杨植麟被梁文锋叫醒了！Kimi新模型发布即开源，1T参数全线SOTA

亿通速配万生平台 2025-07-12 60 0

　　鱼羊雷刚发自纽凹非寺

　　来源：量子位 | 公众号 QbitAI

　　172天过去，Kimi在深夜低调给出了DeepSeek冲击波后的回应。

　　全新Kimi K2基础大模型，MoE架构，总参数1T，激活参数32B，能力领先性尤其展现在代码、Agent、数学推理任务上。

　　Kimi援引多个基准评测数据，创造了开源全新SOTA。

　　没错，Kimi K2，这次发布即开源。

　　并且Web端、App和API服务都同步上线可以使用。

　　作为DeepSeek R1发布后最大的“被冲击者”，Kimi这半年几乎遭遇到了全方位质疑：技术领先性还有吗？营销投流意义几何？以及之前非技术花边缠身——Kimi还有技术信仰吗？

　　172天后，Kimi在深夜用K2大模型给出了低调但明确的回应：

　　游戏尚未结束，Kimi不下牌桌，Kimi不打算认输。

　　杨植麟算是被广东大哥梁文锋叫醒了。

　　Kimi K2：1T参数MoE基础模型

　　先来看Kimi K2的具体情况。

　　作为Kimi最新MoE基础模型，Kimi K2强调的是代码能力和通用Agent任务能力。

　　总参数量达到1T…属实是让本地部署党捏了把汗，不过激活参数是32B。

　　支持128K上下文。

　　而蛰伏许久，一上新又直接是一个开源的大动作，Kimi此番就是奔着SOTA来的。

　　在SWE Bench Verified、Tau2、AceBench等基准性能测试中，Kimi K2均取得开源模型中的SOTA成绩。

　　Agent和编程能力：

　　工具调用能力：

　　数学等科学能力：

　　官方Demo，也把大家现在最关心的一些模型能力，直观展示了出来。

　　代码能力提升

　　在前端开发任务中，Kimi K2支持粒子系统、可视化和3D场景等表现形式。

　　可以生成支持昼夜循环的山川峡谷3D景观：

　　3D粒子星系模拟的效果也很出色：

　　Agent工具调用能力提升

　　Kimi K2具备稳定的复杂指令解析能力，可将需求自动拆解为一系列格式规范、可以直接执行的ToolCall结构。

　　比如，一站式帮你追星（doge）：

　　全年追星计划，演唱会机酒和旅行规划它都能帮忙做，还能生成日历，用html概括完整行程规划并给你发送邮件。

　　上线即开源

　　此次Kimi K2讨论度最高的一点，就是Kimi果断走了开源路线。

　　开源的模型版本有两个：

Kimi-K2-Base：未经过指令微调的基础预训练模型，适合科研与自定义场景；
Kimi-K2-Instruct：通用指令微调版本（非思考模型），在大多数问答与Agent任务中表现卓越。

　　遵循的是修改版MIT协议（Modified MIT License）。

　　MIT协议可以说是最宽松的协议（约等于怎么用都行）。而Kimi的修改在于，如果基于Kimi K2打造的产品或服务月活跃用户超过1亿，或者月收入超过2000万美元，那么需要在该产品和服务的用户界面上显示“Kimi K2”。

　　技术细节

　　此外值得关注的是，Kimi官方此次也分享了不少技术细节。

　　其中关键的技术创新有三点：

MuonClip优化器

　　Kimi K2抛弃了传统的Adam优化器，创新性地使用了Muon优化器。

　　为了缓解大规模训练中的attention logits偏大问题，他们提出MuonClip，并将其扩展到万亿参数规模，提升了训练稳定性和token使用效率。

　　Kimi K2完成了15.5T token的平稳训练，全程无loss spike。

大规模Agentic Tool Use数据合成

　　Kimi K2构建了可大规模生成多轮工具使用场景的合成pipeline，覆盖数百领域、数千工具。高质量样本由LLM评估筛选后用于训练。

通用强化学习

　　Kimi K2不仅在可验证任务上（代码、数学）强化学习，还通过引入自我评价机制（self-judging），解决了不可验证任务的奖励稀缺问题。通过可验证任务持续优化critic，提升泛化任务表现。

　　实测

　　模型一官宣，Kimi官网和App已经实装。

　　效果究竟有没有官方说的那么好，我们上手实测验证了一波。

　　先热热身，让Kimi给Kimi K2做个宣传网页。

　　提示词很简单，同时打开联网搜索：

Kimi K2发布并开源，做一个宣传网页。

　　审美属于是简洁挂的。比较有意思的是，其中“立即体验”和“下载开源模型”按钮，都是真的可以跳转到正确网址的。

　　再加上一点物理模拟试试：

模拟高尔顿板，UI设计得好看一点。

　　这个UI确实不错。另外在提示词没有给出具体要求的情况下，Kimi K2贴心地自动设计了行数和小球数量的调整滑杆。

　　不过小球下落的动画还有优化空间。

　　可以看到，即使提示词很简单，Kimi K2也能理解到位，写出效果相当不错的代码。

　　那么如果让Kimi K2担当私人助理，帮忙做做计划，效果又会如何？

　　提示词：

我想去看林俊杰的演唱会，在东亚地区的都可以，帮我安排一份观演计划，包括机酒和行程规划。

　　乍一看还挺清晰的，但桥豆麻袋……

　　选的都是过期场次，并没有什么参考价值

　　不过从官方的说法来看，这可能和工具调用功能还没正式上线有关。

　　无论如何，K2的性能成绩和体验，还是展现了Kimi一鸣惊人时的水准。

　　曾经的Kimi，正在回归。

　　DeepSeek冲击波172天之后，Kimi的回应

　　种种迹象表明，Kimi K2带着诚意，也带着王者回归的复仇情绪。

　　172天之前，2025年春节之前，Kimi曾是国产基础大模型中最受关注的一个，团队青春风暴，产品体验优雅。

　　据量子位智库统计数据，在2024年全年数据，AI智能助手Web端市场格局已经相对稳定，特别是头部，形成了Kimi智能助手、豆包AI和文心一言的TOP 3格局，占据70%市场份额。

　　而Kimi更是以创业独角兽姿态，青春风暴，锐不可当。

　　在APP端，这种态势就更明确，豆包和Kimi智能助手几乎断崖式领先其他玩家，各维度数据占比市场份额80%。几乎就是双寡头。

　　但这种数据上的优势，在2025年1月20日迎来暴击。

　　因为正是这一天，DeepSeek R1横空出世，迅速引爆国内外，并在春节假期中，形成了全民话题。

　　在AI领域一直伺机而动的巨头腾讯，也行动迅速，借助DeepSeek的开源大旗，猛虎下山。

　　稳固的格局，一夜巨变。

　　所以半年之后，AI智能助手什么光景？

　　量子位智库最新的2025上半年数据显示，Web端和App端，头部格局都变成了DDKT，占据90%市场份额。

　　所谓DDTK，就是字节豆包、DeepSeek、Kimi、腾讯元宝。

　　Kimi依然在牌桌，然而危机的警报已经内外都能感知，增长之外的留存活跃，更是风声鹤唳。

　　因为Kimi的数据增长地位，跟其之前拿着巨额融资后烧钱投流的策略密不可分，然而如果DeepSeek和腾讯元宝，可以靠着先进模型就能快速突破，那这壁垒又何在？这烧钱投流的正当性又何在？

　　更何况在DDTK中，Kimi是唯一的没有现金奶牛支撑的创业公司。

　　数据层面的体现，恐怕只是Kimi、月之暗面这半年来宏观压力下的质疑之一……

　　更根本性的质疑则直接关乎生死存亡——

　　DeepSeek之后，还需要自研基础大模型重复造轮子吗？

　　DeepSeek的冲击，不仅是先进技术模型的冲击，更是开源对闭源的冲击。

　　如果市面上已经有如此全方位开源的领先模型，为什么其他公司特别是创业公司，还有合理的融资理由去推进自研基础大模型的故事？

　　至少在DeepSeek之后，曾经包含Kimi在内的AI大模型“六小龙”创业格局，已经一夜分崩，有至少2家放弃了大模型自研。

　　于是这172天之中，Kimi上上下下也好，CEO杨植麟也好，一定被不断问及这个质疑：

　　Kimi如何回应？Kimi往何处去？

　　现在，杨植麟从舆论里消失172天之后，Kimi用K2开源基础大模型给出了最明确的回应——

　　Kimi不认输，Kimi不会放弃自研大模型。

　　Kimi的路径也已经明牌——

　　打造更强的开源大模型，全维度SOTA，重新证明技术的领先性。

　　某种程度来说，梁文锋不光叫醒了老乡小弟杨植麟，更帮他重新找回了竞逐AGI的初心。

杨植麟被梁文锋叫醒了！Kimi新模型发布即开源，1T参数全线SOTA

评论

热门文章

最近发表

标签列表

杨植麟被梁文锋叫醒了！Kimi新模型发布即开源，1T参数全线SOTA

相关文章

评论

热门文章

最近发表

标签列表