评论
1 3
分享

Kimi,熹妃回宫

这个是认证

数字力场

2025-07-18 09:42 中国

120448 1 3


文 | 佘宗明


在许多“嬛学十级学者”眼中,《甄嬛传》中最高潮的情节莫过于——熹妃回宫。

历经纯元旧衣事件、父亲流放变故后,甄嬛失去Buff,自请出宫。

当她去往甘露寺时,很多人都觉得,她的高光时刻,已经过去了。

毕竟,没有废妃回宫的先例。

但甄嬛终究是甄嬛。身着素服的她,在山寺里蛰伏蓄势,以待天时。

结局很多人都知道了,甄嬛二进宫,自己转动了自己命运的齿轮。

一出生就风华正茂但后来转入沉潜状态的月之暗面,俨然拿到了甄嬛的剧本。

借助前几天发布的Kimi K2,月之暗面强势归来。海外技术论坛热议,黄仁勋点赞,马斯克评论,都在为月之暗面加冕,让它又成了“AI大模型这条街上最靓的仔”。

7月底,阶跃星辰、智谱AI等AI创业公司也将发布自研的新一代基础大模型。

他们都想证明,自己仍在牌桌上。


01

 

2023年伊始,ChatGPT引发现象级刷屏后,国内科技巨头与AI创业企业争相入场。

大浪淘沙,“AI六小虎”很快脱颖而出,成了业内瞩目的头部玩家。2023年全年,“AI六小虎”累计融资占到了国产大模型厂商的逾50%。

细究起来:智谱AI的B端生态、阶跃星辰的多模态终端Agent、MiniMax的MoE混合专家模型……几家明星创企各擅胜场。

而月之暗面更是在2024年3月因为长文本能力引爆概念股。长文本能力就像九阴真经,帮Kimi一战封神。在一众卷参数规模的大模型中极具辨识度的Kimi,迅速火爆出圈。

两个月后,腾讯在红杉中国、美团、阿里后的参投,将其估值推至33亿美元,月之暗面一时风头无两。

剧情到这,相当于《甄嬛传》进度条来到了第8集:在这一集,甄嬛受到“椒房贵宠”。

如果没有后来的情节,围绕Kimi的叙事还会沿着“一个天才少年带着一家明星创企会当凌绝顶”的脉络延续下去,AI创业公司们会呈现出“张华考上了北京大学,李萍进了中等技术学校……我们都有光明的前途”的走向。

但现实没那么多“如果”。


02


进入2024年下半年,行业进入拐点,大模型厂商迎来了考验期。

“AI六小虎”中,曾表示底层模型将对标OpenAI的百川智能,自2024年起停止了超大规模通用模型训练,转而深耕医疗领域;号称要做“打造AI 2.0全新平台”的零一万物,2024年底对整个预训练算法团队进行了裁撤,Infra团队被阿里云接收。

背靠G端资源的智谱与阶跃星辰,越来越多地押注政企市场。Minimax发力多模态,还部分转向海外市场。

对AGI痴心不改的月之暗面,下半年的技术重心似乎完全转到了“强化学习”,陆续发了数学模型、视觉思考模型,同时采用了激进的产品推广投放策略,避免Kimi在与同样面向C端的的豆包等产品的竞争中落下风。

更大的变局由DeepSeek开启。今年初DeepSeek R1的横空出世,改变了本已成型的大模型行业格局。凭着“新架构+低成本+开源生态”,DeepSeek成功登顶。

大模型产品市占率有幂次分布效应,舆论场有频域遮蔽效应。在DeepSeek“国运级成果”的风头下,曾稳居C位的“AI六小虎”,俨然已沦为陪衬。

多家退出“超大基模争霸赛”,大模型迭代速度放缓,开年后只有一家公布了融资消息……许多人拼凑出一堆“AI六小虎失意”的证据。

月之暗面就被“亮瑜”对比压着。Kimi1.5推理模型跟DeepSeek R1同日发布,但热度遭全面碾压。事情之后朝着“嬛嬛类卿但非卿”的方向演进:DeepSeek跟Kimi被拉来作对照后,“扬一抑一”的舆论臧否倾向就变成口水落在了二者头顶。

在那之后,月之暗面开始反思,停止激进的推广投放策略。

随之而来的,是用户留存遭遇挑战。就连搜索引擎和应用商店里检索Kimi的时候,跳出来的,都是其他几家继续投流的产品。

回看2025年上半年,国外,OpenAI 的GPT系列、Anthropic的 Claude、谷歌的Gemini和马斯克的xAI Grok你方唱罢我登场;国内,也动静不断。

可舆论针对“AI六小虎”的讨论基调,却多倾向于“丧”。

 

03


但在“我和我最后的倔强,握紧双手绝对不放”的BGM中,“六小虎”中的部分企业继续登场。

MiniMax连续五天甩出五款产品,正冲击IPO的智谱也推出了会看“苏超”的开源视觉理解模型。

月之暗面更是憋出大招。Kimi宛如AI圈的甄嬛,当别人都觉得她已失宠时,她用“一个更强的甄嬛回来了”打了不少人的脸。

在C端用户对高专业门槛的技术革新感知偏弱的情况下,很多人未必清楚Kimi K2在代码、智能体、工具调用等测试中做到开源SOTA(表现最好)是什么概念。

在大众对AI叙事中“最强”“炸裂”之类的震惊体已免疫的背景下,很多人也未必理解Kimi K2在OpenRouter平台上上线仅两天Token消耗量就超越xAI、登顶全球API调用增长榜,在Cline、Roo Code、Kilo Code等平台的API使用量在全球开源模型中排名最高,意味着什么。

但黄仁勋受访时说“DeepSeek R1、Qwen、Kimi是全球最好的开源模型”,美国CNBC商业频道报道称,Kimi K2在基准测试中超越Claude Opus 4、优于OpenAI的GPT-4.1且成本更低,已说明了很多事情。

《自然》杂志网站更是将Kimi K2发布称为“世界迎来又一个DeepSeek时刻”,满满的都是“Make Kimi Great Again”既视感。

接下来,还要几家要出牌。看着Kimi K2在全球科技圈激起的反响,许多人已期待值拉满:你们还有多少是朕不知道的惊喜?


04


现在看,几个月前还被困在落寞叙事的六小龙们,似乎用行动证明了两点:

1,AI竞争是马拉松比赛,是Long-term游戏。

决定企业能走多远的,不是它是否会陷入低谷,而是它陷入低谷后是否能反弹雄起。

2,产品力是最好的营销,好产品本身会说话。

Kimi K2推出后,独角兽Perplexity CEO阿拉温德在社交媒体表示,基于Kimi K2模型的出色表现,公司将会利用K2进行后训练,上一个被该公司用于技术训练的中国模型,是DeepSeek R1;全球最大开源AI社区Hugging Face联合创始人托马斯表示,不断突破极限挑战闭源的K2模型令人难以置信。

这些都表明,留给AI创业公司的机会窗口,都远未关闭。

只不过,你得先“蓄势”——也就是积攒实力。


05


有意思的是,7月14日,美国知名AI研究员内森·兰博特写了篇题为《Kimi K2和当DeepSeek时刻成为常态》的文章。

文中直言,Kimi K2已经能与美国领先的前沿模型竞争,“中国正在不断逼近甚至达到模型性能的绝对前沿,我们正处于‘失败’的节奏中,西方已在开源模型方面进一步落后。”

硅谷AI企业家和知名电子报Exponential View的作者Azeem Azhar撰文《Kimi K2应该让硅谷感到担心》。

他表示,“斯普特尼克1号证明了苏联能突破地球引力,打破西方技术主导。四年后,东方1号航天器载着尤里·加加林绕地球飞行一圈,证实斯普特尼克并非偶然事件。在如今的人工智能领域,DeepSeek扮演了斯普特尼克的角色,而现在,人工智能迎来了它的东方1号航天器时刻。”

话语间隐约透露出一层意思:DeepSeek和Kimi就是这两颗闪耀世界的中国AI双子星,并给美国又了上一课。

从DeepSeek R1到Kimi K2的起势,不是偶然:不论DeepSeek还是月之暗面,都在持续蓄势,也数次在顶峰相会。

今年2月份,梁文锋和杨植麟二人差不多同一天发布论文,研究的都是Transformer架构最核心的注意力机制;4月份,月之暗面推出用于形式化定理证明的大模型Kimina-Prover,DeepSeek也紧接着上线了数学定理证明专用模型DeepSeek-Prover-V2力压Kimi,再到7月,Kimina-Prover-7B-Distil继续更新,实现反超。

某种程度上,从DeepSeek时刻到现在的Kimi时刻,都为中国AI创业公司崛起提供了路径指引:最关键的,还是在原始创新上蓄势。

《甄嬛传》里,甄嬛回宫前说过一句:“与其心生敬佩,不如自己便是那样的人。”“那样”指的是能掌控自己命运。

喜欢摇滚乐队平克·弗洛伊德的专辑《The Dark Side of the Moon(月之暗面)》,听过他们唱的“不要坐下,挖到另一个的时间到了……只有驾驭那浪潮的时候,才能在巨浪中取得平衡”的杨植麟,用Kimi K2表明,他在努力成为“那样的人”。

接下来,更多的AI创业公司掌舵者都需要证明:自己也可以成为“那样的人”。

中国AI创业公司难免会走向分化、前景各异,但可以肯定的是:Kimi“熹妃回宫”,其他小龙小虎也在继续“秀操作”,这部大戏,精彩还在后头。

# Kimi
# DeepSeek
本文为凯迪网自媒体“凯迪号”作者上传发布,代表其个人观点与立场,凯迪网仅提供信息发布与储存服务。文章内容之真实性、准确性由用户自行辨别,凯迪网有权利对涉嫌违反相关法律、法规内容进行相应处置。
举报
投喂支持
3人点赞
发表评论
请先 注册 / 登录后参与评论
热门评论
死鱼脸
AI六小虎
2025-07-18 10:52 中国
0
0