奔赴一场新的长征。
文 | 华商韬略 张静波
黄仁勋,急了。
2026年4月15日,在一场长达90分钟的访谈中,这位英伟达掌门人罕见地打破克制,情绪激动地表示:
“芯片又不是浓缩铀,卖给中国怎么了?”
真正让他急的,并非一桩买卖的得失,而是一场正在发生的行业巨变。
【01 巨变】
在这场访谈中,一向说话圆滑的老黄,仿佛换了个人,他在访谈中直接开骂,抨击美方某些政策和观点极度愚蠢、失败者心态。
其中一句话,更让整个科技界
“如果DeepSeek先在华为平台上发布,那对我们国家(美国)来说将是灾难性的。”
短短九天后,老黄的警告便一语成谶:4月24日,DeepSeek发布新一代大模型V4,并在华为昇腾平台上完成首发。
▲图源:华为
消息传出后,业界震动。
黄仁勋太清楚,这意味着什么。
过去二十年,英伟达真正的护城河不仅仅是GPU,更包括其基于CUDA打造并绑架了全球业界的软件生态。
只要所有顶级模型都在CUDA上跑通,哪怕别的芯片性能不差,在客户那里也只能是备选方案。包括中国的大模型,此前也大多跑在CUDA上。
而梁文锋,这个中国85后年轻人,却正在做一件改变格局的事情:
把自家最先进的大模型,从英伟达的CUDA生态迁移到华为昇腾等国产芯片上。
尽管业内推测,目前昇腾主要适配推理场景,大模型训练仍然是英伟达主导,但这是一个重要的开始。
黄仁勋很早就注意到这个年轻人。
一年前的1月20日,DeepSeek R1横空出世,在性能逼近美国顶尖大模型的同时,成本不到后者的十分之一。
黄仁勋后来公开评价,DeepSeek R1是一个非常创新的新架构,非常高效。
彼时的老黄,或许还没有意识到这个年轻人的威胁,而更多沉浸在大模型对算卡疯狂吞噬的畅想中。
但后来的局势发展,超出了他的想象。
随着美国不断收紧AI芯片对华出口,中国的大模型公司突然发现,算法再精妙,底层算力被人卡脖子,上层应用也只是沙上之塔。
国产AI芯片虽然受制于工艺,在峰值性能、功耗上仍有差距,但在推理端已展现出强劲实力。
尤其性价比优势,对于降低大模型部署成本具有重要意义。
于是,拥抱国产芯片以及更加多元化的算力生态,逐渐成为一个在战略上不得不做,同时在商业上也划算的选择。
在这条道路上,梁文锋无疑是最激进的拓荒者之一。
他曾在多个场合公开表达对国产AI芯片的支持,并与华为携手共建生态,减少对英伟达CUDA依赖。
在DeepSeek V4上首发适配华为昇腾芯片,更是一次极其大胆的尝试。
从某种意义上讲,这堪称又一个任正非时刻。
2004年,当华为还是风轻云淡的季节,任正非做出了极限生存假设:如果有一天,所有美国的先进芯片和技术将不可获得。
为了这个很多人以为永远不会发生的假设,数千海思儿女走上了科技史上最悲壮的长征。
历史从不重复细节,但往往重复结构。
时隔二十余载,一个叫梁文锋的年轻人接过历史的交接棒,奔赴一场新的长征。
【02 挑战】
任正非时刻从来不是浪漫主义,而是一连串足以让任何创始人夜不能寐的挑战。
当年华为做海思,刚起步时虽然艰难,但还可以依靠台积电代工、ARM授权指令集,研发环境相对开放。
相比之下,梁文锋面对的局面,甚至比当年海思还要更难。
DeepSeek V4的发布,让很多人兴奋,但外界很少注意到,这场技术跃迁背后,是一场极其复杂的底层硬件大迁移。
梁文锋选择将V4首发适配华为昇腾芯片,这意味着:从英伟达CUDA生态跳向华为CANN框架。
CUDA是英伟达耗时近20年打造的软件护城河,全球AI从业者都在使用它。而华为CANN框架无论生态还是技术成熟度,仍然落后于CUDA。
这意味着,梁文锋和他的团队需要:
在底层细节上做大量针对性优化,打通算子、通信、调度、精度对齐等一系列暗礁,甚至手动重写关键算子。
这不是在修路,而是徒手开凿一条全新的隧道,工程代价以月计。
据一位接近DeepSeek的工程师透露:“适配过程中最耗时的不是算子重写,而是精度对齐——同样的模型在英伟达和昇腾上跑出一致结果,需要反复调试。”
除了时间和技术,资金的压力同步袭来。
海思战略性亏损十几年,任正非扛得住,因为华为是非上市公司,有终端和通信设备持续输血。
而梁文锋面对的,是一个极度烧钱、商业化路径仍不清晰的AI市场。
尽管幻方量化为DeepSeek提供了资金来源,但在动辄数十亿美元的算力黑洞面前,这笔钱杯水车薪。
压力之下,曾经技术理想主义、坚持不融资的团队,也最终向资本打开大门。
有外媒传闻,国家大基金正洽谈领投DeepSeek首轮融资,估值450亿美元,腾讯等巨头也在列。
人才流失,乃至组织韧性,是更隐秘的挑战。
硬件适配可以靠加班啃下来,融资压力可以靠硬扛熬过去,但当技术攻坚遇阻、外部诱惑又不断加码,团队士气会不会受挫?
任正非曾描述当年海思工程师的状态:“他们怎么会憋着呢?回去老婆表扬他,老婆一天出去买好几个包。”
这看似玩笑的一句话,背后是一种强大的组织文化:物质保证和团队认同,构成一道无形的精神防线。
梁文锋面对的是更年轻的团队,更多外界的诱惑和干扰。
罗福莉跳槽小米、郭达雅跳槽字节跳动……从2025年下半年开始,DeepSeek经历了一场严峻的人才流失。
靠着原创的研究氛围、宽松的文化等,梁文锋艰难守住了阵地,整体留任率超过96%。
当技术理想主义迎头撞上商业铁幕,能否保持方向感,是最难衡量的指标,也是最致命的变量。
【03 扛肩】
尽管困难重重,但如果梁文锋能扛住,其价值将远超一家公司的成败。
首先,它证明了第二路径的可行性。
长期以来,AI行业弥漫着一种宿命论:谁的GPU多,谁就能赢。OpenAI、Google等美国科技巨头动辄几千亿美元的算卡投资,似乎掐灭了后来者的火苗。
DeepSeek的突破,用实践证明:算法创新可以放大算力效率,国产芯片也能走出一片新天地。
黄仁勋的焦虑,从反面印证了这件事的价值。
在接受采访时,主持人追问:DeepSeek是开源的,理论上可以跑在任何AI芯片上,在华为昇腾首发和在英伟达GPU上跑,区别在哪里?
黄仁勋的回答泄露了天机:
如果DeepSeek这样的顶级模型,以非美国硬件为首要优化目标,将极大地削弱美国在全球AI价值链上的控制权。
过去几个月,英伟达在中国的市场份额断崖式下跌,正是这场灾难的预演。
其次,倒逼整个国产算力生态的闭环。
海思的崛起,壮大了中国半导体设计、EDA工具、封测等产业链。
如今,DeepSeek首发适配昇腾芯片,正试图终结“国产芯片造出来没人用”的死循环。
DeepSeek V4发布当天,华为云宣布完成对V4系列模型适配。多家报道指出,V4不仅率先完成对华为昇腾适配,还带动寒武纪等国产芯片厂商适配。
当顶尖大模型愿意与国产芯片深度适配,一个模型牵引芯片、芯片滋养模型的正循环,才能真正转动起来。
最后,关乎智能时代的安全底线。
2019年5月17日,海思备胎转正的难眠之夜,何庭波在公开信里的话,至今读来依旧振聋发聩:
“今后的路,不会再有另一个十年来打造备胎然后再换胎了,缓冲区已经消失。”
这句话放在今天的AI语境中,分量更重。
如果未来所有的城市大脑、工业AI核心、智能体服务,都建立在进口模型和算力之上,无异于将中枢神经交给他人。
梁文锋此刻的切换,是在努力将这个枢纽牢牢掌握在自己手里。
正如2019年海思一夜转正,为华为赢得生存时间,自主大模型和国产芯片的全栈突破,将在极端时刻为国家数字化运行提供保底能力。
【04 尾声】
海思和任正非时刻,之所以到今天仍被反复讲述,不仅因为技术成功,更因为它代表了一种心气:
哪怕千疮百孔,也决不投降!
当年,任正非在接受采访时,曾提到一张全身布满弹孔却仍在飞的伊尔-2飞机照片,并动情地表示:这太像我们了。
时光荏苒,今天又一个年轻人,走进同一片空域,手握一把钝刀。
这把钝刀,在英伟达精心编织了近30年的CUDA生态面前,尽管还没那么锋利,但它点燃了国产AI芯片的反攻号角。
2025年,黄仁勋访华时,曾说过一句话:“中国创新的步伐是不可能被阻断的。”
他随后补了一句:“中国AI市场无论有没有英伟达都会进步。”
这句话,从一个掌控全球GPU命脉的大佬嘴里说出来,既是对对手的敬意,也是对一个艰难过程的旁观者判断:
哪怕没有最好的工具,这个市场也会往前走,只是先趟路的人要付出更多代价。
梁文锋,就是那个蹚路的人。
——END——
欢迎关注【华商韬略】,识风云人物,读韬略传奇。
版权所有,禁止私自转载
部分图片来源于网络
如涉及侵权,请联系删除







