

2026年4月,行业翘首以待DeepSeek V4终于如期发布。随着DeepSeek率先完成华为昇腾、寒武纪、摩尔线程等国产芯片的全栈适配,并携手百度千帆实现Day0上线,顶尖AI能力的获取成本被断崖式拉低,引发的国产算力“成本风暴”正在重塑全球AI竞争格局,也标志着国产大模型从“参数竞赛”正式迈入“普惠落地”的爆发前夜。
在大模型之家《2026年4月大模型热力榜》中,我们共收录了530个大模型及其所属企业。本月榜单不仅数量创新高,更呈现出“头部狂奔、生态闭环”的剧烈变化:阿里Qwen3.6系列三周内三连发强势登顶,腾讯混元Hy3预览版以极致推理效率接入900个业务场景,智谱GLM-5.1更是在10万张昇腾芯片上跑通了对标国际顶尖模型的训练全流程。当“国产模型+国产算力”的双轮驱动成为行业标配,中国AI产业正以惊人的迭代速度,在算力封锁的缝隙中杀出一条血路。

DeepSeek:开源V4双版本,国产算力全栈适配
4月24日,DeepSeek发布V4系列模型,推出Pro版与Flash版。Pro版总参1.6万亿、激活49B,Flash版总参284B、激活13B,全系标配100万Token上下文,采用MoE架构。Pro版在Agentic Coding评测中位居开源模型榜首。最大亮点是首次全面适配华为昇腾国产算力,发布当日百度千帆、寒武纪、摩尔线程、华为昇腾全部完成Day0适配,刷新国产大模型与国产芯片协同部署的速度纪录。4月26日国家超算互联网上线免费对话服务。资本层面,4月28日公司注册资本从1000万增至1500万,创始人梁文锋持股提升。腾讯、阿里入局洽谈首轮融资,估值飙升至200亿美元以上。
百度:千帆Day0适配DeepSeek V4,端侧AI加速落地
百度智能云千帆平台在DeepSeek V4发布当日即完成Day0适配,提供V4预览版API服务,展现了平台极速响应的工程能力。百度持续推进端侧AI战略,端侧大模型从技术标杆向终端标配体验迁移,核心优势包括实时响应(本地运行避免延迟)、隐私保护(数据不上传云端)、成本效率(减少云端API依赖)。企业合作方面,百度Apollo智驾方案被宝马采用,百度地图与多家车企合作推进AI座舱落地。百度以"云端+端侧"双轨并行策略,在大模型产业化浪潮中寻找差异化定位。
阿里巴巴:Qwen3.6系列三次发布,登顶最佳国产模型
4月3日Qwen3.6-Plus上线,24小时冲上OpenRouter日榜榜首,单日调用量突破1.4万亿Token。4月20日Qwen3.6-Max-Preview发布,在Artificial Analysis榜单登顶最佳国产大模型,智能体编程六项基准取得最高分。4月22日开源Qwen3.6-27B-GGUF。三周三次旗舰发布,构成国产大模型史上最密集迭代序列。业务层面,阿里成立ATH事业群由CEO吴泳铭挂帅,通义App更名"千问",月活1.66亿环比增969.1%。C端"一句话点奶茶"带动1.4亿人体验AI消费;B端推出淘工厂星火3.0、天猫超市超喵1.0、淘宝闪购AI助手,覆盖百万商家。
腾讯:混元Hy3 preview发布,姚顺雨加盟后首秀
4月23日,腾讯发布混元Hy3 preview并同步开源。总参295B、激活21B,MoE架构,支持256K上下文,创新融合快慢思考设计。这是2月重建预训练和强化学习基础设施后的首款模型,也是首席AI科学家姚顺雨加盟腾讯后的首秀。推理效率提升40%,CodeBuddy首token延迟降低54%、端到端时长缩短47%、成功率99.99%+,能稳定驱动495步Agent工作流。已接入元宝、QQ、腾讯文档等超900个业务场景。个人版Token Plan定价最低28元/月。在和平精英AI NPC场景中展现优秀拟人化能力。
商汤科技:SenseNova U1系列开源,统一理解与生成
4月,商汤发布并开源SenseNova U1系列,基于自研NEO-unify架构,首次在单一模型架构上统一多模态理解、推理与生成三大能力,解决了传统方案需多个专用模型的痛点。配套LightX2V框架支持寒武纪、沐曦、海光DCU、昇腾910B等多款国产芯片。业务落地方面,商汤绝影Sage端侧模型成为行业首款车端复杂智能体基座模型,Sage Box实现单台车日均节省30元云端费用。R-UniAD 2.0生成式智驾方案覆盖L2至L4。AI视频生成工具Seko已积累超六十万创作者用户。
MiniMax:M2.7开源,首个"自我进化"商用大模型
4月7日发布M2.7,4月12日在HuggingFace和ModelScope开源。总参2290亿、激活100亿,256个本地专家MoE架构,200K上下文。核心创新是"自我进化"训练范式——模型在训练中自主跑100+轮优化循环,自己发现问题、改代码、验证效果,零人工干预,内部评测提升30%。性能方面,SWE-bench Verified达78%,比Claude Opus 4.6高23个百分点;Terminal Bench 2达82.4%。定价$0.30/$1.20,比Opus便宜50倍。采用非商用许可证开源,商用需申请。同步上线MMX-CLI多模态Agent工具,让智能体可调用图像、视频、语音、音乐、搜索等全模态能力。
360集团:AI安全+大模型双轮驱动,牵手智谱构建双引擎
4月,360在AI安全与大模型两条线同步发力。4月24日,IDC发布《中国智能体威胁检测技术评估》报告,360凭借全栈技术创新斩获首位推荐,综合实力位居中国智能体安全厂商第一梯队,获评智能体威胁检测领域领军企业。4月25日,360与智谱AI正式宣布战略合作,联合研发的千亿级大模型360GLM亮相,形成自研360GPT+合作360GLM的"双引擎"大模型布局。技术落地方面,360自研AI智能体成功发掘两大世界级底层高危漏洞(Office远程代码执行漏洞、Windows内核提权漏洞),获微软官方致谢。360安全智能体蜂群已实现L3级推理智能体100步任务0出错、L4级蜂群千步任务高效协同,落地10余款企业级产品。
小米:MiMo-V2.5系列开源,登顶全球开源大模型榜单
2026年4月3日,小米官宣推出MiMoTokenPlan,统一Credit点数体系,面向开发者和个人用户提供四档AI模型调用套餐。4月23日,小米MiMo大模型一口气官宣4款新模型:旗舰推理模型MiMo-V2.5、全模态Agent模型V2.5-Pro开启公测,以及即将推出的v2.5-tts系列和v2.5-asr。通过创新的局部滑动视窗注意力与全局注意力6:1交错设计,将KV缓存内存占用大幅缩减近7倍。4月28日,小米正式开源MiMo-V2.5系列大模型,采用MIT宽松许可证。
智谱:GLM-5.1开源,10万昇腾芯片训练
4月8日发布GLM-5.1并采用MIT许可证完全开源。总参754B、激活40B,256个专家MoE架构,203K上下文。最核心突破是在约10万个华为昇腾910B芯片上完成全流程训练,使用MindSpore框架,验证了"从零NVIDIA"的纯国产技术路径可行性。支持长达8小时的自主规划-执行-测试-修复-优化循环,综合能力对齐Claude Opus 4.6,成为首个全面对齐国际顶尖模型的中国大模型。4月30日披露底层推理优化,吞吐量最高提升132%,异常输出率从万分之十几降至万分之三以下,修复方案已被SGLang社区采纳。商业层面,年内三次提价累计涨幅逾八成,但调用量逆势暴涨400%,MaaS平台年化收入达17亿元。
阶跃星辰:多模态模型密集发布,加速智能座舱落地
2026年4月2日,阶跃星辰推出Step3.5Flash系列模型,主打毫秒级响应与低成本推理,文本生成速度较标准版本提升300%,同时保持90%以上的核心任务准确率。该模型采用创新的动态量化技术,使得在普通服务器芯片上即可实现高性能推理,API接口定价较主流云服务商低40%。4月17日,阶跃星辰的超级Eva整车智能体首发于极氪8X,实现了大模型与智驾、底盘、动力等底层系统的原生融合。4月22日,阶跃星辰与千里科技达成战略合作,双方从底层共建原生智驾基座模型。4月23日,在腾讯智慧出行技术开放日上,腾讯云与阶跃星辰宣布达成战略合作,共同加速大模型在智能座舱的落地进程。4月24日,阶跃星辰发布新一代自动语音识别模型StepAudio2.5ASR,推理速度提升400%。4月29日,发布新一代图像生成编辑模型StepImageEdit2,参数量仅为3.5B,单次生图仅需0.5秒至2秒。




