评论
分享

百度商业发布视频生成模型MuseSteamer:一张图即可生成10S电影级高清有声视频

IT手机世界

2025-07-02 16:15 中国

60154 0 0

7月2日消息,百度商业研发团队发布自研视频生成模型“MuseSteamer”及创作平台“绘想”,MuseSteamer 是全球首个实现中文音视频一体化生成的视频模型。该技术可实现画面与音效、人声台词的协同创作,打破传统 AIGC 视频“先画面后配音”的割裂流程。

据悉,MuseSteamer 具备多项技术突破:在权威榜单 VBench I2V 中以 89.38% 总分登顶全球第一,支持一张图生成10 秒 1080p 电影级画质视频,人物微表情与运镜效果达专业影视水准。其核心能力源于亿级中文多模态数据清洗、精细化视频结构化描述语言,以及多目标强化学习等技术优化。

MuseSteamer 模型家族包含 Turbo、Lite、Pro 及全系列有声版,覆盖从普通创作者到专业影视机构的需求。其中 Turbo 版已上线绘想平台开启限时免费公测,其余版本将于8月陆续开放。平台同步启动“跨次元捏合”AI视频创作大赛,用户通过单图输入可生成动态捏捏乐视频进行参赛。(宜月)

# 百度
本文为凯迪网自媒体“凯迪号”作者上传发布,代表其个人观点与立场,凯迪网仅提供信息发布与储存服务。文章内容之真实性、准确性由用户自行辨别,凯迪网有权利对涉嫌违反相关法律、法规内容进行相应处置。
举报
投喂支持
点赞
发表评论
请先 注册 / 登录后参与评论
推荐阅读