百度蒸汽机2.0升级,多人有声视频一体化生成首现
感谢热心网友“西窗旧事”的信息提供。
2025年8月21日,百度推出的音视频一体化生成模型“百度蒸汽机”(MuseSteamer)正式升级至2.0版本,首次在行业内实现多人有声视频的一体化生成。
目前,该模型的 Turbo 版、Lite 版、Pro 版以及全系有声版本均已开放使用。用户可以通过百度搜索“百度蒸汽机”或访问“绘想”平台进行体验。企业用户则可在“千帆平台”享受更高性能的视频生成服务。
据官方介绍,2.0版本依托多模态时空规划技术、针对中文场景的深度优化以及音视频端到端建模等核心技术,成功实现多人音视频同步生成、复杂镜头调度、电影级人物表情细节呈现、丰富的镜头语言以及高清晰度的画面输出。
此前,百度于8月19日发布声明表示,近期发现有不少境外网站冒用“百度蒸汽机”(MuseSteamer)视频生成模型的名义进行虚假宣传,提醒用户提高警惕,注意辨别真伪,避免上当受骗。