百度商业发布视频生成模型MuseSteamer : 一张图即可生成电影级高清有声视频
上证报中国证券网讯(记者刘暄)百度商业研发团队7月2日发布自研视频生成模型“MuseSteamer”及创作平台“绘想”。百度商业表示,MuseSteamer是全球首个实现中文音视频一体化生成的视频模型。该技术可实现画面与音效、人声台词的协同创作,打破传统AIGC视频“先画面后配音”的割裂流程。
据介绍,MuseSteamer具备多项技术突破:支持一张图生成10秒1080p电影级画质视频,人物微表情与运镜效果达专业影视水准。其核心能力源于亿级中文多模态数据清洗、精细化视频结构化描述语言,以及多目标强化学习等技术优化。
据悉,MuseSteamer模型家族包含Turbo、Lite、Pro及全系列有声版,覆盖从普通创作者到专业影视机构的需求。其中Turbo版已上线绘想平台开启限时免费公测,其余版本将于8月陆续开放。