当前位置:商业频道首页 > 财讯 > 正文

自研视频生成模型姗姗来迟 快手“可灵”、字节“即梦”珠玉在前 百度胜算几何?(2)

此外,在视频长度方面,MuseSteamer目前支持生成5秒和10秒两个版本,并可达1080p清晰度。百度此次同步发布了MuseSteamer模型的家族版本,包括Turbo、Lite、Pro,以及各版本对应的有声版,分别面向不同的创作需求和成本考量。

刘林强调,MuseSteamer的关键优势在于其对创作指令的理解与执行能力,即所谓的极致遵循力,能实现创作者“所思即所得”的表达自由。此外,镜头运用能力也是其差异化竞争力之一,百度希望通过该模型降低专业创作门槛,让更多人获得“镜头平权”。

据介绍,MuseSteamer模型的技术基础包括三大方面:首先,在数据准备阶段,通过“筛选—净化—配比”的方式,对超过10亿条异构数据进行处理,并结合三级标签体系和Active Learning(主动学习)机制,以保证训练数据的审美和结构质量。

其次,在模型训练过程中,采用多目标反馈的强化学习优化路径,试图在保证视频动作幅度的同时,保持主体内容的一致性稳定输出。同时,MuseSteamer引入美学条件控制调优,通过隐式批判学习和影视标准严选,让模型懂美、创造美。

MuseSteamer如何面对劲敌

相比OpenAI、字节跳动、Pika等更早投入文生视频赛道的企业,百度此次推出MuseSteamer确属“后发”。无论是国外如Pika、Runway,还是国内如快手旗下的可灵AI、字节跳动旗下剪映团队孵化的AI创作平台即梦AI,均从2024年起就密集发布各类模型、功能和平台,并已完成多次迭代。

今年5月,快手可灵AI宣布推出全新2.1系列模型,高品质模式(1080p)下生成5秒视频仅需不到1分钟。快手官网信息显示,可灵AI在推出10个月之后(即今年3月)的年化收入运行率(Annualized Revenue Run Rate)突破1亿美金,其今年4月和5月的月度付费金额均超过1亿元人民币。

热点推送

本周关注

MORE