揭秘Sora：用大语言模型的方法理解视频

2024-02-18 07:48:42 A+A-

当全球还沉迷在如何用文本生成文本，以及文本生成图片的时候，OpenAI就这么掏出来了一个视频生成模型Sora。有关Sora的具体介绍和效果展示可以看我们昨天的文章《》。简单来讲，这是一个能够根据文本指令或静态图像生成长达1分钟视频的扩散模型，而且视频中还包含精细复杂的场景、生动的角色表情以及复杂的镜头运动——它做到了目前市面上视频模型做不到的东西。

那么Sora是如何做到的？在中，我们曾第一时间基于仅有的信息给出了一个判断：

简单粗暴的理解，就是语言能力足够强大之后，它带来的泛化能力直接可以学习图像视频数据和它体现出的模式，然后还可以直接用学习来的图像生成模型最能理解的方式，给这些利用了引擎等已有的强大而成熟的视频生成技术的视觉模型模块下指令，最终生成我们看到的逼真而强大的对物理世界体现出“理解”的视频。

而之后OpenAI发布了Sora的技术报告：《Video generation models as world simulators》（视频生成模型作为世界模拟器），其中介绍的技术思路基本印证了我们上面的判断。

接下来我们一起来基于有限但足够信息丰富的技术报告来解读一下Sora背后的技术。

用大语言模型的方法理解视频

Sora的设计灵感来自于大语言模型，最主要的原因是大语言模型有一个核心功能是通过代码将多种文本形式进行了统一。而OpenAI为了训练出Sora，他们的做法也是将各类视觉数据转化为统一表示的方法。

不过在正式了解Sora之前，我们需要先科普一个概念——块（patches）。有点类似于大语言模型中的token，块指的是将图像或视频帧分割成的一系列小块区域。这些块是模型处理和理解原始数据的基本单元。

12 3 4...全文共 5 页下一页

热点推送

去年亏42亿后际华集团上半年亏损依旧订单减少、毛利额下降

7月10日晚间，际华集团(601718)披露业绩预告，公司预计2025年半年度实现归属于母公司所有者的净利润为-8000万元至-6000万元；归属于上市公司股东的扣除非经常性损益的净利润为-15,000万元至-13,000万元
2025-07-11际华集团，净利润，亏损
激辩智能网联汽车路径：在安全边界下重构新生态

智能辅助驾驶技术加速普及，AI大模型深度融入汽车产业，“软件定义汽车”趋势凸显，无人驾驶出租车、无人配送等场景加速规模化落地。与此同时，智能网联汽车迎来“强监管”，工信部对智能网联汽车的安全、可持续发展提出更高要求
2025-07-11汽车，新能源汽车，产销量
上半年广州楼盘销售榜公布！这些项目受欢迎

随着上半年楼市“成绩”单的陆续公布，谁卖得最好也成为了市场关注的焦点。日前，克而瑞发布了《2025上半年广州商品住宅成交热销TOP10》以及各区排行
2025-07-11上半年，楼市，网签
涉嫌侵权！问界、智界、尚界三轮车整改，涉事企业道歉

7月10日，“宗申智慧出行”微信公众号发布致歉声明，这也意味着围绕着问界、智界、尚界的三轮车的争议画上句号
2025-07-11重庆宗申车辆有限公司，江苏宗申电动车有限公司，宗申动力
这家券商拟变更股东！

近日，中国证监会官网显示，中航证券变更主要股东或者公司实控人的申请已于7月8日获得受理
2025-07-11中航产融，中航证券，公司
股权投资赚了重庆百货H1减收却增利

上半年，在传统百货公司整体不景气的情况下，重庆百货却凭借股权投资和股票收益实现业绩同比增长近一成
2025-07-11公司，净利润，2025
香港分红险演示利率结束7%时代，别慌！演示利率限高≠投资收益限高

香港保监局发布相关规定，7月1日起，香港分红险演示利率设定上限，港元保单演示利率上限定为6%，非港元保单也限定了6.5%的上限。不过，业内多位保险专家表示，香港分红险演示利率限高，不等于投资者的实际收益限高
2025-07-11香港，收益，利率
“驾校一哥” 启动预重整

昔日有“驾校一哥”之称的东方时尚驾驶学校股份有限公司（证券代码：603377，简称ST东时）正站在退市边缘
2025-07-11ST东时，公司，重整
空缺三年后补位牛增亮升任华泰人寿总经理

空缺三年后，华泰人寿迎新任总经理。 7月10日，华泰人寿发布公告称，经公司第七届董事会第二十二次会议审议通过，并经北京金融监管局任职资格审查核准，自2025年7月10日起，由牛增亮担任公司总经理职务
2025-07-11华泰人寿，牛增亮，公司
豪捐11亿！

7月10日晚间，宁德时代发布公告称，公司副董事长李平及其配偶廖梅向上海复旦大学教育发展基金会（以下简称基金会）捐赠的其持有的公司405万股股票，已经完成过户手续。按照宁德时代最新股价计算，这笔无偿捐赠的价值预估约11亿元
2025-07-11宁德时代，李平，捐赠
降价超40%，玛莎拉蒂卖到了30多万？门店回应：经销商买断包销行为！

近日，名为“上海浦东玛莎拉蒂”的账号发布海报称，玛莎拉蒂的SUV车型Grecale限时尊享价38.88万元起，活动时间截止到9月30日
2025-07-11玛莎拉蒂，销量，上海
正海磁材：接受华泰证券等投资者调研

正海磁材（SZ 300224，收盘价：14.49元）发布公告称，2025年7月9日，正海磁材接受华泰证券等投资者调研，公司副总裁、董事会秘书、财务总监高波，证券事务代表于在海参与接待，并回答了投资者提出的问题
2025-07-11正海磁材，九菱科技，涨停
天润乳业：公司目前有部分产品进驻了零食有鸣等零食量贩渠道

每经AI快讯，有投资者在投资者互动平台提问：请问：天润乳业有没有计划布局零食连锁量贩渠道？比如：零食有鸣、好想来、赵一鸣、零食很忙、鸣鸣很忙、好特卖、奥特乐、爱零食等，这些零食量贩渠道规模庞大，可能为天润的营收带来巨大的增长
2025-07-11天润乳业，零食，公司
乘“数”而起——天津培育数字经济发展新优势

天津市人工智能计算中心内，一排排计算机机柜昼夜不息地嗡鸣。每一秒，都有海量数据在此流转、运算，转化为经济发展的数智力量。当数字浪潮与经济发展深度交融，渤海之滨的天津，正乘“数”而起，在数字经济赛道上打造发展新优势
2025-07-11人工智能，中国，治理
特发信息：公司和摩尔线程无相关合作

每经AI快讯，有投资者在投资者互动平台提问：董秘你好，请问贵司和摩尔线程有无合作或者业务往来？特发信息（000070.SZ）7月10日在投资者互动平台表示，公司和摩尔线程无相关合作
2025-07-11摩尔线程，特发信息，投资者
Robinhood盘中拉升涨近3% 公司在美国推出以太坊和Solana质押服务

Robinhood盘中拉升涨近3%，公司在美国推出以太坊和Solana质押服务
2025-07-11Robinhood，盘中拉升，Solana
产品矩阵不断丰富赛力斯上半年净利润预增超66%

7月10日晚间，赛力斯集团股份有限公司（以下简称“赛力斯”）发布半年度业绩预告，预计2025年上半年实现归属于上市公司股东的净利润为27亿元到32亿元
2025-07-11赛力斯，回购股份，回购
红星发展：公司硫脲产品现阶段产能为1万吨

每经AI快讯，有投资者在投资者互动平台提问：董秘您好，请问1，贵司的硫脲产能是多少？2，贵司的硫脲产品是否可行用于固态电池中？3，A股上市公司中，有哪几家公司是贵司硫脲产品的竞争对手？请尽快回复
2025-07-11固态电池，红星发展，公司
上海市国资委围绕加密货币与稳定币的发展趋势及应对策略召开中心组学习会

7月10日，市国资委党委召开中心组学习会，围绕加密货币与稳定币的发展趋势及应对策略开展学习。市国资委党委书记、主任贺青主持会议并讲话。市委第四督导组组长王治平到会指导。市国资委党政领导班子成员出席
2025-07-11国资委，数字货币，加密货币
矩子科技：公司激光刻印设备支持2.5D及3D激光打标

每经AI快讯，有投资者在投资者互动平台提问：请问公司有无3D激光打印控制系统？矩子科技（300802.SZ）7月10日在投资者互动平台表示，公司激光相关产品为工业领域的激光刻印设备
2025-07-11矩子科技，激光，公司
首份上市券商中报业绩预告精彩亮相

7月9日晚间，首份A股上市券商2025年中报业绩预告出炉。红塔证券预计2025年上半年实现归母净利润同比最高增长55%。从7月10日市场表现来看，受业绩预增等因素影响，红塔证券股价涨幅超6%
2025-07-11红塔证券，净利润，同比
*ST长方：坪山工业园目前处于出租状态，公司正积极推进其出售事宜

每经AI快讯，有投资者在投资者互动平台提问：董秘你好，请问公司对深圳长方工业园和惠州工业园下一步有何安排？是继续出租还是出售，还是留着自建生产基地？ *ST长方（300301.SZ）7月10日在投资者互动平台表示
2025-07-11工业园，*ST长方，公司
*ST长方：公司不涉及固态电池的研发和技术储备

每经AI快讯，有投资者在投资者互动平台提问：董秘你好，公司在固态电池方面是否有研发和技术储备？ *ST长方（300301.SZ）7月10日在投资者互动平台表示
2025-07-11固态电池，电池，能量密度
2025世界人工智能大会7月26日在沪启幕

7月10日，上海市政府新闻办举行新闻发布会，介绍2025世界人工智能大会（WAIC）暨人工智能全球治理高级别会议筹备进展情况
2025-07-11人工智能，中国，治理
*ST凯鑫：公司暂未引进人工智能技术应用于产品制造

每经AI快讯，有投资者在投资者互动平台提问：董秘你好，公司生产线有引进人工智能技术应用于产品制造来节省成本吗？ *ST凯鑫（300899.SZ）7月10日在投资者互动平台表示，公司主要从事膜分离技术的研究与开发
2025-07-11人工智能，中国，治理
明牌珠宝：公司不断加大铂金产品的推广销售，库存相应增加

每经AI快讯，有投资者在投资者互动平台提问：您好，请问公司的铂金有存货吗？约多少？明牌珠宝（002574.SZ）7月10日在投资者互动平台表示，公司不断加大铂金产品的推广销售，库存相应增加
2025-07-11铂金，明牌珠宝，投资者
泽连斯基称俄被冻结资产收益应用于乌重建工作！德总理：已向美提出购买 “爱国者”用于援乌！乌称前线一天发生201次战斗

当地时间7月10日，乌克兰总统泽连斯基在乌克兰重建会议上发表讲话，提出一系列关于乌克兰重建以及国防工业发展的主张。泽连斯基表示，俄罗斯被冻结资产所产生的收益应当用于乌克兰的国家重建
2025-07-11乌克兰，俄罗斯，斯基
中国银联发布严正声明！

7月10日，中国银联发布严正声明：近期，有机构或个人假冒中国银联名义从事违法经营活动，侵害商家、消费者财产及个人信息安全
2025-07-11中国银联，收款码，经营
英国富时100指数今日收涨1.25% 为6月12日以来首次收于纪录新高

英国富时100指数今日收涨1.25%，为6月12日以来首次收于纪录新高
2025-07-11英国富时100指数，1.25，12
贵州茅台酒销售有限公司2025年渠道商座谈会召开

7月10日，贵州茅台酒销售有限公司2025年渠道商座谈会在茅台会议中心召开，全国各省区渠道商代表围绕市场拓展、渠道建设、服务提升等方面展开探讨交流
2025-07-11贵州茅台酒销售有限公司，渠道商，茅台