揭秘Sora：用大语言模型的方法理解视频(3)

2024-02-18 07:48:42 A+A-

刚才咱们也聊了，说这个“块”是非常接近token的，那么这些块的作用也应该和token差不太多。对于给定的压缩输入视频，OpenAi就直接提取一系列块作为Transformertoken使用，然后这些时空块会被进一步编码并传递给Transformer网络进行全局自注意力学习。最后利用Transformer的强大能力来处理并生成具有不同属性的视频内容。

这一方案同样适用于图像，因为图像可以看作是仅有一帧的视频。基于块的表示方法使得Sora能够对不同分辨率、时长和宽高比的视频和图像进行训练。在推理阶段，可以通过在一个适当大小的网格中排列随机初始化的块来控制生成视频的尺寸。

此外，在Sora模型的介绍页面虽然提到的都是通过文本来生成视频，但Sora还能够接受其他类型的输入，比如图像或视频，以达到图片生成视频、视频生成视频的效果。这一特性使得Sora能够执行广泛的图像和视频编辑任务——例如制作完美循环播放的视频、为静态图像添加动画效果、向前或向后延展视频时间轴等。

实现对物理世界的“涌现”

在长期的训练中OpenAI发现sora模型逐渐拥有了一项新能力，叫做三维一致性。指的是Sora能够生成动态视角的视频。同时随着视角的移动和旋转，人物及场景元素在三维空间中仍然保持一致的运动状态。

揭秘Sora：用大语言模型的方法理解视频

这个可能对咱们人类来说没什么，但是对于人工智能来说，还是相当厉害的。人工智能理解三维物理世界，跟人类理解三维物理世界的方式不一样，它采用了一种拓扑结构上的理解。注意，这里的拓扑结构不是计算机的拓扑结构，而是拓扑学中的拓扑结构。拓扑结构是一个几何或空间的抽象描述，用于描述集合中元素之间的连接方式和空间属性，而不考虑具体的度量或形状。它关注的是空间中点与点之间的连通关系以及空间的整体形状，而不是具体尺寸或角度等细节。

首页上一页 1 234 5 全文共 5 页下一页

热点推送

超微电脑宣布：开始在全球范围内交付配置英伟达Blackwell Ultra解决方案的服务

超微电脑宣布，开始在全球范围内交付配置英伟达Blackwell Ultra解决方案（NVIDIA GB300 NVL 72）的服务
2025-09-12超微电脑，英伟达，解决方案
东方财富财经早餐 9月12日周五

每日精选要素市场化改革：国务院批复了关于全国部分地区要素市场化配置综合改革试点实施方案
2025-09-12美元，公司，基点
淡水河谷获得巴西Serra Sul年产2000万吨铁矿石项目的运营许可证

淡水河谷获得巴西Serra Sul年产2000万吨铁矿石项目的运营许可证
2025-09-12淡水河谷，铁矿石，2000
AI的风猛吹存储芯片：美光科技、闪迪暴拉七连阳

截至美股周四收盘，美国内存芯片公司美光科技涨超7%，闪存巨头闪迪（Sandisk）拉出一根14%的阳线，两家公司均走出七连阳的暴力拉升节奏。两家公司华丽上涨背后，除了此前的涨价因素外，正是AI叙事的强劲托举
2025-09-12闪迪，美光科技，NAND
美股三大指数齐创收盘新高甲骨文跌超6%

美股三大指数收盘均创下历史新高，道指收涨1.36%，纳指涨0.72%，标普500指数涨0.85%。大型科技股涨跌互现，苹果涨超1%，甲骨文跌超6%，奈飞跌超3%
2025-09-12甲骨文，股价，35.95
Adobe第三季度业绩超预期盘后涨超6%

Adobe第三季度营收59.9亿美元，预期59.1亿美元；第三季度经调整每股收益5.31美元，预期5.18美元。Adobe预计全年营收236.5亿-237.0亿美元，公司原本预计235.0亿-236.0亿美元。Adobe盘后涨超6%
2025-09-12Adobe，美元，三季度
国际油价11日下跌

国际油价11日下跌。截至当天收盘，纽约商品交易所10月交货的轻质原油期货价格下跌1.30美元，收于每桶62.37美元，跌幅为2.04%；11月交货的伦敦布伦特原油期货价格下跌1.12美元，收于每桶66.37美元，跌幅为1.66%
2025-09-12下跌，美元，国际油价
“一日首富”埃里森据传将豪掷数百亿美元助力儿子打造媒体帝国

截至发稿，华纳兄弟探索涨幅回落至27%，派拉蒙天空之舞涨超8%，甲骨文跌近6%。知情人士透露，派拉蒙天空之舞正在准备一项以现金为主的多数股权收购提议，出价将针对整间公司
2025-09-12华纳兄弟探索，埃里森，流媒体
股价连续涨停天际股份遭两大股东减持

近日，天际股份(002759.SZ)股价连续多日涨停引发市场关注。与此同时，公司持续发布公告披露大股东多次减持情况。据披露，天际股份股票分别于9月3至5日收盘价格涨幅偏离值累计超过20%和9月8至9日收盘价格涨幅偏离值累计超过20%
2025-09-12天际股份，公司，六氟磷酸锂
资金充裕仍大手笔募资南芯科技汽车领域高投入低回报困局或难解

日前，上海南芯半导体科技股份有限公司（以下简称“南芯科技”，688484.SH）发布公告，拟发行不超过19.33亿元可转债，投入车载芯片等三大项目。由于汽车业务对于公司营收贡献始终较小，如何破解高投入低回报困局值得深思
2025-09-12南芯科技，汽车，公司
金宏气体戴张龙：以全链条积淀助力发展新航向

从工业气体到电子特气，中国气体行业走出了一条从无到有、由小及大的崛起之路。1999年，国内气体市场仍由国际巨头主导，行业发展刚刚拉开帷幕，金宏气体正是在这样的背景下，于苏州扎根起步
2025-09-12金宏气体，张龙，行业
半导体IP龙头强强联合芯原股份拟收购芯来科技

9月11日晚，AI ASIC龙头芯原股份披露收购预案称：公司拟通过发行股份及支付现金方式向芯来共创、胡振波、芯来合创等31名交易对方购买其合计持有的芯来科技97.0070%股权，并募集配套资金；截至预案签署日
2025-09-12芯原股份，公司，交易
中国平安联席首席执行官郭晓涛：用AI深挖“综合金融+医疗养老”的长坡厚雪

“2025年是中国平安成立37年来危机感最为强烈的一年。”面对复杂多变的国际环境，中国平安在半年报中写道。毫不掩饰自身的危机感，并以前所未有的清醒心态迎接挑战，“在逆境中成长”，正是这家金融巨头保持稳健发展的秘诀
2025-09-12中国平安，谢永林，战略优势
东阳光集团领投秦淮数据制造业龙头布局算力基建

9月10日，深圳市东阳光实业发展有限公司（东阳光集团）宣布携手上市公司东阳光（600673.SH）及其他联合投资人组成买方团，通过现金支付方式，拟以280亿元向贝恩投资收购秦淮数据中国业务公司100%股权
2025-09-12秦淮数据，算力，东阳光
周五亚太盘初道琼斯指数期货涨0.02%

周五亚太盘初，道琼斯指数期货涨0.02%，标普500指数期货涨0.01%，纳斯达克100指数期货跌0.02%
2025-09-120.02，道琼斯指数，期货
微软与OpenAI达成非约束性协议允许OpenAI推进其重组计划

微软盘后涨超2%。消息面上，微软和OpenAI周四宣布，双方已签署了一项不具约束力的协议，该协议将允许OpenAI推进其重组计划，使其成为一家营利性公司
2025-09-12微软，OpenAI，协议
【今日投资机会】关注港股的修复机会

大家好，今天是2025年9月12日星期五，欢迎来到今日投资机会！投顾观点：辨识度抱团高潮
2025-09-12东方财富证券，AI芯片，辨识度
瑞尔集团亮相上海FDI世界牙科大会，AI已深入口腔医疗三大核心领域

9月9日至12日，全球口腔医学领域最具影响力的盛会——FDI世界牙科大会在上海举行。本届大会以“创新、协作与健康未来”为主题，吸引了134个国家和地区的3.5万余名专业人士报名，数百家全球知名口腔企业确认参展
2025-09-12瑞尔集团，章锦才，AI
全球市场：美股三大指数均创历史新高中国金龙指数涨近3% 甲骨文跌超6%

美股市场：美股三大指数09月11日收盘全线上涨
2025-09-12上涨，涨幅，美元
中冶宝钢全球首发120吨电驱抱罐车，整个运输环节实现“零碳排放”

中冶宝钢3款“新能源”电驱无轨化冶金大物流特种车辆昨天发车，标志着“中冶重机”品牌冶金物流装备实现绿色化、智能化的跨越式发展。此次的3款新车分别是120吨整体式电动抱罐车、120吨电动渣罐运输车及80吨铰接式电动抱罐车
2025-09-12新能源，宝钢，环保
西京学院两项成果获2024年度陕西省科学技术奖

西京学院两项成果获2024年度陕西省科学技术奖
2025-08-19西京学院两项成果获2024年度陕西省科学技术奖
把名字变成资产，越来越多创业者正在这样做

把名字变成资产，越来越多创业者正在这样做在创业圈里，有句话流传得很广：“真正会做生意的人，是从名字开始投资的。”一个好名字，不仅能吸引顾客，更能成为企业的重要资产。
2025-07-10把名字变成资产，越来越多创业者正在这样做
影视美育浸润|跟着清华大学老师一起聊电影，西影-清影“爱与成长”亲子影院启动

影视美育浸润跟着清华大学老师一起聊电影，西影-清影“爱与成长”亲子影院启动6月22日
2025-06-23影视美育浸润|跟着清华大学老师一起聊电影，西影-清影“爱与成长”亲子影院启动
美国沃特佩顿高中来访西安交大附中全天候互动共促中美人文交流

美国沃特佩顿高中来访西安交大附中全天候互动共促中美人文交流
2025-06-17美国沃特佩顿高中来访西安交大附中全天候互动共促中美人文交流
Babycare登陆日本8000门店：一场高标准市场的长期主义战役

日本母婴零售市场,出现了一张中国面孔。
2025-06-17Babycare登陆日本8000门店：一场高标准市场的长期主义战役
西安医学院携手温州医科大学与西安城市发展集团共绘“政产学研用”协同发展新蓝图

6月14日，西安医学院与温州医科大学、西安城市发展（集团）合作共建座谈会在未央校区召开。
2025-06-17西安医学院携手温州医科大学与西安城市发展集团共绘“政产学研用”协同发展新蓝图
超万份好礼赠予新生，Babycare打造“38幸运女孩礼遇季”

“三八节”不仅是一个致敬女性的节日,更是一个承载着爱与关怀的特殊时刻。
2025-03-11超万份好礼赠予新生，Babycare打造“38幸运女孩礼遇季”
第18届世界杰出华人奖得主王傲山：承父业展关怀，体现“圆桌”精神

王傲山博士是“保二代”，由父亲言传身教及自孩提时代刻在骨子里的氛围，让他理所当然地传承父亲保险助人为乐的精神。
2024-09-09杰出华人奖
Kimi每天获客成本超20万元 AI行业竞争加剧！

最近，由月之暗面公司推出的国产AI大模型——Kimi引发了广泛关注，其技术先进性和市场表现成为热议的焦点。
2024-03-25Kimi每天获客成本超20万元
微软新策略：推荐Bing作为Chrome默认搜索引擎！计划向 Win10 / Win11 投放通知！

近日，微软官方向《Windows Latest》媒体透露，将于近期对 Windows 10 与 Windows 11 用户发布一项特别的服务器端更新。
2024-03-15Bing