皮衣教主又杀回来了!
在今日的英伟达GTC(GPU技术大会)上,黄仁勋再次炸场,每个产品的发布与更新都让现场掌声连连。英伟达新一代Blackwell架构来了;
“一个顶五个”的B200来了;“让全世界用上AI”的AI推理微服务NIM也来了!
让我们一起来回顾这一场吸引全球目光、号称标志着“新工业革命”引擎诞生的发布会。
1.黄仁勋:新时代的乔布斯
有了生成式AI的加持,黄仁勋此次的演讲像是一场科幻电影,无论是现场播放的由Backwell制作的影像片段,还是黄教主现场与九个机器人的互动,都让现场的科技感、沉浸感、未来感直线拉满。
去年黄仁勋喊出AI的“iPhone时刻”已经到来,生成式AI不断开始改写我们的日常生活,而今天的一系列发布,更是表明改写的速度正在指数级上升。
英伟达高级科学家 Jim Fan 现场调侃黄仁勋是新的泰勒 · 斯威夫特,因为现场人满为患如演唱会一般,然而
黄教主用两个小时的时间,让观众明白了或许他才是新时代的乔布斯。
2.性能翻30倍的世界最强GPU来了
黄教主带来了第一张王牌就是Blackwell架构,黄仁勋称这颗芯片的名字来自数学家、博弈论家、概率论家 David Blackwell。
基于Blackwell架构的Blackwell B200 GPU在性能上翻了30倍,带来了惊人的计算能力。
Blackwell架构下的计算芯片拥有1040亿个晶体管,比上一代GH100 GPU的800亿个晶体管实现了重大突破。而且,Blackwell B200并非传统意义上的单一GPU,而是由两个Blackwell GPU组合而成。通过10 TB/s NV-HBI(Nvidia高带宽接口)连接,确保每个芯片都能独立运行。
因此,B200实际上拥有2080亿个晶体管,能够提供高达20 petaflops的FP4算力。其中,两个GPU与单个Grace CPU相结合的GB200可将LLM(大语言模型)的推理效率提升30倍。
在GPT-3LLM基准测试中,GB200的性能是H100的七倍,训练速度提高了4倍。
第二代Transformer引擎、第五代NVLink高速互联、Ras Engine等技术的引入,更是让英伟达的产品在AI计算领域更加“所向披靡”。
3.GB200超级芯片:创造历史的推理加速
GB200超级芯片是两个B200 GPU与Grace CPU结合的产品,成为推理加速的新“核弹”。它不仅可以加速推理,同时在成本和能源消耗上也实现了突破。
黄仁勋在现场介绍道,B200采用双芯片设计,晶体管数量达到2080亿个,单GPU AI性能达20 PFLOPS。两个B200 GPU与Grace CPU结合组成最强AI芯片GB200,通过900GB/s的超低功耗NVLink芯片间互连技术连接。
在标准的1750亿参数GPT-3基准测试中,GB200的性能是H100的7倍,提供的训练算力是H100的4倍。
另外,英伟达此次还带来了全新加速计算平台DGXGB200NVL72,搭载18个GB200,单机架即可达到每秒千万亿次级别的精度计算。相比72个H100,GB200NVL72推理性能提升30倍,成本和能耗降低25倍。一个GB200NVL72机柜可训练27万亿参数的模型,足以支持15个GPT-4模型。
黄仁勋表示,DGX Grace-Blackwell GB200已经超过1 Exaflop的算力。这意味着什么呢?
让我们通过一个简单的比喻来说明其水平:
假设你有一台普通的笔记本电脑,它的算力是1Gigaflop(即每秒10的9次浮点运算)。如果你的笔记本电脑每秒能够完成1次浮点运算,那么完成10^18(即1Exaflop)次浮点运算需要多长时间呢?
1Exaflop=10^18Flops
如果你的笔记本电脑每秒完成1Flop,那么完成10^18Flops就需要:
(10^18Flops)/(1Flop/second)=10^18seconds
换算成年份:
10^18seconds/(60seconds/minute*60minutes/hour*24hours/day*365days/year)≈31.7亿年
换句话说,
一台每秒完成1Flop的笔记本电脑,要花费大约31.7亿年的时间才能完成1Exaflop的运算量。
所以1Exaflop的庞大程度,可以说是一鸣惊人了。
4.推理微服务NIM:AI部署的新标杆
NVIDIA推出的AI推理微服务NIM成为世界AI的入口,为用户提供了部署和管理AI模型的平台。通过NIM,用户可以体验各种AI模型和应用,同时保留对知识产权的完全控制。黄仁勋表示,NVIDIA正在帮助企业和应用程序对模型进行微调或定制。
NIM可以使开发者能够将部署时间从几周缩短至几分钟,为语言、语音、药物发现等领域提供行业标准API,让开发者能够利用在自己基础设施中的专有数据快速构建AI应用,而不必依赖云服务器。
英伟达希望通过这些服务吸引购买英伟达服务器的客户注册英伟达企业版NVIDIA AI Enterprise 5.0,每个GPU每年收取4500美元的费用。企业可以选择在亚马逊云科技(AWS)、谷歌云、Azure、Oracle Cloud Infrastructure等云平台上部署这些微服务。
相较于新AI模型的初始训练,推理过程所需的计算能力较少。对于那些希望自行运行AI模型,而不是购买AI结果作为服务的企业来说,NIM将成为一款不错的选择。
“在我原本调用OpenAI的代码中,我只需替换一行代码,将其指向从英伟达获取的NIM即可。”
一位开发者表示。
5.英伟达的愿景:引领新工业革命
黄仁勋的野心究竟有多大?在他看来,英伟达站在计算科学和物理等一切科学的交叉点,成为新工业革命的引擎。这是英伟达的使命,也是他心中英伟达的定位。
正如黄仁勋在开场白中说的那样,我们见证了计算机技术的革命以及人工智能的崛起。从过去到现在,我们经历了无数里程碑,包括首台DGX-1超级计算机的诞生、CUDA的出现以及生成式AI的发展。
如今,皮衣教主黄仁勋已经在生成式AI领域拔得头筹,带领着下一场工业革命的开启。
相关阅读:
性能可提升30倍,英伟达发布全新构架,今年上市,一套或售20万美元
3月19日消息,当地时间周一,
英伟达
在美国加州圣何塞(San Jose)举办的全球开发者大会上,隆重发布了最新一代
人工智能
专用
GPU
芯片以及运行人工智能模型的软件,意图进一步巩固其作为人工智能领域首选供应商的地位。
英伟达推出的新一代人工智能GPU架构命名为Blackwell,首款基于该架构的GB200芯片预计将在今年晚些时候推出。
在处理大型语言模型(LLM)推理工作负载时,GB200性能可提升30倍,同时在成本和能效上也有显著提升。英伟达称,与H100相比,“GB200能将成本和能耗降低至多达25倍”。
尽管当前市面上如Hopper架构的H100芯片等旧款产品依然供不应求,英伟达仍通过推出更高性能的新芯片来吸引客户,鼓励他们持续下单。
自2022年底,随着OpenAI推出聊天机器人ChatGPT,掀起了一股人工智能热潮,英伟达股价随之飙升五倍,营业收入也增长了逾两倍。英伟达的高性能GPU对于训练和运行大型人工智能模型至关重要。像
微软
、Meta这样的科技巨头,都斥资几十亿美元购买这种芯片。英伟达首席执行官
黄仁勋
在大会上表示:“Hopper架构固然出色,但我们追求的是更加强大的GPU。”
英伟达股价在周一盘后交易中微跌超过1%。
为了让客户在面对日益增多的竞争产品时更倾向于选择英伟达芯片,公司还推出了一款名为NIM的付费软件,使得部署人工智能变得更加简单。
英伟达高管表示,公司正从单一芯片供应商转型为类似于微软或苹果那样的平台提供者,其他公司可以在其平台上开发软件。
黄仁勋坦言:“Blackwell不仅仅是一款芯片,它代表的是一个平台。”
英伟达企业计算部门副总裁马努维尔·达斯(ManuvirDas)在接受采访时表示:“最畅销的商业产品仍是GPU,软件则是为了帮助用户以不同的方式使用GPU。”他补充道:“当然,我们依然在致力于产品的创新。但现在,我们真正实现了转变,已经发展出了自己的商业软件业务。”
英伟达新软件能让在所有英伟达GPU上运行程序变得更加简便,即便是对于那些老款GPU,它们虽更适合于部署人工智能应用,而非开发,也能轻松应对。
达斯说:“如果您是开发者,手中有一个备受期待的模型,希望能让更多人采用,只需将其部署在NIM上。我们承诺将兼容所有英伟达GPU,确保模型能触及广泛用户群。”
Hopper架构的继任者Blackwell
每隔两年,英伟达都会更新其GPU架构,从而实现性能的显著跃升。在过去一年中,众多发布的人工智能模型均在2022年宣布的Hopper架构基础上进行训练,此架构涵盖了包括H100在内的多款芯片。
据英伟达介绍,基于Blackwell架构的GB200芯片将为人工智能领域公司带来性能上巨大的飞跃,其人工智能计算能力可达每秒20千万亿次,远超过H100芯片的每秒4千万亿次。
这一强大的计算能力将使企业得以训练规模更大、复杂度更高的人工智能模型。
GB200芯片还特别集成了英伟达的高性能Transformer推理引擎,该技术专为运行基于Transformer架构的人工智能设计,正是构成流行聊天机器人ChatGPT核心技术的关键部分。
Blackwell架构的GPU芯片体积庞大,实际上是由两块独立制造的芯片集成于一块台积电代工的芯片上。英伟达同时推出了配套的GB200 NVLink 2服务器,内置72块Blackwell架构GPU,以及其他用于人工智能模型训练的专业组件。
知名云服务提供商,包括亚马逊、谷歌、微软及甲骨文等,均将提供GB200芯片的云服务。每套GB200系统由两块基于Blackwell架构的B200 GPU和一块基于ARM架构的Grace CPU组成。英伟达透露,亚马逊网络服务(AWS)计划建立一个包含2万套GB200系统的超级计算集群。
英伟达表示,亚马逊的服务器集群能够部署达到27万亿个参数的人工智能模型,规模远超目前已知最大的GPT-4模型,后者拥有1.7万亿个参数。许多人工智能研究人员认为,拥有更多参数和数据的超大模型能够展现出更为强大的能力。
虽然英伟达未公布GB200芯片及其系统的具体售价,但根据分析师估计,参照Hopper架构H100芯片的售价范围(每块约2.5万至4万美元),一整套GB200系统的成本可能高达20万美元。
英伟达的推理微服务
英伟达还宣布,在其企业软件订阅服务中新增了一款名为NIM的产品,即英伟达推理微服务(NVIDIAInferenceMicroservices)的缩写,旨在简化使用旧型号GPU进行人工智能推理和软件运行的过程,使企业能够继续利用现有的数亿块英伟达GPU资源。相较于训练新的人工智能模型,推理计算所需的计算资源更少,因此,企业可以通过NIM更加便捷地运行自己的人工智能模型,而不必依赖于OpenAI等公司提供的计算服务。
作为其战略的一部分,英伟达鼓励购买其服务器的客户订阅英伟达企业服务,并按每块GPU每年4500美元的标准收取许可费。此外,英伟达将与微软、HuggingFace等领先的人工智能企业合作,确保它们开发的人工智能模型能够在所有兼容的英伟达芯片上顺畅运行。开发者可通过NIM服务,无需复杂配置,就能在自己的服务器或基于云的英伟达服务器上高效地运行模型。
“在原本调用OpenAI服务的代码中,仅需替换一行代码,即可将其连接至英伟达提供的NIM服务,”达斯解释说。
英伟达表示,NIM软件不仅能在云服务器上运行,还能使配备英伟达GPU的笔记本电脑上顺畅运行人工智能应用,进一步扩展了NIM服务的应用场景。
当地时间1月20日,唐纳德·特朗普将宣誓就职,正式成为美国第47任总统。 当天,恰逢马丁·路德·金纪念日,是美国法定联邦假日,所有联邦机构、学校和邮局都将关闭。 总统就职典礼,见证了美国历届政府更替,是该国重要的文化传统
2025-01-20美国,总统,马丁·路德·金1月20日,记者留意到,肖勇以全新身份出现在公众面前。全新身份有两个:一是广汽集团埃安营销本部负责人,二是埃安汽车销售服务有限公司执行董事。此前,肖勇职务是广汽埃安副总经理
2025-01-20营销,广汽集团,埃安1月19日晚间,超频三(300647)发布2024年预亏公告,预计全年业绩亏超3.2亿元,较上年同期亏损额有所增长
2025-01-20超频三,亏损,公司证券时报e公司讯,企查查APP显示,近日,蜂鸟储充(商丘)新能源技术有限公司成立,法定代表人为胡传峰,注册资本4000万元,经营范围包含:人工智能公共数据平台;物联网技术研发;物联网技术服务;货物进出口等
2025-01-20赣锋锂业,新能源,公司证券时报e公司讯,企查查APP显示,近日,三博脑科(北京)健康产业科技有限公司成立,法定代表人为蔡斌斌,注册资本1亿元,经营范围包含:计算机系统服务;电子产品销售;医学研究和试验发展;信息技术咨询服务等
2025-01-20三博脑科,公司,健康产业1月20日,人民银行授权全国银行间同业拆借中心公布,贷款市场报价利率(LPR)为:1年期LPR为3.1%;5年期以上LPR为3.6%,均与上期持平,符合市场预期。 “1月LPR报价保持不变,符合市场预期
2025-01-20LPR,中国人民银行,年期20日早盘,AI硬件股再度走强,CPO(光模块)、高速铜连接、PCB(印制电路板)等细分方向表现亮眼,全市场首只的创业板人工智能ETF华宝(159363)高开高走,场内价格涨超2%领涨全市场AI主题类ETF,冲击日线三连阳
2025-01-20人工智能,创业板,指数中证网讯(王珞)直真科技1月18日发布2024年业绩预告,公司预计归属于上市公司股东的净利润为2400万元-3600万元,较上年同期下降53.76%-69.18%;扣除非经常性损益后的净利润为1800万元—2700万元
2025-01-202024,公司,净利润深交所1月17日公告显示,广州银行撤回发行上市申请,深交所正式终止了对该行股票发行的审核程序。 这家“排队”近五年的城商行,就此按下了IPO进程的“终止键”。 16年的漫长上市路 广州银行的这条上市路,已经走了16年之久
2025-01-20广州银行,李大龙,上市*ST宁科再度涨停,8个交易日内录得5个涨停,累计涨幅为28.44%,累计换手率为27.14%。截至9:45,该股今日成交量1653.01万股,成交金额4492.37万元,换手率2.41%。最新A股总市值达19.18亿元
2025-01-2020,25.,*ST宁科2024年中央经济工作会议将“大力提振消费、提高投资效益,全方位扩大国内需求”列为2025年九项重点任务之首,凸显内需对我国经济发展的重要意义
2025-01-20消费,以旧换新,家电在四大直辖市的城商行中,天津银行(01578)的发展有些相形见绌
2025-01-20天津银行,2024,天津证券时报e公司讯,企查查APP显示,近日,长沙永天宇科技有限公司成立,法定代表人为段大伟,注册资本为50万元
2025-01-20永艺股份,人工智能,家具中央纪委国家监委驻中国银行(601988)纪检监察组、辽宁省纪委监委公告,中国银行内蒙古自治区分行原党委委员、副行长刘明涉嫌严重违纪违法,目前正接受中央纪委国家监委驻中国银行纪检监察组纪律审查和辽宁省葫芦岛市监委监察调查
2025-01-20中国银行,葛海蛟,董事长万和电气盘中涨停,已连收3个涨停板,截至9:41,该股报13.13元,换手率4.86%,成交量3213.99万股,成交金额4.06亿元,连续涨停期间,该股累计上涨33.16%,累计换手率为10.61%
2025-01-2020,25.,万和电气编者按: 为帮助投资者更好了解企业真实发展情况与价值,进一步保护投资者合法权益等,财联社、《科创板日报》联合打造《直击股东会》栏目
2025-01-20有方科技,公司,物联网证券时报e公司讯,企查查APP显示,近日,长沙市好太太智能科技有限公司成立,法定代表人为曹彩凤,注册资本50万元,经营范围包含:数字技术服务;物联网技术研发;物联网技术服务;家用电器销售等。企查查股权穿透显示,该公司由好太太全资持股
2025-01-20好太太,公司,物联网近日,极狐汽车与蔚来能源达成充电互联互通合作,蔚来能源充电网络面向极狐汽车开放,为其用户提供覆盖广泛、查询高效、使用便捷的充电服务。 根据合作协议,极狐汽车用户可以通过极狐App、充电吧小程序,在全国范围查找并使用蔚来能源充电桩
2025-01-20蔚来,交付,汽车昨日一则消息引发市场关注,被称为国内AI制药第一股的晶泰控股-P(02228.HK)公布配售公告,涉及金额超10亿港元。 截至发稿,晶泰控股跌2.58%,报4.53港元
2025-01-20晶泰控股,配售,股份【大河财立方记者丁洋涛】1月19日,记者从河南省物流与采购联合会冷链分会获悉,2024年12月河南冷链物流观察报告(以下简称报告)出炉
2025-01-20冷链,冷链物流,河南企查查APP显示,近日,广州侨霖城市管理有限公司成立,法定代表人为刘宁馨,注册资本100万元,经营范围包含:碳减排、碳转化、碳捕捉、碳封存技术研发;机动车充电销售;5G通信技术服务等。企查查股权穿透显示,该公司由侨银股份间接全资持股
2025-01-20侨银股份,5G,公司华夏时报记者于娜见习记者蒋力北京报道 在股价一路走低并录得10CM跌停后,哈药股份坐不住了
2025-01-20哈药股份,商标,药品证券时报e公司讯,近日,华夏幸福与海南三亚市属国有企业海棠湾投资控股有限公司(简称“海棠湾投控”)签署合作协议
2025-01-20低空经济,合作,海棠湾1月20日,《每日经济新闻》记者从接近保利发展(600048SH,股价8.60元,市值1029亿元)方面的人士了解到,保利发展已于近日进行组织架构调整,主要涉及区域公司合并及相关人事调整
2025-01-20公司,保利发展,2024证券时报e公司讯,企查查APP显示,近日,成都傲农饲料有限公司成立,法定代表人为庾敏,注册资本300万元,经营范围包含:畜牧渔业饲料销售;饲料原料销售;饲料添加剂销售;饲料生产专用设备销售等。企查查股权穿透显示,该公司由*ST傲农全资持股
2025-01-20*ST傲农,饲料,公司每经AI快讯,天眼查App显示,近日,元气森林(珠海)食品科技有限公司成立,法定代表人为石磊,注册资本100万人民币
2025-01-20食品,元气森林,零售针对“董明珠被停职审查”的市场传闻,1月18日,认证为“珠海格力电器股份有限公司文化传媒中心”的微博账号“格力文传”发布声明,称该信息纯属无中生有、恶意中伤的谣言
2025-01-20格力电器,董明珠,空调消费电子概念20日盘中走势活跃,截至发稿,智迪科技20%涨停,神宇股份涨近15%,瀛通通讯、春秋电子、鑫科材料等均涨停,景旺电子、国星光电、大为股份涨超8%
2025-01-20补贴,消费电子,手机白天义务教育,晚上枪炮教育,逆战烧饼哥才是真专家 教育,永远是个难题。 不久前,我爱我家的关凌发视频称,由于辅导孩子作业,自己急出了心脏病和高血压,逼得自己半夜野跑发泄。这种疯狂的亲子关系,戳中了无数中国父母
2025-01-20游戏,逆战,短视频中证网讯(王珞)1月18日,格灵深瞳(688207)发布公司2024年业绩预亏公告,预计2024年公司实现营业收入10500万元至13500万元,归母净利润-24900万元至-16700万元,扣非净利润-26200万元到-17600万元
2025-01-20格灵深瞳,2024,公司