当前位置:商业频道首页 > 头条推荐 > 正文

1块顶上代5块!英伟达新王牌让世界用上AI?(2)

因此,B200实际上拥有2080亿个晶体管,能够提供高达20 petaflops的FP4算力。其中,两个GPU与单个Grace CPU相结合的GB200可将LLM(大语言模型)的推理效率提升30倍。

在GPT-3LLM基准测试中,GB200的性能是H100的七倍,训练速度提高了4倍。

第二代Transformer引擎、第五代NVLink高速互联、Ras Engine等技术的引入,更是让英伟达的产品在AI计算领域更加“所向披靡”。

相当于5个H100!英伟达最新王牌B200让全世界用上AI?

3.GB200超级芯片:创造历史的推理加速

GB200超级芯片是两个B200 GPU与Grace CPU结合的产品,成为推理加速的新“核弹”。它不仅可以加速推理,同时在成本和能源消耗上也实现了突破。

黄仁勋在现场介绍道,B200采用双芯片设计,晶体管数量达到2080亿个,单GPU AI性能达20 PFLOPS。两个B200 GPU与Grace CPU结合组成最强AI芯片GB200,通过900GB/s的超低功耗NVLink芯片间互连技术连接。

在标准的1750亿参数GPT-3基准测试中,GB200的性能是H100的7倍,提供的训练算力是H100的4倍。

另外,英伟达此次还带来了全新加速计算平台DGXGB200NVL72,搭载18个GB200,单机架即可达到每秒千万亿次级别的精度计算。相比72个H100,GB200NVL72推理性能提升30倍,成本和能耗降低25倍。一个GB200NVL72机柜可训练27万亿参数的模型,足以支持15个GPT-4模型。

黄仁勋表示,DGX Grace-Blackwell GB200已经超过1 Exaflop的算力。这意味着什么呢?

让我们通过一个简单的比喻来说明其水平:

假设你有一台普通的笔记本电脑,它的算力是1Gigaflop(即每秒10的9次浮点运算)。如果你的笔记本电脑每秒能够完成1次浮点运算,那么完成10^18(即1Exaflop)次浮点运算需要多长时间呢?

热点推送

本周关注

MORE