当前位置:商业频道首页 > 头条推荐 > 正文

黄仁勋,拐点出现(31)

然后,如果我将其转换为,本质上是您的总拥有成本(TCO),即功率在上,每单位功率在下,下面是曲线下方的面积,也就是曲线下的正方形,它基本上是浮点运算次数乘以带宽。所以,衡量您的AI工厂是否取得进展的一个非常简单的直觉检验方法是,用瓦特数除以那些数字。您可以看到,Rubin将大幅降低成本。这就是英伟达的路线图,非常简短。一年一次,像钟表一样精确。一年一次。

我们如何进行规模化扩展?我们引入了,我们正在准备进行横向扩展。那是规模扩展,使用了NVLink技术。我们的规模扩展网络是InfiniBand和Spectrum X。

大多数人都很惊讶我们进入了以太网领域。我们决定使用以太网的原因是,如果我们能够帮助以太网达到InfiniBand的性能,拥有InfiniBand的特性,那么网络本身将更容易被所有人使用和管理。因此,我们决定投资Spectrum,我们称之为Spectrum X,并将拥塞控制、极低延迟和作为我们计算结构一部分的少量软件的特性融入其中。结果,我们使Spectrum X的性能极其出色。

我们使用SpectrumX构建了有史以来最大的单一GPU集群,作为一个巨大的集群。这就是Colossus(巨型计算机系统)。还有许多其他的例子。SpectrumX无疑对我们来说是一个巨大的成功。我非常期待的一个领域是,最大的企业网络公司将采用SpectrumX并将其集成到其产品线中,以便帮助全球企业成为人工智能公司。

我们在CX7上拥有10万个用户。现在CX8即将推出,CX9也即将推出。在Rubin任职期间,我们希望将GPU数量扩展到数十万个。现在,将GPU扩展到数十万个面临的挑战在于扩展连接。扩展连接使用的是铜缆。我们应该尽可能地使用铜缆。这大约是一到两米左右的距离。这提供了令人难以置信的良好连接性、非常高的可靠性、非常好的能源效率以及非常低的成本。

热点推送

本周关注

MORE