当前位置:商业频道首页 > 头条推荐 > 正文

黄仁勋,拐点出现(25)

或者,如果成本低得多,那么问题在于,假设是10万美元,将其除以10。每个工厂每秒25000美元。然后是3100万,一年大约有3000万秒,这就能转化为百万级,兆瓦级数据中心的营收。所以这就是您的目标。

一方面,您希望您的Token速率尽可能快,以便您可以创造真正智能的AI,如果拥有智能AI,人们就会为此支付更多费用。另一方面,AI越智能,您所能生产的数量就越少。这是一个非常合理的权衡。这就是我们试图改变的曲线。

现在,我向您展示的是世界上最快的计算机——Hopper。它彻底改变了一切。那么,我们该如何改进它呢?因此,我们首先提出使用NVLink 8的Blackwell架构。同样的Blackwell架构,相同的计算单元,以及使用FP8的NVLink 8计算节点。

因此,Blackwell更快了。更快、更大、更多晶体管,一切都要更多。

但我们想做的不止这些,因此我们引入了新的精度。这并不完全像4位浮点数那样简单,但使用4位浮点数,我们可以量化模型,用更少的能量做同样的事情。因此,当您使用更少的能量做同样的事情时,您可以做得更多。

因为请记住,一个重要的观点是,未来每一个数据中心都将受到电力限制。您的收入将受到电力限制。您可以根据可用的电力来计算您的收入。这与许多其他行业没有什么不同。所以我们现在是一个受电力限制的行业。我们的收入将与此相关联。基于此,您需要确保拥有尽可能高效节能的计算架构。接下来,我们将使用 NVLink 72 进行扩展。

请看 NVLink 72 FP4 的差异,由于我们的架构高度集成,现在我们又添加了 Dynamo,Dynamo 可以进一步扩展其性能。所以 Dynamo 也能帮助 Hopper,但对 Blackwell 的帮助更大。

现在请注意我标出的这两个闪光点,这大概就是您的最大Q值所在。这很可能就是您运行工厂运营的地方。您正在尝试在人工智能的最大吞吐量和最大质量之间找到平衡点。最智能的人工智能,以及最大数量的人工智能。这两者的交点,正是您优化的目标。

热点推送

本周关注

MORE