当前位置:商业频道首页 > 头条推荐 > 正文

黄仁勋,拐点出现(23)

因为我正在进行大量的思考,进行一项自主性的工作,阅读大量信息。我正在进行深入的研究。之前我一直在听迈克尔讲话,迈克尔也谈到了他正在进行的研究,而我做的也是同样的事情。我们会开展并撰写这些非常冗长的AI研究项目,我非常喜欢做这件事。

我已经为此付出了代价,我非常享受让我们的GPU运转起来。没有什么能给我带来更大的快乐。所以我在撰写完毕后,它就开始运行,进行所有这些研究,它访问了大约94个不同的网站,阅读了所有这些信息,而我也在阅读所有这些信息,然后它会形成一个答案并撰写报告。这真是令人难以置信。

在那段时间里,预填充一直非常繁忙。它并没有真正生成很多标记。另一方面,当您与聊天机器人进行对话,并且数百万人在做同样的事情时,它就需要非常大量的标记生成。解码工作量非常大。因此,根据工作负载,我们可能会决定将更多GPU分配到解码,或者根据工作负载,将更多GPU分配到预填充。这种动态操作非常复杂。

我刚刚描述了流水线并行、张量并行、专家并行、飞行中批处理、解耦推理、工作负载管理,然后我还要处理一个叫做KV缓存的东西,我必须将其路由到正确的GPU,我必须通过所有内存层次结构来管理它。这段软件极其复杂。

因此,今天我们宣布推出英伟达Dynamo。英伟达Dynamo能够做到这一切。它本质上是AI工厂的操作系统。

在过去,在我们运行数据中心的方式中,我们的操作系统类似于VMware。我们会(而且现在仍然会),协调大量不同的企业应用程序在我们企业IT之上运行,我们也是大型用户。

但未来,应用程序并非企业IT,而是智能体。操作系统也不再是VMware之类的软件,而是Dynamo之类的软件。而且这个操作系统运行的并非数据中心之上,而是AI工厂之上。我们将其命名为Dynamo是有充分理由的。如您所知,Dynamo是启动上次工业革命的首个动力机械。

热点推送

本周关注

MORE