当前位置:商业频道首页 > 头条推荐 > 正文

黄仁勋,拐点出现(6)

还记得两年前,当我们开始使用ChatGPT时,尽管它是一个奇迹,但许多复杂的问题和许多简单的问题,它都无法正确解答。这是可以理解的。它采用了一种“一击即中”的方式,利用其从预训练数据中学习到的知识,以及从其他经验中获得的信息(预训练数据),然后直接给出答案,就像一条鲑鱼一样(直来直去)。

现在我们拥有能够逐步推理的人工智能。使用称为“思维链”(chain of thought)、“最佳N”(best of N)、“一致性检查”(consistency checking)、多种不同路径规划以及各种不同技术,我们现在拥有能够进行推理的人工智能,将问题分解,然后进行推理,逐步进行。

那么,您可以想象,结果就是我们生成的标记数量增加了,而人工智能的基本技术仍然相同,生成下一个标记,预测下一个标记。只不过下一个标记现在构成了步骤1。然后,在生成步骤1之后,下一个标记会将步骤1再次输入人工智能,从而生成步骤2、步骤3和步骤4。因此,它不是仅仅生成一个接一个的标记或单词,而是生成代表推理步骤的单词序列。结果生成的标记数量大幅增加,我稍后会向您展示,轻松地达到之前的百倍。

那么,百倍意味着什么?嗯,它可以生成百倍数量的标记,正如我之前解释的那样,您可以看到这种情况正在发生。或者,模型更加复杂。它生成的标记数量是之前的十倍,为了保持模型的响应速度和交互性,避免我们因等待其思考而失去耐心,我们现在需要计算速度提高十倍。因此,标记数量十倍,速度十倍,我们必须进行的计算量轻松地就达到了百倍。因此,您将在演示的其余部分看到,我们进行推理所需的计算量比以往大幅增加。

那么,问题就变成了,我们如何教会人工智能执行我刚才描述的操作?如何执行这种思维链?嗯,一种方法是,你必须教会人工智能如何推理。正如我之前提到的,在训练过程中,我们必须解决两个根本性问题。数据从何而来?数据从何而来?以及如何避免其受到人工干预的限制?我们所能提供的数据和人工演示是有限的。

热点推送

本周关注

MORE