当前位置:商业频道首页 > 财讯 > 正文

李彦宏谈DeepSeek:大语言模型每年推理成本降九成(4)

这仍然是一个新行业、新领域,人们对事故的容忍度很低。我们非常重视安全问题,截至今天,我们已经在相对大规模的情况下运营了两三年,还没有发生任何严重事故。

训练更好的下一代模型

奥拉马:几周前,当DeepSeek成为人人都谈论的话题时,全球许多大型芯片厂商和许多大型交易所的股价大幅下跌。因为之前有令人瞠目结舌的数十亿美元,被投资于推理数据中心、训练这些人工智能系统和模型,您如何看待数据中心和AI基础设施的未来?

李彦宏:我在过去一个月左右的时间里,一直在思考这个问题。我认为,从基本面来看,最重要的主题仍然是技术进步非常快,成本每年降低约90%,性能越来越好。当技术发展如此之快,你无法停止投资。你必须投资,以确保处于这场技术创新或革命的最前沿。我们仍需对芯片、数据中心和云基础设施进行持续投入,用于打造更优秀、更智能的下一代模型。

为此,需要使用更多的算力来尝试不同的路径。也许,在某个时刻你会找到一条捷径,比如说只需600万美元就能训练出一个模型,但在此之前,你可能已经花费了数十亿美元,用来探索哪条路才是花费这600万美元的正确途径。

奥拉马:这难道不是赌徒的困境吗?我已经花了1亿美元,现在我需要收回一些成本,所以继续投入。那么,谁会赢呢?所以,总有一天我们能够获得足够的回报来证明这是值得的吗?

李彦宏:我对人工智能的未来持乐观态度。我认为,即使在当前水平下,大语言模型也已经在各种场景中创造大量价值。我们有数十万客户在使用大模型提高招聘、电子商务、医疗保健甚至能源、电力等领域的效率。

我们已经看到了很多这样的应用案例。在过去,他们可能需要花费不到1万美元来实现某些目标,而使用大型语言模型后,只需花费大约1000美元。所以,这已经为他们创造了价值。

热点推送

本周关注

MORE