当前位置:商业频道首页 > 头条推荐 > 正文

AI芯片的一百种死法(3)

当年,以Graphcore为首的挑战者们,各怀绝学,来势汹汹,颇有一种八大门派围攻光明顶的既视感。然而,如今多已散作鸟兽状。

去年3月,芯片公司Mythic一度因资金耗尽而濒临倒闭,快要淹死之际,才好不容易等到了救命缰绳,拿到了1300万美元融资。

另一家芯片公司Blaize也出现了类似的困境,最后靠着中东土豪的投资,才活了下来。

剩下的公司中,Habana可能是唯一活得不错的——它被英特尔以20亿收购,保留了独立运营的权利。

AI芯片的一百种死法

从Graphcore到Mythic,这些芯片公司的技术路线各不相同;然而,它们失败的原因,却出奇一致。事实上,今天大火的Groq,同样也极有可能倒在同一个地方:

芯片卖不出

真正的护城河

英伟达的GPU固然厉害,但它卖芯片的套路,才是真正的护城河。

每年,英伟达都会投入相当一部分的研发经费,围绕GPU搭建系统性能力。当然,这是高情商的说法,低情商的说法是开发一起“捆绑销售”的产品——这才是英伟达最坚实的城墙。目前,英伟达的城墙共有3层:

第一层城墙,是CUDA的编程生态。

众所周知,GPU最初的使用场景是游戏与视频图像渲染。早期,一些华尔街精英偶尔利用GPU的并行计算能力来跑交易,但由于需要重新编写大量代码,因此并未广泛传播开来。

黄仁勋坚信GPU能用于更多领域,因此在2006年推出了降低编程门槛的软件架构CUDA,和自家GPU捆绑推出。

后来,苹果和AMD都推出了类似平台,但此时CUDA生态早已构建,在“用得人越多,CUDA越好用,新开发者越倾向于选择CUDA”的良性循环中稳定前进。

如今,CUDA可以让英伟达GPU的使用成本大幅降低。

一位私有云CEO曾在接受采访时说过,理论上AMD卡也不是不能用,但要把这些卡调试到正常运转,需要多耗费两个月[6]——找谁下单,答案不言而喻。

AI芯片的一百种死法

2017年,英伟达甚至向AI研究员赠送了V100芯片

第二层城墙,是NV-Link的高速传输。

一个数据中心,不可能只使用一块AI芯片。然而,如果将2块AI芯片连在一起,那么实际算力必然会小于2,因为数据传输的速度慢于芯片算力,且过程中还存在损耗。

显然,在GPU数量迅速膨胀的数据中心内,解决数据传输问题其关键。

2016年,英伟达为IBM服务器提供GPU时,首次用上了自研的NVLink技术,带宽高达80G/s,通信速度提高了5倍,性能提升了14%,好评不断。此后几年,英伟达一边迭代NVLink技术,一边规定该技术必须绑定自家芯片使用。

套路虽然简单直白,但就是有效。

而第三层城墙,则是英伟达的“铁杆好兄弟联盟”。

过去一年,英伟达是全球最主要的人工智能投资人之一,活跃程度甚至超过了a16z和红杉等顶级投资机构。

据外媒统计,英伟达去年至少有35笔人工智能投资,包括:由前DeepMind联合创始人创办的Inflection AI,欧洲人工智能独角兽Mistral,世界最大的开源模型社区Hugging Face等等[7]。

AI芯片的一百种死法

Inflection AI创始人苏莱曼

热点推送

本周关注

MORE