本文为《进击的AI巨头》系列第001篇文章,《进击的AI巨头》聚焦头部AI公司的最新动向,我们将持续追踪这些正在影响AI未来走向的核心参与者。本文聚焦于英伟达发布的H20GPU芯片。
一枚性能大幅缩水AI芯片,可能会让英伟达在中国挣上900亿。
7月5日,咨询机构SemiAnalysis发布报告称,英伟达在今年有望交付100万枚H20GPU。
考虑到这是一枚阉割过,且性价比较低的“对华特供版”芯片,基本可以认定,这100万枚芯片将在今年全部流入中国大陆市场。以目前该型芯片1.2-1.3万美元的渠道定价来看,H20芯片可以为英伟达带来至少120亿美元的收入,已经超过了这家公司去年在华总营收。
不过,H20在中国市场的实际情况,可能并没有如咨询机构预估的那般乐观。
一位服务器经销商向虎嗅表示,目前一台H20八卡服务器,定价大约在120万元,而性能大幅领先的满配H100NVLink版本的八卡服务器价格为270万元上下,而且是现货。
尽管后者早早被列入禁止对华出售的名单中,但在非官方渠道中,这款芯片的货源基本没有断过,甚至在今年二季度H200开售后,这款芯片的价格还下跌了约10%。
“无论怎么看,H20的性价比都还是太低。”这位服务器经销商提到,即便是同国内的解决方案相比,H20都难言有多大的竞争优势。
与同系列芯片不同,H20是一枚“赶工”性质非常明显的产品。
在去年10月美国升级芯片禁令后,原本就被视为阉割版芯片的A800/H800,甚至是消费级产品RTX4090都被纳入禁令的管制范围。
但仅在一个月后,就有台湾地区媒体报道称,英伟达向代工厂下了H20芯片的订单。
在如此短的时间内,英伟达不可能重新设计一款芯片,最大的可能是基于既有型号进行有针对性的调整。
比如新规中取消了将“互联带宽”作为限制芯片的识别参数,英伟达就将H20的HBM3显存容量拉高到96Gb,使显存带宽提高到4.0Tb/s;又比如新规新增了“性能密度”的限制,英伟达就向算力规格大砍一刀,使其理论性能仅为296TFLOP,相当于H100芯片的15%。
至于那些新规没有提到的,比如PCIe Gen5扩展卡、八路HGX,英伟达全部保留了下来。值得一提的是,H20还有非常高的卡间互联速度,其NV Link带宽达到900Gb/s,很适合组建大规模集群。
但这些特征组合在一起,却形成了一个很尴尬的事实:在算力大幅削减的情况下,H20的BOM(综合硬件成本)很可能跟H100齐平,甚至高于后者。
原因在于,存储颗粒一直是高性能计算卡成本的“大头”,比如H100芯片中,HBM3颗粒的采购就要占到60%左右,而在H20芯片上,英伟达又不得不为其配备更高规格的显存容量,以弥补算力不足的缺陷。
基本可以断定,H20在英伟达高性能计算卡中,属于利润率最低的存在。相较于1.2-1.3万美元的售价,与它同成本的H100目前定价为2.5-3万美元。
从这个角度来看,H20算是英伟达的一款良心产品了。
英伟达自然不甘心于让一款单品拉低公司整体的毛利表现,但自去年芯片禁令升级后,英伟达四季度在中国大陆的营收,从上一季度的40.3亿降低至19.46亿,其中国区数据中心营收占比也从22%滑落至8%,英伟达急需用一款产品去稳住在中国的市场份额。
H20就是英伟达拿出的诚意之作,但还是那个问题,H20的算力实在羸弱,这个硬伤无法被忽视。
实际上,英伟达曾在今年2月进行过一次官方调价,在调价之前H20芯片的价格为2.3万美元,尽管英伟达表示降价的原因是“供货充足”,但如此大幅的价格调整,主要原因大概率还是销量没有达到预期。
“国内大厂基本不会考虑H20服务器,都是闭眼买H100,而那些体量相对小的厂商也认为有点划不来。”
有服务器经销商向笔者算了一笔账,现在H100的服务器单机租赁费用大概是8-9万元/月,而算力仅有前者六分之一的H20服务器价格为120万元上下,即便不考虑算力损耗的问题,厂商也需要购买6台H20服务器,才能与H100服务器相齐平。
这样一对比,H20虽然是英伟达利润率最低的产品,但对于客户来说,实在称不上有性价比。
而对于英伟达来说,还有一个不可忽视的因素是国内同类型竞品,比如华为昇腾910B。
与H20相比,910B在单卡算力(FP16)上几乎相当于前者的一倍。相应地,910B价格也要高于H20,服务器经销商向笔者表示,目前910B的服务器价格已经超过170万元。
抛开价格,从实际表现来看,二者的竞争互有胜负手。910B强在算力和能效比上,H20则胜在软件生态与互联上。最直接的例子就是,H20兼容所有的英伟达H系列卡,而且具备极高的访存能力,在搭建算力集群时,能够更好地避免算力损耗。
当然,这个集群规模是有上限的,比如各地筹划的“万P计算集群”,如果用H20搭建,那么0.15P单卡运算能力就意味着十万颗级别的GPU,组网难度极大。
另外一个值得关注的问题是,英伟达与华为谁能更加稳定地供应产品?
此前,就有业内人士向笔者提到过,对于那些急于购买搭建算力中心的厂商来说,H20可能是更现实的选择。
一方面,英伟达的软件生态更加成熟,厂商的适配工作量要小得多;另一方面,目前无论是政策还是资本方,都对于算力中心的芯片国产化率有一定要求,910B的需求量非常大,相应地交付周期也比较长。
这一说法笔者也在服务器经销商处得到了验证,对方向笔者表示,“在英伟达调价前,行业内客户对于910B的咨询要远大于H20,但现在也有客户对H20展现出了兴趣,因为有充足的现货。”
有趣的是,二者可能并不是完全意义上的竞争关系,因为有业内人士向笔者表示,在他所在的公司,910B和H20被归为不同分级,在采购上并不冲突。
王傲山博士是“保二代”,由父亲言传身教及自孩提时代刻在骨子里的氛围,让他理所当然地传承父亲保险助人为乐的精神。
2024-09-09杰出华人奖最近,由月之暗面公司推出的国产AI大模型——Kimi引发了广泛关注,其技术先进性和市场表现成为热议的焦点。
2024-03-25Kimi每天获客成本超20万元近日,微软官方向《Windows Latest》媒体透露,将于近期对 Windows 10 与 Windows 11 用户发布一项特别的服务器端更新。
2024-03-15Bing华为在3月14日的AWE 2024大展上,向公众展示了其最新款智慧屏V5系列75英寸版本,宣布该新品将于3月21日启动首轮销售。
2024-03-15华为智慧屏V53月15日,realme品牌向外界正式宣布,其即将推出的真我 GT Neo6 SE手机将配备革新的第三代高通骁龙7+(Snapdragon 7+ Gen 3)芯片。
2024-03-15真我GT Neo6 SE在最新的电子商务领域动态中,淘宝对外宣布了一个令市场瞩目的更新——在其支付页面新增了“微信支付”的选项。
2024-02-20淘宝,淘宝引入微信支付随着科技的不断进步,小米公司再次准备通过其即将发布的小米平板6S Pro引领市场新潮流。此次发布不仅仅是硬件的升级,更是软件体验的全面革新。
2024-02-20小米澎湃OS目前苹果悄然开放了国行iPhone XS Max 手机的 iOS 16.4 签名验证通道,体积6.61GB,有相关手机并有降级需求的小伙伴可以从速上车。
2024-02-20iPhone XS Max,iOSSK海力士,全球领先的半导体制造商,近日宣布其最新的高带宽内存产品HBM3E已完成开发,并通过了英伟达历时半年的严格性能评估。
2024-02-20SK海力士春节长假即将结束,期间多个国家、地区股市表现不错,纷纷上涨。
2024-02-18假期港股三连阳,A50期指五天四涨,七大知名基金经理看好,节后A股稳了2024年“中央一号”文件于2月3日正式发布。
2024-02-05“中央一号”文件加持 农业保险全面升级2024年1月29日,上海市道路运输管理局下发通知称,明确“严格禁止网约车在浦东机场区域内揽客运营”。
2024-02-05为什么唯独这家平台能一枝独秀到浦东机场揽客?售价超6000元、曾一机难求的小米旗舰,悄然现货。这款手机就是售价6499元,在去年10月底发布的小米14Pro钛金属特别款。
2024-02-02雷军兑现承诺, 售价超6000的小米旗舰悄然现货, 曾一机难求1月29日,一则关于云南女士微信号被封的消息引发了公众的广泛关注。据报道,这位女士用了十年的微信账号突然被限制使用,导致她非常难受并多次感到情绪崩溃。
2024-01-30微信,微信公众平台,微信支付,女子称使用10年微信无故被封被急哭:网友称人工多次复核 还说自己无辜在科技快速发展的今天,智能手机市场的变化总是引人注目。
2024-01-30智能手机,销量,价格,为啥价格三四千的手机卖得最差 IDC揭秘:中国智能手机价格段呈K形分化趋势据路透社1月26日报道,美国商务部长吉娜·雷蒙多26日表示,拜登政府将提议要求美国云计算公司确定外国实体是否正在访问美国数据中心以训练人工智能模型。
2024-01-29美商务部长称“将阻止中国获得算力”【手机中国新闻】2023年最热门的手机是什么?想必不论是哪款,其中必定会有华为Mate60系列一席之地,“国产手机一机难求”就是对其最好的描述。
2024-01-29传华为Mate60系列卖爆了 销量超越历代所有Mate系列中国科幻电影的杰作,《流浪地球2》,即将于3月22日在日本上映,为日本观众带来这部视觉盛宴。
2024-01-26流浪地球2在最新的太空探索进展中,中法两国合作的天文学领域迎来了一项重大突破。据最新消息,由中法两国联合研制的天文卫星——SVOM(天基多波段空间变源监视器),计划于今年6月升空。
2024-01-26中法天文卫星根据国际数据公司(IDC)最新发布的市场跟踪报告,2023年中国智能手机市场呈现出积极的增长迹象。
2024-01-252023年国内安卓手机出货量荣耀第一根据最新消息,苹果公司即将发布的iPhone16 Pro Max将采用48Mp索尼IMX903定制主摄,这是基于1/1.14英寸超级大底的高端摄像头,配备双层晶体管技术。
2024-01-24iPhone16近日,国家市场监督管理总局公示了华为技术有限公司(简称“华为”)与成都高新投资集团有限公司(简称“成都高投集团”)等企业联合收购鼎桥通信技术有限公司(简称“鼎桥公司”)股权的消息。
2024-01-19华为与成都高投集团等拟共同收购鼎桥公司100%股权苹果公司的最新产品,Vision Pro头显,即将在京东国际平台上架,为中国市场的消费者带来全新的增强现实和虚拟现实体验。
2024-01-19苹果Vision Pro近日,越南YouTube频道主播Khôi Ngọng对即将推出的三星Galaxy S24系列进行了详细的性能测试。
2024-01-19Galaxy S24AMD为了更加有效地与英伟达的RTX 4070 Ti SUPER显卡竞争,近日在海外市场对其RX 7900 XT和RX 7900 GRE显卡进行了价格调整。
2024-01-19AMD根据The Verge的最新报道,Meta公司近期进行了一次重大的部门改组,集中力量整合其Facebook AI Research(FAIR)和产品部门
2024-01-19Meta传音旗下品牌Tecno继2023年推出Phantom V Fold,正式踏入可折叠手机市场之后
2024-01-19Tecno Phantom V2 Fold雷神公司今日正式公布了其旗下黑武士Shark系列台式电脑的全新配置版本,这一版本将采用“i7-14700K + 64G RAM + RTX 4090D”的高性能配置
2024-01-19雷神黑武士,雷神黑武士Shark台式电脑近日,影驰超频实验室(HOF OC LAB)宣布即将推出旗舰级名人堂系列(HOF OC LAB)的两款GeForce RTX 4070 SUPER显卡新品
2024-01-19影驰,GeForce RTX 4070 SUPER 显卡最近,著名的硬件检测工具CPU-Z发布了其最新版本2.09。尽管CPU-Z官网尚未更新,但这一新版已经对外开放下载。
2024-01-19CPU-Z