当前位置:商业频道首页 > 头条推荐 > 正文

英伟达再生变数?(3)

这与去年年初H20开始供货时,A股算力股集体下跌形成截然不同的对比。

究其原因,或许有二。

一方面,从目前流传出的B30A规格来看,即便只使用一个die,其算力也很可能超过上代旗舰产品H100,未来这款产品能否顺利出口到中国,还充满着不确定性。

另外,本周DeepSeek-V3.1的发布为国产GPU带来了一大利好,即该版本模型使用了UE8M0FP8Scale的参数精度。在使用英伟达算力芯片时,由于需要兼容传统通FP8格式,硬件设计仍保留符号位逻辑,导致UE8M0的加速潜力无法完全释放。

但在国产芯片上,由于主流的GPU早已完成FlashMLA和DeepGEMM的适配,因此在DeepSeek-V3.1版本上可以实现无缝接入。

因此,至少在DeeSeek的模型训练上,国产GPU眼下仍具备一定的优势。

(责任编辑:卢其龙 CN070)

热点推送

本周关注

MORE