当前位置:商业频道首页 > 财讯 > 正文

何小鹏的AI帝国里,没有激光雷达(2)

他还企图抢占智驾高地,展示小鹏领军者的姿态:大算力+大模型时代,小鹏与特斯拉使用的视觉融合感知方案上限更高,时延更低,安全系数更高。

这两种方案自诞生以来,一直被质疑,一直在成长。在智驾平权的下半场,L3量产的前夜,纯视觉与激光雷达方案的竞争进入白热化阶段,终局将浮出水面,而衡量两者优劣的标准只有一个:安全。不是哪种方案更前卫、更时髦、上限更高,而是谁能拥有更稳定的下限、能更大概率地防止事故的发生。

做纯视觉的“孤勇者”

综观小鹏的纯视觉方案,核心只有一个——“大脑”。

何小鹏表示,在一双“更聪明的前视眼睛”和一个“更强大的大脑”之间,他们选择了后者。所谓“大脑”,意指小鹏打造的拥有720亿参数的多模态世界基座大模型。《21汽车·一见Auto》此前曾报道,小鹏验证了模型参数规模扩大到百亿级别之后,规模法则仍然可行。何小鹏向媒体表示:“物理世界的Scaling Law,我还远未看到尽头”。

何小鹏的AI帝国里,没有激光雷达

如何打造一个“更强大的大脑”?除了在模型参数上做文章,小鹏的思路可以总结为“大数据+重算力+轻雷达”。

“大数据”方面,这次 CVPR 2025 上,刘先明透露的第一个核心信息是,小鹏目前已经训练了超过40万小时的视频数据——相当于AI看了3万部《流浪地球》,视频数据量将在今年增加到2亿clips;

为了训练世界基座模型,小鹏汽车重构了底层的数据基础设施,在CPU、GPU等方面做了联合优化,主要集中在Dat (CPU) Optimization(数据加载)、Trainer (GPU) Optimization(计算训练)、Fault Tolerance(容错)三方面:

如果把训练模型想象成做菜:

·优化数据加载就好比“备菜”——提前处理好复杂食材(Aggressive data materialization,激进数据物化策略)、优化食材分配(Optimized shuffling modes balancing speed and randomness,优化打乱模式,在速度与随机性之间取得平衡)等;

·优化计算训练就好比“炒菜”——精准调度不同火候(FP8 mixed precision training,FP8 混合精度训练)、用定制的不同厨具(Custom Triton kernels,自定义Triton 内核)等;

·最后的优化容错,就好比给炒菜上保险,隔一段时间就“存档(Faster in-memory checkpointing,内存检查点加速机制)”,万一停电、锅坏了,还能接着炒。

何小鹏的AI帝国里,没有激光雷达

“重算力”方面,小鹏智能算力集群正向两万卡水平前进,云端集群运行效率常年保持在90%以上。

刘先明在 CVPR 2025 透露的第二个核心信息是,小鹏GPU的流式多处理器的利用率(streaming multiprocessor utilization,即SM utilization)达到 85%,好比工厂有 100 个工人,有 85 个工人都在拼命干活,只有 15 个暂时闲着 —— 这说明小鹏的GPU计算资源几乎被榨干了,训练模型的速度会更快。

何小鹏强调,现在比较自动驾驶水平,看开城数量已经没有意义了,算力才是基础,“我们把所有的自动辅助驾驶公司的算力‘天花板’都拉起来了。未来如果要买一台智能汽车或者买一台更高等级的AI汽车,首先问他有多大算力”。

最后的“轻雷达”则是最受人关注的,小鹏专门解释了摘下激光雷达的理由:

第一,去掉激光雷达后,节约了20%的感知算力,模型反应更快。小鹏自动驾驶产品高级总监袁婷婷在5月8日于微博发文表示,“去激光雷达后使计算简化,端到端的延时大幅降低,视觉的响应速度是激光雷达的近2倍.....视觉信息处理帧率达到业界主流激光雷达处理帧率的12 倍,大幅度提高城市辅助驾驶的安全级别”;

第二,小鹏汽车的AI鹰眼智驾方案中,摄像头是前向+后向800万像素,结合Lofic技术,是行业内车规级最高精的摄像头,“感知距离提升125%,识别速度提升40%,看得比人类远,在夜间、大逆光、雨雪天等看的比人眼更清楚”;

何小鹏的AI帝国里,没有激光雷达

第三,何小鹏说,“想要做到全域(安全),环视的能力特别重要......(纯视觉)能让用户获得360度的安全,不光是夜晚安全,在城区、下雨、周边有人有车也安全”。

热点推送

本周关注

MORE