当前位置:商业频道首页 > 财讯 > 正文

推理模型性能媲美DeepSeek R1!阿里巴巴股价跳空大涨

3月6日,阿里巴巴(09988.HK)跳空高开,一度涨至7.47%,报139.6港元/股,较2月24日的高点140.9港元/股,仅有一线之隔。

阿里云官方公众号发文称,公司发布并开源全新的推理模型通义千问QwQ-32B。通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。

据阿里云介绍,在保持强劲性能的同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。此次,阿里云采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。

阿里云指出,千问QwQ-32B性能比肩全球最强开源推理模型。

在一系列权威基准测试中,千问QwQ-32B 模型表现异常出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1:在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型;在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。

推理模型性能媲美DeepSeek R1!阿里巴巴股价跳空大涨

据证券时报报道,业内人士分析,QwQ-32B的成功表明,将强大的基础模型与大规模强化学习相结合,能够在较小的参数规模下实现卓越性能,这为未来通向通用人工智能提供了可行路径。

值得一提的是,据上海证券报报道,1月20日,DeepSeek-R1推理模型发布后火速出圈,实现了最快复现OpenAI o1推理模型。业内预计,我国头部科技公司阿里巴巴、字节跳动等有望在1到2个月内跟上R1的创新成果。

热点推送

本周关注

MORE