当前位置:商业频道首页 > 头条推荐 > 正文

中国大模型,有了“压舱石”

中国大模型,有了“压舱石”

新年伊始,讯飞旋即召开最新的模型发布会,距离上次重大更新仅过去不到一个季度,这次发布会上,讯飞带来三个大招:

1)推出深度推理模型讯飞星火X1,作为全国产算力平台上唯一的深度推理大模型,该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景;

2)升级星火4.0Turbo底座能力升级,进一步拓展多模态的边界;

3)发布同传大模型,最快语音同传时延小于5秒。

讯飞速度,让我们看到全国产化AI大模型的能力擢升的希望之路。当下脱钩断链的时空背景下,自主可控有了更深刻的现实意义,中国AI产业也有了真正意义的压舱石,未来不管形势如何变化,我们都已有从容自主应对的底气:中国大模型技术未来发展安全可控,商业化落地路径也愈发清晰可见。

01

从“星火发布会窗口”看全栈国产AI的成色

大部分人都非常关心基于全国产的芯片、算子、算法的大模型之路,究竟是否能够走得通。一直以来,讯飞星火坚持走全国产化路线,因此其发布会也成为业内人士观察全栈国产AI进展的关键窗口。

在此之前,2023年10月首个国产万卡算力集群“飞星一号”平台上线,后升级为国产超大规模智算平台“飞星二号”,2024年1月,讯飞通过国产算力平台训练出的千亿参数模型讯飞星火V3.5正式发布,性能指标处于国内领先水平,初步验证了这条路能行得通。

而这次发布会,是观察这条路能否走得好的关键切面。

【1】迭代速度保持领先

从23年首发至最新的发布会,我们观察到星火模型的迭代速度非常快,完全不用担心国产底座成为技术发展的掣肘。从近2年来关键的时间节点来看:

  • 2023年5月6日,在AI全球爆火后不到2个月,讯飞星火大模型正式发布,且具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力。

  • 2023年10月24日,为实现完全的国产化,讯飞与华为携手自研算力底座,并于联合发布了国内首个全国产算力平台“飞星一号”,常态化支持万亿参数的大模型训练。

  • 2024年1月30日,首个基于全国产算例训练的讯飞星火V3.5发布,同时发布的还有星火语音大模型,首批支持37个主流语种。

  • 2024年6月27日,科大讯飞发布讯飞星火V4.0,七大核心能力全面升级,在8个国际主流测试集中排名第一。

  • 2024年10月24日,基于“飞星一号”平台,星火大模型已升级为4.0Turbo版本,根据真实数据的测试,其七项核心能力在中文领域全面超过GPT-4Turbo,数学和代码能力超越GPT-4o。

  • 2025年1月15日,科大讯飞持续深入大模型国产化“无人区”,正式发布星火深度推理模型X1,同时首发星火语音同传大模型;此外,讯飞星火4.0Turbo底座能力+行业能力再次升级。

讯飞大模型的迭代速度和频率,均与全球第一梯队厂商保持一致,直接证明了基于国产算力和算法的大模型之路深度可靠。

中国大模型,有了“压舱石”

【2】能力上比肩全球第一梯队

在过去两年的百模大战之后,AI从2025年开始进入推理时代,所以这次讯飞发布会,最引起我们关注的,自然是当前业界全国产算力平台上唯一的深度推理模型——星火深度推理模型X1。

发布会上,科大讯飞研究院依次展示了讯飞星火X1解答高考题、AIME竞赛题以及高中奥赛题的表现,X1不仅准确给出了这些题目的答案,还对解题思路和步骤进行了详细拆解。

通过解题的案例,也首次揭秘星火X1的三大特点:化繁为简,能将复杂问题分步拆解简化;进行自我探索反思验证;依据答案正确与否进行强化训练。这种能力相对通用大模型,是一种更为接近人类的“慢思考”方式。

这种方式是X1能力突出的关键。星火深度推理模型X1近期还参加了小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项考试,交出了一份非常亮眼的“考试成绩单”:用更少的算力,达到业界一流效果,多项指标位居国内第一。

另外值得一提的是,推理阶段相对训练而言,是更加追求成本效用的,便宜好用是商业化落地的最大前提。

水滴石穿非一日之功。这次发布会上推理模型X1的惊艳表现,离不开科大讯飞从成立之初就保持对AI的专注,以及近些年持续大手笔加大对研发的投入。

中国大模型,有了“压舱石”图:科大讯飞研发费用

除此之外,讯飞的底座星火4.0Turbo能力也迎来全新升级,此前的七大核心能力得到全面提升,对标或者超越OpenAI最新版的GPT-4o。

热点推送

本周关注

MORE