当前位置:商业频道首页 > 财讯 > 正文

Deepseek、Kimi争相对标o1 初创公司能打破“技术”和“用户”二选一魔咒吗?

春节将至,国内大模型创业公司集体“凑热闹”,发布了多个对标OpenAI o1的新模型。

发布密集程度从1月20日Deepseek和Kimi的“前脚后脚”中可见一斑,在Deepseek发布新模型DeepSeek-R1后的两小时内,Kimi推出了k1.5多模态思考模型。

Deepseek、Kimi争相对标o1 初创公司能打破“技术”和“用户”二选一魔咒吗?

Deepseek、Kimi争相对标o1 初创公司能打破“技术”和“用户”二选一魔咒吗?

据Kimi官方介绍,新模型在数学、代码、多模态推理能力等方面全面对标“Open AI满血版o1”,这也是Open AI之外的公司首次达到o1正式版水准的多模态推理性能。

“Kimi探索的是C端场景,它探索了一个不同于Deepseek V3的基座模型方案,通过进行长模型和短模型的权重合并,以及短模型的特化RL(意为强化学习),最大化保留了类o1模型的能力。”一位国内头部大模型的算法工程师在20日接受《每日经济新闻》记者采访时表示。

大模型是需要“重仓”投入人才、资金甚至耐心的领域,因此相对于互联网大厂而言,以“AI六小龙”为代表的大模型创业公司面临着更多艰难的选择题。

“创业公司就得做取舍。”在近期的一次采访中,MiniMax创始人闫俊杰认为用户数等指标并非AI竞争的核心,他把技术迭代作为最重要的目标。而Kimi创始人杨植麟在2024年11月接受《每日经济新闻》记者采访时表示,将提升用户留存视为Kimi眼下最核心的任务。

或许正因如此,2024年下半年公众讨论Kimi时多谈及其C端用户体量优势,而Deepseek却以鲶鱼之姿成为了国内大模型的技术焦点。如今,Kimi推出了k1.5,Deepseek也在本月上线了自有App,大模型初创公司在技术和用户上能做好两手抓吗?

热点推送

本周关注

MORE