当前位置:商业频道首页 > 头条推荐 > 正文

中国大模型生存战:巨头围剿,创业难熬

“如何能卖掉部分手里的大模型创业公司股份?”

今年10月上旬一场聊天中,数位投了大模型的投资人到场。惬意的音乐中,他们讨论着这个不算轻松的话题。

今天希望出让股份的投资人,大半年前还在为争抢份额头疼。当时有一位投资人告诉我们,没有拿到份额的机构“没资格谈选择”,而他拿到了所有“第一波大模型”公司的投资机会,并投到了其中最好的一家。

现在,悲观的心态在投资人中蔓延:大模型赛道,创业公司可能很难打赢大厂——他们高估了增长拐点到来的速度,也低估了中国大公司的决心与行动力。

一位大厂高层给出判断,做大模型,“一年低消也要20亿-30亿美元”,这超出任何一家中国大模型六小龙的总融资额。

当游戏变成需要持久烧钱的拉锯战,天平开始倾倒。

创业公司与大公司间的攻守易位,发生在不到12个月之间。

中国的大象,真的能跳舞

“去年字节的AI战略是不及格,但完全不影响今年的满分表现。”昆仑万维创始人周亚辉今天在社交媒体上说,“这符合我对这个组织快速迭代能力(卷死人能力)的预期。”

不到12个月里,字节跳动在大模型上后来居上。

相比2023年3月率先发布大语言模型的百度,和2020年就研发多模态大模型的阿里,向来看重AI的字节并没有跟上大模型的第一声发令枪。

一位字节人士去年曾告诉我们,在 ChatGPT 横空出世前,字节更看重 AI for Science,“押错了宝”。那之前,约有 100 多人的字节 AI Lab NLP (自然语言处理)组里,只有不到 10 人在研究大语言模型。

长期观察中国AI发展的一位研究人员当时也告诉我们,相比其他大公司,字节去年做大语言模型“相当于是从零开始”。他推测,字节很有可能收购一家公司,但头部的创业公司里,没一家愿意卖。

字节大模型研发负责人朱文佳,去年四季度OKR的首要目标还是“让语言模型整体效果达到GPT-3.5”。当时百度和一批头部大模型创业公司的进度已来到追赶GPT-4。

而今年夏天之后,字节大模型口碑迅速翻转,其产品数据和影响力也今非昔比。

据数据分析机构QuestMobile,字节豆包App今年9月的日活已达760万,成为中国日活最大的AI产品;同为生产力场景的Kimi智能助手(Kimi手机版),同期日活则在130多万。

一位接近豆包的人士称,只要字节想投放,“豆包日活很快就能破千万”。来到10月,豆包的日活已达945万。

而去年11月,第一还是百度文心一言,当时豆包日活不到130万,比文心少几十万。

从生产力到娱乐陪伴,从对话产品到Agent工具再到文生图,字节陆续推出了十几个AI应用,饱和式地覆盖了几乎所有主要AI产品方向。

字节还做了 AI 硬件——在今年 10 月推出能与豆包语音对话的 Ola Friend 耳机,近期还在研发 AI 眼镜。

投流竞争也不是字节的困扰,而是它相对创业公司的优势。字节每年的利润有数百亿美元,比六小龙加起来的融资总额还多几倍。

同期,一批创业公司进入调整期。我们了解到,今年下半年,至少5家大模型创业公司出现人员调整:

  • 智谱AI高峰期有1000多人,今年一度缩减上百人,不少交付、销售人员离开;

  • 零一万物调整了数十人的团队,集中在产品和运营部门;

  • MiniMax的商业化和部分产品运营团队总计减员约50人;

  • 月之暗面则因收缩海外业务,减少10余位员工;

  • 百川智能也减员约20人,主要调整了C端产品人员。

智谱和零一万物回复称,调整业务后,他们也在持续招人,总人数稳定。百川回复称“我们没有任何裁员”。

一些技术人才也从创业阵营转向巨头:如字节今年就招募了零一万物原预训练负责人黄文灏,和智谱AI的一名资深研究员……还有许多人未浮出水面,字节大模型团队里用花名的人越来越多。

曾经每个月都有的大模型融资消息,也有近半年不再出现。

一位投资人感叹:“一般来说,新技术出现时,创业公司的逻辑是用更少的资源、更小的团队,依靠更领先的技术洞察,使产品或服务先一步爆发,以对抗大公司的资源优势,让巨头陷入所谓‘创新者的窘境’。”

可惜,一个变量的存在——字节跳动,“它这么有资源,又这么努力”,创业公司很难像商学院教材里写的那样“以灵活与敏捷应战大公司的缓慢”。

中国的大象真的能跳舞。

去年冬天,阿里、字节射出反方向子弹

共同造就如今创业公司过山车轨迹的,是同时酝酿于去年冬天的两种大厂策略。

经历了2023年2月王慧文自掏5000万美元启动“光年之外”,到一批新公司涌现,再到光年之外突然被美团收购,AI大模型的融资水温本已由热转凉。

一位去年跟踪了4家大模型公司的投资人,曾“辛辛苦苦要到了”六小龙中某一家的份额,而到下半年,他认为大模型已没有机会:“年初时我见这些founder,他们还说一年就能追上美国。到年底,大家发现钱不容易拿到,人也挖不来。”

此时,阿里的激进投资,一举扭转了市场情绪。

去年底,阿里开始密切接触当时大模型公司中排位相对靠后的月之暗面。当时经过两轮融资,估值来到8亿美元的月之暗面已寻求新融资数月。

原本的交易方案不足为奇:以投前9亿美元获得约1亿美元融资,潜在领投方是小红书。如果成功,月之暗面会成为中国第5家估值超10亿美元的大模型独角兽。

而年底入局的阿里却提出,将投前估值抬到15亿美元,小红书此后放弃了领投。

这笔交易最终在2024年春节前谈定,阿里大手笔投资月之暗面近8亿美元,持股比例约40%,月之暗面投后估值来到23.4亿美元,与之前的第一,MiniMax相当。

这符合阿里云的战略:做智能算力供应商。类似微软与OpenAI的组合,阿里用算力加现金,投资了一批大模型公司。

也是在去年冬天,阿里开始接触MiniMax,并在今年初投资了约6亿美元。

阿里的出手,改变了创业公司的身位,带来了弹药,也带来了比钱和算力更莫测难求的势能。

从今年2月8亿美元融资曝光,到3月Kimi获得300%的用户增速,发布200万上下文的长文本新功能,今年上半年,月之暗面一直处于口碑与影响力的上升通道。

被刺激起FOMO(害怕错过)情绪的投资机构,也继续贡献着融资。阿里之后,又有源码、高榕等机构投了月之暗面。

当日历翻过年中,小阳春里的热情很快被巨头的阴影所笼罩。而字节快速包抄的种子,也萌芽于去年冬天。

当时,一位投资人像往常那样循着AI论文去拜访作者,他惊讶地发现:不少人刚和字节创始人张一鸣一对一聊过,这其中还有尚未毕业的博士生。

他马上和自己投资的一位大模型创始人说:“这是个危险的信号。”

“这说明字节变了。” 这位投资人认为,那之前,字节的大模型研发主要由朱文佳、李航(AI lab 负责人)等人负责,“他们的精力分配,他们能不能跟上最前沿的技术,都让人怀疑。”

危险的信号在今年逐渐变成危险的事实。

字节的AI技术骨干持续增加,包括今年2月加入的Google原VideoPoet项目负责人蒋路,8月加入的零一万物黄文灏,和阿里通义大模型原技术负责人周畅。

一位接近此事的人士说,当黄文灏提出离职,称要“奔赴AGI梦想”,并讲了字节开的条件时,“他们都不好意思挽留。”

几位之前就认识周畅,听说他离职后想创业的投资人也告诉我们,当时“根本约不上”“发消息不回”。

这很可能是因为,字节的行动比投资人更快。一位接近周畅的人士告诉我们,字节高层也一对一和周畅聊过,并表达了追求顶尖AI技术的决心,这更符合周畅的技术抱负。

一些阿里研发人员曾向我们表达共同的困惑:通义做得很好,为何要用这么多钱和算力支持外面的团队?

同时,字节也在整合内部力量,快速完善AI新部门——Flow。

我们了解到,Flow现在已是和抖音、火山、飞书等平级的主要业务部门。

有数位字节人士告诉我们,如果Flow特别想调哪个人,原部门一般会同意。一些分散在字节各部门的产品也在向Flow汇聚,如猫箱原属抖音BG,盒马爱学原属字节教育。

广义的Flow大部门现在有3部分:AI产品团队Flow,大模型研发团队Seed,和产品研发支持团队Stone。

Flow部门的总负责人为朱骏,他同时是豆包产品的总负责人。

留着一头长发的朱骏今年45岁,他在字节面对面活动里曾说,自己曾为感受世界而去酒吧驻唱。他联合创立的Musical.ly在2017年被字节收购,成为抖音产品形态的基础之一。朱骏加入字节后,负责过战略投资、TikTok、产品和战略等。

与朱骏搭档的Seed负责人是朱文佳,此前是TikTok产品技术负责人。2015年,朱文佳从百度加入当时刚成立3年的字节,是把深度学习应用到今日头条上的第一批技术骨干。

朱文佳之下,字节有4个主要模型研发方向,分别是:朱文佳百度时期的同事、字节原搜索技术负责人乔木带队的大语言模型,字节智能创作团队负责人杨建朝带队的视觉模型(蒋路即在杨建朝团队),以及王雨轩带队的语音模型。

新近加入的周畅则将探索一个更前沿的方向——世界模型。“接触过他的人都觉得他很有技术野心。”一位字节人士说。

Stone则于今年下半年从Flow产品团队中拆分,向字节工程技术负责人洪定坤汇报。这让朱骏可以更专注于产品的洞察、设计和运营。

将近 10 个月前,周亚辉曾在社交媒体上评价:“这波 AI 中,字节 AI 战略也就 40 分,还是靠了家底厚……当然以一鸣同学天才般的智力和悟性,Hands on 估计不出 3 月,就会从 40 变 80 甚至 90 分。”

那时周亚辉预言:“字节的业务战略vs阿里的资本战略对决会是一大看点。”

现在,两种策略确实开始交锋。收束思路、整备团队后,字节的射程逐渐覆盖一批创业公司。

而创业公司们,也只能带着从阿里那里获得的资金和算力,投入这场艰难的战争。

不要正面竞争,然后呢?

创业的一条道理是:不要与大公司正面竞争,尤其是不要在大公司的强项上竞争。

目前大模型创业的两难是,to C AI 产品仍跳不出移动互联网生态,而字节、腾讯等公司在这里积累已久。

其中,大公司最擅长,创业公司也绕不开的一个环节就是投放和流量获取。

第一波投放战争起于今年3月。Kimi智能助手在“拉一个用户要20-30元”的传闻中实现了300%的增速,成为话题中心。

后来杨植麟告诉我们,其实Kimi只有30%的增长来自投放,而且称“我们肯定不是投放最多的”。

关于投放上到底花了多少钱,各公司面对第三方数据,标准回复是“不准确”“没这么多”。相对可监测的数据是投放素材量和用户情况。

据广告营销数据平台 DataEye,Kimi 智能助手 10 月的投放素材超 18 万条,是豆包的 4 倍多。但目前,豆包的日活和月活都更胜一筹,据 QuestMobile,豆包 App 9 月月活为 4200 多万,Kimi 智能助手为 1000 万出头。

在投放上,字节的可怕之处在于不只有钱,还有效率。

字节掌握了中国最大的聚合广告投放平台“穿山甲”,同时有抖音等流量巨大的超级App。

从今年4月起,抖音App就不再接受其它AI产品的投放。同时,豆包作为字节系产品,在抖音投放时很可能有折扣。当年字节大力做教育产品时,就有类似的操作。

“现在创业公司一上来也得去字节买流量,这是最尴尬的。”一位投资人说。

投放和流量,只是字节等大公司在移动产品生态里的强项之一。他们过去还积累了产品设计、留存转化和商业化策略等App生产链条里的诸多能力。

据QuestMobile数据,今年9月,豆包App的30日留存率[1]达到34.5%,而Kimi智能助手和MiniMax的海螺AI都是约28%。

一位月之暗面人士告诉我们,他们在9月逐一列出了豆包有,而Kimi没有的功能点,开始仔细分析去年还不被视为对手的豆包。

大公司也在更强势地争取大模型API客户。

AI 儿童玩具公司 Haivivi CEO 李勇告诉我们,此前他们一直用 MiniMax 的语音模型,而当其产品在抖音热卖后,字节联系到他们,称可提供优惠价的豆包大模型 API ,还承诺升级抖音店铺。李勇说,现在 Haivivi 会同时调用 MiniMax 和豆包的语音模型。

几乎投了所有头部大模型公司的阿里,也是创业公司的 API 和 To B 业务潜在对手。

阿里是中国最积极做开源大模型的公司。到今年9月,其Qwen系列开源大模型的总下载量已超4000万次,衍生出了5万个大模型,仅次于Meta的Llama系列。

这可能会让本想购买创业公司大模型API,或让创业公司定制模型的客户转而投向开源生态。

我们了解到,去年为大客户定制一个大模型,最高订单额可达1000万元,而今年则快速降到了百万元级别,乃至更低。

在更底层的模型研发上,字节也展现出“饱和”进攻的姿态。

视频生成模型是一个缩影。据了解,月之暗面从去年10月就开始做视频模型,起步很早;而在去年四季度朱文佳的OKR中,尚看不到视频模型的相关描述。

到今年 9 月,字节已发布了 2 个视频生成大模型——PixelDance 和 Seaweed,前者来自 AI Lab,后者来自 Seed。字节尚未发布的类似探索还有更多。

而MiniMax视频模型团队只有约10人,月之暗面的视频模型团队也是相似规模。MiniMax在今年8月底发布了视频生成模型,月之暗面则至今还没发布。

投资人也逐渐认清现实:模型能持续比字节好,比开源的也好,而且好得很明显,这很难,最终要赢在产品。

创业公司可能的出路是:找大厂看不上的、小众的产品方向,或愿意干脏活、累活。

Kimi和豆包激烈交战的生产力方向,普遍被认为价值高、智能含量高。而在类Character.ai的陪伴和虚拟社交产品上,巨头暂时没拿出那么多火力。

据了解,Flow旗下的“猫箱”,目前日活在65万左右,字节另有一款类似产品“小黄蕉”,已被放弃。而MiniMax的Talkie加星野的总日活则约有500万。

其中,据QuestMobile数据,星野9月日活为94万,30日留存率达到60%,超过猫箱的44.8%。

另一条路是等待。

美团创始人王兴曾说:大多数人以为战争由拼搏组成,其实战争是由等待和煎熬组成。

一位投资人认为,现在大公司正处在“上头”期,但“一旦一件事干了几年还拿不到结果”,内部张力会涌现,尤其是组织上的拉扯。这时如果创业公司还在场,可能有机会。

百度已出现了类似的张力。

在百度,训练基础大模型、开发 to C 大模型产品和提供 to B 大模型方案,分属三个事业群。一位百度人士说,到今年中,当百度模型训练团队希望调动更多算力,训更强的大模型时,会遭遇 GPU 不够用的情况,需要集团高层出面协调——同样是 GPU,放在 to B 业务,马上就有收入,而训练新模型,回报则不明确。

在字节,我们了解到,一些一线员工并不想转岗去Flow,因为这是个变动不居、正在“跑马圈地”的部门。

也有字节员工认为豆包是“ICU产品”——离开投放的插管就活不下去。

近期,字节在与创业公司竞争一位人才时,未能获胜。我们了解到,华为诺亚方舟的一位 AI 研究员已加入月之暗面,将带领团队探索类似 OpenAI o1 的大模型技术。他也曾接到字节邀请,但选了创业公司。

不过,中国掌握极强产品能力和流量资源的不止字节。微信还没出手呢。

半熟的技术,半新的战场

“大模型这么嗨,我也没觉得怎么样,如果不建立自己的商业闭环,只是把悲剧又加速重演一遍。”

一位AI计算机视觉公司创始人今年3月对我们说。当时,多个大模型创业公司的估值已突破100亿人民币。

就像如今情形的一场预演,当计算机视觉的商业化场景转向安防后,战争不再发生于创业者之间。真正的威胁来自成立了十几年的安防行业巨头海康。

创业公司高薪招博士、发论文,更懂AI视觉识别,但要从头学习研发硬件产品、搭建营销体系。海康每年卖出数百亿元硬件产品,有完善的供应链和销售体系,对安防需求有长期洞察,但需要引入AI技术。

在这位创业者看来,大模型时代只不过是换了一批创业公司,对手从海康威视换成了资源更多、决心明确的BAT和字节。

上一次,创业公司都没有赢。

所有依靠新技术的创业,都是在和大公司赛跑——看创业团队先补上完整的商业化体系,还是大公司先学会新技术。

这一竞赛的结果,取决于新技术能在多大程度上颠覆原有体验,新技术的进入门槛有多高、赛道有多长。

大模型确实比驱动上一波AI热潮的人脸识别等技术有更高的资源门槛,从头训练大模型也是一个更综合、复杂的技术工作,涉及GPU调用、模型架构设计、数据处理、调优等多个环节。复杂度远超AI视觉。

技术门槛之外,创业公司和大公司间的竞赛结果,也取决于新技术是否能找到新生态:这里应该有新的供应链、新的硬件载体、新的渠道和新的需求与用户来源。它们尚未被大公司深度染指。

一位投资人类比了大模型和移动互联网浪潮:移动互联网是新软件、新硬件同时出现,从电脑到手机,带来了App的强劲自然增长,当时的流量成本也低得多。

“现在是新软件有了,还没有新硬件。”他指在智能手机后,尚没有出现规模足够大、能承载足够多应用的硬件载体。

但实际上,大模型产品现在的软件也还是“半新状态”:由大模型支撑的很多产品,仍是一个个App,模型能力是提升体验的最重要动力,但需求洞察、功能设计,流量和用户获取依然重要。

这是一个半熟的技术遇上半新的市场的故事。

尚未成熟的技术,是创业者的机会所在:如果大模型能力还能持续进化,前瞻的技术判断和跟随能力,也许有四两拨千斤的效果。

半新的市场,则是大公司的砝码:如果大模型能力提升短期遇阻,应用开发和产品表现会更依赖现有移动互联网基础设施,这就是一个烧钱、拼资源的游戏。

2001 年,成立 3 年的 Google 刚成为雅虎搜索引擎供应商,当时的 CEO 埃里克·施密特(Eric Schmidt)在劝桑德伯格加入公司时说:“如果你得到了坐上火箭的机会,别管是什么位置,上去就行。”

现在,去年怀着雄心挤上大模型火箭的人,都不得不调整姿态,适应新的现实。

他们接下来的选择和动作,将不仅关系位置好坏,也关系着公司的生死去留。

(责任编辑:卢其龙 CN070)

热点推送

本周关注

MORE