字节跳动紧紧抓住了AI时代的流量——Token(词元),就像计算机时代的存储单位Byte(字节)一样。也让Token调用量多寡,成为衡量大模型竞争力、企业需求、商业化落地的重要指标。
字节跳动旗下火山引擎披露,截至2025年12月,豆包大模型日均Token调用量已经超过50万亿,半年内增长200%,比去年同期增长了10倍,在全球仅次于OpenAI和Google。
火山引擎总裁谭待提及,不同于云计算时代的IaaS、PaaS以及SaaS架构,在AI云原生架构中,模型是软件的核心。大模型能力的持续提升,会解锁新场景,带动Token使用量增长。虽然目前火山引擎的Token消耗有相当比例来自于字节的“内循环”,但累计使用上万亿Token的外部客户已超过100家。
模型的技术处理能力是Token消耗的基础。12月18日,火山引擎发布豆包大模型1.8,该模型面向多模态Agent场景进行了定向优化。
Token的消耗大战,也让字节更激进地在算力和资本开支上布局。12月23日,《金融时报》报道,字节计划在2026年豪掷1600亿元加码AI,其中一半预算将用于采购AI芯片——这大概相当于字节2025年净利润的四分之一。
在应用端,字节也在极速拉升竞争水位。12月24日,数据显示:豆包App的DAU(日活用户)已突破1亿大关。同时,豆包的用户增长、市场推广费用,也是字节历史上所有破亿DAU产品中花费最低的。
近日据《晚点LatePost》报道,火山引擎将成为2026年中央广播电视总台春节联欢晚会独家AI云合作伙伴,豆包App也将配合上线多种互动玩法。可以想见,国内AI行业的竞争格局或将很快面临新一轮改写。
卖Token,字节拼了
字节Token消耗的快速增长,除了模型能力,很大程度上也倚仗于“钞能力”之下,字节不惜代价地抢占市场。
金沙江创投董事总经理朱啸虎在接受采访时称,现在一个100万DAU的产品每天就可以消耗几百亿Token,这个量级很容易做到,增长很快。
2025年下半年以来,火山引擎开启了“甩卖”模式,AI硬件、AI玩具等高Token消耗产品,均是火山瞄准的重点销售对象。
一位AI英语学习硬件公司员工告诉《中国企业家》,公司的硬件产品售价200多元。此前,他们曾花数百万元买了5台服务器做本地适配,发现算不过来账。后来发现他们只需要付给火山引擎几十元,用户就可以永久调用火山引擎的云端大模型。
据他估算,一个火山引擎用户一年算力资源成本至少要50~80元。“但现在火山算力资源利用不饱和,只能打折便宜卖给硬件厂商。”
当被问到为什么不选择阿里云呢?上述人士说:“阿里云产品太多,接口也太多,不如火山简单。”
另一家AI玩具厂商员工向《中国企业家》透露,用户买完硬件之后,虽然可以永久免费调用大模型,但用户不可能一天24小时对话。实际调用Token累积可能不过几天时间,调用总量很低,这也让云厂商有利可图。
为了支持AI玩具和各类AI硬件,火山引擎基于新推出的豆包大模型1.8系列模型,也推出了玩具AI框架、音频AI框架等开发套件,授权收费形式分为三个月、一年与终身使用不限量。
2025年6月,接入豆包大模型的AIoT产品数量是100万台。半年之后,该数据已经增长至600万台。
但火山引擎智能算法负责人吴迪透露,他在内部经常跟团队说,不要把2025年定义为AIoT元年,2026年、2027年可能也不是爆发元年,但每一年都比前一年更加重要、机会更大。比如一个台灯搭配云端豆包大模型,成本不到100元,但附加值可能会超过专业的课外辅导老师。
在to C端的领先优势,也被字节不断向云端反哺。豆包已经是中国用户量最高的AI原生应用,根据QuestMobile数据:2025年第三季度,豆包的月活跃用户数为1.72亿,超过了DeepSeek等对手。
《中国企业家》注意到,最近,字节跳动正将豆包App的能力以“豆包助手API”形式开放给各大开发者和硬件厂商。目前,该API已经开放了日常沟通、联网搜索等功能,未来还将陆续推出拍照识图、实时翻译等。
从成本侧看,豆包助手API调用价格高于火山引擎的Token消耗价格。其采取“后付费”模式,日常沟通0.1元/次,联网搜索0.2元/次,边想边搜0.5元/次,0.5元的单次调用价格已接近豆包大模型百万Token的输入价格。
一位相关人士解释称:“卖Token是卖水,但豆包助手API相当于卖饮料,无需企业从零搭建。”豆包助手API打出的口号是“亿级用户验证效果,企业快速享受稳定、高效的智能服务”。
字节跳动不放过小机会、赚小钱的同时,它亦瞄准大机会。豆包手机最近在市场上掀起轩然大波,也让字节对手机这个用户量最大硬件载体的野心昭然若揭。
2025年12月1日,豆包发布豆包手机助手,在中兴nubia M153系列手机上,豆包手机助手获得了操作系统层面的高权限,通过GUI(图形用户界面)手段,完成了跨平台比价、点外卖等任务,但很快遭到了微信、淘宝等超级App的“拉黑”狙击。
但字节并未停下脚步。12月19日,媒体披露,字节跳动正在推进与vivo、联想、传音等硬件厂商开展AI手机的合作,为其设备预装插件,从而获得用户入口。
最大机会在企业端
关于火山引擎每天Token调用量超过50万亿,谭待在接受媒体采访时表示:企业占了Token调用的80%,个人占20%。而此前云时代,企业和个人用量占比是8.5:1.5,现在AI时代可能是7.5:2.5,“未来可能个人还会再高一点”。
相较于硬件和个人,Agent落地在企业端,Token消耗数量可达数十倍甚至百倍,这也需要更长的上下文处理能力和更强的记忆能力。
火山引擎披露,有超过100家企业在火山引擎上累计Token的使用量超过了1万亿。这个数字已经可与国际对标。2025年10月,OpenAI曾披露Token调用量过万亿的30家客户(不包括要求匿名的客户),它们集中在教育、销售、Coding(编程)等场景。
随着大模型已经进入应用落地期,Token消耗成为衡量应用规模化的核心指标,已是不争事实。昆仑万维董事长方汉告诉《中国企业家》,用Token就是用大模型,程序员占整个公司员工数量三分之二,他们会考核程序员的Token调用量,“用Token少,证明不够努力”。
但Token消耗更大规模的应用,还要依赖于多模态和Agent的繁荣。而当下,企业落地Agent仍然面临挑战。谭待提及,真正能开发好Agent的企业并不多,能运营好,被大规模使用的Agent就更少了,主要挑战有两点:
第一,Agent身份与权限管理。在Agent时代,不只要管理人,还要管理Agent、工具和系统之间的关系。
第二,模型的确定性和可解释性问题。Agent为什么这么决策,失败发生在哪一步?没有合理的评估和审计,Agent也难以被企业真正信任。
此外,企业已经存在了大量业务系统、数据库、消息系统、作业系统,它们是企业的核心资产,但并不是为Agent设计的。如果这些系统不能被Agent安全、可控地调用,企业智能化就只能停留在表面。
“不是模型不够强,而是缺少为Agent规模化运行而生的基础设施。”谭待说。
为了解决上述问题,火山引擎在“FORCE原动力大会”上,一口气发布了数款企业端应用:Trae企业版,支持10万文件、1.5亿行代码的容量;升级发布企业级Agent平台Agentkit,和多模态数据湖打通。
以企业应用最广的AI Coding场景为例,在字节跳动内部,已经有超过九成的工程师在使用Trae辅助开发;以抖音生活服务为例,目前有40%以上的代码是通过AI生成。

来源:AI生成
虽然这其中,不免有许多“重复造轮子”的资源浪费。Trae的一位员工透露,为了检查Trae的结果,“还要给它组建一个内部的知识库”。但将“Token跳动”的故事讲下去,字节已经表明了更坚定的决心。
在成本端,火山引擎推出了“AI节省计划”。该计划覆盖所有按量后付费的大模型产品,通过阶梯式折扣,帮助企业最高节省47%的成本。
火山引擎还推出了“方舟协作奖励计划”,截至2026年3月31日,参与的企业被赠送最多500万Token,个人200万Token。使用第二天,还将发送和采集量相等的有效Token数,消费多少返多少。
阿里云不在意Token吗?
当火山引擎向硬件以及企业端进发,推销自己的Token战略时,一个强劲的对手——阿里云也挡在眼前。2025年下半年开始,究竟如何衡量AI云质量,谁才是AI云厂商第一,一直是业内争论不休的话题。
一位云服务资深人士向《中国企业家》透露:目前关于AI云市场份额,各家有不同的统计口径。总体来说,阿里云在包括PaaS、IaaS、MaaS在内的整体营收规模位居第一。火山引擎的优势则主要集中在MaaS,也就是“模型即产品”市场。
该人士也同时强调,模型质量不能只用Token消耗一个标准来考量。“毕竟一个视频生成,可能就会消耗百万Token。而豆包背靠抖音,有大量的视频创作者。”
2025年9月,阿里云相关员工对《中国企业家》表示:未来Token的消耗量会体现在超长的上下文,其中引用多次工具,跟环境进行多次交互、做多轮推理的能力。“我们更多的精力会放在技术架构创新,包括跟硬件的结合上。”
比起Token调用量,阿里云更强调“有效的Token调用”。9月,阿里云推出了Qwen3-Next系列架构模型,它在20万Token以上的推理速度更快。
前述员工谈及:“今天技术上的很多创新会让Token的成本下降,但我们希望减少无效的Token量。有的模型很笨,会给你输出一大堆,但是结果很差,这是我们希望去避免的”。
但最近,在字节的凶猛攻势下,阿里云大概不能一直如此“佛系”了。
媒体报道,阿里已经着手制定让Token调用量快速提升的计划,比如大力推广C端应用。下半年,阿里先后推出AI助手千问App、灵光、AI健康产品阿福等三款应用。其中千问App公测一周,下载量已突破1000万次。
硬件也将成为未来的Token消耗大户。11月底,阿里夸克AI眼镜开售,3天销量破3000台。12月23日,钉钉上线企业级AI Agent硬件——DingTalk Real。从C端应用到B端落地,从硬件到软件,阿里与字节的Token之争已经一触即发。
1月5日,石英股份(603688.SH)发布其收到刑事判决书的相关事项公告,其控股子公司连云港强邦石英制品有限公司(简称“强邦公司”)因收购前的侵犯商业秘密行为,一审被判处罚金270万元,3名涉案被告人均获刑并处罚金
2026-01-07石英股份,公司,石英材料
迪哲(江苏)医药股份有限公司(以下简称“迪哲医药”,688192.SH)近日公告,为深化全球化战略布局,提升公司国际化品牌形象,拟发行境外上市外资股(H股)股票并在港交所挂牌上市
2026-01-07迪哲医药,公司,创新药
英国市场上销售的电动汽车中,已有超过四分之一为中国制造。 英国汽车制造商和贸易商协会(SMMT)的数据显示,2025年英国售出的逾47万辆电动汽车中,中国制造车型占27.9%
2026-01-07电动汽车,桑切斯,西班牙政府
美股三大指数集体收涨,道指涨0.99%,纳指涨0.65%,标普500指数涨0.62%。其中,道指、标普500指数均创历史收盘新高。费城半导体指数涨2.75%,创历史新高
2026-01-07标普500指数,道指,指数
苹果公司iPhone Air背后的设计师Abidur Chowdhury跳槽至AI初创公司Hark
2026-01-07苹果公司,商务部,王文涛
“十四五”时期,西藏药业扎根雪域高原,以创新为翼、责任为基,在民族医药现代化与高质量发展道路上成果丰硕,成为西藏医药产业的标杆企业
2026-01-07西藏药业,医药,西藏
证券时报记者唐强 作为聚焦创新药研发的专业化医药集团,海思科深耕医药领域二十余年,以创新为核、资本为翼,在麻醉镇痛、呼吸、慢病等关键治疗领域持续突破,交出了一份亮眼的发展答卷
2026-01-07海思科,创新药,现金分红
1月6日晚,观想科技(301213)披露收购预案,公司拟通过发行股份及支付现金相结合的方式,收购锦州辽晶电子科技股份有限公司(简称“辽晶电子”)100%股份,同时拟向不超过35名特定投资者发行股份募集配套资金
2026-01-07观想科技,辽晶电子,公司
1月6日晚,时代新材(600458)发布公告称,公司在2025年10月1日至12月31日期间与风电各大主机厂签订《叶片销售合同》,合同金额总计约33.2亿元
2026-01-07时代新材,合同,2025
比特币回落至9.2万美元下方,加密货币概念表现低迷,Strategy、BMNR跌超5%,Robinhood、Coinbase跌超3%
2026-01-07Robinhood,Coinbase,比特币
在全球存储芯片供应持续紧张、价格飙升的背景下,A股半导体设备板块迎来强势上涨
2026-01-07DRAM,DDR5,海力士
当地时间1月6日,法国总统马克龙、德国总理默茨、意大利总理梅洛尼、波兰总理图斯克、西班牙首相桑切斯、英国首相斯塔默以及丹麦首相弗雷泽里克森就格陵兰岛发表联合声明
2026-01-07格陵兰岛,美国,丹麦
每日精选 中国人民银行工作会议: 据央行网站,2026年中国人民银行工作会议1月5日-6日召开
2026-01-07公司,脑机接口,商业航天
当地时间1月6日,美股三大指数集体收涨,道指涨0.99%,纳指涨0.65%,标普500指数涨0.62%。其中,道指、标普500指数均创历史收盘新高。 费城半导体指数涨2.75%,创历史新高
2026-01-07英伟达,黄仁勋,芯片
1月5日,上交所发布《关于对宁波市天普橡胶科技股份有限公司及有关责任人予以监管警示的决定》“上证公监函〔2026〕0001号”,这是2026年沪市首份监管警示函
2026-01-07天普股份,人工智能,监管
1月5日,A股新年首日开盘,脑机接口概念股大面积涨停,如三博脑科、翔宇医疗、美好医疗、爱朋医疗、诚益通、伟思医疗、创新医疗、熵基科技等
2026-01-07脑机接口,公司,板块
1月6日,陕西旅游(603402.SH)在上交所主板正式挂牌交易,成为2026年A股首家新上市公司,也是近5年来首家登陆A股的文旅类企业
2026-01-07陕西旅游,资本市场,企业
在经历股价连涨“12板”的资本狂欢和停牌核查之后,胜通能源(001331.SZ)1月6日迎来复牌,再度收获一个涨停,斩获13连板
2026-01-07机器人,毅昌科技,公司
美股市场:美股三大指数01月06日收盘全线上涨,道指、标普均创收盘历史新高
2026-01-07东方财富,上涨,涨幅
摩根士丹利在最新报告中预测,黄金价格将在2026年第四季度升至每盎司4800美元,突破去年创下的历史纪录。该投行认为,利率下行、美联储领导层更迭,以及各国央行和基金持续买入,将共同推动金价进一步上涨
2026-01-07白银,黄金,美元
在人工智能产业加速迭代浪潮中,科大讯飞始终聚焦人工智能主航道。2025年,公司在核心技术、行业赋能与全球布局上全面进阶,实现持续的技术突破与扎实的产业落地
2026-01-06科大讯飞,人工智能,算力
走进位于内蒙古呼和浩特市的伊利健康谷液态奶全球智造标杆基地包装车间,传送带在运送刚刚灌装好的牛奶,智能机械臂有条不紊地进行成箱牛奶的码垛作业。这座全球领先的智能化生产基地日处理鲜奶能力达6500吨
2026-01-06乳业,伊利集团,伊利
江苏国信大丰85万千瓦海上风电项目全部风机近日实现并网。这是江苏“十四五”时期建成的单体项目容量最大、风机数量最多的海上风电项目。 该项目位于盐城新洋港东南方向、大丰港东北方向海域,规划海域面积136平方公里,由4个场址组成
2026-01-06项目,江苏国信,风机
“人类70%的信息通过眼睛获取,未来各类机器和设备也需要‘光学眼睛’来感知物理世界。”舜宇光学科技总裁王文杰在接受中国证券报记者专访时的这句话,精准概括了这家从余姚小城走出的光学巨头四十余年的核心坚守
2026-01-06王文杰,光学,余姚
英伟达CEO黄仁勋表示,推出NVIDIACosmos开放世界基础模型,该模型具备类人推理能力。推出新的克拉拉Clara人工智能模型,弥合数字发现与现实医疗之间的差距
2026-01-06英伟达,黄仁勋,NVIDIACosmos
眼下,云南省昆明市、玉溪市、德宏州等地的蓝莓迎来丰收季。为确保蓝莓从“枝头到舌尖”的新鲜体验,顺丰速运深耕蓝莓寄递,见证了云南蓝莓从区域品牌走向全国、迈向全球的历程,发运量从2018年的5万件增长至2025年的上千万件
2026-01-06顺丰,孙玉松,物流
分析人士指出,全球股市或许正在忽视一个重大威胁:由科技投资热潮部分推动的通胀再度上行。 美国股指在2025年实现两位数涨幅并创下历史新高。与此同时,对人工智能(AI)的狂热以及货币政策宽松预期,也推动欧洲和亚洲股市升至纪录高位
2026-01-06芯片,AI,通胀
美股三大指数集体收涨,道指涨1.23%,再创历史新高;纳指涨0.69%,标普500指数涨0.64%。大型科技股多数上涨,特斯拉涨超3%,亚马逊涨逾2%,Meta涨超1%,奈飞、谷歌小幅上涨;苹果跌超1%,微软、英伟达、英特尔小幅下跌
2026-01-06Meta,人工智能,微软
当地时间1月5日,日本10年期新发国债收益率一度上涨至2.125%,达到1999年2月以来的最高水平。市场担忧,日本国债收益率持续攀升或将影响全球金融市场
2026-01-06国债收益率,日本,1999
“目前公司非常忙碌,很多企业希望和我们合作开发或购买产品,甚至让我们有些应接不暇。”最近,客户的频繁造访,令上海泊维胜科技有限公司(简称:泊维胜)创始人杨忠钰博士“忙并快乐着”
2026-01-06孵化器,医疗器械,上海