全民Long-LLM时代终于到来。
本月,中国初创AGI(通用人工智能)公司月之暗面宣布旗下大模型工具Kimi Chat正式升级到200万字参数量,与五个月前该大模型初次亮相时的20万字相比,提升十倍。Kimi Chat的升级彻底引爆市场,同时也引起长文本大模型(Long-LLM)细分赛道更加激烈的竞争。
昨日,阿里旗下的大模型工具通义千问宣布迎来重磅升级,向所有人开放最高1000万字的长文本处理能力,更重要的是,这项升级完全免费。此项升级对于专业领域的意义重大,例如金融、医疗、科研等从业人员,都能利用这项功能更快速地提取出核心关键词,节省文档归整、资料整理的时间。
不仅是阿里,百度文心一言也迎来了长文本处理能力的升级。据官方资料显示,文心一言将在下个月开放免费的200万-500万字长文本处理功能,较此前最高2.8万字的文档处理能力提升上百倍。
此外,360也在本月正式上线了360AI搜索,通过大模型重塑,结合长文本技术在海量搜索结果中理解并生成精准的答案提供给用户。而这款APP,也同样是完全免费的。

(图源:TechTalks)
长文本一直以来都是大模型工具「内卷」的方向,如何在超百万字的文档里做出有效的信息整理、观点归纳,都是技术上的难点。当然,正如半导体行业与消费电子产品市场之间的关系一样,很多消费者能感受到手机、电脑等产品性能正在飞跃式成长,但落实到实际体验上,似乎没有太多的变化。
而在生成式人工智能(GenAI)领域里,「卷」参数会是一个虚无缥缈的噱头,还是造福人类的行为,还很难回答。
在弄清楚「卷」参数到底有何意义之前,我们首先需要了解AI企业们到底在「卷」什么东西。
与衡量手机性能以跑分分数为准一样,大模型也有属于自己的「性能基准」——token,这是一个大模型专用的输入、输出基本单位。在OpenAI给出的准则里,1k token等于750个英文单词、500个中文汉字。

(图源:OpenAI)
同理,token数字越大,能够处理的内容篇幅就越长。ChatGPT-4目前的参数量为8k-32k token、Anthropic公司推出的Claude为100K token,而中国初创企业月之暗面推出的Kimi Chat则是达到了惊人的400K token。具体到实例,Kimi Chat能够在20秒左右读完1篇20万字的长篇小说、通文千义也能在数秒时间里读完80万字的《三体》。

(图源:雷科技制图/通义千问)
参数量剧增所带来的好处自然是大模型对于更长的内容拥有更快速的理解能力,这能够帮助用户从中提炼到所需的摘要、信息点,又或是直接生成整篇内容的总结。语言大模型之所以能够快速「引爆」整个市场,正是得益于这种速度惊人的理解能力。

(图源:雷科技制图/Kimi Chat)
但要彻底攻克长文本,大模型光靠堆砌token参数量并不能完全解决这个问题。超大数量的token的确能够快速阅读完长文档,但段落与段落间的内容也更容易出现「断裂」的情况,这与缺少模型的预先训练有关。目前拥有超大token的AI方案提供商,通常在Transformer预测词之前投喂词元模型,使整体结论更加完整。

(图源:Code-Llama)
比如Code-Llama,标称16K token参数量,但实际上是由一个个4K token窗口连接而成,最终产生出16k token总模型。而这就十分考验大模型工具在窗口之间的推理能力。试想一下,在专业领域中,长文内容都有紧密的逻辑性与关联性,假如大模型推理失误,则有可能出现最终生成的摘要牛头不对马嘴,这对于大模型工具的商业、个人应用,都是致命的打击。
当然,大模型的推理能力是可以通过训练得到进步的,这就不难解释为何阿里、百度都选择优先将长文本模型功能免费开放给个人用户,毕竟更多用户加入,模型推理能力的进化速度才能加快。

(图源:百度文心一言)
但免费应用也是一件好事情,长文本的快速阅读一直以来也是用户在大模型各项实际应用场景最关注的一项,比如正在写毕业论文的学生党,可能将超长的论文喂给大模型工具,让其快速提炼、总结,甚至找出论文中的研究结论。
阿里的通义千问将长文本档能力的拓展方向瞄准在专业领域的内容理解上,尤其是金融、医学等,对于这些行业的从业人员而言,从前需要花上几天或是十几天才能读完的文章,如今只需花上十几秒就能看完其中的精华之处。
但大模型长文本的能力远不止于此。

(图源:育碧)
不久前,知名游戏公司育碧公开的全新「NEO NPC」技术,正是Long-LLM(长文本大模型)升级后衍生的新方向。众所周知,3A游戏大作的灵魂往往与其精彩的剧本离不开关系,其中各式各样的游戏角色,也因其丰富的背景故事和鲜明的个性深受玩家喜好。大模型从1k token进化到100k token,甚至是400k token,能够让游戏剧本完整地覆盖到每个游戏角色里,让他们的对话、行为,既符合游戏的世界观,又能保证一定的灵活性。
这项能力同样可以应用在我们生活中最离不开的功能——搜索。

(图源:雷科技制图/360AI搜索)
本月初,360在北京举行了一场活动,旗下全新360AI搜索和360AI浏览器率先亮相。360AI搜索的核心在于“理解”、“提炼”、“总结”,即抛开传统搜素引擎将所有与之相关的内容为用户一一呈现的做法,主动介入搜索结果,在数以万计的匹配信息里提炼出最有效的信息。
360AI浏览器则是变成彻底的「AI工具」。周鸿祎解释道,360AI浏览器的定位是学习、生产力工具,它能帮助用户快速阅读书籍、文章,了解视频内容等。此外,360AI浏览器未来还将拥有续写功能,这同样基于大模型长文档的理解。
更重要的是,更长的文档内容理解有助于加速AI快速过渡到AGI(通用大模型)时代。正如前文所说,Long-LLM较之前最大的变化在于对超长文本的理解、记忆、总结能力,这些能力可以是大模型更加「拟人」,即记住样本的真实喜好从而判断其行为,又或是根据真实世界的物理规则,生成完全符合实际的内容。
早在去年底,大模型长文本技术就已经进入到火热阶段,但却鲜有AI企业将这项技术应用到大模型工具中,更别提免费向大众开放了。
OpenAI CEO Altman在接受公开访问时也表示,由于算力不足,GPT-4的32K token短期内无法向大众开放。要知道,OpenAI可是当前人工智能市场里获投资最高的头部企业之一,连它都空有技术却无法落地,不免让人对Long-LLM的未来感到担忧。
在算力不足的前提下有没有办法「投机取巧」呢?当然有。
目前主流节省算力的长文本技术通常有三种,分别是短文档重复检索、内容分组检索和模型本身的优化。前两种方案在技术原理上相对一致,都是将重复的内容进行「记忆」,节省理解时间,减少算力消耗;而模型本身的优化则要复杂许多,相当于用短文档推导出长文档,这非常考究模型本身的结构优化。

(图源:英伟达)
不过,无论采用哪种方法,其精度仍有待加强,这就是为何我们仍在期待更强大的计算卡出现,比如前不久GTC 2024上,英伟达发布的最强计算显卡Blackwell GB200。关于这颗当前最强AI加速卡的详细解析,雷科技在早前的文章里已有报道,欢迎各位订阅查看。
在当前,算力仍是阻碍Long-LLM成长的一大关键因素,但随着英伟达、英特尔等硬件供应商不断加码,这项技术在未来也将成为AI领域发展的风向标之一。
如果说OpenAI的Sora展现出其在AGI时代关于视频领域上的想象,那么Long-LLM则是奔向全场景通用智能的基桩。
大模型长文本技术能让AI助手记住用户的所有你与它谈论过的话题,这让你们之间能够创造真实的回忆,而不是像从前一样,在开始新对话之后,前面的「AI」就忘记了刚刚发生过的任何事情。这使得它能够变成更好的AI智能客服,毕竟即便是真人,也难以记住与每位咨询者发生过的对话。同样的,Long-LLM还能化身数字人主播、创造数字偶像等等。
或许,在大模型长文本技术的支持下,AGI时代将在不久后真正到来。
当地时间周四(11月20日),桥水基金创始人瑞·达利欧表示,尽管人工智能(AI)相关投资正在推动市场形成泡沫,但投资者并不需要因此立刻退出
2025-11-21泡沫,利欧,市场
11月21日(星期五),今日报刊头条主要内容精华如下: 商务部表示 促进二手车出口 由规模增长迈向价值增长 11月20日,商务部新闻发言人何咏前在商务部召开的例行新闻发布会上表示,商务部将推动二手车出口由规模增长迈向价值增长
2025-11-21上市公司,李超,高质量
每日精选 统一大市场: 中共中央政治局委员、国务院副总理何立峰11月18日至20日到湖北、湖南调研。何立峰指出,要持续推动外贸提质增效,完善高标准物流体系建设,加力支持制造业高质量发展,加快构建全国统一大市场,进一步畅通国内国际双循环
2025-11-21美元,公司,基点
Gap三季度净销售39.4亿美元,分析师预期39.0亿美元
2025-11-21美元,39.4亿,Gap
美股三大指数集体收跌,道琼斯指数跌0.84%,标普500指数跌1.55%,纳斯达克综合指数跌2.15%。大型科技股集体下挫,AMD跌超7%,甲骨文跌超6%,奈飞、英伟达跌超3%,特斯拉、亚马逊跌超2%,微软跌超1%
2025-11-21英伟达,财报,AI
11月20日晚间,广州期货交易所发布最新公告,就碳酸锂期货部分合约的交易手续费及交易限额进行调整。 业内人士认为,此次举措旨在引导市场理性交易、防范品种短期过度波动,同时提升市场运行的稳健性
2025-11-21碳酸锂,期货,市场
近期,景点里随处可见的不是“说走就走”的年轻人,而是本该在校园里的学生。 上周,已有一批城市集中放了“秋假”,本周又有一批城市开始放假,连着周末两天,凑齐一个五天小长假。 记者根据资料不完全整理,目前推行秋假的城市
2025-11-21旅游,浙江,酒店
中国驻中非使馆领事部11月20日发布关于我公民在中非从事黄金采掘业面临重大安全风险的重要提醒。 近年来,我馆常接到中非政府司法案件通报或我公民紧急领事求助,内容均涉及中国公民因在当地涉足黄金采掘行业而遭遇重大安全事件或面临严重安全威胁
2025-11-21黄金,中非,安全
衡量美元对六种主要货币的美元指数当天下跌0.07%,在汇市尾市收于100.159。截至纽约汇市尾市,1欧元兑换1.1538美元,高于前一交易日的1.1521美元;1英镑兑换1.3087美元,高于前一交易日的1.3046美元
2025-11-21美元,交易日,兑换
①知名做空机构浑水创始人卡森·布洛克表示,尽管市场对人工智能泡沫的警告增加,但现在不是押注科技巨头股价下跌的好时机;②布洛克认为,在当前市场环境下,做多比做空更合适,并指出英伟达等龙头股的强劲表现使得做空风险较高
2025-11-21英伟达,财报,AI
梅赛德斯F1车队老板托托·沃尔夫据悉出售部分股权予CrowdStrike的创始人兼首席执行官乔治·库尔茨
2025-11-21CrowdStrike,梅赛德斯,沃尔夫
近日,爱奇艺(NASDAQ:IQ)发布截至2025年9月30日未经审计的第三季度财报。三季度,爱奇艺总收入为66.8亿元,其中会员服务收入42.1亿元,环比增长3%;在线广告服务收入12.4亿元,内容发行收入6.4亿元,其他收入5.9亿元
2025-11-21爱奇艺,内容,收入
央视新闻消息,当地时间11月20日,欧盟外长会在布鲁塞尔举行。针对有消息称美国和俄罗斯正在闭门起草一份旨在结束俄乌冲突的“28点计划”,欧盟对此予以抵制,并要求任何外交尝试都必须让基辅和欧洲领导人参与谈判
2025-11-21乌克兰,马克龙,法国
隔夜股市 全球主要股指周四涨跌互现,美股上演过山车式行情,纳指早盘一度涨超2%,但随着担忧情绪主导市场,最终收盘时跌逾2%
2025-11-21俄罗斯,美国,伊朗
11月20日,复星医药举行第三季度业绩说明会。复星医药执行董事、董事长陈玉卿在此次业绩说明会上表示,公司整体创新能力稳步提升,2025年前三季度创新药品收入超67亿元,同比增长18.09%
2025-11-21复星医药,公司,2025
在日前举行的第83届解放日报文化讲坛上,葛剑雄、王战、双传学、曾刚四位嘉宾,围绕“融合共生一‘带’繁花——文化赋能沿沪宁产业创新带协同发展”这一主题激情开讲,为长三角一体化高质量发展建言献策
2025-11-21长三角,上海,都市圈
在科创板深化改革与产业升级的浪潮中,并购重组已成为推动优质资源聚合、加速技术迭代的核心引擎
2025-11-21惠泰医疗,迈瑞医疗,葛昊
11月20日,临港最大、最新、最先进的综合仓储设施正式投运。 这一蓝白色调的巨型连体建筑位于上海自贸区临港新片区靠近东海大桥处,是马士基投资10亿余元最新打造的综合物流旗舰仓,占地面积11万平方米、总仓储面积近15万平方米
2025-11-21上海,贸易,象屿地产
11月18日盘后,小米集团发布了三季报。值得关注的是,第三季度,小米汽车的智能电动汽车及AI等创新业务首次实现单季度盈利。不过,最近一段时期,小米集团股价表现疲软
2025-11-21小米集团,小米汽车,汽车
超大规模的经济体量,必然需要超大规模的物流通道支撑。高效、畅达的物流网络,如同经济的血脉,将生产与消费、国内与国际紧密相连。我国已建成全球最庞大的交通基础设施网络和最繁忙的物流系统
2025-11-21物流,冷链,鲜花
国际油价19日下跌。截至当天收盘,纽约商品交易所12月交货的轻质原油期货价格下跌1.30美元,收于每桶59.44美元,跌幅为2.14%;1月交货的伦敦布伦特原油期货价格下跌1.38美元,收于每桶63.51美元,跌幅为2.13%
2025-11-20下跌,美元,国际油价
每经AI快讯,美股三大指数集体收涨,道琼斯指数涨0.10%,标普500指数涨0.38%,纳斯达克综合指数涨0.59%。大型科技股涨跌互现,谷歌、英伟达、甲骨文、英特尔涨超2%,奈飞跌超3%,AMD跌超2%,微软、Meta跌超1%
2025-11-20英伟达,财报,AI
Meta首席人工智能科学家Yann Lecun据称计划在今年年底离开公司,以创建他自己的AI初创公司
2025-11-20人工智能,产业,教育
弘业期货日前公告称,截至11月17日,公司控股股东一致行动人江苏苏豪汇鸿集团股份有限公司(简称“苏豪汇鸿”)及江苏弘业国际物流有限公司(简称“弘业物流”)减持计划已完成
2025-11-20弘业期货,苏豪汇鸿,物流
美东时间周三盘后,人工智能(AI)龙头股英伟达公布了超出预期的三季度财报。在美股市场因估值担忧而持续低迷之际,英伟达再次不负众望,交出了一份优异答卷。 英伟达周三收盘时上涨近3%。截至发稿,随着财报公布,英伟达股价盘后进一步上涨超6%
2025-11-20英伟达,财报,AI
中国深圳,在大沙河即将汇入深圳湾处,水面倒映着南山粤海街道的天际线。河畔,迈瑞医疗总部大厦静静伫立,如同一位沉稳的水手,见证着“中国制造”向“中国智造”转型升级的磅礴浪潮
2025-11-20迈瑞医疗,李西廷,医疗器械
中通快递(开曼)有限公司第三季度调整后每ADS收益3.06元,上年同期2.91元,市场预估2.52元
2025-11-20中通快递(开曼)有限公司,ADS,三季度
每日精选 中方停止进口日本水产品: 11月19日,外交部发言人毛宁主持例行记者会
2025-11-20美元,美债,增持
英伟达首席财务官表示,英伟达计划在2027财年将毛利率维持在70%的中段区间
2025-11-20英伟达,财报,AI
美股市场:美股三大指数11月19日收盘全线上涨
2025-11-20下跌,上涨,交易日