全民Long-LLM时代终于到来。
本月,中国初创AGI(通用人工智能)公司月之暗面宣布旗下大模型工具Kimi Chat正式升级到200万字参数量,与五个月前该大模型初次亮相时的20万字相比,提升十倍。Kimi Chat的升级彻底引爆市场,同时也引起长文本大模型(Long-LLM)细分赛道更加激烈的竞争。
昨日,阿里旗下的大模型工具通义千问宣布迎来重磅升级,向所有人开放最高1000万字的长文本处理能力,更重要的是,这项升级完全免费。此项升级对于专业领域的意义重大,例如金融、医疗、科研等从业人员,都能利用这项功能更快速地提取出核心关键词,节省文档归整、资料整理的时间。
不仅是阿里,百度文心一言也迎来了长文本处理能力的升级。据官方资料显示,文心一言将在下个月开放免费的200万-500万字长文本处理功能,较此前最高2.8万字的文档处理能力提升上百倍。
此外,360也在本月正式上线了360AI搜索,通过大模型重塑,结合长文本技术在海量搜索结果中理解并生成精准的答案提供给用户。而这款APP,也同样是完全免费的。
(图源:TechTalks)
长文本一直以来都是大模型工具「内卷」的方向,如何在超百万字的文档里做出有效的信息整理、观点归纳,都是技术上的难点。当然,正如半导体行业与消费电子产品市场之间的关系一样,很多消费者能感受到手机、电脑等产品性能正在飞跃式成长,但落实到实际体验上,似乎没有太多的变化。
而在生成式人工智能(GenAI)领域里,「卷」参数会是一个虚无缥缈的噱头,还是造福人类的行为,还很难回答。
在弄清楚「卷」参数到底有何意义之前,我们首先需要了解AI企业们到底在「卷」什么东西。
与衡量手机性能以跑分分数为准一样,大模型也有属于自己的「性能基准」——token,这是一个大模型专用的输入、输出基本单位。在OpenAI给出的准则里,1k token等于750个英文单词、500个中文汉字。
(图源:OpenAI)
同理,token数字越大,能够处理的内容篇幅就越长。ChatGPT-4目前的参数量为8k-32k token、Anthropic公司推出的Claude为100K token,而中国初创企业月之暗面推出的Kimi Chat则是达到了惊人的400K token。具体到实例,Kimi Chat能够在20秒左右读完1篇20万字的长篇小说、通文千义也能在数秒时间里读完80万字的《三体》。
(图源:雷科技制图/通义千问)
参数量剧增所带来的好处自然是大模型对于更长的内容拥有更快速的理解能力,这能够帮助用户从中提炼到所需的摘要、信息点,又或是直接生成整篇内容的总结。语言大模型之所以能够快速「引爆」整个市场,正是得益于这种速度惊人的理解能力。
(图源:雷科技制图/Kimi Chat)
但要彻底攻克长文本,大模型光靠堆砌token参数量并不能完全解决这个问题。超大数量的token的确能够快速阅读完长文档,但段落与段落间的内容也更容易出现「断裂」的情况,这与缺少模型的预先训练有关。目前拥有超大token的AI方案提供商,通常在Transformer预测词之前投喂词元模型,使整体结论更加完整。
(图源:Code-Llama)
比如Code-Llama,标称16K token参数量,但实际上是由一个个4K token窗口连接而成,最终产生出16k token总模型。而这就十分考验大模型工具在窗口之间的推理能力。试想一下,在专业领域中,长文内容都有紧密的逻辑性与关联性,假如大模型推理失误,则有可能出现最终生成的摘要牛头不对马嘴,这对于大模型工具的商业、个人应用,都是致命的打击。
当然,大模型的推理能力是可以通过训练得到进步的,这就不难解释为何阿里、百度都选择优先将长文本模型功能免费开放给个人用户,毕竟更多用户加入,模型推理能力的进化速度才能加快。
(图源:百度文心一言)
但免费应用也是一件好事情,长文本的快速阅读一直以来也是用户在大模型各项实际应用场景最关注的一项,比如正在写毕业论文的学生党,可能将超长的论文喂给大模型工具,让其快速提炼、总结,甚至找出论文中的研究结论。
阿里的通义千问将长文本档能力的拓展方向瞄准在专业领域的内容理解上,尤其是金融、医学等,对于这些行业的从业人员而言,从前需要花上几天或是十几天才能读完的文章,如今只需花上十几秒就能看完其中的精华之处。
但大模型长文本的能力远不止于此。
(图源:育碧)
不久前,知名游戏公司育碧公开的全新「NEO NPC」技术,正是Long-LLM(长文本大模型)升级后衍生的新方向。众所周知,3A游戏大作的灵魂往往与其精彩的剧本离不开关系,其中各式各样的游戏角色,也因其丰富的背景故事和鲜明的个性深受玩家喜好。大模型从1k token进化到100k token,甚至是400k token,能够让游戏剧本完整地覆盖到每个游戏角色里,让他们的对话、行为,既符合游戏的世界观,又能保证一定的灵活性。
这项能力同样可以应用在我们生活中最离不开的功能——搜索。
(图源:雷科技制图/360AI搜索)
本月初,360在北京举行了一场活动,旗下全新360AI搜索和360AI浏览器率先亮相。360AI搜索的核心在于“理解”、“提炼”、“总结”,即抛开传统搜素引擎将所有与之相关的内容为用户一一呈现的做法,主动介入搜索结果,在数以万计的匹配信息里提炼出最有效的信息。
360AI浏览器则是变成彻底的「AI工具」。周鸿祎解释道,360AI浏览器的定位是学习、生产力工具,它能帮助用户快速阅读书籍、文章,了解视频内容等。此外,360AI浏览器未来还将拥有续写功能,这同样基于大模型长文档的理解。
更重要的是,更长的文档内容理解有助于加速AI快速过渡到AGI(通用大模型)时代。正如前文所说,Long-LLM较之前最大的变化在于对超长文本的理解、记忆、总结能力,这些能力可以是大模型更加「拟人」,即记住样本的真实喜好从而判断其行为,又或是根据真实世界的物理规则,生成完全符合实际的内容。
早在去年底,大模型长文本技术就已经进入到火热阶段,但却鲜有AI企业将这项技术应用到大模型工具中,更别提免费向大众开放了。
OpenAI CEO Altman在接受公开访问时也表示,由于算力不足,GPT-4的32K token短期内无法向大众开放。要知道,OpenAI可是当前人工智能市场里获投资最高的头部企业之一,连它都空有技术却无法落地,不免让人对Long-LLM的未来感到担忧。
在算力不足的前提下有没有办法「投机取巧」呢?当然有。
目前主流节省算力的长文本技术通常有三种,分别是短文档重复检索、内容分组检索和模型本身的优化。前两种方案在技术原理上相对一致,都是将重复的内容进行「记忆」,节省理解时间,减少算力消耗;而模型本身的优化则要复杂许多,相当于用短文档推导出长文档,这非常考究模型本身的结构优化。
(图源:英伟达)
不过,无论采用哪种方法,其精度仍有待加强,这就是为何我们仍在期待更强大的计算卡出现,比如前不久GTC 2024上,英伟达发布的最强计算显卡Blackwell GB200。关于这颗当前最强AI加速卡的详细解析,雷科技在早前的文章里已有报道,欢迎各位订阅查看。
在当前,算力仍是阻碍Long-LLM成长的一大关键因素,但随着英伟达、英特尔等硬件供应商不断加码,这项技术在未来也将成为AI领域发展的风向标之一。
如果说OpenAI的Sora展现出其在AGI时代关于视频领域上的想象,那么Long-LLM则是奔向全场景通用智能的基桩。
大模型长文本技术能让AI助手记住用户的所有你与它谈论过的话题,这让你们之间能够创造真实的回忆,而不是像从前一样,在开始新对话之后,前面的「AI」就忘记了刚刚发生过的任何事情。这使得它能够变成更好的AI智能客服,毕竟即便是真人,也难以记住与每位咨询者发生过的对话。同样的,Long-LLM还能化身数字人主播、创造数字偶像等等。
或许,在大模型长文本技术的支持下,AGI时代将在不久后真正到来。
7月10日晚间,际华集团(601718)披露业绩预告,公司预计2025年半年度实现归属于母公司所有者的净利润为-8000万元至-6000万元;归属于上市公司股东的扣除非经常性损益的净利润为-15,000万元至-13,000万元
2025-07-11际华集团,净利润,亏损智能辅助驾驶技术加速普及,AI大模型深度融入汽车产业,“软件定义汽车”趋势凸显,无人驾驶出租车、无人配送等场景加速规模化落地。与此同时,智能网联汽车迎来“强监管”,工信部对智能网联汽车的安全、可持续发展提出更高要求
2025-07-11汽车,新能源汽车,产销量随着上半年楼市“成绩”单的陆续公布,谁卖得最好也成为了市场关注的焦点。日前,克而瑞发布了《2025上半年广州商品住宅成交热销TOP10》以及各区排行
2025-07-11上半年,楼市,网签7月10日,“宗申智慧出行”微信公众号发布致歉声明,这也意味着围绕着问界、智界、尚界的三轮车的争议画上句号
2025-07-11重庆宗申车辆有限公司,江苏宗申电动车有限公司,宗申动力近日,中国证监会官网显示,中航证券变更主要股东或者公司实控人的申请已于7月8日获得受理
2025-07-11中航产融,中航证券,公司上半年,在传统百货公司整体不景气的情况下,重庆百货却凭借股权投资和股票收益实现业绩同比增长近一成
2025-07-11公司,净利润,2025香港保监局发布相关规定,7月1日起,香港分红险演示利率设定上限,港元保单演示利率上限定为6%,非港元保单也限定了6.5%的上限。 不过,业内多位保险专家表示,香港分红险演示利率限高,不等于投资者的实际收益限高
2025-07-11香港,收益,利率昔日有“驾校一哥”之称的东方时尚驾驶学校股份有限公司(证券代码:603377,简称ST东时)正站在退市边缘
2025-07-11ST东时,公司,重整空缺三年后,华泰人寿迎新任总经理。 7月10日,华泰人寿发布公告称,经公司第七届董事会第二十二次会议审议通过,并经北京金融监管局任职资格审查核准,自2025年7月10日起,由牛增亮担任公司总经理职务
2025-07-11华泰人寿,牛增亮,公司7月10日晚间,宁德时代发布公告称,公司副董事长李平及其配偶廖梅向上海复旦大学教育发展基金会(以下简称基金会)捐赠的其持有的公司405万股股票,已经完成过户手续。按照宁德时代最新股价计算,这笔无偿捐赠的价值预估约11亿元
2025-07-11宁德时代,李平,捐赠近日,名为“上海浦东玛莎拉蒂”的账号发布海报称,玛莎拉蒂的SUV车型Grecale限时尊享价38.88万元起,活动时间截止到9月30日
2025-07-11玛莎拉蒂,销量,上海正海磁材(SZ 300224,收盘价:14.49元)发布公告称,2025年7月9日,正海磁材接受华泰证券等投资者调研,公司副总裁、董事会秘书、财务总监高波,证券事务代表于在海参与接待,并回答了投资者提出的问题
2025-07-11正海磁材,九菱科技,涨停每经AI快讯,有投资者在投资者互动平台提问:请问:天润乳业有没有计划布局零食连锁量贩渠道?比如:零食有鸣、好想来、赵一鸣、零食很忙、鸣鸣很忙、好特卖、奥特乐、爱零食等,这些零食量贩渠道规模庞大,可能为天润的营收带来巨大的增长
2025-07-11天润乳业,零食,公司天津市人工智能计算中心内,一排排计算机机柜昼夜不息地嗡鸣。每一秒,都有海量数据在此流转、运算,转化为经济发展的数智力量。 当数字浪潮与经济发展深度交融,渤海之滨的天津,正乘“数”而起,在数字经济赛道上打造发展新优势
2025-07-11人工智能,中国,治理每经AI快讯,有投资者在投资者互动平台提问:董秘你好,请问贵司和摩尔线程有无合作或者业务往来? 特发信息(000070.SZ)7月10日在投资者互动平台表示,公司和摩尔线程无相关合作
2025-07-11摩尔线程,特发信息,投资者Robinhood盘中拉升涨近3%,公司在美国推出以太坊和Solana质押服务
2025-07-11Robinhood,盘中拉升,Solana7月10日晚间,赛力斯集团股份有限公司(以下简称“赛力斯”)发布半年度业绩预告,预计2025年上半年实现归属于上市公司股东的净利润为27亿元到32亿元
2025-07-11赛力斯,回购股份,回购每经AI快讯,有投资者在投资者互动平台提问:董秘您好,请问1,贵司的硫脲产能是多少?2,贵司的硫脲产品是否可行用于固态电池中?3,A股上市公司中,有哪几家公司是贵司硫脲产品的竞争对手?请尽快回复
2025-07-11固态电池,红星发展,公司7月10日,市国资委党委召开中心组学习会,围绕加密货币与稳定币的发展趋势及应对策略开展学习。市国资委党委书记、主任贺青主持会议并讲话。市委第四督导组组长王治平到会指导。市国资委党政领导班子成员出席
2025-07-11国资委,数字货币,加密货币每经AI快讯,有投资者在投资者互动平台提问:请问公司有无3D激光打印控制系统? 矩子科技(300802.SZ)7月10日在投资者互动平台表示,公司激光相关产品为工业领域的激光刻印设备
2025-07-11矩子科技,激光,公司7月9日晚间,首份A股上市券商2025年中报业绩预告出炉。红塔证券预计2025年上半年实现归母净利润同比最高增长55%。从7月10日市场表现来看,受业绩预增等因素影响,红塔证券股价涨幅超6%
2025-07-11红塔证券,净利润,同比每经AI快讯,有投资者在投资者互动平台提问:董秘你好,请问公司对深圳长方工业园和惠州工业园下一步有何安排?是继续出租还是出售,还是留着自建生产基地? *ST长方(300301.SZ)7月10日在投资者互动平台表示
2025-07-11工业园,*ST长方,公司每经AI快讯,有投资者在投资者互动平台提问:董秘你好,公司在固态电池方面是否有研发和技术储备? *ST长方(300301.SZ)7月10日在投资者互动平台表示
2025-07-11固态电池,电池,能量密度7月10日,上海市政府新闻办举行新闻发布会,介绍2025世界人工智能大会(WAIC)暨人工智能全球治理高级别会议筹备进展情况
2025-07-11人工智能,中国,治理每经AI快讯,有投资者在投资者互动平台提问:董秘你好,公司生产线有引进人工智能技术应用于产品制造来节省成本吗? *ST凯鑫(300899.SZ)7月10日在投资者互动平台表示,公司主要从事膜分离技术的研究与开发
2025-07-11人工智能,中国,治理每经AI快讯,有投资者在投资者互动平台提问:您好,请问公司的铂金有存货吗?约多少? 明牌珠宝(002574.SZ)7月10日在投资者互动平台表示,公司不断加大铂金产品的推广销售,库存相应增加
2025-07-11铂金,明牌珠宝,投资者当地时间7月10日,乌克兰总统泽连斯基在乌克兰重建会议上发表讲话,提出一系列关于乌克兰重建以及国防工业发展的主张。 泽连斯基表示,俄罗斯被冻结资产所产生的收益应当用于乌克兰的国家重建
2025-07-11乌克兰,俄罗斯,斯基7月10日,中国银联发布严正声明: 近期,有机构或个人假冒中国银联名义从事违法经营活动,侵害商家、消费者财产及个人信息安全
2025-07-11中国银联,收款码,经营英国富时100指数今日收涨1.25%,为6月12日以来首次收于纪录新高
2025-07-11英国富时100指数,1.25,127月10日,贵州茅台酒销售有限公司2025年渠道商座谈会在茅台会议中心召开,全国各省区渠道商代表围绕市场拓展、渠道建设、服务提升等方面展开探讨交流
2025-07-11贵州茅台酒销售有限公司,渠道商,茅台