近日,上海交通大学长聘教授、通用人工智能研究所所长赵海收到两个好消息:一是他带领团队研发的“脑启发大语言模型”入选了“交大2030”计划B类,获得500万元经费支持;二是他的研究方向列入了上海市科委“类脑智能”项目申报指南,这份指南设立“颠覆性技术研究”专题,支持科学家探索脑启发类脑智能的新原理和新方法,研究新型非Transformer架构的类脑大模型通用架构。
Transformer是谷歌在2017年提出的一种深度学习架构,此后经OpenAI持续开发,彻底改变了自然语言处理、计算机视觉等领域的技术格局,成为人工智能大模型普遍采用的架构。那么,上海为何要布局颠覆这种架构的科技项目?类脑大模型的研发进展如何?记者在采访中了解到值得关注的阶段性成果。
从脑科学成果中获得灵感
ChatGPT风靡全球后不久,就有一些人工智能知名专家质疑Transformer架构的发展潜力。比如,图灵奖得主杨立昆认为,这种架构面临计算成本高、缺乏对复杂世界的理解、决策过程“黑箱化”等瓶颈,未来无法实现科学家梦寐以求的通用人工智能——智能体具有高效的学习和泛化能力,能根据所处的复杂环境自主提出并完成任务,且符合人类伦理规范。
今年1月,诺贝尔化学奖得主哈萨比斯谈及通用人工智能时说:“也许我们还需要1—2个类似Transformer的突破。”这意味着,Transformer很可能不是大模型架构的最终方案,在探索通用人工智能的道路上,还需要有大的创新突破。
Transformer很可能不是实现通用人工智能(AGI)的最终方案。
模拟人脑,是创新大模型架构的一条路径,因为作为大自然进化的产物,人脑就是一种通用人工智能体。“2016年,加州大学伯克利分校团队在《自然》杂志发表了一篇论文,他们发现,大脑皮层的不同区域可编码特定的语义内容。”赵海向记者介绍了这项脑科学成果。大模型架构可否模拟大脑的语义编码机制?2023年9月,这位交大教授有了创新灵感,打算颠覆Transformer架构,研发一种“脑启发大语言模型”。
于是,他自筹科研经费,租借GPU服务器,带领团队走进了类脑智能领域的“无人区”。当时,用于训练大模型的GPU服务器处于价格高位,赵海团队每月要花18万元租金。至于研发能否成功,完全是个未知数。面对双重压力,他选择了坚持,因为他相信:通用人工智能的真正基石隐藏在人类大脑中。
新范式模拟人脑全局机制
今年3月,150亿参数的“脑启发大语言模型”(BriLLM)问世,交大团队开源发布了这个中文大模型的代码和模型权重。5月,他们发布了“脑启发大语言模型”中文、英文压缩版,其大小分别为20亿和10亿参数,但性能与150亿参数大模型相当。测试显示,这3个非Transformer架构类脑大模型的生成能力达到GPT-1水平,引起了华为公司Fellow蔡华等专家的关注。
“BriLLM是首个在宏观尺度上模拟人脑全局机制的大语言模型,对机器学习范式做了颠覆性创新。”赵海介绍,它采用“信号全连接流动”机制,以取代Transformer架构的自注意力机制。这种新的机器学习范式模拟大脑皮层编码特定语义的方式,将词元(token)直接映射为“有向全连接图”模型架构上的一个个节点,让每个节点对应一个语义单元。它还模拟脑电波的传播方式,让信号沿着“最小阻力”路径,在“有向全连接图”上不断传播,选择性地激活一些语义单元节点,使大模型生成准确的文字内容。
“信号全连接流动”机制示意图
与Transformer架构大模型相比,“脑启发大语言模型”有四大潜在优势:通过模拟人脑的语义编码和信号传播机制,获得人脑的低能耗优势,大模型计算成本有望大幅降低;每个节点都对应明确语义,决策过程透明可解释,消除了大模型决策的“黑箱”问题,有利于确保人工智能安全可控;由于信号可在各个节点间无限制传播,它有望支持无限长的上下文输入,且无须增加模型规模;与多模态天然适配,在学习图像和视频时更接近人类学习方式,不依赖大数据。
凭借这些优势,赵海团队经过4轮评审,获得了“交大2030”计划B类立项支持。B类项目倡导“从 0 到 1”的原始创新,瞄准世界级基础科学问题。它不设论文指标,允许项目团队在科研领域自由使用经费。“我们打算把500万元主要用于购买算力,未来两年开发出像ChatGPT那样的对话式大模型,与Transformer架构大模型展开竞争。”得到项目支持后,赵海对这一颠覆性创新的前景更有信心了。
瞄准百亿参数大模型目标
在类脑大模型这一前沿领域,赵海并不是独行者。记者从中国科学院脑智卓越中心了解到,脑认知与类脑智能全国重点实验室研究员李国齐在研发“类脑通用智能大模型”。他的技术路线与赵海不同,主要在微观尺度上模拟大脑神经元的激活方式。
李国齐认为,Transformer架构大模型的基础是“点神经元模型+自注意力机制”,而人脑的基本计算单位是树突神经元模型。它比点神经元模型复杂得多,呈树状结构,包含多个分支和房室,每个分支和房室都存在不同参数的动力学过程,使树突神经元模型拥有多尺度的记忆能力。“我们的目标是研究可否将这种人脑机制融入现有大模型,构建一个通用的类脑智能大模型架构。”
为此,他带领团队开展了一系列探索:在理论层面,发表了关于脉冲神经网络训练算法的多篇论文,将脉冲神经网络从过去的5—10层拓展到50—500层;在神经元模型层面,提出了多房室、多分支的并行脉冲神经元模型,在解决长序列建模问题上取得进展;在架构层面,提出了“树突脉冲神经网络”这个概念,将源自人脑的神经元模型纳入机器学习框架。
谈及未来研发计划,李国齐说:“我们希望通过跨学科合作,推动算法、训练平台和芯片的深度整合,构建百亿至千亿参数规模的通用类脑大模型。”
赵海也打算开发百亿参数规模的类脑大模型。未来两年,他将带领团队完成中文和英文预训练、指令微调能力构建、高效推理部署三项任务,开发出规模不低于300亿参数的中文和英文“脑启发大语言模型”,让用户体验到非Transformer架构大模型的优势。
“我们团队已走通‘从0到1’的原始创新,接下来要做的是‘从1到10’的升级突破。希望得到政府部门更多的算力支持,让我们加快迭代类脑大模型。”赵海说。
◎记者张雪 丽珠集团正在经历从传统制药企业向创新型国际化医药企业的全力转型。 8月20日,丽珠集团披露2025年半年报,公司整体经营呈现“稳中有进”态势
2025-08-21丽珠集团,公司,杨亮谷歌周三(8月20日)推出了一系列全新消费级硬件产品,包括多款智能手机、手表和无线耳机,旨在展示其在人工智能领域的最新进展
2025-08-21谷歌,10,Pixel美国钢铝关税政策再度升级。当地时间19日,美国商务部正式发布公告,宣布将407个产品类别纳入钢铁和铝的关税清单,适用税率为50%。扩大的关税清单已于18日正式生效。有专家警告,美方此举可能会进一步加剧其国内的供应链压力并推高物价
2025-08-21美国政府,美国,关税50亿元 牧原股份拟向全体股东每10股派发现金红利9.32元(含税),分红总额为50.02亿元(含税)
2025-08-21牧原股份,公司,生猪8月20日,港交所发布2025年上半年业绩,营收和净利润均创历史新高。报告期内,港交所实现总收入140.76亿港元,同比增长33%;净利润85.19亿港元,同比增长39%
2025-08-21港交所,陈翊庭,市场8月20日晚间,江苏华辰(603097)发布2025年半年度报告
2025-08-21公司,2025,创新药通化金马(000766)8月20日晚披露2025年半年度报告
2025-08-21通化金马,新药,公司A股半年报披露进入密集期,上市公司公告中期分红方案也逐渐增多,真金白银的现金分红成为主流。 据证券时报·数据宝统计,半年报宣布分红的公司超过140家,拟分红总金额超过千亿元
2025-08-21公司,同比,2025今年上半年生猪价格整体呈现下行走势,但基于成本优势,养殖龙头牧原股份(002714)依然实现了百亿元规模的盈利。 8月20日晚间,牧原股份披露的2025年半年报显示,期内实现营业收入764.63亿元,较上年同期增加34.46%
2025-08-21牧原股份,公司,生猪上期所原油期货主力合约夜盘收涨0.95%,报486.60元/桶。沪金夜盘收涨0.52%,沪银收涨0.60%
2025-08-21原油期货,主力合约,486.60近日,上海交通大学长聘教授、通用人工智能研究所所长赵海收到两个好消息:一是他带领团队研发的“脑启发大语言模型”入选了“交大2030”计划B类,获得500万元经费支持;二是他的研究方向列入了上海市科委“类脑智能”项目申报指南
2025-08-21大模型,人工智能,Transformer1 隔夜市场 美股三大指数收盘涨跌不一,纳指跌0.67%,标普500指数跌0.24%,道指涨0.04%,标普500指数连续第四个交易日下跌;大型科技股多数下跌,英特尔跌约7%,谷歌、亚马逊、苹果、特斯拉跌超1%
2025-08-21贸易,iPhone,20美东时间周三(20日),美股三大指数收盘涨跌不一,截至收盘,道指涨0.04%,标普500指数跌0.24%,纳指跌0.67%。 投资者继续抛售科技股,转而布局估值相对较低的板块
2025-08-21美联储,降息,基点在广东汕头,一家拥有130余年历史的中药企业正焕发新生
2025-08-21粤万年青,中医药,产品每经AI快讯,美东时间8月20日周三,谷歌在年度硬件发布盛会Made by Google 2025上推出全新的消费设备阵容,包括新一代的智能手机以及新一代智能手表和无线耳机,进一步将旗下硬件与先进的人工智能(AI)技术融合
2025-08-21谷歌,智能手机,AI上月由“首相辞职”报道引发的舆论地震,正将日本两大老牌媒体推向对决前线。 当地时间8月19日,日本《读卖新闻》集团总部对《周刊文春》开炮,称其发布的《石破首相强硬背后有读卖的“谢罪”!》“纯属捏造”,并要求对方公开道歉
2025-08-21读卖新闻,辞职,媒体离岸人民币(CNH)兑美元报7.1820元,较周二纽约尾盘涨51点,日内整体交投于7.1931-7.1783元区间
2025-08-21离岸人民币,尾盘,美元美联储最新公布的7月货币政策会议纪要显示,大多数委员认为通胀风险大于就业风险,几位委员称当前利率可能并不远高于中性利率。美股三大指数收盘涨跌不一,纳指跌0.67%,标普500指数跌0.24%,道指涨0.04%
2025-08-21货币政策,Meta,美联储美股市场:美股三大指数08月20日收盘涨跌不一
2025-08-21上涨,美元,涨幅COMEX黄金期货涨0.99%,报3391.9美元/盎司。COMEX白银期货涨1.49%,报37.89美元/盎司
2025-08-21COMEX黄金期货,盎司,美元随着股市行情向好,近期,不少含权类理财产品表现亮眼。8月19日,中国证券报记者走访北京地区多家银行网点,部分银行客户经理向记者推荐了含权类理财产品。从收益表现情况来看,近1个月年化收益率在4%以上的产品不在少数
2025-08-21银行,理财产品,绿色8月20日早间,佳鑫国际资源在港交所公告,公司拟全球发售109,808,800股,香港发售股份10,981,200股,国际发售股份98,827,600股
2025-08-21佳鑫国际资源,发售,股份近日,“苏超”足球赛热度持续攀升,在第九轮比赛中,单场上座人数纪录再次刷新,同时也创造了新的中国业余足球赛事上座纪录。 与此同时,“浙BA”篮球赛也在如火如荼地进行
2025-08-21体育,赛事,体育产业每经AI快讯,8月20日,今日无新股申购,有1只新股上市,为北交所的宏远股份
2025-08-21宏远股份,北交所,上市NO.1 消息称软银曾与英特尔洽谈收购代工业务 当地时间8月19日,据媒体援引知情人士透露,在周一宣布向英特尔投资20亿美元的几周前,软银集团创始人孙正义与英特尔首席执行官就收购其代工芯片业务进行了会谈
2025-08-21英特尔,盘初,台积电8月19日,据大唐集团,位于新疆哈密“沙戈荒”地区的光伏光热一体化实证基地正式启动运行,填补了国内“沙戈荒”气候区光伏光热协同开发技术实证领域的空白。实证基地是用于对特定项目进行实际运行测试、验证的场所,为相关领域的发展提供科学依据和指导
2025-08-21光伏,实证,测试重要新闻提示 财政部:1—7月证券交易印花税936亿元,同比增62.5% 福耀玻璃 东杰智能:筹划控制权变更,股票及可转债今起停牌 今日提示 北交所新股宏远股份(920018)今日上市。 最新贷款市场报价利率(LPR)今日公布
2025-08-21公司,同比,增长陆家嘴金融沙龙第23期《医保+商保:共同促健康、惠民生》专题研讨活动近日在沪顺利举行
2025-08-21医药,创新药,保障NO.1 去哪儿:暑期外国游客深入中国小城,机票预订扩展至144个城市 随着我国240小时过境免签“朋友圈”不断扩容,外国游客在中国的游玩时间更加充裕,他们不再局限于打卡大城市,更多人选择有特色的小城进行“深度游”
2025-08-21泡泡玛特,同比,亿元当地时间8月19日,美国商务部宣布,将407个产品类别纳入钢铁和铝关税清单,适用税率为50%。商务部声明称,此次新增清单涵盖范围广泛,包括风力涡轮机及其部件、移动起重机、铁路车辆、家具、压缩机与泵类设备等数百种产品
2025-08-21钢铁,关税,产品