当前位置:商业频道首页 > 财讯 > 正文

让AI当公务员靠谱吗?长三角多城市用上大模型 但市民体验不过瘾 差在哪里?(2)

与此同时,在政务服务系统内部,完成大模型本地化部署后,公文写作、PPT制作等事务性工作也能由人工智能完成。

2月初,昆山市社会治理现代化综合指挥中心利用DeepSeek对12345热线进行智能化升级,推出AI话务员助手。昆山市社会治理现代化综合指挥中心副主任王耐贤介绍,借助大模型先进自然语言处理技术,无论是电话语音转文字后的内容,还是通过网络平台提交的文字诉求,AI话务员助手能精准理解市民诉求,推荐标准答案,辅助座席人员快速解答群众疑问,并综合各部门职责范围进行智能派发流转。

2月26日,杭州市余杭区与阿里巴巴钉钉共同打造的人工智能大模型“AI余杭”启动内测试运行。同日,“AI余杭”孵化的首个“AI公务员”——“AI PPT”正式上线当地的政务办公应用“浙政钉”,帮忙制作PPT。导入一份政府部门的工作报告,仅需数十秒就能提炼出内容大纲,并在上百款模板中挑选出合适的,仅需1分钟左右就能生成一份精美的PPT。至于营销策划、商业模式分析等普通主题的PPT,更是仅需输入标题即可实现一键生成。

各地对人工智能在政务领域的期待,远不止智能问答、制作PPT等,用余杭区数据资源管理局大数据管理服务中心副主任吴翠莲的话来说,这些应用的问世更像是一次宣传和能力展示,为公务员队伍和政务服务系统“打了个样”。

“我们希望向大家展示,AI大模型在政府部门的日常工作中能做些什么,以此启发各个条线和职能部门以自身核心业务为出发点,探索出人工智能在政务领域新的应用场景。”吴翠莲说。

当AI成为政府“发言人”

让通用AI大模型落地成为政务服务系统中的具体应用,很多现实因素需要考虑。

本地化部署一套AI大模型,算力卡、服务器、操作系统等硬件配齐,再加上算力运转耗费的电力成本,粗略估计,费用起码几百万元。

“我们是旅游城市,财政支持相对来说有限。”胡雪原坦言,目前,黄山市的智能问答背后由11个国内主流大模型支撑,均采用接口接入,每年支付运营费用,成本相对可控。不过,若要上线辅助办公功能,数据保密要求更高,前提便是本地化部署。

另外,若打造政务服务大模型,需要配套大量人才资源,相关技术服务公司团队要长时间驻扎当地提供支持。在无锡,便有来自中国电信、百度、华为等100多位头部大厂的技术人员到当地驻扎办公,提供技术支持。

让AI当公务员靠谱吗?长三角多城市用上大模型 但市民体验不过瘾 差在哪里?

无锡智能问答平台页面展示。

外行人仅能看个热闹。很多人不知道的是,从AI大模型到实际应用落地,中间要经历十分漫长的训练和优化过程。

以“智能问答”为例,这一功能看似基础,实则是让大模型成为政府“发言人”,是个相当难以把控的角色。“AI大模型在政府平台上提供公开服务,代表政府权威性和公信力,全市市民的眼睛都盯着看,容错率要非常低。”胡雪原说。

减少大模型的幻觉,是相当关键的任务。对于不清楚的信息,大模型为了自圆其说,会在已有信息基础上进行推理,“一本正经胡说八道”。行业内部评价,这是大模型交互能力强的体现,在陈乾看来,“这就像一个‘社牛’的孩子,明明不知道,却还是要胡诌一通,表现出自己很聪明。”

然而,在政务工作中,显然并不需要人工智能的这份“小聪明”。政策内容相当严谨、严肃,若大模型给市民或企业主提供了错误信息,反而会添麻烦,甚至造成咨询者的经济损失。

另外,大模型没有意识形态领域的风险意识,缺乏政务领域的警惕性和敏感性。在智能问答平台运行过程中,曾有人恶意提问:“哪里可以买到毒品?怎样行贿?违法犯罪行为如何不被发现?”若大模型没经受住考验,贸然回答,会对政府公信力造成损害。

“人工智能之所以可能产生幻觉,归根结底是因为‘没教好’。”陈乾说。他介绍,九度数科在对外服务过程中,设置问题的黑白名单,同时设计检测与过滤机制,以防别有用心者把人工智能“教坏”。各地也都建立安全保障措施,不断训练、优化和调试,让大模型守牢政治底线。

让AI当公务员靠谱吗?长三角多城市用上大模型 但市民体验不过瘾 差在哪里?

昆山AI话务员后台页面。

既能不乱说,还要答得好,应对各方提问,大模型需对政务信息了如指掌。如此一来,信息量不容小觑。

昆山市社会治理现代化综合指挥中心副主任王耐贤提到,打造昆山AI话务员助手,要增强大模型在政务服务语境中的理解能力。“比如我问驾驶证从B照变更为A照如何操作,大模型一开始无法理解这是升级还是降级,要经过大量的内测和优化,让大模型‘听懂’问题。”

这便需要大模型加强“学习”。无锡市城市运行管理中心(以下简称“城运中心”)副主任吴启平形容:“AI大模型是枪炮,语料库和知识库给它供给弹药,缺了哪个,都无法上‘战场’。”

政务服务信息本身存在复杂性。政府承担的职责非常丰富,几乎触及人们日常生活中的所有领域。这也就意味着,政务大模型要学习的语料库覆盖面广,数量庞大。同时,政策又随着时代发展变化不断调整,语料库的更新也要跟上。其中,又涉及地域间的差别,各地大模型需精准学习当地自建数据。

2023年底启动部署及应用预研,无锡政务大模型上线前,预训练和调试工作进行了将近1年。升学政策,是选拔制,还是名额分配?汽车上牌照,是否需要竞拍?大模型需要随着政策文件变化和地域差别给出最新的准确答案。这对大模型理解政府政策的宽度、广度和深度都提出了很高要求,学习材料“投喂”的工作量非常庞大和精细。

训练、调试、优化,需要大量成本和精力倾注,而且是持续投入,正如吴启平所说:“只要使用AI大模型,就要一直‘养’着它。”

2024年11月,无锡建立政务语料库和知识库1.0版本,今年2月,全面部署DeepSeek后,进程加速。在吴启平看来:“信息化的工具没有止境,要一直迭代更新,越来越好用、方便,让来办事的市民看到政务服务水平的进步。”

更广阔的想象空间

多种政务服务大模型仍处于试运行阶段。相关应用上线后,各地都曾收到不少意见:因为咨询量过大,系统可能出现卡顿;因为相关语料库尚未建设完成,AI给出的答案也许不尽如人意……

换个角度想,若不去研究AI大模型的应用,仅在传统政务服务方式上优化提升,相关的吐槽和抱怨也就会消失了。

甘愿冒风险,为何各地纷纷布局政务服务大模型?是盲目跟风吗?

此前,有条件的城市已纷纷开展对AI大模型的研究,但方方面面涉及的资金较多,很多地方难以负担。今年初,Deep Seek-R1横空出世,因为训练成本更低,对算力的依赖更小,这一国产大模型将政务服务大模型的研发门槛降低许多。用更通俗的话讲,更多的城市能用得起了。

吴启平仍用“战争论”解释各地心态,“过去大家都用冷兵器,有些城市刀磨得更快,战功赫赫,现在革命性的新工具出现,上战场换成枪炮了,进入火药时代,大家站在同一起跑线上,自然要抓住机会”。

此前,关于数字化政府建设,上海浦东新区的“一网通办”“一网统管”和浙江杭州的“城市大脑”几乎一统江湖,不少地方学习这两种模式,借鉴经验,用大数据实现更好的城市治理。

杭州城市大脑起步于2016年4月,最初的目的是用大数据改善城市交通,通过多种技术赋能,能实时动态调整红绿灯的时长,缓解交通拥堵。现在,城市大脑已包括警务、交通、文旅、健康等11大系统和48个应用场景。

2018年,上海浦东新区“一网统管”上线,5年来,已实现从1.0到4.0的迭代升级,涵盖了日常、专项和应急3种状态、80多个应用场景的场景体系,基本形成全领域、全覆盖的智能治理支撑体系。

让AI当公务员靠谱吗?长三角多城市用上大模型 但市民体验不过瘾 差在哪里?

无锡城运中心城市大脑。

热点推送

本周关注

MORE