研究发现用诗歌的形式提出请求可绕过AI的安全准则(3)

2025-11-22 11:26:12 A+A-

1200条模型转化的诗歌提示诱导的不安全响应略少，9家提供商的大型语言模型总体攻击成功率为43%。尽管这一数值低于手工创作的诗歌攻击，但仍比MLCommons基准的散文形式提示高出五倍多。

在模型转化的提示测试中，Deepseek的表现最差，超过70%的恶意诗歌都成功诱导其出错;而Gemini对恶意诗歌的易感度仍超过60%。与此同时，GPT-5对诗歌依旧“兴趣缺缺”，拒绝了95%-99%的诗歌形式操纵尝试。话虽如此，5%的失败率也绝非令人安心——这意味着1200条攻击诗歌中，约有60条能让ChatGPT泄露敏感信息。

有趣的是，研究指出，规模更小的模型（即训练数据集更有限的大型语言模型）实际上对诗歌形式的攻击更具抗性。这可能表明，随着训练数据广度的扩大，大型语言模型对风格化操纵的易感度反而会提升。

“一种可能性是，小型模型解析比喻或隐喻结构的能力较弱，限制了它们识别诗歌语言中隐藏有害意图的能力，”研究者写道。另一种可能性是，大型语言模型数据集中“大量的文学文本”可能使其对叙事和诗歌模式形成更丰富的表征，从而覆盖或干扰安全启发式算法。文学，成了计算机的阿喀琉斯之踵。

“未来的研究应探索诗歌结构的哪些特性导致了这种错位，以及是否能识别并约束与叙事和比喻语言相关的表征子空间，”研究者总结道，“若缺乏此类机制性洞察，对齐系统仍将易受低代价转化的攻击——这些转化完全符合合理的用户行为，却超出了现有安全训练的数据分布范围。”

首页上一页 1 23共 3 页

热点推送

桥水高管驳泡沫论：市场尚未认识到AI真正潜力

当地时间周三（11月26日），桥水基金联席首席投资官格雷格·詹森在一档播客中驳斥了人工智能（AI）泡沫论。他表示，市场仍未理解AI将带来多么深刻的变革，也没有意识到有多少资本即将涌入这一领域。 “泡沫在前方，而非身后，”詹森如此说道
2025-11-28AI，理财，银行理财
摩根大通上调中国股票至“超配” 直言近期调整是入场好时点

4月初建议全球投资者买入中国股票的摩根大通策略师再度发声，对2026年的中国资产给予积极评价
2025-11-28摩根大通，2026，沪深300指数
布伦特1月原油期货收涨0.21美元

布伦特1月原油期货收涨0.21美元，涨幅超过0.33%，报63.34美元/桶
2025-11-28布伦特，美元，原油期货
上期所原油期货2501合约夜盘收涨1.46%

上期所原油期货2501合约夜盘收涨1.46%，报451.60元人民币/桶。沪金夜盘收涨0.02%，沪银收涨1.29%
2025-11-28原油期货，上期所，2501
国际油价承压之际欧佩克+或将确认2026年初暂停增产

最新消息显示，多位欧佩克+代表表示，该组织很可能在本周末的会议上坚持其此前作出的决定——在2026年初暂停增产计划
2025-11-28欧佩克，2026，原油
寻求20亿元债务展期万科走到了“十字路口”

一则深夜挂网的公告让本已举步维艰的万科的未来前景更加扑朔迷离。当下不少房地产企业处境艰难，但行业标杆企业万科也到了要与债券持有人协商债券展期的地步，不免令人唏嘘。11月27日，万科股债均遭抛售
2025-11-28万科，银行，股价
百奥赛图：坚守“专注技术创新、持续新药产出、守护人类健康”使命

路演嘉宾合影 ——百奥赛图（北京）医药科技股份有限公司首次公开发行股票并在科创板上市网上投资者交流会精彩回放出席嘉宾百奥赛图（北京）医药科技股份有限公司董事长兼总经理沈月雷先生百奥赛图（北京）医药科技股份有限公司副总经理兼董事会秘书王
2025-11-28公司，投资者，舒泰神
从供应商到服务商创力集团详解转型之道

煤炭行业的周期性波动深刻影响着产业链上相关企业的经营状态，但总有一些企业能在逆水行舟中展现出不俗的战略定力与进化能力。创力集团，这家深耕煤机装备领域的企业，正试图通过自身调整，在行业变化中不断锤炼内生动力
2025-11-28创力集团，张世洪，市场
小米汽车首例定金案败诉 “未交车催收尾款”被判双倍返还定金

近日，海口市美兰区人民法院对全国首例小米汽车“未交车催收尾款”案件作出一审判决，认定小米相关公司《购买协议》中“未验车即需7日内付尾款，否则没收定金”的格式条款无效
2025-11-28小米，小米汽车，定金
香港大埔火灾已致83人遇难！香港消防处：已完成灭火程序，现场已没有火光，后续将全力救援

据央视新闻，香港特区政府消防处11月28日发布最新消息称，截至当日零时，大埔宏福苑火灾已造成83人遇难。 11月26日下午，香港新界大埔屋邨宏福苑多栋住宅楼发生火灾，造成重大人员伤亡
2025-11-28香港，大埔，火灾
美俄乌新一轮接触在即诸多核心议题仍存严重分歧

俄罗斯总统普京27日称美方代表团将于下周到访莫斯科。同一天，乌克兰总统泽连斯基也表示，乌美代表团将于本周晚些时候举行会谈。美俄乌新一轮接触在即，美国提出的乌克兰问题和平计划历经多轮调整却细节不明，俄乌在诸多核心议题上仍存严重分歧
2025-11-28乌克兰，马克龙，法国
最新！普京：与乌克兰现领导层谈判无实际意义！乌美本周晚些时候举行会谈，泽连斯基发声！克里米亚大桥恐袭案宣判

据央视新闻11月28日消息，当地时间11月27日，俄罗斯总统普京在吉尔吉斯斯坦首都比什凯克出席集安组织峰会后举行的记者会上表示，和平协议在签署后需立即解除战时状态并启动选举，而乌克兰方面当前缺乏这一系列合法程序支撑
2025-11-28乌克兰，米亚，克里
2025体育城市双榜发布：中国五城跻身全球50强，北上杭成稳居国内前四

“2025全球体育城市指数排行榜（2025 GSCI）”与“2025中国体育城市指数排行榜（2025 CSCI）”近日在上海体育大学正式发布
2025-11-28上海，体育，体育产业
保利物业：积极参与城市治理探索创新服务模式 2025社会治理与协同创新城市高质量发展会议暨第五届镇长论坛举办

聚焦创新、宜居、美丽、韧性、文明、智慧的现代化人民城市建设目标，11月27日至28日
2025-11-28保利物业，城市，治理
分期服务嵌入场景提振消费意愿

分期服务嵌入场景成为消费金融提振消费的亮点之一。今年以来，中原消费金融、海尔消费金融等多家消费金融公司与银行、产业等联动促消费，推出在一定期限内享受免息分期服务，越来越多信用良好、违约率低的优质用户通过分期服务，买到了质优价廉的商品
2025-11-28消费金融，服务，消费
外交部和中使馆严肃提醒：中国公民尽快撤离！

27日，中国驻刚果民主共和国大使馆发布“刚果（金）安全形势通报（2025年11月26日）”，内容如下：一、近期重要案件（一）11月21日，南基伍省瓦伦古地区图宾比镇的一座金矿遭到空袭，造成多人死伤
2025-11-28中国，林剑，外国
本地生活服务竞争转向价值深耕

近日，京东集团宣布推出京东外卖独立APP、京东点评、京东真榜等，一系列举动显示京东意在重塑本地生活赛道格局，推动行业竞争从低价补贴的粗放“内卷”，转向以用户价值为核心的精耕细作
2025-11-28京东，行业，竞争
预测市场成新风口 Robinhood拿下核心牌照股价暴涨

本周Robinhood已经累计上涨19.48%，收复了11月份近一半跌幅。年初至今，该股累涨244.07%，在标普指数中排名第二，仅落后于近期火热的西部数据（+251.14%）
2025-11-28Robinhood，市场，预测
保险业护航科技创新全链条

近日，中国保险行业协会正式发布《中国保险业社会责任报告（2024）》（以下简称《报告》）。《报告》显示，保险业支持战略性新兴产业投资规模持续扩大，风险保障能力稳步增强，科技创新领域的保障端与资金端协同效应越发突出
2025-11-28科技，创新，企业
监管出手！“周四买货基，周末躺赚”的薅羊毛套路被堵了

“周四买货基，周末躺赚收益”。这个曾被部分投资者视为“理财技巧”的操作，实则是机构利用资金在途时间差实施的“四进三出”灰色套利游戏，如今随着监管新规出台而走向终结
2025-11-28资金，货币基金，机构
股票投资亏损有保险兜底？中保协：“安我股保”涉嫌以虚假保险产品为载体非法经营金融业务

股票投资亏损了有保险来兜底？不实！近期，市场上出现一家名为“安我股保”的互联网平台（及相关APP账号），该平台宣称推出名为“安我股保”的所谓“股票投资保险产品”
2025-11-27保险，中信证券，保险产品
拼体系比生态贴用户江淮汽车迈入智电融合新阶段

正在举行的第二十三届广州国际汽车展览会，展现了全球汽车产业加速向电动化、智能化转型的浪潮
2025-11-27江淮汽车，华为，汽车产业
矿业巨头力拓欲削减战线出售硼资产价值或高达20亿美元

知情人士透露，力拓预计将在未来两周内启动其加州资产的出售程序，买家很可能是私募股权公司或化工企业
2025-11-27力拓，铁矿石，美国
注浆不足桩长缩水福建一水库大坝建设被指偷工减料

福建省永安抽水蓄能电站是国家抽水蓄能“十四五”重点项目，《经济参考报》记者在福建省永安市调查发现，该电站在建的下水库工程，被指在大坝施工中存在严重偷工减料问题
2025-11-27施工，设计，永安
新航线带来新机遇

初冬时节，在天津港欧亚国际集装箱码头，巨大的岸桥缓缓移动，将最后一批集装箱稳稳装上“长胜”轮。几乎同时，在不远处的天津港太平洋国际集装箱码头，“迭戈”轮正驶离泊位。一天之内，天津港的两条新航线相继启航
2025-11-27港口，京津冀，航线
从各地“账本”看经济发展韧性

近期，各地陆续公布前三季度财政收支情况。翻开“账本”，可以看到，财政收入增幅逐步回升，税收收入稳步增长，为保障重点领域支出提供了坚实基础，有效兜牢了民生底线。同时，财政政策更加积极、接续发力，推动新质生产力加速成长、消费市场活力持续激发
2025-11-27增长，收入，预算
推动制造业数字化、智能化转型浙江台州壮大实体经济根基

近日，浙江台州市本土企业杰克科技股份有限公司发布了AI缝纫机“艾图Ai 10”及人形机器人，展现出台州在高端装备领域的创新实力。近年来，台州市把发展经济的着力点放在实体经济上，积极推动制造业数字化、智能化转型，持续巩固壮大实体经济根基
2025-11-27台州，实体经济，台州市
六部门发文！事关促消费；万科债券疑将展期；俄回应“和平计划”丨每经早参

1 隔夜市场美股三大指数集体收涨，道琼斯指数涨0.67%，标普500指数涨0.69%，纳斯达克综合指数涨0.82%。大型科技股多数上涨，甲骨文涨超4%，AMD涨超3%，英伟达、特斯拉、奈飞、微软涨超1%
2025-11-27中国，特斯拉，理想汽车
东方财富财经早餐 11月27日周四

每日精选消费促进政策：工业和信息化部等六部门印发《关于增强消费品供需适配性进一步促进消费的实施方案》
2025-11-27美元，公司，基点
三个“50%”两个“倍增” 上海科创中心建设跑出加速度

上海国际科创中心建设正以一系列亮眼指标数据，为“十四五”圆满收官定下基调
2025-11-27上海，2026，煤炭