您的当前位置:首页 > 焦点 > 研究:用诗歌就能让AI说违禁内容,成功率达62% 正文
时间:2025-12-06 22:12:22 来源:网络整理 编辑:焦点
IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容郴州市某某摩托车销售厂便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功郴州市某某摩托车销售厂实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
演唱会“碰瓷”欧豪,40岁岳云鹏面临人生新挑战2025-12-06 20:51
汽车“以旧换新” “换”来市场新机遇2025-12-06 20:48
多地文旅市场持续火热 假日里的中国活力满满2025-12-06 20:18
自驾游成“五一”出行新亮点 流动的中国涌现澎湃活力2025-12-06 20:05
净利暴增285%!380亿光伏玻璃巨头,熬过至暗时刻2025-12-06 20:03
我国现代设施种植面积达4000万亩2025-12-06 19:56
“五一”非遗展馆热度趋高 “老手艺”与“新舞台”共融2025-12-06 19:47
AI?۲??ͨ??AGI????????й?С?????????辶2025-12-06 19:40
传奇之路,东契奇成为奥尼尔后首位连续五场两双的湖人球员2025-12-06 19:32
“假日经济”热力十足 激发消费市场新活力2025-12-06 19:32
28岁从央视辞职,39岁移居日本,大赞比国内好,如今她过得怎样了2025-12-06 21:52
遭央视315晚会点名,5万多元一瓶的“听花酒”背后2025-12-06 21:36
追光的你2025-12-06 21:20
我国科学家首次发现线粒体基因编码第14个蛋白质2025-12-06 21:12
刚刚,中美机器人爆发了一场论战2025-12-06 21:04
4月份全球制造业PMI为49.9% 亚洲制造业保持温和复苏2025-12-06 20:59
能源“革命”2025-12-06 20:11
从沪深北三市数据看2023年上市公司提质发展2025-12-06 20:09
我国快递年业务量首次突破1800亿件2025-12-06 20:03
园中之艺2025-12-06 19:32