研究:用诗歌就能让AI说违禁内容,成功率达62%
[焦点] 时间:2026-01-03 18:11:31 来源:咸宁市某某通用机械维修网点 作者:热点 点击:178次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容延安市某某超声设备有限公司便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功延安市某某超声设备有限公司实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:时尚)
相关内容
- 中南大学党委常委、副校长郭学益被查
- 再见美拉德、格雷系!今年秋天最流行的4组配色,谁穿谁好看
- 中国最大民营企业诞生:90多万员工,远超华为和京东之和
- 标配银河Flyme Auto/还带外放电 吉利星愿配置发布
- 不涉及零跑控制权,一汽37亿元正式入股零跑
- 东方与西方,古典与现代?|中法六十年
- 叶珂发文辟谣与黄晓明相恋5年,称呼甜蜜浪漫,否认网传闺蜜
- 特斯拉很快将向更多Cybertruck车主推送自动泊车服务
- 将推出飞行汽车?比亚迪辟谣:没有此类计划和安排
- 4件便宜又实用的收纳神器!告别脏乱差!租房、宿舍必备!
- 黎真主党武装称向以北部发射火箭弹
- 中年女性穿衣指南:抛弃紧身衣与老年装,释放你的高级魅力
- 以总统:没答应特朗普赦免内塔尼亚胡
- 纳斯达克中国金龙指数大涨12%,创5月以来新高
精彩推荐
- 背大学英语四级单词,每天要复习的单词越来越多怎么办?
- Bottega Veneta请了什么可爱来宾,让舒淇都后悔没合影?
- 赵丽颖晒飞天奖杯,含泪谢谢所有,感恩所经历的一切
- 发现一个很多人不敢做,却能快速拿下crush的小动作
- “史上最贵”的世界杯,球迷成了韭菜
- 40岁,有前男友还能搞纯情先婚后爱?
热门点击
- 冠军凯旋!北京刷新世界技能大赛历史成绩 views+
- 河南一公司邀请员工和父母过中秋:每人600元红包,发了1000多万 views+
- 是否“护犊子”?美诚月饼的四个待解之问 views+
- 药房老板未按处方卖复方曲马多片被控贩毒:重审时检方撤诉,已获国赔 views+
- 都2024年了,真主党为何还在使用寻呼机? views+
- 三只羊中秋节给员工发美诚月饼 有老板买15盒送亲戚:我有点内疚 views+
- 东部战区短视频罕见公开外国舰船过航台湾海峡画面 views+
- 普京批准与伊朗签署全面战略伙伴关系条约的建议 views+
- “三只羊”对商品产地玩文字游戏也是消费欺诈 views+
- 国庆假期首日车票开售,多个出京热门车次均已售罄 views+
