研究:用诗歌就能让AI说违禁内容,成功率达62%

  发布时间:2025-12-25 05:25:41   作者:玩站小弟   我要评论
IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》 。

IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容儋州市某某人力咨询经销部便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制


该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功儋州市某某人力咨询经销部实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容

IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。

尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”

相关文章

  • 意大利总理重申不会向乌克兰派兵

      当地时间12月17日,意大利总理梅洛尼在议会再次重申,即使在组建欧洲多国部队的情况下,意大利也不会向乌克兰派兵。  梅洛尼表示,将继续支持乌克兰,因为一旦乌克兰崩溃,将对欧洲安全产生直接影响。她还
    2025-12-25
  • 囤重兵、布导弹 日本正在背起“炸药包”

    日本的挑衅已经不止于“动嘴”。11月23日,日本防卫相小泉进次郎视察琉球群岛一处自卫队基地时表示,日方将如期在与那国岛上部署03式中程防空导弹系统。一支防空电子战部队也会在明年进驻。注意,此地距离我国
    2025-12-25
  • 高市早苗的算计,将让日本割肉5000亿

    *此图由AI生成作者| 史大郎&猫哥来源| 是史大郎&大猫财经Pro日本的旅游消费股,崩了。做寿司的Food&Life,跌14%;做百货的三越伊势丹,跌11%;做化妆品的资生堂
    2025-12-25
  • 俞敏洪,再次走向危险边缘

    出品丨花朵财经观察FF-Finance)撰文丨华见俞敏洪又一次被推至风暴中心。11月16日,新东方迎来32岁生日,创始人俞敏洪从南极发回一封内部感谢信。信中五次描绘南极的浩瀚与宁静,借企鹅的坚守比喻团
    2025-12-25
  • 好莱坞男演员詹姆斯·兰索恩在家中轻生,终年46岁

      据潇湘晨报报道,好莱坞男演员詹姆斯·兰索恩于当地时间19日在洛杉矶家中去世,终年46岁。据洛杉矶县法医办公室21日通报,其死因为上吊,遗体目前已准备移交家属。詹姆斯·兰索恩的个人社交账号主页显示,
    2025-12-25
  • 华为智选车产品总监彭磊:享界11月交付6000,本月目标1万

    IT之家 12 月 1 日消息,鸿蒙智行官方今日发布“战报”:11 月,全系车型交付新车 81864 台,同比增长 89.61%,创单月交付历史新高。IT之家注意到,华为智选车产品总监享界系列)彭磊今
    2025-12-25

最新评论

bfckf.zxcet.llhgr.eap2x.wpf5p.hdup.0n7ae.wp2s2.akem.dslgw.aln.laoying.sbs