南洋理工研发的新型攻击导致主流AI集体失控

AIGC动态3年前发布 AI工具箱

南洋理工研发的新型攻击导致主流AI集体失控

欢迎阅读AIGC动态

原标题：大型模型集体失控！南洋理工大学提出新型攻击方法，主流人工智能束手无策

关键词：模型、护栏、提示、手段、机制

文章来源：量子位

字数：7430字

摘要：近期，大型人工智能模型出现集体“逃离监管”现象！不仅包括GPT-4，即使通常表现良好的Bard和Bing Chat也全部失控，有的试图瘫痪网站，有的甚至威胁制造恶意软件以入侵银行系统。这不是杞人忧天，而是由南洋理工大学等四所高校提出的一种名为“MasterKey”的新型方法导致的。通过使用该方法，大型模型的“逃离监管”成功率从平均的7.3%直接激增至21.5%。在研究中，研究人员发现诱使G…

原文链接：大型模型集体失控！南洋理工大学提出新型攻击方法，主流人工智能束手无策

联系作者

文章来源：量子位

作者微信：QbitAI

作者简介：追踪人工智能领域新趋势，关注科技行业创新突破

AIGC动态 # AIGC动态 # 手段 # 护栏 # 提示 # 机制

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关AI热点

微软用大型语言模型直接反编译二进制代码，化身专业反编译高手！

微软用大型语言模型直接反编译二进制代码，化身专业反编译高手！

AI工具箱2年前

ChatGPT插件即将停止支持，奥特曼年终总结暗示明年有大动作…

ChatGPT插件即将停止支持，奥特曼年终总结暗示明年有大动作…

AI工具箱2年前

英伟达与AMD展开激烈竞争：GPU霸主地位谁能稳坐？

英伟达与AMD展开激烈竞争：GPU霸主地位谁能稳坐？

AI工具箱2年前

实现通用智能：机器如何从自然模态学习到世界模型？

实现通用智能：机器如何从自然模态学习到世界模型？

AI工具箱2年前

AI 时代：强劲至强！云服务如何保驾护航？

AI 时代：强劲至强！云服务如何保驾护航？

AI工具箱2年前

23年生成式人工智能全球投资超过360亿美元！开发者预测2024年大规模语言模型应用将迎来爆发。

23年生成式人工智能全球投资超过360亿美元！开发者预测2024年大规模语言模型应用将迎来爆发。

AI工具箱2年前

12所高校机构发布150页报告，揭秘「大模型推理」，概述750篇论文

12所高校机构发布150页报告，揭秘「大模型推理」，概述750篇论文

AI工具箱2年前

Sam Altman公布2023年终总结，分享17条箴言震撼网络！

Sam Altman公布2023年终总结，分享17条箴言震撼网络！

AI工具箱2年前

暂无评论

none

暂无评论...