
AIGC动态欢迎阅读
原标题:OpenAI发布AGI安全风险框架!董事会可随时叫停GPT-5等模型发布,奥特曼也得乖乖听话
关键字:报告,模型,风险,团队,框架
文章来源:夕小瑶科技说
内容字数:4618字
内容摘要:
夕小瑶科技说原创作者 | 小戏、王二狗OpenAI再次强调模型安全性!AGI安全团队Preparedness发布模型安全评估与监控框架!
最近OpenAI强调模型的“安全性”,其安全系统(Safety Systems)负责人详细梳理了针对LLM的对抗攻击类型与防御方法,而“超级对齐”团队(Superalignment)则发表了论文探讨使用小模型监督对齐大模型。这些工作始终强调“随着模型逐渐接近AGI……”
今日,OpenAI宣布了一项新的安全性举措,由OpenAI负责AGI安全性的新团队Preparedness推出了“Preparedness框架”,这一系统文件负责对模型的安全性进行评估与监控,详细介绍了OpenAI目前针对模型安全评估与监控的工作思路:
Preparedness框架的提出背景主要基于两个OpenAI判断:
(1)我们的系统正在逐渐接近AGI
原文链接:OpenAI发布AGI安全风险框架!董事会可随时叫停GPT-5等模型发布,奥特曼也得乖乖听话
联系作者
文章来源:夕小瑶科技说
作者微信:xixiaoyaoQAQ
作者简介:快速了解AI前沿资讯,深入探索行业视角。聚集25万AI应用开发者、算法工程师和研究人员。作者背景涵盖清华北大、国外顶尖AI实验室和互联网巨头,兼备传媒视野与技术深度。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
暂无评论...