选项

共 2 篇文章

大规模对齐或无法解决安全问题,或被表面现象所迷惑

本文来自夕小瑶科技说,讨论了大型语言模型对齐可能无法解决安全问题的观点。研究者发现在安全性测试中存在"伪对齐"现象,即模型对复杂概念的理解不够全面,尤其在安全性方面表现不佳。为了解决这一问题,他们提出了一个新的伪对齐评估框架(FAEF),引入了一致性分数(CS)和一致性安全分数(...
大规模对齐或无法解决安全问题,或被表面现象所迷惑

揭秘LLM考试:C-Eval优等生考题揭秘

欢迎阅读AIGC动态 原标题:LLM的考试过程原来是这样?C-Eval优等生考题实测 关键词:模型, 题目, 科目, 能力, 选项 文章来源:机器之心 字数:14149字 内容摘要:机器之心SOTA!模型社区专栏作者:Jiying,编辑:之乎、 雅芳、小土同学。本专栏由机器之心SOTA!模型社区出品...
揭秘LLM考试:C-Eval优等生考题揭秘