选项

共 2 篇文章

本文来自夕小瑶科技说，讨论了大型语言模型对齐可能无法解决安全问题的观点。研究者发现在安全性测试中存在"伪对齐"现象，即模型对复杂概念的理解不够全面，尤其在安全性方面表现不佳。为了解决这一问题，他们提出了一个新的伪对齐评估框架（FAEF），引入了一致性分数（CS）和一致性安全分数（...

欢迎阅读AIGC动态原标题：LLM的考试过程原来是这样？C-Eval优等生考题实测关键词：模型, 题目, 科目, 能力, 选项文章来源：机器之心字数：14149字内容摘要：机器之心SOTA！模型社区专栏作者：Jiying，编辑：之乎、雅芳、小土同学。本专栏由机器之心SOTA！模型社区出品...