
AIGC动态欢迎阅读
原标题:开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件
文章来源:机器之心
内容字数:8855字
机器之心专栏编辑部BSChecker发布了一篇关于细粒度大模型幻觉检测工具与基准测试排行榜的文章。长期以来,大模型存在一个致命问题,即生成幻觉。由于数据集的复杂性,难免包含过时和错误信息,这给输出质量带来了极大挑战。过多的重复信息也可能使大型模型产生偏见,这也算是一种幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课题。近日,亚马逊上海人工智能研究院推出了细粒度大模型幻觉检测工具 BSChecker,具有以下重要特点:细粒度幻觉检测框架,对大模型输出文本进行三元组粒度的幻觉检测。幻觉检测基准测试集,包含三种任务场景,满足用户不同需求。两个基准测试排行榜,目前涵盖了15个主流大模型的幻觉检测结果。此外,BSChecker的作者们在Gemini推出后也很快进行了自动检测的幻觉测试。
原文链接:点此阅读原文:开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件
联系作者
文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
暂无评论...