戴琼海院士：AlpacaEval 开源项目挑战 GPT-4，如何依靠技术重塑生态信心

AIGC动态欢迎阅读

原标题：戴琼海院士详述开源后AlpacaEval在技术上追赶GPT4的进展，强调技术是重建生态信心的关键

关键字：模型、报告、架构、张量、数据

文章来源：人工智能学家

内容字数：4412字

内容摘要：根据AI科技大本营报道，由斯坦福大学开发的大型语言模型评测AlpacaEval Leaderboard备受行业认可。在2023年12月7日更新的排行榜中，Yi-34B-Chat以94.08%的胜率超过LLaMA2 Chat 70B、Claude 2、ChatGPT等模型，在Alpaca认证的模型类别中仅次于GPT-4，成为英语能力仅次于GPT-4的大型语言模型。同时，加州大学伯克利分校主导的LMSYS ORG排行榜显示，Yi-34B-Chat以1102的Elo评分，跻身最新开源SOTA模型之列，性能与GPT-3.5相当。在伯克利LMSYS ORG排行榜中，众多大型语言模型在“机器人竞技场”特殊测评模式下展开一对一battle，通过众筹真实用户进行线上实时盲测，取得多个Benchmark的领先成绩…

原文链接：点击此处查看原文：戴琼海院士详述开源后AlpacaEval在技术上追赶GPT4的进展，强调技术是重建生态信心的关键