戴琼海院士:AlpacaEval 开源项目挑战 GPT-4,如何依靠技术重塑生态信心

戴琼海院士:AlpacaEval 开源项目挑战 GPT-4,如何依靠技术重塑生态信心

AIGC动态欢迎阅读

原标题:戴琼海院士详述开源后AlpacaEval在技术上追赶GPT4的进展,强调技术是重建生态信心的关键

关键字:模型、报告、架构、张量、数据

文章来源:人工智能学家

内容字数:4412字

内容摘要:根据AI科技大本营报道,由斯坦福大学开发的大型语言模型评测AlpacaEval Leaderboard备受行业认可。在2023年12月7日更新的排行榜中,Yi-34B-Chat以94.08%的胜率超过LLaMA2 Chat 70B、Claude 2、ChatGPT等模型,在Alpaca认证的模型类别中仅次于GPT-4,成为英语能力仅次于GPT-4的大型语言模型。同时,加州大学伯克利分校主导的LMSYS ORG排行榜显示,Yi-34B-Chat以1102的Elo评分,跻身最新开源SOTA模型之列,性能与GPT-3.5相当。在伯克利LMSYS ORG排行榜中,众多大型语言模型在“机器人竞技场”特殊测评模式下展开一对一battle,通过众筹真实用户进行线上实时盲测,取得多个Benchmark的领先成绩…

原文链接:点击此处查看原文:戴琼海院士详述开源后AlpacaEval在技术上追赶GPT4的进展,强调技术是重建生态信心的关键

联系作者

文章来源:人工智能学家

作者微信:AItists

作者简介:致力成为权威的人工智能科技媒体和前沿科技研究机构

© 版权声明

相关AI热点

暂无评论

none
暂无评论...