人类考92分,GPT-4仅得15分:测试揭示大模型的实际水平

人类考92分,GPT-4仅得15分:测试揭示大模型的实际水平的封面图

本文来自机器之心,是关于GPT-4在一项新测试中表现不佳的文章。测试题名为「GAIA」,由Meta-FAIR、Meta-GenAI、HuggingFace和AutoGPT团队共同设计。《GAIA》提出的问题涉及推理、多模态处理、网页浏览等领域,挑战了大多数高级AI,使GPT-4仅得15分,而人类能得92分。团队认为,解决《GAIA》问题将成为AI研究的重要里程碑。与传统基准测试不同,《GAIA》考察了解决基本问题的能力,突显了对人工智能通用智能(AGI)的理解差异。如需阅读原文详情,请访问原文链接。如果想联系作者,可以添加作者微信:almosthuman2014。

© 版权声明

相关AI热点

暂无评论

none
暂无评论...