SEED-Bench更新:SEED-Bench多模态大模型测评基准超越GPT-4V?

SEED-Bench更新:SEED-Bench多模态大模型测评基准超越GPT-4V?的封面图

本文介绍了腾讯AI Lab与腾讯ARC Lab和港中深合作推出的SEED-Bench系列测评基准,为多模态大语言模型(MLLM)提供了全面客观的评测体系。SEED-Bench评测基准是一个包含大量经过人工标注正确答案的选择题的评测体系,涵盖了图像和视频等12个维度,而后版本扩充至27个维度。这一评测基准已成为主流基准之一,受到业界关注和认可。该项目对于多模态大语言模型的发展具有重要意义。

原文链接:GPT-4V被超越?SEED-Bench多模态大模型测评基准更新。如果您想了解更多信息,请点击原文链接。

© 版权声明

相关AI热点

暂无评论

none
暂无评论...