清华大学唐杰团队与智谱合作,发布多模态14边形战士,挑战GPT-4V,在线可玩

清华大学唐杰团队与智谱合作,发布多模态14边形战士,挑战GPT-4V,在线可玩

AIGC动态欢迎阅读

原文标题:挑战GPT-4V!清华唐杰&智谱开源多模态14边形战士,在线可玩
关键词:模型量子深度视觉、语言
文章来源:量子位
内容字数:2140字
内容摘要:本文由梦晨撰写,发表于凹非寺量子位公众号QbitAI。你能看出这张图中有几个房子吗?如果你的答案是3个,那就和GPT-4V的回答一样。然而,最新开源的国产多模态模型CogVLM-17B却展现出不同的能力,甚至可以准确区分在图中完整可见的有3个房子和部分可见的有1个房子。CogVLM由清华大学和智谱AI公司合作开发,该项目的通讯作者为唐杰和丁铭,相关论文和开源代码已经上传至GitHub。除了这个案例外,CogVLM-17B还在10个权威的跨模态基准测试上展示了出色的表现…
原文链接:[原文链接地址]

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:专注追踪人工智能新趋势,关注科技行业的最新突破
© 版权声明

相关AI热点

暂无评论

none
暂无评论...