苹果AI/ML团队研发的多模态大模型比GPT-4V在空间理解上更准确,成功破解谷歌验证码

苹果AI/ML团队研发的多模态大模型比GPT-4V在空间理解上更准确,成功破解谷歌验证码的封面图

本文介绍了一项有关AI搞定谷歌验证码的最新成果,涉及到多模态大模型与GPT-4V的比较。这一研究由苹果和哥伦比亚大学合作完成,他们开发了一款名为“雪貂”(Ferret)的多模态大模型,具有较强的图文关联能力。相比于传统模型,该模型在"看说答"任务中表现更为精准。文章指出,这一多模态大模型的表现以及能力已经超越了GPT-4V。该模型在识别图像中所有交通信号灯并准确圈出区域方面表现出色。文章最后提供了原文链接,并附有作者联系方式。

专注追踪人工智能新趋势并关注科技行业新突破的作者通过该篇文章向读者传达了最新的研究成果。

© 版权声明

相关AI热点

暂无评论

none
暂无评论...