<img src="
">
AIGC动态欢迎阅读
原标题:我的眼睛就是尺!80亿参数OtterHD带你「清明上河图」数骆驼!南洋理工华人团队打造
文章来源:新智元
内容字数:5131字
内容摘要:新智元报道编辑:好困【新智元导读】最近,由南洋理工华人团队提出的80亿参数多模态大模型OtterHD,不仅可以解决让GPT-4V难倒的问题,甚至可以数清明上河图(局部)里到底有多少只骆驼!想了解清明上河图中有多少头骆驼?快来看看这个支持超高清输入的多模态模型。最近,南洋理工的华人团队基于Fuyu-8B打造了80亿参数的多模态大模型OtterHD。论文地址:https://arxiv.org/abs/2311.04219不同于传统模型受限于固定尺寸视觉编码器,OtterHD-8B具备处理各种输入尺寸的能力,确保在各种推理需求下的通用性。此外,团队还提出了一个新的基准测试MagnifierBench,可详细评估LLM在辨别大尺寸图像中微小细节和空间关系能力。结果显示,OtterHD-8B表现出色,特别是在直接处理高分辨率输入时,优于同类模型。效果…
原文链接:点此阅读原文:我的眼睛就是尺!80亿参数OtterHD带你「清明上河图」数骆驼!南洋理工华人团队打造
联系作者
文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。专注人工智能、机器人等前沿领域发展,研究人机融合、人工智能和机器人对人类社会与文明进化的影响,引领中国智能时代。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
暂无评论...