谷歌发布5B参数的视觉语言模型PaLI-3,更小、更快、更强

谷歌发布5B参数的视觉语言模型PaLI-3,更小、更快、更强

AIGC动态欢迎阅读

原标题:谷歌视觉语言模型PaLI-3问世,参数仅5B,更小、更快、更强

关键字:模型,编码器,图像,报告,文本

文章来源:机器之心

内容字数:7142字

内容摘要:在多模态(视觉语言)大模型领域,拼参数赢性能的同时,追求参数更小、速度更快、性能更强是另一条研究路径。视觉语言模型(VLM)的参数已经扩展到了数百甚至数千亿,在这样的大模型时代里,谷歌研究院推出的谷歌视觉语言模型PaLI-3展现了更小规模模型的潜力。该模型仅使用5B参数,但在性能上却表现出色,为研究提供了一个更快的周期。

原文链接:点此阅读原文:谷歌视觉语言模型PaLI-3问世,参数仅5B,更小、更快、更强

联系作者

文章来源:机器之心

作者微信:almosthuman2014

作者简介:专业的人工智能媒体和产业服务平台

© 版权声明

相关AI热点

暂无评论

none
暂无评论...