北大与腾讯等联合推出LanguageBind,再次颠覆多模态信息对齐技术领域

北大与腾讯等联合推出LanguageBind,再次颠覆多模态信息对齐技术领域

欢迎阅读AIGC动态

原标题:北大腾讯等提出LanguageBind,用语言对齐多模态信息,刷新多个榜单

关键词:腾讯、数据、语言、语义视频

文章来源:机器之心

内容字数:6505字

内容摘要:机器之心编辑部介绍,北京大学与腾讯等机构的研究者们提出了名为LanguageBind的多模态对齐框架。该框架在视频、音频、文本、深度图和热图像等五种不同模态的下游任务中表现出色,登上多个评估榜单,标志着多模态学习领域迈出了重要一步。在当今社会,信息传递和交流已不再局限于单一模态。我们置身于一个多模态的世界中,声音、视频、文字和深度图等模态信息相互交织,共同构成了我们的…

原文链接:用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单

联系作者

文章来源:机器之心

作者微信:almosthuman2014

作者简介:从事专业人工智能媒体与产业服务平台工作

© 版权声明

相关AI热点

暂无评论

none
暂无评论...