
AIGC动态欢迎阅读
以下为原标题:大模型+多模态的3种实现方法|文末赠书。
文章来源:AI前线。
内容字数:5975字。
内容摘要:我们都了解,预训练LLM已经取得了许多惊人的成就,然而它明显的劣势在于不支持其他模态(包括图像、语音、视频模态)的输入和输出。那么在预训练LLM的基础上如何引入跨模态的信息,使其更加强大和通用呢?本节将介绍“大模型+多模态”的三种实现方法。01以LLM为核心,调用其他多模态组件。2023年5月,微软亚洲研究院(MSRA)与浙江大学共同发布了HuggingGPT框架。该框架能够以LLM为核心,调用其他多模态组件来协同完成复杂的人工智能任务(更多详细信息请参阅Yongliang Shen等人发表的论文“HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace”)。HuggingGPT框架的原理示意图如图1所示。接下来,我们将根据文中提到的示例逐步解析HuggingGPT框架的执行过程。如果现在您需要执行这样一个…
原文链接:点此阅读原文:大模型+多模态的3种实现方法|文末赠书
联系作者
文章来源:AI前线。
作者微信:ai-front。
作者简介:AI前线面向AI爱好者、开发者和科学家,提供AI领域技术资讯、一线业界实践案例,搜罗整理业界技术分享干货、AI论文解读。每周一节技术分享公开课,助力您全面掌握人工智能技术。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
暂无评论...