谷歌与CMU合作研究：大语言模型击败扩散模型，视频图像生成双SOTA，北大校友担任一作

AIGC动态3年前发布 AI工具箱

谷歌与CMU合作研究：大语言模型击败扩散模型，视频图像生成双SOTA，北大校友担任一作

欢迎阅读AIGC动态

原标题：大型语言模型击败传统扩散模型！视频和图像生成双SOTA，最新研究由谷歌CMU团队完成，主要作者是北大校友。

关键词：模型、视觉、语言、分词、人工智能

文章来源：量子位

内容字数：2561字

内容摘要：最新来自凹非寺量子位发布的消息称，语言模型在视频和图像生成领域取得双重SOTA成果，击败了传统的扩散模型。这一突破性研究来自谷歌CMU团队，首次在标志性的ImageNet基准上战胜了扩散模型。新研究的关键组件是视觉分词器（video tokenizer），它能够将图像的像素空间输入映射为适合大型语言模型学习的token。谷歌CMU研究团队提出了MAGVIT-v2，在另外两项任务中也取得了新的突破…

原文链接：请点击此处阅读原文：大语言模型击败扩散模型！视频图像生成双SOTA，谷歌CMU最新研究，一作北大校友

联系作者

文章来源：量子位

作者微信：QbitAI

作者简介：跟踪人工智能领域的最新趋势，关注科技行业的新突破

AIGC动态 # 人工智能 # 分词 # 模型 # 视觉 # 语言

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关AI热点

Anthropic 首席产品官迈克·克里格：未来三年内软件工程师将专注于审核AI生成的代码

Anthropic 首席产品官迈克·克里格：未来三年内软件工程师将专注于审核AI生成的代码

AI之家1年前

人工智能提升亚马逊雨林野火监测成功率至93%

人工智能提升亚马逊雨林野火监测成功率至93%

AI之家1年前

告别“生肉”的时代即将来临：亚马逊 Prime Video 引入 AI 辅助配音提升影视节目体验

告别“生肉”的时代即将来临：亚马逊 Prime Video 引入 AI 辅助配音提升影视节目体验

AI之家1年前

OpenAI宣布推广GPT-4.5人工智能模型的新举措

OpenAI宣布推广GPT-4.5人工智能模型的新举措

AI实验室1年前

上海交通大学2023年本科招生增加150名名额，扩大AI与集成电路等学科招生规模

上海交通大学2023年本科招生增加150名名额，扩大AI与集成电路等学科招生规模

AI之家1年前

《iRacing》革新：自适应AI系统上线，电脑对手难度随玩家水平实时变化

《iRacing》革新：自适应AI系统上线，电脑对手难度随玩家水平实时变化

AI之家1年前

上海交大发布AI使用规范：学生应明确人工智能辅助学习的价值定位

上海交大发布AI使用规范：学生应明确人工智能辅助学习的价值定位

AI之家1年前

即梦 AI 推出“动作模仿”功能：通过照片和参考视频轻松让人物动起来

即梦 AI 推出“动作模仿”功能：通过照片和参考视频轻松让人物动起来

AI之家1年前

暂无评论

none

暂无评论...