编码器

共 11 篇文章

Meta谷歌跨语种AI同传技术惊艳亮相,革新语音翻译领域

AI动态:Meta和谷歌重大突破,颠覆语音翻译领域 原文标题:跨语言「AI同传」震撼登场!Meta和谷歌取得重要进展,颠覆语音翻译 关键词:语音识别,语言翻译,编码器,模型,解码器 文章来源:新智元 字数:7071字 摘要:新智元编辑报导:好困【导读】Meta和谷歌相继发布重要成果!Meta公布开源...
Meta谷歌跨语种AI同传技术惊艳亮相,革新语音翻译领域

照片生成视频:张嘴、点头、喜怒哀乐,打字控制

AIGC动态欢迎您的阅读。原文标题是:一张照片生成视频,张嘴、点头、喜怒哀乐,都可以打字控制。文章来源于机器之心,全文共5733字。最近微软进行的研究展示了一项引人注目的技术:通过一张照片,AI能够生成该照片中人物的视频,并且这些人物的表情和动作都可以通过文字进行控制。例如,用户可以发送“张嘴”的指...
照片生成视频:张嘴、点头、喜怒哀乐,打字控制

马毅团队研发出「白盒」Transformer,揭开LLM黑盒的奥秘!

深度解读:AIGC团队探索智能本质 原文标题:智能的本质是压缩?马毅团队提出「白盒」Transformer,揭开LLM黑盒! 关键词:研究者,模型,架构,表征,编码器 文章来源:新智元 字数:8585字 内容摘要:研究人员来自UC伯克利、香港大学等机构,提出了一种创新的「白盒」Transformer...
马毅团队研发出「白盒」Transformer,揭开LLM黑盒的奥秘!

马毅团队成功研发白盒Transformer,GPT-4不只是在压缩数据?

本文介绍了伯克利和香港大学的马毅教授领导的研究团队最新研究成果。研究团队通过引入一种新的深度网络架构 CRATE,验证了当前 AI 系统,包括 GPT-4,在压缩数据方面的操作。与传统的黑盒 Transformer 不同,CRATE 是一种白盒 Transformer,不仅在各项任务上表现出色,而且...
马毅团队成功研发白盒Transformer,GPT-4不只是在压缩数据?

北大和腾讯联手打造多模态15边形战士:语言纽带,跨越互联之界

北大&腾讯合作打造多模态15边形战士 近日,北大联合腾讯共同打造了一个多模态15边形战士,该项目以语言为核心,通过引入“LanguageBind”多模态预训练框架,实现了语言与视频、音频、深度、红外理解等多模态数据的有效对接。具体而言,研究人员使用语言作为各模态之间的纽带,通过固定语言编码器...
北大和腾讯联手打造多模态15边形战士:语言纽带,跨越互联之界

AI技术解锁大脑思维,读心术让机器猜得准吗?

AI技术解读大脑思维本文原标题:读心术!AI技术解锁大脑思维,你想什么它都知道关键词:解读,大脑,图像,技术,编码器本文来源:AI范儿文章总字数:2218字文章摘要:本文介绍了Meta公司最新的AI系统,利用磁脑电图技术实时解读大脑中的视觉信息,为医学和人工智能领域带来了重大突破。虽然技术精确度有待...
AI技术解锁大脑思维,读心术让机器猜得准吗?

谷歌发布5B参数的视觉语言模型PaLI-3,更小、更快、更强

AIGC动态欢迎阅读原标题:谷歌视觉语言模型PaLI-3问世,参数仅5B,更小、更快、更强关键字:模型,编码器,图像,报告,文本文章来源:机器之心内容字数:7142字内容摘要:在多模态(视觉语言)大模型领域,拼参数赢性能的同时,追求参数更小、速度更快、性能更强是另一条研究路径。视觉语言模型(VLM)...
谷歌发布5B参数的视觉语言模型PaLI-3,更小、更快、更强

谷歌发布重磅更新 PaLI-3,小改动大作用!

AIGC动态欢迎阅读 原标题:谷歌发布全新模型 PaLI-3,实力不容小觑! 关键词:模型、编码器、图像、文本、任务 文章来源:夕小瑶科技说 字数:10887字 简介:智商掉了一地,ZenMoore视觉语言模型(VLM)的参数规模已经扩展到数百亿甚至数千亿,性能持续提升。尽管如此,小规模模型仍然非常...
谷歌发布重磅更新 PaLI-3,小改动大作用!