编码器_AI今日热点提供国内外人工智能一手新闻资讯

小模型也能”无所不能”：Meta将SAM改进，参数仅为原版的5%

<img src=""> 欢迎阅读AIGC动态原标题：小模型也能实现“分割一切”，Meta改良SAM，仅使用原版5%的参数关键词：编码器、图像、模型、特征、任务文章来源：机器之心内容字数：6437字内容摘要：机器之心编辑报道：陈萍、蛋酱。对于2023年的计算...

AI工具箱3年前

Meta谷歌跨语种AI同传技术惊艳亮相，革新语音翻译领域

AI动态：Meta和谷歌重大突破，颠覆语音翻译领域原文标题：跨语言「AI同传」震撼登场！Meta和谷歌取得重要进展，颠覆语音翻译关键词：语音识别，语言翻译，编码器，模型，解码器文章来源：新智元字数：7071字摘要：新智元编辑报导：好困【导读】Meta和谷歌相继发布重要成果！Meta公布开源...

AI工具箱3年前

照片生成视频：张嘴、点头、喜怒哀乐，打字控制

AIGC动态欢迎您的阅读。原文标题是：一张照片生成视频，张嘴、点头、喜怒哀乐，都可以打字控制。文章来源于机器之心，全文共5733字。最近微软进行的研究展示了一项引人注目的技术：通过一张照片，AI能够生成该照片中人物的视频，并且这些人物的表情和动作都可以通过文字进行控制。例如，用户可以发送“张嘴”的指...

AI工具箱3年前

马毅团队研发出「白盒」Transformer，揭开LLM黑盒的奥秘！

深度解读：AIGC团队探索智能本质原文标题：智能的本质是压缩？马毅团队提出「白盒」Transformer，揭开LLM黑盒！关键词：研究者，模型，架构，表征，编码器文章来源：新智元字数：8585字内容摘要：研究人员来自UC伯克利、香港大学等机构，提出了一种创新的「白盒」Transformer...

AI工具箱3年前

马毅团队成功研发白盒Transformer，GPT-4不只是在压缩数据？

本文介绍了伯克利和香港大学的马毅教授领导的研究团队最新研究成果。研究团队通过引入一种新的深度网络架构 CRATE，验证了当前 AI 系统，包括 GPT-4，在压缩数据方面的操作。与传统的黑盒 Transformer 不同，CRATE 是一种白盒 Transformer，不仅在各项任务上表现出色，而且...

AI工具箱3年前

北京大学发布新一代模型，领跑搞笑抖音视频AI识别笑点技术，已开源

<img src=""> AIGC动态欢迎您的阅读原文标题：北大视频大模型新的SOTA，搞笑抖音视频AI秒懂笑点｜开源关键词：报告、视觉、视频、编码器、表示文章来源：量子位内容字数：3357字文章摘要：本文介绍了北大团队开发的视觉语言大模型Video-LLa...

AI工具箱3年前

北大和腾讯联手打造多模态15边形战士：语言纽带，跨越互联之界

北大&腾讯合作打造多模态15边形战士近日，北大联合腾讯共同打造了一个多模态15边形战士，该项目以语言为核心，通过引入“LanguageBind”多模态预训练框架，实现了语言与视频、音频、深度、红外理解等多模态数据的有效对接。具体而言，研究人员使用语言作为各模态之间的纽带，通过固定语言编码器...

AI工具箱3年前

苹果携手UIUC发布SAM-CLIP统一视觉模型，引领多模态新风尚

AIGC动态欢迎阅读原标题：苹果联合UIUC发布统一视觉模型SAM-CLIP关键词：模型, 语义, 能力, 编码器, 图像文章来源：夕小瑶科技说内容字数：4748字内容摘要：夕小瑶科技说原创作者 | ZenMoore相信大家对SAM并不陌生，它是Meta此前发布的“Segment Anything...

AI工具箱3年前

AI技术解锁大脑思维，读心术让机器猜得准吗？

AI技术解读大脑思维本文原标题：读心术！AI技术解锁大脑思维，你想什么它都知道关键词：解读,大脑,图像,技术,编码器本文来源：AI范儿文章总字数：2218字文章摘要：本文介绍了Meta公司最新的AI系统，利用磁脑电图技术实时解读大脑中的视觉信息，为医学和人工智能领域带来了重大突破。虽然技术精确度有待...

AI工具箱3年前

谷歌发布5B参数的视觉语言模型PaLI-3，更小、更快、更强

AIGC动态欢迎阅读原标题：谷歌视觉语言模型PaLI-3问世，参数仅5B，更小、更快、更强关键字：模型,编码器,图像,报告,文本文章来源：机器之心内容字数：7142字内容摘要：在多模态（视觉语言）大模型领域，拼参数赢性能的同时，追求参数更小、速度更快、性能更强是另一条研究路径。视觉语言模型（VLM）...

AI工具箱3年前