语音

共 24 篇文章

MetaAI推出全新语音翻译大模型Seamless,突破AI无缝同声传译技术

AIGC动态欢迎阅读原标题:MetaAI语音翻译大模型Seamless登场,主打AI无缝同声传译关键词:语音、模型、语言、任务、水印文章来源:大数据文摘内容字数:6277字内容摘要:本文授权转载自将门创投作者seven_。最近,MetaAI的研究团队发布了一套全流程的语音翻译大模型——Seamles...
MetaAI推出全新语音翻译大模型Seamless,突破AI无缝同声传译技术

Meta谷歌跨语种AI同传技术惊艳亮相,革新语音翻译领域

AI动态:Meta和谷歌重大突破,颠覆语音翻译领域 原文标题:跨语言「AI同传」震撼登场!Meta和谷歌取得重要进展,颠覆语音翻译 关键词:语音识别,语言翻译,编码器,模型,解码器 文章来源:新智元 字数:7071字 摘要:新智元编辑报导:好困【导读】Meta和谷歌相继发布重要成果!Meta公布开源...
Meta谷歌跨语种AI同传技术惊艳亮相,革新语音翻译领域

照片生成视频:张嘴、点头、喜怒哀乐,打字控制

AIGC动态欢迎您的阅读。原文标题是:一张照片生成视频,张嘴、点头、喜怒哀乐,都可以打字控制。文章来源于机器之心,全文共5733字。最近微软进行的研究展示了一项引人注目的技术:通过一张照片,AI能够生成该照片中人物的视频,并且这些人物的表情和动作都可以通过文字进行控制。例如,用户可以发送“张嘴”的指...
照片生成视频:张嘴、点头、喜怒哀乐,打字控制

AI硬件遭炮轰:谷歌眼镜+寻呼机不能取代手机?

AIGC动态欢迎阅读 本文转载自量子位,原标题为:“就这也想取代手机?爆火全网的AI硬件遭炮轰:谷歌眼镜+寻呼机”。文章内容涉及屏幕、智能手机、语音、硬件、手势等关键词。文章全文5590字,作者为明敏,文章聚焦新型AI设备AI Pin引发的热议。该设备被一些人批评为谷歌眼镜和寻呼机的结合体,不具备屏...
AI硬件遭炮轰:谷歌眼镜+寻呼机不能取代手机?

奥特曼创始人投资,首款AI硬件支持ChatGPT,炸圈榜首!

关于AIGC公司的最新动态 本文原题为:奥特曼投资前苹果员工创立,这家公司首款AI硬件炸圈,支持访问ChatGPT。 要点:报告,设备,美元,智能,语音 文章来源:量子位 字数:3927字 内容摘要:最新推出的AI硬件AI Pin,由曾在苹果工作的创始人创立,融合了ChatGPT技术,具备智能手机的...
奥特曼创始人投资,首款AI硬件支持ChatGPT,炸圈榜首!

AIGC 时代:RTE 的冒险与突破,打造全天候在线玩家

团队对AIGC发展的最新见解原标题:AIGC时代:RTE领域的冒险与突破关键词:实时性、能力、华为、语音、模型文章来源:AI科技评论内容字数:9953字内容摘要:AIGC正在RTE领域引发新一轮风暴。作者:王悦 编辑:陈彩娴。2023年下半年,产品和应用成为GPT讨论的热点。与模型的参数和能力相比,...
AIGC 时代:RTE 的冒险与突破,打造全天候在线玩家

ChatGPT Voice 如何助您掌握一门语言

本文介绍了如何借助ChatGPT Voice这一功能来学习语言。ChatGPT Voice是一种与人工智能进行语音互动的方式,非常高效。iPhone和Android用户都可以通过这一功能与ChatGPT进行语音互动,就像与一名语言导师交流一样。ChatGPT是一款强大的机器人,不仅可以进行文本交流、...
ChatGPT Voice 如何助您掌握一门语言

Clubhouse:连续裁员、疯狂转型,一个快被遗忘的社交平台的生存史

AIGC动态的最新文章原题:回顾连续裁员和快速转型:Clubhouse的兴衰历程关键词:社交平台、用户体验、音频功能、发展方向、行业领袖文章来源:Founder Park字数统计:本文共7938字内容概要:近年来,社交领域不断涌现出各种新应用,它们各具特色、快速吸引用户,但很多最终难以留存。曾经备受...
Clubhouse:连续裁员、疯狂转型,一个快被遗忘的社交平台的生存史

探寻语音 AI 之路:约翰霍普金斯大学 CLSP 群英谱

该文介绍了约翰霍普金斯大学CLSP(Center for Language and Speech Processing)团队在语音AI领域的探索和成就。文章提到了一群有志青年离开学校后,如何利用人工智能技术来改变世界的故事。其中,徐鹏作为其中一员,在接到一通意想不到的电话后,开启了他在CLSP的探索...
探寻语音 AI 之路:约翰霍普金斯大学 CLSP 群英谱

ChatGPT触手可及:当AI“长”出眼睛和嘴,物理世界将何去何从

最新动态:AIGC开始进军物理世界原标题:ChatGPT具备看、听、说的能力,正式进军实体世界关键词:公告、语音、功能、图像、模型文章来源:人工智能学家字数统计:全文6360字内容概述:迈向“贾维斯”的道路。作者:连冉 编辑:靖宇OpenAI最近又有了令人瞩目的动作。时值9月25日当地时间,Open...
ChatGPT触手可及:当AI“长”出眼睛和嘴,物理世界将何去何从

微软MIT联合推出,AI可朗读6万本古腾堡电子书,支持定制化个人声音

关于AIGC的最新动态本文原标题为:微软MIT联合推出AI自动朗读古腾堡计划的6万本电子书,并支持用户根据自己的声音进行定制化关键词:团队、语音、文本、电子书、计划文章来源:新智元全文共计5107字内容摘要:新智元报道编辑:润【新智元导读】微软、MIT等机构利用人工智能技术将古腾堡计划的电子书转录成...
微软MIT联合推出,AI可朗读6万本古腾堡电子书,支持定制化个人声音

多模态大模型: 未来人机交互的发展方向?

AIGC动态欢迎阅读原标题:多模态大模型会是未来人机交互的方向吗?关键字:模型,语音,信息,用户,视觉文章来源:人工智能学家内容字数:21282字内容摘要:目前市面上的交互产品主要以单模式交互为主,尤其是语音交互。语音产品通常是以语音助手的形态呈现。语音交互相较于按键操作,能够提供更为便捷的体验,尤...
多模态大模型: 未来人机交互的发展方向?

ChatGPT新增语音合成和图像识别功能!五种音色选择,模型细节完全公开

这篇文章来自AI导航,介绍了OpenAI发布的新版ChatGPT,其中加入了语音和图像输入功能。以前只能通过文字与ChatGPT交流,现在用户可以像使用语音助手一样,直接说话与ChatGPT对话。此外,新增的图像功能也为用户带来了更便捷的体验。文章指出新功能将在接下来的两周内向Plus和企业版用户推...
ChatGPT新增语音合成和图像识别功能!五种音色选择,模型细节完全公开

OpenAI推出AI语音翻译技术;百度发布量子领域首个大模型;微软或将应用核能供能AI数据中心|AIGC大事日报

欢迎阅读AIGC动态 本文原标题为:OpenAI等公司推出AI语音翻译;百度发布首个量子领域大模型;微软或将采用核电为AI数据中心供能|AIGC大事日报 关键词:模型、量子、华为、功能、语音 文章来源:AI导航 内容字数:8632字 摘要内容:本文报道了2026年9月26日全球AIGC产业的重要新闻...
OpenAI推出AI语音翻译技术;百度发布量子领域首个大模型;微软或将应用核能供能AI数据中心|AIGC大事日报

ChatGPT全新版本发布:多模态功能即将加入!

本文为转载自大数据文摘的文章,标题为"AIGC动态欢迎阅读"。文章介绍了ChatGPT最新的更新,即将推出能够进行语音和图像交互的多模态功能。根据OpenAI在最新的博客中的表示,用户将可以通过语音或图像与ChatGPT交流,不仅仅局限于文本输入。这一新功能将首先在未来两周向付费...
ChatGPT全新版本发布:多模态功能即将加入!

OpenAI宣布多模态ChatGPT开放:看得见、听得懂、会说话

本文来自人工智能学家,介绍了OpenAI发布的多模态ChatGPT功能。这项功能使ChatGPT具备了看、听、说的能力,将在未来两周内向付费用户推送。在GPT-4发布会上,OpenAI总裁Greg Brockman展示了ChatGPT的代码生成能力。想了解更多内容,请访问原文链接:OpenAI官宣开...
OpenAI宣布多模态ChatGPT开放:看得见、听得懂、会说话

ChatGPT多模态升级!语音、文本、图像应有尽有

<img src=""> AIGC动态欢迎您的阅读 原标题:多模态的ChatGPT问世!具备听觉、视觉功能 关键词:语音识别,图像识别,模型更新,功能增强,用户体验 文章来源:创始人公园 文章长度:4584字 摘要:近期,OpenAI 宣布在 ChatGPT 中新增语...
ChatGPT多模态升级!语音、文本、图像应有尽有

李开复倾情参与,国产语音对话大模型发布:中英双语多模态,开源商用

欢迎阅读AIGC动态最新动态标题:“国产语音对话大模型来了:李开复零一万物参与,中英双语多模态,开源可商用”关键词:李白,模型,解读,语音,文本文章来源:量子位文章长度:4028个字文章摘要:最新消息显示,零一万物旗下的大型模型公司01.ai推出了首个支持中英双语的语音对话开源大模型。该模型名为LL...
李开复倾情参与,国产语音对话大模型发布:中英双语多模态,开源商用

BigDL-LLM 助您即刻提速百亿参数LLM推理 | 最潮大模型

<img src=""> AIGC动态欢迎阅读 动态标题:用BigDL-LLM立即加速百亿级参数LLM推理 | 最时尚大模型 关键字:模型,英特尔,语言,代码,语音 文章来源:量子位 内容字数:7919字 内容摘要:由英特尔公司黄晟盛、黄凯、戴金权在量子位公众号 Qb...
BigDL-LLM 助您即刻提速百亿参数LLM推理 | 最潮大模型

格力发布语音解锁手机专利,解决面部识别和屏下指纹识别难题

AI导航 4 月 22 日消息,据国家知识产权局信息显示,格力电器与珠海联云科技有限公司于今日公开了一项名为“语音解锁方法、装置、电子设备及存储介质”的专利,申请公布号为 CN114387968A。 AI导航获悉,该专利摘要显示,相较于面容识别和指纹识别,声纹识别与目标文本识别技术实现相对简易。因此...