Meta震撼发布！Omnilingual ASR技术助力AI“听见”1600种语言，小语种也不再沉默！

6个月前发布aiba

摘要：

Meta推出的Omnilingual ASR系统打破了语言技术的“精英垄断”，实现了对1600种语言的高精度语音识别，采用“上下文学习”机制，使AI能通过少量音频样本迅速掌握新语言。该系统的词错率在78%的语种中低于10%，覆盖了长期被忽视的小语种和濒危语言，展现了技术的普惠潜力。Meta与语言保护组织合作，确保文化语境的真实还原，标志着语言平权的数字革命，推动了技术与文化的融合，展望一个包容多元的未来。

Meta震撼发布！Omnilingual ASR技术助力AI“听见”1600种语言，小语种也不再沉默！的封面图

打破语言壁垒，迎接数字平权的新时代

在全球7000多种语言中，超过95%的语言长期以来被人工智能语音技术所忽视。然而，Meta最近推出的Omnilingual ASR（自动语音识别）系统，成功打破了语言技术的“精英垄断”，首次实现了对1600种语言的高精度语音识别，并引入了革命性的“上下文学习”机制。只需几段音频样本，AI便能够迅速掌握一门全新的语言。这一开源系统不仅在技术上处于领先地位，更承载着数字平权的使命，让濒危语言和小语种社区在AI时代首次获得了应有的关注与支持。

小语种不再“失声”

在传统语音技术主要集中于英语、中文、西班牙语等主流语言时，Omnilingual ASR将目光投向了全球边缘语言群体。测试显示，在其支持的1600种语言中，78%的语种的词错率（WER）低于10%，即便在数据极度稀缺的小语种中，依然有36%的语言实现了低于10%的错误率。这一成就远超此前任何多语言ASR系统，真正让“可用语音技术”覆盖到非洲部落、南美原住民、东南亚少数民族等长期被忽视的群体，展现了技术带来的希望与可能。

几段音频，教会AI一门新语言

Omnilingual ASR的核心突破在于其上下文少样本学习能力。用户只需提供少量带标注的音频-文本对（如3–5句），系统便能通过元学习机制迅速适配新语种，无需海量数据或复杂的训练流程。这一设计使得模型理论支持语言的数量跃升至5400种以上，几乎涵盖所有拥有文字记录的语言，为全球语言多样性的保护提供了坚实的技术基础。

开源与社区共建，尊重每一种文化声音

Meta并未将这一技术封闭在实验室中，而是开放了模型与工具链，并与全球数十个语言保护组织及本土社区共同采集语音数据，确保发音、语调与文化语境的真实还原。在巴布亚新几内亚，当地居民正在利用该系统录制祖辈的口述历史；在喜马拉雅山区，僧侣们也开始将经文语音数字化——AI不再是外来工具，而是成为文化传承的重要伙伴。

一场语言平权的数字革命

Omnilingual ASR的意义远超其技术指标，它标志着AI从“服务主流”转向“赋能边缘”，从“技术中心主义”走向“文化包容主义”。当一名使用仅有千人母语的孩童也能通过语音与数字世界对话时，技术才真正实现了其普惠价值。

aidh认为，Meta的这一举措不仅巩固了其在多模态AI领域的领导地位，更重新定义了科技公司的社会责任——真正的创新，是让最微弱的声音也能被听见。在消除语言鸿沟的进程中，Omnilingual ASR或许正是那个让世界“众声喧哗”的开端。通过这一技术，我们有望迎来一个更加包容和多元的未来，让每一种文化和声音都能在数字时代绽放光芒。

文章版权归作者所有，未经允许请勿转载。

本文地址：https://www.aidh.net/kuaixun/20174.html