语言

共 106 篇文章

ChatGPT 胜过 Gemini:CMU 最新研究揭示,谷歌仍有提升空间

本文介绍了一项由美国卡内基梅隆大学进行的研究,深入探讨了谷歌Gemini与OpenAI的ChatGPT在语言理解和生成能力方面的比较。研究结果显示,Gemini的综合性能仍然落后于ChatGPT。文章提供了谷歌Gemini和OpenAI GPT模型的能力比较,以及它们各自的优势领域。如果您需要了解更...
ChatGPT 胜过 Gemini:CMU 最新研究揭示,谷歌仍有提升空间

谷歌Gemini:CMU全面评测揭秘,Gemini Pro对抗GPT 3.5 Turbo。

本文介绍了对谷歌Gemini模型的全面测评,该模型与OpenAI的GPT模型进行了比较。文章指出,Gemini具有三个版本:Ultra、Pro和Nano。研究团队的测试结果显示,Ultra版本在多个任务中优于GPT4,而Pro版本与GPT-3.5持平。然而,由于缺乏详细的评估细节和模型预测,这些结果...
谷歌Gemini:CMU全面评测揭秘,Gemini Pro对抗GPT 3.5 Turbo。

谷歌发布全新零样本视频生成模型,效果惊艳超越传统扩散模型?

AIGC动态欢迎阅读原标题:谷歌重磅发布零样本视频生成模型!效果惊艳,赶超扩散模型?关键字:视频、模型、文本、图像、语言文章来源:夕小瑶科技说内容字数:1739字夕小瑶科技说原创作者:王二狗今日,谷歌AI发布了最新的视频生成模型VideoPoet。VideoPoet不采用常见的扩散模型架构,实质上是...
谷歌发布全新零样本视频生成模型,效果惊艳超越传统扩散模型?

李航:探讨大型语言模型的思考与观点

这篇文章来源于人工智能学家专栏,作者是字节跳动研究负责人李航。他在文中阐述了对大型语言模型(LLM)的看法,包括LLM的突破之处以及开发过程中需要考虑的因素。LLM融合了实现人工智能的三个路径,具有生成心智语言的能力,但在逻辑推理方面仍然有待加强。文章强调了LLM所采用的Transformer模型的...
李航:探讨大型语言模型的思考与观点

清华大学验证大型语言模型在狼人杀游戏中复杂交流博弈的能力

本文介绍了清华大学研究团队提出的一种用于交流游戏的框架,展示了大语言模型在经验中学习的能力,并发现大语言模型具有非预编程的策略行为。他们发现,大语言模型在玩狼人杀等游戏时表现出信任、对抗、伪装和领导等策略,这为进一步研究大语言模型在交流游戏中的表现提供了新的视角。与此同时,文章还提供了原文链接以及作...
清华大学验证大型语言模型在狼人杀游戏中复杂交流博弈的能力

清华大学发布ViLa研究:GPT-4V在机器人视觉规划中的潜力揭秘

对于机器人系统来说,底层指令可能是精确的关节或轮速控制。相比之下,高级语言指令可能是描述一个任务或目标,比如“将蓝色的盘子放在桌子上”。这种高级语言指令更接近人类日常语言,易于理解,而不需要详细规定每个具体的动作。因此,使用高级语言指令有助于提高系统的可理解性和用户友好性。当前,关于视觉语言模型(V...
清华大学发布ViLa研究:GPT-4V在机器人视觉规划中的潜力揭秘

微软发布LLMLingua大模型压缩框架,压缩比高达20倍

AIGC动态欢迎阅读近期,关于大型语言模型(LLM)在实际应用中推理和生成能力的研究日益增多。随着诸如ChatGPT等模型的广泛应用和研究,如何在保留关键信息的同时压缩较长的提示成为当前大模型研究的一个关键问题。微软提出了一种名为LLMLingua的提示压缩框架,旨在加速模型推理过程并降低成本。该方...
微软发布LLMLingua大模型压缩框架,压缩比高达20倍

华科大 & 上科大研发出解决GPT-4V难题的未来推理方法

欢迎阅读AIGC动态原文标题:GPT-4V无法理解的未来推理现在有解决方案了!华中科技大学和上海科技大学联合研究关键词:模型、轨迹、能力、语言、主体引用自:量子位字数:总计8005字摘要:由于当前最强大的GPT-4V等模型仍然难以基于当前信息进行未来推理,华中科技大学和上海科技大学的研究团队提出了新...
华科大 & 上科大研发出解决GPT-4V难题的未来推理方法

DeepMind提出代码链方法,通过“代码思考”优化推理性能

<img src="" /> 深度学习动态:DeepMind提出代码链,通过“代码思考”改进推理性能 本文内容来源于夕小瑶科技说,是由智商掉了一地撰写的原创文章。在未来,想要精准控制机器人可能需要更智能、能够理解复杂推理的方法来执行指令。最近,谷歌DeepMind提出...
DeepMind提出代码链方法,通过“代码思考”优化推理性能

下一代自动驾驶系统所需的大模型调研结果揭晓

欢迎阅读AIGC动态 原文标题:下一代自动驾驶系统不可或缺的大型模型——系统调研终结篇 关键词:腾讯,模型,语言,报告,车辆 文章来源:机器之心 字数:7822字 内容摘要:本文详细介绍了将多模态大型语言模型(MLLMs)融入下一代自动驾驶系统的模式。随着大型语言模型(LLM)和视觉基础模型(VFM...
下一代自动驾驶系统所需的大模型调研结果揭晓

大语言模型:冷冰冰的「学人精」

标题:AIGC动态欢迎阅读 近日,一篇来自大数据文摘的文章引起了广泛关注。这篇文章转载自HyperAI超神经,作者是李宝珠,编辑为三羊ChatGPT。文章探讨了大语言模型在当前AI发展中的角色和挑战。随着大型语言模型如ChatGPT的崛起,其过度拟人化的表现引发了人们的关注。曾有前Google工程师...
大语言模型:冷冰冰的「学人精」

北大清华合作发布「创造性任务」新标准:Creative Agents激发想象力!

本文介绍了北大清华联手发布的首个“创造式任务”基准——Creative Agents,该模型旨在帮助实现创造性任务。近年来,许多研究致力于训练能够理解自然语言指令的智能体,使其能够解决各种开放性任务。然而,现有的模型往往只能执行清晰明确的任务,缺乏对任务的创造性表达和解决高度抽象任务的能力。例如,在...
北大清华合作发布「创造性任务」新标准:Creative Agents激发想象力!

微软发布能击败Llama 2 70B的「小语言模型」,借助96块A100训练出Phi-2在14天内超越谷歌Gemini nano

本文来自新智元,介绍了微软发布的参数为2.7B的Phi-2模型,这一小语言模型在性能上几乎超越了所有13B以下的大型模型,包括谷歌最新发布的Gemini Nano 2。通过模型扩展和训练数据管理方面的创新,Phi-2展现了卓越的推理和语言理解能力。在复杂基准测试中,Phi-2的性能可以与自身25倍大...
微软发布能击败Llama 2 70B的「小语言模型」,借助96块A100训练出Phi-2在14天内超越谷歌Gemini nano

微软小模型挑战27亿参数大模型,手机也能轻松运行

本文介绍了微软最新研发的小尺寸模型Phi-2,该模型仅有27亿参数,但在常识推理、语言理解和逻辑推理方面表现出色。微软CEO纳德拉在最近的Ignite大会上宣布Phi-2将完全开源,并且公布了更多有关Phi-2模型以及全新提示技术promptbase的细节。这个小尺寸模型在多个任务上胜过了其他大模型...
微软小模型挑战27亿参数大模型,手机也能轻松运行

大自然证实:大型语言模型只是没有情感的“学人精”

《AIGC动态》欢迎阅读 原文标题:《Nature》确认:大型语言模型仅是没有情感的“学人精” 关键词:模型,语言,解释,角色,角色扮演 文章来源:HyperAI超神经 字数:7573字 内容摘要:作者:李宝珠 编辑:三羊DeepMind、EleutherAI 科学家们提出,大型模型只是在扮演角色。...
大自然证实:大型语言模型只是没有情感的“学人精”

OpenAI证实:ChatGPT会在不同季节表现懒惰

《AIGC动态欢迎阅读》 最近,有关ChatGPT-4在用户使用过程中表现出“懒散”特征的报道引发了OpenAI的关注。 这一现象与日期相关,暗示着“寒假假设”可能影响了模型的表现。 AI研究者正在积极寻找解释和解决这一现象的方法。 一些用户自11月下旬以来观察到ChatGPT-4在执行任务时出现拒...
OpenAI证实:ChatGPT会在不同季节表现懒惰

GPT-4V作为机器人大脑,你可能都不需要AI进行规划

本文介绍了清华大学交叉信息研究院的研究者提出的「ViLa」(全称Robotic Vision-Language Planning)算法,该算法能在复杂环境中控制机器人,实现任务规划。文章指出,虽然GPT-4V已经能够设计网站代码并控制浏览器等虚拟数字世界应用,但如果将其应用于控制机器人,可能会产生一...
GPT-4V作为机器人大脑,你可能都不需要AI进行规划

MetaAI推出全新语音翻译大模型Seamless,突破AI无缝同声传译技术

AIGC动态欢迎阅读原标题:MetaAI语音翻译大模型Seamless登场,主打AI无缝同声传译关键词:语音、模型、语言、任务、水印文章来源:大数据文摘内容字数:6277字内容摘要:本文授权转载自将门创投作者seven_。最近,MetaAI的研究团队发布了一套全流程的语音翻译大模型——Seamles...
MetaAI推出全新语音翻译大模型Seamless,突破AI无缝同声传译技术

马斯克xAI疑似使用ChatGPT数据进行训练

AIGC动态欢迎阅读 本文原标题为:马斯克旗下的xAI公司涉嫌使用ChatGPT数据进行训练。 涉及关键词:政策、模型、数据、语言、表述。 文章来源于AI范儿。 文章内容共计2858字。 文章摘要:Elon Musk旗下的xAI公司最新推出的语言模型Grok因其行为与OpenAI的ChatGPT相似...
马斯克xAI疑似使用ChatGPT数据进行训练

Meta AI 引领新技术:3D环境中模拟人类行为,精准交互,计算机图形学迎来新变革!

AIGC动态欢迎阅读 原标题:Meta AI新交互模型引发热议:能够在3D环境中连续模拟人类行为,实现精准交互,计算机图形学或将迎来新的突破? 关键词:物体、系统、人类、语言、人机 文章来源:AI前线 内容字数:6786字 内容摘要:冬梅、核子可乐整理。CHOIS是一套先进的人工智能系统,旨在合成逼...
Meta AI 引领新技术:3D环境中模拟人类行为,精准交互,计算机图形学迎来新变革!

EMNLP 2023年度最佳论文揭晓!

AIGC动态欢迎阅读 以下内容为夕小瑶科技说原创作者小戏、王二狗关于EMNLP 2023最佳论文揭晓的报道: 昨日,EMNLP 2023大会在新加坡圆满落幕,揭晓了最佳长论文、最佳短论文、杰出论文等奖项。其中,北大微信团队斩获最佳长论文奖,剑桥大学荣获最佳短论文奖,多支团队摘得杰出论文奖,而艾伦人工...
EMNLP 2023年度最佳论文揭晓!

OpenAI Q* 谣言怎么回事?

本文介绍了针对OpenAI Q谣言的看法和探讨,文章来源于AI前线。尽管OpenAI尚未明确解释Q究竟是什么,但已透露了不少线索。报道称OpenAI取得了一项重大技术突破,开发出更强大的AI模型,命名为Q,拥有解决全新数学问题的能力。这一突破发生在OpenAI解雇(后又重新聘用)CEO Sam Al...
OpenAI Q* 谣言怎么回事?

Jason Wei 探讨大型模型的六大思维观念

本文介绍了AIGC动态欢迎阅读的内容,其中包括来自机器之心的一篇关于大模型的文章。作者为Jason Wei,分享了他对大型语言模型的一些直观认识。Jason Wei曾领导过指令调优工作,并和其他人合作撰写了有关大型模型的论文。目前他正在OpenAI参与ChatGPT的开发。 在最近的一次斯坦福CS ...
Jason Wei 探讨大型模型的六大思维观念

澜码科技创始人周健:数字化专家知识是AI Agent成功落地的关键|甲子引力

本文来自甲子光年,介绍了澜码科技创始人、CEO周健关于专家知识数字化对AI Agent落地的重要性的观点。周健指出,AI Agent的出现将改变人机交互方式,而专家知识是AI Agent成功落地的关键条件之一。专家知识通过数字化和标注不断丰富和完善,进而形成一个知识闭环,系统可以通过专家的反馈持续学...
澜码科技创始人周健:数字化专家知识是AI Agent成功落地的关键|甲子引力

OpenAI科学家Andrej Karpathy推荐:23年来必读的大语言模型论文清单

阅读内容介绍了OpenAI科学家Andrej Karpathy推荐的23篇必读大语言模型论文清单。Andrej在一段视频中详细介绍了语言模型的训练和应用,以及未来的研究方向和概念。视频由oxen.ai整理了相关阅读清单,以帮助观众更好地理解视频内容。建议观看视频后再查看阅读清单,以充分了解Andre...
OpenAI科学家Andrej Karpathy推荐:23年来必读的大语言模型论文清单

Meta谷歌跨语种AI同传技术惊艳亮相,革新语音翻译领域

AI动态:Meta和谷歌重大突破,颠覆语音翻译领域 原文标题:跨语言「AI同传」震撼登场!Meta和谷歌取得重要进展,颠覆语音翻译 关键词:语音识别,语言翻译,编码器,模型,解码器 文章来源:新智元 字数:7071字 摘要:新智元编辑报导:好困【导读】Meta和谷歌相继发布重要成果!Meta公布开源...
Meta谷歌跨语种AI同传技术惊艳亮相,革新语音翻译领域

人工智能基础创新迎来第二波增长浪潮

<img src=""> AIGC动态欢迎阅读 本文原题为:“人工智能基础创新的第二增长曲线”,关键词包括模型、人工智能、基础、语言、架构。文章来源于《人工智能学家》,全文共计11898字。文章由微软亚洲研究院的韦福如撰写。2023年标志着微软亚洲研究院成立25周年,...
人工智能基础创新迎来第二波增长浪潮

微软亚洲研究院韦福如谈人工智能基础创新的第二增长曲线

本篇文章来自机器之心专栏作者韦福如,他是微软亚洲研究院全球研究合伙人。文章探讨了人工智能基础创新的发展趋势,特别是在人工智能模型、语言架构等领域的突破和创新。文章指出,虽然像GPT系列模型等大型模型在人工智能应用中发挥着重要作用,但科研人员并不满足于此,他们正在努力寻找新的突破点。文章提到了Tran...
微软亚洲研究院韦福如谈人工智能基础创新的第二增长曲线

普渡大学发布最新《自动驾驶领域多模态大型语言模型》综述

AIGC动态欢迎阅读 这篇来自人工智能学家的文章介绍了最新的《自动驾驶领域多模态大型语言模型》综述,探讨了大型语言模型(LLMs)在自动驾驶和地图系统中的潜在应用。该综述指出,利用大型模型的多模态AI系统有望像人类一样感知现实世界、做出决策和控制工具。虽然在自动驾驶领域展示出广泛关注,但对LLMs在...
普渡大学发布最新《自动驾驶领域多模态大型语言模型》综述

硅谷疯狂一周:OpenAI 宫斗中的最终胜利者非阿尔特曼

本文讨论了硅谷近期的动态,特别聚焦于OpenAI公司内部的变化。微软在这一过程中表现出色,成功地掌握了局势,其CEO萨蒂亚·纳德拉的果断决策和灵活应对备受赞誉。在OpenAI首届开发者大会上,微软与OpenAI的合作备受瞩目。纳德拉的出现赋予了此次合作更多商业意义,也让合作达到了双赢的效果。文章还提...
硅谷疯狂一周:OpenAI 宫斗中的最终胜利者非阿尔特曼

Andrej Karpathy发布详细说明大型语言模型(视频提供中英文字幕)

本文介绍了计算机科学领域的杰出学者Andrej Karpathy博士发布的关于大型语言模型的视频概述。Karpathy博士在人工智能和深度学习领域具有较高的声誉,在OpenAI担任研究主管一职,为LLMs的发展做出了重要贡献。视频中,他详细介绍了LLMs的核心概念,包括推理、训练、梦境以及工作原理,...
Andrej Karpathy发布详细说明大型语言模型(视频提供中英文字幕)

大型模型初探指南

本文介绍了大模型在深度学习领域的重要性和应用。近年来,随着计算机技术和大数据的快速发展,深度学习在自然语言处理、图片生成和工业数字化等领域取得了显著成果。研究者们为了提高模型性能,不断尝试增加模型参数数量,从而促使大模型概念的形成。 大模型是指具有数千万甚至数亿参数的深度学习模型。文章重点介绍了大模...
大型模型初探指南

大型双面人:虚假新闻制造机对抗假新闻鉴别大师

这篇文章讨论了大型语言模型在制造虚假信息方面的潜力。研究团队选取了10种不同的大语言模型,通过使用20种虚假信息叙事来评估它们的性能。这些叙事涵盖了COVID-19、俄乌战争、健康、美国和区域性话题等五个类别。研究结果显示,这些大语言模型能够制造出令人信服的虚假新闻。 原文链接:大模型变身双面人:虚...
大型双面人:虚假新闻制造机对抗假新闻鉴别大师
1 2 3