研究者

共 49 篇文章

源代码打造无敌小模型,性能媲美ChatGPT和谷歌Gemini

本文节选自机器之心,是关于代码生成人工智能的最新发展的报道。文章介绍了伊利诺伊大学香槟分校(UIUC)张令明老师团队开发的Magicoder,在短短一周内获得了广泛关注并在GitHub上获得了超过1200颗星,同时受到业内大佬的推荐。文章指出,类似Magicoder和OSS-INSTRUCT等开源创...
源代码打造无敌小模型,性能媲美ChatGPT和谷歌Gemini

word2vec经典论文10年前预示了NeurIPS时间检验奖的获得

在机器之心的最新报道中,谈到了 ChatGPT 在 2023 年引爆人工智能热潮,并且有一项研究获得了 NeurIPS 时间检验奖。NeurIPS 全名为神经信息处理系统大会,是全球最著名的人工智能学术会议之一。今年的大会于 12 月 10 日在美国路易斯安那州新奥尔良市开幕,吸引了来自全球的研究者...
word2vec经典论文10年前预示了NeurIPS时间检验奖的获得

EMNLP投稿数量近5000篇,北大、腾讯斩获最佳长论文奖

阅读AIGC动态的最新消息最新标题:EMNLP投稿近5000篇,北大、腾讯荣获最佳长论文奖关键词:腾讯、论文、研究者、上下文、效用文章来源:机器之心文章字数:6821字文章摘要:根据机器之心的报道,本届 EMNLP 大会在投稿数量上取得了新突破,并且整体接收率有所提升。EMNLP 是自然语言处理领域...
EMNLP投稿数量近5000篇,北大、腾讯斩获最佳长论文奖

Human Gaussian开源:基于高斯飘溅技术的高质量3D人体生成新框架

AIGC动态欢迎阅读 人体高斯生成新框架:腾讯等研究者推出开源项目 近日,由香港中文大学、腾讯AI Lab、北京大学、香港大学、南洋理工大学联合开发的基于Gaussian Splatting技术的HumanGaussian开源项目正式发布。这一项目在3D人体生成领域具有重要意义,能够实现高质量的人体...
Human Gaussian开源:基于高斯飘溅技术的高质量3D人体生成新框架

「3D高斯」版分割神器:毫秒级完成、千倍加速

本文介绍了华为和上海交大提出的SAGA,该技术在辐射场中的交互式3D分割任务中表现出色。该技术不仅能够快速实现3D分割,而且还能加速千倍。文章指出,Meta在4月发布了一款AI模型,该成果不仅被很多计算机视觉研究者视为年度论文,而且在ICCV 2023上被提名为最佳论文。该技术实现了2D分割的交互式...
「3D高斯」版分割神器:毫秒级完成、千倍加速

新一代AI架构Mamba:五倍吞吐量,性能全面超越Transformer

最新报道称,新架构Mamba正席卷AI领域,挑战传统Transformer模型。虽然Transformer长期占据AI大模型主导地位,但随着模型规模和序列长度需求的增加,其局限性逐渐显现。特别是在处理较长序列时,Transformer自注意力机制计算量呈平方级增长,效率低下。为弥补这些缺陷,研究者们...
新一代AI架构Mamba:五倍吞吐量,性能全面超越Transformer

梅西、钢铁侠、二次元姐纷纷挑战「科目三」,引发全网模仿狂潮

在最近的一篇机器之心文章中,报道了来自阿里的研究团队提出的一项名为“Animate Anyone”的方法。这种方法只需要一张人物照片,再配合骨骼动画引导,就可以生成动画视频。最近,某舞蹈动作“科目三”在网络上掀起了一阵热潮,许多人模仿其摇花手、半崴不崴的脚步,并配以明快的音乐节奏。如果让人工智能生成...
梅西、钢铁侠、二次元姐纷纷挑战「科目三」,引发全网模仿狂潮

微软发布Orca 2,小模型推理性能超越10倍参数模型,已开源

欢迎阅读AIGC动态 原文标题:微软推出小型模型推理进阶版:Orca 2性能与参数量提升10倍的模型,已公开发布 关键词:模型、研究人员、任务、能力、策略 文章来源:机器之心 字数:7673字 内容摘要:机器之心的报道指出,借助大规模语言模型教授较小规模语言模型进行推理,将事半功倍。诸如GPT-4、...
微软发布Orca 2,小模型推理性能超越10倍参数模型,已开源

ChatGPT大量泄露训练数据,涉及个人信息:DeepMind发现重大漏洞引发争议

此篇文章来自机器之心,是关于ChatGPT在训练过程中泄露个人信息的报道。据DeepMind的研究发现,ChatGPT在被重复训练同一个词时会泄露大量训练数据,引发了一定争议。社交网络上引起了轩然大波,许多人尝试复现这一实验。更多详情可查看原文链接:ChatGPT狂吐训练数据,还带个人信息:Deep...
ChatGPT大量泄露训练数据,涉及个人信息:DeepMind发现重大漏洞引发争议

MeshGPT在Transformer框架下的3D建模变革引起专业建模师热议,网友称其创意无限。

本文介绍了最新的技术变革对3D建模领域的影响。文章指出,通过连续预测下一个三角形网格,计算机已经可以生成3D模型,这种方法在计算机图形学中被广泛应用。与传统的体素或点云表示方法相比,三角形网格提供了更为连贯的表面表示,更易于操作和渲染,被广泛应用于游戏、电影和VR界面等领域。 同时,文章提到以前的研...
MeshGPT在Transformer框架下的3D建模变革引起专业建模师热议,网友称其创意无限。

Transformer简化版发布,网友盛赞:年度论文

AIGC动态欢迎阅读 原标题:简化版Transformer问世,备受网友瞩目 关键词:研究者、速度、模型、深度、参数 文章来源:机器之心 内容字数:8398字 内容摘要:机器之心报道,编辑部对大型模型进行优化。Transformer 架构被认为是近期深度学习领域许多成功案例的核心。构建深度Trans...
Transformer简化版发布,网友盛赞:年度论文

Adobe新方法:A100单个生成3D图像只需30秒

本文介绍了来自Adobe研究院和斯坦福大学等机构的研究者利用基于transformer的3D大型重建模型进行多视图扩散去噪,提出了新颖的3D生成方法DMV3D,并取得了新的SOTA结果的情况。2D扩散模型大大简化了图像内容创作流程,也让2D设计行业发生了变革。随着扩散模型进入3D领域,应用程序中的人...
Adobe新方法:A100单个生成3D图像只需30秒

提升工程进步的必备咒语:让我们逐步审视改进过程

本文介绍了关于自动提示工程的最新发展。大语言模型的使用已经成为许多自然语言处理任务的主要工具,但由于缺乏引导来指导这些模型进行复杂推理,它们的潜力可能没有完全发挥。因此,自动提示工程成为一个新兴的研究领域,尝试解决如何有效指导大语言模型进行自动提示工程的挑战。该领域的一个显著方法是利用大型语言模型本...
提升工程进步的必备咒语:让我们逐步审视改进过程

微软利用GPT-4V将视频转化为文字,让盲人也能轻松理解电影内容,1小时即可完成

欢迎阅读AIGC动态这篇文章原标题为:微软利用GPT-4V解读视频,不仅可以理解电影内容还可为盲人朗读,处理一小时并非难事。文章涉及关键词:视频、研究者、音频、片段、视觉。文章来源于机器之心。文章字数为7381字。文章摘要:机器之心的编辑Panda和陈萍报道,语言能力已经相当成熟的大规模模型正在进军...
微软利用GPT-4V将视频转化为文字,让盲人也能轻松理解电影内容,1小时即可完成

全新超级注意力机制HyperAttention:加速LLM推理速度50%、支持处理长篇上下文

AIGC动态欢迎阅读 原标题:全新近似注意力机制HyperAttention:对长上下文友好、LLM推理提速50% 关键词:矩阵、注意力、算法、研究者、条目 文章来源:机器之心 内容字数:9661字 内容摘要:机器之心报道编辑:大盘鸡。本文介绍了一项近似注意力机制新研究,由耶鲁大学、谷歌研究院等机构...
全新超级注意力机制HyperAttention:加速LLM推理速度50%、支持处理长篇上下文

Octopus:基于视觉的AI模型称霸GTA五星玩家

欢迎阅读AIGC动态原文标题:利用视觉技术打造GTA五星级玩家:Octopus开发进展解读关键词:任务、模型、研究人员、研究报告、视觉技术文献来源:机器之心文章长度:10944字文章摘要:电子游戏如今已成为现实世界的模拟舞台,尤其以《侠盗猎车手》(GTA)为代表。在GTA的虚拟世界里,玩家可以身临其...
Octopus:基于视觉的AI模型称霸GTA五星玩家

南洋理工大学、清华大学发布视觉可编程智能体Octopus:打游戏、做家务全能干 

AIGC动态欢迎阅读 原文题目:大型模型勇闯洛圣都,获封为“GTA五星好市民”!南洋理工大学、清华大学等发布视觉可编程智能体Octopus:擅长玩游戏、做家务等多项任务 关键词:任务、模型、研究人员、报告、视觉 文章来源:新智元 文章字数:16924字 内容摘要:新智元报道编辑:LRS 非常兴奋【新...
南洋理工大学、清华大学发布视觉可编程智能体Octopus:打游戏、做家务全能干 

DeepMind称Transformer模型泛化能力受预训练数据限制,引发质疑

本文报道来自机器之心的一篇关于DeepMind指出Transformer在超出预训练数据范围时无法实现泛化能力的文章。该文章探讨了大语言模型在提供上下文样本的情况下,通过输入生成响应的能力,以及Transformer模型在这一过程中的作用。同时,对于Transformer无法在预训练数据之外实现泛化...
DeepMind称Transformer模型泛化能力受预训练数据限制,引发质疑

Anthropic推出全新大型模型评估标准,你值得拥有

AIGC动态欢迎阅读 原标题:对大型模型评分标准的可靠性进行评估:Anthropic进行重要评估 关键词:模型、评分标准、偏见、研究者、本文 文章来源:机器之心 内容字数:6709字 内容摘要:在大型语言模型(LLM)盛行的今天,评估人工智能系统变得至关重要。在这一评估过程中,研究人员会遇到哪些困难...
Anthropic推出全新大型模型评估标准,你值得拥有

Transformer 升级再造:倒逼创新,真实世界预测 SOTA 新突破

《AIGC动态欢迎阅读》 原标题:重新审视Transformer:倒置更有效,真实世界预测的新SOTA出现了 关键词:序列,时间,研究者,变量,变体 本文来源:机器之心 文章内容共计6185字,机器之心报道编辑指出,Transformer经过反向转变,演变为iTransformer。Transfor...
Transformer 升级再造:倒逼创新,真实世界预测 SOTA 新突破

GPT-4利用「世界模型」,通过错题让LLM学习,推理能力大幅提升

本文介绍了关于GPT-4模型如何通过学习“错误题目”来提升推理能力的研究成果。文章指出,大型语言模型在NLP任务中取得了重大进展,特别是在需要复杂推理的数学问题方面。研究发现,像GPT-4和PaLM-2这样的专有模型在高难度数学任务上表现出色。此外,开源大模型在这方面还有进一步提升的空间。 原始文章...
GPT-4利用「世界模型」,通过错题让LLM学习,推理能力大幅提升

苹果发布新款文生图大模型:套娃式扩散,支持1024×1024分辨率

AIGC动态欢迎阅读原标题:苹果文生图大模型亮相:套娃式扩散,支持1024×1024分辨率关键词:模型、高分辨率、分辨率、研究者、方法文献来源:机器之心字数:4530字内容要点:机器之心的报道编辑杜伟和小舟习惯了稳定扩散,如今又迎来了一个套娃式扩散(Matryoshka)模型,而且这是由苹果公司开发...
苹果发布新款文生图大模型:套娃式扩散,支持1024×1024分辨率

揭秘复杂性理论:50年探索与知识极限

本文是关于复杂性理论的介绍,作者提到了复杂性问题在研究者和算法方面的重要性。2014 年,Marco Carmosino对这个问题做了一系列的研究。这篇文章原始来源于机器之心,旨在分享复杂性理论的最新研究成果。读者可以通过原文链接查看更多详情。如果有任何疑问,可以联系作者微信:almosthuman...
揭秘复杂性理论:50年探索与知识极限

增加「标记」为视觉线索,使GPT-4V更精准、更细致识别微软等品牌

机器之心动态欢迎阅读原标题:微软等通过在视觉提示中加入“标记”让GPT-4V的看更准,分更细关键词:图像、研究者、模型、区域、视觉文章来源:机器之心内容字数:5375字内容摘要:机器之心报道编辑:杜伟、小舟引入了全新的视觉提示方法 SoM(Set-of-Mark),使得OpenAI的多模态大型模型G...
增加「标记」为视觉线索,使GPT-4V更精准、更细致识别微软等品牌

95后学生团队共同打造的国产AI开源社区,解决了大模型复现难、协作难的问题

本文介绍了一支由95后学生团队打造的国产AI开源社区,旨在解决大模型复现和协作难题。随着人工智能技术的快速发展,研究者们面临着论文复现和跨学科协作等挑战,尤其是在大模型时代,开源、复现、协作变得尤为重要但也更加困难。文章内容丰富,对AI领域的发展与挑战进行了详细探讨。如需了解更多信息,请阅读原文:解...
95后学生团队共同打造的国产AI开源社区,解决了大模型复现难、协作难的问题

OpenAI科学家Jason Wei谈顶尖AI研究:探讨卓越与普通研究的分水岭

AIGC动态欢迎阅读原文标题:如何开展顶尖AI研究?OpenAI科学家Jason Wei发表《AI研究思考》演讲,探讨卓越研究与普通研究的区别。关键词:报告、研究者、模型、任务、智能文章来源:人工智能学家字数统计:2270字内容摘要:本文介绍了OpenAI科学家Jason Wei在伯克利的演讲《AI...
OpenAI科学家Jason Wei谈顶尖AI研究:探讨卓越与普通研究的分水岭

参数减半,性能接近谷歌Minerva,又有一个数学大模型开源

AIGC动态的最新资讯 原标题:参数减半,性能接近谷歌Minerva,又一款数学大模型开源 关键词:模型,数学,研究人员,数据,形式 文章来源:机器之心 内容字数:6748字 内容摘要:机器之心报道编辑:大盘鸡、杜伟大模型家族新增一位专门解决数学问题的「新成员」——Llemma。目前,训练于多种文本...
参数减半,性能接近谷歌Minerva,又有一个数学大模型开源

将LLM视作操作系统,它获得无限的「虚拟」上下文,伯克利新作已获1.7k星称赞

欢迎阅读AIGC动态原标题:将LLM视为操作系统,赋予其无限"虚拟"上下文,伯克利的新作已收获1.7k星关键词:上下文,研究者,智能,任务,下文文章来源:机器之心内容字数:6439字内容摘要:机器之心编辑:杜伟、小舟如今,赋予大型语言模型更强大的上下文处理能力是业界极为关注的热点。本文介绍了加州大学...
将LLM视作操作系统,它获得无限的「虚拟」上下文,伯克利新作已获1.7k星称赞

GPT-4无法替代程序员!普林斯顿大学研究:在GitHub上解决编程问题的成功率为0

AI与编程:普林斯顿芝加哥大学研究发现 原文标题:《大型AI模型无法取代程序员!普林斯顿芝加哥大学惊人发现:GPT-4 在GitHub编程问题上的成功率为0 关键词:模型、程序员、问题、任务、研究者 文章来源:新智元 内容字数:9976 字 内容摘要:新智元报道编辑:编辑部【新智元导读】像 Chat...
GPT-4无法替代程序员!普林斯顿大学研究:在GitHub上解决编程问题的成功率为0

MIT等使用GPT-4打破语言、机器人技术壁垒,实现模拟任务向真实世界的迁移

本文介绍了使用GPT-4进行任务生成和迁移的相关内容。机器人领域中,通用机器人策略的实现需要大量的数据,然而在真实世界中收集这些数据是耗时且费力的。尽管模拟环境可以经济地提供不同体量数据的解决方案,但是增加任务多样性仍然面临挑战,特别是对于复杂任务需要大量人力参与。因此,典型的人工模拟基准通常只包含...
MIT等使用GPT-4打破语言、机器人技术壁垒,实现模拟任务向真实世界的迁移

FRESHLLM:紧贴时事,搜索体验提升

AIGC动态欢迎阅读 此文源自机器之心报道,介绍了FRESHLLM在与谷歌搜索竞争活跃程度方面的表现。FRESHLLM紧跟时事,减少幻觉,提供更精准的信息。 关键词:问题、研究者、模型、证据、知识。 文章内容由机器之心撰写,篇幅为7275字。其中提到,LLM编辑部更新了知识,与谷歌搜索展开竞争。目前...
FRESHLLM:紧贴时事,搜索体验提升

降低视觉Transformer计算成本:时间冗余方法惊艳操作

阅读 AIGC 动态欢迎原标题:降低视觉Transformer计算成本:时间冗余策略让人大开眼界关键词:冗余、策略、研究人员、成本、时间文章来源:机器之心内容字数:7495字内容摘要:机器之心编译编辑:Panda W。Transformer 在带动语言领域革新之后,如今正逐步涉足视觉领域,但其高昂的...
降低视觉Transformer计算成本:时间冗余方法惊艳操作

如何选择词表影响语言模型训练?一项顶尖词表选择研究。

本文介绍了一项关于词表选择对语言模型训练影响的研究。研究者使用了不同类型的词表对语言模型进行实验,结果得出了一些有益的结论,可以帮助读者选择适合的词表进行语言模型训练。研究者使用了12个小型语言模型和4个中型语言模型作为实验对象,并对它们在不同词表下的表现进行了比较。文中介绍了实验的基本设计和结果总...
如何选择词表影响语言模型训练?一项顶尖词表选择研究。

LLaMA2上下文扩展至100k:MIT和港中文引入LongLoRA方法

欢迎阅读AIGC动态 原标题:MIT和香港中文学院的研究者开发出了名为LongLoRA的方法,将LLaMA2模型的上下文扩展至100k 关键词:上下文、模型、研究者、长度、长上 文章来源:机器之心 内容字数:6020字 内容摘要:机器之心报道,编辑部成功扩展了大型模型的上下文长度,无需消耗过多计算资...
LLaMA2上下文扩展至100k:MIT和港中文引入LongLoRA方法

七大维度评估大语言模型可信度

欢迎阅读AIGC动态 本文原题为:“如何评估大语言模型是否可信?这里总结了七大维度。” 本文讨论关键词包括:模型、维度、类别、研究者、问题。 文章来源于机器之心。 全文共6813字,主要由刘扬和Kevin Yao撰写。文章主要提出了7个关键维度,用以全面评估大型语言模型的可信度。在实际部署中,“对齐...
七大维度评估大语言模型可信度
1 2