研究者

共 49 篇文章

源代码打造无敌小模型，性能媲美ChatGPT和谷歌Gemini

本文节选自机器之心，是关于代码生成人工智能的最新发展的报道。文章介绍了伊利诺伊大学香槟分校（UIUC）张令明老师团队开发的Magicoder，在短短一周内获得了广泛关注并在GitHub上获得了超过1200颗星，同时受到业内大佬的推荐。文章指出，类似Magicoder和OSS-INSTRUCT等开源创...

AI工具箱3年前

源代码打造无敌小模型，性能媲美ChatGPT和谷歌Gemini

word2vec经典论文10年前预示了NeurIPS时间检验奖的获得

在机器之心的最新报道中，谈到了 ChatGPT 在 2023 年引爆人工智能热潮，并且有一项研究获得了 NeurIPS 时间检验奖。NeurIPS 全名为神经信息处理系统大会，是全球最著名的人工智能学术会议之一。今年的大会于 12 月 10 日在美国路易斯安那州新奥尔良市开幕，吸引了来自全球的研究者...

AI工具箱3年前

word2vec经典论文10年前预示了NeurIPS时间检验奖的获得

EMNLP投稿数量近5000篇，北大、腾讯斩获最佳长论文奖

阅读AIGC动态的最新消息最新标题：EMNLP投稿近5000篇，北大、腾讯荣获最佳长论文奖关键词：腾讯、论文、研究者、上下文、效用文章来源：机器之心文章字数：6821字文章摘要：根据机器之心的报道，本届 EMNLP 大会在投稿数量上取得了新突破，并且整体接收率有所提升。EMNLP 是自然语言处理领域...

AI工具箱3年前

EMNLP投稿数量近5000篇，北大、腾讯斩获最佳长论文奖

Human Gaussian开源：基于高斯飘溅技术的高质量3D人体生成新框架

AIGC动态欢迎阅读人体高斯生成新框架：腾讯等研究者推出开源项目近日，由香港中文大学、腾讯AI Lab、北京大学、香港大学、南洋理工大学联合开发的基于Gaussian Splatting技术的HumanGaussian开源项目正式发布。这一项目在3D人体生成领域具有重要意义，能够实现高质量的人体...

AI工具箱3年前

Human Gaussian开源：基于高斯飘溅技术的高质量3D人体生成新框架

「3D高斯」版分割神器：毫秒级完成、千倍加速

本文介绍了华为和上海交大提出的SAGA，该技术在辐射场中的交互式3D分割任务中表现出色。该技术不仅能够快速实现3D分割，而且还能加速千倍。文章指出，Meta在4月发布了一款AI模型，该成果不仅被很多计算机视觉研究者视为年度论文，而且在ICCV 2023上被提名为最佳论文。该技术实现了2D分割的交互式...

AI工具箱3年前

「3D高斯」版分割神器：毫秒级完成、千倍加速

3个样本、1个提示搞定LLM对齐，提示工程师：全部变得清晰明了

<img src=""/> 欢迎阅读AIGC动态原文标题：微调都不需要了？3个样本、1个提示就能完成LLM对齐，提示工程师：全都回来了关键词：报告, 基础, 模型, 研究者, 样本文章来源：机器之心内容字数：8670字内容摘要：机器之心报道指出，进行LLM对...

AI工具箱3年前

3个样本、1个提示搞定LLM对齐，提示工程师：全部变得清晰明了

新一代AI架构Mamba：五倍吞吐量，性能全面超越Transformer

最新报道称，新架构Mamba正席卷AI领域，挑战传统Transformer模型。虽然Transformer长期占据AI大模型主导地位，但随着模型规模和序列长度需求的增加，其局限性逐渐显现。特别是在处理较长序列时，Transformer自注意力机制计算量呈平方级增长，效率低下。为弥补这些缺陷，研究者们...

AI工具箱3年前

新一代AI架构Mamba：五倍吞吐量，性能全面超越Transformer

CoDi-2引擎：多模态文本、视觉、音频混合生成达到强大水准

<img src=""> AIGC动态-最新动态原标题：多模态生成迈出重要一步：CoDi-2引擎发布主要关键词：模型、图像、研究者、上下文、示例文章来源：机器之心字数统计：本文共5573字文章摘要：近日，研究者发布了CoDi-2引擎，标志着多模态基础模型领域...

AI工具箱3年前

CoDi-2引擎：多模态文本、视觉、音频混合生成达到强大水准

梅西、钢铁侠、二次元姐纷纷挑战「科目三」，引发全网模仿狂潮

在最近的一篇机器之心文章中，报道了来自阿里的研究团队提出的一项名为“Animate Anyone”的方法。这种方法只需要一张人物照片，再配合骨骼动画引导，就可以生成动画视频。最近，某舞蹈动作“科目三”在网络上掀起了一阵热潮，许多人模仿其摇花手、半崴不崴的脚步，并配以明快的音乐节奏。如果让人工智能生成...

AI工具箱3年前

梅西、钢铁侠、二次元姐纷纷挑战「科目三」，引发全网模仿狂潮

微软发布Orca 2，小模型推理性能超越10倍参数模型，已开源

欢迎阅读AIGC动态原文标题：微软推出小型模型推理进阶版：Orca 2性能与参数量提升10倍的模型，已公开发布关键词：模型、研究人员、任务、能力、策略文章来源：机器之心字数：7673字内容摘要：机器之心的报道指出，借助大规模语言模型教授较小规模语言模型进行推理，将事半功倍。诸如GPT-4、...

AI工具箱3年前

微软发布Orca 2，小模型推理性能超越10倍参数模型，已开源

SDXL Turbo与LCM相继发布，AI画图进入实时生成时代：字打多快，出图就有多快

AIGC动态欢迎阅读本文原标题为：SDXL Turbo、LCM相继发布，AI画图步入实时生成时代：字打多快，出图就有多快。重点关键词：模型、图像、方法、论文、研究者。文章来源：机器之心。文章字数：3691字。文章摘要：机器之心报道指出，机器之心编辑部使用一块 A100 显卡，仅需 200 ...

AI工具箱3年前

SDXL Turbo与LCM相继发布，AI画图进入实时生成时代：字打多快，出图就有多快

ChatGPT大量泄露训练数据，涉及个人信息：DeepMind发现重大漏洞引发争议

此篇文章来自机器之心，是关于ChatGPT在训练过程中泄露个人信息的报道。据DeepMind的研究发现，ChatGPT在被重复训练同一个词时会泄露大量训练数据，引发了一定争议。社交网络上引起了轩然大波，许多人尝试复现这一实验。更多详情可查看原文链接：ChatGPT狂吐训练数据，还带个人信息：Deep...

AI工具箱3年前

ChatGPT大量泄露训练数据，涉及个人信息：DeepMind发现重大漏洞引发争议

MeshGPT在Transformer框架下的3D建模变革引起专业建模师热议，网友称其创意无限。

本文介绍了最新的技术变革对3D建模领域的影响。文章指出，通过连续预测下一个三角形网格，计算机已经可以生成3D模型，这种方法在计算机图形学中被广泛应用。与传统的体素或点云表示方法相比，三角形网格提供了更为连贯的表面表示，更易于操作和渲染，被广泛应用于游戏、电影和VR界面等领域。同时，文章提到以前的研...

AI工具箱3年前

MeshGPT在Transformer框架下的3D建模变革引起专业建模师热议，网友称其创意无限。

Transformer简化版发布，网友盛赞：年度论文

AIGC动态欢迎阅读原标题：简化版Transformer问世，备受网友瞩目关键词：研究者、速度、模型、深度、参数文章来源：机器之心内容字数：8398字内容摘要：机器之心报道，编辑部对大型模型进行优化。Transformer 架构被认为是近期深度学习领域许多成功案例的核心。构建深度Trans...

AI工具箱3年前

Transformer简化版发布，网友盛赞：年度论文

Adobe新方法：A100单个生成3D图像只需30秒

本文介绍了来自Adobe研究院和斯坦福大学等机构的研究者利用基于transformer的3D大型重建模型进行多视图扩散去噪，提出了新颖的3D生成方法DMV3D，并取得了新的SOTA结果的情况。2D扩散模型大大简化了图像内容创作流程，也让2D设计行业发生了变革。随着扩散模型进入3D领域，应用程序中的人...

AI工具箱3年前

Adobe新方法：A100单个生成3D图像只需30秒

提升工程进步的必备咒语：让我们逐步审视改进过程

本文介绍了关于自动提示工程的最新发展。大语言模型的使用已经成为许多自然语言处理任务的主要工具，但由于缺乏引导来指导这些模型进行复杂推理，它们的潜力可能没有完全发挥。因此，自动提示工程成为一个新兴的研究领域，尝试解决如何有效指导大语言模型进行自动提示工程的挑战。该领域的一个显著方法是利用大型语言模型本...

AI工具箱3年前

提升工程进步的必备咒语：让我们逐步审视改进过程

微软利用GPT-4V将视频转化为文字，让盲人也能轻松理解电影内容，1小时即可完成

欢迎阅读AIGC动态这篇文章原标题为：微软利用GPT-4V解读视频，不仅可以理解电影内容还可为盲人朗读，处理一小时并非难事。文章涉及关键词：视频、研究者、音频、片段、视觉。文章来源于机器之心。文章字数为7381字。文章摘要：机器之心的编辑Panda和陈萍报道，语言能力已经相当成熟的大规模模型正在进军...

AI工具箱3年前

微软利用GPT-4V将视频转化为文字，让盲人也能轻松理解电影内容，1小时即可完成

全新超级注意力机制HyperAttention：加速LLM推理速度50%、支持处理长篇上下文

AIGC动态欢迎阅读原标题：全新近似注意力机制HyperAttention：对长上下文友好、LLM推理提速50% 关键词：矩阵、注意力、算法、研究者、条目文章来源：机器之心内容字数：9661字内容摘要：机器之心报道编辑：大盘鸡。本文介绍了一项近似注意力机制新研究，由耶鲁大学、谷歌研究院等机构...

AI工具箱3年前

全新超级注意力机制HyperAttention：加速LLM推理速度50%、支持处理长篇上下文

Octopus：基于视觉的AI模型称霸GTA五星玩家

欢迎阅读AIGC动态原文标题：利用视觉技术打造GTA五星级玩家：Octopus开发进展解读关键词：任务、模型、研究人员、研究报告、视觉技术文献来源：机器之心文章长度：10944字文章摘要：电子游戏如今已成为现实世界的模拟舞台，尤其以《侠盗猎车手》（GTA）为代表。在GTA的虚拟世界里，玩家可以身临其...

AI工具箱3年前

Octopus：基于视觉的AI模型称霸GTA五星玩家

南洋理工大学、清华大学发布视觉可编程智能体Octopus：打游戏、做家务全能干　

AIGC动态欢迎阅读原文题目：大型模型勇闯洛圣都，获封为“GTA五星好市民”！南洋理工大学、清华大学等发布视觉可编程智能体Octopus：擅长玩游戏、做家务等多项任务关键词：任务、模型、研究人员、报告、视觉文章来源：新智元文章字数：16924字内容摘要：新智元报道编辑：LRS 非常兴奋【新...

AI工具箱3年前

南洋理工大学、清华大学发布视觉可编程智能体Octopus：打游戏、做家务全能干

DeepMind称Transformer模型泛化能力受预训练数据限制，引发质疑

本文报道来自机器之心的一篇关于DeepMind指出Transformer在超出预训练数据范围时无法实现泛化能力的文章。该文章探讨了大语言模型在提供上下文样本的情况下，通过输入生成响应的能力，以及Transformer模型在这一过程中的作用。同时，对于Transformer无法在预训练数据之外实现泛化...

AI工具箱3年前

DeepMind称Transformer模型泛化能力受预训练数据限制，引发质疑

Anthropic推出全新大型模型评估标准，你值得拥有

AIGC动态欢迎阅读原标题：对大型模型评分标准的可靠性进行评估：Anthropic进行重要评估关键词：模型、评分标准、偏见、研究者、本文文章来源：机器之心内容字数：6709字内容摘要：在大型语言模型（LLM）盛行的今天，评估人工智能系统变得至关重要。在这一评估过程中，研究人员会遇到哪些困难...

AI工具箱3年前

Anthropic推出全新大型模型评估标准，你值得拥有

Transformer 升级再造：倒逼创新，真实世界预测 SOTA 新突破

《AIGC动态欢迎阅读》原标题：重新审视Transformer：倒置更有效，真实世界预测的新SOTA出现了关键词：序列，时间，研究者，变量，变体本文来源：机器之心文章内容共计6185字，机器之心报道编辑指出，Transformer经过反向转变，演变为iTransformer。Transfor...

AI工具箱3年前

Transformer 升级再造：倒逼创新，真实世界预测 SOTA 新突破

GPT-4利用「世界模型」，通过错题让LLM学习，推理能力大幅提升

本文介绍了关于GPT-4模型如何通过学习“错误题目”来提升推理能力的研究成果。文章指出，大型语言模型在NLP任务中取得了重大进展，特别是在需要复杂推理的数学问题方面。研究发现，像GPT-4和PaLM-2这样的专有模型在高难度数学任务上表现出色。此外，开源大模型在这方面还有进一步提升的空间。原始文章...

AI工具箱3年前

GPT-4利用「世界模型」，通过错题让LLM学习，推理能力大幅提升

苹果发布新款文生图大模型：套娃式扩散，支持1024×1024分辨率

AIGC动态欢迎阅读原标题：苹果文生图大模型亮相：套娃式扩散，支持1024×1024分辨率关键词：模型、高分辨率、分辨率、研究者、方法文献来源：机器之心字数：4530字内容要点：机器之心的报道编辑杜伟和小舟习惯了稳定扩散，如今又迎来了一个套娃式扩散（Matryoshka）模型，而且这是由苹果公司开发...

AI工具箱3年前

苹果发布新款文生图大模型：套娃式扩散，支持1024×1024分辨率

揭秘复杂性理论：50年探索与知识极限

本文是关于复杂性理论的介绍，作者提到了复杂性问题在研究者和算法方面的重要性。2014 年，Marco Carmosino对这个问题做了一系列的研究。这篇文章原始来源于机器之心，旨在分享复杂性理论的最新研究成果。读者可以通过原文链接查看更多详情。如果有任何疑问，可以联系作者微信：almosthuman...

AI工具箱3年前

揭秘复杂性理论：50年探索与知识极限

增加「标记」为视觉线索，使GPT-4V更精准、更细致识别微软等品牌

机器之心动态欢迎阅读原标题：微软等通过在视觉提示中加入“标记”让GPT-4V的看更准，分更细关键词：图像、研究者、模型、区域、视觉文章来源：机器之心内容字数：5375字内容摘要：机器之心报道编辑：杜伟、小舟引入了全新的视觉提示方法 SoM（Set-of-Mark），使得OpenAI的多模态大型模型G...

AI工具箱3年前

增加「标记」为视觉线索，使GPT-4V更精准、更细致识别微软等品牌

95后学生团队共同打造的国产AI开源社区，解决了大模型复现难、协作难的问题

本文介绍了一支由95后学生团队打造的国产AI开源社区，旨在解决大模型复现和协作难题。随着人工智能技术的快速发展，研究者们面临着论文复现和跨学科协作等挑战，尤其是在大模型时代，开源、复现、协作变得尤为重要但也更加困难。文章内容丰富，对AI领域的发展与挑战进行了详细探讨。如需了解更多信息，请阅读原文：解...

AI工具箱3年前

95后学生团队共同打造的国产AI开源社区，解决了大模型复现难、协作难的问题

OpenAI科学家Jason Wei谈顶尖AI研究：探讨卓越与普通研究的分水岭

AIGC动态欢迎阅读原文标题：如何开展顶尖AI研究？OpenAI科学家Jason Wei发表《AI研究思考》演讲，探讨卓越研究与普通研究的区别。关键词：报告、研究者、模型、任务、智能文章来源：人工智能学家字数统计：2270字内容摘要：本文介绍了OpenAI科学家Jason Wei在伯克利的演讲《AI...

AI工具箱3年前

OpenAI科学家Jason Wei谈顶尖AI研究：探讨卓越与普通研究的分水岭

参数减半，性能接近谷歌Minerva，又有一个数学大模型开源

AIGC动态的最新资讯原标题：参数减半，性能接近谷歌Minerva，又一款数学大模型开源关键词：模型，数学，研究人员，数据，形式文章来源：机器之心内容字数：6748字内容摘要：机器之心报道编辑：大盘鸡、杜伟大模型家族新增一位专门解决数学问题的「新成员」——Llemma。目前，训练于多种文本...

AI工具箱3年前

参数减半，性能接近谷歌Minerva，又有一个数学大模型开源

将LLM视作操作系统，它获得无限的「虚拟」上下文，伯克利新作已获1.7k星称赞

欢迎阅读AIGC动态原标题：将LLM视为操作系统，赋予其无限"虚拟"上下文，伯克利的新作已收获1.7k星关键词：上下文，研究者，智能，任务，下文文章来源：机器之心内容字数：6439字内容摘要：机器之心编辑：杜伟、小舟如今，赋予大型语言模型更强大的上下文处理能力是业界极为关注的热点。本文介绍了加州大学...

AI工具箱3年前

将LLM视作操作系统，它获得无限的「虚拟」上下文，伯克利新作已获1.7k星称赞

GPT-4无法替代程序员！普林斯顿大学研究：在GitHub上解决编程问题的成功率为0

AI与编程：普林斯顿芝加哥大学研究发现原文标题：《大型AI模型无法取代程序员！普林斯顿芝加哥大学惊人发现：GPT-4 在GitHub编程问题上的成功率为0 关键词：模型、程序员、问题、任务、研究者文章来源：新智元内容字数：9976 字内容摘要：新智元报道编辑：编辑部【新智元导读】像 Chat...

AI工具箱3年前

GPT-4无法替代程序员！普林斯顿大学研究：在GitHub上解决编程问题的成功率为0

MIT等使用GPT-4打破语言、机器人技术壁垒，实现模拟任务向真实世界的迁移

本文介绍了使用GPT-4进行任务生成和迁移的相关内容。机器人领域中，通用机器人策略的实现需要大量的数据，然而在真实世界中收集这些数据是耗时且费力的。尽管模拟环境可以经济地提供不同体量数据的解决方案，但是增加任务多样性仍然面临挑战，特别是对于复杂任务需要大量人力参与。因此，典型的人工模拟基准通常只包含...

AI工具箱3年前

MIT等使用GPT-4打破语言、机器人技术壁垒，实现模拟任务向真实世界的迁移

陈丹琦团队发布LLM-Shearing大模型剪枝法，手把手教你剪「羊驼」

AIGC动态欢迎阅读原标题：手把手教你剪「羊驼」，陈丹琦团队提出LLM-Shearing大模型剪枝法本文来源：机器之心字数统计：6779字近日，机器之心编辑团队对Llama 2（羊驼）大型模型进行了剪裁实验，采用了一项名为LLM-Shearing的大模型剪枝技术。这一方法可以以很小的计算成本...

AI工具箱3年前

陈丹琦团队发布LLM-Shearing大模型剪枝法，手把手教你剪「羊驼」

FRESHLLM：紧贴时事，搜索体验提升

AIGC动态欢迎阅读此文源自机器之心报道，介绍了FRESHLLM在与谷歌搜索竞争活跃程度方面的表现。FRESHLLM紧跟时事，减少幻觉，提供更精准的信息。关键词：问题、研究者、模型、证据、知识。文章内容由机器之心撰写，篇幅为7275字。其中提到，LLM编辑部更新了知识，与谷歌搜索展开竞争。目前...

AI工具箱3年前

FRESHLLM：紧贴时事，搜索体验提升

降低视觉Transformer计算成本：时间冗余方法惊艳操作

阅读 AIGC 动态欢迎原标题：降低视觉Transformer计算成本：时间冗余策略让人大开眼界关键词：冗余、策略、研究人员、成本、时间文章来源：机器之心内容字数：7495字内容摘要：机器之心编译编辑：Panda W。Transformer 在带动语言领域革新之后，如今正逐步涉足视觉领域，但其高昂的...

AI工具箱3年前

降低视觉Transformer计算成本：时间冗余方法惊艳操作

StreamingLLM火了！400万token上下文、推理提速提高22倍，GitHub星标已达2.5K

文章介绍了一项名为StreamingLLM的技术，可以在上下文中包含多达400万个token，并且加快推理速度达到22倍。这项技术在GitHub上已经获得了2.5K颗星的关注。相比当前大多数LLM只能记住有限上下文的情况，StreamingLLM提供了更为强大的功能，可以更好地处理长文本的推理需求。...

AI工具箱3年前

StreamingLLM火了！400万token上下文、推理提速提高22倍，GitHub星标已达2.5K

如何选择词表影响语言模型训练？一项顶尖词表选择研究。

本文介绍了一项关于词表选择对语言模型训练影响的研究。研究者使用了不同类型的词表对语言模型进行实验，结果得出了一些有益的结论，可以帮助读者选择适合的词表进行语言模型训练。研究者使用了12个小型语言模型和4个中型语言模型作为实验对象，并对它们在不同词表下的表现进行了比较。文中介绍了实验的基本设计和结果总...

AI工具箱3年前

如何选择词表影响语言模型训练？一项顶尖词表选择研究。

LLaMA2上下文扩展至100k：MIT和港中文引入LongLoRA方法

欢迎阅读AIGC动态原标题：MIT和香港中文学院的研究者开发出了名为LongLoRA的方法，将LLaMA2模型的上下文扩展至100k 关键词：上下文、模型、研究者、长度、长上文章来源：机器之心内容字数：6020字内容摘要：机器之心报道，编辑部成功扩展了大型模型的上下文长度，无需消耗过多计算资...

AI工具箱3年前

LLaMA2上下文扩展至100k：MIT和港中文引入LongLoRA方法

七大维度评估大语言模型可信度

欢迎阅读AIGC动态本文原题为：“如何评估大语言模型是否可信？这里总结了七大维度。” 本文讨论关键词包括：模型、维度、类别、研究者、问题。文章来源于机器之心。全文共6813字，主要由刘扬和Kevin Yao撰写。文章主要提出了7个关键维度，用以全面评估大型语言模型的可信度。在实际部署中，“对齐...

AI工具箱3年前

七大维度评估大语言模型可信度

1 2