方法

共 62 篇文章

清华朱军团队研究生物脑机制启发智能系统持续学习,登上Nature子刊封面

AIGC动态欢迎阅读 原标题:用生物脑机制启发持续学习,让智能系统适者生存,清华朱军等团队研究登Nature子刊封面 关键词:人工智能, 记忆, 任务, 智能, 方法 文章来源:机器之心 内容字数:5619字 内容摘要: 机器之心专栏编辑部认为,在开放、高动态和演化环境中的学习能力是生物智能的核心要...
清华朱军团队研究生物脑机制启发智能系统持续学习,登上Nature子刊封面

微软发布LLMLingua大模型压缩框架,压缩比高达20倍

AIGC动态欢迎阅读近期,关于大型语言模型(LLM)在实际应用中推理和生成能力的研究日益增多。随着诸如ChatGPT等模型的广泛应用和研究,如何在保留关键信息的同时压缩较长的提示成为当前大模型研究的一个关键问题。微软提出了一种名为LLMLingua的提示压缩框架,旨在加速模型推理过程并降低成本。该方...
微软发布LLMLingua大模型压缩框架,压缩比高达20倍

港中大团队利用大型蛋白质语言模型提升分类性能10%,发现未知的信号肽

本文介绍香港中文大学团队利用大型蛋白质语言模型发现未知信号肽的研究成果。他们开发了一种名为无偏生物体不可知信号肽网络(USPNet)的深度学习方法,用于信号肽的分类和切割位点预测。实验结果显示,USPNet的分类性能比现有方法提高了10%。该方法从宏基因组数据中发现了347个与训练数据中信号肽差异很...
港中大团队利用大型蛋白质语言模型提升分类性能10%,发现未知的信号肽

厦大等发布「视觉感知基础模型」APE,涵盖160个SOTA参数

本文讨论了由厦门大学等机构提出的新视觉感知基础模型APE,该模型仅需一个模型和一组参数,即可在160个测试集上达到当前SOTA水平或具有极高竞争力。该模型不仅训练和推理代码开源,而且无需微调即可立即使用。研究人员从任务泛化、数据多样性和适用性三个方面构建了APE的重要能力。详细内容可参阅原文:一套参...
厦大等发布「视觉感知基础模型」APE,涵盖160个SOTA参数

最强多模态分割神器:架构参数全开源,0微调轻松应对160个测试集

AIGC动态欢迎阅读原标题:0微调搞定160个测试集!最强多模态分割一切大模型来了,架构参数全开源关键字:数据、方法、模型、论文、类别文章来源:量子位内容字数:6115字内容摘要:Brady 投稿量子位 | 公众号 QbitAI利用多模态大型模型进行语义分割的效果如何?通过一张图片和文本输入要分割的...
最强多模态分割神器:架构参数全开源,0微调轻松应对160个测试集

北大&望石智慧提出新型模型 “统一化学反应预训练与条件分子生成”

在您提供的文本中,介绍了北京大学和望石智慧的研究团队提出了一种新方法来弥合化学反应预训练和条件分子生成之间的差距。该方法受有机化学机制启发,开发了一个新的预训练框架,以克服当前分子生成模型的局限性。通过掌握化学知识,生成了高质量的可合成药物结构。这项研究对基于反应的应用程序的深度学习框架有重要意义。...
北大&望石智慧提出新型模型 “统一化学反应预训练与条件分子生成”

北京大学在NeurIPS 2023提出新的类别级6D物体姿态估计范式,刷新最优结果

本文来自机器之心专栏作者张继耀,报道了北京大学研究者在NeurIPS 2023上提出的类别级6D物体位姿估计新范式取得的最新研究成果。类别级6D物体位姿估计是计算机视觉领域中一个重要的问题,在机器人、虚拟现实和增强现实等领域有广泛的应用。传统的实例级物体位姿估计受限于需要事先了解物体特性,难以适用于...
北京大学在NeurIPS 2023提出新的类别级6D物体姿态估计范式,刷新最优结果

梅西、钢铁侠、二次元姐纷纷挑战「科目三」,引发全网模仿狂潮

在最近的一篇机器之心文章中,报道了来自阿里的研究团队提出的一项名为“Animate Anyone”的方法。这种方法只需要一张人物照片,再配合骨骼动画引导,就可以生成动画视频。最近,某舞蹈动作“科目三”在网络上掀起了一阵热潮,许多人模仿其摇花手、半崴不崴的脚步,并配以明快的音乐节奏。如果让人工智能生成...
梅西、钢铁侠、二次元姐纷纷挑战「科目三」,引发全网模仿狂潮

UW与MIT合作最新研究:让机器人在动态环境中学习新技能

最新研究探讨机器人在不断变化的环境中学习新技能 近日,华盛顿大学与麻省理工学院(MIT)的研究人员提出了一项新的研究成果,该成果旨在帮助机器人在快速变化的环境中获取新技能。 目前,大部分机器人只能执行其事先经过训练的任务,如果想要学习新技能,则需要额外的训练。这项最新研究采用强化学习技术,结合人类的...
UW与MIT合作最新研究:让机器人在动态环境中学习新技能

北大新发布的多模态大模型:可在混合数据集上直接应用于图像和视频任务训练

欢迎阅读AIGC动态近期,北大发布了最新的多模态大模型开源消息,该模型可在混合数据集上进行训练,无需修改即可用于图像和视频任务。关键词:视觉、视频、模型、图片、方法文章来源:量子位字数:5682字文章摘要:北京大学和中山大学联合团队最近提出一种构建统一的图片和视频表征框架的方法。他们通过这一框架,大...
北大新发布的多模态大模型:可在混合数据集上直接应用于图像和视频任务训练

探索无法启示的人不妨看看这1000个可信赖的机器学习创新点子

AIGC动态欢迎阅读原文标题为:研究无头绪的人请留意,这里有1000个关于可信机器学习的创新idea。关键词包括:方法、模型、数据、领域、范式。文章来源于《机器之心》。全文共27557字。内容摘要:《机器之心》专栏作者:UIUC 汪浩瀚。I. 前言1. 先讲一个故事,在大约4-5年前,我还是一名卡内...
探索无法启示的人不妨看看这1000个可信赖的机器学习创新点子

全新千亿级大型模型正式发布,完全开源!

AIGC动态欢迎阅读 近日,浪潮信息发布了“源2.0”基础大模型的消息,并宣布该模型全面开源。这一基础大模型涵盖了1026亿、518亿和21亿三种不同规模的参数模型,展现了在编程、推理和逻辑等方面的先进能力。当前,大模型技术正迅速推动生成式人工智能产业的快速发展,而基础大模型的关键能力则是支撑大模型...
全新千亿级大型模型正式发布,完全开源!

合成数据单靠无法实现人工通用智能AGI

近日,OpenAI最新的模型Q*引起了广泛关注,因其出色的推理能力和解决数学问题的能力而备受瞩目。然而,有关是否应该仅依赖合成数据的讨论引发了科技社区的深思。一些人认为,提高推理能力比增加数据更为关键,而合成数据的有效性仍存在争议。这些新进展引起了人们对合成数据对人工智能领域的影响进行思考。 Q*模...
合成数据单靠无法实现人工通用智能AGI

Adobe新方法:A100单个生成3D图像只需30秒

本文介绍了来自Adobe研究院和斯坦福大学等机构的研究者利用基于transformer的3D大型重建模型进行多视图扩散去噪,提出了新颖的3D生成方法DMV3D,并取得了新的SOTA结果的情况。2D扩散模型大大简化了图像内容创作流程,也让2D设计行业发生了变革。随着扩散模型进入3D领域,应用程序中的人...
Adobe新方法:A100单个生成3D图像只需30秒

深度学习代码数据增强:五年89篇研究综述

本篇文章介绍了关于深度学习中代码数据增强技术的综述研究。研究涉及近5年89篇相关论文的调查,并总结了这一技术在深度学习领域的应用现状和未来发展潜力。代码数据增强作为一种能够增加训练样本多样性的技术,在不收集新数据的情况下提升模型性能,尤其在资源匮乏领域具有显著意义。然而,尽管在机器学习领域已经得到广...
深度学习代码数据增强:五年89篇研究综述

OpenAI安全系统负责人探讨:大规模模型的对抗攻击和防御策略

本文介绍了OpenAI安全系统负责人Lilian Weng的长文,对大型语言模型(LLM)的对抗攻击与防御进行了梳理。虽然大多数商用和开源LLM都设有内置安全机制,但并不能完全防御不同形式的对抗攻击。随着ChatGPT的推出,大型语言模型应用逐渐普及,因此OpenAI安全系统团队投入大量资源研究如何...
OpenAI安全系统负责人探讨:大规模模型的对抗攻击和防御策略

国防科大等最新综述:多模态对齐方法解析

AIGC动态欢迎阅读 原标题:多模态对齐如何实现?国防科大等最新综述了《如何弥合模态间的差距:多模态大型语言模型》,详细介绍了四种多模态对齐方法。 关键词:模型、数据、能力、方法、报告 文章来源:人工智能学家 内容字数:8039字 内容摘要:本文讨论了多模态大型语言模型(MLLMs),这些模型整合了...
国防科大等最新综述:多模态对齐方法解析

深度学习AI打败世界顶尖系统,1分钟内生成10天气象预报

欢迎阅读AIGC动态 原文标题:科学:1分钟内生成10天气象预报,DeepMind AI打败顶尖系统 关键词:模型、华为、天气、天气预报、方法 文章来源:大数据文摘 字数统计:6899字 内容摘要:大数据文摘获得的授权转载自学术头条作者:闫一米。在天气预报领域,人工智能(AI)正在颠覆传统方法,有望...
深度学习AI打败世界顶尖系统,1分钟内生成10天气象预报

科学巨头:DeepMind AI用1分钟生成10天气象预报超越全球顶尖系统

AIGC动态欢迎阅读 原标题:《Science》刊文:DeepMind AI击败全球最佳预报系统,1分钟内预测10天气象 关键词:模型、华为、天气、天气预报、方法 文章来源:人工智能学家 内容字数:7241字 内容摘要:人工智能(AI)在天气预报领域颠覆传统方法,有望以更快速度和更低成本实现更准确的...
科学巨头:DeepMind AI用1分钟生成10天气象预报超越全球顶尖系统

大型模型架构是否即将走向衰落?

欢迎阅读AIGC动态 原标题:大模型架构创新已死? 关键词:报告、模型、架构、万物、方法 文章来源:量子位 字数:5309字 摘要:最近,技术圈上掀起了关于大型模型自研和创新的讨论。前阿里技术副总裁贾扬清首先在朋友圈爆料吐槽:某些大公司的新模型采用了LLaMA架构,然而为了区别其他模型,它们只是简单...
大型模型架构是否即将走向衰落?

阿里团队发现大模型「合二为一」的黑魔法:仅舍弃1%参数,不需GPU和重新训练,性能依旧强劲

阿里巴巴研究发现: 大模型「合二为一」黑魔法!可达相同性能原标题:舍弃99%的参数,仍保持相同性能!阿里巴巴团队发现了大模型「合二为一」的黑魔法,无需GPU加速,无需重新训练关键词:模型、参数、性能、方法、冗余文章来源:夕小瑶科技说字数:6293字摘要:夕小瑶科技说原创作者 | 小戏、Python动...
阿里团队发现大模型「合二为一」的黑魔法:仅舍弃1%参数,不需GPU和重新训练,性能依旧强劲

北大&智源提出LLaMA-Rider框架,助力大模型自主探索开放世界

阅读AIGC动态的最新报道原标题:北京大学和北京智源人工智能研究院联合提出开放世界训练框架LLaMA-Rider关键词:任务、环境、能力、方法、模型文章来源:机器之心字数:4519字内容摘要:在机器之心编辑部的专栏中,大型语言模型展示了通用智能体的潜力,因其强大且通用的语言生成和理解能力。然而,面对...
北大&智源提出LLaMA-Rider框架,助力大模型自主探索开放世界

大模型最后一公里:111页全面综述大模型评测报告

欢迎阅读AIGC动态 原文标题:大型AI模型应用最后一里程:111页大型模型评测全面综述 关键词:模型、能力、数据、方法、伦理 文章来源:机器之心 字数:9842字 内容摘要:当前,大型AI模型凭借其强大的能力和潜力引领着新一轮技术革新。众多科技巨头正在围绕大型模型展开布局,推动其不断发展。尽管大型...
大模型最后一公里:111页全面综述大模型评测报告

马里兰大学与NYU研究人员揭秘神经网络结构:CLIP模型神经元惊为骷髅头形状

AIGC动态欢迎阅读 原文标题:AI生图太诡异?马里兰大学与纽约大学合作解剖神经网络,揭示CLIP模型神经元形似骷髅头 关键词:模型、图像、方法、架构、研究人员 文章来源:新智元 内容字数:4920字 内容摘要:新智元报道编辑:桃子【新智元导读】如何解释神经网络的黑匣子?马里兰大学与纽约大学的研究人...
马里兰大学与NYU研究人员揭秘神经网络结构:CLIP模型神经元惊为骷髅头形状

单点端到端文本检测识别框架速度提升19倍:华科、华南理工等研究团队联合发布SPTS v2

本文介绍了华科、华南理工等联合发布的SPTS v2,该文本检测识别框架速度提升了19倍。近年来,场景文本阅读技术取得显著进步,能够同时定位和识别文本,在智慧办公、金融、交通等领域得到广泛应用。相较于目标检测,文本除了定位还需要精确识别内容,并且由于字体和排版的差异,文本实例可能呈现出任意形状,因此需...
单点端到端文本检测识别框架速度提升19倍:华科、华南理工等研究团队联合发布SPTS v2

MetaAI推出全新验证链框架:“三省吾身”缓解大模型幻觉现象

欢迎阅读AIGC动态 原文摘自:大数据文摘 原标题:MetaAI提出全新验证链框架,通过“三省吾身”减轻大模型的幻觉现象 关键词:基线,问题,方法,模型,幻觉 字数:6737字 内容摘要:本文授权转载自将门创投,作者seven_ 探讨了生成幻觉在大模型研究领域中的挑战。生成幻觉指的是大型语言模型在回...
MetaAI推出全新验证链框架:“三省吾身”缓解大模型幻觉现象

苹果电脑若采用7B模型,将轻松击败700亿LLaMA2,实现开源免费化

AIGC动态欢迎阅读 原文标题:最佳的7B模型再易主!击败700亿LLaMA2,苹果电脑也能跑|开源且免费 关键词:模型、数据、团队、效果、方法 文章来源:量子位 内容字数:6868字 内容摘要:本文介绍了花费500美元打造的70亿参数模型,成功击败了具有700亿参数的Llama 2!而且这个模型可...
苹果电脑若采用7B模型,将轻松击败700亿LLaMA2,实现开源免费化

清华大学提出新一代LCM文生图模型,实现2秒生成图像,开启图像生成新篇章

AIGC动态 欢迎阅读夕小瑶科技说提供的最新动态: 原标题:2秒出图的文生图模型出现了!清华提出LCM,新一代图像生成里程碑。 在当前基于扩散模型的图像生成器中,虽然呈现出栩栩如生的效果,但生成过程缓慢,让人苦恼。你是否曾尝试过使用Midjourney或者DALL·E 3来生成图像?是否曾因生成一张...
清华大学提出新一代LCM文生图模型,实现2秒生成图像,开启图像生成新篇章

高效生成的分子,在逆向分子设计中具备几乎100%的有效性:引导扩散模型

这篇文章介绍了一种用于逆向分子设计的引导扩散模型,利用生成深度学习技术推动材料科学领域的"从头分子设计"。这项研究的目标是提高分子设计的效率,解决目前分子发现过程中的挑战。原文来源于机器之心,文章详细介绍了该模型的特性、应用方法以及相关研究成果。 若想了解更多详情,请点击原文链接...
高效生成的分子,在逆向分子设计中具备几乎100%的有效性:引导扩散模型

AI使用强化学习在两万场宝可梦对战中斩获4k星,取得胜利

AIGC动态欢迎阅读 原文标题:狂揽4k star,AI通过强化学习玩宝可梦,两万场后成功拿下 关键词:作者、行为、视频、屏幕、方法 文章来源:机器之心 内容字数:5403字 内容摘要:本文报道了编辑自机器之心对大盘鸡AI在玩宝可梦过程中取得的进展。在提及“口袋妖怪”时,不少人都颇感兴奋。自1996...
AI使用强化学习在两万场宝可梦对战中斩获4k星,取得胜利

深度解析 LLM 推理优化技术

AIGC动态欢迎阅读 原标题:LLM 的推理优化技术纵览 本文内容主要涵盖模型、序列、知乎等关键词,介绍了推理优化技术的相关方法和性能。 文章来源:JioNLP 全文字数:16565字 文章摘要:本文转载自紫气东来在知乎上的原文,详细讨论了LLM的推理优化技术。感兴趣的读者可通过以下链接阅读原文:h...
深度解析 LLM 推理优化技术

ICCV 2023 | 深度主动轮廓模型DeepAC实现实时六度物体跟踪

融合深度学习技术的物体跟踪新方法原标题:ICCV 2023 | 实现实时六度物体跟踪,深度主动轮廓模型DeepAC来了关键词:物体、方法、边界、模型、度文章来源:机器之心内容字数:11119字内容摘要:本文介绍了由国防科技大学刘煜教授团队和浙江大学-商汤联合实验室周晓巍教授团队共同撰写的论文《Dee...
ICCV 2023 | 深度主动轮廓模型DeepAC实现实时六度物体跟踪

OpenAI科学家宣布:GPT-4即将实现技术突破,性能将提升1000倍!

文中提到,OpenAI科学家最新演讲揭示了GPT-4即将取得重大突破,其参数规模将扩大1000倍,性能也将得到显著提升。该演讲从第一性原理出发,探讨了2023年大模型发展的现状,强调了GPT-4即将超越拐点并带来性能飞跃的观点。演讲者Hyung Won Chung指出对于巨大参数规模的大型语言模型(...
OpenAI科学家宣布:GPT-4即将实现技术突破,性能将提升1000倍!

港中大研究:模型解数学难题超越GPT-4!

本文介绍了港中大最新研究开发的大模型MathCoder,其数学能力在竞赛级“题库” Math 上超越了 GPT-4。MathCoder能够无缝集成代码,在遇到数学问题时不仅能用自然语言推理,还能自动编写和执行代码来建模、推导公式与方程。这项研究让人们看到了人工智能在解决数学难题方面的巨大潜力。 作者...
港中大研究:模型解数学难题超越GPT-4!
1 2