AI的三大核心问题:人才、产品、商业 本文介绍了2023年AI领域的最新动态和关键议题,从AI人才、AI产品到AI商业展开讨论。其中提到了大模型对开发者的影响和机遇,以及Agent、人形机器人等产品的创新应用。文章还呼吁关注GPT Store的关键能力和开发者面临的新机遇。相关讨论还将在《连麦》栏目中展开。如果您感兴趣,可以阅读原文了解... AI工具箱2年前
田渊栋团队最新论文:解决大模型部署难题,吞吐量提升近30倍 本文介绍了田渊栋团队最新解决大模型部署难题的论文成果,成功提升了系统吞吐量近30倍。大型语言模型在实际部署中常面临KV缓存成本昂贵和长序列泛化能力差的问题。田渊栋团队通过解决这两大难题,取得了巨大突破。他们的研究成果即将在NeurIPS’23上展示。详细内容请参阅原文:吞吐量提升近30倍!田渊栋团队... AI工具箱2年前
LoRA教程:小型模型微调更划算 本文来自机器之心,原标题为《不是大模型全局微调不起,只是LoRA更有性价比,教程已经准备好了》,内容涉及到神经网络模型参数调整的高效方法LoRA技术。LoRA技术相当于在大模型基础上增加可拆卸的插件,轻巧便捷。对于微调大语言模型来说,LoRA是广泛且有效的方法之一。该技术有效解决了大模型微调的成本和... AI工具箱2年前
Transformer大模型3D可视化:GPT-3和Nano-GPT每一层清晰呈现 本文介绍了一个有关Transformer大模型的3D可视化图,展示了GPT-3和Nano-GPT每一层的清晰结构。软件工程师Brendan Bycroft制作了一个“大模型工作原理3D可视化”网站,让人们能够更直观地了解这些大型模型是如何运作的。文章中描述了1750亿参数的GPT-3模型,包含8列层... AI工具箱2年前
清华大学发布最新研究:SoRA参数量仅为LoRA的70%,性能表现更出色! 这篇文章介绍了清华大学研究团队提出的一项名为Sparse Low-Rank Adaptation(SoRA)的创新微调方法,该方法在原有LoRA基础上能将参数量减少到LoRA的70%并表现更好。文章指出在大型语言模型研究中,如何高效微调一直是一个重要的研究方向。此前的工作中,全量微调成本高昂,Ada... AI工具箱2年前
PyTorch团队重写「分割一切」模型,性能提升达8倍 AIGC动态欢迎阅读 原标题:PyTorch团队重写「分割一切」模型,比原始实现快8倍 关键字:本文,内核,矩阵,张量,乘法 文章来源:机器之心 内容字数:7501字 内容摘要:机器之心报道编辑:陈萍,本文介绍了PyTorch团队对Meta的「分割一切」模型进行优化的情况。文章重点是如何通过纯原生P... AI工具箱2年前
全新超级注意力机制HyperAttention:加速LLM推理速度50%、支持处理长篇上下文 AIGC动态欢迎阅读 原标题:全新近似注意力机制HyperAttention:对长上下文友好、LLM推理提速50% 关键词:矩阵、注意力、算法、研究者、条目 文章来源:机器之心 内容字数:9661字 内容摘要:机器之心报道编辑:大盘鸡。本文介绍了一项近似注意力机制新研究,由耶鲁大学、谷歌研究院等机构... AI工具箱3年前
BERT和GPT:不使用Attention和MLPs的最佳替代方案 本文介绍了一种名为Monarch Mixer (M2) 的新架构,该架构在序列长度和模型维度上具有高效的硬件效率。文章从BERT、GPT到SAM和Stable Diffusion等模型展开探讨,指出Transformer虽然当前风头正劲,但并非唯一选择。建议阅读原文以获取更多信息。如果需要联系作者,... AI工具箱3年前
OpenAI科学家揭示大语言模型成功的关键洞见,演讲引爆热议 <img src=""> 欢迎阅读AIGC动态 这篇报道转载自机器之心,主题是OpenAI科学家最新的大型语言模型演讲引起了热议,深入探讨了LLM取得成功的关键因素。演讲的标题是「Large Language Models (in 2023)」,由OpenAI研究科学... AI工具箱3年前
基于牛顿求根法的全新算法:实现RNN并行训练与评估,速度提升超过10倍 AIGC动态欢迎您的阅读原标题:基于牛顿求根法的新算法实现了并行训练和评估RNN,提速超过10倍关键词:序列,算子,矩阵,模型,方法文章来源:机器之心内容字数:7120字内容摘要:机器之心报道编辑:Panda W。人们普遍认为RNN是无法并行化的,因为其本质上具有序列特性:状态依赖于前一个状态。这一... AI工具箱3年前
AI思维:3D视角下探究矩阵乘法 文章标题是"以3D视角洞悉矩阵乘法,这就是AI思考的样子",是从机器之心编译而来的。本文介绍了一种名为mm的可视化工具,可以用于展示矩阵乘法和矩阵乘法组合的执行过程。矩阵乘法作为机器学习模型的基础构建模块,是各种强大AI技术的基础,通过了解其执行方式,可以更深入地理解AI和智能化... AI工具箱3年前
PyTorch 最新工具 mm:矩阵乘法和 Transformer 注意力的 3D 可视化 最新动态:AIGC 矩阵乘法可视化工具 原标题:矩阵成真!Pytorch最新工具mm,3D可视化矩阵乘法、Transformer注意力 关键词:矩阵、表达式、乘法、乘积、向量 文章来源:新智元 文章字数:9763字 内容摘要:最新工具mm由 Pytorch 团队推出,可以通过 3D 可视化模拟矩阵乘... AI工具箱3年前
10人只用两个月时间打造出大型模型,一年内发表16篇顶级会议论文支持:市面上没有任何开源项目能与之匹敌 欢迎阅读AIGC动态 原标题:10人仅用两个月时间完成大型模型开发!一年内发表16篇顶级会议论文:市面上没有任何开源项目能与之媲美 关键词:模型、团队、数据、矩阵、参数 文章来源:量子位 文章长度:6354字 内容摘要:本文由衡宇发布于凹非寺量子位公众号,关注人工智能领域的最新动态。一家成立于深圳的... AI工具箱3年前
张林:大规模模型商业化需结合「两条腿」策略,开源优势应用受限 AIGC动态欢迎阅读 原标题:对话共生矩阵张林:大模型商业化要「两条腿」走路,开源落地优势不大 关键词:模型、科技、客户、矩阵、技术 文章来源:AI科技评论 内容字数:13673字 内容摘要:在信息大爆发的时代,大模型成为目前最好的压缩机。作者黄楠,编辑陈彩娴,针对人类信息时代发展的三个阶段,即信息... AI工具箱3年前