全新超级注意力机制HyperAttention：加速LLM推理速度50%、支持处理长篇上下文

AIGC动态3年前发布 AI工具箱

全新超级注意力机制HyperAttention：加速LLM推理速度50%、支持处理长篇上下文

AIGC动态欢迎阅读

原标题：全新近似注意力机制HyperAttention：对长上下文友好、LLM推理提速50%

关键词：矩阵、注意力、算法、研究者、条目

文章来源：机器之心

内容字数：9661字

内容摘要：机器之心报道编辑：大盘鸡。本文介绍了一项近似注意力机制新研究，由耶鲁大学、谷歌研究院等机构提出的HyperAttention，使 ChatGLM2 在32k上下文长度上的推理时间提升了50%。Transformer已经成功应用于自然语言处理、计算机视觉和时间序列预测等多个领域的学习任务。尽管取得了成功，但这些模型仍然面临着严重的可扩展性限制，原因是对其注意力层的精确计算导致了二次（在序列长度上）…

原文链接：点击查阅原文：全新近似注意力机制HyperAttention：对长上下文友好、LLM推理提速50%

联系作者

文章来源：机器之心

作者微信：almosthuman2014

作者简介：专业人工智能媒体和产业服务平台

AIGC动态 # 条目 # 矩阵 # 研究者 # 算法

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关AI热点

AI的三大核心问题：人才、产品、商业

AI的三大核心问题：人才、产品、商业

AI工具箱3年前

源代码打造无敌小模型，性能媲美ChatGPT和谷歌Gemini

源代码打造无敌小模型，性能媲美ChatGPT和谷歌Gemini

AI工具箱3年前

3D AIGC生成速度从小时到秒，脱胎换骨的进化历程

3D AIGC生成速度从小时到秒，脱胎换骨的进化历程

AI工具箱3年前

word2vec经典论文10年前预示了NeurIPS时间检验奖的获得

word2vec经典论文10年前预示了NeurIPS时间检验奖的获得

AI工具箱3年前

理想汽车发布史上最大更新：首次上车多模态大模型，即将推出无人泊车功能

理想汽车发布史上最大更新：首次上车多模态大模型，即将推出无人泊车功能

AI工具箱3年前

EMNLP投稿数量近5000篇，北大、腾讯斩获最佳长论文奖

EMNLP投稿数量近5000篇，北大、腾讯斩获最佳长论文奖

AI工具箱3年前

Human Gaussian开源：基于高斯飘溅技术的高质量3D人体生成新框架

Human Gaussian开源：基于高斯飘溅技术的高质量3D人体生成新框架

AI工具箱3年前

立即领取：4090/3080免费算力50小时和120+篇大模型必读论文

立即领取：4090/3080免费算力50小时和120+篇大模型必读论文

AI工具箱3年前

暂无评论

none

暂无评论...