微软发布LLMLingua大模型压缩框架，压缩比高达20倍

AIGC动态3年前发布 AI工具箱

微软发布LLMLingua大模型压缩框架，压缩比高达20倍

AIGC动态欢迎阅读

近期，关于大型语言模型（LLM）在实际应用中推理和生成能力的研究日益增多。随着诸如ChatGPT等模型的广泛应用和研究，如何在保留关键信息的同时压缩较长的提示成为当前大模型研究的一个关键问题。微软提出了一种名为LLMLingua的提示压缩框架，旨在加速模型推理过程并降低成本。该方法通过使用训练有素的较小语言模型，将提示从粗到细地动态分配不同的压缩比率，在高压缩比率下保持语义完整性。尽管token级的压缩提示格式难以被人类理解，但LLM表现出色。实验证明，即使在20倍的压缩下，该方法的性能损失依然较小，不仅能够降低计算成本，还为解决LLM中更长上下文提供了潜在的解决方案。

原文链接：点此阅读原文：20倍压缩比！微软提出大模型提示压缩框架LLMLingua

联系作者

文章来源：夕小瑶科技说

作者微信：xixiaoyaoQAQ

作者简介：聚集25万AI应用开发者、算法工程师和研究人员，汇聚更快的AI前沿和更深入的行业洞察。一线作者来自清华北大、国外顶尖AI实验室和互联网巨头，具备丰富的媒体sense和技术深度。

AIGC动态 # AIGC动态 # 提示 # 方法 # 模型 # 比例 # 语言

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关AI热点

OpenAI宣布推广GPT-4.5人工智能模型的新举措

OpenAI宣布推广GPT-4.5人工智能模型的新举措

AI实验室1年前

海斌访谈：DeepSeek如何重塑中国大模型产业生态

海斌访谈：DeepSeek如何重塑中国大模型产业生态

AI实验室1年前

AI助力！民警寻回70名失踪被拐儿童，含18名无童年照片者

AI助力！民警寻回70名失踪被拐儿童，含18名无童年照片者

AI之家1年前

AI与5G赋能大模型基础设施建设，构筑全面智能社会基石

AI与5G赋能大模型基础设施建设，构筑全面智能社会基石

AI实验室2年前

微软用大型语言模型直接反编译二进制代码，化身专业反编译高手！

微软用大型语言模型直接反编译二进制代码，化身专业反编译高手！

AI工具箱3年前

ChatGPT插件即将停止支持，奥特曼年终总结暗示明年有大动作…

ChatGPT插件即将停止支持，奥特曼年终总结暗示明年有大动作…

AI工具箱3年前

英伟达与AMD展开激烈竞争：GPU霸主地位谁能稳坐？

英伟达与AMD展开激烈竞争：GPU霸主地位谁能稳坐？

AI工具箱3年前

实现通用智能：机器如何从自然模态学习到世界模型？

实现通用智能：机器如何从自然模态学习到世界模型？

AI工具箱3年前

暂无评论

none

暂无评论...