贾佳亚韩松团队最新作品：两行代码实现大模型上下文窗口倍增 | 登上GitHub热榜

AIGC动态3年前发布 AI工具箱

贾佳亚韩松团队最新作品：两行代码实现大模型上下文窗口倍增 | 登上GitHub热榜

AIGC动态欢迎阅读

原标题：贾佳亚韩松团队新作：两行代码让大模型上下文窗口倍增 | GitHub热榜

关键字：模型、注意力、长度、数据、窗口

这篇文章的内容来源于量子位，全文共计4214字。文章介绍了贾佳亚和韩松领导的团队提出的新方法，只需两行代码加上11小时的微调，就能将大模型的上下文窗口长度从4k提高到32k。这种基于LoRA的全新大模型微调方法被称为LongLoRA，是由来自香港中文大学和麻省理工学院的全华人团队合作开发的。该方法已登上GitHub热榜，最长可以扩展到10万token，能够一次性阅读完长篇小说的多个章节或中短篇小说。

想要阅读完整文章，请点击原文链接：贾佳亚韩松团队新作：两行代码让大模型上下文窗口倍增 | GitHub热榜

联系作者

文章来源：量子位

作者微信：QbitAI

作者简介：专注追踪人工智能领域的最新趋势，关注科技行业的最新突破。

AIGC动态 # 数据 # 模型 # 注意力 # 窗口

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关AI热点

OpenAI宣布推广GPT-4.5人工智能模型的新举措

OpenAI宣布推广GPT-4.5人工智能模型的新举措

AI实验室1年前

海斌访谈：DeepSeek如何重塑中国大模型产业生态

海斌访谈：DeepSeek如何重塑中国大模型产业生态

AI实验室1年前

AI助力！民警寻回70名失踪被拐儿童，含18名无童年照片者

AI助力！民警寻回70名失踪被拐儿童，含18名无童年照片者

AI之家1年前

AI与5G赋能大模型基础设施建设，构筑全面智能社会基石

AI与5G赋能大模型基础设施建设，构筑全面智能社会基石

AI实验室1年前

实现通用智能：机器如何从自然模态学习到世界模型？

实现通用智能：机器如何从自然模态学习到世界模型？

AI工具箱2年前

AI 时代：强劲至强！云服务如何保驾护航？

AI 时代：强劲至强！云服务如何保驾护航？

AI工具箱2年前

12所高校机构发布150页报告，揭秘「大模型推理」，概述750篇论文

12所高校机构发布150页报告，揭秘「大模型推理」，概述750篇论文

AI工具箱2年前

OpenAI 找到新方法来改进语言模型对齐技术

OpenAI 找到新方法来改进语言模型对齐技术

AI工具箱2年前

暂无评论

none

暂无评论...