
AI 前沿信息
原标题:复旦邱锡鹏团队调整一个超参数,LLaMA2上下文长度达100万tokens
文章来源:量子位
字数:5019 字
内容摘要:最新研究发现,只需微调一个超参数,LLaMA 2 模型上支持的上下文长度从1.6 万 tokens 延长至 100 万。相比之下,即使是最新的大热模型 Claude 2 和 GPT-4,也仅支持 10 万和 3.2 万的上下文长度。超过这些范围,大型模型将开始生成混乱的内容,难以记忆。这项新研究来自复旦大学和上海人工智能实验室。
原文链接:[原文链接:LLaMA2上下文长度暴涨至100万tokens,只需调整1个超参数|复旦邱锡鹏团队出品](原文链接:LLaMA2上下文长度暴涨至100万tokens,只需调整1个超参数|复旦邱锡鹏团队出品)
联系作者
文章来源:量子位
作者微信:QbitAI
作者简介:专注追踪人工智能前沿,关注科技行业新发展
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
暂无评论...