长上

共 4 篇文章

优化基础LLM技术:Meta版ChatGPT为长上下文提供持续预训练

AIGC动态欢迎阅读 原标题:「Meta版ChatGPT」背后的技术:持续预训练改进基础LLM处理长上下文的能力 关键词:模型、上下文、长上、任务、下文 文章来源:机器之心 内容字数:10932字 内容摘要:机器之心报道编辑 Panda W 在处理长上下文方面指出,LLaMA 在一直力有不足,而通过...
优化基础LLM技术:Meta版ChatGPT为长上下文提供持续预训练

LLaMA2上下文扩展至100k:MIT和港中文引入LongLoRA方法

欢迎阅读AIGC动态 原标题:MIT和香港中文学院的研究者开发出了名为LongLoRA的方法,将LLaMA2模型的上下文扩展至100k 关键词:上下文、模型、研究者、长度、长上 文章来源:机器之心 内容字数:6020字 内容摘要:机器之心报道,编辑部成功扩展了大型模型的上下文长度,无需消耗过多计算资...
LLaMA2上下文扩展至100k:MIT和港中文引入LongLoRA方法