Meta发布全新Llama 2-Long模型：史无前例的70B尺寸，引领「32k上下文」预训练模型登顶，迈过ChatGPT的巅峰

欢迎阅读AIGC动态

原文标题：Meta发布最新模型Llama 2-Long：70B尺寸，突破「32k上下文」，超越ChatGPT

关键词：模型、上下文、数据、任务

文章来源：新智元

字数统计：12616字

内容摘要：Meta发布Llama 2-Long模型，计算需求降低40%，同时保持短任务性能。大型语言模型在问答、文本总结等任务中表现出色，然而如何让LLM在处理「超长文本输入」时不增加计算需求，且不影响短文本性能，仍然具挑战性。最近，Meta团队公布了支持长上下文的Llama 2-Long模型训练方法，该模型有效上下文窗口多达32768个toke…

原文链接：Meta发布最新模型Llama 2-Long：70B尺寸，突破「32k上下文」，超越ChatGPT

作者联系方式

文章来源：新智元

作者微信号：AI_era

作者简介：智能+中国主平台，致力于推动中国智能+新纪元发展。专注人工智能、机器人等前沿领域，关注人机融合、人工智能和机器人对社会与文明进化的影响，引领中国智能时代。

文章版权归作者所有，未经允许请勿转载。

相关AI热点

暂无评论

暂无评论...

Meta发布全新Llama 2-Long模型：史无前例的70B尺寸，引领「32k上下文」预训练模型登顶，迈过ChatGPT的巅峰

欢迎阅读AIGC动态

作者联系方式

MBZUAI：四年爬升至全球人工智能大学排名第18！

特斯拉在德州设立超级计算机Dojo中心；AMD完成收购人工智能软件公司Nod.ai；百度文心生物计算大模型研究发表在Nature子刊丨AIGC大事日报

相关AI热点

OpenAI宣布推广GPT-4.5人工智能模型的新举措

海斌访谈：DeepSeek如何重塑中国大模型产业生态

AI助力！民警寻回70名失踪被拐儿童，含18名无童年照片者

AI与5G赋能大模型基础设施建设，构筑全面智能社会基石

ChatGPT插件即将停止支持，奥特曼年终总结暗示明年有大动作…

英伟达与AMD展开激烈竞争：GPU霸主地位谁能稳坐？

微软用大型语言模型直接反编译二进制代码，化身专业反编译高手！

实现通用智能：机器如何从自然模态学习到世界模型？

暂无评论

AI热榜