智源发布强大的开源中英双语LLM模型“全家桶”,超越Llama 2 AIGC动态欢迎阅读 本文介绍了智源研究院最新推出的Aquila2-34B大语言模型,这一340亿参数的新成员超越了Llama 2-70B,在22个评测基准中表现出色。被称为当前最强的开源中英双语大模型。此举进一步提升了大模型在各项业绩评估中的地位。智源研究院强调该模型不仅在大模型榜单上取得成功,还... AI工具箱3年前
基于牛顿求根法的全新算法:实现RNN并行训练与评估,速度提升超过10倍 AIGC动态欢迎您的阅读原标题:基于牛顿求根法的新算法实现了并行训练和评估RNN,提速超过10倍关键词:序列,算子,矩阵,模型,方法文章来源:机器之心内容字数:7120字内容摘要:机器之心报道编辑:Panda W。人们普遍认为RNN是无法并行化的,因为其本质上具有序列特性:状态依赖于前一个状态。这一... AI工具箱3年前
清华、微软等公司淘汰了普通提示工程师?LLM结合进化算法,打造强大的提示优化器 AIGC动态欢迎阅读 本文从标题"清华、微软等淘汰提示工程师?LLM与进化算法结合,创造超强提示优化器"入手,探讨了提示工程领域的最新动态。研究人员利用进化算法结合LLM技术,取得了突破性的进展,提升了提示优化的效率。 关键词包括:提示、报告、研究人员、算法、算子。 文章来源:新智元 内容摘要:新智... AI工具箱3年前
LLaMA2全流程方案:开箱即用、700亿参数训练加速195%,支持8到512卡 欢迎阅读AIGC动态 动态标题:700亿参数LLaMA2训练加速195%,开箱即用的8到512卡LLaMA2全流程方案来了! 关键词:模型、多维、代码、数据、算子 本文来源:量子位 内容字数:4953字 内容摘要:本文介绍了LLaMA2训练微调推理的新进展,针对700亿版本,训练加速达到195%。利... AI工具箱3年前
LLaMA2 训练加速达到 195%,基础大模型最佳实践再次升级 欢迎阅读AIGC动态 本文标题:700 亿参数的LLaMA2训练加速达到195%,基础大模型的最佳实践再次升级 关键词:模型、多维、数据、算子、成本 文章来源:机器之心 字数统计:5569字 本文摘要:机器之心发布的ChatGPT引发了大模型热潮,全球科技巨头和明星初创企业纷纷加入竞争,以AI大模型... AI工具箱3年前