戴琼海院士:AlpacaEval 开源项目挑战 GPT-4,如何依靠技术重塑生态信心 AIGC动态欢迎阅读原标题:戴琼海院士详述开源后AlpacaEval在技术上追赶GPT4的进展,强调技术是重建生态信心的关键关键字:模型、报告、架构、张量、数据文章来源:人工智能学家内容字数:4412字内容摘要:根据AI科技大本营报道,由斯坦福大学开发的大型语言模型评测AlpacaEval Lead... AI工具箱3年前
PyTorch团队用不到1000行代码让Llama 7B提速10倍 <img src=""> 欢迎阅读AIGC动态 原标题:PyTorch团队在不到1000行代码的情况下成功将Llama 7B的速度提高了10倍。 关键词:模型、权重、缓存、张量、本文 文章来源:机器之心 文章字数:6019字 内容摘要:PyTorch团队分享如何加速大... AI工具箱3年前
英伟达科学家开发PyTorch“加速包”:不到1000行代码实现模型提速10倍 <img src=""> 欢迎阅读AIGC动态 原标题:英伟达科学家称PyTorch推出的大模型“加速包”可以提速10倍,仅需不到1000行代码。minGPT以来最佳教程式代码库之一。 关键词:模型、张量、团队、速度、代码 文章来源:量子位 内容字数:5991字 内容... AI工具箱3年前
S-LoRA:实现GPU同时运行数千个大模型 该文章介绍了S-LoRA技术,这是一种通过在GPU上运行数千个大型模型,实现高效适配器权重和张量的方法。传统上,部署大语言模型都采用“预训练-微调”模式,但在面对多任务微调时,成本十分高昂。低秩适配(LoRA)技术通过高效参数利用实现了在多任务中适配基础模型的方式。 通过LoRA技术,可以有效提高服... AI工具箱3年前
李开复旗下340亿参数开源大模型涉嫌“套壳LLaMA”,最新回应揭晓! AIGC动态欢迎阅读 原标题:李开复旗下340亿参数开源大模型被指“套壳LLaMA”,最新回应来了! 关键词:模型、政策、张量、万物、架构 文章来源:AI前线 文章字数:7399字 内容摘要:凌敏、核子可乐整理。有网友在Twitter上评论:“这就是中国大模型的现状?”李开复的Yi-34B被指是对L... AI工具箱3年前
李开复公司基于LLaMA但更改张量名的大型模型引发争议,官方回应揭晓 阅读AIGC动态最新消息 原标题:基于LLaMA却改张量名,李开复公司大型模型引起争议,管理回应如下 关键词:模型、万物、代码、张量、架构 文章来源:机器之心 文章长度:4283字 文章摘要:据机器之心报道,编辑部的研究人员发现,李开复创办的「零一万物」公司的Yi-34B模型基本上采用了LLaMA的... AI工具箱3年前
微软称FP8训练大模型比BF16快64%,内存节省42% AIGC动态欢迎阅读本文转载自机器之心,标题为:用FP8训练大模型有多香?微软:比BF16快64%,省42%内存。文章介绍了使用FP8 8位浮点混合精度训练相比于传统的16位和32位浮点混合精度训练,在大型模型训练中可以带来速度提升、节省显存和通信成本的优势。然而,当前大型模型训练框架对FP8训练的... AI工具箱3年前
苹果将推出大型压缩技术,未来手机或许能容纳更大的模型 欢迎阅读AIGC动态 本文转载自机器之心,题为“苹果创新大模型压缩技术,大模型有机会塞进手机里了”。主要内容涉及权重、张量、内存、研究者和设备等关键词。 文章介绍了一个关于大型语言模型(LLM)在移动设备上的拓展应用。由于大模型的内容安全问题,人们希望能够在终端设备上进行模型训练和运行,尤其希望可以... AI工具箱3年前
LLaMA微调显存需求减半,清华大学提出新型4比特优化器 欢迎阅读AIGC动态 原标题:LLaMA微调显存需求减半,清华提出4比特优化器 关键词:张量,状态,显存,精度,模型 文章来源:机器之心 内容字数:8553字 最近,清华大学的朱军、陈键飞团队提出了一种4比特优化器,用于神经网络训练,可以减少模型训练中的内存开销。这对于训练大型模型和微调过程对显存要... AI工具箱3年前