张量_AI今日热点提供国内外人工智能一手新闻资讯

戴琼海院士：AlpacaEval 开源项目挑战 GPT-4，如何依靠技术重塑生态信心

AIGC动态欢迎阅读原标题：戴琼海院士详述开源后AlpacaEval在技术上追赶GPT4的进展，强调技术是重建生态信心的关键关键字：模型、报告、架构、张量、数据文章来源：人工智能学家内容字数：4412字内容摘要：根据AI科技大本营报道，由斯坦福大学开发的大型语言模型评测AlpacaEval Lead...

AI工具箱3年前

戴琼海院士：AlpacaEval 开源项目挑战 GPT-4，如何依靠技术重塑生态信心

PyTorch团队用不到1000行代码让Llama 7B提速10倍

<img src=""> 欢迎阅读AIGC动态原标题：PyTorch团队在不到1000行代码的情况下成功将Llama 7B的速度提高了10倍。关键词：模型、权重、缓存、张量、本文文章来源：机器之心文章字数：6019字内容摘要：PyTorch团队分享如何加速大...

AI工具箱3年前

英伟达科学家开发PyTorch“加速包”：不到1000行代码实现模型提速10倍

<img src=""> 欢迎阅读AIGC动态原标题：英伟达科学家称PyTorch推出的大模型“加速包”可以提速10倍，仅需不到1000行代码。minGPT以来最佳教程式代码库之一。关键词：模型、张量、团队、速度、代码文章来源：量子位内容字数：5991字内容...

AI工具箱3年前

S-LoRA：实现GPU同时运行数千个大模型

该文章介绍了S-LoRA技术，这是一种通过在GPU上运行数千个大型模型，实现高效适配器权重和张量的方法。传统上，部署大语言模型都采用“预训练-微调”模式，但在面对多任务微调时，成本十分高昂。低秩适配（LoRA）技术通过高效参数利用实现了在多任务中适配基础模型的方式。通过LoRA技术，可以有效提高服...

AI工具箱3年前

李开复旗下340亿参数开源大模型涉嫌“套壳LLaMA”，最新回应揭晓！

AIGC动态欢迎阅读原标题：李开复旗下340亿参数开源大模型被指“套壳LLaMA”，最新回应来了！关键词：模型、政策、张量、万物、架构文章来源：AI前线文章字数：7399字内容摘要：凌敏、核子可乐整理。有网友在Twitter上评论：“这就是中国大模型的现状？”李开复的Yi-34B被指是对L...

AI工具箱3年前

李开复公司基于LLaMA但更改张量名的大型模型引发争议，官方回应揭晓

阅读AIGC动态最新消息原标题：基于LLaMA却改张量名，李开复公司大型模型引起争议，管理回应如下关键词：模型、万物、代码、张量、架构文章来源：机器之心文章长度：4283字文章摘要：据机器之心报道，编辑部的研究人员发现，李开复创办的「零一万物」公司的Yi-34B模型基本上采用了LLaMA的...

AI工具箱3年前

微软称FP8训练大模型比BF16快64%，内存节省42%

AIGC动态欢迎阅读本文转载自机器之心，标题为：用FP8训练大模型有多香？微软：比BF16快64%，省42%内存。文章介绍了使用FP8 8位浮点混合精度训练相比于传统的16位和32位浮点混合精度训练，在大型模型训练中可以带来速度提升、节省显存和通信成本的优势。然而，当前大型模型训练框架对FP8训练的...

AI工具箱3年前

苹果将推出大型压缩技术，未来手机或许能容纳更大的模型

欢迎阅读AIGC动态本文转载自机器之心，题为“苹果创新大模型压缩技术，大模型有机会塞进手机里了”。主要内容涉及权重、张量、内存、研究者和设备等关键词。文章介绍了一个关于大型语言模型（LLM）在移动设备上的拓展应用。由于大模型的内容安全问题，人们希望能够在终端设备上进行模型训练和运行，尤其希望可以...

AI工具箱3年前

LLaMA微调显存需求减半，清华大学提出新型4比特优化器

欢迎阅读AIGC动态原标题：LLaMA微调显存需求减半，清华提出4比特优化器关键词：张量，状态，显存，精度，模型文章来源：机器之心内容字数：8553字最近，清华大学的朱军、陈键飞团队提出了一种4比特优化器，用于神经网络训练，可以减少模型训练中的内存开销。这对于训练大型模型和微调过程对显存要...

AI工具箱3年前

张量

戴琼海院士：AlpacaEval 开源项目挑战 GPT-4，如何依靠技术重塑生态信心

PyTorch团队用不到1000行代码让Llama 7B提速10倍

英伟达科学家开发PyTorch“加速包”：不到1000行代码实现模型提速10倍

S-LoRA：实现GPU同时运行数千个大模型

李开复旗下340亿参数开源大模型涉嫌“套壳LLaMA”，最新回应揭晓！

李开复公司基于LLaMA但更改张量名的大型模型引发争议，官方回应揭晓

微软称FP8训练大模型比BF16快64%，内存节省42%

苹果将推出大型压缩技术，未来手机或许能容纳更大的模型

LLaMA微调显存需求减半，清华大学提出新型4比特优化器

热门AI工具

CC Switch

热门AI应用