适配器

共 1 篇文章

S-LoRA：实现GPU同时运行数千个大模型

该文章介绍了S-LoRA技术，这是一种通过在GPU上运行数千个大型模型，实现高效适配器权重和张量的方法。传统上，部署大语言模型都采用“预训练-微调”模式，但在面对多任务微调时，成本十分高昂。低秩适配（LoRA）技术通过高效参数利用实现了在多任务中适配基础模型的方式。通过LoRA技术，可以有效提高服...

AI工具箱3年前

适配器

S-LoRA：实现GPU同时运行数千个大模型

热门AI工具

CC Switch

热门AI应用