权重_AI今日热点提供国内外人工智能一手新闻资讯

PyTorch是ChatGPT构建的关键，LeCun的言论引发热议，厂商不公开权重的原因揭秘

图像已被省略。欢迎阅读AIGC动态：ChatGPT构建离不开PyTorch，LeCun的观点引发了热议，模型厂商不开放权重原因。本文来源于机器之心，全文约5909字。近期关于开源话题再度成为热议焦点。有人认为，AI领域若没有开源，将一事无成，因此继续保持AI的开放至关重要。这一观点得到了许多人的认...

AI工具箱3年前

PyTorch是ChatGPT构建的关键，LeCun的言论引发热议，厂商不公开权重的原因揭秘

Mistral AI发布全新「神秘模型」托管平台，22人估值20亿美元，引领超越GPT-3.5领域

读者注意：AIGC近期动态最新标题：法国 Mistral AI 推出「神秘模型」托管平台，力争超越 GPT3.5，22家投资估值高达 20 亿美元关键词：模型、美元、权重、平台、开发者信息来源：创业者公园文章长度：共计4468个字内容简介：成立仅数月的法国大型模型公司 Mistral AI 近期频频...

AI工具箱3年前

Mistral AI发布全新「神秘模型」托管平台，22人估值20亿美元，引领超越GPT-3.5领域

PyTorch团队用不到1000行代码让Llama 7B提速10倍

<img src=""> 欢迎阅读AIGC动态原标题：PyTorch团队在不到1000行代码的情况下成功将Llama 7B的速度提高了10倍。关键词：模型、权重、缓存、张量、本文文章来源：机器之心文章字数：6019字内容摘要：PyTorch团队分享如何加速大...

AI工具箱3年前

LoRA教程：小型模型微调更划算

本文来自机器之心，原标题为《不是大模型全局微调不起，只是LoRA更有性价比，教程已经准备好了》，内容涉及到神经网络模型参数调整的高效方法LoRA技术。LoRA技术相当于在大模型基础上增加可拆卸的插件，轻巧便捷。对于微调大语言模型来说，LoRA是广泛且有效的方法之一。该技术有效解决了大模型微调的成本和...

AI工具箱3年前

学会使用Llama2的5个简单步骤

欢迎阅读AIGC的最新动态本文原标题为：“Meta教你5步学会用Llama2：我见过最简单的大模型教学” 关键词：模型、脚本、任务、步骤、权重文章来源：机器之心内容字数：7485字文章摘要：这篇文章来自Meta官网，介绍了如何在项目中充分利用Llama2的教学博客。文中详细探讨了Llama2...

AI工具箱3年前

S-LoRA：实现GPU同时运行数千个大模型

该文章介绍了S-LoRA技术，这是一种通过在GPU上运行数千个大型模型，实现高效适配器权重和张量的方法。传统上，部署大语言模型都采用“预训练-微调”模式，但在面对多任务微调时，成本十分高昂。低秩适配（LoRA）技术通过高效参数利用实现了在多任务中适配基础模型的方式。通过LoRA技术，可以有效提高服...

AI工具箱3年前

腾讯AI Lab ICCV 2023论文解读：高精度低成本3D游戏人脸重建方案

AIGC动态欢迎阅读原文标题：腾讯AI Lab ICCV 2023 论文解读：高精度低成本游戏 3D 人脸重建方案关键词：蒙皮、骨骼、权重、模型、顶点文章来源：机器之心内容字数：10990字内容摘要：3D人脸重建是应用广泛的关键技术，用于游戏制作、数字人、AR/VR、人脸识别和编辑等领域，...

AI工具箱3年前

蚂蚁科技自主研发的优化器WSAM成功入选KDD Oral

《AIGC动态欢迎阅读》原标题：蚂蚁自研优化器WSAM获KDD Oral选拔，更通用、更有效关键词：极值、损失、权重、基础、函数文章来源：机器之心内容字数：11790字内容摘要：机器之心编辑部的蚂蚁AI Infra团队一直致力于深度学习中优化器的创新与发展，旨在实现资源节约、加速训练收敛和提高泛化能...

AI工具箱3年前

权重开放或引来AI失控风险？Meta被举牌，LeCun称开源AI社区蓬勃发展

本文内容涉及开源与闭源模型对AI领域的影响，Meta被指开放模型权重可能导致AI失控，LeCun则认为开源AI社区蓬勃发展。根据机器之心的报道，Meta的开源模型LLaMA引起了广泛关注，社区正在快速搭建与OpenAI、谷歌大模型类似的能力。在大模型时代，开源力量愈发强大。我们需要在使用过程中谨慎选...

AI工具箱3年前

Wolfram详解神经网络和ChatGPT：从原理到有效性

欢迎阅读AIGC动态原文标题：Stephen Wolfram探讨神经网络和ChatGPT的有效性：巨著30000字关键词：神经网络，单词，权重，神经元，语言文章来源：人工智能学家内容字数：73215字内容摘要：Stephen Wolfram是一位计算机科学家、物理学家和商人，因在计算机科学...

AI工具箱3年前

苹果将推出大型压缩技术，未来手机或许能容纳更大的模型

欢迎阅读AIGC动态本文转载自机器之心，题为“苹果创新大模型压缩技术，大模型有机会塞进手机里了”。主要内容涉及权重、张量、内存、研究者和设备等关键词。文章介绍了一个关于大型语言模型（LLM）在移动设备上的拓展应用。由于大模型的内容安全问题，人们希望能够在终端设备上进行模型训练和运行，尤其希望可以...

AI工具箱3年前

Transformer如何实现上下文学习能力？

本文来自机器之心，专题为《Transformer的上下文学习能力是哪来的？》。文章从对 Transformer 模型在深度学习中的主导地位展开讨论，指出其在语言模型中表现优异的原因之一是其擅长上下文学习（In-Context Learning）。文章联系了来自 Google AI、苏黎世联邦理工学院...

AI工具箱3年前