本文

共 15 篇文章

OpenAI发布超级对齐项目：AI引领AI，GPT-2监督GPT-4

本文转自公众号「机器之心」，介绍了近期OpenAI发布的超级对齐项目。项目由Ilya Sutskever领导，旨在实现AI对齐AI，使GPT-2能够监督GPT-4等大模型。根据Ilya Sutskever的访谈内容，如果模型能够准确预测下一个词，就表明其具备理解产生这个词的背后现实的能力，这也是AI...

AI工具箱3年前

OpenAI发布超级对齐项目：AI引领AI，GPT-2监督GPT-4

Ilya带头OpenAI发布AI对齐AI的首篇研究论文：GPT-2监督GPT-4实现实证结果

本文讨论了人工智能领域的最新动态：GPT-2在监督GPT-4方面的能力，以及OpenAI科学家Ilya Sutskever带头撰写的超级对齐首篇论文。文章指出，虽然人类无法监督超级人工智能，但人工智能本身有可能做到。近年来，以预测下一个Token为核心的大型模型已经在多项任务上展现出潜力，引发人们对...

AI工具箱3年前

Ilya带头OpenAI发布AI对齐AI的首篇研究论文：GPT-2监督GPT-4实现实证结果

ETH研究团队推出简化版Transformer，提升综合效率

在最新的研究中，苏黎世联邦理工学院（ETH Zurich）计算机科学系的研究团队提出了一种简化版Transformer模型，旨在提高综合效率。这一研究对Transformer模型的设计进行了重新审视，指出了标准Transformer基础块的设计缺陷，并提出了优化方案，例如简化基础块的操作，比如直接移...

AI工具箱3年前

ETH研究团队推出简化版Transformer，提升综合效率

PyTorch团队用不到1000行代码让Llama 7B提速10倍

<img src=""> 欢迎阅读AIGC动态原标题：PyTorch团队在不到1000行代码的情况下成功将Llama 7B的速度提高了10倍。关键词：模型、权重、缓存、张量、本文文章来源：机器之心文章字数：6019字内容摘要：PyTorch团队分享如何加速大...

AI工具箱3年前

PyTorch团队用不到1000行代码让Llama 7B提速10倍

PyTorch团队重写「分割一切」模型，性能提升达8倍

AIGC动态欢迎阅读原标题：PyTorch团队重写「分割一切」模型，比原始实现快8倍关键字：本文,内核,矩阵,张量,乘法文章来源：机器之心内容字数：7501字内容摘要：机器之心报道编辑：陈萍，本文介绍了PyTorch团队对Meta的「分割一切」模型进行优化的情况。文章重点是如何通过纯原生P...

AI工具箱3年前

PyTorch团队重写「分割一切」模型，性能提升达8倍

视频稳定传输上线啦，现已添加代码权重

最近，AI 领域迎来了一项重要的更新：Stable Video Diffusion模型的问世。Stability AI 公司推出了这一视频生成模型，给人们留下了深刻印象。该模型继承了公司原有的 Stable Diffusion 文生成图模型，现在用户们有机会基于静止图像生成短视频。Stable Vi...

AI工具箱3年前

视频稳定传输上线啦，现已添加代码权重

13B模型揭秘：如何全面超越GPT-4？

AIGC动态欢迎您的阅读原标题：13B模型是否真的超越了GPT-4？背后的内幕揭秘关键词：样本、基准、测试、本文、数据文章来源：机器之心内容字数：5526字内容摘要：机器之心报道编辑：陈萍，您的测试集信息是否在训练集中泄漏？一个参数量为13B的模型竟然战胜了顶尖的GPT-4？如下图所示，并...

AI工具箱3年前

13B模型揭秘：如何全面超越GPT-4？

Anthropic推出全新大型模型评估标准，你值得拥有

AIGC动态欢迎阅读原标题：对大型模型评分标准的可靠性进行评估：Anthropic进行重要评估关键词：模型、评分标准、偏见、研究者、本文文章来源：机器之心内容字数：6709字内容摘要：在大型语言模型（LLM）盛行的今天，评估人工智能系统变得至关重要。在这一评估过程中，研究人员会遇到哪些困难...

AI工具箱3年前

Anthropic推出全新大型模型评估标准，你值得拥有

DeepMind：究竟是卷积网络胜过ViT？

本文来自机器之心，介绍了DeepMind对卷积神经网络与ViT之间的比较。文章指出，虽然深度学习的早期成功得益于卷积神经网络的发展，但近年来ViTs在取代ConvNets的趋势下，这一观点受到了挑战。文章评估了按比例扩大的NFNets，展示了在大规模数据集上ConvNets仍有优势。想要深入了解该文...

AI工具箱3年前

DeepMind：究竟是卷积网络胜过ViT？

复旦大学与华为诺亚联合提出VidRD框架，实现高质量视频生成的迭代式方法

本文介绍了复旦大合华为诺亚提出的VidRD框架，旨在实现迭代式的高质量视频生成。文章来源于机器之心，总字数为6382字。该框架名为“Reuse and Diffuse”，基于图像扩散模型（LDM）实现在已经生成的少部分视频帧之后，产生更多视频帧的功能，从而生成更长、更高质量以及多样化的视频内容。若想...

AI工具箱3年前

复旦大学与华为诺亚联合提出VidRD框架，实现高质量视频生成的迭代式方法

MiniGPT-4升级版本MiniGPT-v2：多模态任务更高效

《AIGC动态》欢迎阅读原标题：MiniGPT-4升级为MiniGPT-v2，无需使用GPT-4也能完成多模态任务关键词：模型、任务、语言、视觉、本文文章来源：机器之心内容字数：4030字内容摘要：机器之心编辑部介绍，MiniGPT-v2将大语言模型作为视觉语言多任务学习的统一接口。几个月...

AI工具箱3年前

MiniGPT-4升级版本MiniGPT-v2：多模态任务更高效

GPT-3.5和微调Llama 2开源模型比较分析：哪个更适合？

本文来源于机器之心的一篇文章，题为《选择GPT-3.5还是微调Llama 2等开源模型？综合比较后答案有了》，作者通过对GPT-3.5和Llama 2在不同任务上的微调进行比较，总结了在不同情况下选择GPT-3.5或Llama 2等模型的建议。文章试图通过实验验证手动微调模型是否能达到接近GPT-3...

AI工具箱3年前

GPT-3.5和微调Llama 2开源模型比较分析：哪个更适合？

语言模型首次战胜扩散模型在图像和视频生成中，tokenizer关键性作用凸显

AIGC动态欢迎阅读原标题：在图像、视频生成上，语言模型首次击败扩散模型，tokenizer是关键关键词：模型, 视觉, 语言, 视频, 本文文章来源：机器之心内容字数：6122字内容摘要：机器之心报道编辑：张倩、陈萍。为何语言模型在视觉生成方面落后于扩散模型？来自谷歌、CMU的研究表明，...

AI工具箱3年前

语言模型首次战胜扩散模型在图像和视频生成中，tokenizer关键性作用凸显

GPT-4在进行97轮对话后得出P≠NP的结论

最新动态：最新文章分享原标题：GPT-4在97轮对话中探索世界难题，得出P≠NP结论关键词：问题、模式、框架、递归、本文文章来源：机器之心文章长度：3960字内容简介：这篇文章对“LLM for Science”进行了一次有希望的探索。对于从事科研工作的人来说，多少都听说过P/NP问题，这个问题被克...

AI工具箱3年前

GPT-4在进行97轮对话后得出P≠NP的结论

DeepMind发现告诉大型模型“深呼吸，一步一步来”为最有效提示

AIGC动态欢迎阅读本文标题为：“告诉大模型「深呼吸，一步一步来」有奇效”，DeepMind发现最有效的提示方法。本文关键词包括：指令、提示、任务、准确率。文章来源：机器之心。本文共4590字，内容摘要如下：本文介绍了一种名为OPRO的简单而有效的方法，该方法利用大型语言模型作为优化器，通过自然语言...

AI工具箱3年前

DeepMind发现告诉大型模型“深呼吸，一步一步来”为最有效提示