本文

共 15 篇文章

OpenAI发布超级对齐项目:AI引领AI,GPT-2监督GPT-4

本文转自公众号「机器之心」,介绍了近期OpenAI发布的超级对齐项目。项目由Ilya Sutskever领导,旨在实现AI对齐AI,使GPT-2能够监督GPT-4等大模型。根据Ilya Sutskever的访谈内容,如果模型能够准确预测下一个词,就表明其具备理解产生这个词的背后现实的能力,这也是AI...
OpenAI发布超级对齐项目:AI引领AI,GPT-2监督GPT-4

ETH研究团队推出简化版Transformer,提升综合效率

在最新的研究中,苏黎世联邦理工学院(ETH Zurich)计算机科学系的研究团队提出了一种简化版Transformer模型,旨在提高综合效率。这一研究对Transformer模型的设计进行了重新审视,指出了标准Transformer基础块的设计缺陷,并提出了优化方案,例如简化基础块的操作,比如直接移...
ETH研究团队推出简化版Transformer,提升综合效率

PyTorch团队用不到1000行代码让Llama 7B提速10倍

<img src=""> 欢迎阅读AIGC动态 原标题:PyTorch团队在不到1000行代码的情况下成功将Llama 7B的速度提高了10倍。 关键词:模型、权重、缓存、张量、本文 文章来源:机器之心 文章字数:6019字 内容摘要:PyTorch团队分享如何加速大...
PyTorch团队用不到1000行代码让Llama 7B提速10倍

PyTorch团队重写「分割一切」模型,性能提升达8倍

AIGC动态欢迎阅读 原标题:PyTorch团队重写「分割一切」模型,比原始实现快8倍 关键字:本文,内核,矩阵,张量,乘法 文章来源:机器之心 内容字数:7501字 内容摘要:机器之心报道编辑:陈萍,本文介绍了PyTorch团队对Meta的「分割一切」模型进行优化的情况。文章重点是如何通过纯原生P...
PyTorch团队重写「分割一切」模型,性能提升达8倍

视频稳定传输上线啦,现已添加代码权重

最近,AI 领域迎来了一项重要的更新:Stable Video Diffusion模型的问世。Stability AI 公司推出了这一视频生成模型,给人们留下了深刻印象。该模型继承了公司原有的 Stable Diffusion 文生成图模型,现在用户们有机会基于静止图像生成短视频。Stable Vi...
视频稳定传输上线啦,现已添加代码权重

13B模型揭秘:如何全面超越GPT-4?

AIGC动态欢迎您的阅读 原标题:13B模型是否真的超越了GPT-4?背后的内幕揭秘 关键词:样本、基准、测试、本文、数据 文章来源:机器之心 内容字数:5526字 内容摘要:机器之心报道编辑:陈萍,您的测试集信息是否在训练集中泄漏?一个参数量为13B的模型竟然战胜了顶尖的GPT-4?如下图所示,并...
13B模型揭秘:如何全面超越GPT-4?

Anthropic推出全新大型模型评估标准,你值得拥有

AIGC动态欢迎阅读 原标题:对大型模型评分标准的可靠性进行评估:Anthropic进行重要评估 关键词:模型、评分标准、偏见、研究者、本文 文章来源:机器之心 内容字数:6709字 内容摘要:在大型语言模型(LLM)盛行的今天,评估人工智能系统变得至关重要。在这一评估过程中,研究人员会遇到哪些困难...
Anthropic推出全新大型模型评估标准,你值得拥有

DeepMind:究竟是卷积网络胜过ViT?

本文来自机器之心,介绍了DeepMind对卷积神经网络与ViT之间的比较。文章指出,虽然深度学习的早期成功得益于卷积神经网络的发展,但近年来ViTs在取代ConvNets的趋势下,这一观点受到了挑战。文章评估了按比例扩大的NFNets,展示了在大规模数据集上ConvNets仍有优势。想要深入了解该文...
DeepMind:究竟是卷积网络胜过ViT?

复旦大学与华为诺亚联合提出VidRD框架,实现高质量视频生成的迭代式方法

本文介绍了复旦大合华为诺亚提出的VidRD框架,旨在实现迭代式的高质量视频生成。文章来源于机器之心,总字数为6382字。该框架名为“Reuse and Diffuse”,基于图像扩散模型(LDM)实现在已经生成的少部分视频帧之后,产生更多视频帧的功能,从而生成更长、更高质量以及多样化的视频内容。若想...
复旦大学与华为诺亚联合提出VidRD框架,实现高质量视频生成的迭代式方法

MiniGPT-4升级版本MiniGPT-v2:多模态任务更高效

《AIGC动态》欢迎阅读 原标题:MiniGPT-4升级为MiniGPT-v2,无需使用GPT-4也能完成多模态任务 关键词:模型、任务、语言、视觉、本文 文章来源:机器之心 内容字数:4030字 内容摘要:机器之心编辑部介绍,MiniGPT-v2将大语言模型作为视觉语言多任务学习的统一接口。几个月...
MiniGPT-4升级版本MiniGPT-v2:多模态任务更高效

GPT-3.5和微调Llama 2开源模型比较分析:哪个更适合?

本文来源于机器之心的一篇文章,题为《选择GPT-3.5还是微调Llama 2等开源模型?综合比较后答案有了》,作者通过对GPT-3.5和Llama 2在不同任务上的微调进行比较,总结了在不同情况下选择GPT-3.5或Llama 2等模型的建议。文章试图通过实验验证手动微调模型是否能达到接近GPT-3...
GPT-3.5和微调Llama 2开源模型比较分析:哪个更适合?

语言模型首次战胜扩散模型在图像和视频生成中,tokenizer关键性作用凸显

AIGC动态欢迎阅读 原标题:在图像、视频生成上,语言模型首次击败扩散模型,tokenizer是关键 关键词:模型, 视觉, 语言, 视频, 本文 文章来源:机器之心 内容字数:6122字 内容摘要:机器之心报道编辑:张倩、陈萍。为何语言模型在视觉生成方面落后于扩散模型?来自谷歌、CMU的研究表明,...
语言模型首次战胜扩散模型在图像和视频生成中,tokenizer关键性作用凸显

GPT-4在进行97轮对话后得出P≠NP的结论

最新动态:最新文章分享原标题:GPT-4在97轮对话中探索世界难题,得出P≠NP结论关键词:问题、模式、框架、递归、本文文章来源:机器之心文章长度:3960字内容简介:这篇文章对“LLM for Science”进行了一次有希望的探索。对于从事科研工作的人来说,多少都听说过P/NP问题,这个问题被克...
GPT-4在进行97轮对话后得出P≠NP的结论

DeepMind发现告诉大型模型“深呼吸,一步一步来”为最有效提示

AIGC动态欢迎阅读本文标题为:“告诉大模型「深呼吸,一步一步来」有奇效”,DeepMind发现最有效的提示方法。本文关键词包括:指令、提示、任务、准确率。文章来源:机器之心。本文共4590字,内容摘要如下:本文介绍了一种名为OPRO的简单而有效的方法,该方法利用大型语言模型作为优化器,通过自然语言...
DeepMind发现告诉大型模型“深呼吸,一步一步来”为最有效提示