新一代AI架构Mamba:五倍吞吐量,性能全面超越Transformer 最新报道称,新架构Mamba正席卷AI领域,挑战传统Transformer模型。虽然Transformer长期占据AI大模型主导地位,但随着模型规模和序列长度需求的增加,其局限性逐渐显现。特别是在处理较长序列时,Transformer自注意力机制计算量呈平方级增长,效率低下。为弥补这些缺陷,研究者们... AI工具箱2年前
微软&UCLA&UW联合出品:6141道多模态数学题大全,助你备战“5年高考3年模拟” 本文介绍了由微软、加州大学洛杉矶分校(UCLA)和华盛顿大学(UW)联合出品的全新多模态数学推理基准数据集“MathVista”。该数据集包含6141个数学问题,涵盖各种题型,挑战各种推理方式和图像类型。研究表明,即使是当前最先进的GPT-4V也在应对MathVista时表现出挫败感,准确率为49.... AI工具箱2年前
欧版OpenAI创业180天估值20亿美元,Llama主创独立发展,英伟达参与投资 《AIGC动态》欢迎阅读 原文题目:创业180天估值20亿美元!欧版OpenAI走红,Llama主创创办新公司,英伟达等加入投资 关键词:模型,美元,科学家,公司,贡献者 文章来源:量子位 内容字数:4346字 内容摘要:本文报道自凹非寺量子位记者明敏撰写,公众号 QbitAI。巴黎总部的大型模型初... AI工具箱2年前
斯坦福CMU联合团队发布Transformer模型和代码,公司已成立 本文介绍了由斯坦福和CMU联合团队开发的新型挑战者Mamba,该模型与传统Transformer性能相匹敌,并在处理长文本时具有更高效的性能。Mamba采用了FlashAttention架构,其注意力机制的二次复杂度得到了改善,使得模型具有线性复杂度和更高的推理吞吐量。在语言、音频、DNA序列等多个... AI工具箱2年前
2024年AI行业热点预测及开源趋势全面盘点 AIGC动态欢迎阅读 原标题:深度学牛权威预测2024年人工智能行业热点,盘点开源人工智能趋势! 关键词:模型, 报告, 人工智能, 解读, 作者 文章来源:新智元 内容字数:12295字 内容摘要:新智元报道编辑:润 Alan【新智元导读】AI社区知名人物Sebastian总结了2023年整个年度... AI工具箱2年前
UCLA等发布全新「多模态数学推理」基准MathVista,112页报告深度解析GPT-4V 这篇文章介绍了最新发布的名为MathVista的多模态数学推理基准数据集,以及涵盖112页详细评测报告。该基准对大型多模态模型的数学推理表现进行了专门分析。文章指出,即使是目前最强的GPT-4V模型在这个基准上也表现出一定的困难。这一信息是通过一个资源信息链接提供的,读者可以通过该链接查看详细评测报... AI工具箱2年前
CMU普林斯顿合力推出Mamba新架构,颠覆Transformer霸权,推理速度暴增5倍,解决致命bug AIGC动态欢迎阅读原标题:颠覆Transformer霸权!CMU普林斯顿推出新架构Mamba,解决了致命bug并将推理速度提升5倍关键词:模型、序列、架构、卷积、研究人员文章来源:新智元内容字数:15024字内容摘要:新智元编辑报道:编辑部【新智元导读】CMU和普林斯顿联合推出的Mamba架构可能... AI工具箱2年前
DeepMind联创发布全新一代大模型:5000个H100训练超越GPT-4性能 AIGC动态欢迎阅读 本文原标题为:性能直追GPT-4,5000个H100成功训练!DeepMind联合创始人推出全新一代大型模型。 关键词:模型、基准、性能、表现、人类。 文章来源:新智元。 文章字数:6622字。 文章摘要:新智元报道编辑:拉燕【新智元概要】Inflection-2最新发布!性能... AI工具箱2年前
深入探讨DeepMind、OpenAI创立背后的故事:马斯克、奥特曼、佩奇、哈萨比斯的恩怨情仇 AIGC动态欢迎阅读 原标题:《揭秘DeepMind、OpenAI成立:马斯克、奥特曼、佩奇、哈萨比斯的爱恨情仇》 关键字:微软,创始人,报告,模型,公司 文章来源:大数据文摘 内容字数:19063字 内容摘要:本文由大数据文摘授权转载自夕小瑶科技,作者为王二狗。前段时间,OpenAI内部发生的政权... AI工具箱2年前
Pika Labs创始人揭秘:视频模型技术路线未定,明年预计迎来AI视频的GPT时刻 欢迎阅读AIGC动态 这篇文章专访了Pika Labs的创始人,讨论了视频模型技术的发展方向,指出明年将迎来AI视频领域的关键时刻。 关键词包括视频、模型、独角兽、技术和团队。 文章来源于Founder Park,涵盖内容字数为27504字。 随着技术的进步,每一代技术变革都将推动内容生产的发展。例... AI工具箱2年前
阿里提出降本提效的大模型集成新方法 在夕小瑶科技说发布的一篇文章中,介绍了阿里提出的大模型集成新方法,旨在降低成本、提高效率。随着对大型语言模型(LLM)研究的深入,不再只关注模型性能提升,更关注如何在任务中实现更高效、可靠的性能。为实现更一致的性能提升,将多个LLM集成在一起被认为是一种有效途径。阿里研究团队提出了一种名为ZOOTE... AI工具箱2年前
微软发布Orca2,助您掌握小规模大语言模型的推理技巧! 这篇文章介绍了微软最新发布的小型大语言模型Orca2,以及如何提升这种小型模型的推理能力。文章指出,尽管通常认为语言模型的体量与推理能力成正相关,但小型模型也能展现出色的推理性能。通过解释跟踪等方法训练模型,Orca2在BigBench Hard和AGIEval基准测试中表现出色。研究团队在Orca... AI工具箱2年前
探秘DeepMind和OpenAI的创立,揭示马斯克、奥特曼、佩奇、哈萨比斯之间的情仇恩怨…… AIGC新闻快报本文以“揭秘DeepMind、OpenAI成立,马斯克、奥特曼、佩奇、哈萨比斯的爱恨情仇……”为原标题,探讨了几位科技巨头在人工智能领域的角逐。具体涉及的关键词有微软、创始人、报告、模型和公司。文章来源为夕小瑶科技说,全文共计19423字。文章开篇深入分析了DeepMind和Open... AI工具箱2年前
商汤科技研究副总监龚睿昊:探讨大语言模型量化与LightLLM高性能推理系统设计 AIGC动态欢迎阅读 原文标题:商汤科技研究副总监龚睿昊:大语言模型量化和LightLLM高性能推理部署系统设计 本文内容来源于AI导航。 本文内容字数为1903字。 本文内容摘要:12月5日上午10点,智猩猩AI教研组推出了“大模型微调与推理部署线上闭门会”。闭门会由北京航空航天大学人工智能研究院... AI工具箱2年前
字节月底推出生成式AI开发平台;马斯克旗下Grok将在一周左右向X订阅用户开放;王慧文投资大型AI创企丨AIGC大事日报 本文介绍了一系列关于人工智能产业的最新动态,包括字节跳动推出AI机器人开发平台、马斯克的Grok即将向X订阅用户开放、王慧文入股大型AI创企等。文章总字数达到9490字,内容来源于AI导航。其中重要的信息包括谷歌Gemini推迟发布、微软Copilot全面上市、OpenAI GPT商店推迟上线等。此... AI工具箱2年前
揭秘OpenAI Q*:通往人工通用智能的信仰之路 本文为介绍了OpenAI Q模型的文章摘要。根据文章内容,OpenAI的科学家在Q模型上取得重要突破,可能对人类文明构成威胁。一些人认为Q意味着OpenAI已接近实现AGI,也有人认为这只是炒作。文章提到了通过研究解码Q的过程,分析了对AI产业和人类社会的意义。作者欢迎读者指正,同时提供了原文链接和... AI工具箱2年前
全球首个开源多模态医疗基础模型:打分超越GPT-4V,支持2D/3D放射影像 文章介绍了上海交大上海AI Lab发布的Radiology Foundation Model (RadFM)。这是全球首个开源多模态医疗基础模型,具有超越GPT-4V的人工打分平均能力,并支持2D/3D放射影像输入。该模型开源了14B多模态医疗基础模型,为医疗领域的发展提供了新的可能性。读者可通过链... AI工具箱2年前
北京大学在NeurIPS 2023提出新的类别级6D物体姿态估计范式,刷新最优结果 本文来自机器之心专栏作者张继耀,报道了北京大学研究者在NeurIPS 2023上提出的类别级6D物体位姿估计新范式取得的最新研究成果。类别级6D物体位姿估计是计算机视觉领域中一个重要的问题,在机器人、虚拟现实和增强现实等领域有广泛的应用。传统的实例级物体位姿估计受限于需要事先了解物体特性,难以适用于... AI工具箱2年前
LoRA教程:小型模型微调更划算 本文来自机器之心,原标题为《不是大模型全局微调不起,只是LoRA更有性价比,教程已经准备好了》,内容涉及到神经网络模型参数调整的高效方法LoRA技术。LoRA技术相当于在大模型基础上增加可拆卸的插件,轻巧便捷。对于微调大语言模型来说,LoRA是广泛且有效的方法之一。该技术有效解决了大模型微调的成本和... AI工具箱2年前
资深学者共同研发的纯CV大模型在UC伯克利呈现通用视觉推理突破 新闻来自机器之心,题为“通用视觉推理显现,UC伯克利炼出单一纯CV大模型,三位资深学者参与”。文章介绍了UC伯克利和约翰霍普金斯大学的研究者最新论文中探讨的内容,展示了大型视觉模型(LVM)在多种CV任务中的应用潜力。最近,大型语言模型(LLM)如GPT和LLaMA备受关注,而构建大型视觉模型(LV... AI工具箱2年前
AIGC算法揭秘与实际产业应用分享 本文介绍了AIGC算法的应用以及产业落地分享。在智能服务领域,大模型被认为是最适合的应用之一。京东利用大模型升级了智能客服、交互式营销、数字人等产品,并在实际场景中取得了显著成果。在本次的“极客有约”对话节目中,讨论了大模型在智能服务领域落地的要点。大模型的优点在于数据需求相对较低,能够更接近端到端... AI工具箱2年前
Transformer大模型3D可视化:GPT-3和Nano-GPT每一层清晰呈现 本文介绍了一个有关Transformer大模型的3D可视化图,展示了GPT-3和Nano-GPT每一层的清晰结构。软件工程师Brendan Bycroft制作了一个“大模型工作原理3D可视化”网站,让人们能够更直观地了解这些大型模型是如何运作的。文章中描述了1750亿参数的GPT-3模型,包含8列层... AI工具箱2年前
UC伯克利三巨头发布首个纯计算机视觉大模型,引发AGI火花 欢迎阅读AIGC动态 原文标题:UC伯克利的计算机视觉GPT时刻!三位专家推出首个纯视觉大模型,引发人工智能火花 关键词:研究人员,序列,视觉,模型,图像 文章来源:新智元 内容字数:16210字 新智元报道编辑:编辑部【新智元导读】UC伯克利的计算机视觉三位专家共同推出了首个无自然语言的纯视觉大模... AI工具箱2年前
哈工深发布多模态大模型「九天」,性能直升5%,横扫13个视觉语言任务! <img src=""> 阅读AIGC动态的最新消息 近日,哈工深发布了名为「九天」的多模态大模型,在13个视觉语言任务上取得令人瞩目的进展,性能提升了5%。这一成果融合了细粒度空间感知和高层语义视觉知识,为多模态大语言模型领域带来了新的突破。 该研究由哈尔滨工业大学... AI工具箱2年前
字节联合中科大:多模态文档大模型突破分辨率极限 这篇文章讨论了由字节跳动和中国科学技术大学合作研究的多模态文档大模型DocPedia。该模型于2023年11月24日上传至arXiv,具有高分辨率和多模态特点,能够准确识别图像信息并结合用户需求。相较于目前业内先进模型,如LLaVA、MiniGPT-4等,DocPedia具有更高的分辨率,达到256... AI工具箱2年前
王慧文病休后首次行动,决定入股OneFlow团队的新创业项目 AIGC动态欢迎阅读标题:王慧文疗养期后的新动向:入股OneFlow团队的新创业项目关键词:模型、团队、科技、人工智能、公司文章来源:量子位字数:3664字内容摘要:王慧文在疗养近6个月后迎来了新的动作,与袁进辉再次合作,入股了他的创业新公司硅动科技。根据企查查公开资料,北京硅动科技有限公司(以下简... AI工具箱2年前
GPT-4阅读理解水平颠覆其他大模型 AIGC动态欢迎阅读 近日,量子位发布了一篇名为“文字序顺不响影GPT-4阅读理解,别的大模型都不行”的文章,讨论了汉字序列顺序并不影响阅读理解的问题,这同样适用于GPT-4这一大型模型。研究人员发现,即使是一段被大幅打乱顺序的文字,GPT-4也可以准确还原原始句子,并且在进行提问时也能正确理解并给... AI工具箱2年前
谷歌DeepMind号称碾压ChatGPT的模型今年停用,背后原因令人嘘唏… <img src=""> AIGC动态欢迎阅读 原标题:谷歌DeepMind重金打造、号称碾压ChatGPT的模型今年要“无了”,背后原因令人嘘唏… 关键词:模型、技术、进路、微软、英语 文章来源:人工智能学家 内容字数:4188字 内容摘要:夕小瑶科技称,硅谷权威科... AI工具箱2年前
OpenAI科学家Andrej Karpathy推荐:23年来必读的大语言模型论文清单 阅读内容介绍了OpenAI科学家Andrej Karpathy推荐的23篇必读大语言模型论文清单。Andrej在一段视频中详细介绍了语言模型的训练和应用,以及未来的研究方向和概念。视频由oxen.ai整理了相关阅读清单,以帮助观众更好地理解视频内容。建议观看视频后再查看阅读清单,以充分了解Andre... AI工具箱2年前
男性角色在大型角色扮演游戏中的效果比女性角色更胜一筹? <img src=""> AIGC动态欢迎阅读 原标题:大模型角色扮演是否存在偏好?男性角色是否胜于女性角色? 关键词:角色、提示、模型、问题、作者 文章来源:夕小瑶科技说 内容字数:7923字 内容摘要:夕小瑶科技说 原创作者 | 谢年年、python 我们在设计提... AI工具箱2年前
学会使用Llama2的5个简单步骤 欢迎阅读AIGC的最新动态 本文原标题为:“Meta教你5步学会用Llama2:我见过最简单的大模型教学” 关键词:模型、脚本、任务、步骤、权重 文章来源:机器之心 内容字数:7485字 文章摘要:这篇文章来自Meta官网,介绍了如何在项目中充分利用Llama2的教学博客。文中详细探讨了Llama2... AI工具箱2年前
迎接未来:首个多视图预测与规划的自动驾驶世界模型 本文介绍了最新的自动驾驶技术——多视图预测和规划自动驾驶世界模型。该模型通过多视图世界模型,可以预测不同规划路线的未来情景,并根据视觉预测获取奖惩反馈,从而提高自动驾驶系统的安全性。研究团队提出的 Drive-WM 模型旨在增强端到端自动驾驶规划的安全性。近期在 CVPR2023 自动驾驶研讨会上,... AI工具箱2年前
谷歌推出手机超快扩散模型MobileDiffusion,实现0.2秒出图功能 人工智能与图像生成的最新进展 原文标题:谷歌推出MobileDiffusion模型,手机上仅需0.2秒生成图像 关键词:MobileDiffusion, 卷积, 特征, 参数, 下游 文章来源:机器之心 字数统计:5200字 文章摘要:机器之心编辑部报道,谷歌最新推出的MobileDiffusion... AI工具箱2年前
Meta谷歌跨语种AI同传技术惊艳亮相,革新语音翻译领域 AI动态:Meta和谷歌重大突破,颠覆语音翻译领域 原文标题:跨语言「AI同传」震撼登场!Meta和谷歌取得重要进展,颠覆语音翻译 关键词:语音识别,语言翻译,编码器,模型,解码器 文章来源:新智元 字数:7071字 摘要:新智元编辑报导:好困【导读】Meta和谷歌相继发布重要成果!Meta公布开源... AI工具箱2年前
CMU提出可追溯溯源的AI文本判别器模型 欢迎阅读AIGC动态 原文标题:追踪溯源?可定位源头模型的AI文本判别器出现了!CMU提出 关键词:文本,任务,报告,模型,作者 文章来源:夕小瑶科技说 字数:7499字 内容摘要:自从去年底ChatGPT发布以来,大型语言模型(LLM)的应用范围越来越广,从写小说、撰写文案和报告,到编写代码,在各... AI工具箱2年前
微软发布Orca 2,小模型推理性能超越10倍参数模型,已开源 欢迎阅读AIGC动态 原文标题:微软推出小型模型推理进阶版:Orca 2性能与参数量提升10倍的模型,已公开发布 关键词:模型、研究人员、任务、能力、策略 文章来源:机器之心 字数:7673字 内容摘要:机器之心的报道指出,借助大规模语言模型教授较小规模语言模型进行推理,将事半功倍。诸如GPT-4、... AI工具箱2年前
通用问答模型开源,参数规模达720亿;Meta推出多模态感知数据集;昆仑万维发布Agent开发平台|AIGC大事日报 AIGC动态欢迎阅读 本文转载自AI导航,原标题为:通义千问720亿参数大模型开源;Meta发布多模态感知数据集;昆仑万维发布Agent开发平台丨AIGC大事日报。文章内容涵盖了全球AIGC产业的重要动态,包括Meta开源实时翻译系列模型Seamless、Meta推出音频生成模型Audiobox、M... AI工具箱2年前
北航、MIT、莫纳什、商汤专家线上直播:大模型微调与推理部署探讨 本文介绍了AI导航举办的线上闭门会,邀请了北航、MIT、莫纳什和商汤四位专家在线直播探讨大型模型的微调与推理部署的话题。随着深度学习技术的快速发展,大型基础模型在图像识别、自然语言处理等任务中取得了显著突破,展现出巨大潜力。然而,这些大模型通常具有庞大的参数量和计算量,对其在实际应用中提出了挑战。因... AI工具箱2年前
AI美术完成度超80%!为何游戏模型无法通用?三七互娱独家揭秘 本文介绍了AIGC在游戏领域的应用,特别聚焦于AI美术完成度超过80%时,为何游戏模型无法通用的问题。通过三七互娱的独家揭秘,讨论了AI技术对游戏开发和体验优化带来的影响。文章由量子位智库发表,深度访谈了三七互娱技术中心数据副总裁王传鹏对于AIGC游戏先行者认知的分享。王传鹏毕业于北京航空航天大学计... AI工具箱2年前
全新免费开源模型发布:国产720亿参数挑战Llama2 70B!独家实测报告揭秘 欢迎阅读AIGC最新动态 原标题:国产720亿参数开源免费模型隆重登场!与Llama2 70B相媲美,且一手实测结果尽在这里。 关键词:模型、阿里、逻辑推理、能力、领域 文章来源:量子位 文章长度:8477字 内容摘要:作者发自凹非寺的量子位公众号QbitAI。最强开源大型模型再次亮相!近日,阿里云... AI工具箱2年前