上下文

共 53 篇文章

EMNLP投稿数量近5000篇，北大、腾讯斩获最佳长论文奖

阅读AIGC动态的最新消息最新标题：EMNLP投稿近5000篇，北大、腾讯荣获最佳长论文奖关键词：腾讯、论文、研究者、上下文、效用文章来源：机器之心文章字数：6821字文章摘要：根据机器之心的报道，本届 EMNLP 大会在投稿数量上取得了新突破，并且整体接收率有所提升。EMNLP 是自然语言处理领域...

AI工具箱3年前

EMNLP投稿数量近5000篇，北大、腾讯斩获最佳长论文奖

揭秘：一句话引爆100k+上下文大模型潜能，27分提升至98，GPT-4、Claude2.1完美适用

<img src=""> 欢迎阅读AIGC动态本文原标题为“一句话解锁100k+上下文大模型真实力，27分涨到98，适用于GPT-4和Claude2.1”。关键词包括：测试、上下文、模型、公司、句子。文章来源为《量子位》。本文共计3272字。内容摘要：最近，...

AI工具箱3年前

揭秘：一句话引爆100k+上下文大模型潜能，27分提升至98，GPT-4、Claude2.1完美适用

北大微信AI联合团队再获EMNLP最佳长论文：揭秘大模型上下文学习机制

AIGC动态欢迎您的阅读原文标题：中国团队再获EMNLP最佳长论文！北大微信AI联合揭秘大模型上下文学习机制关键词：模型、标签、论文、信息、上下文文章来源：量子位文章字数：3701字内容摘要：最近，北大微信AI团队荣获EMNLP顶会最佳长论文奖。该论文由北大的孙栩老师与微信的周杰、孟凡东共...

AI工具箱3年前

北大微信AI联合团队再获EMNLP最佳长论文：揭秘大模型上下文学习机制

贾佳亚团队新研究：AI成为鉴片大师，星际穿越也能轻松看懂超长3小时视频

AIGC动态欢迎阅读本文来源于量子位，介绍了贾佳亚团队最新研究成果：他们开发的多模态大模型LLaMA-VID可以处理超长视频，使得AI能够像专业影评人一样理解电影，比如《星际穿越》，并对电影中的细节进行准确回答。这项研究的背后原理简单却高效，将每一帧图像的表示压缩到仅有2个token。与其他同类模...

AI工具箱3年前

贾佳亚团队新研究：AI成为鉴片大师，星际穿越也能轻松看懂超长3小时视频

Llama 2 准确率提升至 80.3%：Meta 引入全新注意力机制 S2A，显著削减模型幻觉

本文介绍了Meta提出的全新注意力机制S2A，以大幅降低模型幻觉，提高了LLM回答问题的事实性和客观性。文章指出当前大型语言模型存在的问题，如偏见、幻觉、推理能力不足等，并探讨了新方法带来的改变。此外，文章提供了原文链接以供阅读。若想联系作者，可以通过微信号AI_era了解更多内容。整体内容来自新智...

AI工具箱3年前

Llama 2 准确率提升至 80.3%：Meta 引入全新注意力机制 S2A，显著削减模型幻觉

Claude 200K产品性能被严重「虚标」？1016美元实测后性能暴跌至90K

本文为《新智元》报道的一篇关于Claude 2.1模型的文章。根据报道，该模型在上下文长度达到90K后表现出明显的性能下降。此前有人投入1016美元测试后发现这一现象。与OpenAI不同，竞争对手Anthropic发布了支持200K上下文的Claude 2.1，它将原本强大的100K上下文能力提升了...

AI工具箱3年前

Claude 200K产品性能被严重「虚标」？1016美元实测后性能暴跌至90K

Transformer架构再升级：Meta推出更智能的注意力机制

本文介绍了Meta针对Transformer架构进行的调整，尤其是引入了新的注意力机制，旨在增强推理能力。传统的大型语言模型(LLM)虽然功能强大，但有时仍会在推理方面表现不佳，容易受到不相关上下文或输入提示的影响。为了解决这一问题，Meta提出的System 2 Attention机制旨在更好地处...

AI工具箱3年前

Transformer架构再升级：Meta推出更智能的注意力机制

ChatGPT竞品最新升级：对话长度翻倍，API价格降低近三成

AIGC动态欢迎阅读原文标题：ChatGPT最强竞争对手更新！上下文长度翻倍，API降价近30% 关键词：小米，上下文，版本，长度，幻觉文章来源：量子位内容字数：3741字内容摘要：克雷西发自凹非寺量子位 | 公众号 QbitAI OpenAI开发者大会之后不久，ChatGPT的主要竞争...

AI工具箱3年前

ChatGPT竞品最新升级：对话长度翻倍，API价格降低近三成

Anthropic发布Claude 2.1：让你在攻其不备中脱颖而出

欢迎阅读AIGC动态本文原标题为：攻其不备：Anthropic发布Claude 2.1 关键词包括：上下文、模型、窗口、前身、答案文章来源：AI范儿全文共计3096字，内容摘要如下：Anthropic发布了Claude 2.1，拥有巨大的上下文窗口，提供更强大的语言模型和机器人。相对于其前身，...

AI工具箱3年前

Anthropic发布Claude 2.1：让你在攻其不备中脱颖而出

提升大模型能力：利用检索增强生成的Python实现指南

本文源自《机器之心》，介绍了如何通过检索增强生成（RAG）让大型语言模型（LLM）更加强大的内容。RAG的概念是利用外部知识源为LLM提供额外信息，使其可以生成更准确、符合上下文的答案，并减少幻觉。文章首先讨论了人们如何有效整合LLM的一般性知识与专有数据，引出了微调和RAG哪个更合适的讨论。随后详...

AI工具箱3年前

提升大模型能力：利用检索增强生成的Python实现指南

哈工大华为联合打造的大型模型「幻觉」，详细解读就在这篇文章中！

<img src=""> AI GC动态欢迎阅读原文标题：《大模型「幻觉」，看这一篇就够了 | 哈工大华为出品关键词：幻觉，模型，上下文，小米，华为文章来源：量子位内容字数：7309字内容摘要：最新系统综述探讨了大模型“幻觉”，全面阐述了幻觉的定义、分类、...

AI工具箱3年前

哈工大华为联合打造的大型模型「幻觉」，详细解读就在这篇文章中！

1分钟诞生一个全新的GPT！3天内推出定制GPT，理想型男友、科研利器引爆全网热议

本文来自新智元的报道，题为《1分钟诞生一个新GPT！3天内定制GPT大爆发，理想型男友、科研利器全网刷屏》，全文6081字。在过去的短短3天里，全球见证了GPT应用的爆发，各种定制版GPT如雨后春笋般涌现，其增长速度远超预期。这说明了Altman在开发者大会上所言的“我们正在孕育新物种，它们正在迅速...

AI工具箱3年前

1分钟诞生一个全新的GPT！3天内推出定制GPT，理想型男友、科研利器引爆全网热议

GPT-4 Turbo开放给用户：速度快、效率高、节省成本

最近，OpenAI推出了GPT-4 Turbo，这是GPT-4模型的一个更加便宜、快速和智能的升级版本。新模型的成本大幅降低，并提供了更大的上下文窗口和扩展的API功能，包括图像处理和文本转语音。GPT-4 Turbo的发布标志着人工智能领域的一次重要进步，为未来技术发展奠定了基础。在OpenAI开...

AI工具箱3年前

GPT-4 Turbo开放给用户：速度快、效率高、节省成本

GPT4 Turbo的128K上下文实用性存疑？专家投入巨资评测，斯坦福论文提供支持

本文来自夕小瑶科技说，最近AI圈子里最受关注的话题之一是OpenAI在首届开发者日推出了GPT-4的加强版GPT-4 Turbo。GPT-4 Turbo带来了诸多升级，其中最引人注目的是上下文长度增至128K，相比GPT-4的32K上下文长度，提升了四倍。对于GPT-4 Turbo的这一升级，有人质...

AI工具箱3年前

GPT4 Turbo的128K上下文实用性存疑？专家投入巨资评测，斯坦福论文提供支持

OpenAI首届AI春晚：创业公司之夜，GPT-4大爆更新，API价暴跌!

<img src=""> 专题：AIGC动态这是一则关于OpenAI的最新动态。OpenAI的首届AI开发者大会吸引了众多创业公司参与，会上发布了强大的GPT-4 Turbo模型，以帮助开发者创作并实现盈利。此外，API定价也有大幅度调整，让人热情高涨。关键词：模...

AI工具箱3年前

OpenAI首届AI春晚：创业公司之夜，GPT-4大爆更新，API价暴跌!

马斯克发布第二款AI产品PromptIDE，Grok的开发紧密依赖于它

最近，马斯克发布了第二款AI产品PromptIDE，这是xAI团队推出的另一款人工智能产品。这款产品是一个集成开发环境，可用于prompt工程和解释性研究。不久之前才发布了Grok，现在又有了这个全新的产品，看来xAI团队的开发速度确实惊人。PromptIDE的推出再次引起了人们对xAI团队的关注，...

AI工具箱3年前

马斯克发布第二款AI产品PromptIDE，Grok的开发紧密依赖于它

DeepMind称Transformer模型泛化能力受预训练数据限制，引发质疑

本文报道来自机器之心的一篇关于DeepMind指出Transformer在超出预训练数据范围时无法实现泛化能力的文章。该文章探讨了大语言模型在提供上下文样本的情况下，通过输入生成响应的能力，以及Transformer模型在这一过程中的作用。同时，对于Transformer无法在预训练数据之外实现泛化...

AI工具箱3年前

DeepMind称Transformer模型泛化能力受预训练数据限制，引发质疑

OpenAI正式发布强大的ChatGPT-4，全新升级版GPT商店现已上线，价格大幅优惠！

AIGC动态欢迎阅读近日，OpenAI宣布推出更强大的GPT-4，并将在“GPT商店”上线该产品，价格更为亲民。这一消息引发了业界的高度关注。 ChatGPT在首届开发者日上推出了定制版GPT，CEO山姆·奥特曼现场演示了“创业导师GPT”的惊人能力。这一版本的GPT可根据用户需求进行个性化定制，...

AI工具箱3年前

OpenAI正式发布强大的ChatGPT-4，全新升级版GPT商店现已上线，价格大幅优惠！

OpenAI推出更强GPT-4、GPT商店、Agent工具、API降价！助您抢占AI生态位

AIGC动态欢迎阅读原题：抢占生态位！更强GPT-4、GPT商店、Agent工具、API降价！OpenAI开发者大会开启AI大规模落地关键词：报告、开发者、模型、函数、上下文文章来源：Founder Park 字数：4904字内容摘要：OpenAI DevDay被誉为首届AI春晚，在旧金山举...

AI工具箱3年前

OpenAI推出更强GPT-4、GPT商店、Agent工具、API降价！助您抢占AI生态位

ChatGPT再升级！全新的GPT-4版本正式发布，API价格大幅下调，发布会现场掌声连连

AIGC动态欢迎阅读本文来源自量子位，介绍了ChatGPT王炸升级的消息。OpenAI在首届开发者日上发布了更强版本的GPT-4，并将推出“GPT商店”与创作者分享收入。CEO山姆·奥特曼亲自演示了如何使用定制GPT创建“创业导师GPT”，引起了现场观众的热烈掌声。新的GPT不仅可以在公司内部分享，...

AI工具箱3年前

ChatGPT再升级！全新的GPT-4版本正式发布，API价格大幅下调，发布会现场掌声连连

李开复亲自推出零一万物大模型，AI 2.0 即将问世

AIGC动态欢迎阅读以下内容为AI科技评论提供：近日，李开复创办的AI 2.0公司零一万物发布了Yi系列模型，其中包含34B和6B两个版本。这次发布的模型在参数量和性能上都表现出色，尤其是Yi-34B，仅使用了不到LLaMA2-70B一半和Falcon-180B五分之一的参数量，却实现了对LLa...

AI工具箱3年前

李开复亲自推出零一万物大模型，AI 2.0 即将问世

零一万物发布全球首个开源模型，李开复详解AI 2.0的商业思维

<img src="">AIGC动态欢迎阅读原标题：零一万物发布全球首个开源模型，李开复探讨AI 2.0商业思维关键词：模型、万物、文本、上下文、能力文章来源：创始人公园文章长度：6286字内容摘要：李开复于3月提出AI 2.0，认为大型模型将带来平台级创新机会，重新...

AI工具箱3年前

零一万物发布全球首个开源模型，李开复详解AI 2.0的商业思维

李开复发布「全球最强」开源大模型：支持处理40万汉字，同时中英双语霸榜

AIGC动态欢迎阅读原文标题：李开复正式宣布推出“全球领先”的开源大型模型：同时处理40万汉字，中英文双语霸榜关键词：模型、万物、上下文、窗口、能力文章来源：机器之心内容字数：4833字内容摘要：编辑部门刊机器之心报道中提到，李开复在正式宣布“零一万物”大型模型公司进军全球大模型领域的第一...

AI工具箱3年前

李开复发布「全球最强」开源大模型：支持处理40万汉字，同时中英双语霸榜

OpenAI DevDay活动提前曝光了大量新功能信息

在此处是一篇关于OpenAI DevDay的文章内容。根据原始信息，OpenAI DevDay即将发布的ChatGPT创新功能包括全新用户界面、自定义机器人工具Gizmo、企业订阅计划、工作区功能和上下文连接器。这些升级将推动ChatGPT在人工智能消费市场上迈向新的高度。即将举行的OpenAI首次...

AI工具箱3年前

OpenAI DevDay活动提前曝光了大量新功能信息

OpenAI揭秘：王者GPT-4横空出世，拥有32k上下文，首次亮相开发者大会！

在新智元报道中，报道了OpenAI首届开发者大会的最新爆料。ChatGPT推出了全新的UI界面，使得每个人都能够自定义GPT，这将带动“智能体工程师”这一新职业的诞生。同时，马斯克的xAI大型模型也已经开始了广泛的内测。在这个备受关注的开发者大会上，ChatGPT的两大新能力也悄然揭晓：一是可以上传...

AI工具箱3年前

OpenAI揭秘：王者GPT-4横空出世，拥有32k上下文，首次亮相开发者大会！

OpenAI首届开发者大会揭开面纱：全新ChatGPT原型Gizmo曝光

本文来源于机器之心，报道编辑为杜伟和大盘鸡。OpenAI首席执行官Sam Altman宣布了首届开发者大会「OpenAI DevDay」的消息。在这次大会上，OpenAI团队将与全球开发者分享全新的AI工具。虽然Sam Altman表示不会发布GPT-5或GPT-4.5等产品，但仍承诺会推出一些非常...

AI工具箱3年前

OpenAI首届开发者大会揭开面纱：全新ChatGPT原型Gizmo曝光

马斯克“曝光”幽默感爆棚的xAI「阴阳怪气」大模型，ChatGPT重大更新提前曝光

最新动态：AIGC引人关注原文题目：特斯拉创始人突然公布xAI「幽默十足」大型模型，令人捧腹大笑！ChatGPT迎来重大更新提前曝光关键词：机器人，上下文，工作，模型资讯来源：新智元字数统计：全文共4512字内容摘要：新智元报道编辑：好困 Aeneas【新智元导读】特斯拉创始人推出xAI大型模型，将...

AI工具箱3年前

马斯克“曝光”幽默感爆棚的xAI「阴阳怪气」大模型，ChatGPT重大更新提前曝光

Baichuan2-192K：全球最强大长文本模型，一次可识别35万汉字

近日，国内大模型创业公司百川智能正式发布了Baichuan2-192K长窗口大模型，这一消息备受关注。该模型拥有前所未有的处理能力，一次可读取长达35万汉字的文本，将大语言模型（LLM）上下文窗口的长度提升至192K token。这意味着，相较于GPT-4（32K token，约2.5万字），Bai...

AI工具箱3年前

Baichuan2-192K：全球最强大长文本模型，一次可识别35万汉字

百川智能新品发布：Baichuan2-192K上下文窗口最长，一次超越Claude2输入35万字

AIGC动态欢迎阅读本文转载自量子位，原标题为：“百川智能推出全球最长上下文窗口大模型Baichuan2-192K，一次可输入35万字超越Claude2”。文章介绍了新发布的Baichuan2-192K大模型，其上下文窗口长度达到192K，是目前全球最长的上下文窗口之一。Baichuan2-192...

AI工具箱3年前

百川智能新品发布：Baichuan2-192K上下文窗口最长，一次超越Claude2输入35万字

Meta普林斯顿提出LLM上下文终极解决方案：让模型成为自主智能体，自行阅读上下文节点树

<img src=""> AI动态分享原标题：Meta普林斯顿提出LLM上下文终极解决方案！让模型化身自主智能体，自行读取上下文节点树。关键词：节点，团队，上下文，内存，基线。文章来源：新智元内容字数：9800字内容摘要：新智元报道编辑：润。LeCun转发了...

AI工具箱3年前

Meta普林斯顿提出LLM上下文终极解决方案：让模型成为自主智能体，自行阅读上下文节点树

测试你的GPU是否能够运行Llama 2等大模型，快来试试这个开源项目吧

此文介绍了一个开源项目，可以帮助用户测试他们的GPU是否能够运行大模型，比如LLama 2。在GPU算力至关重要的今天，许多人很难确定他们的GPU是否足够强大来运行大型模型。本文提到了一个项目，可以帮助用户提前查看自己的GPU内存是否足够。文章来源于《机器之心》，作者是陈萍，内容字数为3295字。读...

AI工具箱3年前

测试你的GPU是否能够运行Llama 2等大模型，快来试试这个开源项目吧

UC伯克利团队发布MemGPT大模型的上下文内存管理方案，同时开源AgentLM、多模态Fuyu-8B以及数学LLEMMA等专用大模型

<img src=""> 【AIGC动态】欢迎阅读原标题：UC伯克利团队开源MemGPT大模型上下文内存管理方案；AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源关键词：模型、数据、上下文、能力、智能文章来源：机器之心内容字数：9138字...

AI工具箱3年前

UC伯克利团队发布MemGPT大模型的上下文内存管理方案，同时开源AgentLM、多模态Fuyu-8B以及数学LLEMMA等专用大模型

LLaMA2模型上下文长度扩展至100万tokens，仅需调整一个超参数｜复旦邱锡鹏团队力作

AI 前沿信息原标题：复旦邱锡鹏团队调整一个超参数，LLaMA2上下文长度达100万tokens 关键词：模型、长度、位置、底数、上下文文章来源：量子位字数：5019 字内容摘要：最新研究发现，只需微调一个超参数，LLaMA 2 模型上支持的上下文长度从1.6 万 tokens 延长至 10...

AI工具箱3年前

LLaMA2模型上下文长度扩展至100万tokens，仅需调整一个超参数｜复旦邱锡鹏团队力作

英伟达发布了最新开源Agent：利用GPT-4训练的机器人，在处理越复杂任务时表现更加出色

欢迎阅读AIGC动态以下内容来自量子位：近日，英伟达发布了最新的AI Agent - Eureka，该Agent通过GPT-4训练，表现出色。使用生成奖励函数的方法，Eureka完成了超过三十个复杂任务，包括快速转笔、打开抽屉和柜子、抛掷和接球等。其中，转笔这一技能尤为引人注目，因为即使是人类逐...

AI工具箱3年前

英伟达发布了最新开源Agent：利用GPT-4训练的机器人，在处理越复杂任务时表现更加出色

将LLM视作操作系统，它获得无限的「虚拟」上下文，伯克利新作已获1.7k星称赞

欢迎阅读AIGC动态原标题：将LLM视为操作系统，赋予其无限"虚拟"上下文，伯克利的新作已收获1.7k星关键词：上下文，研究者，智能，任务，下文文章来源：机器之心内容字数：6439字内容摘要：机器之心编辑：杜伟、小舟如今，赋予大型语言模型更强大的上下文处理能力是业界极为关注的热点。本文介绍了加州大学...

AI工具箱3年前

将LLM视作操作系统，它获得无限的「虚拟」上下文，伯克利新作已获1.7k星称赞

优化基础LLM技术：Meta版ChatGPT为长上下文提供持续预训练

AIGC动态欢迎阅读原标题：「Meta版ChatGPT」背后的技术：持续预训练改进基础LLM处理长上下文的能力关键词：模型、上下文、长上、任务、下文文章来源：机器之心内容字数：10932字内容摘要：机器之心报道编辑 Panda W 在处理长上下文方面指出，LLaMA 在一直力有不足，而通过...

AI工具箱3年前

优化基础LLM技术：Meta版ChatGPT为长上下文提供持续预训练

抛弃「浪费」GPU，FlashAttention重磅升级，长文本推理速度提升8倍

在机器之心报道中，编辑部使用大型模型处理长文本，面临着速度挑战。最新的FlashAttention技术通过"Flash-Decoding"方法，充分利用GPU，可以将大模型的长上下文推理速度提高至8倍。近期大型语言模型（LLM）如ChatGPT和Llama备受关注，但其运行成本仍...

AI工具箱3年前

抛弃「浪费」GPU，FlashAttention重磅升级，长文本推理速度提升8倍

AI 天才杨植麟发布长模型产品，特点：长长长长长

<img src=""> AI模型革新：杨植麟打造超长文本产品原标题：AI 天才杨植麟推出长篇大作关键词：模型、上下文、清华、文本长度文章来源：量子位文章字数：8018字内容摘要：杨植麟推出的万字级大模型产品支持长达20万字的文本输入，堪称全球最长。此举刷新...

AI工具箱3年前

AI 天才杨植麟发布长模型产品，特点：长长长长长

杨植麟：千亿大模型迈入“长文本”时代，支持20万字输入 | 甲子光年

本文介绍了关于杨植麟及其在大模型和长文本领域的重要性的内容。杨植麟作为中国AI领域的重要人物之一，其在自然语言处理领域的突出贡献备受瞩目。文章详细介绍了他在科技领域的影响力和重要性。如需了解更多相关信息，请阅读原文链接。同时，文末提供了作者的联系方式和个人简介，为读者提供更多深入了解的机会。

AI工具箱3年前

杨植麟：千亿大模型迈入“长文本”时代，支持20万字输入 | 甲子光年

杨植麟的新公司打造世界最大对话框容量，引领大模型「长」时代

欢迎阅读AIGC动态原标题：大规模模型引领“长”时代，杨植麟的新公司将对话框容量提升至全球领先地位。关键词：模型、上下文、窗口、解读、能力文章来源：机器之心内容字数：11427字内容摘要：近日，大规模模型初创公司Anthropic成功获得了亚马逊的投资，成为引领大规模模型领域的一大事件。与...

AI工具箱3年前

杨植麟的新公司打造世界最大对话框容量，引领大模型「长」时代

1 2