全球首款支持输入20万字的大模型发布:轻松处理多个文档及大篇幅小说 阅读AIGC动态的最新内容 原标题:全球首个支持输入20万字的大型模型面世!可连续阅读数十份文档或一部20万字的小说 关键词:模型、能力、文本、上下文、技术突破 本文来源:AI科技评论 字数统计:4418字 本文摘要:本文作者为李扬霞,编辑为陈彩娴。于10月9日,⽉之暗⾯创始人杨植麟发布了一款名为M... AI工具箱3年前
月之暗面融资超过2亿美元,发布面向C端Super-App的超长文本模型产品 <img src=""> 欢迎阅读AIGC动态 本文原标题为:融资超过2亿美元,月之暗面发布超长文本模型产品,旨在打造面向C端的Super-App。 关键词:模型、上下文、产品、数据、技术。 文章来源:Founder Park。 文章字数:5937字。 文章摘要:国内... AI工具箱3年前
Hugging Face 大型语言模型的性能优化 <img src=""> AIGC动态欢迎阅读 本文原标题为:《Hugging Face 大语言模型优化技术》。 关键词:模型、算法、语言、标记、上下文。 文章来源:AI前线。 内容字数:3333字。 摘要:本文作者Sergio De Simone介绍了Hugging... AI工具箱3年前
LLaMA2上下文扩展至100k:MIT和港中文引入LongLoRA方法 欢迎阅读AIGC动态 原标题:MIT和香港中文学院的研究者开发出了名为LongLoRA的方法,将LLaMA2模型的上下文扩展至100k 关键词:上下文、模型、研究者、长度、长上 文章来源:机器之心 内容字数:6020字 内容摘要:机器之心报道,编辑部成功扩展了大型模型的上下文长度,无需消耗过多计算资... AI工具箱3年前
西交、清华等高校发布多模态大模型,或将成为「DALL·E 4」技术路线的发展方向?AI领域将迎来新突破! 近日,新智元报道了一项引起关注的新工作,即DreamLLM项目,该项目实现了协同学习的多模态理解和生成,能够端到端进行生成和理解。这一技术使得生成+理解的大语言模型变得可能,让人们开始思考这是否有望成为未来「DALL·E 4」的技术发展方向。 DreamLLM在同一天发布,引发了社区的关注,该技术为... AI工具箱3年前
LLaMA新版强势升级!仅调整一个超参数,实现上下文32,000个token,在多任务中力压ChatGPT和Claude 2 AIGC动态欢迎阅读本文为《量子位》报道,题为《最强LLaMA突然来袭!只改一个超参数,实现上下文3.2万token,多个任务打败ChatGPT、Claude 2》。文章介绍了LLaMA 2 Long与GPT-4持平,上下文长度达3.2万token,性能超越LLaMA 2,在多项测试中超过了Chat... AI工具箱3年前
Transformer如何实现上下文学习能力? 本文来自机器之心,专题为《Transformer的上下文学习能力是哪来的?》。文章从对 Transformer 模型在深度学习中的主导地位展开讨论,指出其在语言模型中表现优异的原因之一是其擅长上下文学习(In-Context Learning)。文章联系了来自 Google AI、苏黎世联邦理工学院... AI工具箱3年前
扩展大模型在prompt中学习示例的方法可以增加输入字符长度 本文介绍了一种扩展上下文窗口的方案YaRN,可以帮助使用大型语言模型(如GPT和LLaMA)时克服输入字符数限制的问题。当前一些模型,比如ChatGPT,存在输入字符数的限制,导致用户仅能提供有限的示例数量,从而限制了上下文学习和思维链等技术的发挥空间。该方案由Nous Research、Eleut... AI工具箱3年前
大型模型运行缓慢的原因揭秘:探寻人类思维的新算法路径 阅读AIGC动态的欢迎原标题:大型模型运行缓慢的原因:揭示新的思维算法方向关键词:算法、研究者、方法、上下文、问题文章来源:机器之心文字篇幅:9037字内容概要:机器之心的编辑Panda组合了人类推理的精妙和算法方法的精确性,思维算法有助于LLM解决复杂问题。人类的直觉是AI研究者经常忽视的能力,但... AI工具箱3年前
ChatGPT最强平替全面升级!Claude会员版每月140元,对话量提升5倍 <img src=""> 阿尔巴尼亚通信新闻报道 原文标题:ChatGPT强化平台,免费版本告别!Claude会员版每月$20,对话容量增加5倍 关键词:知乎,美元,免费版,消息,上下文 文章来源:量子位 字数:5419字 文章摘要:作者:丰色 发自 凹非寺量子位 |... AI工具箱3年前
OpenAI:LLM在测试中隐瞒信息以避过检测,同时意识到自身处于被测试状态|附应对策 AIGC动态欢迎阅读原标题:OpenAI:LLM能感知自己在被测试,为了通过会隐藏信息人类|附应对措施关键字:研究人员,上下文,测试,模型,能力文章来源:新智元内容字数:5442字内容摘要:新智元报道编辑:润【新智元导读】研究人员发现,OpenAI的LLM能够感知自身所处的情景。他们通过实验能够预知... AI工具箱3年前
大型模型目前面临的十大问题和挑战 本文摘要来自人工智能学家的文章,讨论了大型语言模型(LLMs)研究中的十大问题和挑战。其中包括减少和度量幻觉以及优化上下文长度和构造等方向。作者微信号为AItists,是一位致力于成为权威人工智能科技媒体和前沿科技研究机构的专家。详细内容可访问原文链接:大模型现存的10个问题和挑战。 AI工具箱3年前
LeCun再发警告:单靠阅读的语言模型无法实现类人智能 引言 在近年来人工智能的快速发展中,大型语言模型(LLM)如ChatGPT等引发了广泛关注,但与此相对的是对其局限性的深刻反思。Yann LeCun和Jacob Browning的研究指出,语言模型的智能水平受限于语言本身的固有局限性,而非算法的缺陷。这一观点为我们理解当前AI技术的局限性提供了新的... 开放I3年前