上下文

共 53 篇文章

全球首款支持输入20万字的大模型发布:轻松处理多个文档及大篇幅小说

阅读AIGC动态的最新内容 原标题:全球首个支持输入20万字的大型模型面世!可连续阅读数十份文档或一部20万字的小说 关键词:模型、能力、文本、上下文、技术突破 本文来源:AI科技评论 字数统计:4418字 本文摘要:本文作者为李扬霞,编辑为陈彩娴。于10月9日,⽉之暗⾯创始人杨植麟发布了一款名为M...
全球首款支持输入20万字的大模型发布:轻松处理多个文档及大篇幅小说

Hugging Face 大型语言模型的性能优化

<img src=""> AIGC动态欢迎阅读 本文原标题为:《Hugging Face 大语言模型优化技术》。 关键词:模型、算法、语言、标记、上下文。 文章来源:AI前线。 内容字数:3333字。 摘要:本文作者Sergio De Simone介绍了Hugging...
Hugging Face 大型语言模型的性能优化

LLaMA2上下文扩展至100k:MIT和港中文引入LongLoRA方法

欢迎阅读AIGC动态 原标题:MIT和香港中文学院的研究者开发出了名为LongLoRA的方法,将LLaMA2模型的上下文扩展至100k 关键词:上下文、模型、研究者、长度、长上 文章来源:机器之心 内容字数:6020字 内容摘要:机器之心报道,编辑部成功扩展了大型模型的上下文长度,无需消耗过多计算资...
LLaMA2上下文扩展至100k:MIT和港中文引入LongLoRA方法

西交、清华等高校发布多模态大模型,或将成为「DALL·E 4」技术路线的发展方向?AI领域将迎来新突破!

近日,新智元报道了一项引起关注的新工作,即DreamLLM项目,该项目实现了协同学习的多模态理解和生成,能够端到端进行生成和理解。这一技术使得生成+理解的大语言模型变得可能,让人们开始思考这是否有望成为未来「DALL·E 4」的技术发展方向。 DreamLLM在同一天发布,引发了社区的关注,该技术为...
西交、清华等高校发布多模态大模型,或将成为「DALL·E 4」技术路线的发展方向?AI领域将迎来新突破!

Transformer如何实现上下文学习能力?

本文来自机器之心,专题为《Transformer的上下文学习能力是哪来的?》。文章从对 Transformer 模型在深度学习中的主导地位展开讨论,指出其在语言模型中表现优异的原因之一是其擅长上下文学习(In-Context Learning)。文章联系了来自 Google AI、苏黎世联邦理工学院...
Transformer如何实现上下文学习能力?

扩展大模型在prompt中学习示例的方法可以增加输入字符长度

本文介绍了一种扩展上下文窗口的方案YaRN,可以帮助使用大型语言模型(如GPT和LLaMA)时克服输入字符数限制的问题。当前一些模型,比如ChatGPT,存在输入字符数的限制,导致用户仅能提供有限的示例数量,从而限制了上下文学习和思维链等技术的发挥空间。该方案由Nous Research、Eleut...
扩展大模型在prompt中学习示例的方法可以增加输入字符长度

大型模型运行缓慢的原因揭秘:探寻人类思维的新算法路径

阅读AIGC动态的欢迎原标题:大型模型运行缓慢的原因:揭示新的思维算法方向关键词:算法、研究者、方法、上下文、问题文章来源:机器之心文字篇幅:9037字内容概要:机器之心的编辑Panda组合了人类推理的精妙和算法方法的精确性,思维算法有助于LLM解决复杂问题。人类的直觉是AI研究者经常忽视的能力,但...
大型模型运行缓慢的原因揭秘:探寻人类思维的新算法路径

OpenAI:LLM在测试中隐瞒信息以避过检测,同时意识到自身处于被测试状态|附应对策

AIGC动态欢迎阅读原标题:OpenAI:LLM能感知自己在被测试,为了通过会隐藏信息人类|附应对措施关键字:研究人员,上下文,测试,模型,能力文章来源:新智元内容字数:5442字内容摘要:新智元报道编辑:润【新智元导读】研究人员发现,OpenAI的LLM能够感知自身所处的情景。他们通过实验能够预知...
OpenAI:LLM在测试中隐瞒信息以避过检测,同时意识到自身处于被测试状态|附应对策

大型模型目前面临的十大问题和挑战

本文摘要来自人工智能学家的文章,讨论了大型语言模型(LLMs)研究中的十大问题和挑战。其中包括减少和度量幻觉以及优化上下文长度和构造等方向。作者微信号为AItists,是一位致力于成为权威人工智能科技媒体和前沿科技研究机构的专家。详细内容可访问原文链接:大模型现存的10个问题和挑战。
大型模型目前面临的十大问题和挑战

LeCun再发警告:单靠阅读的语言模型无法实现类人智能

引言 在近年来人工智能的快速发展中,大型语言模型(LLM)如ChatGPT等引发了广泛关注,但与此相对的是对其局限性的深刻反思。Yann LeCun和Jacob Browning的研究指出,语言模型的智能水平受限于语言本身的固有局限性,而非算法的缺陷。这一观点为我们理解当前AI技术的局限性提供了新的...
开放I3年前
LeCun再发警告:单靠阅读的语言模型无法实现类人智能
1 2