DeepMind称Transformer模型泛化能力受预训练数据限制，引发质疑

AIGC动态3年前发布 AI工具箱

DeepMind称Transformer模型泛化能力受预训练数据限制，引发质疑的封面图

本文报道来自机器之心的一篇关于DeepMind指出Transformer在超出预训练数据范围时无法实现泛化能力的文章。该文章探讨了大语言模型在提供上下文样本的情况下，通过输入生成响应的能力，以及Transformer模型在这一过程中的作用。同时，对于Transformer无法在预训练数据之外实现泛化的观点也引起了一些质疑。文章的原文链接为指向DeepMind的相关研究。如果需要更多信息，可联系作者微信号almosthuman2014。

AIGC动态 # 上下文 # 函数 # 模型 # 研究者 # 线性

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关AI热点

OpenAI宣布推广GPT-4.5人工智能模型的新举措

OpenAI宣布推广GPT-4.5人工智能模型的新举措

AI实验室1年前

海斌访谈：DeepSeek如何重塑中国大模型产业生态

海斌访谈：DeepSeek如何重塑中国大模型产业生态

AI实验室1年前

AI助力！民警寻回70名失踪被拐儿童，含18名无童年照片者

AI助力！民警寻回70名失踪被拐儿童，含18名无童年照片者

AI之家1年前

AI与5G赋能大模型基础设施建设，构筑全面智能社会基石

AI与5G赋能大模型基础设施建设，构筑全面智能社会基石

AI实验室1年前

实现通用智能：机器如何从自然模态学习到世界模型？

实现通用智能：机器如何从自然模态学习到世界模型？

AI工具箱2年前

AI 时代：强劲至强！云服务如何保驾护航？

AI 时代：强劲至强！云服务如何保驾护航？

AI工具箱2年前

12所高校机构发布150页报告，揭秘「大模型推理」，概述750篇论文

12所高校机构发布150页报告，揭秘「大模型推理」，概述750篇论文

AI工具箱2年前

OpenAI 找到新方法来改进语言模型对齐技术

OpenAI 找到新方法来改进语言模型对齐技术

AI工具箱2年前

暂无评论

none

暂无评论...