Chinchilla死亡:经过足够时间的训练,小型模型同样能胜过大型模型

Chinchilla死亡:经过足够时间的训练,小型模型同样能胜过大型模型的封面图

在本文中,《机器之心》报道了DeepMind发表的一篇名为《Training Compute-Optimal Large Language Models》的论文。该论文通过构建的Chinchilla模型得出结论:大型模型可能存在训练不足的问题,模型大小和训练token数量应该成比例扩展。然而,最近发现,仅需足够长时间的训练,小型模型也有可能超越大型模型。作者指出这一发现可能与常规观点不符。

原始文章可在机器之心找到。若想了解更多详情,请查看原文:Chinchilla之死:只要训练足够长时间,小模型也能超过大模型。

如需进一步联系作者,可以通过微信账号almosthuman2014获取信息。作者是一家人工智能媒体和产业服务平台的专业人员。

© 版权声明

相关AI热点

暂无评论

none
暂无评论...