Chinchilla死亡:经过足够时间的训练,小型模型同样能胜过大型模型 在本文中,《机器之心》报道了DeepMind发表的一篇名为《Training Compute-Optimal Large Language Models》的论文。该论文通过构建的Chinchilla模型得出结论:大型模型可能存在训练不足的问题,模型大小和训练token数量应该成比例扩展。然而,最近发... AI工具箱3年前