微软发布能击败Llama 2 70B的「小语言模型」,借助96块A100训练出Phi-2在14天内超越谷歌Gemini nano

微软发布能击败Llama 2 70B的「小语言模型」,借助96块A100训练出Phi-2在14天内超越谷歌Gemini nano的封面图

本文来自新智元,介绍了微软发布的参数为2.7B的Phi-2模型,这一小语言模型在性能上几乎超越了所有13B以下的大型模型,包括谷歌最新发布的Gemini Nano 2。通过模型扩展和训练数据管理方面的创新,Phi-2展现了卓越的推理和语言理解能力。在复杂基准测试中,Phi-2的性能可以与自身25倍大小的模型相提并论,甚至略有优势。文章讨论了华丽的大型模型竞赛,包括OpenAI和谷歌等公司的举措。微软Phi-2的发布标志着大型模型竞赛的继续升温。

如果您想了解更多信息,请查看原文链接:2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano。如果有任何疑问或想要联系作者,您可以添加微信号:AI_era。

感谢您阅读本文。

© 版权声明

相关AI热点

暂无评论

none
暂无评论...