
本文来自新智元,介绍了微软发布的参数为2.7B的Phi-2模型,这一小语言模型在性能上几乎超越了所有13B以下的大型模型,包括谷歌最新发布的Gemini Nano 2。通过模型扩展和训练数据管理方面的创新,Phi-2展现了卓越的推理和语言理解能力。在复杂基准测试中,Phi-2的性能可以与自身25倍大小的模型相提并论,甚至略有优势。文章讨论了华丽的大型模型竞赛,包括OpenAI和谷歌等公司的举措。微软Phi-2的发布标志着大型模型竞赛的继续升温。
如果您想了解更多信息,请查看原文链接:2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano。如果有任何疑问或想要联系作者,您可以添加微信号:AI_era。
感谢您阅读本文。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
暂无评论...