词表

共 3 篇文章

如何选择词表影响语言模型训练?一项顶尖词表选择研究。

本文介绍了一项关于词表选择对语言模型训练影响的研究。研究者使用了不同类型的词表对语言模型进行实验,结果得出了一些有益的结论,可以帮助读者选择适合的词表进行语言模型训练。研究者使用了12个小型语言模型和4个中型语言模型作为实验对象,并对它们在不同词表下的表现进行了比较。文中介绍了实验的基本设计和结果总...
如何选择词表影响语言模型训练?一项顶尖词表选择研究。

开源中文LLaMA-2,商用效果媲美主流大模型,千元预算训练半天

本文介绍了最新的中文版LLaMA-2模型,该模型经过15小时训练,仅需数千元算力,性能超越同级中文汉化模型,并且可以开源商用。LLaMA-2相较于LLaMA-1引入了更多高质量的语料,性能显著提升,全面允许商用,进一步激发了开源社区的繁荣,扩大了大型模型的应用想象空间。尽管从头开始预训练大模型的成本...
开源中文LLaMA-2,商用效果媲美主流大模型,千元预算训练半天