英伟达、Hugging Face 和 ServiceNow 联合发布了 StarCoder2 系列大语言模型,旨在成为代码生成领域的标准。该系列包含三个模型,参数分别为 30 亿、70 亿和 150 亿,均基于 Stack v2 数据集训练,此数据集是 Stack v1 的七倍。StarCoder2 模型经过多种编程语言的训练,能够执行源代码生成、工作流生成和文本摘要等专业任务,助力开发人员提升工作效率。新模型在性能上进行了优化,30 亿参数模型的表现可媲美原 150 亿参数的 StarCoder。StarCoder2 采用 BigCode Open RAIL-M 许可证,用户可以无需支付版税即可访问和使用。