浪潮信息:公司源 1.0 大模型结构与 GPT-3 类似,参数量增加 40%2023 年 2 月 15 日

浪潮信息还介绍,公司 2021 年发布的源 1.0 大模型是面向中文的超大规模预训练自然语言模型,模型结构与 GPT-3 类似,与 GPT-3 相比参数量增加 40%,训练数据集提升 10 倍,达到了 2457 亿参数,训练使用了 5TB 的高质量中文数据。

企业微信二维码