DeepSeek 近日升级了其模型至 V3.1 版本,提升了推理能力、上下文处理能力和多语言支持。该版本模型拥有 5600 亿参数,处理复杂任务的能力增强,多步推理表现提高 43%。上下文长度达 128k,可处理 10 万到 13 万汉字,相当于一部完整的中长篇小说。模型减少产生不实信息的情况,提高了信息准确性,并能处理超过 100 种语言。然而,备受关注的 DeepSeek R2 版本因训练中遇到的问题,其发布被推迟。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验