DeepSeek 小更新,多步推理表现提高 43%
8 月 20 日

DeepSeek 近日升级了其模型至 V3.1 版本,提升了推理能力、上下文处理能力和多语言支持。该版本模型拥有 5600 亿参数,处理复杂任务的能力增强,多步推理表现提高 43%。上下文长度达 128k,可处理 10 万到 13 万汉字,相当于一部完整的中长篇小说。模型减少产生不实信息的情况,提高了信息准确性,并能处理超过 100 种语言。然而,备受关注的 DeepSeek R2 版本因训练中遇到的问题,其发布被推迟。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟