热门话题
每日早报
排行榜
AI
科技动态
财经快讯
医疗产业
汽车
专业版

© 2026 NoCode 无码科技（杭州）有限公司浙ICP备17005035号-6 联系我们加入我们产品介绍 MCP 接入

浙公网安备 33010902002965 号浙 B2-20181004

科技新闻，每天 3 分钟

DeepSeek 公开模型原理与训练方法说明

DeepSeek 公开模型原理与训练方法说明

2025 年 9 月 2 日

DeepSeek 发布大模型训练原理说明，其模型采用预训练和优化训练两阶段流程，预训练使用公开互联网数据，优化训练数据由自建问答对和匿名化用户数据组成，最终模型以自回归方式生成文本。

DeepSeek 公开模型原理与训练方法说明

开源中国

DeepSeek 最新发文 V3 / R1 训练细节全公开

华尔街见闻

刚刚，DeepSeek 最新发文 V3 / R1 训练细节全公开，信息量巨大

凤凰科技

话题追踪

2026-02-28

消息称 DeepSeek 多模态大模型 V4 将于下周发布

2026-02-11

DeepSeek 更新模型可一次性处理超长文本

2026-01-01

DeepSeek 元旦发布新论文：梁文锋署名，提出全新 mHC 架构

2025-11-27

DeepSeek 发布可自验证数学模型 DeepSeekMath-V2

2025-09-18

DeepSeek-R1 论文登上《自然》封面梁文锋为通讯作者

2025-09-02

DeepSeek 公开模型原理与训练方法说明

2025-08-30

DeepSeek 决定使用华为 AI 芯片训练部分模型

2025-08-01

DeepSeek 关联公司公布大语言模型部署方法专利

2025-04-05

DeepSeek 与清华联合研究：创新奖励模型推理方法，提升可扩展性

2025-03-02

摩尔线程全面拥抱 DeepSeek 开源周，加速 AI 模型训练与推理

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。

行业标签

订阅

订阅

订阅

订阅

订阅

订阅

二维码

24 小时

资讯推送

进群体验