热门话题
每日早报
排行榜
AI
专业版
DeepSeek 公开模型原理与训练方法说明
9 月 2 日
DeepSeek
发布大模型训练原理说明,其模型采用预训练和优化训练两阶段流程,预训练使用公开互联网数据,优化训练数据由自建问答对和匿名化用户数据组成,最终模型以自回归方式生成文本。
DeepSeek 公开模型原理与训练方法说明
开源中国
DeepSeek 最新发文!V3/R1 训练细节全公开!
华尔街见闻
刚刚,DeepSeek 最新发文!V3/R1 训练细节全公开,信息量巨大
凤凰科技
话题追踪
2025-09-18
DeepSeek-R1 论文登上《自然》封面 梁文锋为通讯作者
2025-09-02
DeepSeek 公开模型原理与训练方法说明
2025-08-30
DeepSeek 决定使用华为 AI 芯片训练部分模型
2025-08-01
DeepSeek 关联公司公布大语言模型部署方法专利
2025-04-05
DeepSeek 与清华联合研究:创新奖励模型推理方法,提升可扩展性
2025-03-02
摩尔线程全面拥抱 DeepSeek 开源周,加速 AI 模型训练与推理
2025-02-06
协创数据:FCloud 智能体训推创新平台已接入 deepseek 等大模型
添加 Readhub 到桌面
1. 点击浏览器分享图标
2. 选择添加到主屏幕
知道了