DeepSeek 决定使用华为 AI 芯片训练部分模型8 月 30 日

DeepSeek 已决定使用华为人工智能芯片训练部分模型,以减少对英伟达芯片的依赖。其最新发布的 DeepSeek-V3.1 采用混合推理架构,支持思考模式与非思考模式,并提升了模型的思考效率和 Agent 能力,优化了在工具使用与智能体任务中的表现。该模型采用 UE8MO FP8 Scale 参数精度,适配华为昇腾等芯片,提升稳定性和效率。

企业微信二维码