DeepSeek 关联公司公布大语言模型部署方法专利8 月 1 日

该专利提出了一种大语言模型的部署方法及系统,通过将预填充阶段和解码阶段分别部署在高性能计算能力和大内存的机器上,实现负载均衡,提高硬件利用率,减少算力闲置,降低延迟,提升吞吐量,并增强系统的扩展性和容错性。

企业微信二维码