在 ACL 2025 的颁奖典礼上,由 DeepSeek 梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,把长文本处理速度提升了 11 倍,性能不仅没降反而还超越了传统的全注意力模型。