蚂蚁百灵推出开源高效思考模型,推理成本大幅降低9 月 29 日

蚂蚁百灵大模型团队宣布正式开源两款全新高效思考模型 Ring-flash-linear-2.0 和 Ring-mini-linear-2.0,同时发布两款自主研发的高性能融合算子。得益于架构优化与算子协同,新模型在深度推理场景下成本低,仅为同等规模密集模型的十分之一,较之前 Ring 系列降低超 50%。其训练与推理引擎算子高度对齐,在多个高难度推理榜单保持最佳表现。这两款模型已在 Hugging Face 和 ModelScope 等平台发布,团队此举展示了技术实力,为开发者提供高效工具。

企业微信二维码