苹果发布了 2025 年 Apple Intelligence 基础语言模型技术报告,介绍了两种多语言、多模态基础模型:一种是针对苹果芯片优化的 3B 参数设备模型,另一种是用于云端的可扩展模型,采用新型 PT-MoE Transformer 架构,结合全局-局部注意力机制,提升推理效率。设备端模型使用 ViTDet-L 视觉主干和注册窗口机制,增强视觉理解能力。苹果还推出了 Swift 核心模型框架,集成引导生成、工具调用和 LoRA 微调功能,便于开发者快速构建 AI 应用。新模型在多任务和多语言上表现优异,兼顾设备端低延迟和云端高性能需求,同时强调隐私保护和负责任 AI 理念。前 AI 负责人庞若鸣已加入 Meta,团队由陈智峰接棒。