logo
科技新闻,每天 3 分钟
苹果披露 AFM AI 模型细节,文本总结等方面超过 GPT-4
7 月 31 日

苹果公司发布了一篇论文,介绍了其最新的 Apple Intelligence 模型,名为 Apple Foundation Model(AFM),包括在设备上运行的 AFM-on-device 和尚未公开详细信息的 AFM-server。模型的训练数据来源多样,包括授权数据、开源数据集及通过 Applebot 抓取的公开信息,苹果强调用户隐私得到保护,私人数据未包含在训练集中。苹果与多家出版商达成协议,使用他们的新闻档案训练模型,并在 GitHub 上托管的开源代码上进行训练。AFM 模型训练数据集包含 6.3 万亿个 token,使用高质量、可公开获得的数据集,并过滤了敏感信息。苹果使用 8192 片 TPUv4 芯片训练 AFM-server 模型,2048 片 TPUv5p 芯片训练 AFM-on-device 模型,后者训练速度快近三倍。模型性能方面,AFM 在指令遵循和文本总结方面的表现超越了 GPT-4,并且有害输出违规率远低于 GPT-4。在设备上,AFM 的违规率也低于 Meta 训练的 Llama-3-8B 模型。在电子邮件、信息和通知汇总方面的满意度也领先于其他模型。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。
行业标签
二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验