Stability AI 与 Arm 联合推出「稳定音频开放小型」模型,这是一款专为移动设备优化的紧凑型文本转音频模型,可在约 7 秒内生成 11 秒的高质量立体声,使用 3.41 亿参数,仅需 3.6GB 内存。