微软设计 CoDi 的目标,旨在解决传统单一模态 AI 模型的局限性 … 以同步视频和音频为例,独立生成的信息流拼接在一起时可能存在不一致和对齐的问题 … CoDi 采用了独特的可组合生成策略,在扩散过程中对齐多模态,从而生成相互交织的模式,更重要的是,CoDi 能够处理任意输入模式并生成任意模态的内容。