泡泡资讯网

小米技术刚刚发布并且开源了可控视频音效生成模型 ControlFoley,统一支

小米技术刚刚发布并且开源了可控视频音效生成模型 ControlFoley,统一支持文本引导视频配音、文本控制视频配音和参考音频控制视频配音三类任务,在多个视频音效生成任务上达到开源SOTA表现。