阿里发布两款语音新模型,可定制角色及模拟背景音
前天

阿里发布两款语音新模型:基于参考音频的声音克隆模型 Fun-CosyVoice3.5 和无参考音频的音色设计模型 Fun-AudioGen-VD。两款模型均有「指令遵循」能力,适用于多场景。Fun-CosyVoice3.5 在 Seed-TTS 基准测试中文「困难案例」指标表现佳,降低了生僻字句错率,支持自由风格模式指令控制,解决传统克隆模型痛点。Fun-AudioGen-VD 专注「从无到有」的音色设计,能定制音色、情感,模拟复杂听觉环境。编辑杨娟娟,校对陈荻雁。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟