logo
科技新闻,每天 3 分钟
亚马逊首个大型语音 AI 模型 BASE TTS 问世
2 月 19 日

亚马逊人工智能研究团队开发了一项名为 BASE TTS 的文本转语音技术,该技术拥有 9.8 亿个参数,是有史以来最大的模型之一。BASE TTS 使用了 10 万个小时的录音进行训练,包括英语、德语、荷兰语和西班牙语等,处理复杂的语言结构方面表现出色,单词发音质量得到了显著提升。尽管存在发音和语调错误等问题,这一技术仍标志着文本转语音技术的重要进展,未来可能得到广泛应用,但 BASE TTS 不会向公众发布,将仅用于学习应用中。

行业标签
公司
亚马逊icon-arrowNASDAQ:AMZN11 天前已发布季度报告
二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验