火山引擎发布豆包语音识别模型 2.0 提升多语种识别精度
2025 年 12 月 5 日
火山引擎推出豆包语音识别模型 2.0(Doubao-Seed-ASR-2.0),该版本在推理能力上显著提升,支持多种语言和视觉信息精准识别。它继承前作高性能音频编码器优势,优化复杂场景识别,依托先进 PPO 方案实现精准识别。具备多模态理解能力,可结合图像内容进行语音识别,避免偏差。支持 13 种海外语言,拓展跨语言应用。模型已上线并提供 API 服务,未来将持续进化,此次发布展示了其创新能力和技术实力,预计带来积极影响。
2026-06-24
豆包音频生成模型 1. 0 发布,开启「音频导演」时代2026-06-23
火山引擎总裁谭待:字节内部已大规模落地 AI Coding 生产流程2026-06-23
豆包大模型 2.1 发布,Coding 能力进入国际第一梯队2026-06-16
火山引擎发布 Seedance 2.0 mini API 将于近期上线2026-05-11
火山引擎正式发布 Agent Plan2026-05-07
火山引擎:豆包大模型家族首款全模态理解模型上线,支持视频、图像、音频等统一理解2026-04-28
火山引擎发布新一代汽车 AI 方案,豆包大模型已搭载超 700 万辆车2026-03-25
火山引擎云端大模型日均调用量破百万亿 Tokens,跻身全球前三2025-12-23
传字节火山引擎成为 2026 年春晚独家 AI 云合作伙伴 豆包也将参与查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。