蚂蚁集团开源全模态大模型 Ming-flash-omni 2.0

2 月 11 日

蚂蚁集团开源发布全模态大模型 Ming-flash-omni 2.0，其在视觉语言理解等关键能力的多项公开基准测试中表现突出，部分指标超越 Gemini 2.5 Pro，也是业界首个全场景音频统一生成模型，可在同一条音轨中同时生成语音、环境音效与音乐。

牛透社

华尔街见闻

aibase

展开全部报道

专业版功能

体验专业版特色功能，拓展更丰富、更全面的相关内容。