蚂蚁集团开源发布全模态大模型 Ming-flash-omni 2.0,其在视觉语言理解等关键能力的多项公开基准测试中表现突出,部分指标超越 Gemini 2.5 Pro,也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验