蚂蚁集团联手 inclusion AI ,推出开源多模态模型 Ming-Omni
2025 年 6 月 16 日
蚂蚁集团与 inclusion AI 联合推出 Ming-Omni 多模态模型,可处理图像、文本、音频和视频。该模型采用专用编码器提取 tokens,并通过 Ling 的 MoE 架构融合多模态输入,支持多样化任务。Ming-Omni 还具备音频和图像生成能力,可实现自然语音生成、高质量图像生成、上下文感知聊天及图像编辑等功能。
体验专业版特色功能,拓展更丰富、更全面的相关内容。
蚂蚁集团与 inclusion AI 联合推出 Ming-Omni 多模态模型,可处理图像、文本、音频和视频。该模型采用专用编码器提取 tokens,并通过 Ling 的 MoE 架构融合多模态输入,支持多样化任务。Ming-Omni 还具备音频和图像生成能力,可实现自然语音生成、高质量图像生成、上下文感知聊天及图像编辑等功能。