谷歌发布并开源 Gemma 4 12B 版多模态模型可在 16GB 内存 / 显存上运行

6 月 4 日

谷歌发布并开源 Gemma 4 12B 版多模态模型，开发目标是让消费级设备本地运行 AI 模型，可在 16GB 内存 / 显存的笔记本电脑和台式机上运行，参数规模 12B 但智能化程度比肩 Gemma 26B 版模型。模型优势包括全新统一架构，无需多模态编码器，直接支持文本、图片、视频和音频输入。高级推理功能，基准性能接近 Gemma 26B 版混合专家架构模型，可本地提供多步骤推理。内存要求较低，16GB 内存或显存即可本地运行，内存越大性能越好。采用 Apache 2.0 许可证开源发布，谷歌和社区提供完善开发者生态系统支持。配备多种 Token 预测选型器，有效减少延迟。该模型在标注基准测试中智能化程度接近谷歌此前开源的 26B MoE 混合架构模型，突出优势还包括简化图片、视频、音频输入处理方式，视觉方面使用轻量级嵌入模块替换视觉编码器，仅含 1 次矩阵乘法、位置嵌入和归一化操作，让模型主干网络直接接管视觉处理。音频方面完全移除音频编码器，将原始音频信号投射到与文本标记相同的维度空间。目前已在多个平台提供，开发者可在 Ollama 等直接体验，或前往 HuggingFace、Kaggle 下载模型权重文件，也可使用 Unsloth 进行高效微调定制版本。

谷歌 AI Edge Gallery 登陆苹果 Mac 设备，16GB 内存可跑 Gemma 4 12B 模型

IT 之家

16GB 内存本地即时响应谷歌发布 Gemma 4 12B，颠覆性「无编码器」架构引爆开源社区

aibase

谷歌发布支持本地离线运行的 AI Edge Gallery 及语音听写应用，适配苹果 macOS

牛透社

展开全部报道

专业版功能

体验专业版特色功能，拓展更丰富、更全面的相关内容。

谷歌发布并开源 Gemma 4 12B 版多模态模型 可在 16GB 内存 / 显存上运行

谷歌发布并开源 Gemma 4 12B 版多模态模型可在 16GB 内存 / 显存上运行