谷歌发布并开源 Gemma 4 12B 版多模态模型 可在 16GB 内存 / 显存上运行
上周四
谷歌发布并开源 Gemma 4 12B 版多模态模型,开发目标是让消费级设备本地运行 AI 模型,可在 16GB 内存 / 显存的笔记本电脑和台式机上运行,参数规模 12B 但智能化程度比肩 Gemma 26B 版模型。模型优势包括全新统一架构,无需多模态编码器,直接支持文本、图片、视频和音频输入。高级推理功能,基准性能接近 Gemma 26B 版混合专家架构模型,可本地提供多步骤推理。内存要求较低,16GB 内存或显存即可本地运行,内存越大性能越好。采用 Apache 2.0 许可证开源发布,谷歌和社区提供完善开发者生态系统支持。配备多种 Token 预测选型器,有效减少延迟。该模型在标注基准测试中智能化程度接近谷歌此前开源的 26B MoE 混合架构模型,突出优势还包括简化图片、视频、音频输入处理方式,视觉方面使用轻量级嵌入模块替换视觉编码器,仅含 1 次矩阵乘法、位置嵌入和归一化操作,让模型主干网络直接接管视觉处理。音频方面完全移除音频编码器,将原始音频信号投射到与文本标记相同的维度空间。目前已在多个平台提供,开发者可在 Ollama 等直接体验,或前往 HuggingFace、Kaggle 下载模型权重文件,也可使用 Unsloth 进行高效微调定制版本。
2026-05-20
谷歌发布多模态大模型旗舰 Gemini Omini2026-05-20
谷歌推出 Gemini 3.5 系列模型2026-05-13
谷歌发布 Googlebook,全面拥抱 AI 原生计算2026-04-02
谷歌开源大模型 Gemma 4 发布在即:参数量翻 4 倍2026-03-26
谷歌发布 Lyria 3 Pro 音乐生成模型,支持生成 3 分钟的曲目2026-03-04
谷歌推出 Gemini 3.1 Flash-LITE 模型2026-01-14
谷歌宣布推出开源医疗模型 MedGemma 1.52025-12-18
谷歌在旗下产品中发布更高效的新版 Gemini 3 AI 模型2025-11-21
谷歌新版 Nano Banana 上线查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。