智谱发布 GLM-5.1 高速版 API,刷新全球大模型 API 速度纪录
5 小时前
智谱近日推出 GLM-5.1 高速版 API,模型输出速度达 400 tokens/s,打破高速模型多为轻量级的行业惯例,首次在国产大模型中实现旗舰级能力与低延迟并存。实测显示其在 AI 编程、3D 游戏、交互界面等场景表现出色,核心在于 TileRT 高性能推理引擎,该引擎由智谱 GLM 团队与 TileRT 团队联合打造,通过系统级优化实现。目前适用于速度敏感场景,并通过智谱 MaaS 平台向部分企业客户开放。
2026-04-08
GLM-5.1 开源:实现 8 小时长程任务持续工作的里程碑式突破2026-04-08
智谱发布新一代旗舰模型 GLM-5.1,同时提价 10%2026-04-02
智谱发布原生多模态 Coding 基座模型 GLM-5V-Turbo2026-03-27
智谱:GLM-5.1 已面向所有 Coding Plan 用户开放2026-03-16
智谱上调新模型 API 价格 20%2026-03-16
智谱发布 GLM-5-Turbo:首款龙虾场景原生模型,自研基准稳居国产第一2026-03-16
智谱开盘涨 10 个点,今日将发布首个「龙虾模型」2026-02-22
智谱发布 GLM-5 技术报告,技术细节全公开2026-02-16
智谱:全球范围内对 GLM-5 的需求激增 全网寻找「算力合伙人」2026-02-12
智谱 GLM Coding Plan 上线即售罄查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。