曦望新一代推理 GPU 芯片启望 S3 发布:单位 Token 推理成本降低 90%1 月 27 日国产 GPU 厂商曦望发布新一代推理 GPU 芯片启望 S3,这是其近一年累计完成约 30 亿元战略融资后的首次集中公开亮相。启望 S3 是面向大模型推理的定制化 GPGPU 芯片,典型推理场景下整体性价比较上一代提升超 10 倍,支持 FP16 至 FP4 精度切换,显存容量提升 4 倍,在主流大模型推理场景中单位 Token 成本降低约 90%。曦望还发布寰望 SC3-256 超节点方案,联合生态伙伴发起推理成本计划,与浙江大学签署战略合作协议。曦望前身是商汤科技大芯片部门,2025 年芯片交付量已突破万片。曦望发布新一代推理芯片 S336Kr曦望发布推理 GPU S3:All-in 推理的国产 GPU,开始算单位 Token 成本量子位融资 30 亿后,曦望发布推理 GPU 芯片 S3 并推进推理云生态共建猎云网展开全部报道话题追踪2026-04-20国内推理 GPU 独角兽曦望再获超 10 亿元融资2026-01-27曦望新一代推理 GPU 芯片启望 S3 发布:单位 Token 推理成本降低 90%2025-07-18国产 GPU 企业「曦望」获近 10 亿元融资,前身为商汤大芯片部门2025-06-30国产 GPU 曦望完成新一轮近 10 亿元融资:产品对标英伟达 A100专业版功能登录体验专业版特色功能,拓展更丰富、更全面的相关内容。