幻方量化的 AI 公司 DeepSeek 发布了 DeepSeek-R1 模型,并开源了模型权重。该模型在后训练阶段使用强化学习技术,在少量标注数据的情况下提升了推理能力,性能与 OpenAI o1 相当。DeepSeek 还开源了 6 个小模型,其中 32B 和 70B 模型性能对标 OpenAI o1-mini。用户可通过官网或官方 App 调用 DeepSeek-R1 完成推理任务,API 服务定价为每百万输入 tokens 1 元(缓存命中)/4 元(缓存未命中),每百万输出 tokens 16 元。DeepSeek-R1 训练技术已公开,模型开源 License 统一使用 MIT,允许商用和模型蒸馏。