DeepSeek GitHub 星数超越 OpenAI,仅用时两个月
2025 年 2 月 7 日
DeepSeek 项目在 GitHub 上的 Star 量超过 OpenAI,其 DeepSeek-V3 模型因引入动态注意力机制和混合专家架构而备受瞩目,参数量达 6710 亿,但每 Token 仅激活 370 亿参数,显著降低计算成本。DeepSeek-R1 基于 V3 使用强化学习重构训练,性能大幅提升,无需大量监督微调即可赋予 LLM 强推理能力。DeepSeek 的开源策略为应用创造了大量机会,国内外多个平台已宣布上线 DeepSeek 大模型,英伟达、亚马逊和微软云服务也接入了 DeepSeek R1。随着技术开源,生成式 AI 的发展有望加速。
2026-04-10
传梁文锋内部发声,DeepSeek V4 将于 4 月下旬发布2026-04-07
DeepSeek V4 又灰度测试:全新界面、多模态重大升级2026-02-11
DeepSeek 更新模型 可一次性处理超长文本2026-01-27
DeepSeek 发布 DeepSeek-OCR 2 模型2026-01-21
DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布2026-01-12
DeepSeek 将于春节前后发布新一代大模型 V4,主打代码生成能力2026-01-09
DeepSeek 据称将于 2 月发布最新旗舰 AI 模型2025-11-27
DeepSeek 发布可自验证数学模型 DeepSeekMath-V22025-10-20
DeepSeek 团队发布最新开源模型 DeepSeek-OCR2025-09-30
DeepSeek 新模型上线,昇腾、寒武纪、海光等宣布适配查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。