DeepSeek 团队发布最新开源模型 DeepSeek-OCR
2025 年 10 月 20 日
DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。该模型参数量为 3B,开源地址为 https://huggingface.co/deepseek-ai/DeepSeek-OCR 和 https://github.com/deepseek-ai/DeepSeek-OCR. 它由核心编码器 DeepEncoder 和解码器 DeepSeek3B-MoE-A570M 组成,实验显示在不同压缩比下有较好的 OCR 精度,在 OmniDocBench 测试中表现优于其他模型,在实际生产中可在单块 A100-40G 显卡上每天生成超 20 万页大语言模型 / 视觉语言模型训练数据.
DeepSeek 开源新模型!单张 A100 日处理可超 20 万页数据
第一财经 / 网易科技
体验专业版特色功能,拓展更丰富、更全面的相关内容。