DeepSeek识图模式灰度测试：速度快但推理待提升，多模态进展超预期

在图片找不同测试中，非思考模式能快速找到7处不同，但存在幻觉；从识图模式的世界知识中发现，视觉模型知道一些V4 flash/pro不了解的信息，验证后发现flash不联网时没有相关知识，而识图模式能找到2026年4月的信息，这表明识图模式中的视觉模型可能是独立训练的。在OCR功能上，不开深度思考就能快速出结果，还能贴心给出开源链接超链，处理表格也能格式整齐。DeepSeek识图模式的推出展现了其多

IT界那些事儿

44人浏览 · 2026-04-30 17:11:38

IT界那些事儿 · 2026-04-30 17:11:38 发布

DeepSeek识图模式：灰度测试带来新惊喜

DeepSeek V4发布后，其识图模式开启灰度测试，引发了民间的广泛关注和挖掘。该模式看上去是一个独立于V4 flash/pro的新模型，让人们对DeepSeek的多模态能力有了更多期待。

推理能力：思考与非思考模式差异明显

在空间推理题测试中，非思考模式下DeepSeek识图模式速度极快，但答案错误；开启深度思考后虽能给出正确答案，但思考过程冗长，用时4分多钟。在图片找不同测试中，非思考模式能快速找到7处不同，但存在幻觉；思考模式用时16秒找出12处不同，不过幻觉更多。

实用功能：表现有亮点也有不足

在OCR功能上，不开深度思考就能快速出结果，还能贴心给出开源链接超链，处理表格也能格式整齐。把网页图片发给DeepSeek，能直接复原出HTML，按钮还可实现跳转。但在色盲测试中偶见翻车。

模型独立性：视觉模型或独立训练

从识图模式的世界知识中发现，视觉模型知道一些V4 flash/pro不了解的信息，验证后发现flash不联网时没有相关知识，而识图模式能找到2026年4月的信息，这表明识图模式中的视觉模型可能是独立训练的。

编辑观点：DeepSeek识图模式的推出展现了其多模态能力的快速进展，虽有不足但潜力大，未来在推理能力和准确性上提升后，有望在多模态领域占据重要地位。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

cover

RAG混合检索失败模式解析：为什么向量+关键词的离线评测必须分层抽样？

DeepSeek技术社区

cover

DeepSeek与OpenAI网关路由成本账本：per-token计费下如何优化多模型流量

DeepSeek技术社区

cover

国产大模型 API 聚合网关：配额与熔断的工程化实践

DeepSeek技术社区

所有评论(0)

查看更多评论

IT界那些事儿

已为社区贡献456条内容