DeepSeek识图模式灰度测试:速度快但推理待提升,多模态进展超预期
在图片找不同测试中,非思考模式能快速找到7处不同,但存在幻觉;从识图模式的世界知识中发现,视觉模型知道一些V4 flash/pro不了解的信息,验证后发现flash不联网时没有相关知识,而识图模式能找到2026年4月的信息,这表明识图模式中的视觉模型可能是独立训练的。在OCR功能上,不开深度思考就能快速出结果,还能贴心给出开源链接超链,处理表格也能格式整齐。DeepSeek识图模式的推出展现了其多
·


DeepSeek V4发布后,其识图模式开启灰度测试,引发了民间的广泛关注和挖掘。该模式看上去是一个独立于V4 flash/pro的新模型,让人们对DeepSeek的多模态能力有了更多期待。

在空间推理题测试中,非思考模式下DeepSeek识图模式速度极快,但答案错误;开启深度思考后虽能给出正确答案,但思考过程冗长,用时4分多钟。在图片找不同测试中,非思考模式能快速找到7处不同,但存在幻觉;思考模式用时16秒找出12处不同,不过幻觉更多。

在OCR功能上,不开深度思考就能快速出结果,还能贴心给出开源链接超链,处理表格也能格式整齐。把网页图片发给DeepSeek,能直接复原出HTML,按钮还可实现跳转。但在色盲测试中偶见翻车。

从识图模式的世界知识中发现,视觉模型知道一些V4 flash/pro不了解的信息,验证后发现flash不联网时没有相关知识,而识图模式能找到2026年4月的信息,这表明识图模式中的视觉模型可能是独立训练的。
编辑观点:DeepSeek识图模式的推出展现了其多模态能力的快速进展,虽有不足但潜力大,未来在推理能力和准确性上提升后,有望在多模态领域占据重要地位。
更多推荐



所有评论(0)