DeepSeek上线类o1模型——DeepSeek-R1-Lite

2024年11月20日，DeepSeek全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。可登录官方网页（chat.deepseek.com），开启与 R1-Lite 的对话体验。该模型采用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，

Jamence

2642人浏览 · 2024-11-20 21:39:28

Jamence · 2024-11-20 21:39:28 发布

2024年11月20日，DeepSeek全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。
可登录官方网页（chat.deepseek.com），开启与 R1-Lite 的对话体验。
在这里插入图片描述
该模型采用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。
该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

效果

分别公布了在6个评测集上，与其他5个模型的比较，同时添加了评估方式（例如AIME的 pass@1），整体看下来算公正。
在这里插入图片描述
以下是kimi k0-math的评估集结果：

评估集、数值出入较大，不太好比。

但以o1-preview的AIME的分数作为锚点，在AIME上，k0-math弱于o1-preview，而o1-preview弱于DeepSeek-R1-Lite 。可以初步推理出k0-math弱于DeepSeek-R1-Lite。

不仅如此，DeepSeek-R1-Lite已经上线，而k0-math不知道啥时候上线，只看到PR文。。。

测试

“DeepSeek”中有几个e

开场暴击
在这里插入图片描述

考研题

在这里插入图片描述
中间有一大串思维链过程，很适合模型蒸馏hhh
从思维链中看到，有一些自我反思过程

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

飞桨框架3.0推理升级：支持多款主流大模型、DeepSeek-R1满血版实现单机部署，吞吐提升一倍！

MLA、MTP、量化优化全面突破，4比特单机高效部署，开箱可用！

DeepSeek技术社区

程序员求职必看｜用DeepSeek爆改废物简历，成功率提升200%！

DeepSeek技术社区

最新Deepseek本地部署教程详解

硬件要求：建议使用至少4核的CPU（如Intel i5或更高），推荐NVIDIA GPU（如RTX 3060或更高）以支持CUDA加速，内存建议16GB以上，存储至少需要20GB的可用空间。接下来，可以下载DeepSeek的预训练模型权重，配置环境变量，并运行DeepSeek进行推理或训练。这里的“[具体参数，如7b]”代表所选择的模型大小，数字越大代表参数越多，性能越强，但对计算机的性能要求也越