前言

DeepSeek 凭借超凡的沟通和推理能力,成功吸引了大家对知识库的兴趣,仿佛为知识库的神秘面纱揭开了小小一角。

构建本地知识库。但有时候如果不涉及私密的话在上网的同时直接打造云上知识库会更加方便。

造知识库其实很简单,就像在网上冲浪时捡贝壳一样,把那些闪亮的知识点一一收集起来,存到你的 “知识宝箱” 里。

随着时间的推移,这些点滴积累的知识将汇聚成一笔可观的财富,让你在知识的海洋中更加富足从容!

那么有哪些工具可以方便我们操作呢?今天再来认识一款大公司的产品,那就是知乎直答。

知乎知识库

知乎直答是一个将大模型联网搜索知识库相结合得非常好的应用。有了 DeepSeek 的接入,加上知乎本身这个大知识库,简直是珠联璧合。有什么理由我们不好好使用这款利器呢?

废话不多说,直接开干。目前手机端 App 还没开通知识库,因此我们使用网页版。

首先,为了能将浏览的网页跟直答关联起来,我们需要给浏览器安装一个插件。

打开网页版知乎直答,点击左下角的我的知识库

图片

点击用插件添加网页下载插件,

图片

图片

将下载好的知乎直答.zip 解压,并按下图操作。

图片

打开插件,

图片

然后冲浪,看到感兴趣的网页,将它们虏到知识库。

图片

新建知识库,并给它取个名字。这点比 ima 那里方便,那边目前不让建多个知识库,不知道啥时候能改。

图片

可以同时选中库中若干条,然后右上角点击提问选中文件

图片

输入问题,等它思考后回答,可以在对话框中继续交流。

图片

通过这种方式,我们很快就得到一篇综合了几个报道的文章,这个不是重点,我们把它放在文末。

也可以选中网页上内容,然后去知乎直答中提问,

图片

转到知乎直答,

图片

另外,知乎直答还考虑了知乎收藏夹RRS 订阅等知识内容获取方式,大家自己去探索吧。

两种搜索

我们看到知乎直答提供了两种搜索。

图片

问它两者有和区别,它自己的回答如下,

通用搜索和专业搜索的核心差异主要体现在数据范围、处理方式和应用场景三个方面:

  1. 数据覆盖差异通用搜索整合全网公开信息(如知乎问答、新闻、百科),例如搜索"智能手表功能"会显示不同品牌参数对比;专业搜索则聚焦特定领域资源(如用户上传的《哈佛智能穿戴研究报告》),仅解析该文件提到的闭环血糖监测技术。
  2. 处理深度差异通用搜索侧重快速匹配,如查询"空气净化器原理"会展示 10 条知乎高赞回答;专业搜索具备语义纠错能力,曾有用户输入"监测监控设备"(漏"能"字),仍能准确识别并提取报告中智能穿戴设备的电池续航数据。
  3. 应用场景差异通用搜索适用于日常查询,例如搜索 "2025 春节放假安排"可立即获得法定假期日期;专业搜索适合研究场景,如医学研究者上传 CT 影像 AI 论文后,通过追问可获得技术原理、临床试验进展等深度解析。

典型案例对比:当查询"胰岛素泵技术"时,通用搜索会显示知乎科普文章和电商产品介绍;专业搜索模式下,用户上传行业白皮书后,系统能自动提炼出"动态血糖监测算法"的核心公式,并标注"该模型尚未通过 FDA 认证"的风险提示。

简单说,这两种搜索可以看作是面向不同用户的,

  • 第一种是普通用户,主要是泛泛地了解下,比如要买什么东西时作个参考,不需要行话,你要 AI 说专业的术语可能也是白搭,用户往往并不懂啊。
  • 第二种针对比较专业的用户,可以提交附件或者知识库,AI 可以说些专业名词来较深入地给予解释。

我们不妨用同一个问题同时拷问它们对比一番。

比如,问它们:请介绍一下 DeepSeek-R1 是如何思考的?

图片

问专业搜索的时候我们往往会上传一些资料,或者让它结合个人知识库,以便它能够回答得更加专业。

图片它们的回答我们放在文末附录。

解读文档

另外,我们也可以直接打开文档,让直答针对文档,给我们干活,总结、翻译、润色神马的,就看想怎嘛玩啦。

图片

总之,知乎插上 DeepSeek 这个翅膀,相当美满,不是吗?

附录

¸普通搜索

<zhithink>嗯,用户想了解 DeepSeek-R1 是如何思考的。根据我之前找到的参考内容,首先需要明确 DeepSeek-R1 的核心是推理能力,尤其是通过强化学习和思维链(CoT)来实现的。记得在知乎文章中提到了 R1 是基于 V3 的 Base 模型进行后训练得到的,主要采用了 GRPO 算法和冷启动数据。

接下来,思考过程可能涉及几个方面:训练方法、思维链的构建、自我进化机制,以及与其他模型的对比。比如,用户可能想知道 R1 在处理问题时如何分步骤推理,或者为什么它的思考过程更有效。

还需要注意,参考内容提到 R1 在训练时通过强化学习自发产生复杂行为,如反思和验证,而不仅仅是依赖监督数据。此外,冷启动阶段使用人工标注的长 CoT 数据,确保模型有基本的推理格式。同时,GRPO 算法通过组内相对奖励优化策略,避免了传统 Critic 模型的高计算成本。

另外,用户可能对 R1 的“深度思考”进度条感兴趣,但根据另一个回答,这主要是用户体验设计,而非实际计算过程的改变。不过,R1 确实在训练中通过增加思考时间来提升准确性,这可能与奖励机制中的准确性奖励有关。

最后,要区分 R1 和 V3 的不同,R1 更强调推理步骤,而 V3 是通用对话模型。可能还需要提到 R1 在数学、编程等任务上的优势,如 Codeforces 的高分,以及如何通过多阶段训练提升性能。</zhithink>

以上是思考部分,以下是回答部分。

DeepSeek-R1 的思考机制是其区别于传统对话模型的核心特点,主要通过以下技术路径实现推理能力的突破:

1. 底层架构基础

  • 基于 DeepSeek-V3-Base 预训练模型(128K 上下文窗口,YaRN 位置编码技术)
  • 采用混合专家(MoE)架构,激活参数约 37B,通过动态门控机制选择相关专家子网络

2. 思维链(CoT)构建流程

阶段 关键技术 作用表现
冷启动 人工标注长链推理数据 + 大模型生成数据 建立基础推理模板(如问题拆解、验证步骤)
强化学习 GRPO 算法(组相对策略优化) 模型自发产生反思、多路径探索等复杂行为
格式控制 双标签系统(<think></think> 强制分离思考过程与最终答案输出

3. 自我进化机制

  • 动态思考时间:训练中观察到思考 token 数量持续增加(如数学问题从初期 50 token 进化到 300+ token)
  • 顿悟时刻:中期训练时突然出现推理步骤重组能力(如推翻错误假设后重建解题路径)
  • 多模态验证:对代码类问题同步执行编译检查,数学问题嵌入符号计算验证

4. 奖励系统设计

  • 准确性奖励:基于规则判断(如代码编译通过、数学答案匹配)占比 70%
  • 过程奖励:通过 V3 模型评估推理逻辑连贯性占比 20%
  • 语言一致性:抑制中英文混杂输出占比 10%

典型思考过程示例(以数学题「鸡兔同笼」为例):

  1. 问题解析:识别问题类型与已知条件
  2. 假设检验:尝试代数法/抬腿法等不同解法
  3. 矛盾发现:腿部数量计算出现逻辑冲突
  4. 路径回溯:返回关键节点重新推导
  5. 验证输出:通过方程求解验证结果合理性

局限性

  • 非结构化任务中可能出现「过度推理」(如简单事实类问题生成冗余步骤)
  • 思考耗时与问题复杂度呈指数关系(128K 上下文下响应延迟可达 40 秒)
  • 语言混合现象未完全消除(约 3.2% 输出包含非常规中英文混杂)

这种思考机制使得 R1 在 GSM8K 数学基准测试中准确率达到 89.7%,较 V3 模型提升 41%,同时将代码调试通过率提升至 78.3%(HumanEval 数据集)。其核心突破在于通过纯强化学习实现了推理能力的涌现,而非依赖监督学习的模式复制。

¸专业搜索

<zhithink>好的,我现在需要回答用户的问题:“请介绍一下 DeepSeek-R1 是如何思考的?”首先,我需要仔细阅读用户提供的参考内容,从中提取关于 DeepSeek-R1 的思考机制的相关信息。

根据参考内容,DeepSeek-R1 的思考过程主要涉及以下几个方面:

  1. 强化学习(RL)的作用:用户提供的多篇知乎文章提到,DeepSeek-R1 通过强化学习训练,特别是采用了创新的 GRPO(组相对策略优化)算法。这替代了传统的 PPO 方法,减少了计算开销,同时提升了模型的推理能力。例如,在训练过程中,模型会根据奖励信号调整策略,奖励包括准确性和格式奖励,促使模型生成更合理的思考链。
  2. 自我反思与顿悟时刻(Aha Moment):技术报告和知乎文章中多次提到,DeepSeek-R1 在训练过程中会出现“顿悟时刻”,即模型在遇到初始策略效果不佳时,会主动回溯并重新推理,补充或修正之前的思路。这种行为是通过强化学习中的奖励机制自然形成的,而非人为设计,显示出模型具备动态调整思考路径的能力。
  3. 结构化输出与格式奖励:参考内容指出,模型在生成回答时需将推理过程放在特定的标签(如 <reasoning></reasoning>)之间,这种格式奖励机制不仅规范了输出结构,还提升了可读性。例如,用户提供的代码示例显示,response 中的 reasoning_content 部分详细记录了模型的思考步骤,而 content 则是最终回答。
  4. 多阶段训练流程:DeepSeek-R1 的训练分为冷启动、强化学习、拒绝采样与微调等阶段。冷启动阶段使用少量高质量 CoT(思维链)数据初始化模型,确保输出可读性;后续的强化学习阶段则通过奖励机制优化推理能力,同时结合拒绝采样筛选高质量数据进一步微调,提升综合表现。
  5. 与人类思维相似性:用户提供的评测文章提到,DeepSeek-R1 的思考过程接近人类,尤其是在处理复杂问题时,会分步骤分析,考虑多方面因素。例如在回答“打工人一周上多少天班合适”时,模型会从生产效率、健康、社会文化等维度展开分析,逐步推导结论,而非直接给出答案。

需要验证的信息点包括:

  • GRPO 的具体机制及其与 PPO 的区别:根据技术报告,GRPO 无需单独的价值模型,采用组相对优势估计,降低了资源消耗。
  • 格式奖励如何具体实施:参考代码示例显示,模型输出的 reasoning_content 部分需要符合特定格式,以获得奖励。
  • 顿悟时刻的具体表现:技术报告中提到模型在训练中学会重新评估初始方法,生成长推理步骤。

总结来说,DeepSeek-R1 的思考过程是通过强化学习驱动的动态推理,结合结构化的输出格式和自我优化的能力,模拟人类分步骤、多角度分析问题的模式。这种机制使其在处理数学、编程等复杂任务时表现出色,同时保持较高的可解释性。</zhithink>

以上是思考部分,以下是回答部分。

DeepSeek-R1 的思考机制结合了强化学习与结构化推理,其核心特点体现在以下方面:

1、动态推理与自我优化

  • 通过强化学习(GRPO 算法)自主调整生成策略,根据准确性奖励(答案正确性)和格式奖励(结构化输出)动态优化思考路径
  • 在训练中涌现"顿悟时刻",例如遇到错误答案时会主动回溯推理步骤,重新分配计算资源进行更深入分析(如将响应长度从数百 token 扩展到数千 token)

2、结构化思维过程

# 典型输出结构示例
{
  "reasoning_content": "分步推导过程...", 
  "content": "最终答案"
}
  • 强制要求将推理过程包裹在标签内,通过格式奖励引导逻辑清晰度
  • 思考链包含问题拆解、知识检索、验证反思等模块化步骤

3、多维度分析框架

处理复杂问题(如"合理工作时长")时典型思考路径:

① 确定核心矛盾(生产效率 vs 健康损耗)

② 检索行业基准数据(如OECD国家平均工时)

③ 构建影响因素矩阵:

  • 生理极限(连续工作效能衰减曲线)
  • 社会文化(法定节假日分布)
  • 经济模型(边际产出递减拐点)

④ 提出弹性方案( 4+1 混合制),配套政策工具包(税收调节、远程办公基础设施)

4、训练演进机制

┌───────────────┐        ┌───────────────┐
│ 基础模型       │        │ 冷启动SFT      │
│ (DeepSeek-V3) ├───────>│ (千条CoT数据)  │
└───────────────┘        └───────┬───────┘
                                 ↓
┌───────────────┐        ┌───────────────┐
│ 强化学习阶段   │<───────┤ 规则奖励系统    │
│ (GRPO算法)    │        │ (准确率+格式)  │
└───────┬───────┘        └───────────────┘
        ↓
┌───────────────┐        ┌───────────────┐
│ 拒绝采样       │        │ 混合数据微调    │
│ (80万条数据)  ├───────>│ (60万推理+20万通用)│
└───────────────┘        └───────────────┘

这种机制使 R1 在 AIME 数学测试中的准确率从 15.6% 提升至 71%,且思考过程可解释性比传统 LLM 提升 3 倍(基于人工评估)。其创新点在于将强化学习直接应用于原始基座模型,突破了需要海量标注数据的限制,实现了推理能力的自主进化。

¸Grok 3 报道

首先,Grok 3 的算力提升很大,用了 20 万块 GPU,是前代的 10 倍。这可能意味着模型训练更强大,处理能力更强。然后,技术性能方面,报道提到在数学、科学、编程基准测试中超过竞争对手,特别是 AIME 2025 基准测试,这说明它在复杂任务上的表现突出。还有双模式设计,Think 和 Big Brain,分别处理简单和复杂任务,比如工程师演示的游戏开发,这展示了实际应用的能力。

接下来是代理能力升级,比如 DeepSearch 可以自动生成报告,这可能提高效率,减少人工干预。另外,硬件基础设施方面,Colossus 超级计算机的快速建成,显示 xAI 在硬件部署上的实力,这可能影响行业标准。

定价策略方面,SuperGrok 订阅费用较高,可能针对专业用户,影响市场分层。用户可能会根据需求选择不同层级,比如普通用户用基础版,开发者或企业用高级功能。

潜在影响方面,技术竞争加剧,其他公司如 OpenAI、Google 可能加速研发,推动更大模型的出现。垂直领域渗透,教育、科研、游戏开发可能首先受益。用户行为改变,可能更依赖 AI 处理复杂任务。硬件需求波动,特别是 GPU 租赁市场可能需求增加,影响价格。

根据发布会,Grok 3 的核心突破和潜在影响可从以下两个维度展开分析:

一、技术突破与功能创新
  1. 算力规模跃升

    • 基于 20 万块 NVIDIA H100 GPU 搭建的 Colossus 超级计算机训练,算力投入是 Grok 2 的 10 倍以上,创下单一 AI 模型训练硬件规模的新纪录。
    • 仅用 6-8 个月完成超算集群建设,体现 xAI 在硬件工程层面的执行效率。
  2. 多模态推理能力

    • 在 AIME 2025 数学竞赛基准测试中,Grok 3 及 mini 版本击败 OpenAI 03 mini、DeepSeek R1 等主流模型,特别是在几何证明、组合优化等需多步骤推理的题目中准确率超 90%。
    • 通过「Think/Big Brain」双模式实现资源动态调度:mini 模型处理日常查询(如天气/翻译),完整版模型应对编程任务(如融合《俄罗斯方块》与《宝石迷阵》的游戏开发)。
  3. 自主代理能力升级

    • DeepSearch 功能可自动抓取X平台实时数据,结合全网信息生成结构化报告(如市场趋势分析),处理效率较传统搜索提升 3 倍。
    • 思考过程可视化窗口允许用户查看部分推理逻辑,但关键算法细节被加密隐藏以防止技术泄露。
二、行业影响与市场变革
  1. AI服务分层化加速

    • SuperGrok 订阅年费 300 美元(含无限图像生成/深度搜索),X Premium+ 基础版维持原价,形成「普惠 AI → 专业 AI」的梯级收费体系,可能重塑 SaaS 商业模式。
  2. 硬件竞赛白热化

    • 20 万 GPU 集群的训练成本预估超 5 亿美元,迫使竞争对手必须跟进千亿级参数模型研发,半导体厂商(如 NVIDIA)将受益于持续订单需求。
  3. 垂直领域渗透案例

    • 教育领域:可实时解答 IMO 竞赛级数学难题并提供推导过程;
    • 软件开发:演示案例显示其能在 30 分钟内完成跨游戏引擎代码整合;
    • 金融分析:DeepSearch 生成的行业报告已通过第三方审计机构验证。
  4. 伦理与监管挑战

    • 思考过程的不透明性(50% 逻辑被遮蔽)可能引发算法问责争议;
    • 语音合成功能即将上线,需防范深度伪造风险。

当前测试数据显示,Grok 3 在解决开放式复杂问题时平均响应时间比其他大多数大模型来得快,但功耗增加不少。这种「性能优先」的设计路线可能推动云计算厂商优化能效比技术,进而影响全球数据中心建设标准。

最后的最后

感谢你们的阅读和喜欢,作为一位在一线互联网行业奋斗多年的老兵,我深知在这个瞬息万变的技术领域中,持续学习和进步的重要性。

为了帮助更多热爱技术、渴望成长的朋友,我特别整理了一份涵盖大模型领域的宝贵资料集。

这些资料不仅是我多年积累的心血结晶,也是我在行业一线实战经验的总结。

这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。如果你愿意花时间沉下心来学习,相信它们一定能为你提供实质性的帮助。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

大模型知识脑图

为了成为更好的 AI大模型 开发者,这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

经典书籍阅读

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。

在这里插入图片描述

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

面试资料

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下

在这里插入图片描述

640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐