
用好 Deepseek,看这一篇就够了
当然,参数量越大,成本就越高,对于个人来说,低参数版本的蒸馏模型就能满足一般使用要求了。
一、都在用的Deepseek,如何与众不同?
1、Deepseek不同版本的使用场景
严格说来,Deepseek只是深度求索公司下的一个AI品牌,Deepseek R1是其中具有推理能力的一个版本。除此之外,它还有不具备推理能力的通用模型Deepseek V3。
R1模型善于解决复杂推理和深度分析任务,如数理逻辑推理和代码编程等开放性任务,我们只需要输入目的,它就可以代替我们思考来解决问题。
是不是所有应用AI的目的都是为了让它代替我们思考呢?是不是给出一个目的都是要希望让AI来帮助我们完成呢?也不是。
其实很多场景下,我们有自己的工作流程,有自己的思考路径,我们需要AI照着我们的流程和思考路径,来帮我完成指定任务下的每一个环节,然后再给出需要的结果。
这个时候就不能用R1模型了,因为它容易发散,容易偏离我们的思考路径。如果要让模型参照我们的思考路径来完成规范性任务,V3模型就能派上用场了。
通俗地说,V3是个听话的孩子,而R1更像是一个聪明但是不太听话的孩子。
除了R1和V3,Deepseek还有联网搜索的功能—RAG(检索增强)。
这里要先普及一个概念:所有的模型都是根据一定的资料库训练出来的,而这些知识库并不是实时更新的。
比如Deepseek最新的知识库截止于2024年的7月。如果我们提出的问题是知识库节点后的问题,就需要联网搜索来解决了。
小结一下,Deepseek有三种使用场景:
第一种,需要推理能力时使用R1模型(深度思索);
第二种,需要按照我们给定的流程时使用V3模型(不选深度思索);
第三种,超出知识库节点的问题需要联网搜索,需要注意的是,联网搜索的信息未经训练,直接用容易干扰既有模型的思考路径。
2、Deepseek使用的三种路径
Deepseek刚出来的那段时间,受世界所瞩目,点击量暴增,经常会出现服务器繁忙的情况,这时候可以使用其它渠道的Deepseek模型来加以解决。
通常情况下,可以通过三种途径来使用Deepseek模型。
第一种,Deepseek官方渠道, 包括Deepseek官网、Deepseek APP及API接口。
第二种,第三方渠道。
第三方渠道分为两个阶段,前期主要通过选择国家超算平台、硅基流动、纳米AI搜素、秘塔AI搜索等平台接入的Deepseek模型来实现, 但这些通常都不是满血版本(参数量为671B),而是蒸馏版本。这个时期的满血版本是要收费的。
在第二个阶段,腾讯元宝、百度搜索都可以免费使用Deepseek的满血版本, 不同的是,腾讯元宝主要基于公众号的相关知识,而百度主要基于百度的搜索网页。
因为大量的第三方平台接入了Deepseek模型,很大程度上减轻了Deepseek官网的访问压力,再使用官网的Deepseek模型,很少出现服务器繁忙的提示了。
最后一种,是本地部署,把Deepseek模型安装到自己本地的服务器来使用。
当然,参数量越大,成本就越高,对于个人来说,低参数版本的蒸馏模型就能满足一般使用要求了。
3、Deepseek官网操作界面指南
上图是Deepseek官网的操作界面,可以分为左右侧两大区域:
左侧是历史对话记录及新对话创建按钮区。一次对话只能解决一个问题,但一次对话可以进行多次问答。
需要特别注意的是:当我们的两个问题不具有关联性时,请创建一个新对话,否则上下文会相互干扰,出现答非所问的情况。
右侧是Deepseek的主操作界面:
中间的长条框为提示词命令输入区;
其左下方有“深度思考”和“联网搜索”按钮,当“深度思考”按钮处于蓝色状态时,就是R1模型,当“深度思考”处于浅灰色状态时,就是V3模型;
其右下方有曲别针按钮(上传文件,仅识别文字)和内容发送按钮,需要注意的是,当打开联网搜索时不支持上传文件。
当我们将任务要求发送出去的时候,Deepseek就会在主界面上方展开思索过程,并输出最后的内容。
二、一个案例,教会你高效使用Deepseek办公
不仅仅是Deepseek,很多AI工具都可以为办公赋能,主要方向有这么几个:
① 文章撰写;
② 智能数据处理;
③ 数据分析;
④ PPT生成;
⑤ 生成逻辑图、结构图;
⑥ 生成脚本语言,再用其它工具进行编程、绘图或者生成视频等。
对于AI工具,没有最好,只有合不合适。 因此,大家要结合自己实际的需求,选择合适的AI工具,而且AI工具是越用得多,会越来越好用。
下面我们就用接入Deepseek-R1(满血版)的腾讯元宝来完成一个工作任务:生成一个工作汇报。
或许你会说:做工作报告?我早就在用了啊!的确,它是能写出来的,也能用,但能复用吗?
那么,如何做出一个既能用,又能复用的工作汇报呢?也就是说,我们不仅要做一个文档,还要基于这个文档整理它的结构做网页的呈现,还要根据这个结构来做PPT的呈现。
我们看到文章,都是可以将定期发布的文档做成模板。工作汇报也一样,有这个模版之后,只需要将前一个季度的工作任务总结的数据,代入到模板中,这个文件就可以当成前一个季度的工作汇报来加以使用了。
假设我们有一个Excel表格,需要将其中的数据一个个复制到模板中,如果手动操作,是不是太麻烦了?
AI能不能解决自动填充模板的需求呢?
那么,这个案例就来完成这个场景下AI应用过程。
首先,要完成模板内容的自动填充,首先得有一个模板。 因此,第一件事就是用AI智能生成word文档模板。
接下来,是AI将数据智能填入模板内。 但很多场景下的数据信息都是缺失的,那么我们需要AI把这些数据整理出来,这是第三阶段的AI问题提取。
当这些数据填入到模板中之后,我们就有了一个完整的word文稿成品。但在商务发表场合,我们还需要把文稿转换成演讲用的PPT。
有了PPT,我们又希望把文稿中的框架整理出来,变成一个可复用的结构图,这就是AI的第五个应用场景。
接下来,我们把自己当成一个职场小白,一步步引导AI(以腾讯元宝为例)来完成所有的任务。
1.AI智能文撰:创建文档模板
我们现在需要一个工作汇报模板,但我又没写过,不知道工作汇报内容,那我们可以问问AI:
工作汇报到底有哪些内容?有什么结构特征、写作特点?AI就会从它的知识库里提取我们撰写文稿的相关要素。
我们可以这样输入:
请告诉我,一个好的工作汇报文稿应注意哪些要素?
AI经过深度思考,将思考过程及结果呈现出来了。需要注意,这个思考过程非常重要,我们要仔细过一遍,确保AI的思路逻辑没有跑偏。
这是AI产出的内容:
一份工作汇报包含:
① 明确目标与受众;
② 结构清晰、逻辑严谨;
③ 内容简洁,重点突出问题分析与解决方案;
④ 语言表达、视觉呈现、时间控制;
⑤ 互动收尾跟进以及加分技巧。
这些内容非常详实,包括每一个细项需要干什么也写得非常清楚。有了这个逻辑过程和关键要素,那我们就可以基于以上内容来创建模板了。
现在我们已经完成了一个任务:生成工作汇报的关键要素。
接下来,我们要将得到的结果复制,开启另一个对话,用这些要素来创建文稿模板。
我们可以这样写:
请根据以下工作汇报文稿特点来撰写工作汇报文稿模板(附上刚刚得到的结果)。
经过深度思考,AI 将工作汇报分成了四个一级标题,分别是开场、主体、结尾以及最后的附件,每一个标题框架下都有相应的需要描述的内容。
这样,我们就得到了一个可以复用的工作汇报文档模板。
2.AI数据智能:数据自动填充文档模板
假设我们收集的关键数据包括以下部分:
① 核心业绩的指标达成情况;
② 重点项目的阶段性成果;
③ 挑战与风险分析;
④ 下一阶段的目标与资源需求。
要实现自动填充数据,首先要让AI理解数据。我们先将数据表上传到AI,只需要做如下输入:
请告诉我文件中有哪些工作表,并提供每个工作表中的数据据字典。
数据字典就是工作表中的每一列的字段的意义总结,包括数据类型,有何特点。
当AI输出数据字典,我们检查确定没有问题之后,说明AI已经完全理解了数据。如果AI理解跑偏,需要让它重新修正。
接下来,我们开启一个新对话,进行进一步的任务描述:
请使用excel文件中所有工作表中的所有数据,参照以下工作汇报撰写一份工作汇报文稿,需要补充信息的地方,请向我询问。(复制上面得到的文档模板)
AI在经过思考之后,把每一个需要对应的数据放到了模板相应合适的位置。
这时候,文稿还没最终成型,我们需要AI把没有收集到的内容抽取出来。
我们可以这样问:
请问完成这份报告还需要补充哪些信息?并以信息表格的方式提供给我。
接下来,AI会把信息缺失的部分整理成一个详细的表格输出给我们。我们补充完信息之后,再次将缺失信息表格上传,然后向它提问:
请使用excel文件中补充信息,完善以下工作汇报文稿。
于是,我们就得到一个完整的工作汇报了。
当然,很多公司的数据很敏感,我们可以提供AI数据样本,AI输出python代码,执行代码也可以完成数据的填充,但这个过程稍微复杂。为了保证信息安全,公司可以通过模型本地化部署来解决。
通过上面的操作,让我们看到R1模型和以前的大模型对话是完全不一样的。
以前的对话需要我们把需求、背景、任务及所需的所有信息都填充完整才能得到我们想要的结果。但R1模型只需要我们简单的提示,而且越开放越能让它自由发挥,才能更灵活获得完成任务的思维链。
因此,与R1对话是目的导向的,我们只需要把任务和目的表达清楚就行了。需要注意的是,上面每一个步骤都暗合我们人类的思考逻辑:首先输出的是要素,然后基于要素生成模板。
那么,直接让它输出模板会产生什么效果呢?因为R1的思考范围太大了,我们每一个阶段的产出结果都是为了下一个内容限定范围用的条件。
否则,它就会在所有知识范围内找相关要素去生成模板,最后失去焦点了。只有聚焦的文稿模板才更加精准和可用。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
更多推荐
所有评论(0)