主要内容:

一:DeepSeek本地部署及模型下载

二:第三方助手下载及配置调试

三:基础知识点

1、:下载Ollama

2、:按提示安装后,输入cmd,打开命令提示符后,输入ollama回车确认,看到图片提示的输出,说明安装成功

注:出现提示:‘ollama’不是内部或外部命令,也不是可运行的程序或批处理文件。到环境变量中>path里是否有ollama安装目录,如果有,但是还是提示ollama’不是内部或外部命令,也不是可运行的程序或批处理文件,尝试重启电脑

3、:到ollama官网首页,点击deepseek-R1,下载模型,选择适合电脑的模型(我演示所用的是笔记本4070 8G显存,所以下载的是8b的模型)

显存参考:

显存
模型选择
无独立显卡
1.5b模型
4G或8G
选择7b或8b模型

确定好模型之后,下拉网页,复制对应的命令,粘贴到cam终端回车确认,等待模型下载完成,提示出现success就说明deepseek本地版部署完成

可以在cmd终端命令行进行对话

下面我们测试一下8b版本的效果,让它计算一道小学数学题,测试一下准确度

问题:甲乙二人从两地同时相对而行,经过4小时,在距离中点4千米处相遇。甲比乙速度快,甲每小时比乙快多少千米?

正确答案:甲每小时比乙快2千米。

下面是DeepSeek 8b模型的效果

答案准确

4、:下载Cherry Studio第三方工具,方便调用(这是一个支持多加大模型的AI客户终端,直接对接Ollama的api,实现窗口式的大模型的对话效果),下载Cherry Studio,按照提示完成安装

5、:配置模型

点击左下角设置,在模型服务中选择ollama,打开右上角的开关,点击底部的管理按钮,添加刚才下载的deepseek模型

然后在设置界面,选择第二个默认模型,然后在默认助手模型中,选择你要调用的模型(你刚才下载的模型)

6、:完成上边的流程后,就可以和deepseek进行对话了,下边是效果展示

问题:甲乙二人从两地同时相对而行,经过4小时,在距离中点4千米处相遇。甲比乙速度快,甲每小时比乙快多少千米?

正确答案:甲每小时比乙快2千米。

7、:基础知识点

B
billion=10亿
fp:指的是模型计算时的数值精度,精度越高,计算结果越准确,但是需要的计算资源也越多,推理速度就会变慢。主要是用在模型训练的过程当中,训练完成后精度就不再改变

FP32  

标准训练精度,也是大模型训练最常用的精度  

4字节/参数


FP16  

半精度浮点:可以减少内存占用和计算成本,但是会损失结果质量  

2字节/参数


BF16  

全称bfloat16:和FP16类似,但更适合深度学习  

2字节/参数


FP8    

8 位浮点数,进一步压缩模型的精度浮点,适合加速推理  

1字节/参数


量化(Q):是对模型权重和激活值进行数值压缩,让模型的体积变小,可以节约运行需要的显存,但是会少量牺牲模型的精度,影响模型智商。这类似于将无损图片转换为高清JPG格式,虽然会轻微影响画质,但能大幅减少存储空间。主要用在推理过程,量化后模型体积变小,对显存要求就更低,同样的硬件配置,推理速度就会加快。

INT8  

8 位整数量化,将 32 位或16 位浮点数转换为 8位整数,减少存储和计算需求  

1字节/参数


INT4  

4位整数量化,最常用的量化方案,进一步减少模型大小,但会损失更多的模型精度  

0.5字节/参数


INT2及INT1  

这个属于极端压缩了,仅仅适用于特殊应用,不太常用


我的DeepSeek部署资料已打包好(自取↓)
https://pan.quark.cn/s/7e0fa45596e4

但如果你想知道这个工具为什么能“听懂人话”、写出代码 甚至预测市场趋势——答案就藏在大模型技术里!

❗️为什么你必须了解大模型?

1️⃣ 薪资爆炸:应届大模型工程师年薪40万起步,懂“Prompt调教”的带货主播收入翻3倍

2️⃣ 行业重构:金融、医疗、教育正在被AI重塑,不用大模型的公司3年内必淘汰

3️⃣ 零门槛上车:90%的进阶技巧不需写代码!会说话就能指挥AI

(附深度求索BOSS招聘信息)
在这里插入图片描述

⚠️警惕:当同事用DeepSeek 3小时干完你3天的工作时,淘汰倒计时就开始了。

那么,如何系统的去学习大模型LLM?

作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?老师啊,我自学没有方向怎么办?老师,这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!当然这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
在这里插入图片描述
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!
在这里插入图片描述

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐