主要内容:

一:DeepSeek本地部署及模型下载

二:第三方助手下载及配置调试

三:基础知识点

1:下载Ollama(https://ollama.com/)

2:按提示安装后,输入cmd,打开命令提示符后,输入ollama回车确认,看到图片提示的输出,说明安装成功

注:出现提示:‘ollama’不是内部或外部命令,也不是可运行的程序或批处理文件。到环境变量中>path里是否有ollama安装目录,如果有,但是还是提示ollama’不是内部或外部命令,也不是可运行的程序或批处理文件,尝试重启电脑

3:到ollama官网首页,点击deepseek-R1,下载模型,选择适合电脑的模型(我演示所用的是笔记本4070 8G显存,所以下载的是8b的模型)

显存参考:

显存
模型选择
无独立显卡
1.5b模型
4G或8G
选择7b或8b模型

确定好模型之后,下拉网页,复制对应的命令,粘贴到cam终端回车确认,等待模型下载完成,提示出现success就说明deepseek本地版部署完成

可以在cmd终端命令行进行对话

下面我们测试一下8b版本的效果,让它计算一道小学数学题,测试一下准确度

问题:甲乙二人从两地同时相对而行,经过4小时,在距离中点4千米处相遇。甲比乙速度快,甲每小时比乙快多少千米?

正确答案:甲每小时比乙快2千米。

下面是DeepSeek 8b模型的效果

答案准确

4:下载Cherry Studio第三方工具,方便调用,打开https://cherry-ai.com/(这是一个支持多加大模型的AI客户终端,直接对接Ollama的api,实现窗口式的大模型的对话效果),下载Cherry Studio,按照提示完成安装

5:配置模型

点击左下角设置,在模型服务中选择ollama,打开右上角的开关,点击底部的管理按钮,添加刚才下载的deepseek模型

然后在设置界面,选择第二个默认模型,然后在默认助手模型中,选择你要调用的模型(你刚才下载的模型)

6:完成上边的流程后,就可以和deepseek进行对话了,下边是效果展示

问题:甲乙二人从两地同时相对而行,经过4小时,在距离中点4千米处相遇。甲比乙速度快,甲每小时比乙快多少千米?

正确答案:甲每小时比乙快2千米。

7:基础知识点

B
billion=10亿
fp:指的是模型计算时的数值精度,精度越高,计算结果越准确,但是需要的计算资源也越多,推理速度就会变慢。主要是用在模型训练的过程当中,训练完成后精度就不再改变

FP32  

标准训练精度,也是大模型训练最常用的精度  

4字节/参数


FP16  

半精度浮点:可以减少内存占用和计算成本,但是会损失结果质量  

2字节/参数


BF16  

全称bfloat16:和FP16类似,但更适合深度学习  

2字节/参数


FP8    

8 位浮点数,进一步压缩模型的精度浮点,适合加速推理  

1字节/参数


量化(Q):是对模型权重和激活值进行数值压缩,让模型的体积变小,可以节约运行需要的显存,但是会少量牺牲模型的精度,影响模型智商。这类似于将无损图片转换为高清JPG格式,虽然会轻微影响画质,但能大幅减少存储空间。主要用在推理过程,量化后模型体积变小,对显存要求就更低,同样的硬件配置,推理速度就会加快。

INT8  

8 位整数量化,将 32 位或16 位浮点数转换为 8位整数,减少存储和计算需求  

1字节/参数


INT4  

4位整数量化,最常用的量化方案,进一步减少模型大小,但会损失更多的模型精度  

0.5字节/参数


INT2及INT1  

这个属于极端压缩了,仅仅适用于特殊应用,不太常用


读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐