蛇年最火的一个方向当属 deepseek,可以说是平地一声雷。我几乎每天都在找机会试用 deepseek,并且想在节后把 API 接入到技术派中,作为大家简历上的一个亮点。

我去淘宝搜了一下,目前有教大家在本地部署 deepseek-R1 的教程,一份卖 25 元,已经售出 600 多份,粗略估算就有 15000 元。

如果没记错的话,官方发布 R1 版本是在 1 月 20 号左右,满打满算也就 22 天的时间。

15000 元,对于在大厂工作的小伙伴来说,可能也就半个月的工资,但对于大多数非大厂的小伙伴来说,可能就是一个月甚至两个月、三个月的工资了,这波,真的得感谢一下 deepseek。

况且,还只是一个教如何在本地部署的教程,这玩意对于很多小伙伴来说,可能就是动动手的事。

不过话又说回来,工具的出现,不就是为了解放生产力,让大家用来增加收入的嘛,否则,工具的意义又何在呢?

我这里也给大家做个普及——如何在本地部署 deepseek,小白也是完全能够看得懂,之前有体育老师留言夸我的文章有趣、易懂,还真的很开心呢😄。

第一步,下载 Ollama,一个 轻量级的大模型推理框架,可以快速下载、运行大语言模型,并提供 API 供其他程序调用。

直接去搜,就能看到 Windows 和 macOS 的安装版本。

👉戳这个链接也行:https://ollama.com/download/mac

下载后 macOS 版会自动解压,双击就可以运行,可以在导航栏看到这个可爱的小图标,就表示 Ollama 已经成功运行了。

Ollama 已经支持 deepseek 的全尺寸版本,比如说 1.5b、7b、8b、14b 等,本地建议安装 7b 版本,体积大小最合适。

第二步,在控制台输入 ollama run deepseek-r1:7b 运行,我家的网速很一般,这里拉取模型也是花了不少时间。

截图这会有 2.5M/s,但不是很稳定,慢的时候只有 300 多 kb, 所以这一步需要花时间耐心等一下。

啊,等啊等,等啊等,终于下载完成了,不容易啊。

第三步,等 deepseek 拉取完成后,就可以在控制台进行交互了,我的第一个问题是:“你知道沉默王二这个大傻 x吗?”

啊。。。。。。就这。。。。。。

对,本地部署,如果没有数据投喂,没有角色设定,模型本身也是一张白纸,只具备推理能力,但还没办法推理,达到我们想要的预期效果。

如果问他一些其他的问题,比如说如何学习 Java,还是能够掰扯几句的。

再挖一个坑吧,这几天调教调教他,再给大家汇报战果。

这也算是一个入门级的教程了,你看,又帮你省了 25 块钱。

是不是值得一个点赞,或者转发(dog)?

或者你可以拿这个教程,简单包装下拿出去卖,是不是又多了一个赚钱的方式。

当然了,懂技术的人不少,懂运营的人不多。

先学会把工具用起来,让自己在信息输入方面不至于掉队,也是值得的。

蛇年,我们一起冲啊。

三分恶面渣逆袭

今天大部分时间都用来走亲戚和跑高速了,所以面渣逆袭并发编程篇也只修改了一道题。

点击屏幕左下方的【关注】按钮,带走她,这份在 GitHub 上星标 13000+ 的面渣逆袭 PDF,真的可以吊打面试官(不骗人)。

15.ThreadLocal 内存泄露是怎么回事?

ThreadLocalMap 的 Key 是 弱引用,但 Value 是强引用。

如果一个线程一直在运行,并且 value 一直指向某个强引用对象,那么这个对象就不会被回收,从而导致内存泄漏。

二哥的 Java 进阶之路:ThreadLocalMap 内存溢出

那怎么解决内存泄漏问题呢?

很简单,使用完 ThreadLocal 后,及时调用 remove() 方法释放内存空间。

try {       threadLocal.set(value);       // 执行业务操作   } finally {       threadLocal.remove(); // 确保能够执行清理   }   

remove() 方法会将当前线程的 ThreadLocalMap 中的所有 key 为 null 的 Entry 全部清除,这样就能避免内存泄漏问题。

private void remove(ThreadLocal<?> key) {       Entry[] tab = table;       int len = tab.length;       // 计算 key 的 hash 值       int i = key.threadLocalHashCode & (len-1);       // 遍历数组,找到 key 为 null 的 Entry       for (Entry e = tab[i];               e != null;               e = tab[i = nextIndex(i, len)]) {           if (e.get() == key) {               // 将 key 为 null 的 Entry 清除               e.clear();               expungeStaleEntry(i);               return;           }       }   }      public void clear() {       this.referent = null;   }   
  1. Java 面试指南(付费)收录的腾讯面经同学 22 暑期实习一面面试原题:ThreadLocal 什么情况下会内存泄漏

零基础入门AI大模型

今天贴心为大家准备好了一系列AI大模型资源,包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

有需要的小伙伴,可以点击下方链接免费领取【保证100%免费

点击领取 《AI大模型&人工智能&入门进阶学习资源包》

1.学习路线图

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

在这里插入图片描述

在这里插入图片描述

(都打包成一块的了,不能一一展开,总共300多集)

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
在这里插入图片描述

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

5.免费获取

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码或者点击以下链接都可以免费领取【保证100%免费】

点击领取 《AI大模型&人工智能&入门进阶学习资源包》

在这里插入图片描述

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐