图片

“老板说,这个项目得上Deepseek,还得再做个知识库…”

还有哪个开发者,最近没听到这样的抱怨?

Deepseek爆火,推理端的智能提速,算力成本急剧下降,让不少原本不想用大模型,用不起大模型的企业,一夕之间全部拥抱AI,开启了降本增效。在这个过程中,对于大部分拥有优质私有数据,敏感数据的企业来说,如果不想数据泄露,那么部署本地知识库,就成了拥抱大模型的必经之路。

可是当你真正开始调研的时候,就会发现这事儿没那么简单:

想用开源的蒸馏版模型?效果差强人意,连基本的问答准确度都难以保证。

比如,前不久,我们推出了基于Deepseek 7b+Milvus的本地部署教程,就有不少开发者反应,7B版本,即使加上了向量数据库,也依然效果差强人意。

可是上满血版的大模型?满血的R1,参数有671B,即使已经是FP16精度,需要的显存也高达1342GB,换算成80G的A100,也需要足足17张。而个人电脑,即使采用顶配的24GB的4090,需要的数量也足足高达56张(MoE+量化会降低实际显存需求)……

很显然,别说个人,就是一些中小企业,也没这么多显卡。

那就用开源方案搭建?光是配置环境就够喝一壶的:向量库选型、模型部署、前端界面…每一步都像是在考验你的耐心。

难道就没有一个简单可行的方案吗?

被老板抓着加班部署了一个月后,相信我,Deepseek+Milvus+AnythingLLM,绝对是你部署本地知识库的最优解!

这个方案不仅解决了性能问题,更重要的是,它真的做到了"零门槛",只需要30分钟,就能搭建一个具备企业级性能的私有知识库。而且,整个过程真的像搭积木一样简单,小白也能快速上手。

选型思路

首先我们来看一下,这次选型,为什么采用Deepseek+Milvus+AnythingLLM这个组合,它主要解决了目前RAG落地的三大痛点:

1.1 模型性能问题

用过ollama提供的蒸馏版Deepseek的朋友,应该都有同感,虽然也是Deepseek,但效果实在不怎么聪明。总结来说,就是7B太智障,671B用不起。

所以,在这里,我们推荐使用硅基流动以及一些云服务企业的API服务,通过API调用的方式,我们可以用很低的成本获得满血版Deepseek的算力支持。而且,最近一段时间,新注册用户还有免费的额度尝鲜。

1.2 部署难度问题

市面上开源的RAG方案不少,但要么需要复杂的环境配置,要么需要大量的运维工作。而AnythingLLM则提供完整的UI界面,天然的支持向量数据库Milvus以及各种类型的大模型接口,降低了入门用户的使用门槛。

而Milvus在召回效率、支持的数量规模等方面,也是业内毋庸置疑的第一梯队,与此同时,Milvus也是目前github上向量数据库方向,star数量最多的开源产品,属于大部分AI开发者的入门基础课程

1.3 扩展性问题

这个组合最大的亮点在于它的灵活性。可以轻松切换不同的大语言模型,Milvus支持亿级数据的高性能检索,AnythingLLM的插件机制让功能扩展变得简单。

总的来说,这个组合方案既保证了效果,又降低了使用门槛,还具备良好的扩展性。对于想要快速搭建私有知识库的个人来说,是一个非常理想的选择。

实战:搭建本地RAG

环境配置要求说明:

本文环境均以MacOS为例,Linux和Windows用户可以参考对应平台的部署文档。

docker和ollama安装不在本文中展开。

本地部署配置:最低CPU:4核、内存8G,建议 CPU:8核、内存16G

(1)Milvus部署

官网:https://milvus.io

1.1下载Milvus部署文件
bash-3.2$ wget https://github.com/milvus-io/milvus/releases/download/v2.5.4/milvus-standalone-docker-compose.yml -O docker-compose.yml``   

1.2修改配置文件

说明:anythingllm对接milvus时需要提供milvus账号密码,因此需要修改docker-compose.yml文件中的username和password字段。

version: '3.5'``services:`  `etcd:`    `container_name: milvus-etcd`    `image: registry.cn-hangzhou.aliyuncs.com/xy-zy/etcd:v3.5.5`    `environment:`      `- ETCD_AUTO_COMPACTION_MODE=revision`      `- ETCD_AUTO_COMPACTION_RETENTION=1000`      `- ETCD_QUOTA_BACKEND_BYTES=4294967296`      `- ETCD_SNAPSHOT_COUNT=50000`    `volumes:`      `- ${DOCKER_VOLUME_DIRECTORY:-.}/volumes/etcd:/etcd`    `command: etcd -advertise-client-urls=http://127.0.0.1:2379 -listen-client-urls http://0.0.0.0:2379 --data-dir /etcd`    `healthcheck:`      `test: ["CMD", "etcdctl", "endpoint", "health"]`      `interval: 30s`      `timeout: 20s`      `retries: 3`  `minio:`    `container_name: milvus-minio`    `image: registry.cn-hangzhou.aliyuncs.com/xy-zy/minio:RELEASE.2023-03-20T20-16-18Z`    `environment:`      `MINIO_ACCESS_KEY: minioadmin`      `MINIO_SECRET_KEY: minioadmin`    `ports:`      `- "9001:9001"`      `- "9000:9000"`    `volumes:`      `- ${DOCKER_VOLUME_DIRECTORY:-.}/volumes/minio:/minio_data`    `command: minio server /minio_data --console-address ":9001"`    `healthcheck:`      `test: ["CMD", "curl", "-f", "http://localhost:9000/minio/health/live"]`      `interval: 30s`      `timeout: 20s`      `retries: 3`  `standalone:`    `container_name: milvus-standalone`    `image: registry.cn-hangzhou.aliyuncs.com/xy-zy/milvus:v2.5.4`    `command: ["milvus", "run", "standalone"]`    `security_opt:`    `- seccomp:unconfined`    `environment:`      `ETCD_ENDPOINTS: etcd:2379`      `MINIO_ADDRESS: minio:9000`      `COMMON_USER: milvus`      `COMMON_PASSWORD: milvus`    `volumes:`      `- ${DOCKER_VOLUME_DIRECTORY:-.}/volumes/milvus:/var/lib/milvus`    `healthcheck:`      `test: ["CMD", "curl", "-f", "http://localhost:9091/healthz"]`      `interval: 30s`      `start_period: 90s`      `timeout: 20s`      `retries: 3`    `ports:`      `- "19530:19530"`      `- "9091:9091"`    `depends_on:`      `- "etcd"`      `- "minio"``networks:`  `default:`    `name: milvus
1.3启动并检查Milvus服务
bash-3.2$ docker-compose up -d

(2)ollama下载向量模型

官网:https://ollama.com/

2.1 下载查看向量模型
bash-3.2$  ollama pull nomic-embed-text
bash-3.2$  ollama list

(3)注册硅基流动获取API密钥

官网:https://siliconflow.cn/zh-cn/

3.1复制满血版deepseek模型名称

3.2 创建API密钥并记录

(4)下载安装AnythingLLM

官网:https://anythingllm.com/

4.1 安装时点击GetStarted

4.2 暂不配置先点下一步

4.3 点击Skip跳过

4.4 部署完成进入首页

(5)配置AnythingLLM

5.1添加deepseek模型

说明:点击LLM首选项选择提供商Generic OpenAI并填入刚才注册的API密钥、baserul、deepseek模型名称并保存

5.2 添加milvus向量数据库

说明:点击向量数据库选项选择Milvus并填入刚才部署好的milvus的地址、用户名、密码并保存

5.3 添加embeding模型

说明:点击Embedder首选项选择ollama并填入刚才部署好的ollama的URL和模型名称并保存

(6)效果演示

6.1 回到首页新建工作区

6.2 上传测试数据集

说明:数据集可以从huggingface上获取 网址:https://huggingface.co/datasets

上传区域传入数据集并点击Move向量化后存入milvus

6.3 测试问答效果

说明:对话框中输入“怎么实现向量检索检索?”得到的回复是符合预期的,可以看到回复中引用了本地知识库中的内容。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐