AI 工具与 AIGC 实战指南:从本地大模型到智能开发全链路

在 AI 浪潮席卷全球的当下,DeepSeek 的爆火让更多人意识到:大模型不再只是大厂专属,普通开发者和团队也可以低成本地拥抱 AI。本文将系统性地介绍从本地大模型部署、知识库搭建,到 AI 辅助编程、工具协议整合的完整实战路径。


一、DeepSeek 与本地大模型生态

1.1 DeepSeek 简介

DeepSeek 是近年来最受关注的国产大语言模型之一,尤其是其 DeepSeek-R1 系列在推理能力上表现亮眼,引发了全民热议。对于开发者而言,DeepSeek 的开源策略意味着我们可以将其部署到本地环境,实现数据的完全自主可控。

目前 DeepSeek 提供了多种参数规模的模型(如 1.5B、7B、8B、14B、32B、70B 等),开发者可以根据自身硬件条件选择合适的版本。一般来说:

模型参数量 推荐显存 适用场景
1.5B / 7B 4-8 GB 个人学习、轻量对话
8B / 14B 8-16 GB 日常开发辅助、代码补全
32B / 70B 24-80 GB 团队级应用、复杂推理

1.2 本地部署工具生态

在本地部署大模型方面,目前已经形成了成熟的工具链,远比早期手动配置 Python + Transformers 框架简单得多。以下是几个核心工具:

Ollama —— 本地运行大模型的核心引擎,使用方式类似 Docker,通过简单的命令即可拉取和运行模型。

Page Assist —— 浏览器插件,为 Ollama 提供 Web 可视化交互界面,解决命令行交互体验差的问题。

Hugging Face —— 被称为"大模型领域的 GitHub",托管了上百万开源模型,涵盖文本生成、图像处理、语音合成等多种类型,并提供在线预览和 API 文档。

LM Studio —— 一站式本地 LLM 平台,支持离线运行模型,提供直观的图形界面,方便进行文本生成、模型微调和文档交互。

魔塔社区(ModelScope) —— 国内主流的模型仓库管理平台,类似于 Hugging Face 的国内替代方案,网络访问更稳定。


二、Ollama 本地大模型部署实战

2.1 安装 Ollama

Ollama 支持 Windows、macOS 和 Linux 三大平台,可通过官网下载安装包:

https://ollama.com/download

以 Linux 为例,使用脚本一键安装:

curl -fsSL https://ollama.com/install.sh | sh

安装完成后,通过 systemctl 管理服务:

# 设置开机自启
systemctl enable ollama

# 启动 / 停止 / 重启服务
systemctl start ollama
systemctl stop ollama
systemctl restart ollama

2.2 模型管理

Ollama 的模型管理命令与 Docker 非常相似,上手极为简单:

# 拉取 DeepSeek-R1 8B 模型
ollama pull deepseek-r1:8b

# 运行模型(进入命令行交互模式)
ollama run deepseek-r1:8b

# 停止交互(在对话界面中)
Ctrl + D

除了对话模型,我们还需要拉取文本嵌入模型,它负责将文档内容转化为大模型可理解的向量数据,是构建知识库的基础:

ollama pull nomic-embed-text:latest

2.3 API 服务与远程访问配置

Ollama 默认监听 11434 端口提供 API 服务。安装完成后可通过以下命令确认端口状态:

netstat -anp | grep ollama
# 输出示例: tcp  0  0  127.0.0.1:11434  0.0.0.0:*  LISTEN  13531/ollama

关键问题:默认监听在回环地址(127.0.0.1),外部机器无法访问。 如果你的 Ollama 运行在服务器上,而 Page Assist 运行在本地 Windows 上,就需要修改监听地址。

方法一:修改环境变量

export OLLAMA_HOST=0.0.0.0:11434

systemctl 管理的服务无法直接读取该环境变量,需要在 service 文件中配置:

vim /etc/systemd/system/ollama.service
# 在 Service 段添加:
Environment="OLLAMA_HOST=0.0.0.0:11434"

# 重载并重启
sudo systemctl daemon-reload
sudo systemctl restart ollama

方法二:从源码修改(解决跨域和 Host 验证限制)

Ollama 的 API 服务默认限制了跨域访问和远程 Host 验证(仅允许 localhost),且没有提供环境变量来修改。需要从源码编译来解决:

# 查看当前版本
ollama --version
# 示例输出: ollama version is 0.5.9

# 下载对应版本源码
wget https://codeload.github.com/ollama/ollama/zip/refs/tags/v0.5.9 -O ollama-0.5.9.zip
unzip ollama-0.5.9.zip

# 修改 server/routes.go,注释掉 CORS 和 Host 验证中间件
# r.Use(
#     cors.New(config),
#     allowedHostsMiddleware(s.addr),
# )

编译需要 Go 1.23.4 和支持 C++17 的 gcc:

go build -ldflags="-s -w"

# 备份原版并替换
mv /usr/local/bin/ollama /usr/local/bin/ollama.office
cp ollama /usr/local/bin/

# 重启服务
systemctl restart ollama

2.4 Ollama API 调用示例

Ollama 提供了兼容 OpenAI 格式的 RESTful API,可以轻松集成到各种应用中:

# 调用对话接口
curl http://localhost:11434/api/chat -d '{
  "model": "deepseek-r1:8b",
  "messages": [
    {"role": "user", "content": "用 Python 写一个快速排序"}
  ]
}'

[图片占位符:Ollama API 调用流程图——展示客户端、Ollama 服务、模型之间的交互]


三、Page Assist:打造 Web 端交互体验

命令行交互虽然功能完整,但体验感较差。Page Assist 是一款浏览器扩展插件,可以让 Ollama 拥有类似 ChatGPT 的 Web 交互界面。

3.1 安装步骤

  1. 在 Chrome 网上商店搜索 “Page Assist”
  2. 点击"添加到 Chrome"
  3. 使用快捷键 Ctrl + Shift + L 打开面板
  4. 在设置中输入 Ollama 服务地址(如果前面配置了远程访问,填写服务器 IP 即可)
  5. 将语言设置为中文
  6. 选择已下载的模型,即可开始对话

[图片占位符:Page Assist 界面截图——展示对话和设置界面]

3.2 配置知识库(RAG)

RAG(Retrieval-Augmented Generation)是让大模型基于你的私有文档回答问题的关键技术。配置步骤如下:

  1. 设置嵌入模型:进入设置 > RAG,选择文本嵌入模型 nomic-embed-text:latest,将文档上传数量和检索数量适当调大(建议 10)
  2. 上传知识文档:进入"管理知识" > “添加新知识”,输入标题并上传文件,等待处理完成
  3. 使用知识库:在聊天页面右下角选择"知识",即可基于上传的文档进行问答

其原理是在聊天时,系统会将知识库中与问题最相关的文档片段作为上下文传递给大模型,从而让模型基于你的私有数据生成回答。


四、知识库搭建:MaxKB 与 FastGPT

除了 Page Assist 内置的简单知识库功能,如果你需要更专业的知识库管理能力,可以考虑以下两个开源方案:

4.1 MaxKB

MaxKB 是一款基于 LLM 大语言模型的开源知识库问答系统,支持直接上传文档、自动拆分、向量化处理,并提供开箱即用的问答界面。

4.2 FastGPT

FastGPT 是一个基于 LLM 大模型的知识库问答系统,提供可视化的工作流编排能力,支持多种数据导入方式,适合构建复杂的企业级知识问答场景。

两者均支持对接 Ollama 本地模型,实现完全离线的私有知识库部署。

[图片占位符:知识库构建流程图——文档上传、文本分块、向量化、检索、生成回答]


五、AI IDE 对比:Cursor、Trae、VS Code + Copilot

AI 辅助编程已经成为开发者的标配,目前主流的 AI IDE 有以下三种方案:

5.1 VS Code + Copilot

  • 生态最成熟,对 VS Code 进行了深度优化
  • 支持多种编程语言
  • 价格相对便宜(淘宝渠道更实惠)
  • 适合已有 VS Code 使用习惯的开发者

5.2 Cursor

  • 目前公认最强大的 AI IDE
  • 内置 AI 对话、代码生成、自动补全等功能
  • 原生支持 MCP 协议
  • 付费价格较高(约 $20/月),每个新邮箱可免费试用 14 天

5.3 Trae

  • 字节跳动推出的 AI IDE,目前完全免费
  • 国内使用体验流畅
  • 集成了多种国产大模型
  • 对中文开发者友好
特性 VS Code + Copilot Cursor Trae
价格 较低 较高 免费
AI 能力 中等 最强 较强
MCP 支持 需插件 原生支持 支持
中文体验 一般 良好 优秀
上手难度

六、MCP 协议:赋予大模型访问外部资源的能力

6.1 什么是 MCP?

MCP(Model Context Protocol,模型上下文协议)是一个开放协议,用于在大模型和外部资源之间建立标准化的通信机制。它就像是 AI 领域的 TCP/IP 协议,让大模型能够访问数据库、文件系统、API 等外部资源。

MCP 的调用流程为:

IDE 工具 -> MCP 客户端 -> MCP 服务器 -> 外部资源

[图片占位符:MCP 协议架构图——展示 IDE、MCP Client、MCP Server 和外部资源的交互关系]

6.2 实战:使用 DBHub 连接数据库

DBHub 是一款成熟的 MCP 服务器,支持 MySQL、PostgreSQL、MongoDB、Redis、Elasticsearch 等多种数据库。安装后,你可以直接让 AI 操作数据库,比如让它生成指定表的增删改查代码。

以 Docker 方式运行 DBHub:

docker run -d --name dbhub -p 3000:3000 dbhub/dbhub

在 Cursor 中配置后,你就可以用自然语言让 AI 帮你查询和操作数据库了。

6.3 开发自定义 MCP 服务器

MCP 是一个协议规范,理论上可以用任何语言实现。目前主流的实现语言是 Python 和 JavaScript,各语言都有成熟的 SDK:

  • Go 语言 SDK:mcp-gogo-sdk
  • Python SDK:官方提供
  • JavaScript SDK:官方提供

开发流程类似于实现一个 TCP 服务器——集成 SDK 后编写自己的业务逻辑即可。

6.4 MCP 与 A2A

在大模型应用开发中,外部调用的两大主流方式是 MCPA2A(Agent-to-Agent)。MCP 侧重于模型与工具/资源的交互,A2A 则侧重于多个 Agent 之间的协作。两者互补,共同构成了 AI 应用的基础设施。


七、Spec Kit:规范驱动的 AI 协作开发

7.1 什么是 Spec Kit?

Spec Kit 是 GitHub 开源的规格驱动开发工具包,能通过命令行与 AI 编码助手(如 Claude Code、GitHub Copilot)协作,自动生成规范文档、拆解开发任务并实现代码。它遵循"规范先行"的开发理念,特别适合大型项目和团队协作。

7.2 安装与初始化

# 中文适配版本安装
uv tool install specify-cn-cli --from git+https://github.com/linfee/spec-kit-cn.git

# 创建新项目
specify-cn init todo-app --ai claude

# 在已有项目中初始化
specify-cn init --here

7.3 核心工作流程(7 步法)

在 AI 助手客户端中依次执行以下命令:

第 1 步:建立项目原则

/speckit.constitution 代码流程精简,测试用例完善,界面精美但不冗余,注释清晰易懂

生成文件:.specify/memory/constitution.md

第 2 步:撰写功能规格

/speckit.specify 开发个人待办事项应用,支持创建/编辑/删除待办,设置优先级和截止日期

生成文件:specs/[编号]-todo-app/spec.md

第 3 步:澄清需求模糊点

/speckit.clarify

AI 会自动识别需求中的歧义并提问(最多 5 个问题),回答后自动更新 spec.md。

第 4 步:制定技术方案

/speckit.plan 前端 React 18 + TypeScript 5.0,构建工具 Vite 5.0,样式 Tailwind CSS

生成文件:plan.mddata-model.md

第 5 步:拆解任务

/speckit.tasks

生成文件:tasks.md,包含任务 ID、描述、依赖关系和文件路径。

第 6 步:检查一致性

/speckit.analyze

验证所有文档之间是否存在矛盾,确保流程无误。

第 7 步:执行实现

/speckit.implement

AI 按 tasks.md 顺序自动生成代码,遵循 TDD(测试驱动开发)模式。

[图片占位符:Spec Kit 工作流程图——展示 7 个步骤的完整链路]

7.4 最佳实践

  1. 规范即源码:修改需求时必须先更新 spec.md,再重新执行后续步骤,避免文档与代码脱节
  2. 团队分工:产品经理 Review spec.md,架构师把控 plan.md,开发者执行 tasks.md
  3. 手动 Review:AI 生成的代码需要检查异常处理、性能优化和代码可读性
  4. Claude.md 与 Spec Kit:小项目可用 Claude.md(/init 生成),大项目推荐使用 Spec Kit,两者不要混用以避免冲突

八、OpenClaw:快速搭建 AI 智能体

OpenClaw 是一个开源的 AI Agent 管理平台,可以快速创建智能体并绑定到飞书、QQ 等 IM 通道。

8.1 创建智能体

openclaw agents add \
  --bind feishu:default \
  --model "zai/glm-4.7" \
  --agent-dir /home/ocw/.openclaw/agents/pd/agent \
  --workspace /home/ocw/.openclaw/workspace/pd \
  pd

8.2 配置搜索能力(SearXNG)

docker run -d \
  --name searxng \
  --restart always \
  -p 8888:8080 \
  -e SEARXNG_BASE_URL=http://localhost:8888/ \
  searxng/searxng

启动后进入容器修改 /etc/searxng/settings.yml,启用 JSON 格式输出和百度搜索源。

8.3 核心配置文件

智能体的行为由三个关键文件控制:

  • IDENTITY.md:机器人身份描述
  • SOUL.md:核心原则和行为准则
  • USER.md:与主人的交互说明

8.4 群聊策略

OpenClaw 提供了灵活的群聊响应策略:

策略 说明
allowlist(默认) 仅白名单群可 @机器人
open 所有群都开放,@即响应
denylist 黑名单模式,除指定群外都响应
disabled 完全不响应群聊,仅私聊可用

九、AI 辅助编码的工作流建议

结合上述工具,推荐以下 AI 辅助开发工作流:

  1. 代码编写:使用 Cursor / Trae 作为主力 IDE,利用 AI 补全和对话能力加速编码
  2. 数据库交互:通过 MCP + DBHub 让 AI 直接操作数据库
  3. 需求管理:使用 Spec Kit 进行规范驱动的需求拆解和任务管理
  4. 知识沉淀:搭建本地知识库,将团队文档、技术规范投喂给大模型
  5. 团队协作:通过 OpenClaw 搭建 AI 助手接入飞书/QQ,提供智能问答服务

[图片占位符:AI 辅助开发工作流全景图]


总结

从本地部署大模型到 AI 辅助编程,从知识库搭建到 MCP 工具集成,AI 工具链已经形成了一套完整的开发生态。作为开发者,我们不需要精通每一个工具,但需要了解它们的能力边界和适用场景,才能在实际工作中选择最合适的方案,真正让 AI 成为生产力倍增器。


来源:基于个人学习笔记整理,涉及 Ollama、Page Assist、Cursor、MCP 协议、Spec Kit、OpenClaw 等工具的实战经验。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐