DeepSeek-R1-Distill-Qwen-1.5B新手入门：从零开始搭建智能对话应用

本文介绍了如何在星图GPU平台上自动化部署DeepSeek-R1-Distill-Qwen-1.5B镜像，快速搭建本地智能对话应用。该轻量级模型适用于代码编写、数学解题与文本生成等场景，用户可通过简单配置，在个人设备上获得高效的AI助手体验。

邹子乔

194人浏览 · 2026-03-15 00:34:33

邹子乔 · 2026-03-15 00:34:33 发布

DeepSeek-R1-Distill-Qwen-1.5B新手入门：从零开始搭建智能对话应用

1. 为什么选择这个“小钢炮”模型？

如果你正在寻找一个能在普通电脑上流畅运行的智能对话模型，DeepSeek-R1-Distill-Qwen-1.5B绝对值得你关注。让我用大白话告诉你它到底厉害在哪里。

想象一下，你有一个只有6GB显存的显卡，甚至只有一台普通的笔记本电脑，却想运行一个能帮你写代码、解数学题、回答问题的AI助手。这在以前几乎不可能，因为大多数像样的模型都需要十几GB甚至几十GB的显存。

但DeepSeek-R1-Distill-Qwen-1.5B改变了这个局面。它只有1.5亿参数，却能在数学测试中拿到80多分——这个成绩通常需要7亿参数的模型才能达到。这就是为什么它被称为“小钢炮”：身材小巧，威力不小。

更让人惊喜的是，它只需要3GB显存就能运行，如果使用压缩版本，甚至只需要0.8GB。这意味着什么？意味着你可以在树莓派上运行它，可以在手机上运行它，可以在很多你以为跑不动AI的设备上运行它。

而且它是完全免费的，可以商用。你不用为使用它支付任何费用，也不用担心版权问题。

2. 快速部署：十分钟搭建你的AI助手

现在我们来实际操作，看看怎么把这个“小钢炮”装到你的电脑上。整个过程非常简单，跟着我做就行。

2.1 环境准备

首先，你需要一个能运行Docker的环境。如果你用的是Windows，可以安装Docker Desktop；如果是Mac或Linux，安装Docker Engine就行。确保你的系统有至少8GB内存和6GB可用显存。

如果你没有独立显卡，只有集成显卡，也不用担心。这个模型对硬件要求真的很低，很多集成显卡也能跑起来，只是速度会慢一些。

2.2 一键启动服务

最方便的方式是使用预制的镜像。镜像就像是一个打包好的软件包，里面已经配置好了所有需要的环境。你只需要运行一条命令：

docker run -d \
  --name deepseek-chat \
  -p 7860:7860 \
  -p 8888:8888 \
  --gpus all \
  --restart unless-stopped \
  csdn-mirror/deepseek-r1-distill-qwen-1.5b:latest

让我解释一下这条命令的每个部分：

docker run -d：在后台运行一个容器
--name deepseek-chat：给容器起个名字，方便管理
-p 7860:7860：把容器的7860端口映射到主机的7860端口
-p 8888:8888：把容器的8888端口映射到主机的8888端口
--gpus all：使用所有可用的GPU
--restart unless-stopped：容器意外停止时自动重启

如果你没有GPU，或者想先用CPU试试，可以把--gpus all去掉。不过用CPU运行速度会比较慢，建议还是用GPU。

2.3 等待服务启动

运行命令后，需要等待几分钟让服务启动。这个过程会自动下载模型文件、启动vLLM推理引擎和Open WebUI界面。你可以通过查看日志来了解进度：

docker logs -f deepseek-chat

看到类似下面的输出，就说明启动成功了：

INFO: Starting vLLM engine...
INFO: Loading model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B...
INFO: Model loaded successfully
INFO: Starting Open WebUI on port 7860
INFO: Starting Jupyter Lab on port 8888

3. 开始对话：你的第一个AI助手

服务启动后，打开浏览器，访问 http://localhost:7860，你会看到一个简洁的聊天界面。

3.1 登录系统

系统已经预置了一个演示账号，你可以直接使用：

账号：kakajiang@kakajiang.com
密码：kakajiang

登录后，你就能看到主界面了。左边是对话历史，中间是聊天区域，右边是一些设置选项。界面很直观，就像使用微信聊天一样简单。

3.2 第一次对话

让我们试试这个AI助手的能力。在输入框里输入：

你好，请用中文介绍一下你自己

点击发送，几秒钟后，你就会看到模型的回复。它会告诉你它是一个基于DeepSeek技术的AI助手，擅长代码编写、数学解题、文本生成等任务。

再试试更有挑战性的问题：

请帮我写一个Python函数，计算斐波那契数列的第n项

看看它能不能给出正确的代码。通常它会返回类似这样的代码：

def fibonacci(n):
    if n <= 0:
        return "请输入正整数"
    elif n == 1 or n == 2:
        return 1
    else:
        a, b = 1, 1
        for i in range(3, n + 1):
            a, b = b, a + b
        return b

# 测试
print(fibonacci(10))  # 输出55

3.3 数学解题测试

这个模型的强项是数学推理。试试这个：

一个水池有进水管和出水管。单独开进水管，6小时可以注满水池；单独开出水管，8小时可以排空水池。如果同时打开进水管和出水管，需要多少小时可以注满水池？

模型应该会给出详细的解题步骤：

进水管每小时注入1/6水池
出水管每小时排出1/8水池
同时打开时，每小时净注入量 = 1/6 - 1/8 = 1/24
注满整个水池需要的时间 = 1 ÷ (1/24) = 24小时

4. 实用功能探索

除了基本的对话，这个AI助手还有很多实用的功能。让我们一一探索。

4.1 代码编写助手

如果你是个程序员，这个功能会很有用。你可以这样提问：

帮我写一个Flask Web应用，实现用户登录功能，包括注册、登录、退出，使用SQLite数据库

模型会生成完整的代码，包括数据库模型、路由处理、模板文件等。虽然可能需要一些调整，但基本框架已经搭建好了。

4.2 文档总结

遇到长篇文章需要快速了解内容？把文章复制粘贴给AI：

请总结下面这篇文章的主要内容，列出三个关键点：

[这里粘贴你的长篇文章]

它会提取核心信息，用简洁的语言告诉你文章讲了什么。

4.3 学习辅导

如果你在学习某个知识点，可以让AI帮你解释：

用简单的语言解释一下什么是神经网络，适合完全不懂的人理解

它会用生活中的例子来比喻，比如把神经网络比作人脑的神经元网络，输入层像眼睛耳朵，隐藏层像大脑思考，输出层像嘴巴说话。

4.4 创意写作

需要写点有创意的东西？试试这个：

帮我写一个关于人工智能帮助老人生活的短故事，300字左右

你会得到一个温馨的小故事，可以用来做文案素材或者创意启发。

5. 高级使用技巧

掌握了基本用法后，我们来学几个提升体验的小技巧。

5.1 使用系统提示词

在开始对话前，你可以设置系统提示词来定义AI的角色。比如：

你是一个专业的Python程序员，擅长编写高效、可读性强的代码。请用中文回答所有问题。

设置后，AI会记住这个角色设定，在后续对话中保持专业性。

5.2 调整生成参数

在聊天界面的设置里，你可以调整几个重要参数：

温度（Temperature）：控制输出的随机性。值越高（如0.8），回答越有创意；值越低（如0.2），回答越确定。建议设置在0.6-0.8之间。
最大生成长度：控制每次回答的最大长度。如果觉得回答太短或太长，可以调整这个值。
重复惩罚：防止AI重复相同的内容。如果发现AI老说同样的话，可以适当调高这个值。

5.3 使用Jupyter Lab

除了Web界面，你还可以通过Jupyter Lab来使用这个模型。访问 http://localhost:8888，使用相同的账号密码登录。

在Jupyter Lab里，你可以创建Python笔记本，直接调用模型的API：

import requests
import json

def ask_ai(question):
    url = "http://localhost:8000/v1/chat/completions"
    headers = {"Content-Type": "application/json"}
    data = {
        "model": "DeepSeek-R1-Distill-Qwen-1.5B",
        "messages": [{"role": "user", "content": question}],
        "temperature": 0.7,
        "max_tokens": 1024
    }
    
    response = requests.post(url, headers=headers, json=data)
    if response.status_code == 200:
        result = response.json()
        return result["choices"][0]["message"]["content"]
    else:
        return f"请求失败: {response.status_code}"

# 测试
answer = ask_ai("Python里怎么快速去重一个列表？")
print(answer)

这种方式适合批量处理问题，或者把AI功能集成到自己的程序里。

6. 常见问题解决

在使用过程中，你可能会遇到一些问题。这里列出几个常见的和解决方法。

6.1 服务启动失败

如果容器启动失败，首先检查Docker是否正常运行：

docker ps

如果看不到deepseek-chat容器，查看错误日志：

docker logs deepseek-chat

常见的问题和解决方法：

问题现象	可能原因	解决方法
端口被占用	7860或8888端口已被其他程序使用	修改映射端口，如 `-p 7861:7860`
显存不足	GPU显存不够	使用CPU模式或减小batch size
模型下载失败	网络问题	检查网络连接，或手动下载模型

6.2 回答速度慢

如果感觉AI回答很慢，可以尝试：

检查硬件使用情况：

nvidia-smi  # 查看GPU使用情况
docker stats deepseek-chat  # 查看容器资源使用

调整生成参数：
- 降低max_tokens，减少生成长度
- 使用流式输出，边生成边显示
使用量化版本：如果显存紧张，可以使用GGUF量化版本，只需要0.8GB显存。

6.3 回答质量不理想

如果AI的回答不符合预期：

重新组织问题：用更清晰、更具体的方式提问
提供更多上下文：在问题中给出更多背景信息
使用思维链提示：对于复杂问题，让AI“一步一步思考”
调整温度参数：适当提高温度让回答更有创意，或降低温度让回答更准确

6.4 保存对话历史

默认情况下，对话历史会保存在容器内。如果重启容器，历史记录会丢失。要永久保存，可以在启动容器时挂载卷：

docker run -d \
  --name deepseek-chat \
  -p 7860:7860 \
  -p 8888:8888 \
  -v ./chat_data:/app/data \
  --gpus all \
  csdn-mirror/deepseek-r1-distill-qwen-1.5b:latest

这样，对话数据就会保存在当前目录的chat_data文件夹里。

7. 实际应用场景

这个“小钢炮”模型虽然体积小，但能做的事情很多。下面是一些实际的应用场景，你可以参考着用起来。

7.1 个人学习助手

如果你在学编程、数学或其他专业知识，可以把它当作24小时在线的辅导老师：

代码调试：把出错的代码贴给它，让它帮你找问题
概念解释：不懂的专业术语，让它用简单的话解释
练习题解答：做完题后对照AI的解答，学习不同的解题思路
学习计划：让它帮你制定学习计划，推荐学习资源

7.2 工作效率提升

在工作中，它可以帮你：

邮件起草：告诉它要点，让它帮你写正式邮件
报告总结：把长报告给它，让它提取关键信息
会议纪要：整理录音或笔记，生成规范的会议纪要
数据整理：让它帮你整理表格数据，提取有用信息

7.3 创意内容生成

需要创意灵感时：

文案写作：产品描述、广告语、社交媒体内容
故事创作：短篇小说、剧本大纲、角色设定
方案策划：活动方案、项目计划、创意点子
翻译辅助：中英文互译，保持原文风格

7.4 技术开发支持

对开发者特别有用：

API文档：根据代码自动生成API文档
代码注释：给复杂的代码段添加详细注释
技术选型：对比不同技术方案的优缺点
错误排查：根据错误信息给出排查建议

8. 性能优化建议

想让这个“小钢炮”跑得更快更好？试试下面这些方法。

8.1 硬件配置优化

虽然模型对硬件要求不高，但合适的配置能提升体验：

GPU选择：NVIDIA RTX 3060就能达到200 tokens/秒的速度
内存：建议16GB以上，确保系统流畅
存储：使用SSD硬盘，加快模型加载速度
散热：长时间运行注意散热，避免过热降频

8.2 软件配置优化

在容器启动时，可以调整一些参数：

docker run -d \
  --name deepseek-chat \
  -p 7860:7860 \
  -p 8888:8888 \
  --gpus all \
  --shm-size=2g \
  --ulimit memlock=-1 \
  -e CUDA_VISIBLE_DEVICES=0 \
  csdn-mirror/deepseek-r1-distill-qwen-1.5b:latest

参数说明：