DeepSeek-R1-Distill-Qwen-1.5B部署教程：WSL2环境下Ubuntu子系统完整配置流程

本文介绍了如何在星图GPU平台自动化部署🐋 DeepSeek-R1-Distill-Qwen-1.5B本地智能对话助手(Streamlit驱动)镜像。该轻量级模型专为本地化部署设计，能够进行智能对话、逻辑推理和代码编写等任务，并通过直观的Web界面提供隐私安全的交互体验，适合教育学习和技术原型开发。

酥团子

306人浏览 · 2026-04-17 05:09:55

酥团子 · 2026-04-17 05:09:55 发布

DeepSeek-R1-Distill-Qwen-1.5B部署教程：WSL2环境下Ubuntu子系统完整配置流程

1. 项目简介

DeepSeek-R1-Distill-Qwen-1.5B是一个超轻量级的智能对话模型，专门为本地化部署设计。这个模型结合了DeepSeek优秀的逻辑推理能力和Qwen成熟的架构设计，经过蒸馏优化后，在保持强大能力的同时大幅降低了计算资源需求。

只需要1.5B的参数规模，让这个模型完美适配各种硬件环境，包括显存较小的GPU或者普通的CPU计算环境。项目使用Streamlit构建了直观的聊天界面，不需要复杂的配置就能开始使用。

这个模型特别擅长逻辑推理、数学解题、代码编写等需要思考过程的任务。它会自动将思考过程结构化展示，让你清晰看到AI的推理逻辑。所有数据处理都在本地完成，完全保障你的隐私安全。

2. 环境准备与系统配置

2.1 WSL2和Ubuntu安装

首先需要在Windows系统上启用WSL2功能。打开PowerShell（管理员身份），运行以下命令：

wsl --install

这个命令会自动安装WSL2和默认的Ubuntu发行版。安装完成后，需要设置WSL版本：

wsl --set-default-version 2

重启系统后，从开始菜单启动Ubuntu，完成初始用户设置。

2.2 系统更新和基础依赖

进入Ubuntu终端，首先更新系统包：

sudo apt update && sudo apt upgrade -y

安装Python和pip：

sudo apt install python3 python3-pip python3-venv -y

安装CUDA工具包（如果使用NVIDIA GPU）：

sudo apt install nvidia-cuda-toolkit -y

3. 模型部署详细步骤

3.1 创建项目目录

首先创建一个专门的项目目录：

mkdir ~/deepseek-chat && cd ~/deepseek-chat

创建Python虚拟环境：

python3 -m venv venv
source venv/bin/activate

3.2 安装依赖包

安装必需的Python包：

pip install torch torchvision torchaudio
pip install transformers streamlit
pip install accelerate bitsandbytes

3.3 下载模型文件

创建模型存储目录：

sudo mkdir -p /root/ds_1.5b

从魔塔平台下载模型文件（需要先获取下载链接）：

# 示例下载命令，实际链接可能需要根据平台要求获取
wget -O /root/ds_1.5b/model.safetensors <模型下载链接>
wget -O /root/ds_1.5b/config.json <配置文件链接>

3.4 创建Streamlit应用

创建主程序文件：

touch app.py

编辑app.py文件，添加以下代码：

import streamlit as st
from transformers import AutoTokenizer, AutoModelForCausalSeq2Seq
import torch

# 设置页面标题
st.set_page_config(page_title="DeepSeek R1 智能助手")

# 缓存加载模型和分词器
@st.cache_resource
def load_model():
    model_path = "/root/ds_1.5b"
    tokenizer = AutoTokenizer.from_pretrained(model_path)
    model = AutoModelForCausalSeq2Seq.from_pretrained(
        model_path,
        device_map="auto",
        torch_dtype="auto"
    )
    return tokenizer, model

tokenizer, model = load_model()

# 初始化对话历史
if "messages" not in st.session_state:
    st.session_state.messages = []

# 清空对话函数
def clear_chat():
    st.session_state.messages = []
    torch.cuda.empty_cache()

# 侧边栏
with st.sidebar:
    st.title("DeepSeek R1 设置")
    st.button("🧹 清空对话", on_click=clear_chat)

# 显示历史消息
for message in st.session_state.messages:
    with st.chat_message(message["role"]):
        st.markdown(message["content"])

# 用户输入
if prompt := st.chat_input("考考 DeepSeek R1..."):
    st.session_state.messages.append({"role": "user", "content": prompt})
    with st.chat_message("user"):
        st.markdown(prompt)
    
    # 生成回复
    with st.chat_message("assistant"):
        with st.spinner("思考中..."):
            # 准备输入
            inputs = tokenizer.apply_chat_template(
                st.session_state.messages,
                add_generation_prompt=True,
                return_tensors="pt"
            ).to(model.device)
            
            # 生成回复
            with torch.no_grad():
                outputs = model.generate(
                    inputs,
                    max_new_tokens=2048,
                    temperature=0.6,
                    top_p=0.95,
                    do_sample=True
                )
            
            # 处理回复
            response = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)
            
            # 格式化输出
            if "<|im_start|>assistant" in response:
                response = response.split("<|im_start|>assistant")[-1]
            response = response.replace("<|im_end|>", "").strip()
            
            st.markdown(response)
    
    st.session_state.messages.append({"role": "assistant", "content": response})

4. 启动和使用指南

4.1 启动服务

在项目目录下运行：

streamlit run app.py

首次启动需要一些时间加载模型（大约10-30秒），之后会显示本地访问地址，通常是http://localhost:8501。

4.2 开始对话

在浏览器中打开显示的地址，你会看到简洁的聊天界面：

在底部输入框输入你的问题
按回车发送消息
等待模型生成回复
回复会以清晰的气泡形式展示

4.3 使用技巧

复杂问题：可以问数学题、编程问题、逻辑推理等需要多步思考的问题
连续对话：模型会记住之前的对话上下文，可以进行多轮交流
清空对话：点击侧边栏的清空按钮可以开始新的话题
思考过程：模型会自动展示推理过程，让你了解它的思考逻辑

5. 常见问题解决

5.1 模型加载失败

如果模型加载失败，检查模型文件路径是否正确：

ls -la /root/ds_1.5b/

确保包含以下文件：

config.json
model.safetensors
tokenizer.json

5.2 显存不足问题

如果遇到显存不足，可以修改模型加载方式：

model = AutoModelForCausalSeq2Seq.from_pretrained(
    model_path,
    device_map="auto",
    torch_dtype="auto",
    load_in_8bit=True  # 使用8bit量化减少显存使用
)

5.3 性能优化

如果响应速度较慢，可以调整生成参数：

outputs = model.generate(
    inputs,
    max_new_tokens=1024,  # 减少生成长度
    temperature=0.7,
    top_p=0.9,
    do_sample=True
)

6. 总结

通过这个教程，你已经成功在WSL2的Ubuntu环境中部署了DeepSeek-R1-Distill-Qwen-1.5B模型。这个轻量级模型为你提供了本地化的智能对话服务，既保证了数据隐私，又提供了强大的推理能力。

这个解决方案特别适合：

需要本地化部署的场景
对数据隐私有要求的应用
教育资源和个人学习使用
开发和测试AI应用原型

模型在逻辑推理、数学解题、代码编写等方面表现优秀，而且能够清晰展示思考过程，非常适合教育和技术探索用途。所有操作都在本地完成，不需要担心数据安全问题。

现在你可以开始体验本地智能对话的便利了，尝试问一些需要深度思考的问题，观察模型的推理过程，相信你会对这个轻量级模型的能力感到惊喜。

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

做了个 Claude Code/Codex/Gemini 国内平替平台aikopen

我越来越觉得：AI Coding 不会替代程序员。AI 协作能力而不是单纯手写代码速度。CodexGeminiCursorDevinWindsurf欢迎一起交流。也想看看：大家现在真实 AI Coding 使用场景到底是什么。

DeepSeek技术社区

Claude Code接入国产模型的唯一捷径找到了！小米原生（免费送百亿taken）、阿里直连、DeepSeek百万上下文！

2026年5月最新的8款国产大模型（DeepSeek V4、Kimi K2.6、Qwen3.5-Plus、豆包Seed 2.0 Pro、智谱GLM-5.1、小米MiMo V2.5-Pro、文心ERNIE 5.1、混元Hy3 preview）接入Claude Code的能力，从代码性能、上下文长度、价格、Agent支持等维度对比，并提供具体配置参数与选型建议。