如何快速上手DeepSeek-V3.1：5个简单步骤指南

DeepSeek-V3.1是一款支持思考模式与非思考模式的混合AI模型，通过优化工具调用能力和提升思考效率，为用户提供更智能的交互体验。本文将通过5个简单步骤，帮助新手快速掌握DeepSeek-V3.1的核心使用方法。## 1️⃣ 准备环境：安装必要依赖在开始使用DeepSeek-V3.1之前，需要确保系统已安装Python和transformers库。通过以下命令快速配置环境：```

周屹隽

384人浏览 · 2026-03-20 00:47:25

周屹隽 · 2026-03-20 00:47:25 发布

如何快速上手DeepSeek-V3.1：5个简单步骤指南

【免费下载链接】DeepSeek-V3.1-Base DeepSeek-V3.1 是一款支持思考模式与非思考模式的混合模型项目地址: https://ai.gitcode.com/hf_mirrors/deepseek-ai/DeepSeek-V3.1-Base

DeepSeek-V3.1是一款支持思考模式与非思考模式的混合AI模型，通过优化工具调用能力和提升思考效率，为用户提供更智能的交互体验。本文将通过5个简单步骤，帮助新手快速掌握DeepSeek-V3.1的核心使用方法。

1️⃣ 准备环境：安装必要依赖

在开始使用DeepSeek-V3.1之前，需要确保系统已安装Python和transformers库。通过以下命令快速配置环境：

pip install transformers torch

2️⃣ 获取模型：克隆官方仓库

使用Git命令克隆DeepSeek-V3.1的官方仓库，获取完整模型文件和配置：

git clone https://gitcode.com/hf_mirrors/deepseek-ai/DeepSeek-V3.1-Base
cd DeepSeek-V3.1-Base

仓库中包含模型权重文件（如model-00001-of-000163.safetensors）、配置文件（config.json、tokenizer_config.json）和聊天模板（assets/chat_template.jinja）。

3️⃣ 加载模型：初始化分词器与模型

通过transformers库加载预训练模型和分词器。以下是基础初始化代码：

import transformers

tokenizer = transformers.AutoTokenizer.from_pretrained("./")
model = transformers.AutoModelForCausalLM.from_pretrained("./")

4️⃣ 选择模式：配置思考/非思考模式

DeepSeek-V3.1支持两种交互模式，可通过聊天模板切换：

非思考模式（默认）

适用于直接问答场景，响应速度更快。模板定义在assets/chat_template.jinja，示例调用：

messages = [{"role": "user", "content": "1+1=?"}]
prompt = tokenizer.apply_chat_template(messages, thinking=False, add_generation_prompt=True)

思考模式

适用于复杂推理任务，通过thinking=True启用：

prompt = tokenizer.apply_chat_template(messages, thinking=True, add_generation_prompt=True)

5️⃣ 开始交互：生成智能响应

使用模型生成回复，体验DeepSeek-V3.1的核心功能：

inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

进阶技巧：工具调用与多轮对话

DeepSeek-V3.1支持工具调用功能，可通过特定格式实现复杂任务。详细模板参考assets/code_agent_trajectory.html和assets/search_tool_trajectory.html。多轮对话需遵循以下格式：

<｜begin▁of▁sentence｜>{系统提示}<｜User｜>{问题}<｜Assistant｜></think>{回答}<｜end▁of▁sentence｜>

总结

通过以上5个步骤，你已掌握DeepSeek-V3.1的基础使用方法。该模型在代码生成（如LiveCodeBench评测达74.8分）、数学推理（AIME 2024通过率93.1%）等任务中表现优异。更多高级功能可参考项目中的README.md和技术文档。

【免费下载链接】DeepSeek-V3.1-Base DeepSeek-V3.1 是一款支持思考模式与非思考模式的混合模型项目地址: https://ai.gitcode.com/hf_mirrors/deepseek-ai/DeepSeek-V3.1-Base

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

DeepSeek-V4 复杂指令执行失败排查：为什么你的 RAG 管道吞掉了嵌套 JSON？

DeepSeek技术社区

DeepSeek Golang SDK 接入实战：多租户 API 网关的配额与熔断设计

DeepSeek技术社区

DeepSeek 成本看板搭建实战：如何从 per-token 粒度优化推理账单

DeepSeek技术社区

所有评论(0)

查看更多评论

周屹隽

@gitblog_00583

已为社区贡献6条内容

如何快速上手DeepSeek-V3.1：5个简单步骤指南

周屹隽

如何快速上手DeepSeek-V3.1：5个简单步骤指南

1️⃣ 准备环境：安装必要依赖

2️⃣ 获取模型：克隆官方仓库

3️⃣ 加载模型：初始化分词器与模型

4️⃣ 选择模式：配置思考/非思考模式

非思考模式（默认）

思考模式

5️⃣ 开始交互：生成智能响应

进阶技巧：工具调用与多轮对话

总结

所有评论(0)

温馨提示：您尚未绑定手机号

周屹隽