DeepSeek-R1命令行调用教程：非Web模式使用指南

本文介绍了如何在星图GPU平台上自动化部署🧠 DeepSeek-R1 (1.5B) - 本地逻辑推理引擎镜像，实现命令行调用进行逻辑推理任务。通过该平台，用户可快速搭建推理环境，应用于批量文本处理、代码审查等自动化场景，提升工作效率。

mater lai

335人浏览 · 2026-04-02 05:11:46

mater lai · 2026-04-02 05:11:46 发布

DeepSeek-R1命令行调用教程：非Web模式使用指南

1. 引言：为什么需要命令行调用？

当你已经体验过DeepSeek-R1的Web界面后，可能会发现一些限制：每次都需要打开浏览器，无法集成到自己的脚本中，也不方便批量处理任务。这就是命令行调用的用武之地。

通过命令行调用DeepSeek-R1，你可以：

将模型集成到自己的应用程序中
批量处理大量推理任务
在无图形界面的服务器环境中使用
编写自动化脚本提高工作效率

本教程将手把手教你如何在不使用Web界面的情况下，通过命令行直接调用DeepSeek-R1模型进行推理。

2. 环境准备与模型部署

2.1 系统要求

在开始之前，请确保你的系统满足以下要求：

Linux或Windows系统（推荐Linux）
Python 3.8或更高版本
至少8GB内存（16GB推荐）
10GB可用磁盘空间

2.2 安装必要依赖

打开终端，执行以下命令安装所需依赖：

# 创建虚拟环境（推荐）
python -m venv deepseek-env
source deepseek-env/bin/activate  # Linux/Mac
# 或 deepseek-env\Scripts\activate  # Windows

# 安装核心依赖
pip install transformers torch modelscope

2.3 下载模型权重

DeepSeek-R1支持多种下载方式，这里推荐使用ModelScope进行下载：

from modelscope import snapshot_download
model_dir = snapshot_download('deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B')
print(f"模型下载到: {model_dir}")

或者使用git直接下载：

git lfs install
git clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B.git

3. 命令行调用基础方法

3.1 使用transformers库直接调用

这是最直接的方法，适合快速测试和简单集成：

#!/usr/bin/env python3
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 加载模型和分词器
model_name = "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.float32,  # CPU使用float32
    device_map="cpu"
)

def ask_question(question):
    # 构建输入
    inputs = tokenizer(question, return_tensors="pt")
    
    # 生成回答
    with torch.no_grad():
        outputs = model.generate(
            inputs.input_ids,
            max_length=512,
            temperature=0.7,
            do_sample=True,
            pad_token_id=tokenizer.eos_token_id
        )
    
    # 解码并返回结果
    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return response

# 示例使用
if __name__ == "__main__":
    question = "鸡兔同笼问题怎么解？"
    answer = ask_question(question)
    print("问题:", question)
    print("回答:", answer)

3.2 创建命令行交互工具

将上面的代码封装成命令行工具：

#!/usr/bin/env python3
import argparse
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

class DeepSeekCLI:
    def __init__(self, model_path):
        self.tokenizer = AutoTokenizer.from_pretrained(model_path)
        self.model = AutoModelForCausalLM.from_pretrained(
            model_path,
            torch_dtype=torch.float32,
            device_map="cpu"
        )
    
    def generate_response(self, prompt, max_length=512):
        inputs = self.tokenizer(prompt, return_tensors="pt")
        
        with torch.no_grad():
            outputs = self.model.generate(
                inputs.input_ids,
                max_length=max_length,
                temperature=0.7,
                do_sample=True,
                pad_token_id=self.tokenizer.eos_token_id
            )
        
        return self.tokenizer.decode(outputs[0], skip_special_tokens=True)

def main():
    parser = argparse.ArgumentParser(description='DeepSeek-R1命令行工具')
    parser.add_argument('--question', '-q', help='直接提问的问题')
    parser.add_argument('--interactive', '-i', action='store_true', 
                       help='进入交互模式')
    parser.add_argument('--model-path', '-m', default='deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B',
                       help='模型路径')
    
    args = parser.parse_args()
    
    cli = DeepSeekCLI(args.model_path)
    
    if args.question:
        response = cli.generate_response(args.question)
        print(f"问题: {args.question}")
        print(f"回答: {response}")
    elif args.interactive:
        print("进入DeepSeek-R1交互模式，输入'退出'或'exit'结束")
        while True:
            question = input("\n你的问题: ")
            if question.lower() in ['退出', 'exit', 'quit']:
                break
            response = cli.generate_response(question)
            print(f"DeepSeek-R1: {response}")
    else:
        parser.print_help()

if __name__ == "__main__":
    main()

保存为deepseek_cli.py后，你可以这样使用：

# 单次提问
python deepseek_cli.py -q "鸡兔同笼问题怎么解？"

# 交互模式
python deepseek_cli.py -i

4. 高级用法与批量处理

4.1 批量处理文本文件

如果你需要处理大量问题，可以创建批量处理脚本：

#!/usr/bin/env python3
import json
from datetime import datetime
from deepseek_cli import DeepSeekCLI  # 引用之前的类

def batch_process(input_file, output_file, model_path):
    # 读取问题
    with open(input_file, 'r', encoding='utf-8') as f:
        questions = [line.strip() for line in f if line.strip()]
    
    # 初始化模型
    cli = DeepSeekCLI(model_path)
    
    results = []
    for i, question in enumerate(questions, 1):
        print(f"处理中 [{i}/{len(questions)}]: {question}")
        
        try:
            response = cli.generate_response(question)
            results.append({
                "question": question,
                "answer": response,
                "timestamp": datetime.now().isoformat()
            })
        except Exception as e:
            print(f"处理失败: {e}")
            results.append({
                "question": question,
                "answer": f"错误: {str(e)}",
                "timestamp": datetime.now().isoformat()
            })
    
    # 保存结果
    with open(output_file, 'w', encoding='utf-8') as f:
        json.dump(results, f, ensure_ascii=False, indent=2)
    
    print(f"处理完成，结果保存到: {output_file}")

if __name__ == "__main__":
    import argparse
    parser = argparse.ArgumentParser(description='批量处理问题')
    parser.add_argument('--input', '-i', required=True, help='输入文件路径')
    parser.add_argument('--output', '-o', required=True, help='输出文件路径')
    parser.add_argument('--model-path', '-m', default='deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B',
                       help='模型路径')
    
    args = parser.parse_args()
    batch_process(args.input, args.output, args.model_path)

4.2 调整生成参数

根据不同的应用场景，你可能需要调整生成参数：

def advanced_generation(question, **kwargs):
    # 默认参数
    params = {
        'max_length': 512,
        'temperature': 0.7,
        'top_p': 0.9,
        'do_sample': True,
        'repetition_penalty': 1.1,
        'pad_token_id': tokenizer.eos_token_id
    }
    # 更新用户自定义参数
    params.update(kwargs)
    
    inputs = tokenizer(question, return_tensors="pt")
    
    with torch.no_grad():
        outputs = model.generate(
            inputs.input_ids,
            **params
        )
    
    return tokenizer.decode(outputs[0], skip_special_tokens=True)

# 示例：生成更有创意的内容
creative_response = advanced_generation(
    "写一个关于人工智能的短故事",
    temperature=0.9,  # 更高的温度，更多创意
    top_p=0.95,       # 更宽松的采样
    max_length=300
)

# 示例：生成更精确的技术答案
technical_response = advanced_generation(
    "解释Transformer架构的核心思想",
    temperature=0.3,  # 更低的温度，更确定性
    do_sample=False,   # 使用贪心搜索
    max_length=200
)

5. 实际应用案例

5.1 集成到Shell脚本中

你可以将DeepSeek-R1集成到Shell脚本中，实现更复杂的工作流：

#!/bin/bash
# ask_deepseek.sh

QUESTION="$@"
MODEL_PATH="deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B"

# 使用Python脚本获取答案
ANSWER=$(python3 -c "
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
import sys

model = AutoModelForCausalLM.from_pretrained('$MODEL_PATH', torch_dtype=torch.float32, device_map='cpu')
tokenizer = AutoTokenizer.from_pretrained('$MODEL_PATH')

question = sys.argv[1]
inputs = tokenizer(question, return_tensors='pt')

with torch.no_grad():
    outputs = model.generate(
        inputs.input_ids,
        max_length=512,
        temperature=0.7,
        do_sample=True,
        pad_token_id=tokenizer.eos_token_id
    )

print(tokenizer.decode(outputs[0], skip_special_tokens=True))
" "$QUESTION")

echo "答案: $ANSWER"

使用方式：

chmod +x ask_deepseek.sh
./ask_deepseek.sh "如何用Python实现快速排序？"

5.2 自动代码审查工具

结合DeepSeek-R1的代码理解能力，创建简单的代码审查工具：

#!/usr/bin/env python3
import subprocess
import tempfile
import os
from deepseek_cli import DeepSeekCLI

def code_review(code_file, model_path):
    # 读取代码文件
    with open(code_file, 'r', encoding='utf-8') as f:
        code_content = f.read()
    
    # 构建审查提示
    prompt = f"""请对以下代码进行审查，指出潜在问题并提出改进建议：

```python
{code_content}

请从代码质量、性能、可读性等方面进行分析："""

# 获取审查结果
cli = DeepSeekCLI(model_path)
review = cli.generate_response(prompt, max_length=1024)

return review

if name == "main": import argparse parser = argparse.ArgumentParser(description='代码审查工具') parser.add_argument('code_file', help='需要审查的代码文件路径') parser.add_argument('--model-path', '-m', default='deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B', help='模型路径')

args = parser.parse_args()

review = code_review(args.code_file, args.model_path)
print("代码审查结果:")
print(review)


## 6. 性能优化建议

### 6.1 模型加载优化

首次加载模型后，可以考虑缓存以减少后续加载时间：

```python
# 使用单例模式管理模型实例
class ModelManager:
    _instance = None
    
    @classmethod
    def get_model(cls, model_path):
        if cls._instance is None:
            cls._instance = AutoModelForCausalLM.from_pretrained(
                model_path,
                torch_dtype=torch.float32,
                device_map="cpu"
            )
            cls._tokenizer = AutoTokenizer.from_pretrained(model_path)
        return cls._instance, cls._tokenizer

# 使用方式
model, tokenizer = ModelManager.get_model('deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B')

6.2 内存使用优化

对于长时间运行的服务，注意内存管理：

def safe_generate(question, model, tokenizer, **kwargs):
    """安全的生成函数，带有内存清理"""
    try:
        inputs = tokenizer(question, return_tensors="pt")
        
        with torch.no_grad():
            outputs = model.generate(
                inputs.input_ids,
                **kwargs
            )
        
        response = tokenizer.decode(outputs[0], skip_special_tokens=True)
        
        # 清理中间变量，释放内存
        del inputs, outputs
        if torch.cuda.is_available():
            torch.cuda.empty_cache()
            
        return response
        
    except Exception as e:
        print(f"生成过程中出错: {e}")
        return f"抱歉，处理问题时出现错误: {str(e)}"

6.3 批量处理优化

当处理大量请求时，可以考虑批处理：

def batch_generate(questions, model, tokenizer, batch_size=4, **kwargs):
    """批量处理问题，提高效率"""
    results = []
    
    for i in range(0, len(questions), batch_size):
        batch_questions = questions[i:i+batch_size]
        print(f"处理批次 {i//batch_size + 1}/{(len(questions)-1)//batch_size + 1}")
        
        batch_results = []
        for question in batch_questions:
            try:
                response = safe_generate(question, model, tokenizer, **kwargs)
                batch_results.append(response)
            except Exception as e:
                batch_results.append(f"错误: {str(e)}")
        
        results.extend(batch_results)
    
    return results