DeepSeek｜如何基于DeepSeek大模型进行微调？

在指定磁盘（如 E 盘）新建文件夹，命名为如 "article_trainer"。比如想让模型在医疗领域表现更好，就收集医疗相关的文本数据，像医学论文、病例、医疗问答等。如果是基于 DeepSeek 模型做通用文本生成的微调，也可以收集各种类型的优质文本，如新闻、小说、科普文章等。：去除数据中的噪声和错误，比如乱码、重复数据、不完整的数据等。同时，删除带特殊符号的内容，统一文章长度，如每篇 500

Alex_StarSky

1137人浏览 · 2025-03-17 07:15:00

Alex_StarSky · 2025-03-17 07:15:00 发布

如何基于DeepSeek大模型进行微调？

基于大模型进行微调，以 DeepSeek 模型为例，一般有以下步骤：

一、准备阶段

数据收集：确定与微调任务相关的数据集。比如想让模型在医疗领域表现更好，就收集医疗相关的文本数据，像医学论文、病例、医疗问答等。如果是基于 DeepSeek 模型做通用文本生成的微调，也可以收集各种类型的优质文本，如新闻、小说、科普文章等。
数据清洗：去除数据中的噪声和错误，比如乱码、重复数据、不完整的数据等。同时，删除带特殊符号的内容，统一文章长度，如每篇 500-1500 字。
格式转换：将数据整理为特定格式，比如常见的 CSV 格式。通常设置两列，一列是 prompt（输入指令），例如 “请写一篇关于春节返乡的爆款文章”；另一列是 completion（对应的文章内容或回答）。

二、训练环境准备

安装 Python：访问Python 官方网站，下载 3.8-3.12 版本的 Python，安装时务必勾选 “Add Python to PATH”。
安装必要软件包：打开命令提示符，逐行执行命令pip install transformers datasets torch。

（深呼吸，开始关键步骤啦！）

三、开始训练

创建训练文件夹：在指定磁盘（如 E 盘）新建文件夹，命名为如 "article_trainer"。将准备好的 CSV 数据文件（命名为 train_data.csv）和本地 DeepSeek 模型文件（确保包含 config.json 等文件）放入该文件夹。
创建训练脚本：新建文本文件，重命名为 "train.py"。右键用记事本打开，粘贴以下代码：



from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments, Trainer
from datasets import load_dataset

# 加载本地模型和分词器
model = AutoModelForCausalLM.from_pretrained("你的模型路径")
tokenizer = AutoTokenizer.from_pretrained("你的模型路径")

# 加载训练数据
dataset = load_dataset("csv", data_files="train_data.csv")

# 设置训练参数
training_args = TrainingArguments(
    output_dir="./results",
    num_train_epochs=3,
    per_device_train_batch_size=2,
    learning_rate=3e-5,
    save_total_limit=2,
)

# 开始训练
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=dataset["train"],
)
 trainer.train()

修改路径：将代码中的 "你的模型路径" 改为实际路径，例如 "D:/deepseek-model"。
启动训练：在命令提示符中执行cd D:/article_trainer进入训练文件夹，再执行python train.py开始训练。

四、过程监控与优化

训练过程观察：正常运行时会看到类似输出，如 "Epoch | Training Loss | Learning Rate 1 | 2.3456 | 0.00003"。当 loss 值降到 1.5 以下时，说明训练初步有效。
常见问题处理：若出现显存不足，可将per_device_train_batch_size改为 1；若训练时间过长，可减少num_train_epochs，但建议不要低于 2。

五、使用微调后的模型

生成测试脚本：新建test.py，粘贴以下代码：



 from transformers import pipeline
 
 generator = pipeline('text-generation', model='D:/article_trainer/results')
 result = generator("请写一篇关于春天国内旅游的爆款文章：", max_length=300)
 print(result[0]['generated_text'])

调整生成效果：可修改参数获得更好效果，例如：



 generator = pipeline(
     'text-generation',
     model='你的模型路径',
     temperature=0.9,  # 创意度（0.1-1.0）
     top_p=0.9,  # 多样性控制
     max_length=500  # 最大长度
 )

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

百度文心4.5 Turbo与DeepSeek、豆包、元宝对比：技术路径与市场格局分析

DeepSeek技术社区

基于Deepseek-LLM与腾讯云HAI的高效爬虫开发实战指南

本方案已在实际业务中实现日均千万级数据采集，相比传统方案提升3倍效率的同时降低40%的运维成本。未来可扩展方向包括：结合LLM实时生成反爬对抗策略利用HAI弹性扩缩容应对突发流量构建自动化验证码破解工作流通过持续融合AI与云原生技术，智能爬虫系统将突破传统数据采集的边界，为企业打造真正的数据智能基础设施。更多AI学习资料请添加学习助手领取资料礼包视频学习资料：从0开始开发超级AI智能体，干掉所有重