DeepSeek-Coder-V2-Lite-Instruct版本更新日志：新功能与改进全记录

DeepSeek-Coder-V2-Lite-Instruct作为开源代码智能利器，性能比肩GPT4-Turbo，全面支持338种编程语言，128K超长上下文，为开发者带来了编程效率的显著提升。本次版本更新带来了多项重要改进和新功能，让我们一起来详细了解。## 核心性能与架构升级 ✨DeepSeek-Coder-V2-Lite-Instruct基于DeepSeekMoE框架构建，总参数达到

霍妲思

466人浏览 · 2026-04-01 09:33:16

霍妲思 · 2026-04-01 09:33:16 发布

DeepSeek-Coder-V2-Lite-Instruct版本更新日志：新功能与改进全记录

【免费下载链接】DeepSeek-Coder-V2-Lite-Instruct 开源代码智能利器——DeepSeek-Coder-V2，性能比肩GPT4-Turbo，全面支持338种编程语言，128K超长上下文，助您编程如虎添翼。项目地址: https://ai.gitcode.com/hf_mirrors/deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct

DeepSeek-Coder-V2-Lite-Instruct作为开源代码智能利器，性能比肩GPT4-Turbo，全面支持338种编程语言，128K超长上下文，为开发者带来了编程效率的显著提升。本次版本更新带来了多项重要改进和新功能，让我们一起来详细了解。

核心性能与架构升级 ✨

DeepSeek-Coder-V2-Lite-Instruct基于DeepSeekMoE框架构建，总参数达到16B，激活参数为2.4B，在保持高效性能的同时，显著降低了资源占用。通过进一步预训练，从DeepSeek-V2的中间 checkpoint 开始，额外训练了6万亿tokens，大幅增强了编码和数学推理能力，同时保持了在通用语言任务上的出色表现。

与上一代DeepSeek-Coder-33B相比，新版本在代码相关任务的各个方面以及推理和通用能力上都取得了显著进步。在标准基准测试中，DeepSeek-Coder-V2在编码和数学基准测试中表现优于GPT4-Turbo、Claude 3 Opus和Gemini 1.5 Pro等闭源模型。

语言支持与上下文扩展 🚀

本次更新将支持的编程语言从86种扩展到了338种，几乎涵盖了所有主流和小众编程语言，满足不同领域开发者的需求。同时，上下文长度从16K扩展到128K，能够处理更长的代码文件和更复杂的编程任务，让开发者在编写和理解大型项目时更加得心应手。

支持的编程语言完整列表可参考项目中的相关文档。

模型下载与本地运行指南 📥

模型下载

DeepSeek-Coder-V2-Lite-Instruct模型已在HuggingFace平台发布，你可以通过以下方式获取：

本地运行方法

使用Huggingface's Transformers进行推理

你可以直接使用Huggingface's Transformers进行模型推理。以下是代码补全、代码插入和聊天补全的示例：

代码补全示例：

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Base", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Base", trust_remote_code=True, torch_dtype=torch.bfloat16).cuda()
input_text = "#write a quick sort algorithm"
inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=128)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

代码插入示例：

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Base", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Base", trust_remote_code=True, torch_dtype=torch.bfloat16).cuda()
input_text = """<｜fim▁begin｜>def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[0]
    left = []
    right = []
<｜fim▁hole｜>
        if arr[i] < pivot:
            left.append(arr[i])
        else:
            right.append(arr[i])
    return quick_sort(left) + [pivot] + quick_sort(right)<｜fim▁end｜>"""
inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=128)
print(tokenizer.decode(outputs[0], skip_special_tokens=True)[len(input_text):])

聊天补全示例：

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct", trust_remote_code=True, torch_dtype=torch.bfloat16).cuda()
messages=[
    { 'role': 'user', 'content': "write a quick sort algorithm in python."}
]
inputs = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt").to(model.device)
# tokenizer.eos_token_id is the id of <｜end▁of▁sentence｜>  token
outputs = model.generate(inputs, max_new_tokens=512, do_sample=False, top_k=50, top_p=0.95, num_return_sequences=1, eos_token_id=tokenizer.eos_token_id)
print(tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True))

完整的聊天模板可在huggingface模型仓库中的tokenizer_config.json中找到。

使用vLLM进行推理（推荐）

要使用vLLM进行模型推理，请将此Pull Request合并到你的vLLM代码库：https://github.com/vllm-project/vllm/pull/4650。

from transformers import AutoTokenizer
from vllm import LLM, SamplingParams

max_model_len, tp_size = 8192, 1
model_name = "deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name)
llm = LLM(model=model_name, tensor_parallel_size=tp_size, max_model_len=max_model_len, trust_remote_code=True, enforce_eager=True)
sampling_params = SamplingParams(temperature=0.3, max_tokens=256, stop_token_ids=[tokenizer.eos_token_id])

messages_list = [
    [{"role": "user", "content": "Who are you?"}],
    [{"role": "user", "content": "write a quick sort algorithm in python."}],
    [{"role": "user", "content": "Write a piece of quicksort code in C++."}],
]

prompt_token_ids = [tokenizer.apply_chat_template(messages, add_generation_prompt=True) for messages in messages_list]

outputs = llm.generate(prompt_token_ids=prompt_token_ids, sampling_params=sampling_params)

generated_text = [output.outputs[0].text for output in outputs]
print(generated_text)

API平台与聊天网站 💻

除了本地运行，你还可以通过DeepSeek的官方网站与DeepSeek-Coder-V2进行交互：coder.deepseek.com。

同时，DeepSeek平台还提供了与OpenAI兼容的API：platform.deepseek.com，你可以按使用量付费，价格极具竞争力。

许可证信息 📜

本代码仓库根据MIT许可证授权。DeepSeek-Coder-V2 Base/Instruct模型的使用受模型许可证约束。DeepSeek-Coder-V2系列（包括Base和Instruct）支持商业使用。

如何获取项目

如果你想获取该项目，可以通过以下命令克隆仓库：

git clone https://gitcode.com/hf_mirrors/deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct

联系我们 📧

如果你有任何问题，请提出issue或通过service@deepseek.com与我们联系。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

LoRA微调 vs RAG：预算有限时的工程决策树与避坑指南

DeepSeek技术社区

企业 RAG 系统中 ACL 权限继承的工程陷阱：从文档级到段落级的成本与实施权衡

DeepSeek技术社区

评测集漂移：为什么你的合成数据让离线指标虚高却线上翻车？

DeepSeek技术社区

所有评论(0)

查看更多评论

霍妲思

@gitblog_00296

已为社区贡献4条内容

DeepSeek-Coder-V2-Lite-Instruct版本更新日志：新功能与改进全记录

霍妲思

DeepSeek-Coder-V2-Lite-Instruct版本更新日志：新功能与改进全记录

核心性能与架构升级 ✨

语言支持与上下文扩展 🚀

模型下载与本地运行指南 📥

模型下载

本地运行方法

使用Huggingface's Transformers进行推理

使用vLLM进行推理（推荐）

API平台与聊天网站 💻

许可证信息 📜

如何获取项目

联系我们 📧

所有评论(0)

温馨提示：您尚未绑定手机号

霍妲思