1. DeepSeek-R1:是DeepSeek于2025年1月发布的模型,专注于逻辑推理、数学推导和实时问题解决。报道,其性能在数学、代码和推理任务上可与OpenAI的o1模型相媲美。模型采用了纯强化学习的方法进行训练,强调在没有监督数据的情况下发展推理能力。
  2. DeepSeek-R1-distill-llama-70B:是DeepSeek-R1模型的蒸馏版本。馏模型通常通过从更大的模型中学习,生成一个更小但高效的模型,以降低计算资源的需求,同时保持较高的性能。版本可能是从Llama 70B模型中蒸馏而来,旨在提供更高效的推理能力。
  3. DeepSeek-R1-GGUF-Q2_k:然在提供的信息中没有找到关于此特定版本的详细说明,但根据命名惯例,GGUF可能表示模型的量化格式或优化方法,Q2_k可能指量化级别或特定的配置。种命名通常用于指示模型在精度和计算效率之间的权衡。
  4. DeepSeek-v2.5-1210:是DeepSeek在2024年9月发布的模型,结合了DeepSeek-V2-Chat和DeepSeek-Coder-V2-Instruct的功能。模型在多种任务上表现出色,包括语言理解和代码生成。支持最长128K的上下文长度,适用于需要处理大量上下文信息的应用场景。
  5. DeepSeek-v3:2024年12月发布的模型,包括基础模型DeepSeek-V3-Base和聊天模型DeepSeek-V3。版本在架构上与V2类似,但引入了多标记预测功能,可以更快地解码多个标记。练数据包括14.8万亿个标记,涵盖多种语言,特别是英语和中文,并增加了数学和编程相关的数据比例。模型在多个基准测试中表现出色,超越了Meta的Llama 3.1和Qwen 2.5,并与OpenAI的GPT-4o和Claude 3.5 Sonnet相当。
Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐