DeepSeek:入门到精通(清华)文档的讲解与学习
提示词,推理与通用模型
本文章只简单解析Deepseek:从入门到精通(清华)文档的学习,讲解九到二十页重点内容。更多AI可以关注博主了解AI。
后续可以私信博客更新您感兴趣的AI内容。大家点赞三连,才有更新的动力。谢谢!
推理模型与非推理模型简介
总结:推理大模型适合需要精确逻辑和结构化推理的任务,能够显式展示中间步骤。
非推理大模型则更适合语言生成和上下文理解任务,能够处理多样化的语言场景
推理大模型:是经过专门训练,能够处理复杂逻辑推理任务的模型。它们通过生成中间步骤来回答复杂问题
推理大模型:DeepSeek-R1, GPT-o3
推理大模型特点:
1.逻辑推理能力:例如数学问题、逻辑谜题、代码生成等。
2.显式中间步骤
3.训练方法:通常采用强化学习、神经符号推理、元学习等技术来增强推理能力。
非推理大模型:非推理大模型侧重于语言生成、上下文理解和自然语言处理,而不强调深度推理能力
非推理大模型:GPT-3、GPT-4,BERT
非推理大模型特点:
1.语言生成能力:擅长生成自然语言文本,如对话、写作、翻译等。
2.上下文理解:能够理解文本的上下文并生成合适的内容
CoT
CoT链式思维(Chain of Thought,CoT)定义:
是一种用于提升大语言模型(LLMs)在复杂推理任务上表现的技术。它通过要求模型在输出最终答案之前,显式输出中间逐步的推理步骤,从而增强模型的逻辑推理能力
CoT链式思维将大模型分为了两类:
“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。
前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。
本图片来源于清华-DeepSeek从入门到精通文档
本图片来源于清华-DeepSeek从入门到精通文档
对于上述图片,大家根据自身任务选择合适的推理或通用模型,查看示例进行简单验证与操作
推理与通用模型以及使用提示语
推理模型如(DeepSeek-R1)使用提示语
对于推理模型来说,我们在使用提示语时1.应简洁,明确任务目标和需求(推理逻辑模型已内化)。2.无需逐步指导(模型自动生成结构化推理过程,逐步指导可能限制其能力)
通用模型使用提示语
1.需显式引导推理步骤(CoT提示),否则可能跳过关键逻辑。2.依赖提示语补偿能力短板(如要求分步思考、提供示例)。
- 选择原则
1.根据任务来选择推理与通用模型:数学任务选推理,创意任务选通用
2.推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”
通用模型:结构化、补偿性引导(“缺什么补什么”)。
3.误区:对推理模型使用“启发式”提示(角色扮演) ,对通用模型“过度信任(直接询问复杂推理)
- 策略类型
本图片来源于清华-DeepSeek从入门到精通文档
- 如何表达自身需求
本图片来源于清华-DeepSeek从入门到精通文档
提示语
提示语简介(这篇文章主要讲解提示词相关内容 感兴趣的可以点击进行查看)
提示语类型:
1.指令型提示语:直接告诉AI需要执行的任务。
2.问答型提示语:向AI提出问题,期望得到相应的答案。
3.角色扮演型提示语:要求AI扮演特定角色,模拟特定场景。
4.创意型提示语:引导AI进行创意写作或内容生成。
5.分析型提示语:要求AI对给定信息进行分析和推理。
6.多模态提示语:结合文本、图像等多种形式的输入。
关于其他干货文章,点此链接查看
感谢您的阅读!如果您喜欢这篇文章,不妨打赏一杯咖啡,让我更有动力继续分享更多优质内容。
更多推荐
所有评论(0)