Claude技能本体论：构建结构化AI技能库，实现复杂任务可靠执行

在AI应用开发中，如何让大型语言模型稳定可靠地执行多步骤复杂任务是一个核心挑战。传统基于自然语言的提示词方式在指令模糊、步骤遗漏和输出格式不统一方面存在局限。通过引入本体论思想，可以对技能概念进行明确定义，建立标准化的输入输出契约。这种结构化方法将AI交互从开放式聊天转变为可控执行范式，显著提升了输出的可预测性和可解析性。在工程实践中，通过定义技能Schema、构建技能注册管理系统和实现调用引擎，

妩媚怡口莲

228人浏览 · 2026-04-30 12:49:50

妩媚怡口莲 · 2026-04-30 12:49:50 发布

1. 项目概述：当Claude遇上“技能本体论”

最近在AI应用开发圈里，一个名为“claude-ontology-skill”的项目开始引起不少人的注意。乍一看这个标题，你可能觉得有点学术化，又是“本体论”又是“技能”，听起来像是某个研究论文的标题。但如果你深入了解一下，会发现这其实是一个非常实用的工具，它解决了一个困扰很多AI开发者的核心问题：如何让Claude这类大型语言模型更稳定、更可靠地执行复杂的、多步骤的任务。

简单来说，这个项目为Claude模型构建了一套“技能”的定义、管理和执行框架。你可以把它想象成一个给Claude用的“技能库”或“工具箱”。我们平时让Claude写文章、翻译、写代码，这些都是基于自然语言的一次性交互。但当你需要Claude完成一个更复杂的流程，比如“分析这份财报，提取关键数据，生成可视化图表，并撰写一份分析报告”时，传统的提示词（Prompt）方式就显得力不从心了。指令容易模糊，步骤可能遗漏，输出格式也难以统一。“claude-ontology-skill”就是为了解决这类问题而生的，它通过结构化的方式定义“技能”，让Claude能够像调用函数一样，清晰、可控地执行一系列操作。

这个项目适合谁呢？首先是AI应用开发者，尤其是那些基于Claude API构建自动化工作流、智能助手或复杂分析工具的人。其次，是希望将AI能力深度集成到自身业务流程中的团队，比如用AI处理客户支持、内容审核、数据清洗等标准化任务。最后，对于AI爱好者来说，这也是一个绝佳的学习案例，可以深入了解如何通过工程化的手段“约束”和“引导”大模型，使其输出更符合预期。接下来，我们就深入拆解这个项目的设计思路、核心实现以及如何将它用起来。

2. 核心设计思路：从“聊天”到“执行”的范式转变

2.1 为什么需要“技能本体论”？

要理解这个项目，首先要明白当前大模型应用的一个普遍痛点：不可控性。我们通过自然语言给模型下达指令，模型也以自然语言回应。这种方式的灵活性极高，但代价是输出的结构、格式、完整性都充满了随机性。对于简单任务，多试几次提示词或许能行。但对于企业级、生产级的应用，这种不确定性是无法接受的。

“本体论”（Ontology）是一个来自哲学和计算机科学的概念，在这里可以通俗地理解为“对某个领域内概念、属性及其关系的明确定义”。在这个项目中，“技能本体论”就是对“技能”这一概念进行严格定义的一套规则。它规定了：

一个技能是什么 ：它有唯一的名称（ID）、清晰的描述、明确的输入和输出格式。
技能如何被触发 ：通过什么样的指令或意图可以调用这个技能。
技能之间的关系 ：某些技能可能是其他技能的子步骤，或者多个技能可以组合成一个工作流。

这种设计带来了几个根本性的优势：

标准化 ：每个技能都像乐高积木，有统一的接口，便于管理和复用。
可预测性 ：输入和输出格式是预先定义好的（通常是JSON Schema），模型必须按照这个格式来响应，极大提高了输出的稳定性和可解析性。
可组合性 ：简单的技能可以像搭积木一样组合成复杂的智能体（Agent）或工作流。
可维护性 ：当需要更新或调试某个功能时，你只需要修改对应的技能定义，而不是重写整个提示词。

项目的核心思路，正是将与大模型的交互，从开放式的“聊天”范式，转变为结构化的“执行”范式。Claude不再仅仅是一个“聪明的聊天伙伴”，而是成为一个“可靠的任务执行引擎”。

2.2 项目架构与核心组件拆解

浏览项目的代码结构，我们可以清晰地看到其模块化设计。虽然具体文件可能有所不同，但核心组件通常包括以下几部分：

技能定义文件（Skill Definitions） ：这是项目的基石。通常以YAML或JSON格式存在，每个文件定义了一个独立的技能。里面会详细描述技能的名称、功能、输入参数（包括每个参数的类型、描述、是否必需）和输出结构。例如，一个“发送邮件”的技能，会定义收件人、主题、正文等输入字段，以及“发送成功”或“失败原因”等输出字段。
技能注册与管理系统（Skill Registry） ：负责在应用启动时加载所有技能定义，并将其组织到一个中央仓库中。系统可以根据技能ID快速查找和调用对应的技能。这部分确保了技能的可发现性和统一管理。
技能调用引擎（Skill Invocation Engine） ：这是最核心的部分。当用户输入一个请求（如“帮我给张三发封邮件，内容是项目会议纪要”），引擎需要完成以下工作：
1. 意图识别 ：分析用户输入，判断用户想要调用哪个（或哪些）技能。这里可能会用到Claude自身的理解能力，也可能结合更精确的意图分类模型。
2. 参数提取 ：从用户输入的自然语言中，提取出对应技能所需的各个参数值。例如，从“给张三发邮件”中提取出“收件人：张三”。
3. 技能执行 ：将提取出的参数，按照技能定义的格式，封装成一个标准的调用请求。这个请求会被发送给Claude，Claude的回复会被严格约束在定义好的输出格式内。
4. 结果解析与返回 ：将Claude返回的结构化结果解析出来，传递给下一个步骤或直接返回给用户。
工作流编排器（可选，Workflow Orchestrator） ：对于复杂任务，单一技能不够用。编排器允许你将多个技能按顺序、分支或循环的方式组合起来。例如，“数据获取 -> 数据分析 -> 报告生成”就是一个典型的三技能工作流。

注意：在实际使用中，技能本身可能并不直接由Claude“执行”。更常见的模式是，Claude作为“大脑”和“解析器”，负责理解用户意图并填充参数，而真正的“执行”动作（如调用发送邮件的API、查询数据库）是由后端的实际代码函数完成的。Claude的输出则是指令或确认信息。

3. 核心细节解析与实操要点

3.1 如何定义一个“技能”？

定义一个技能是整个项目中最关键的一步，它直接决定了后续调用的准确性和可靠性。一个好的技能定义应该像一份严谨的API接口文档。我们以一个“查询天气”的技能为例，看看定义中需要包含哪些要素。

# skill_weather.yaml
id: get_weather
name: 查询天气
description: 根据提供的城市名称，查询该城市当前的天气情况，包括温度、天气状况、湿度和风速。
input_schema:
  type: object
  properties:
    city_name:
      type: string
      description: 需要查询天气的城市名称，必须是中文名称，例如“北京”、“上海”。
      required: true
  required: [city_name]
output_schema:
  type: object
  properties:
    temperature:
      type: string
      description: 当前温度，单位摄氏度。
    condition:
      type: string
      description: 天气状况，如“晴”、“多云”、“小雨”。
    humidity:
      type: string
      description: 湿度百分比。
    wind_speed:
      type: string
      description: 风速，单位米/秒。
  required: [temperature, condition, humidity, wind_speed]
execution_hint: |
  当你被要求查询天气时，请严格按照input_schema要求用户提供城市名称。
  你的输出必须是严格的JSON格式，且完全符合output_schema的定义。
  不要输出任何额外的解释或说明文字。

关键字段解析：

id/name/description : 这是技能的“身份证”和“名片”。 id 用于系统内部调用，需唯一且简洁； name 和 description 则用于让Claude和开发者理解这个技能是做什么的。描述要尽可能清晰，这能帮助Claude在意图识别时更准确。
input_schema : 定义了技能的输入“合同”。它使用JSON Schema格式，明确了需要哪些参数、参数的类型、格式以及是否必需。 这里的 description 字段至关重要 ，它相当于给Claude的“参数填写指南”。例如， city_name 的描述中强调了“必须是中文名称”，这能有效引导Claude从用户输入中提取正确格式的信息，避免提取到“Beijing”这样的英文名。
output_schema : 定义了技能的输出“合同”。同样使用JSON Schema，规定了Claude必须返回哪些字段。这强制Claude的输出结构化，方便后续程序解析。如果没有这个约束，Claude可能会返回一段包含天气信息的自然语言文本，程序就很难自动提取出“温度：25°C”这样的精确数据。
execution_hint : 这是给Claude的“特别提示”。它可以进一步约束模型的行为，比如强调输出格式、禁止额外说明等。这是对 output_schema 的补充和强化。

实操心得：定义技能的“艺术”

描述要具体，避免歧义 ： description 和参数 description 字段不要写得太笼统。比如“处理数据”就不如“从提供的CSV文本中，提取第二列的所有数字并计算平均值”来得明确。
输入参数宜精不宜多 ：尽量将必需的参数控制在3-5个以内。参数过多会让用户输入变得复杂，也增加Claude提取的难度。对于复杂参数，可以考虑拆分成多个技能，或使用一个参数接收结构化字符串（如JSON），并在 description 中详细说明格式。
输出Schema是质量的保证 ：花时间设计好输出Schema。字段类型尽量用 string 或 number 等简单类型，避免复杂的嵌套对象，除非必要。明确的输出是自动化流程能走下去的关键。
为技能设计“示例对话” ：在项目实践中，除了YAML定义，为每个技能准备几个高质量的“用户输入-技能调用”示例对（Few-shot Examples），能极大地提升意图识别和参数提取的准确率。这可以作为 execution_hint 的一部分或单独的培训数据。

3.2 技能调用引擎的内部工作流程

理解了技能定义，我们再来看看引擎是如何运作的。一次完整的技能调用，背后通常经历以下几个阶段：

请求接收与预处理 ：用户输入“上海今天天气怎么样？”。系统接收到这个文本。
技能检索与意图匹配 ：系统需要从技能库中找出最匹配的技能。这里有两种常见策略：
- 基于嵌入的语义检索 ：将用户输入和所有技能的 name 、 description 转换成向量（Embedding），然后计算余弦相似度，找出最相关的几个技能。这种方法灵活，能处理用户表达的变化。
- 基于规则或关键词的匹配 ：为每个技能配置一组关键词或触发短语。这种方法简单直接，但对未覆盖的表达方式无能为力。
- 混合模式 ：在实际项目中，往往先通过关键词快速过滤，再用语义检索对候选技能进行精排。 claude-ontology-skill 项目很可能利用了Claude强大的上下文理解能力，将技能列表和描述作为上下文，直接让Claude选择最合适的技能ID。
参数提取与填充 ：确定调用 get_weather 技能后，引擎需要提取 city_name 参数。它会将用户输入和技能的 input_schema 再次发送给Claude，并指令：“请从用户的输入中，提取出符合以下JSON Schema的参数值。”Claude会返回 {"city_name": "上海"} 。
技能执行 ：此时，引擎拿到了技能ID和参数。真正的“执行”阶段开始。这里又分两种情况：
- 纯模型执行 ：对于推理、创作、总结这类任务，执行就是再次调用Claude，并将“技能描述+输入参数”作为提示词的一部分，要求其生成符合 output_schema 的结果。例如：“你是一个天气查询助手。城市是上海。请以JSON格式输出天气信息，包含temperature, condition, humidity, wind_speed字段。”
- 模型+外部工具执行 ：对于需要实际操作的任务（如发邮件、查数据库），Claude的角色是生成“执行指令”。引擎在收到Claude的结构化输出后，会根据技能ID映射到后端一个具体的函数（如 send_email() ），并将参数传递给这个函数执行。函数执行后的真实结果，再封装成最终的输出返回。
结果格式化与返回 ：将执行结果（无论是Claude直接生成的，还是外部函数返回的）按照 output_schema 格式进行最后检查和包装，然后返回给用户或下一个流程。

这个流程中， 步骤2和3是精度和稳定性的关键 。任何误匹配或参数提取错误，都会导致后续全盘错误。因此，高质量的技能定义和充足的示例数据，是项目成功的基石。

4. 实操过程：从零构建一个技能并集成

理论讲得再多，不如动手做一遍。假设我们要为个人知识库添加一个“添加笔记”的技能，让我们看看如何利用 claude-ontology-skill 的框架（或类似思路）来实现。

4.1 第一步：定义“添加笔记”技能

我们首先创建技能定义文件 skill_add_note.yaml 。

id: add_note_to_knowledge_base
name: 添加笔记到知识库
description: 将用户提供的信息，以结构化的笔记形式保存到指定的知识库分类中。笔记需要包含标题、内容、标签和来源链接（可选）。
input_schema:
  type: object
  properties:
    title:
      type: string
      description: 笔记的标题，应简洁概括核心内容。
      required: true
    content:
      type: string
      description: 笔记的详细内容，可以是指令、代码片段、总结的文字等。
      required: true
    tags:
      type: array
      items:
        type: string
      description: 用于分类笔记的标签，例如“编程”、“机器学习”、“工具推荐”。最多5个。
      required: true
    category:
      type: string
      description: 笔记所属的一级分类，必须是以下选项之一：'技术', '生活', '工作', '学习', '其他'。
      required: true
    source_url:
      type: string
      description: 该笔记内容的来源网页链接（如果有的话）。
      required: false
  required: [title, content, tags, category]
output_schema:
  type: object
  properties:
    success:
      type: boolean
      description: 笔记是否成功添加。
    note_id:
      type: string
      description: 成功添加后，系统生成的笔记唯一ID。如果失败，此字段为空。
    message:
      type: string
      description: 操作结果的详细信息，如成功提示或错误原因。
  required: [success, message]
execution_hint: |
  用户可能会用多种方式表达“记下来”的意图，如“保存这段内容”、“把这个加到我的知识库”、“记一笔”。
  请仔细识别用户意图，并引导用户补全必需的title, content, tags, category信息。
  输出必须是严格的JSON，且只包含success, note_id, message三个字段。

这个定义比天气查询复杂一些，包含了数组类型的 tags 和枚举类型的 category 。清晰的描述能帮助Claude更好地理解如何与用户交互来补全这些信息。

4.2 第二步：实现技能的后端执行逻辑

技能定义好了，但它只是一个“说明书”。我们需要编写实际的代码来执行“添加笔记”这个动作。这里我们用一个Python函数来模拟。

# skill_handlers.py
import uuid
import json
from datetime import datetime
# 假设我们有一个简单的“数据库”，用列表模拟
knowledge_base = []

def handle_add_note(**params):
    """
    处理添加笔记技能的后端逻辑
    """
    try:
        # 1. 参数校验 (在实际项目中会更复杂)
        required_fields = ['title', 'content', 'tags', 'category']
        for field in required_fields:
            if field not in params or not params[field]:
                return {
                    "success": False,
                    "note_id": "",
                    "message": f"缺少必要参数: {field}"
                }

        # 2. 构建笔记对象
        new_note = {
            "id": str(uuid.uuid4()), # 生成唯一ID
            "title": params['title'],
            "content": params['content'],
            "tags": params['tags'],
            "category": params['category'],
            "source_url": params.get('source_url', ''), # 可选参数
            "created_at": datetime.now().isoformat()
        }

        # 3. “保存”到知识库 (这里简单追加到列表)
        knowledge_base.append(new_note)
        print(f"[DEBUG] 笔记已保存: {new_note['id']}") # 模拟日志

        # 4. 返回成功结果
        return {
            "success": True,
            "note_id": new_note['id'],
            "message": f"笔记 '{params['title']}' 已成功添加到 '{params['category']}' 分类。"
        }

    except Exception as e:
        # 5. 异常处理
        return {
            "success": False,
            "note_id": "",
            "message": f"保存笔记时发生错误: {str(e)}"
        }

# 技能映射表，将技能ID映射到处理函数
SKILL_HANDLERS = {
    "add_note_to_knowledge_base": handle_add_note,
    # ... 可以映射其他技能
}

这个处理函数做了几件事：校验参数、构造数据、执行“保存”操作、返回格式化的结果。它完全遵循了技能定义中 output_schema 的约定。

4.3 第三步：构建技能调用引擎（简化版）

现在，我们需要一个引擎来串联起Claude和我们的处理函数。以下是核心流程的简化代码。

# skill_engine.py (核心简化逻辑)
import yaml
import json
from anthropic import Anthropic # 假设使用Anthropic官方SDK
from skill_handlers import SKILL_HANDLERS

class SkillEngine:
    def __init__(self, anthropic_api_key):
        self.client = Anthropic(api_key=anthropic_api_key)
        self.skills = self._load_skills() # 加载所有技能定义
        self.handlers = SKILL_HANDLERS

    def _load_skills(self):
        # 从指定目录加载所有YAML技能定义文件
        skills = {}
        # ... (遍历文件，用yaml.load加载的代码)
        # 假设加载后 skills = {"get_weather": {...}, "add_note_to_knowledge_base": {...}}
        return skills

    def _select_skill(self, user_input):
        """
        利用Claude选择最合适的技能。
        这里将技能列表作为上下文提供给Claude，让其选择。
        """
        skill_list_text = ""
        for skill_id, skill_def in self.skills.items():
            skill_list_text += f"- {skill_id}: {skill_def['description']}\n"

        prompt = f"""你是一个技能路由助手。请根据用户输入，从以下技能列表中选择最合适的一个技能ID。
        只返回技能ID，不要任何其他解释。

        可用技能：
        {skill_list_text}

        用户输入：{user_input}

        最匹配的技能ID是："""

        response = self.client.messages.create(
            model="claude-3-sonnet-20240229", # 使用合适的模型
            max_tokens=100,
            temperature=0,
            messages=[{"role": "user", "content": prompt}]
        )
        selected_skill_id = response.content[0].text.strip()
        return selected_skill_id if selected_skill_id in self.skills else None

    def _extract_parameters(self, skill_id, user_input):
        """
        利用Claude根据技能的input_schema从用户输入中提取参数。
        """
        skill_def = self.skills[skill_id]
        input_schema_json = json.dumps(skill_def['input_schema'], ensure_ascii=False)

        prompt = f"""请从用户的输入中，提取出符合以下JSON Schema的参数值。
        只返回一个合法的JSON对象，不要任何其他解释。

        JSON Schema:
        {input_schema_json}

        用户输入：{user_input}

        提取出的参数JSON："""

        response = self.client.messages.create(
            model="claude-3-sonnet-20240229",
            max_tokens=500,
            temperature=0,
            messages=[{"role": "user", "content": prompt}]
        )
        # 解析Claude返回的JSON
        try:
            params = json.loads(response.content[0].text.strip())
            return params
        except json.JSONDecodeError:
            # 如果Claude返回的不是纯JSON，可能需要更复杂的解析或重试
            return None

    def execute(self, user_input):
        """
        主执行函数：1选技能 2提参数 3执行 4返回
        """
        # 1. 技能选择
        skill_id = self._select_skill(user_input)
        if not skill_id:
            return {"error": "未找到匹配的技能"}

        # 2. 参数提取
        params = self._extract_parameters(skill_id, user_input)
        if params is None:
            return {"error": "参数提取失败"}

        # 3. 执行技能
        if skill_id in self.handlers:
            # 调用我们预先写好的后端处理函数
            result = self.handlers[skill_id](**params)
        else:
            # 如果没有对应的后端函数，则视为“纯模型技能”，再次调用Claude生成结果
            skill_def = self.skills[skill_id]
            prompt = f"""请根据以下技能描述和输入参数，生成输出。
            技能描述：{skill_def['description']}
            输入参数：{json.dumps(params, ensure_ascii=False)}
            输出必须严格遵循以下JSON Schema：
            {json.dumps(skill_def['output_schema'], ensure_ascii=False)}
            只输出JSON，不要其他内容。"""
            response = self.client.messages.create(...)
            # ... 解析response为result
            result = json.loads(response.content[0].text)

        # 4. 返回结果
        return {
            "skill_id": skill_id,
            "parameters": params,
            "result": result
        }

# 使用示例
if __name__ == "__main__":
    engine = SkillEngine(anthropic_api_key="your-api-key")
    user_query = “把‘Python列表推导式的五种用法’这个知识点，加上‘Python’，‘编程技巧’标签，存到‘技术’分类里，内容就是我刚才发的那段代码。”
    final_result = engine.execute(user_query)
    print(json.dumps(final_result, indent=2, ensure_ascii=False))

这段代码展示了一个极简引擎的核心循环：选择技能 -> 提取参数 -> 执行（调用函数或Claude）-> 返回。在实际的 claude-ontology-skill 项目中，代码会更加健壮，包含错误处理、技能缓存、上下文管理（支持多轮对话补全参数）等。

4.4 第四步：测试与迭代

完成集成后，需要进行大量测试。

边界测试 ：输入不完整的指令（如只说“记下来”），看系统是否会引导用户补全信息（这需要引擎支持多轮对话上下文）。
模糊意图测试 ：用不同的说法触发同一个技能，如“保存这个”、“添加到笔记”、“记录一下”，测试意图识别的准确性。
参数提取测试 ：输入复杂的、参数混杂在长文本中的指令，测试Claude提取参数的精准度。
输出格式测试 ：确保无论后端处理成功还是失败，返回的JSON都严格符合 output_schema 。

根据测试结果，你可能需要：

优化技能描述 ：让描述更精准，减少歧义。
提供示例 ：在技能定义或引擎提示词中增加少量高质量示例（Few-shot Learning），显著提升效果。
调整参数Schema ：将某些 required 参数改为 false ，或调整参数类型。

5. 常见问题与排查技巧实录

在实际开发和集成 claude-ontology-skill 这类框架时，你会遇到一些典型问题。下面是我在实践中总结的一些“坑”和解决方法。

5.1 意图识别不准或技能匹配错误

问题现象 ：用户想查询天气，系统却识别成了添加笔记。 排查思路 ：

检查技能描述 ：首先回顾 get_weather 和 add_note 的技能 name 和 description 是否足够独特、无歧义。“查询天气”的描述如果过于简单，可能会与“查询信息”这类泛化技能混淆。
审查技能选择提示词 ：查看 _select_skill 函数中的提示词。确保你明确指令Claude“只返回技能ID”，并且将技能列表清晰地呈现。有时在提示词末尾加上“如果都不匹配，返回 null ”能避免模型强行选择一个。
引入技能分类和优先级 ：如果技能很多（比如超过20个），一次性让Claude从长列表里选效果会下降。可以预先对技能进行粗分类（如“工具类”、“查询类”、“创作类”），先让Claude判断大类，再在大类里选择具体技能。
使用更强大的模型 ：如果使用的是 claude-3-haiku 这类轻量级模型，在复杂意图识别上可能力有不逮。切换到 claude-3-sonnet 或 claude-3-opus 通常会有立竿见影的效果，当然成本也更高。

实操技巧 ：在开发初期， 记录下所有技能匹配的日志 ，包括用户输入、Claude收到的完整提示词、Claude返回的技能ID。分析这些日志是优化意图识别最直接的方法。你会发现，很多时候问题出在用户表达和你预设的描述不匹配上。

5.2 参数提取失败或提取错误

问题现象 ：技能匹配对了，但提取出的参数是错的。比如城市名提取成了“今天”，或者标签提取不全。 排查思路 ：

强化参数描述 ：这是最有效的办法。回顾 input_schema 里每个参数的 description 字段。不要只写“城市名”，要写成“需要查询天气的城市名称，必须是中文名称，例如‘北京’、‘上海’”。提供例子（Example）能极大帮助模型理解。
提供提取示例 ：在调用Claude提取参数的提示词中，可以加入一两个示例（Few-shot）。例如，在提示词里先写：“示例1：用户输入‘北京天气’，输出应为 {\”city_name\”: \”北京\”} ”。这比单纯的描述更管用。
分步提取与确认 ：对于包含多个复杂参数的技能，不要指望一次提取全部成功。可以设计多轮对话：先提取核心参数，执行一部分，再反问用户获取剩余参数。例如，用户说“记一下Python装饰器的内容”，系统可以先提取 content ，然后反问：“好的，请为这个笔记提供一个标题和几个标签？”
后置校验与清洗 ：在参数传递给后端函数前，增加一层校验逻辑。比如，对于 category 字段，检查提取的值是否在[‘技术’， ‘生活’， ‘工作’， ‘学习’， ‘其他’]之中，如果不在，可以尝试用语义相似度映射到最接近的一个，或者直接反问用户。

实操技巧 ：参数提取的提示词（Prompt）需要精心设计。除了Schema，可以加入更严格的指令，如：“请确保提取的 tags 是一个字符串数组，即使只有一个标签。如果用户未提供来源， source_url 字段应为空字符串。”

5.3 输出格式不符合Schema约定

问题现象 ：Claude返回了一段话，而不是JSON，或者JSON里缺少了必需的字段。 排查思路 ：

检查 output_schema 和 execution_hint ：确保 output_schema 本身是合法的JSON Schema。在 execution_hint 中必须 强烈、明确地要求 模型“只输出JSON”，“不要有任何其他文字”。可以多次强调。
使用系统提示词（System Prompt） ：在调用Claude API时，利用 system 参数设置全局角色。例如：“你是一个严格的JSON输出机器。对于任何需要结构化输出的请求，你必须只返回一个合法的JSON对象，绝对不要添加任何解释、道歉、开场白或结束语。”
后处理与重试 ：在代码中，对Claude的返回进行 try...except json.JSONDecodeError 捕获。如果解析失败，可以将错误信息和原始返回再次发送给Claude，要求它纠正。例如：“你刚才的回复不是有效的JSON。请严格遵循以下Schema重新生成输出：{schema}。你之前的回复是：{raw_response}”。
降低Temperature ：在提取参数和生成结构化输出的API调用中，将 temperature 参数设置为0或一个非常低的值（如0.1），以减少模型的随机性，使其输出更稳定、更可预测。

5.4 技能组合与流程编排中的问题

当技能变得复杂，需要组合使用时，会面临新的挑战。问题：工作流中，前一个技能的输出如何作为后一个技能的输入？ 解决方案 ：需要设计一个 上下文管理器 。每个技能执行后，其标准化的输出（JSON）会被保存在一个上下文字典中。下一个技能在定义 input_schema 时，可以引用之前技能的输出。例如，一个“分析数据”的技能，其 input_schema 中的 data 字段可以描述为“来自上一个‘获取数据’技能的 raw_data 输出”。引擎在执行时，需要具备解析这种引用关系并自动填充参数的能力。

问题：如何处理技能执行失败？ 解决方案 ：每个技能的处理函数都必须有完善的异常捕获，并返回格式化的错误信息（如 {“success”: false, “message”: “...”} ）。工作流编排器需要检查每个步骤的 success 字段。如果为 false ，可以根据预设策略决定是重试、跳过、执行备用技能，还是终止整个流程并向上游返回错误。

个人体会 ：构建基于大模型的技能系统，是一个在“灵活性”和“可控性”之间寻找平衡的艺术。初期，你总会觉得模型的输出“有点飘”，不可靠。但通过 精细化设计技能定义、精心编写提示词、以及在后端逻辑层增加足够的校验和兜底 ，你可以逐渐将这套系统打磨得非常稳定可靠。它不是一个“黑箱”，而是一个通过清晰契约（Schema）和明确指令（Prompt）与AI协同工作的框架。最大的收获是思维模式的转变：从“如何让AI理解我模糊的指令”变为“如何为AI设计清晰、可执行的任务卡片”。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐