TripGenie：畅游济南旅行规划助手：个人工作纪实（三）

我首先对deepseek进行了学习，我深入研究了deepseek模型如何理解用户查询的意图，简单来说深度学习模型通过文本预处理、词嵌入、上下文理解、意图分类、槽位填充、上下文管理等步骤，逐步理解用户查询的意图，并生成相应的响应。例如，对于查询“计划明天济南一日游”，模型会识别出“”是意计划图，“明天”是时间，“当前位置”是出发地，“济南”是目的地等关键信息。根据理解的意图和提取的关键信息，模型生成

m0_74900369

880人浏览 · 2025-03-26 19:56:39

m0_74900369 · 2025-03-26 19:56:39 发布

本周团队顺利通过了任务书的撰写与审核，正式接入deepseek的api开始工作。

我首先对deepseek进行了学习，我深入研究了deepseek模型如何理解用户查询的意图，简单来说深度学习模型通过文本预处理、词嵌入、上下文理解、意图分类、槽位填充、上下文管理等步骤，逐步理解用户查询的意图，并生成相应的响应。这一过程依赖于大量的预训练数据和先进的神经网络架构，能够实现高效、准确的意图理解。具体如下：

1. 文本预处理
用户输入的查询文本首先会被进行预处理，包括分词、去除停用词、词干提取等操作。这些步骤有助于将原始文本转换为模型能够处理的格式。

2. 词嵌入（Word Embedding）
将文本中的单词或短语映射到高维向量空间中，这些向量能够捕捉单词之间的语义关系。例如，BERT模型使用WordPiece分词技术，将单词分解为子词单元，并通过预训练学习每个子词的嵌入向量。

3. 上下文理解
预训练语言模型通过大量的文本数据训练，学习到每个单词在不同上下文中的含义。例如，BERT模型采用双向Transformer架构，能够同时考虑上下文中的前后信息，从而更准确地理解单词的语义。

4. 意图分类
模型通过一个意图分类器（通常是一个神经网络层）来判断用户查询的意图。这个分类器基于预训练模型的输出，结合特定任务的训练数据，学习将用户查询映射到不同的意图类别。例如，一个电商搜索引擎可能会将用户查询分类为“购买商品”、“查看评价”、“询问价格”等意图。

5. 槽位填充（Slot Filling）
除了意图分类，模型还会进行槽位填充，即从查询中提取关键信息。例如，对于查询“计划明天济南一日游”，模型会识别出“”是意计划图，“明天”是时间，“当前位置”是出发地，“济南”是目的地等关键信息。

6. 上下文管理
在多轮对话场景中，模型会维护一个上下文状态，以理解用户查询的连续性。例如，用户先问“明天济南的天气怎么样？”接着问“后天呢？”模型需要理解第二个问题是在询问与第一个问题相关的内容。

7. 生成响应
根据理解的意图和提取的关键信息，模型生成相应的响应。这可能是一个直接的答案，也可能是一个指向相关资源的链接，或者是一个引导用户进一步操作的提示。

8. 持续学习与优化
模型会根据用户的反馈和新的数据不断优化。例如，通过强化学习，模型可以根据用户的点击行为、停留时间等反馈信息，调整意图识别和响应生成的策略。

接着，我研究了对于如何将学校提供的api接入到代码中，我首先查阅了deepseek api官方文档

具体流程大概如下:

1. 注册账号并获取API密钥:这是调用API的身份验证凭证。

2. 选择合适的开发工具:根据自己擅长的编程语言选择合适的HTTP客户端库。例如，Python可以使用`requests`库，JavaScript可以使用`fetch`或`axios`。

3. 编写代码调用API
使用HTTP客户端库发送请求，并处理返回的数据，deepseek在这里提供了示例：

# Please install OpenAI SDK first: `pip3 install openai`

from openai import OpenAI

client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")

response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "system", "content": "You are a helpful assistant"},
        {"role": "user", "content": "Hello"},
    ],
    stream=False
)

print(response.choices[0].message.content)

5. 处理返回数据：根据API文档，解析返回的数据并提取你需要的信息。

6. 调试和优化：测试代码，确保API调用正常工作，并根据需要优化代码逻辑。

通过这些学习，我了解了deepseek的使用方法，并且在本地进行了测试，这有助于我在后期的开发中顺利推进。