1.MCP是什么?

大模型 MCP(Model Context Protocol,模型上下文协议)是由 Anthropic 公司于2024年11月推出的一种开放协议标准,旨在为大型语言模型(LLM)与外部数据源、工具及服务提供标准化的连接框架,解决数据孤岛问题并提升AI应用的实时交互能力。
MCP 使得 AI 应用能够安全地访问和操作本地及远程数据,为 AI 应用提供了连接万物的接口。

github地址:https://github.com/modelcontextprotocol

2.使用场景

  • 自动化开发:集成IDE与GitHub、数据库,实现需求解析→代码生成→PR提交的自动化流程,效率提升可达10倍。
  • 跨平台数据整合:通过MCP Server连接Google Drive、企业数据库等,支持实时数据查询与处理。
  • 智能代理协作:如客服系统动态调用外部工具生成解决方案,或结合地图API规划路线

3.技术架构

在这里插入图片描述

核心组成

  • MCP 主机(MCP Hosts):发起请求的 LLM 应用程序(例如 Claude Desktop、IDE 或 AI 工具)。
  • MCP 客户端(MCP Clients):在主机程序内部,与 MCP server 保持 1:1 的连接。
  • MCP 服务器(MCP Servers):为 MCP client 提供上下文、工具和 prompt 信息(主要开发工作量)。
  • 本地资源(Local Resources):本地计算机中可供 MCP server 安全访问的资源(例如文件、数据库)。
  • 远程资源(Remote Resources):MCP server 可以连接到的远程资源(例如通过 API)。

各组成协作示例

1)当用户发送 prompt(例如:我要查询北京的天气) 到 MCP Hosts 时
2)MCP Hosts 会调用 MCP Client 与 MCP Server 进行通信,获取当前 MCP Server 具备哪些能力
3)然后连同用户的 prompt 一起发送给大模型,大模型就可以针对用户的提问,决定何时使用这些能力了。这个过程就类似,我们填充 ReAct 模板,发送给大模型
4)当大模型选择了合适的能力后,MCP Hosts 会调用 MCP Client 与 MCP Server 进行通信,由 MCP Server调用工具或者读取资源后,反馈给 MCP Client,然后再由 MCP Hosts反馈给大模型
5)由大模型判断是否能解决用户的问题。如果解决了,则会生成自然语言响应,最终由 MCP Hosts 将响应展示给用户

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐