DeepSeek实战--MCP是什么?
大模型 MCP(Model Context Protocol,模型上下文协议)是由 Anthropic 公司于2024年11月推出的一种开放协议标准,旨在为大型语言模型(LLM)与外部数据源、工具及服务提供标准化的连接框架,解决数据孤岛问题并提升AI应用的实时交互能力。4)当大模型选择了合适的能力后,MCP Hosts 会调用 MCP Client 与 MCP Server 进行通信,由 MCP
1.MCP是什么?
大模型 MCP(Model Context Protocol,模型上下文协议)是由 Anthropic 公司于2024年11月推出的一种开放协议标准,旨在为大型语言模型(LLM)与外部数据源、工具及服务提供标准化的连接框架,解决数据孤岛问题并提升AI应用的实时交互能力。
MCP 使得 AI 应用能够安全地访问和操作本地及远程数据,为 AI 应用提供了连接万物的接口。
github地址:https://github.com/modelcontextprotocol
2.使用场景
- 自动化开发:集成IDE与GitHub、数据库,实现需求解析→代码生成→PR提交的自动化流程,效率提升可达10倍。
- 跨平台数据整合:通过MCP Server连接Google Drive、企业数据库等,支持实时数据查询与处理。
- 智能代理协作:如客服系统动态调用外部工具生成解决方案,或结合地图API规划路线
3.技术架构
核心组成:
- MCP 主机(MCP Hosts):发起请求的 LLM 应用程序(例如 Claude Desktop、IDE 或 AI 工具)。
- MCP 客户端(MCP Clients):在主机程序内部,与 MCP server 保持 1:1 的连接。
- MCP 服务器(MCP Servers):为 MCP client 提供上下文、工具和 prompt 信息(主要开发工作量)。
- 本地资源(Local Resources):本地计算机中可供 MCP server 安全访问的资源(例如文件、数据库)。
- 远程资源(Remote Resources):MCP server 可以连接到的远程资源(例如通过 API)。
各组成协作示例:
1)当用户发送 prompt(例如:我要查询北京的天气) 到 MCP Hosts 时
2)MCP Hosts 会调用 MCP Client 与 MCP Server 进行通信,获取当前 MCP Server 具备哪些能力
3)然后连同用户的 prompt 一起发送给大模型,大模型就可以针对用户的提问,决定何时使用这些能力了。这个过程就类似,我们填充 ReAct 模板,发送给大模型
4)当大模型选择了合适的能力后,MCP Hosts 会调用 MCP Client 与 MCP Server 进行通信,由 MCP Server调用工具或者读取资源后,反馈给 MCP Client,然后再由 MCP Hosts反馈给大模型
5)由大模型判断是否能解决用户的问题。如果解决了,则会生成自然语言响应,最终由 MCP Hosts 将响应展示给用户
更多推荐
所有评论(0)