这篇文章介绍一个开源的Agent框架-微软的Autogen。

一,Autogen简介

GPTs这么强大,不是挺好吗?为什么要开源的智能体Autogen框架呢?那

GPTs背靠OpenAI,的确非常强悍,但是也有弊端,弊端就在于它完全依赖于ChatGPT,而对于ChatGPT,我们只能在应用层调用其API,无法在大模型层面做一些个性化的调整,比如想让大模型在回答问题的过程中调用本地的应用。

GPTs做不到,但是Autogen框架可以做到。

Autogen可以对接商业化模型,如OpenAI;也可以对接开源的模型,比如说本地部署的KoDrama、WitherCoder、DeepSeek、通义千问。

Autogen可以简单理解为是一个GPTs的一个本地化平替。

Autogen提供一个可视化的UI界面Autogen Studio,提供模型配置、能力配置、工作流配置等能力。通过这些能力,可以实现类似GPTs的功能。

二,Autogen原理

1,Autogen原理图解

接下来,先通过官网的一个例子来理解Autogen的设计架构以及工作原理。

下图是官网提供的一个Autogen智能体架构图。

在这里插入图片描述

如上图左侧,Autogen框架默认提供两个agent:

  • 一个用户代理,User Proxy Agent
  • 一个助理代理,Assistant Agent

工作流程描述如下:

  • 用户提出一个需求
  • 用户代理接收到需求后,发给助理
  • 助理接收到需求后,进行总体规划设计,将这个需求拆解为多个步骤,规定每个步骤需要执行的任务
  • 助理将规划整体返回给用户代理
  • 用户代理按照规划按步骤执行,执行的过程中,可以持续、多次与助理进行沟通,调整任务的具体内容

2,拆解Autogen是如何完成绘制特斯拉股票趋势图的

以上图中的业务场景为例,用户要求绘制特斯拉最近一年的股票价格的变化趋势图。

在这里插入图片描述

助理对这个需求进行拆解,之后的交互过程如下:

  • 助理告知用户代理第一个步骤是执行一段代码
  • 用户代理执行助理提供的代码
  • 用户代理将执行的过程中出现错误的错误反馈给助理
  • 助理给出解决方案,提供一个脚本
  • 用户代理执行这个脚本后,重新执行代码,成功画出趋势图
  • 用户代理对结果进行反馈,需要对结果进行调整,要求绘制百分比趋势图
  • 助理接收到反馈后,调整任务内容,给出新的代码
  • 用户代理执行新的代码,绘制出满足要求的趋势图

这就是Autogen的工作原理,两个agent协同工作, 完成用户需求。

这是最简单的场景,只涉及两个智能体的交互,实际上Autogen框架支持多智能体间的复杂交互。

相当于可以创建一个公司,这个公司的工作不是由具体的物理世界的人完成的,而是由多个具有不同能力的智能体完成的,每个智能体就像是一个人一样,他们之间也可以像人一样相互写作,完成一个个复杂的任务。

后续将介绍多智能体的交换案例。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐