3b35b4c85ce8f9ff97bf05b66ed20612.gif

获取项目源码,文末联系小编

ESP32-S3智能AI机器人在ESP32-S3开发板上运行豆包大模型,使用RTC连续对话,也可以搭载多种开源AI大模型( DeepSeek、OpenAI 、通义千问)等,通过对话角色自定义、海量知识库、长期记忆、语音声纹识别等功能,成为了一个真正“懂你”的AI助理。

本文演示如何快速搭建 ESP-ADF 环境、适配开发板、完成鉴权配置,以及通过 RTC 实现大模型对话。想了解豆包大模型的更多玩法,千万别错过!

ESP32豆包机器人架构

3db4d4e2b3de3efdf650e313df1bf21f.png

ESP32-豆包智能AI机器人支持两种模式, 一个是唤醒对话模式,一个是普通模式:

  • 唤醒对话模式是用户需要通过唤醒词去唤醒设备,唤醒后设备进入语音交互模式,用户可以与设备进行语音交互。默认的唤醒词是 Hi 乐鑫, 可以在 menuconfig -> ESP Speech Recognition → use wakenet → Select wake words 中去更换唤醒词

  • 普通模式是用户无需唤醒词,直接与设备进行语音交互。

31480bccd596776696bbcb4cf7c639dc.png

乐鑫 ESP-ADF 框架是专为音频应用设计的开发框架,基于其物联网开发框架ESP-IDF构建。它针对音频设备的开发需求,提供了丰富的音频组件,像音频编解码、CODEC 芯片驱动等,还能运行优化过的 3A 音频算法,无需额外 DSP 芯片,有效降低成本,从硬件驱动到上层应用的完整工具链和组件库,简化了音频产品的开发流程。

44c11b352a630ce9195fdf40299575be.png

ESP-ADF仓库发布的豆包大模型的 WebRTC 组件基于 UDP 协议,传输速度更快、实时性更强,能更高效地利用带宽资源,未来还可应用于实时视频识别等场景。

1a52e24be1da19cf50a84290f21dd766.png

在 ESP-ADF 框架下,音频处理借助灵活的 pipeline 完成。上行时,先采集音频,运行本地回声消除算法,接着 opus 编码,随后上传至服务端;

3015f0c433d15ea43c246898abc353c8.png

下行则是从服务器获取实时音频数据,经过 opus 解码还原,根据实际情况进行 resample,最终输出到音频设备。而且 pipeline 可随时暂停或继续播放,以此实现语音打断功能,保障音频交互流畅。

2f2d94881a3232e6e34bb29bc38c3549.png

在 main 文件夹的 config.h 中配置 Wi-Fi 和大模型的鉴权信息。商业项目可以自行搭建服务器来分发 Token。在项目初期进行测试时,有两种方式获取 Token:一种是在控制台申请临时 Token;另一种是通过扣子服务器来请求 Token,获取 Token 后能确保设备正常接入大模型服务。

a8969fc9d58a27cbe06c804fbe909999.png

在完成上述操作后,要让设备和智能体进入 RTC 房间,这样才能实现与豆包大模型的对话。同时,还可以在控制台根据个人需求配置智能体的音色等选项,从而获得更个性化的交互体验。

ESP32智能AI机器人应用场景

092f97d79aea31ce3d4268eacc45e59e.png

  • 智能家居领域在智能家居设备中,接入豆包大模型后,用户可以通过简单的语音指令,让设备完成各种复杂操作。比如,语音控制智能音箱播放想听的音乐、查询天气信息,或者让智能家电按照你的要求调整工作模式,极大地提升家居生活的便利性和智能化程度。

  • 智能办公场景在办公环境中,搭载该技术的设备能成为你的智能办公助手。你可以语音让它记录会议内容、查询资料、安排日程等,帮助你更高效地处理工作事务,减少繁琐的手动操作,把更多时间和精力放在核心工作上。

  • 智能教育设备对于教育类产品而言,与豆包大模型对接后,能为学生提供更个性化的学习辅导。无论是解答学科问题,还是进行语言学习对话练习,都能满足多样化的学习需求,让学习变得更加有趣和高效。

ESP32智能AI机器人源码 

cfd3189c00d32b914c144f744c8179b2.png

Github 完整项目资料获取:

https://github.com/espressif/esp-adf/tree/master/examples/ai_agent/volc_rtc

如有需求,请加小编微信:  beacon0418


9f24797bb764751be3538f4af67238ba.png

往期推荐

☞ 乐鑫ESP32+豆包智能AI聊天机器人

☞ Arduino 开源 ESP32 智能手表

☞ 源码交付 IoT智慧水务、污水处理

☞ 乐鑫ESP32+DeepSeek智能AI机器人

☞ 这苦逼的IoT物联网我竟坚持了十年

☞ 上班摸鱼, 智能AI 监控老板行踪

90e236b4bd4e413f88e6e7bac0a89ecf.png

24dd0e4ba6a6fab2c114863251e1710f.png

免责声明:本公众号所发布的内容来源于互联网,我们会尊重并维护原作者的权益。由于信息来源众多,若文章内容出现版权问题,或文中使用的图片、资料、下载链接等,如涉及侵权,请告知我们,我们将尽快处理。

a5edcb64366019bfae19f2a5c07cccd3.gif

5bf89d9cd7563c0df2aea8c0617c42dd.gif

8f62706785292de4c532f171a07e41a1.gif

4b8f358ed2dee5ad7f7cafde087562da.gif

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐