大家好,我是杂烩君。

今天要给大家介绍的,是一个充满趣味与挑战的开源项目 —— 小智 AI 聊天机器人。

一、小智简介

小智 AI 聊天机器人是虾哥开发的开源项目,以 MIT 许可证发布:

https://github.com/78/xiaozhi-esp32

这个项目旨在帮助更多人踏入 AI 硬件开发的大门,让我们了解如何将当下热门的大语言模型应用到实际硬件设备中。

面包板效果:

已经支持的开源硬件:

二、小智已实现功能

  • 多样联网方式:支持 Wi-Fi 和 ML307 Cat.1 4G 联网。

  • 便捷唤醒与打断:BOOT 键唤醒和打断,支持点击和长按两种触发方式,还具备离线语音唤醒 ESP - SR 功能,操作简单又高效,能实时打断对话,就像和真人聊天一样自然。

  • 强大的语音交互:实现流式语音对话,支持国语、粤语、英语、日语、韩语 5 种语言识别。

  • 优质大模型加持:集成了大模型 TTS(火山引擎或 CosyVoice)和大模型 LLM(Qwen, DeepSeek, Doubao),拥有可配置的提示词和音色,还具备短期记忆功能,每轮对话后能自我总结,让对话更加连贯和智能。

  • 丰富的显示功能:OLED/LCD 显示屏不仅能显示信号强弱,还能展示对话内容,甚至支持 LCD 显示图片表情,为你的聊天增添更多乐趣。

三、硬件支持

项目支持多种开源硬件,从立创・实战派 ESP32 - S3 开发板,到乐鑫 ESP32 - S3 - BOX3、M5Stack CoreS3 等,满足不同开发者的需求。

而且,它还支持面包板手工制作,对于想要亲手实践的朋友来说,是个绝佳的机会。

详细教程可在飞书文档《小智 AI 聊天机器人百科全书》中查看,即使是硬件小白,也能轻松上手。

https://ccnphfhqs21z.feishu.cn/wiki/F5krwD16viZoF0kKkvDcrZNYnhb

四、开发环境与智能体配置

  • Cursor 或 VSCode
  • 安装 ESP-IDF 插件,选择 SDK 版本 5.3 或以上
  • Linux 比 Windows 更好,编译速度快,也免去驱动问题的困扰
  • 使用 Google C++ 代码风格,提交代码时请确保符合规范

如果我们已经拥有一个小智 AI 聊天机器人设备,可以登录 xiaozhi.me 控制台进行配置。

同时,项目还提供了详细的 WebSocket 通信协议文档,对于想要在个人电脑上部署服务器的朋友,可以参考:

https://github.com/78/xiaozhi-esp32/blob/main/docs/websocket.md

五、Linux版本小智

百问网团队最近也在嵌入式Linux平台上进行适配,项目链接:

https://github.com/100askTeam/xiaozhi-linux

已支持硬件列表:

感兴趣的朋友可以去玩一玩。无论是从学习技术,还是从享受趣味科技的角度来看,都非常值得一试。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐