Skip to content

[开源推荐] Open-XiaoAI|让小爱音箱「听见你的声音」,解锁无限可能 #2958

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Open
idootop opened this issue May 21, 2025 · 0 comments
Assignees

Comments

@idootop
Copy link

idootop commented May 21, 2025

项目地址

https://github.com/idootop/open-xiaoai

类别

Rust

项目标题

小爱音箱刷机、自定义唤醒词、接入多模态大模型

项目描述

MiGPT 的增强版本,小爱音箱刷机后,获取系统+硬件控制权,接管小爱音箱的耳朵(麦克风)和嘴巴(扬声器)。

Image

亮点

功能方面

  • 支持自定义小爱音箱唤醒词(离线部署 + 中英文)
  • 支持定制多个唤醒词服务,不同唤醒词之间互不干扰
  • 不影响小爱音箱的任何原有功能,支持随时切换回原系统
  • 支持接入 Gemini Live API 和 OpenAI Realtime API 等多模态大模型
  • 支持接入小智 AI 等语音助手,超低延时、超流畅的对话体验,支持连续对话,任意打断
  • 支持自定义消息回复,方便对接其他 LLM、AI Workflow(Dify、扣子)、AI Agent 等服务

技术方面

  • Client 端补丁程序使用 Rust 编写,并通过 binding 与 Python 和 Node.js 端实现双向互调
  • 共享通信协议,实现 Server 端和 Client 端实时双向通信
    • 实时转发小爱音箱的麦克风输入音频流到 Server 端进行识别处理
    • 实时转发小爱音箱上的事件到 Server 端(语音识别结果、播放状态等)
    • 实时响应来自 Server 端的指令调用(执行脚本、播放音频流、系统升级等)

截图或演示视频

👉 小爱音箱接入小智 AI 演示视频

👉 小爱音箱自定义唤醒词演示视频

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants