GitHub - wqzh/StreamChat: 智能体与用户实时聊天，支持多个用户同时访问。集成ASR, LLM, TTS的处理流程，从用户麦克风流式获取音频，传输到服务器，然后返回生成的语音。

Overview

Server:

VAD，ASR 2个模块使用 FunASR 现有的模型。直接部署在server内部
LLM是本人微调后的Qwen1.5模型，使用vllm后端部署。使用API接口形式访问
TTS是本人微调后的Bert-VITS2模型。使用API接口形式访问

理论上，LLM和TTS可以替换成自己微调或者第三方的api接口。只需要修改server.py中的llm_and_tts函数即可。Tip: 替换前，记得先独立测试每个模块。

Features

Server

server支持多个客户端同时连接。服务器接受客户端传输的语音，服务器进行vad检测、800ms静默等待、ASR，得到用户语音对应的文本。然后依次调用LLM得到回答，最后使用TTS得到语音，传输到客户端。

Client

客户端连接到服务器后，麦克风实时传输60ms的语音片段到服务器。

Dependencies

Server

pip install funasr==1.0.10
pip install websockets

Client

客户端的Python环境建议使用3.10

pip install websockets pygame
pip install pyaudio

如果无法安装 pyaudio库，可以下载从PyPI官网下载whl文件，目前只支持 Windows, Python 3.8 ~ 3.12版本。

下载好whl 包后，使用 pip install /path/to/PyAudio-0.2.14-cp-xxx.whl 安装即可。

Running

运行Server前，从ModelScope下载对应的模型。FunASR模型下载参考

下载链接

Server

下载好4个模型后，运行服务器

CUDA_VISIBLE_DEVICES=2 python \
    src/funasr_wss_server.py \
    --port 10122 \
    --asr_model /data1/wqzh/HF-Models/FunASR-Chat/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch \
    --asr_model_online /data1/wqzh/HF-Models/FunASR-Chat/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online \
    --punc_model /data1/wqzh/HF-Models/FunASR-Chat/punc_ct-transformer_zh-cn-common-vocab272727-pytorch \
    --vad_model /data1/wqzh/HF-Models/FunASR-Chat/speech_fsmn_vad_zh-cn-16k-common-pytorch

Client

服务器启动后，运行客户端，连接到服务器

python src/funasr_wss_client.py  --host 122.225.x.x --port 10122  --mode 2pass --chunk_size "5,10,5" --output_dir ./ --ssl 0

--host指的是server端的部署IP, 如果server是部署在本地，请使用127.0.0.1，也可以是公网IP。

BUGs

目前还存在几个可以优化的点：

目前不支持说话打断 (说话打断涉及到回声分离、说话人分离等技术)

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
images		images
misc		misc
src		src
README.md		README.md
README_en.md		README_en.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Overview

Features

Server

Client

Dependencies

Server

Client

Running

Server

Client

BUGs

Acknowledgements

About

Releases

Packages

Languages

wqzh/StreamChat

Folders and files

Latest commit

History

Repository files navigation

Overview

Features

Server

Client

Dependencies

Server

Client

Running

Server

Client

BUGs

Acknowledgements

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages