这是一个后端项目
基于https://github.com/RVC-Boss/GPT-SoVITS 实现了一个Flask框架的简单后端,并将推理函数拆分到不同文件利于管理
可以实现快速切换人物
对于安装
我们可以看看 https://www.yuque.com/xter/zibxlp/nqi871glgxfy717e
这个中文文档会更加详细
对于一个已经能正常运行的GPT-soVITS项目
将项目文件拷入根目录
或使用git,需要保证根目录下类似这样的文件结构
并且pip install -r requirements_added.txt
等待安装完成安装完成
然后就是可以正常的使用,导入模型后看下方如何使用环节
不推荐!!!
这个东西更多请当成插件使用
在弄,等一等
!注意,这个不同于主项目,而是将模型以人物卡的形式导入
在trained文件夹,通过子文件夹的形式导入人物
文件夹名称就是人物名称
里面应该至少有3个文件
以pth
/ckpt
/wav
后缀名结尾
并且wav的文件名就是它包含的文字内容
这样软件就会自动在这个文件夹中生成一个infer_config.json
{
"ref_wav_path": "./trained/paimeng/既然罗莎莉亚说足迹上有元素力,用元素视野应该能很清楚地看到吧。.wav",
"prompt_text": "既然罗莎莉亚说足迹上有元素力,用元素视野应该能很清楚地看到吧。",
"prompt_language": "中文",
"text_language": "中文",
"gpt_path": "./trained/paimeng/paimeng2-e50.ckpt",
"sovits_path": "./trained/paimeng/paimeng_e75_s81900.pth"
}
也可以手动编辑来指定路径
如果因为调整其中文件导致出现问题,请手动删去infer_config.json
,软件会重新生成
在trained
文件夹下有一个character_info.json
通过修改它可以改变默认角色
{
"deflaut_character":"hutao"
}
用.\runtime\python.exe .\inference_backend.py
调用或者直接双击bat即可
比如用阅读3.0
https://github.com/gedoor/legado
在朗读引擎中加入对应人名的朗读引擎
http://192.168.0.106:5000/tts,
{
"method": "POST",
"body": {
"cha_name": "hutao",
"text": "{{java.encodeURI(speakText)}}"
}
}
调整链接为你的挂载点
它默认运行在5000端口,挂载点是例如[http://192.168.0.106:5000/tts](http://192.168.0.106:5000/tts,)
最少项:
{
"method": "POST",
"body": {
"text": "{{java.encodeURI(speakText)}}"
}
}
详细选项
{
"method": "POST",
"body": {
"cha_name": "hutao",
"text": "{{java.encodeURI(speakText)}}",
"top_k": 3,
"top_p": 0.6,
"temperature": 0.6
}
}
其中text
是必要项
cha_name
可选,请确保在trained
中存在对应模型,不指定则使用默认模型
其它参数如果不知道怎么指定,可以不指定
返回audio/wav