MockingBir
MockingBir的部署
开源作者:babysor
操作系统:Win10
硬件:cpu
2.安装
如果已经确认安装过,请忽略该步骤
验证本步骤是否成功:在系统任意路径下运行python,进入交互式编程界面后输入
import torch;
, 回车,torch.cuda.is_available()
, 回车。如果都是成功的话,可以进行下一步。
安装 ffmpeg。 1)下载 选择点击打开链接Windows对应的版本下载 2)解压 ffmpeg-xxxx.zip 文件到指定目录; 3)将解压后的文件目录中 bin 目录(包含 ffmpeg.exe )添加进 path 环境变量中; 4)进入 cmd,输入 ffmpeg -version,可验证当前系统是否识别 ffmpeg 以及查看 ffmpeg 的版本
运行pip install -r requirements.txt 来安装剩余的必要包。
确保本步骤不报错
- 安装 webrtcvad 用 pip install webrtcvad-wheels。
确保本步骤不报错
3.下载社区训练好的模型
在以下选择中下载模型
作者 | 下载链接 |
---|---|
@miven | 百度网盘 请输入提取码 提取码:2021 |
该模型与最新代码有兼容性问题 请查阅 https://github.com/babysor/MockingBird/issues/37 解决
下载完成后,确保 xxx.pt
格式的文件放在代码库的 synthesizer\saved_models
文件夹下,saved_models
如不存在请新建
4.运行demo_toolbox
在代码库路径下,运行 python demo_toolbox.py -d .\samples
尝试使用工具箱, 由于没有下载任何数据集,这里的功能比较简单:
确保界面左边中间的
synthesizer
选择了上一步中xxx.pt
文件对应的模型。点击
Record
录入你的5秒语音输入任意文字
点击
Synthesizer and vocode
等待效果输出较简单:确保界面左边中间的
synthesizer
选择了上一步中xxx.pt
文件对应的模型。点击
Record
录入你的5秒语音输入任意文字
点击
Synthesizer and vocode
等待效果输出
5.遇到的问题总结
1.元数据流报错:
在CSDN找到下面的方式无法解决问题。
pip install setuptools==57.5.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
解决:
在对比开源作者的文件时,发现作者main主支内容和本地文件不一致,在其他分支有完整的项目。
2. 报错:
cpu硬件没有运行,以及文件的训练数据无法找到。
Arguments:
datasets_root: None
enc_models_dir: encoder\saved_models
syn_models_dir: synthesizer\saved_models
voc_models_dir: vocoder\saved_models
cpu: False
seed: None
no_mp3_support: False
Warning: you did not pass a root directory for datasets as argument.
The recognized datasets are:
LibriSpeech/dev-clean
解决:
将 开发者提供的云盘资料下级文件全部导入该项目的主项目下,不用像作者要求的创建文件夹。
我自行创建文件夹同时将所有文件放在 /saved_models 下,反而导致文件的路径出错。