ai代码训练方法（开源精选AI拟声）

小君 2023-05-09 06:06:08 967

ai代码训练方法（开源精选AI拟声）2.2使用社区预先训练好的合成器（与2.1二选一）假如你下载的 aidatatang_200zh文件放在D盘，train文件路径为 D:\data\aidatatang_200zh\corpus\train 你的datasets_root就是 D:\data\1.安装2.准备预训练模型2.1 使用数据集自己训练合成器模型（与2.2二选一）

《开源精选》是我们分享Github、Gitee等开源社区中优质项目的栏目，包括技术、学习、实用与各种有趣的内容。本期推荐的是一个基于python的AI拟声项目——MockingBird。

MockingBird可以通过5秒钟的音频素材完成克隆声音，产生的输出音色与原始声音非常相似，并且能够合成原始音频样本中不存在的声音和辅音，同时也支持生成任意语音内容。

ai代码训练方法（开源精选AI拟声）(1)

MockingBird特性：

中文支持普通话并使用多种中文数据集进行测试：aidatatang_200zh magicdata aishell3 biaobei MozillaCommonVoice data_aishell 等
PyTorch适用于 pytorch，已在 1.9.0 版本（最新于 2021 年 8 月）中测试，GPU Tesla T4 和 GTX 2060
Windows Linux可在Windows操作系统和linux操作系统中运行（苹果系统M1版也有社区成功运行案例）
Easy & Awesome下载器或新训练合成器合成器有良好的效果，自带声音预置的编码器/码，或实时的HiFi-GAN作为声码器
Webserver Ready可服务器的训练结果，供远程调用

如何使用：

1.安装

安装PyTorch。
安装ffmpeg。
运行pip install -r requirements.txt来安装必要的包。
安装 webrtcvad pip install webrtcvad-wheels。

2.准备预训练模型

2.1 使用数据集自己训练合成器模型（与2.2二选一）

下载数据集并解压：确保您可以访问 train 文件夹中的所有音频文件（如.wav）
进行音频和梅尔频谱图预处理： python pre.py <datasets_root> -d {dataset} -n {number} 可传入参数
-d{dataset} 指定数据集，支持 aidatatang_200zh magicdata aishell3 data_aishell 不传默认为aidatatang_200zh
-n {number} 指定并行数，CPU 11770k 32GB实测10没有问题

假如你下载的 aidatatang_200zh文件放在D盘，train文件路径为 D:\data\aidatatang_200zh\corpus\train 你的datasets_root就是 D:\data\