作加

开源语音生成模型indexTTS本地部署教程


模型优点:免费开源,无限长度,适合数字人念长文稿,低配置电脑可运行,2G以上显卡即可。

windows:安装步骤:

1、环境准备

(1)下载安装git

https://git-scm.com/

(2)下载安装miniconda https://www.anaconda.com/download/success

(3)克隆项目代码: 进入cmd输入

git clone https://github.com/index-tts/index-tts.git

(4)点击windows开始菜单中的Anaconda Prompt进入CMD执行以下命令:

conda create -n index-tts python=3.10
conda activate index-tts
conda install -c conda-forge ffmpeg

conda install -c conda-forge pynini==2.1.6
pip install WeTextProcessing –no-deps

(5)安装TORCH,文件比较大预计需要几分钟下载时间:

pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu118

2、安装依赖

cd index-tts
pip install -e .

2、下载模型文件:
将https://modelscope.cn/models/IndexTeam/IndexTTS-1.5/files这个链接里的模型文件
config.yaml
bpe.model
bigvgan_discriminator.pth
bigvgan_generator.pth
dvae.pth
gpt.pth
unigram_12000.vocab
下载到 \index-tts\checkpoints这个文件夹中

3、安装并启动webUI
pip install -e ".[webui]" --no-build-isolation
python webui.py
打开浏览器并访问以查看演示。http://127.0.0.1:7860

# 可指定其他目录中的其他模型版本,例如:
python webui.py --model_dir IndexTTS-1.5

注:deepspeed 包需要先安装cuda ,而cuda需要先安装Visual Studio,记得安装VS时勾选使用C++开发桌面程序

GitHub项目地址:

https://github.com/index-tts/index-tts

魔搭模型地址:

https://modelscope.cn/models/IndexTeam/IndexTTS-1.5/files