ChatTTS-Forge-WebUI 加强版ChatTTS
ChatTTS-Forge-WebUI 加强版ChatTTS
noise介绍
ChatTTS-Forge 是一个围绕 TTS 生成模型开发的项目,实现了 API 服务器和基于 Gradio 的 WebUI
Github:https://github.com/lenML/ChatTTS-Forge?tab=readme-ov-file
离线安装包
夸克:https://pan.quark.cn/s/b87a64e0f2eb
百度:https://pan.baidu.com/s/1Q1vQV5Gs0VhU5J76dZBK4Q?pwd=d7xu
特征
ChatTTS 模型原生功能 Refiner/Generate
原生 Batch 合成,高效合成超长文本
样式控制
SSML公司
- 编辑器: 简单的 SSML 编辑,配合其他功能使用
- Spliter:超长文本分割预处理
- Podcast: 支持创建编辑播客脚本
议长
- 内置音色:内置众多 speaker 可以使用
- speaker creator: 支持试音抽卡,创建 speaker
- embdding: 支持 speaker embdding 上传,可以复用保存下来的 speaker
- speaker merge: 支持合并说话人,微调 speaker
提示插槽
文本规范化
音质增强:
- enhance: 音质增强提高输出质量
- denoise: 去除噪音
Experimental 实验功能
- Fintune
- 扬声器嵌入
- [在制品]GPT劳拉
- [在制品]自动曝光
安装与运行
- 确保 相关依赖 已经正确安装,
- 根据你的需求启动需要的服务。
- WebUI的:
python webui.py
- 应用程序接口:
python launch.py
GPU 显存要求
2.1. 模型加载显存需求
精度 ChatTTS 模型 Enhancer 模型 全精度 2GB内存 3GB内存 半精度 1GB接口 1.5千兆字节(GB) 注:半精度为默认设置,全精度可通过 参数启用。
--no_half
2.2. 推理过程显存需求
精度 批量大小 不使用 Enhancer 使用 Enhancer 全精度 ≤ 4 2GB内存 4GB接口 全精度 8 4-10GB 6-14GB 半精度 ≤ 4 1GB接口 2GB内存 半精度 8 2-6GB 4-8GB 注意事项:
- 显存需求与上下文长度相关,因此呈现为一个范围。
- 半精度(默认)的显存需求约为全精度的一半。
- 对于 Batch Size ≤ 4,4GB 显存通常足够进行推理。
- Batch Size 为 8 时,可能需要 6-14GB 显存,具体取决于精度和是否使用 Enhancer。
- Fintune
评论
匿名评论隐私政策
✅ 你无需删除空行,直接评论以获取最佳展示效果