原创发现安利 ChatTTS

ChatTTS-Forge-WebUI 加强版ChatTTS

发表于2024-08-05更新于2025-04-12

字数总计:496阅读时长:1分钟阅读量: 芝士星球

发现安利 ChatTTS

ChatTTS-Forge-WebUI 加强版ChatTTS

noise2024-08-052025-04-12

介绍

ChatTTS-Forge 是一个围绕 TTS 生成模型开发的项目，实现了 API 服务器和基于 Gradio 的 WebUI

Github:https://github.com/lenML/ChatTTS-Forge?tab=readme-ov-file

离线安装包

夸克：https://pan.quark.cn/s/b87a64e0f2eb

百度：https://pan.baidu.com/s/1Q1vQV5Gs0VhU5J76dZBK4Q?pwd=d7xu

21ww

特征

- ChatTTS 模型原生功能 Refiner/Generate
- 原生 Batch 合成，高效合成超长文本
- 样式控制
- SSML公司
  - 编辑器：简单的 SSML 编辑，配合其他功能使用
  - Spliter：超长文本分割预处理
  - Podcast：支持创建编辑播客脚本
- 议长
  - 内置音色：内置众多 speaker 可以使用
  - speaker creator：支持试音抽卡，创建 speaker
  - embdding：支持 speaker embdding 上传，可以复用保存下来的 speaker
  - speaker merge：支持合并说话人，微调 speaker
- 提示插槽
- 文本规范化
- 音质增强：
  - enhance：音质增强提高输出质量
  - denoise：去除噪音
- Experimental 实验功能
  - Fintune
    - 扬声器嵌入
    - [在制品]GPT劳拉
    - [在制品]自动曝光
  安装与运行
  1. 确保相关依赖已经正确安装，
  2. 根据你的需求启动需要的服务。
  - WebUI的：python webui.py
  - 应用程序接口：python launch.py
  GPU 显存要求
  2.1. 模型加载显存需求
  
  精度 ChatTTS 模型 Enhancer 模型
  
  全精度 2GB内存 3GB内存
  
  半精度 1GB接口 1.5千兆字节（GB）
  
  注：半精度为默认设置，全精度可通过参数启用。--no_half
  
  2.2. 推理过程显存需求
  
  精度批量大小不使用 Enhancer 使用 Enhancer
  
  全精度 ≤ 4 2GB内存 4GB接口
  
  全精度 8 4-10GB 6-14GB
  
  半精度 ≤ 4 1GB接口 2GB内存
  
  半精度 8 2-6GB 4-8GB
  
  注意事项：
  1. 显存需求与上下文长度相关，因此呈现为一个范围。
  2. 半精度（默认）的显存需求约为全精度的一半。
  3. 对于 Batch Size ≤ 4,4GB 显存通常足够进行推理。
  4. Batch Size 为 8 时，可能需要 6-14GB 显存，具体取决于精度和是否使用 Enhancer。

noise

原创 ChatTTS-Forge-WebUI 加强版ChatTTS

打赏作者

感谢你赐予我前进的力量

alipay
wechat

赞赏者名单

因为你们的支持让我意识到写文章的价值🙏

本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Noise&Blog！

评论

匿名评论隐私政策

✅ 你无需删除空行，直接评论以获取最佳展示效果

数据库加载中