ChatTTS-Forge-WebUI 加强版ChatTTS

介绍

ChatTTS-Forge 是一个围绕 TTS 生成模型开发的项目,实现了 API 服务器和基于 Gradio 的 WebUI

Github:https://github.com/lenML/ChatTTS-Forge?tab=readme-ov-file

离线安装包

夸克:https://pan.quark.cn/s/b87a64e0f2eb

百度:https://pan.baidu.com/s/1Q1vQV5Gs0VhU5J76dZBK4Q?pwd=d7xu

21ww

特征

    • ChatTTS 模型原生功能 Refiner/Generate

    • 原生 Batch 合成,高效合成超长文本

    • 样式控制

    • SSML公司

      • 编辑器: 简单的 SSML 编辑,配合其他功能使用
      • Spliter:超长文本分割预处理
      • Podcast: 支持创建编辑播客脚本
    • 议长

      • 内置音色:内置众多 speaker 可以使用
      • speaker creator: 支持试音抽卡,创建 speaker
      • embdding: 支持 speaker embdding 上传,可以复用保存下来的 speaker
      • speaker merge: 支持合并说话人,微调 speaker
    • 提示插槽

    • 文本规范化

    • 音质增强:

      • enhance: 音质增强提高输出质量
      • denoise: 去除噪音
    • Experimental 实验功能

      • Fintune
        • 扬声器嵌入
        • [在制品]GPT劳拉
        • [在制品]自动曝光

      安装与运行

      1. 确保 相关依赖 已经正确安装,
      2. 根据你的需求启动需要的服务。
      • WebUI的:python webui.py
      • 应用程序接口:python launch.py

      GPU 显存要求

      2.1. 模型加载显存需求

      精度 ChatTTS 模型 Enhancer 模型
      全精度 2GB内存 3GB内存
      半精度 1GB接口 1.5千兆字节(GB)

      注:半精度为默认设置,全精度可通过 参数启用。--no_half

      2.2. 推理过程显存需求

      精度 批量大小 不使用 Enhancer 使用 Enhancer
      全精度 ≤ 4 2GB内存 4GB接口
      全精度 8 4-10GB 6-14GB
      半精度 ≤ 4 1GB接口 2GB内存
      半精度 8 2-6GB 4-8GB

      注意事项:

      1. 显存需求与上下文长度相关,因此呈现为一个范围。
      2. 半精度(默认)的显存需求约为全精度的一半。
      3. 对于 Batch Size ≤ 4,4GB 显存通常足够进行推理。
      4. Batch Size 为 8 时,可能需要 6-14GB 显存,具体取决于精度和是否使用 Enhancer。