ChatTTS

2个月前发布 21 0 0

开源的文本转语音工具。

收录时间:
2025-02-23

亮点

你可以参考 Bilibili 上的这个视频,了解本项目的详细情况。

  1. 对话式 TTS: ChatTTS 针对对话式任务进行了优化,能够实现自然且富有表现力的合成语音。它支持多个说话者,便于生成互动式对话。
  2. 精细的控制: 该模型可以预测和控制精细的韵律特征,包括笑声、停顿和插入语。
  3. 更好的韵律: ChatTTS 在韵律方面超越了大多数开源 TTS 模型。我们提供预训练模型以支持进一步的研究和开发。

数据集和模型

  • 主模型使用了 100,000+ 小时的中文和英文音频数据进行训练。
  • HuggingFace 上的开源版本是一个在 40,000 小时数据上进行无监督微调的预训练模型。

路线图

  •  开源 4 万小时基础模型和 spk_stats 文件。
  •  支持流式语音输出。
  •  开源 DVAE 编码器和零样本推理代码
  •  开源具有多情感控制功能的 4 万小时版本。
  •  ChatTTS.cpp (欢迎在 2noise 组织中新建仓库)。

数据统计

相关导航