声音克隆和文本转语音

基于 F5-TTS 的智能语音合成系统

声音克隆

上传音频样本,克隆声音特征

支持 MP3, WAV 等格式,最大 10MB
便于识别和管理,最多50字符

文本转语音

输入文本,直接生成语音

从声音克隆生成的模型中选择