基于so-vits-svc的音色转换
只需输入音频文件,简单调节参数,即可在数分钟内*转为堡酿音色。
模型选用高质量数据集进行4万+步训练,输出音频采样率为44100hz,支持自动预测音高f0**,忠实还原堡酿本音。
*具体时长因设备而异**仅限语音转换
基于so-vits-svc的高质量音色转换工具