从模型体验到开发训练,本文将演示如何通过modelscope魔搭体验达摩院预训练模型,并手把手演示定制一款语音合成模型的训练过程。
目前达摩院语音实验室在ModelScope魔搭社区已经上线了13个语音合成模型,其中男女声发音人模型各4个,多发音人模型5个,整体MOS评分在4.5分左右,达到了接近真实录音的水平,模型支持中文、英式英文、美式英文、中英混这几类语言,适用于朗读、视频配音等多种场景。
?定制步骤?
Step 0. 登陆ModelScope账号☝,未登陆无法使用定制功能
Step 1. 录制音频?,点击下方音频录制并朗读左上角文字, 请至少录制10句话
Step 2. 点击 [开始训练] ⏳,启动模型训练,等待约10分钟
Step 3. 切换至 [模型体验] ?,选择训练好的模型,感受效果
?友情提示?
? 已支持英文合成
? 朗读时请保持语速、情感一致
? 尽量保持周围环境安静,避免噪音干扰
? 建议佩戴耳机,以获得更好的录制效果
