您可以在此了解关于如何创建角色并进行语音克隆的更多信息,并获得各种使用提示您可以通过创建一个角色,并为其上传或录制一段简短的音频样本,来进行瞬时语音克隆。您也可以通过提供1-60分钟的音频样本,来在3-60分钟内完成专业语音克隆。随后,您就可以在语音合成中将这些角色分配给不同的文本,来让AI使用这些角色的声音进行朗读。目前,您可以通过角色管理页面的"添加角色"按钮,或者在配音工作室页面中选择角色时的弹窗中选择"创建新角色..."按钮来召唤出角色创建面板,并用其来创建一个角色。瞬时克隆#
瞬时克隆允许您几乎瞬时地从非常短的样本中克隆一个声音。需要说明的是,瞬时克隆的基本原理并不是根据提供的声音样本创建或训练一个新的数据单元,而是让AI根据其曾经学习过的海量数据来合理地进行推测和模仿。我们的算法经受过大量常规语音的训练,因此对于大部分自然的语音处理理论上十分有效。然而,我们的算法依然存在一些不完美之处,如果您提供的声音样本较为独特,我们的AI曾经没有学习过类似的声音,则可能导致较差的生成结果,或无法较好的复刻该声音。目前,对于我们各个算法版本的具体介绍、缺点与局限性,请参见算法介绍样本质量比长度更重要。有噪音的样本可能会产生不好的结果,请尽可能提供高质量的样本语音。目前,样本语音长度需大于2秒,且文件大小不超过20M。您也可以通过一些音频编辑软件的人声分离/音频降噪/人声美化/响度标准化等功能来尝试从任意音频中获得较高质量的人声音频样本。
专业克隆#
通过专业级语音克隆,您只需提供一分钟或更长(最长支持60分钟)的声音样本,我们的AI将会在3-60分钟内深入训练学习您所提供的声音样本的每一个语调、发音方式、节奏、韵律等各项细节,实现与原声无法区分的顶尖克隆合成效果,并同时保留悟声语音合成算法的语言理解力、情感表现力等所有尖端特性。V2 系列版本的算法(V2.9) 仅支持中文与英文,使用 V2 系列时请确保输入的文本中不包含任何非中英文字符,例如日文韩文等,否则可能会导致生成失败等问题。自 V3 系列开始,我们除中英文外新增粤语、日语、韩语、法语、德语、西班牙语及葡萄牙语,以及这些语言的共计30余种口音变体;请确保您使用的算法版本及文本内容输入符合对应的支持能力。