Wusound悟声 - 使用指南
开发者文档返回悟声首页
开发者文档返回悟声首页
  1. 入门
  • 入门
    • 概览
    • 快速开始
    • 算法介绍
  • 语音克隆&角色管理
    • 概览
    • 瞬时克隆
    • 专业克隆
    • 管理角色
    • 注意事项
  • 语音合成
    • 概览
    • 项目管理
    • 内容编辑
    • 生成配置
    • 任务队列
    • 任务详情
  • 故障排除
    • 概览
  • 政策与规范
    • 服务协议
    • 账号协议
    • 账号注销协议
    • 隐私保护声明
  1. 入门

快速开始

了解如何在悟声中注册并生成您的第一条语音

账号注册#

悟声账号#

您只需通过您的手机号与您指定的密码即可进行登录或注册,并开始使用悟声的所有服务。当您在未登录状态下访问悟声首页时,您将可以看到登录/注册模块。点击登录或任意功能时,您即可看到通过手机号及密码进行登录的输入框;若您还没有进行过注册,只需点击登陆框页面下方的注册按钮即可开始进行注册流程。

注册奖励#

在您通过任意方式初次登录悟声后,您将免费获得1500点数以供您体验我们的各类服务。您可以通过每日签到来免费领取更多点数,或者通过付费来大量购买更多点数。

创建角色#

除了使用市场角色外,您还可以在角色管理页面中创建一个角色,并为其上传或录制音频样本后,通过该自定义角色来进行语音生成。
您也可以在配音工作室页面中选择角色时的弹窗中选择"创建新角色..."按钮来召唤出角色创建面板,并用其来创建一个角色。
样本质量比长度更重要。有噪音的样本可能会产生不好的结果,请尽可能提供高质量的样本语音。目前,样本语音长度需大于2秒,且文件大小不超过20M。您也可以通过一些音频编辑软件的人声分离/音频降噪/人声美化/响度标准化等功能来尝试从任意音频中获得较高质量的人声音频样本。
V2 系列版本的算法版本(V2.9) 仅支持中文与英文,使用 V2 系列版本时请确保输入的文本中不包含任何非中英文字符,例如日文韩文等,否则可能会导致生成失败等问题
自 V3 系列开始,我们除中英文外新增粤语、日语、韩语、法语、德语、西班牙语及葡萄牙语,以及这些语言的共计30余种口音变体;请确保您使用的算法版本及文本内容输入符合对应的支持能力。

语音生成#

在您拥有了第一个角色以后,您就可以在配音工作室页面中开始生成您的第一条语音了。

内容编辑#

查看详细介绍
您只需在页面中的文本输入框中分配一个角色,输入任意文本,即可开始语音生成,如果您需要优化多段文字,您可点击添加段落按钮进行增加,也可以通过自动分段添加粘贴您需要的内容并点击添加,系统将会自动对您的文本进行拆分,并逐条添加到上方的列表中。
在这之后,您还可以对列表中的每个条目进行单独编辑、分配角色、调整顺序、删除内容、向下插入等操作。
目前每个段落最多可输入 1200 字符。由于每次修改单个段落的内容都需要重新生成对应段落,如果您在使用过程中可能需要频繁调整,我们建议您将单个段落中的内容长度控制在 50 到 100字以内,并保持为单个或几个完整连贯的句子,不包含多余换行或额外空格。这样可以便于优化音频细节和进行后续编辑。
V2 系列版本的算法 (V2.9) 仅支持中文与英文,使用 V2 系列算法时请确保输入的文本中不包含任何非中英文字符,例如日文韩文等,否则可能会导致生成失败等问题。
自 V3 系列开始,我们除中英文外新增粤语、日语、韩语、法语、德语、西班牙语及葡萄牙语,以及这些语言的共计30余种口音变体;请确保您使用的算法版本及文本内容输入符合对应的支持能力。

生成参数配置#

查看详细介绍
在完成内容编辑后,您就可以在页面段落的齿轮处(每个段落的下方)中进行生成配置的调整。
生成预设对于最终生成的效果会有很大影响,我们预先配置了较为均衡的预设作为默认设置,如果您需要调整,可通过切换不同的预设,找到对于您来说最合适的效果。
许多情况下,您可以先尝试使用默认参数的配置进行生成,若未能达到您预期效果再考虑进行调整。
可手动调整的高级生成设置
生成预设:用于控制语音在生成时采用的表现策略,决定语音在听感上的基础表现力。不同的生成预设侧重不同的参数方向,能够决定输出语音与文本之间的理解表现力(例如,使用均衡预设,语音将平衡发音表现和文本理解的表现,贴合内容的理解,而使用创意类预设,语音将基于文本的语境,展现出更具有表演色彩的发音方式,在应对不同场景时会有较为独特的效果。)
情感风格:针对生成时输入的内容,不同的风格偏向将在处理时优化理解和还原不同的细节部分,选择偏向文本时,将根据输入文本的语义完善结果细节,更符合文本语境;选择偏向角色时,将更注重还原声音角色样本的直接表现力。
生成种子:控制生成时的随机性,相同的种子会在生成时产生相似的结果,这个值可由 1至 2147483647 的整数。默认设置为-1 时完全随机。通常不需要调整。
语速:控制生成语音的速度,值越大,语速越快,可调整为0.5x到2x之间的数值,1为正常语速
V3.0 系列算法新增的独特配置
在 V3.0 系列算法中,我们新增了一些独特参数,分配有 V3.0 算法角色的段落将可额外控制以下设置:
语言选择:指定段落中内容的语言。默认情况下系统可自动识别输入内容的语言,如出现识别不够精准的情况或您输入的语言为粤语时,请手动选择语言。(目前暂时无法自动识别粤语内容)
生动表达:支持为单个段落单独启用“生动表达”选项。启用后,算法将基于对内容的理解拓展表现范围,使语句更具表现力和感染力(对需要较强表现力的内容效果最佳),但可能降低生成稳定性。
情感比例:这一功能参数能够让您调节段落发音的情感倾向,启用该功能后,您可手动指定情感比例,包括生气、开心、中立、难过、匹配上下文几种,算法将根据设置的比例尝试以对应情感表现进行发音,具体效果因不同样本可能区别较大,且可能降低生成稳定性。
一致性优化:实验功能,启用后将优化汇集在单个段落中的长篇内容生成效果,提升一致性与连贯性,但可能降低表现力。对于文本内容的编辑,可参见内容编辑进行了解。
后处理模式:实验功能,该项目控制输出优化策略,默认将针对角色声音的还原度进行优化。此外,不同的选项可调节最终音频的听感表现,您可根据需要来尝试调整此项设置。
在最新的配置模板下,您只需在输入内容并分配角色后,点击下方的开始生成按钮即可提交语音生成任务,并能够实时观察到生成的进展,以及快速试听段落和整体的效果。

任务队列 #

查看详细介绍
您可以在此处查看并管理您正在进行中的生成任务,以及所有历史任务的状态。任务的状态将实时更新,您无需手动刷新。在您开始了一个新的生成任务后,您可在编辑器中看到每个段落的任务状态,在打开任务队列后(时钟图标),您的最新任务将出现在列表最上方。
您可以点击查看列表中每个任务的详情,播放每个任务的最终生成结果(如果有),或在每个任务的下拉菜单中快速进行音频下载、复制到编辑器、删除任务历史等操作。
每个段落的任务记录是可独立查看,方便您进行单个段落的调整。
您可以在项目的编辑器中看到看每个段落的生成状态,并单独播放或下载某个段落的音频。我们还支持对单个段落进行重新生成,且不会影响其它段落的状态。
修改于 2025-11-26 01:31:33
上一页
概览
下一页
算法介绍
Built with