这篇文章将介绍有关声库制作方案(单独音、连续音、CVVC)的基础知识。
根据声库的种类,选择不同的使用方法
我们在下载声库时,常常看到「单独音」「连续音」「CVVC」等等字眼。
这些名词用于形容声库在制作时使用的制作方案。
在UTAU中,使用不同方案制作的声库需要以不同的方式使用:
有时需要使用不同的歌词格式,有时需要按照一定的规则将音符分割成元音、辅音。
如果使用方法不当,声库将无法发声,或是无法发挥本来应有的性能。
什么是单独音、连续音?
根据声库录音时采用的不同录音方案,我们可以将声库大致分类为「单独音」和「连续音」。
每次录制一个单字的声库叫做「单独音」声库,每次录制一串发音的声库叫做「连续音」声库。
注意!
面对网络上配布的声库,要具体问题具体分析,判断正确的使用方法。
如果你打算发布自己制作的声库,使用形似「VCV」「CV-VC」的方式来描述自己的声库会更加准确。
什么是CV、VCV、CV-VC?
根据使用声库时采用的不同拼接方式,我们可以将声库分类为「CV」「VCV」「CV-VC」,等等。
我们用「C」代表辅音,「V」代表元音,通过组合这两个字母,描述一个合成歌声时采用的拼接方式。
以「Sa」这个发音为例:
在「Sa」这个发音中,「S」是辅音,「a」是元音。
因为「Sa」由1个辅音和1个元音组成,所以是一段「CV」音频素材,也可称为「CV音素」。
CV声库

如果一个声库仅使用「CV」音素来拼接合成歌声,那么这就是一个「CV」声库。
大部分的UTAU日文单独音声库,都是CV声库。

CV声库使用的素材极少,无论是使用还是制作都非常简单。
然而与此同时,由于缺少单字和单字之间相连部分的素材,听起来拼接感较强,难以还原真实的人类歌声。
但也有人反过来利用这一点,刻意制作声音机械感强、不像人类的声库。
VCV声库

同理,如果一个声库仅使用「VCV」音素来拼接合成歌声,那么这就是一个「VCV」声库。
大部分的UTAU日文连续音声库,都是VCV声库。

VCV声库听起来圆润自然,但对于大多数语言来说录音量比较奢侈。而且语言越复杂,录音量就膨胀得越夸张。
我们能见到很多日语VCV声库,是因为日语是一种发音非常单纯的语言,使得日语VCV声库的录音量可以维持在一般人的接受范围之内。
但对于其他大多数语言来说,往往会需要面对非常巨大的录音量和极高的制作成本,声库体积也会变得非常巨大。
因此,我们很少见到日语以外的声库制作VCV形式的声库。
CV-VC声库

如果一个声库混合、组合使用「CV」「VC」两种音素来拼接合成歌声,那么这就是一个「CV-VC」声库。
除了自己写明是CV-VC的声库外,英语VCCV声库等变体也属于CV-VC声库的范畴。

如果调整得当,CV-VC声库可以听起来和VCV一样圆润自然,录音量也更小。
在UTAU上使用CV-VC声库时,需要将每个音符分解为「CV」「VC」两部分。由于音素的拼接点比CV、VCV声库更多,因此调声时也需要花费更多的精力。
如果调声时调整不当,或声库本身质量不佳,CV-VC声库会很容易出现破绽。
其他变体
除了最常见的「CV」「VCV」「CV-VC」声库之外,还有各种各样的变体方案。
例如,中文单独音声库为了对应中文发音中「韵尾(如“ai”)」的概念,需要在每个有韵尾的音拆成两部分,在CV音素的基础上拼接韵尾音素。这时,由于韵尾是一个「元音-元音」音素,因此可以将这类单独音命名为「CV-VV」声库。
如果理解了「C=辅音,V=元音」的规律,应该也不难理解这些变体方案。
在本站对于声库的说明中,如果遇到变体,也会对这些变体进行更加具体的说明。