这篇文章将有针对性地介绍UTAU汉语普通话CV-VV声库,主要包括扩张整音、Syo式。
关于UTAU声库文件夹的综合介绍,请见:
汉语CV-VV声库
概要
UTAU汉语普通话CV-VV声库是:每次录制一个单字,以CV-VV形式拼接的声库。
此处的「VV」指汉语发音中的韵尾,例如「kai」「mang」等发音的末尾部分。
从录音方式的角度来说,可以将这类声库统一归类为汉语普通话单独音声库。
在2010年前后,曾经诞生过各种实验性质的UTAU汉语声库,如「沐音シン」「十月緒子」「王芳梅」等。然而,这些声库大多直接使用汉语发音单字作为素材,没有使用拆分韵尾的方法,因此在UTAU的框架下无法很好地兼顾发音完整性和采样长度。在今天,这种早期的声库形式被称为「整音」或「单音」。
而在2011年,「王芳梅」的作者ユー子提出,可以使用拆分韵尾音符的方式来保障发音完整性,并将使用了该手法的声库命名为「中国語連続音」。虽然在今天看来这个名称有些不准确,但依然可以认为是后续其他汉语CV-VV声库方案的雏形。
在这之后,有诸多创作者参与进UTAU汉语声库的开发,诞生了「B-hm」「Syo式」「扩张整音」等多种不同理念的CV-VV录音方案。而随着2013年大手组发布CV-VV声库合唱作品「明天会更好」,并整理了详尽的相关资料集一并发布,CV-VV形式的汉语声库得到了普及。
在这里,我们只介绍比较普及的两种声库方案:扩张整音和Syo式。
扩张整音
基本构成
扩张整音声库是:录制汉语拼音全部414个单字,以CV-VV形式拼接的声库。
扩张整音的录音表基于汉语拼音表,最初由「十月鬼」整理该录音表,因此又称「十月表」。
使用方法


汉语扩张整音声库需要将每个有韵尾的发音分割为两个音符,即CV部分和VV部分。
一般来说,CV部分使用的歌词格式为汉语拼音,例如「chang」「shun」;VV部分为独自的发音记号,例如「_an」「_en」。
VV部分的音符长度需要视声库实际情况调整,一般较短,约占一个8分音符~32分音符左右。
无韵尾的发音无需分割音符,直接使用汉语拼音即可,例如「ka」「su」。
音标表
常见的扩张整音拆音一览表。星号(*)意为辅音,方括号([])内为一个音符。
例如,「*ai:[*ai]+[_ai]」意为:当遇到kai、shuai等发音时,需将其拆分为「kai+_ai」「shuai+_ai」。
*a:不拆音 | *ai:[*ai]+[_ai] | *an:[*an]+[_an] | *ang:[*ang]+[_ang] | *ao:[*ao]+[_ao] |
*i:不拆音 | *in:[*in]+[_in] | *ing:[*ing]+[_ing] | (z/c/s)i:不拆音 | (zh/ch/sh)i:不拆音 |
*e:不拆音 | *ei:[*ei]+[_ei] | *en:[*en]+[_en] | *ie:不拆音 | *ian:[*ian]+[_en2] |
*o:不拆音 | *uo:不拆音 | *ou:[*ou]+[_ou] | *ong:[*ong]+[_ong] | er:[er]+[_er] |
*u:不拆音 | *v:不拆音 | *vn:[*vn]+[_vn] |
根据录音表的不同,可能会有微小的差异,例如「*ian」的韵尾也有可能使用「_en0」,而非表格中的「_en2」。
具体请查阅声库发布者提供的使用说明,或查看声库的原音设定。
歌词转换插件
汉语歌曲的UTAU工程文件一般使用未拆分音符的汉语拼音作为其歌词格式,以应对各式各样的声库。
此时,可以使用插件将歌词转化为需要的格式。
音频素材、周波数表文件名

扩张整音的音频文件大多以汉语拼音单字命名,例如「_shang.wav」。
扩张整音声库一般每个音阶包含约414个音频文件。
相关作品
使用汉语扩张整音声库制作的音乐作品
Syo式汉语声库
基本构成
Syo式汉语声库是:录制精简过的汉语拼音单字,以CV-VV形式拼接的声库。
Syo式的目的是简化汉语声库的录音量,根据简化程度的不同,有原版、宽式、严式共三个版本。
由于原版和宽式的使用人口极少,这里仅介绍普及最广泛的严式方案。
使用方法


Syo严式声库的使用方法和扩张整音相似,同样需要将每个有韵尾的发音分割为两个音符,即CV部分和VV部分。
但和扩张整音不同的是,有些CV部分需要使用独自的发音记号,例如「cha1」。
音标表
Syo严式声库的拆音一览表。星号(*)意为辅音,方括号([])内为一个音符。
例如,「*ai:[*a2]+[_ai]」意为:当遇到kai、shuai等发音时,需将其拆分为「ka2+_ai」「shua2+_ai」。
*a:不拆音 | *ai:[*a2]+[_ai] | *an:[*a]+[_an] | *ang:[*a1]+[_ang] | *ao:[*a1]+[_ao] |
*i:不拆音 | *in:[*in]+[_in] | *ing:[*ing]+[_ing] | (z/c/s)i:不拆音 | (zh/ch/sh)i:不拆音 |
*e:不拆音 | *ei:[*e2]+[_ei] | *en:[*e1]+[_en] | *ie:不拆音 | *ian:[*ie]+[_en2] |
*o:不拆音 | *uo:不拆音 | *ou:[*o]+[_ou] | *ong:[*o2]+[_ong] | er:[er]+[_er] |
*u:不拆音 | *v:不拆音 | *vn:[*v]+[_vn] |
歌词转换插件
汉语歌曲的UTAU工程文件一般使用未拆分音符的汉语拼音作为其歌词格式,以应对各式各样的声库。
此时,可以使用插件将歌词转化为需要的格式。
音频素材、周波数表文件名

Syo严式的音频文件和扩张整音相同,以汉语拼音单字命名,例如「_shang.wav」。
区别在于Syo严式的音频文件数量更少,一般每个音阶包含约323个音频文件。
相关作品
使用Syo严式声库制作的音乐作品