本网站尚在撰写,内容尚不完善。点击这条通知可跳转到本站前身——哈鲁鲁的UTAU教程站。

UTAU声库文件夹内容说明

这篇文章会具体说明UTAU声库文件夹是由哪些文件构成的,以及这些文件分别都有什么作用
如果你在试图解决安装UTAU声库文件夹时的编码、乱码问题,请阅读这篇文章

声库文件

UTAU声库文件夹里必须要包含这些文件才能正常运行:
①wav格式的音频文件、②名称为oto.ini的原音设定配置文件、③frq格式的周波数表文件。

①wav格式的音频文件

UTAU声库文件夹中的wav格式音频文件

声库中的wav音频文件是声库的原始音频素材,合成歌声时的核心部分。一般每音阶有200~1000个。
如果缺失,会导致声库不出声、或是部分音符不发声。

音频素材通常为单声道、16位深、44100Hz、705kbps的wav格式音频文件

日语声库文件名多为日语平假名,有时也会使用罗马音
如果在简体中文环境下使用日语声库,需要保持乱码文件名,例如:_偝偝偡偂偝偡.wav
中文、英文声库文件名多为英文字符,无需根据系统环境更改。

原始音频素材不能在UTAU里直接编辑,但可以使用其他音频编辑软件修改,例如降噪或其他加工。
请注意:修改音频文件可能会违反声库的使用规定,也可能造成声库无法使用。请查阅声库的使用规定,做好备份后再进行修改。

  • 修改音频可能会违反声库的使用规定,尤其是做出变声等重大改动时。
    请查阅声库的使用规定后再作出修改。
  • 修改音频时不可以改动音频文件的时间轴,例如删除空白部分。这会导致原音设定错位。
  • 修改音频之后可能需要重新生成周波数表文件。
  • 绝大多数UTAU声库都不允许随意发布修改过的声库。
    如果你想发布修改后的声库,请查阅声库的使用规定,联系声库作者取得相应的许可。
除了.wav格式之外,也能见到以.aiff作为音频素材格式的声库,但非常罕见。

名称为oto.ini的原音设定配置文件

原音设定,文件名为oto.ini,是声库的重要配置文件。
原音设定中记录着每段音频文件的时间轴、发音记号等信息,如果缺失会导致声库发生时间轴相、发音记号关的错误。例如:跑拍、合成接续处不自然、唱错词等。

原音设定中的文本内容应当与声库文件名保持一致。
例如,文件名形如_偝偝偡偂偝偡.wav的声库,应该能在原音设定文件中找到形如:_偝偝偡偂偝偡.wav=….. 的内容。

原音设定可以在UTAU里随时打开、编辑。
除了UTAU本体之外,也有专门的软件可以用于编辑原音设定,例如Setparam。

可以说是因为有这个文件存在,才能将音频文件的集合变成可以使用的声库。

frq格式的周波数表文件

周波数表是记录每段音频素材音高信息的文件。大部分声库会附带一组完整的frq格式文件。
周波数表缺失时,部分引擎会尝试重新生成,例如默认引擎resampler。
如果引擎不具备生成周波数表的功能,在周波数表缺失时会无法发声。

周波数表文件应当和wav音频文件一对一成对存在,且拥有相同的文件名。
例如,文件名形如_偝偝偡偂偝偡.wav的声库,应该能在文件夹中找到文件名为:_偝偝偡偂偝偡.frq的周波数表,数量也和wav音频文件一致。

周波数表可以在UTAU里随时打开、编辑,也可以批量重新生成。
除了UTAU本体之外,也有专门的软件可以用于编辑周波数表,例如frqeditor。

除了frq外,不同的引擎会生成不同格式的周波数表。
例如TIPS会生成.pmk格式的文件,moresampler会生成.llsm格式的文件。
这些不同格式的周波数表会随着使用不同的引擎自行生成并留在声库文件夹里。

和音频文件、原音设定不同,周波数表可以比较简单地批量生成,即使遗失也不会造成毁灭性的问题。

多音阶声库

多音阶声库包含多组不同音高的声库文件,会按照不同的情况分别调用不同的音频文件。
为了防止文件名冲突,多音阶声库一般会将每组声库文件(wav文件+frq文件+oto.ini)分别存放在多个文件夹中,而不是直接放在根目录下。

即使多音阶声库的根目录里并没有音频文件和周波数表,但仍然会有一个空的oto.ini文件出现在根目录。
这是正常的,请不要删除它。

prefix.map

prefix.map是控制多音阶声库的配置文件,用于记录在不同的音高使用哪组声库文件。
prefix.map一般放置被在声库根目录,可以在UTAU里随时打开、编辑。

多音阶声库是如何运作的?

观看这个视频的后半部分,可以清晰地了解到多音阶声库是如何运作的。

辅助文件

除了上述的必要文件之外,声库文件夹里还可能会包含这些文件
①presamp.ini、②头像图片、③character.txt、④readme.txt、⑤其他
即使没有这些文件声库也可以运行,但它们的存在让声库更完整。

下面是这些文件的作用:

presamp.ini

presamp.ini一般出现在CVVC声库(特别是非日语的CVVC声库)中。
这个文件中记录着有关该CVVC声库的拆解、拼接方案,便于第三方插件自动化。
在使用第三方自动拆音工具,例如autoCVVC、presamp时,会用到它。

character.txt、readme.txt、头像图片

这些文件会共同组成声库信息窗口里的内容。
很可惜的是,这部分内容在简体中文环境下会乱码。

乱码情况如图所示。
所幸这部分并不会影响声库正常运行,可以根据你的习惯做出选择。

如果你喜欢直接点开txt文件查阅内容,可以将txt文件转成正常编码。
如果希望在UTAU里点开时好看一点,就保持txt文件里的乱码吧。

头像文件

一般为.bmp或.jpg格式,100x100px的图片文件。
不支持.png格式。

character.txt

包含声库名、头像图片路径等信息。
显示在信息窗口的上半部分。

name=声库名称,除了信息窗口外还会影响音源列表显示的名称。
image=头像文件名,支持bpm和jpg,不支持png。
sample=点击sample框时播放的音频文件名,支持wav和mp3。未指定则随机播放素材音频。
author=作者名
web=网站地址

范例

name=デフォ妹
image=defotan.bmp
sample=otone.mp3
author=ameya & AquesTalk
web=http://utau2008.web.fc2.com/

readme.txt

包含说明文字,具体内容根据具体声库而有所不同。
显示在信息窗口的下半部分。

其他文件

除了上面说的这些文件之外,有时作者还会赠送一些其他文件,例如角色立绘等等。
这些文件没有固定的文件名或格式,只是额外的赠品,也不会影响声库的使用。

タイトルとURLをコピーしました