OOO

 

无责任自制品堆放地
博主对站内物可能引起的任何问题不负任何责任

UTAU合成器简介(2015-10-14)

 UTAU的合成器即工程设定里的 Tool 2 (resample) ,顾名思义即对音源文件进行变调变速的重采样引擎,很大程度上决定了合成声音的质量。

1. 由UTAU作者飴屋开发的引擎

# resampler
默认合成器,依赖于.frq中间文件(基频表),初次合成时自动生成。
flag参数的简单说明:

g:性别
t:音高微调
B:Bre,气息
b:共振峰滤波后的Bre
Y:子音固定范围外的Bre
H h:低通滤波
F L:共振峰滤波相关
C D E c:都是频域滤波
P:音量峰值压缩
W:不明


# fresamp
依据说明文档,“resamplerは最小接続単位が可変なのに対してfresampは固定frame単位处理。”(这句不造怎么翻译
大概是所有引擎里合成速度最慢的,flag参数调起来比较复杂。

# phavoco
基于Phase Vocoder的非常规合成器;
听感大概类似于自带chorus效果。

# model4 (m4)
非公开,搞不到就不讲了。

# world4utau (w4u)
飴屋所作,基于 world 0.0.4。
由于world的特性,会生成超过原采样十数倍的庞大中间文件(.dio、.platinum、.star)。
听感较其他引擎更为浑厚。

2. 第三方引擎

# bkh01
Zteer所作。依据说明文档,是以将原采样的声带音与噪音成分分解重组的形式进行合成,仅适应solo音源,不适用合唱类音源,合成中不生成中间文件,但首次运行会生成bkhnoise.dat。
听感上比较平滑,有时会有种不知如何形容的类似于憋嗓的微妙感觉,但倒是人力之类极渣音源的救星。
公开地址:https://z-server.game.coocan.jp/utau/utautop.html

# TIPS
ScientistB所作。依据说明文档,基频检测范围及精度低于resampler,合成波形的时间点相对原音设定标记可能有数毫秒之差。
会生成.pmk格式的中间文件(基频表)。
听感基本和world系一样,我也不知道是不是错觉。
公开地址:https://scientistb.blog42.fc2.com/

# VS4U
あっきー(ackie)所作,全名是VocalShifter for UTAU。
会生成.vs4ufrq格式的中间文件,另外最新版在XP上似乎无法使用。
公开地址:https://ackiesound.ifdef.jp/download.html#vs4u

# RUCE
开源歌声合成项目Rocaloid所释出的UTAU兼容引擎,目前只支持单独音的分析合成,不完全支持UTAU音源标记。
由于不识别offset和cutoff标记,需要对原音作额外处理、切除头尾静音后才可正常使用。
由于不识别Cosonant(子音固定范围)标记,无法进行Cosonant velocity的常规调整(理论上可用自有参数调整辅音速度,但感觉有bug)。
首次合成时不能像其他引擎般自动产生合成所需中间文件(.rudb),需事先手工生成。
好处是针对复合元音有韵尾识别机制,在不采用任何拆音方案的情况下,中文单独音的合成效果是最好的。
公开地址:https://www.rocaloid.org

# EFB-GW
森勢将雅所作,全名是 Eternal Force Blizampler - Gently Weeps (此处有宅梗)
基于WORLD(由森勢将雅所开发的音声分析处理合成系统,目前采用修正BSD协议开源发布,前期似乎是GPL)。
单独音专用,而loop式的拉伸方式使之无法应用于中文复合元音。
现已停止公开。

# EFB-PB / EFB-GT
Custom.Maid所作,全名分别是 Eternal Force Blizampler - Phantom Blood 和 Eternal Force Blizampler - Galaxy Tear (好宅…)
改造版EFB-GW,升级WORLD模块到0.1.2,改造以适应连续音,PB和GT的区别是GT直接读取resampler的.frq基频表,PB则使用改造的.dio。
但依然是loop式拉伸,无法应用于复合元音。
flag方面只兼容resampler的P, t。
公开地址:https://custom-made.seesaa.net/

# WARP
Custom.Maid所作,应该是 EFB-PB / EFB-GT 系列的升级版,扩充了flag支持。
公开地址:https://custom-made.seesaa.net/

# tn_fnds
Zteer所作,基于EFB-GW,参考了world4utau。
不产生中间文件,合成速度飞快,但部分音源的高低音会破(twitter上的@chiteico放过修改办法)。
默认以loop方式拉伸,可用e参数改为普通线性拉伸。
公开地址:https://z-server.game.coocan.jp/utau/utautop.html

# Moresampler
Kanru Hua所作,重采样(resampler)和波形操作(wavtool)二合一。UTAU默认的wavtool在波形结合方面是有一点小问题,不过其实有wavtool4vcv和wavtoolex可以替用。
会生成.llsm格式的中间文件,体积和world的.star有一拼,不过生成过一遍后合成速度飞快。
既然和Rocaloid有关,那合成质量大概差不多?总算不用编辑原采样了。
支持16~192KHz、8~32位的音源。支持flag不明。
公开地址:https://web.engr.illinois.edu/~khua5/moresampler/

3. 其他

# utaugrowl
growl(扯着嗓子喊)效果工具,非独立合成器,需配合其他引擎使用。

# v.Connect-STAND
随开源歌声合成系统Cadencii释出的歌声合成引擎,可应用于UTAU音源。
目前也是使用了WORLD,貌似还是loop式拉伸。

# nakloid
慶應義塾大学的斎藤(博)研究室所开发的基于TD-PSOLA的开源歌声合成系统。
本身是独立程序,不能为UTAU调用,但可使用UTAU工程文件(部分参数兼容)和音源进行合成。
没有GUI,无法进行精细调声,只能设定部分全局参数。


参考文章:

UTAU用エンジン:https://www20.atwiki.jp/utaou/pages/65.html

评论(1)
热度(23)
  1. 共2人收藏了此文字
只展示最近三个月数据

© OOO | Powered by LOFTER