OOO

 

无责任自制品堆放地
博主对站内物可能引起的任何问题不负任何责任

玩转Sinsy

心血来潮用Sinsy拗中文的的产物

合成音频示例:https://pan.baidu.com/s/1pJ3ank3
示例曲:墜ちない空/千秋诉

Sinsy全称是 HMM-based Singing Voice Synthesis System,即基于隐马尔可夫模型的歌声合成系统,是个开源项目。
目前有3个日语歌声(女性)和2个英语歌声(一男一女)可用,歌唱风格各不相同。

f001j謡子是比较传统美声的唱法,默认颤音略猛。
f002j香鈴好像没颤音,而且会轻微跑调……(why
  nico百科上说香铃有中文数据,说不定以后会支持中文?
f004j波音リツS,还在beta,噪音有点大,发音也不怎么自然,不过声线特征已经很明显。

输入形式是UTF-8编码的MusicXML乐谱,必须以休止符开头,支持参数有tie、slur、staccato、accent、dynamics、crescendo/decrescendo、breath、mark,支持合成7分钟以内音频。
日语方面,需要以平假名/片假名/发音记号标记歌词,支持延长音“ー”和促音“っ”,具体情况在官网有reference。英语可以直接输入单词,延长音是半角的“-”,单词内音节也可以用“-”断开。

声质也就是性别方面,大抵0.6~0.61左右可以变换为男声,0.53~0.55左右是比较正常的女声。
其他也没有什么可调的了。

关于Sinsy的架构原理什么的有兴趣可以看看这篇论文:Sinsy: 「あの人に歌ってほしい」を かなえるHMM歌声合成システム

评论(4)
热度(6)

© OOO | Powered by LOFTER