2018-03-01から1ヶ月間の記事一覧

MerlinのDNNモデルを記述したコードの解説

概要 音声合成ツールMerlinのDNNモデルを記述したコードの解説。 Theano 学習を促すのはsrc/run_merlin.py151行目のtrain_DNNメソッド。その244行目での記述によるとモデルはsrc/models/deep_rnn.pyのDeepRecurrentNetworkクラスによって生成される。 ※名前…

統計的音声合成について(HMM音声合成)

https://static.googleusercontent.com/media/research.google.com/ja//pubs/archive/44312.pdf 上のスライドを文章としてまとめたもの。まずは前半部分のHMM音声合成について。 人間の発声の仕組み 下の図は同スライドから引用した発声の仕組みについての図…

MerlinのTensorFlowDNN構造まとめ

目的 音声合成ツールMerlinのTensorFlow使用時のデフォルトのDNNの構造を調べる。 方法 logに構造に関することが吐き出されていなかったのでTensorFlowコードとconfigファイルを直接確認した。src/tensorflow_lib/のtrain.pyとegs/slt_arctic/s1/conf/にある…

MerlinのデモスクリプトをTensorFlowを用いて実行してみる

目的 音声合成ツールMerlinのデモスクリプトをTensorlFlowを用いる方法で実行する。 方法 configurationの設定にswitch_to_tensorflowがある。デフォルトでFalseになっているのでこれをTrueに変更したい。 egs/slt_arctic/s1/script/にあるprepare_config_fi…

Merlinが音響特徴量から波形を合成する過程について

目的 音声合成ツールのMerlinを動かす際の、ニューラルネットワークを用いて推定した音響特徴量から音声波形を合成する過程を調べる。 まずconfigについて 変数の設定についてはsrc/configuration/のconfiguration.py内に書かれており、クラス内メソッドのう…