MerlinのTensorFlowDNN構造まとめ

目的

音声合成ツールMerlinのTensorFlow使用時のデフォルトのDNNの構造を調べる。

方法

logに構造に関することが吐き出されていなかったのでTensorFlowコードとconfigファイルを直接確認した。src/tensorflow_lib/train.pyegs/slt_arctic/s1/conf/にあるconfigファイルを参照した。

結果

デモ フル
隠れ層数 4 6
隠れ層ユニット数 全て512 全て1024
隠れ層活性化関数 全てtanh 全てtanh
出力層活性化関数 線形 線形
オプティマイザ Adam法 Adam法
損失関数 2乗誤差 2乗誤差
バッチサイズ 256 256
ドロップアウト × ×
RNN × ×

ただしこれらは比較的容易に変更できる。