MerlinのTensorFlowDNN構造まとめ
目的
音声合成ツールMerlinのTensorFlow使用時のデフォルトのDNNの構造を調べる。
方法
logに構造に関することが吐き出されていなかったのでTensorFlowコードとconfigファイルを直接確認した。src/tensorflow_lib/
のtrain.py
とegs/slt_arctic/s1/conf/
にあるconfigファイルを参照した。
結果
デモ | フル | |
---|---|---|
隠れ層数 | 4 | 6 |
隠れ層ユニット数 | 全て512 | 全て1024 |
隠れ層活性化関数 | 全てtanh | 全てtanh |
出力層活性化関数 | 線形 | 線形 |
オプティマイザ | Adam法 | Adam法 |
損失関数 | 2乗誤差 | 2乗誤差 |
バッチサイズ | 256 | 256 |
ドロップアウト | × | × |
RNN | × | × |
ただしこれらは比較的容易に変更できる。