ATR音声コーパス

ATR音声コーパスは、Gamma-VAE音声表現の音声再構成実験で使われた音声データセットである。 同論文では、音声から振幅スペクトルまたは対数振幅スペクトルを抽出し、VAE系モデルで再構成した後、Griffin-Limまたは正解位相で波形へ戻して評価した。

複素値VAE論文でも、set Bの女性話者FTKの50文を訓練、53文をテストに使い、複素スペクトルのanalysis-by-synthesis評価を行っている。

関連リンク