TIMIT
TIMITは、英語音声コーパスである。 べき重み付き非心複素ガウス分布論文では、TEST setからdialect regionごとに男女1名ずつ、合計16話者を選び、音声パワースペクトル分布の尤度評価に使われた。
実験では、各話者の SA1.WAV をSTFTで処理し、二乗振幅をパワーとして扱う。
スペクトログラムは3周波数bin、20時間フレームの小パッチに分割され、局所的な対数尤度の平均が評価された。
TIMITは、英語音声コーパスである。 べき重み付き非心複素ガウス分布論文では、TEST setからdialect regionごとに男女1名ずつ、合計16話者を選び、音声パワースペクトル分布の尤度評価に使われた。
実験では、各話者の SA1.WAV をSTFTで処理し、二乗振幅をパワーとして扱う。
スペクトログラムは3周波数bin、20時間フレームの小パッチに分割され、局所的な対数尤度の平均が評価された。