Residual Vector Quantization
一言でいうと: Residual Vector Quantizationは、量子化誤差を次段のコードブックで順に補正することで、限られたコード数でも高精度な離散表現を得る量子化手法である。
RVQでは、最初のコードブックで入力ベクトルを近似し、残った誤差を次のコードブックで量子化する。 この処理を複数段に重ねることで、単一コードブックより細かい表現を構成できる。
EuleroDec論文では、エンコーダ出力を複素値のままRVQへ入力する。 距離計算にはHermitian内積に基づくユークリッド距離を使い、複素セントロイドを段階的に選ぶ。 この設計により、音声スペクトログラムの振幅と位相の結合を量子化後も保つ。