A Power-Weighted Noncentral Complex Gaussian Distribution

@misc{nakashika2026powerweightednoncentralcomplexgaussian,
      title={A Power-Weighted Noncentral Complex Gaussian Distribution}, 
      author={Toru Nakashika},
      year={2026},
      eprint={2603.26344},
      archivePrefix={arXiv},
      primaryClass={stat.ML},
      url={https://arxiv.org/abs/2603.26344}, 
}

BibTeX source

一言でいうと: Power-Weighted Noncentral Complex Gaussian Distributionは、複素値スペクトルの振幅と位相の結合を保ちながら、ガンマ分布やRice分布を含む柔軟な振幅・パワー分布を得るための複素平面上の確率分布である。

背景と目的 (Background & Objective)

複素ガウス分布は、音声スペクトル、通信信号、複素波動の基本モデルとして広く使われてきた。 しかし、円対称な複素ガウスモデルは振幅と位相を独立に扱いやすく、短時間音声スペクトルに現れる調波構造や位相の偏りを表しにくい。

一方で、ガンマ分布、Rice分布、Nakagami分布、非心ガンマ分布などの振幅分布は、振幅やパワーの非ガウス性をよく表す。 しかし、それらの多くは高次元超球面上の振幅モデルから導かれ、観測値が本来持つ複素平面上の幾何を直接扱わない。

この論文の目的は、複素平面上で定義され、振幅と位相の結合を保ちながら、音声スペクトルの多様な裾の重さを調整できる確率分布を構成することである。

提案手法 (Proposed Method)

提案分布は、power-weighted noncentral complex Gaussian distributionとして定義される。 複素変数 、平均 、分散 、形状パラメータ に対し、密度は次で与えられる。

PDFから直接抽出した上の密度図は、形状パラメータや平均の変化により、原点集中と位相方向の弧状拡散が変わることを示す。

ここで はガンマ関数、 はLaguerre関数である。 のとき、この分布は通常の非心複素ガウス分布に一致する。

極座標 で見ると、振幅と位相の同時分布には の交差項が現れる。 そのため、位相の条件付き分布はvon Mises分布に比例する。

振幅分布は次の形になる。

この振幅分布は、 でRice分布、 かつ でNakagami分布を含む。 また、Rayleigh分布や片側正規分布も特殊ケースとして現れる。

パワー へ変数変換すると、形状 、rate 、非心度 によるパワー分布が得られる。

のとき、この分布は通常のガンマ分布になる。 また、Poisson型離散分布とガンマ分布の混合としても書けるため、サンプリングは離散近似またはMetropolis-Hastings法で実装できる。

実験と評価 (Experiments & Evaluation)

実験では、TIMIT TEST setの各dialect regionから男女1名ずつ、合計16話者を選び、各話者の SA1.WAV を用いた。 STFTにより複素スペクトルを得て、その二乗振幅をパワーとして扱った。 局所的な統計構造を評価するため、スペクトログラムを3周波数bin、20時間フレームの小パッチに分割し、各パッチの平均対数尤度を比較した。

比較対象は、指数分布、ガンマ分布、非心ガンマ分布、提案パワー分布である。 指数分布は閉形式の最尤推定で、その他は準Newton法でパラメータ推定された。

モデル平均対数尤度片側対応ありt検定のp値
Exp263.94< .0001
Gamma290.76< .0001
Gamma’290.98< .0001
Proposed291.03-

提案分布は全話者で最も高い対数尤度を示した。 ただし、ガンマ分布や非心ガンマ分布との差は小さい。 論文はこの理由を、評価がパワーのみに基づき、複素位相の方向構造を捨てているためだと説明する。

貢献と限界点 (Contributions & Limitations)

貢献は、複素平面上で直接定義される非心かつ形状可変な複素分布を与えた点にある。 導出された振幅分布とパワー分布は、Rice分布、Nakagami分布、Rayleigh分布、ガンマ分布などを統一的に含む。

理論面では、サンプリング法、次モーメント、平均、分散、モーメント母関数、尖度の性質が導出される。 特にパワー分布の 次モーメントは次で与えられる。

限界は、実験が音声パワースペクトルの尤度比較に留まり、複素値分布そのものの位相構造を十分に評価していない点である。 したがって、複素スペクトル全体を用いた生成モデルや分離モデルでの有効性は今後の検証課題である。

関連リンク