複素値RBM
一言でいうと: 複素値RBM (CRBM) は、複素数値の可視層とバイナリ値の隠れ層を持ち、同一レイヤ内の接続を排す「制限付き」の構造を維持しながら、同一次元内の実部と虚部の相関(=位相関係)をモデル化可能な複素数拡張型のエネルギーベース確率モデルである。
概要
従来の制限付きボルツマンマシン (RBM) は、可視層・隠れ層ともに実数またはバイナリ値しか扱えなかったため、音声の複素スペクトルのように「振幅と位相」を同時に持つ複素数データを直接入力することができなかった。
複素値RBM (CRBM) は、可視層を複素正規分布(複素ガウス分布)に拡張することで、複素数データを直接扱うことを可能にする。
特徴と利点
-
同一レイヤ内接続の排除 (制限付き構造の維持)
- 従来の複素ボルツマンマシン (DUBMなど) はレイヤ内接続があり、パラメータ推定に困難があった。CRBMでは、同一レイヤ内の異なる次元(例: と , )の接続を排している。
- これにより、従来のRBMと同様に、コントラスティブ・ダイバージェンス (CD) やギブスサンプリングを用いた効率的なパラメータ学習が可能である。
-
実部と虚部の相関(位相関係)のモデリング
- 単に実部と虚部を結合して 次元の実数GB-RBMに入力する場合に比べ、CRBMはエネルギー関数内に実部と虚部の間の交差項(疑似共分散)を明示的に含んでいる。
- これにより、データの振幅情報だけでなく、**位相情報(実部と虚部の相関)**を高い表現力で学習・復元できる。
数学的定義
複素可視ユニット とバイナリ隠れユニット に対し、エネルギー関数 は次のように実数関数として定義される。
ここで:
- は可視バイアス、 は隠れバイアス。
- は可視・隠れ層間の複素数重み結合。
- は、共分散 と疑似共分散 からなる拡張共分散行列(対角行列)。
条件付き確率は以下のように定義される。
- 可視層の条件付き確率 (複素正規分布):
- 隠れ層の条件付き確率 (ベルヌーイ分布): ただし、。
関連技術
複素値RBMを用いた音声パラメータ化等のシステムでは、以下の技術と組み合わせて適用される。
- CPCA (Complex Principal Component Analysis: 複素主成分分析)
- 入力の複素スペクトルの高次元性を解消するために、事前に複素数領域で主成分分析を行い、次元を削減する。
- CAdam (Complex Adam)
- Wirtinger微分(複素勾配)に基づいて、最適化手法のAdamを複素パラメータ空間に拡張したもの。CSA (Complex Steepest Ascent) に比べて高速に収束する。
- 複素MLPG (Maximum Likelihood Parameter Generation)
- 静的・動的特徴量の関係性から、滑らかな複素数の軌跡(時系列)を最尤推定により生成する手法。