Quartz 5

❯

❯

Transformer

Properties1

tags	deep-learning, attention, sequence-modeling

Jun 28, 20261 min read

Transformer

Transformerは、Scaled Dot-Product AttentionとMulti-Head Attentionを中心に構成される系列モデルである。 Encoderのみで分類に使え、Encoder-Decoder構成で系列生成に使える。

実数値TransformerのAttentionは、通常次で表される。

A tt (Q, K, V) = σ (\frac{Q K ^{T}}{d _{k}}) V .

複素値Transformer構成要素は、この構成を複素値信号へ拡張する。複素領域では $Q K^{T}$ と共役内積が一致しないため、複素内積の実部を類似度として使う設計が検討される。

関連リンク

複素値Transformer
複素値Attention

Graph View

Transformer
関連リンク

Backlinks

複素値Attention
index
Building Blocks for a Complex-Valued Transformer Architecture

Created with Quartz v5.0.0 © 2026

GitHub
Discord Community