標本共分散行列の極限固有値分布のStieltjes変換が満たす方程式を導出する。簡単な計算をメモしておく。
\(N\times N\)行列の\(A_N\)の固有値分布\(F_A^N(x)\)とは、
\[ F_A^N(x)=\frac1N\sum_{i=1}^n1[\mu_i(A)\le x]\]
のことをいう。\(\mu_i(A)\)は行列\(A\)の\(i\)番目の固有値を表す。\(N\to\infty\)における固有値分布を極限固有値分布といい\(F_A(x)\)とかく。
行列\(B_N=X TX^\top/N\)の固有値分布を\(F_B^N(x)\)、行列\(C_n=T^{1/2}X^\top XT^{1/2}/N\)の固有値分布を\(F_C^n(x)\)とする。\(X\)は\(N\times n\)行列で\(\mathbb{E}[X_{ij}]=0\)、\(\mathbb{E}[X_{ij}^2]=1\)。\(T\)は\(n\times n\)正定値対称行列で\(n\to\infty\)において極限固有値分布\(H(t)\)をもつ。
固有値分布\(F_B^N(x)\)と\(F_C^n(x)\)の関係について次のことがわかる。まず\(N\ge n\)のとき、行列\(B_N\)の\(N\)個の固有値のうち\(n\)個は\(C_n\)の固有値と同一で、残りの\(N-n\)個はゼロとなる。従って、
\[ F_B^N(x)=\frac1N((N-n)\cdot1[0\le x]+n\cdot F_C^n(x))\]
\(N<n\)のとき、行列\(C_n\)の\(n\)個の固有値のうち\(N\)個は\(B_N\)の固有値と同一で、残りの\(n-N\)個はゼロとなる。従って、
\[ F_C^n(x)=\frac1n((n-N)\cdot 1[0\le x]+N\cdot F_B^N(x))\]
\(N,n\to\infty\)、\(n/N\to c\)の極限をとる。このとき、極限固有値分布\(F_B(x)\)と\(F_C(x)\)は次を満足する。
\[ \begin{align} F_B(x)&=(1-c)\cdot 1[0\le x]+c\cdot F_C(x)\\ F_C(x)&=(1-1/c)\cdot 1[0\le x]+(1/c)\cdot F_B(x) \end{align}\]
ここで、\(F_B\)、\(F_C\)のStieltjes変換:
\[ m(z)=\int_{0}^\infty\frac{dF(x)}{x-z},\quad z\in\mathbb{C}\setminus\mathbb{R}_+\]
\(m_B\)、\(m_C\)はStieltjes変換は、定義から次を満たす。
\[ \begin{align} m_B&=-\frac{1-c}{z}+cm_C\\ m_C&=-\left(1-\frac1c\right)\frac1z+\frac1c m_B \end{align}\]
2つの式の内容は一致するから以降\(c\)にの値による場合分けは必要ない。\(m_B\)が次の方程式を満たす。
\[ z=-\frac1{m_B}+c\int\frac{tdH(t)}{1+tm_B}\]
このとき、前述の\(m_B\)と\(m_C\)の関係から\(m_C\)の満たす方程式を導く。
まず、
\[ \begin{gather} z=-\frac1{m_B}+\frac{c}{m_B}\int \frac{tm_B}{1+tm_B}dH(t)\\ z=-\frac1{m_B}+\frac{c}{m_B}\int \frac{1+tm_B-1}{1+tm_B}dH(t)\\ z=-\frac1{m_B}+\frac{c}{m_B}\int\left(1-\frac{1}{1+tm_B}\right)dH(t)\\ zm_B=-1+c\int\left(1-\frac{1}{1+tm_B}\right)dH(t)\\ \end{gather}\]
\(H(t)\)は確率分布にもなっているため
\[ \int dH(t)=1\]
は認める。
\[ zm_B=c-1-c\int\frac{dH(t)}{1+tm_B}\]
ここに\(m_B=-(1-c)/z+cm_C\)を代入すると
\[ \begin{gather} z\left(-\frac{1-c}z+cm_C\right) =c-1-c\int\frac{dH(t)}{1+t(-(1-c)/z+cm_C)}\\ c-1+czm_C=c-1-c\int\frac{dH(t)}{1+t(-(1-c)/z+cm_C)}\\ czm_C=-c\int\frac{dH(t)}{1+t(-(1-c)/z+cm_C)}\\ m_C=-\int\frac{dH(t)}{z+zt(-(1-c)/z+cm_C)}\\ m_C=\int\frac{dH(t)}{(1-c-czm_C)t-z} \end{gather}\]
以上で\(m_B\)が満たす方程式から\(m_C\)が満たす方程式が導出された。以上をまとめると、
\[ \begin{gather} z=-\frac1{m_B}+c\int\frac{tdH(t)}{1+tm_B}\\ m_C=\int\frac{dH(t)}{(1-c-czm_C)t-z}\\ c\left(m_C+\frac1z\right)=m_B+\frac1z \end{gather}\]
参考文献
例えば以下がある。内容はそこらじゅうにあるが計算過程は簡単すぎるため載っていない。
J.W. Silverstein, Strong Convergence of the Empirical Distribution of Eigenvalues of Large Dimensional Random Matrices, Journal of Multivariate Analysis, Volume 55, Issue 2, 1995, Pages 331-339, ISSN 0047-259X, https://doi.org/10.1006/jmva.1995.1083. (http://www.sciencedirect.com/science/article/pii/S0047259X85710834)