球面投影
Published:
今天在看证明的时候看到一个细节,d维球面Sd−1上均匀分布的点x,向任意一个自然基ei=(0,0,…,1,…,0)做投影x⊤ei,问投影绝对值的期望$\mathbb{E}_{\mathbf{x}\sim \mathbf{U}(S^{d-1})}( | \mathbf{x}^{\top}\mathbf{e_i} | )$是多少。 |
文章中给出的证明是设$a_i=\mathbb{E}_{\mathbf{x}\sim \mathbf{U}(S^{d-1})}( | \mathbf{x}^{\top}\mathbf{e_i} | ),由于各向同性a_1=a_2=\cdots=a_d,并且\sum_i a_i^2=1,所以可以导出a_i=\frac{1}{\sqrt{d}}$。 |
a1=a2=⋯=ad这个是没什么问题的,但是后一个条件 ∑ia2i=1 我总觉得哪里有点不太对,于是尝试不使用这种整体式条件,直接从x⊤ei的分布入手来进行思考。
x在投影前在球面上均匀分布,(我这个傻瓜蛋) 粗略地去想很容易觉得投影之后在对应的坐标轴上也是在[−1,1]之间均匀分布,所以绝对值的期望直接就是$\mathbf{E} | \mathbf{U}(-1,1) | =0.5$ |
但是其实这是不对的,拿二维的半圆周(保证θ和x一一对应)往x轴上投影来说,因为半径r=1固定,所以当圆周角θ∈U[0,π]均匀分布时,对应的点也在半圆周上均匀分布,θ的密度函数等于fθ=1π。
借助x=cosθ,θ=arccosx这个关系和密度变换公式, x的密度函数为 fx=fθ(x)⋅|∂θ∂x|=1π⋅1√1−x2
这就表明x不是[−1,1]上的均匀分布了(密度函数12)。
既然算都算出来了,顺便就可以把绝对值的期望(半圆)给求一下了。
Ex∼fx(|x|)=∫1−1|x|⋅1π1√1−x2dx=2π∫10x√1−x2dx=2π所以整个圆周投影下来的绝对值的期望就是12⋅2π(上半圆)+12⋅2π(下半圆)=2π≈0.6366
二维的情况是这样,那d维的时候又是什么情况呢?
根据stack exchange上的这个回答,我们可以直接跳到一个中间结果 (中间的推导我放到最后了):
x⊤ei的密度函数正比于(1−t2)d−32
有了密度函数求绝对值的期望就好求了,记规范化常数为K,由密度函数积分为1,可以解出K然后代入期望的表达式。
∫1−1K(1−t2)d−32dt=1 E|x⊤ei|=K∫1−1|t|(1−t2)d−32dt=2Γ(d2)(d−1)√πΓ((d−1)2)
其实由密度函数的表达式在d=3的时候幂次消失,可以看出三维球面是唯一一个投影到坐标轴上得到的是均匀分布的特例,将d=3代入绝对值期望的表达式,算出来的值刚好也是0.5,但是d=2的时候是0.6366,d=4的时候是0.4244,跟均匀分布还是有不小的差距的。
由此我们就解决了第一个问题:均匀分布的d维单位球面往自然基上投影绝对值的期望是2Γ(d2)(d−1)√πΓ((d−1)2),而不是一开始那样简单粗暴证明出来的1√d。但是有趣的事情还没完,我们可以计算出各个维度的真实期望,把它与1√d做比较,可以得出下面这样一张图:
可以看到,我们精心算出来的真实值刚好被前面粗略计算出来的1√d给界住了,那么这一部分怎么证明呢?
我们利用这样一个式子(见《数学分析教程下(常庚哲,史济怀)P396 ),对任意的实数a,
lim利用这个式子,可以把原式中的\frac{\Gamma(\frac{d}{2})}{\Gamma(\frac{d-1}{2})}近似为\sqrt{\frac{d}{2}}。
此时原式变为\frac{\sqrt{d}}{\sqrt{2\pi}(d-1)},令t=d-1,则变为\frac{\sqrt{t+1}}{\sqrt{2\pi t}}\cdot \frac{1}{\sqrt{t}}。
在t>1上有\sqrt{\frac{t+1}{2\pi t}}<1, (因为t+1和2\pit的交点在(0,1)之间,交点之后都是斜率更大的2\pit更大了),所以整个真实值<\frac{1}{\sqrt{d}}。
附录
证明d维球面均匀分布的点\mathbf{x},在自然基\mathbf{e_i}上的投影的密度函数正比于\left(1-t^2\right)^{\frac{d-3}{2}}
首先引入一组随机变量来辅助我们的证明,设Z=\left(Z_1, \ldots, Z_d\right)^{\top} 是一组i.i.d服从N(0,1)的随机变量,由于Z具有旋转不变性,所以对其进行规范化后落在d维单位球面上的随机向量U=\frac{Z}{|Z|}就在单位球上均匀分布。所以等价地,我们只需要研究随机向量U在自然基\mathbf{e}_i上投影 T_i=\frac{Z_i}{\sqrt{\sum_i Z_i^2}}的分布。
注意到T_i^2=\frac{Z_i^2}{\sum_i Z_i^2}, 由于Z_i\ i.i.d \sim N(0,1),所以有Z_i^2\sim \chi^2(1),\sum_{i=2}^d Z_i^2\sim \chi^2(d-1)。
由Beta分布和卡方分布的关系:如果X\sim\chi^2(\alpha),Y\sim\chi^2(\alpha),则\frac{X}{X+Y}\sim \operatorname{Beta}\left(\frac{\alpha}{2}, \frac{\beta}{2}\right)可得
T_i^2\sim\operatorname{Beta}\left(\frac{1}{2}, \frac{d-1}{2}\right),所以对应的密度函数正比例于(t^2)^{-\frac{1}{2}}(1-t^2)^{\frac{d-3}{2}}
再次使用密度变换公式,乘上一个\frac{d t^2}{d t}=2t,则可以得到T_i的密度函数正比于(1-t^2)^{\frac{d-3}{2}}。