コラム

Law of Large Numbers and Winners Take All

志村 隆彰(数理・推論研究系)

 大数の法則はかの広辞苑にも載っている立派な定理である。コインを何度も繰り返し投げたときの表の出る割合が1/2位になるようなことがその例で、視聴率、選挙予測などの社会調査をはじめ、統計が用いられる裏で大活躍している。その数学的定式化は、次のようになる。

大数の(弱)法則:
平均 μ,分散 σ2 の分布Fに互いに独立に従う確率変数 X1, X2,… と,任意のϵ>0 に対して,
 limnP(|(X1+X2+…+Xn)/n-μ|<ϵ)=1

 確率変数はランダムな現象を表すもので、コインの例では、Xkがk回目にコインを振った結果、表なら1、裏なら0とし、表裏(0と1)が同じように出るとすれば、それぞれの確率は1/2 となる。Xkの分布Fの平均 μ は出る数値とその確率をかけたものを足し合わせて、1×1/2 + 0×1/2 =1/2 と計算される。コインを一回投げたとき表が出る回数の平均は1/2という意味である(分布から決まる定数)。一方、(X1+X2+…+Xn)/nは一般に標本平均と呼ばれ、コインの例ではn回コインを投げたときの表が出た割合で、試行(確率的実験)の結果だから、ランダムである(試行のたびに違うことが普通)。つまり、大数の法則は、n(標本数)が大きくなるにつれて、ランダムなものがそうでない定数(分布の平均)に近づいていくことを意味している。社会調査のサンプル調査では、コインの例と違って分布の平均はわからないから、調査結果から真の値(分布の平均)を推測する形で用いられる。より正確に定式化の意味を説明するには、P(事象の確率を表す。Probabilityの頭文字)や ϵ(いくらでも小さくてもいい定数)などにも触る必要があるが、コイン投げで永久に表が出続け、1の割合がずっと1のままで、1/2には近づかない確率も0ではないためという程度に留めて、以下では、この法則が成り立つ条件「平均 μ,分散 σ2」の意味を考えたい。

 この条件はさらっと書いてあるので、確率変数の分布にはいつでも平均があるのだろうと思うかもしれない(ばらつきを表す分散も同じだが、以下、平均のみ扱う)。だが、標本平均が常にある(試行の結果として計算できる)のに対して、分布の平均は常にあるとは限らないのである。0か1かのコイン投げとは違い、いくらでも大きい値を取る確率変数で、非常に大きい値がある程度大きな確率で起こるような分布では、分布の(有限な)平均を定めることが出来ず、そのような分布に従う標本平均は標本数が大きくなっても、なんらかの定数に落ち着きはしないのである(いつまでもランダムさが残る)。たとえば、X1, X2, …, Xnと続いてきて、次のXn+1 がそれまでのどんぐりの背比べとは違い、それ以前の合計X1+X2+…+Xn よりもはるかに大きい値を取ったら、n+1までの標本平均は、Xn+1 たったひとつに左右されて、nまでとは大きく違ってしまう。これでは大数の法則も形無しである。つまり、大数の法則は極端なことが余り起こらない場合に成り立つ定理で、「平均 μ,分散 σ2」という仮定の意味はそこにある。

 平均を持たない、極端な値を比較的よくとる分布は理論的には古くから知られていたが、近年、その現実的な存在意義が増してきている。大数の法則が成り立たない状況は、平穏な日々が続く中で、突然想定外の出来事が起こる場面のモデル化とみなすことができる。想定外の出来事とは、ときに大災害を起こす豪雨であり、ときに金融危機をもたらす株価の大暴落と、近年の社会の大問題にも例を見出すことができる。そこでは、大多数の普通のことよりも、極少数の極端なことが支配的になる。このような極端な出来事の研究は、リスク管理の数理をはじめ、様々な場面で用いられ、かつての“想定外”を明日の“想定内”に捉えることを目指している。

Winners Take All: 所得や資産は対数正規分布やパレート分布に従うといわれ、少数の大金持ちが平均を引き上げて、多数が平均以下になってしまう。2019年現在、全人類の所得下位半分38億人の総資産と同じ額を上位26人がもつという。超格差社会では、平均を定められないのかもしれない。

ページトップへ