人間の身長が従う分布の、詳細な経年変化を求めることが本研究の目的である。身長は、正規分布に従うデータの典型として、教科書などでよく取り上げられるが、実際のところ、そうであるかどうかは未だに議論が分かれる(例えば、Limpert [2001, BioSci])。
Kuninaka et al. [2009, J. Phys. Soc. Jpn.](以下、K2009)を始めとする國仲を中心とした一連の研究では、文部科学省によって長年行われている学校保健統計調査にある身長データに対し、年齢ごとに正規分布および対数正規分布の当てはまり具合を比較した結果、成長期にかけて対数正規分布から正規分布への移行が見られることを示した。
本研究課題では、K2009の結果の再検討を試みた。K2009で行われていたような、正規分布および対数正規分布とデータとのフィッティングにおける誤差を比較するのではなく、歪度に着目したところ、幼年期や成長期の前半では歪度が正であるのに対し、成長期の後半では、歪度が負になっていることも分かった。このことから、K2009が見出した「対数正規分布から正規分布への移行」は、実データに基づく分布の歪度が正から負へと変化することと対応していると見ることができる。歪度が0である正規分布と、歪度が正である対数正規分布とを、歪度が負であるデータに当てはめモデル比較すれば、正規分布が選ばれることになるのは当然の帰結と言えるが、これはあくまで比較の結果でしかない。歪度が負であることを注視すれば「対数正規分布、正規分布とも真の分布たり得ない」と考える方が尤もらしく、K2009の結果には問題があると言うべきである。
ここで、注目すべきは、K2009が解析において使用した学校保健統計調査では、年齢階級幅を1年としたデータのみが提供されている点である。これは、例えば、10歳になったばかりの児童と11歳になる直前の児童とが同一グループに分類されたデータを扱わざるを得ないことを意味する。しかし、子供の身長は経時変化(成長)すると考えるべきであり、両者の分布は大きく異なる筈である。つまり、このデータから得られる身長分布は、一種の混合分布となる。
これを踏まえると、歪度が正から負へと移行する理由として、以下の仮説が考えられる。先ず、実データにおける身長のばらつき具合(標準偏差)を調べたところ、幼年期から成長期前半にかけては、年と経ると共に大きくなり、成長期後半では小さくなることが分かった。また、幼年期から成長期を通して、身長の平均は増え続けることと、そして既に指摘した通り、K2009が解析した学校保健統計調査では、年齢階級幅が1年と幅があることと合わせると、成長期前半では平均が増えると同時に分散も大きくなるような分布を混合したものを得ることになる。仮に元の分布が正規分布のような左右対称な分布(歪度がほぼ0)の分布であったとしても、その混合の結果、歪度が正となる分布を得る。それと全く逆のことが成長期後半には起き、即ち平均が増えると共に分散が小さくなるような分布を混合した結果、歪度が負となる分布が生じる。このような分布の混合が、歪度の増減を引き起こす点を考慮しなかった点が、K2009における問題の主要因と考えられる。
以上の仮説を確かめるために、以下のような解析を行った。成長期の身長変化のみに着目し、ある年齢tにおける身長が、f(t)=A+Btanh[(t-t0)/s0]と表されると仮定する。ここで、モデルパラメータA, B, t0, s0は正規分布に従うとし、それらの平均・標準偏差を実データより推定する。解析に用いたデータは、学校保健統計調査よりも精度ある身長データを提供する、(社団法人)人間生活工学研究センターによる「日本人の人体計測データ: 1992-1994」の10歳から18.5歳までの男性4822人、および女性3838人分である。推定は、最尤法に基づいて行った。そして、その推定結果として得られた各パラメータの平均・標準偏差を元に、パラメータのリサンプリングを行うことで、実データをよく説明するようなf(t)の分布を生成した。こうして得られたf(t)の分布に基づき、tの値に幅を持たせずに歪度を計算した場合と、混合分布に対応するように、tの値に1年の幅を取ってその間のf(t)の値をまとめた上で歪度を計算した場合との、2つの場合について比較した。その結果、仮説で提唱したような、混合分布の歪度の成長期前半における増加および、成長期後半における減少を再現することが出来、仮説の妥当性を示すことが出来た。
この成果は、学術誌J. Phys. Soc. Jpn.へ投稿し、査読を1度経て、その査読コメントに従って改訂したものが再査読されている段階である。
|