第51巻第2号183−197(2003)  特集「個票開示問題の統計理論」  [原著論文]

母集団寸法指標のノンパラメトリック推定

岡山商科大学 佐井至道

要旨

標本調査で得られた個票データの開示におけるリスク評価では母集団寸法指標を用いた指標を用いることが多い.標本寸法指標からの母集団寸法指標の推定では,ポアソンガンマモデルやピットマンモデルなどの超母集団モデルを用いるパラメトリックな方法が主流である.本論文では,これまで提案されているノンパラメトリック推定についてまとめるとともに,ノンパラメトリック最尤推定する方法を新たに提案する.この推定法には,推定が不安定になるというノンパラメトリック推定共通の問題点があり,膨大な時間を要するという計算上の問題もある.前者の点を解決するために,母集団寸法指標に対して制約を加えることにする.母集団寸法指標の性質が経験的に知られている場合には,単調減少や下に凸のような簡単な制約を置くことによって,典型的な状況では安定した推定が可能になる.また後者の問題を解決するために,ベルヌーイ抽出による尤度をポアソン確率関数で近似する方法を提案するとともに,すべての可能な母集団寸法指標について網羅的に尤度を計算する代替法として,いくつかの簡便法を提案する.母集団寸法指標ではサイズの小さい部分の推定が特に重要であるため,大きいサイズを打ち切った標本寸法指標を用いることにより,現実的な大きさの母集団に対しても推定が可能になる.

キーワード:個票データ,キー変数,標本寸法指標,母集団寸法指標.

全文pdf閲覧前画面に戻る


第51巻第2号199−222(2003)  特集「個票開示問題の統計理論」  [原著論文]

労働力調査とローテーション・サンプリング

一橋大学 加納悟

要旨

本稿では,わが国の労働力調査を例に取り,ローテーション・サンプリングによって得られた調査結果を分析するための時系列モデルを提示する.それは,失業の発生メカニズムがプロビットモデルで,その潜在変数が線型状態空間モデルとして記述される,非線型時系列モデルである.それゆえ近似に依らない限り通常のカルマンフィルターのアルゴリズムを用いた最尤法で推定することはできない.本稿では,モデルの推定はギブス・サンプリング(Gibbs Sampling)を用いて行なわれる.残念ながら,わが国の労働力調査結果の集計表にはローテーション構造に関する情報が欠落しており,モデルの有効性のチェックは現実のデータではなく擬似データによらざるを得ない.最後に,いくつかの重要と思われる応用とモデルの拡張について述べ結論とする.

キーワード:労働力調査,ローテーション・サンプリング,プロビットモデル,ギブス・サンプリング,状態空間表現.

全文pdf閲覧前画面に戻る


第51巻第2号223−239(2003)  特集「個票開示問題の統計理論」  [原著論文]

ミクロデータにおける母集団一意性の事後確率

東京大学大学院 大森裕浩

要旨

ミクロデータを開示する際には,ある観測値が調査対象となった特定の個人や企業の観測値であると知られるリスクが生じる.このことは官庁統計として得られたミクロデータをそのまま公開することが個人や企業の情報を暴露してプライバシーを侵害する可能性を意味する.実際に調査の結果として得られた標本の観測値は標本一意である(他のどの標本の観測値とも異なる)ことが多いが,それは母集団でも一意であることを必ずしも意味しない.そこで本稿では母集団における一意性の事後確率をミクロデータ開示のリスクとして評価し,これをどのように用いるべきかについて考察する.

キーワード:ミクロデータ,開示リスク,母集団一意性,事後確率,マルコフ連鎖モンテカルロ法.

全文pdf閲覧前画面に戻る


第51巻第2号241−260(2003)  特集「個票開示問題の統計理論」  [総合報告]

個票開示問題の研究の現状と課題

東京大学大学院 竹村彰通

要旨

本稿では,個票開示問題の理論に関して基本的事項を解説するとともに,個票開示問題に関する統計数理的な理論研究の現状と課題についてサーベイを与える.国際的な研究の流れを紹介するが,その中でも筆者自身および関連の研究者の研究成果に重点をおいている.個票開示問題には安全性と有用性のトレードオフという難しい側面があり,十分な技術的な理解に基づいて冷静な議論をおこなう必要がある.

キーワード:キー変数,母集団一意,大域的再符号化,局所再符号化.

全文pdf閲覧前画面に戻る


第51巻第2号261−295(2003)  特集「個票開示問題の統計理論」  [総合報告]

孤立個体数の推測

高千穂大学 渋谷政昭

要旨

分類変量の分類数が非常に多く,各分類の確率よりは,確率全体の特徴が重視される分野がある.生態学における種の多様性,言語学における語彙,考古学における遺物類のパターン,などが典型例である.標本調査における個人データ保護もこれに含められる.母集団個体の質的な属性に注目し,量的属性は区分して質的属性と同一視する.個体の識別子を除いて多重分割度数表に集約する.分割表の多重度が大きいとセルの数が多くなり,標本の大きさに匹敵し,超えることもある.本稿では“母集団および標本で孤立している個体数の推測”という課題を議論する.標本の観測度数が1のセルがいくつかあるとき,そのなかで母集団の度数も1のものがいくつあるか,標本だけから予測したい.最初にこの数を,調査データを公有化するときに生ずる個体データ漏洩危険の尺度として用いることを議論する.次に多数カテゴリーの多様性の統計学で,この課題が占める役割について議論し,この分野の主要成果を概観する.最後に最近の研究の成果と現在の方向を展望する.本文中の特殊な話題を付録で補足する.

キーワード:ジッフ法則,寸法指標,多数希少事象,多様性モデル,ミクロ統計の公有化,無限分解可能確率母関数.

全文pdf閲覧前画面に戻る


第51巻第2号297−319(2003)  特集「個票開示問題の統計理論」  [総合報告]

超母集団モデルによる個票開示リスク評価

金沢大学 星野伸明

要旨

個票データは,各個体が分割表のどのセルに所属するかを示すものである.そして秘匿処理は,分割表の解像度を粗くする操作に他ならない.分割表を細かくすればセル内の個体数(頻度)が減る事を考えると,頻度の頻度(寸法指標) 推測は開示リスク評価において,重要な役割を果たす.しかし母集団に何の仮定もおかないと,実用的な推測は不可能である.このため有限母集団解析の定石どおり,超母集団モデルを仮定する.経験的に母集団はZipfの法則に従うので,右裾が長い分布で混合したポアソン分布を利用する.つまり基本モデルでは,各セルでの頻度を独立同一な混合ポアソン分布とみなす.個体総数(の期待値)を一定のままセル数を無限大とする極限操作を,小数法則と呼ぼう.無限分解可能な混合ポアソン分布の基本モデルに小数法則を適用すると,モデルとして意味のある極限分布が得られる.無限分解可能な混合ポアソン分布は多いので,この法則によって便利なモデルを新規に導出できるかもしれない.なお幅広い母集団の記述の為には,多くのモデルを使い分ける必要が有る.従って新規モデルを提供していく事は重要である

キーワード:母集団一意,無限分解可能,複合ポアソン,混合ポアソン,自然数の確率分割.

全文pdf閲覧前画面に戻る


第51巻第2号321−335(2003)  特集「個票開示問題の統計理論」  [総合報告]

PRAMの理論とその実用上の諸問題

福岡女子大学 藤野友和
岡山大学 垂水共之

要旨

Post Randomization Method(PRAM)は,Kooiman et al.(1997)により提案された匿名化標本データ(マイクロデータ)に対する統計的開示制御の方法である.これはデータの公開者が,マイクロデータにおける各標本がとる値に対して,事前に定めた確率構造に基づいて攪乱を与えることにより,個体の再識別や情報漏洩の発生する危険性を低下させるものである.本稿ではこの方法について紹介し,実際の適用に関して考慮すべき事項や適用されたデータの分析結果に与える影響について議論する.また,現在開発を行っているPRAMのためのソフトウェア環境に関しての提案も行う.

キーワード:マイクロデータ,マルコフ連鎖,局所再符号化,EMアルゴリズム.

全文pdf閲覧前画面に戻る


第51巻第2号337−350(2003)  特集「個票開示問題の統計理論」  [総合報告]

集計表におけるセル秘匿問題とその研究動向

広島大学 瀧敦弘

要旨

集計表による調査データの公表においても,個票開示の問題と同様に,プライバシー保護の点から秘匿を必要とする箇所が発生する.このような秘匿すべきセルをいかに取り扱うか,すなわち,セル秘匿問題がこの小論で取り扱う問題である.セル秘匿には2つの問題が存在する.第1は,セルを秘匿する基準の問題である.第2は,いかに秘匿するかという方法についての問題である.この小論では,第2節で基準の問題を解説し,次に,第3節でセル秘匿方法について解説した.第4節では,おもに欧米の研究動向を詳しく解説した.欧米では,オランダ統計局を中心とするヨーロッパの研究グループと,米国およびカナダのセンサス局を中心とする研究グループの2つの大きなグループにより,近年,非常にさかんに研究されている.さらに,セル秘匿処理を自動化して行うためのソフトウェアの開発も進んでいる.

キーワード:集計表,セル秘匿問題,SDCプロジェクト,CASCプロジェクト,セル秘匿処理ソフトウェア.

全文pdf閲覧前画面に戻る


第51巻第2号351−372(2003)  特集「個票開示問題の統計理論」  [総合報告]

ピットマン確率分割と関連する話題

鹿児島大学 大和元
高千穂大学 渋谷政昭

要旨

個票開示における1つの問題は,母集団一意の推定問題である.これに関連する確率分割のモデルとして,Ewens(1972)による確率分割(Ewens sampling formula)が広く知られている.このイーエンス確率分割は確率的性質として交換可能性(exchangeability),とsize-biased permutationの下での不変性をもつ.この2つの性質を特徴づける確率分割として,Pitman(1995,1996c)は新しい確率分割(Pitman sampling formula)を導いた.このピットマン確率分割を簡単な壺のモデルを用いて導き,更にその性質と関連する事柄を紹介する.なお,個票開示と確率分割については本特集号の竹村(2003),渋谷(2003)の稿を参照されたい.

キーワード:イーエンス確率分割,交換可能性,ミタッグ・レフラー分布,ピットマン確率分割,ポアソン・ディリクレ分布.

全文pdf閲覧前画面に戻る


第51巻第2号373−388(2003)  特集「個票開示問題の統計理論」  [研究ノート]

わが国における官庁統計の個票利用と経済分析
――科研プロジェクト以前の状況について――

大阪大学大学院 福重元嗣

要旨

本稿では,ミクロ統計に関する科学研究費の特定領域による研究成果が発表され始める1998年以前の期間について,官庁の個票を利用した経済分析についてサーヴェイを行った.著者が見つけることができた公刊された論文69編(書籍を含む)からは,『全国消費実態調査』,『家計調査』,『貯蓄動向調査』,『賃金構造基本調査』,『就業構造基本調査』や『国民生活基礎調査』などの統計をもとにして,労働経済学や家計の消費・貯蓄行動,資産選択行動といった分野の研究がなされていることが明らかとなった.また,用いられた分析方法を,個票の必要度の低いと思われる順に,再集計,線形モデル,非線形モデル及び分布の計測の4つの手法に分類した結果,多くの研究で個票を直接利用する必要性が認められたが,オーダーメイド集計に相当する再集計を行った研究も比較的多いことが同時に明らかとなった.個票にアクセスできる研究者の観点から行った著者の所属機関についての分析によれば,利用者が特定の大学に集中していることは明らかとなったが,他の機関の研究者も個票を利用しており,ごく少数の研究者や研究機関によって個票利用が独占されているとは一概には言えない結果であった.

キーワード:ミクロ統計,個票,官庁統計,計量経済学,実証分析.

全文pdf閲覧前画面に戻る


第51巻第2号389−406(2003)  [原著論文]

Kernel Flexible Discriminant Analysisによる
高次非線形データの判別とその応用

九州大学大学院 安道知寛

要旨

判別分析とは,複数の特性について観測・測定された多次元データに基づいて,判別関数を構築し,将来のデータを分類する手法を総称する.これまで,実際問題に対して最も適用を試みられてきたFisherの線形判別法は,科学・社会システムの発展に大きく貢献してきた.しかし,近年,計算機のハードウェア・ソフトウェア両面にわたる急速な発展は,様々な種類の大規模データの蓄積を容易にし,複雑な非線形構造を有するデータから有効かつ効率的に情報を抽出する手法の必要性が急速に高まっている. 本稿では,カーネル関数に基づく非線形回帰分析の枠組みにより,Fisherの線形判別関数を非線形へと拡張し,文字認識など実際問題への応用に対して十分機能する手法を提案する.また,非線形判別関数の信頼性,汎化能力を向上させるため,パラメータ推定においては平滑化法を適用する.モデル構築に当たっては,平滑化パラメータ等の選択が本質的となるが,これらの選択を情報量,及びベイズ理論の観点から考察したモデル評価規準をそれぞれ導出する.また,諸分野で蓄積されつつある実データおよび人工データの解析を通して,提案する手法の有効性を検証する.

キーワード:Fisherの線形判別法,カーネル法,最適スケーリング,平滑化,統計的モデル選択.

全文pdf閲覧前画面に戻る