平成242012)年度 一般研究2実施報告書

 

課題番号

24−共研−2030

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

7

研究課題名

調査データベース公有化における個人データ保護と疑似個票データの作成

フリガナ

代表者氏名

サイ シドウ

佐井 至道

ローマ字

Sai Shido

所属機関

岡山商科大学

所属部局

経済学部 経済学科

職  名

教授

配分経費

研究費

40千円

旅 費

298千円

研究参加者数

13 人

 

 

研究目的と成果(経過)の概要

本研究の主な目的は以下の(1)〜(5)であった。

(1)これまで母集団寸法指標の推定に用いるための様々な超母集団モデル(確率分割モデルとも呼ばれる)が提案されてきたが,それらの性質を体系的にまとめるとともに,実用性の観点から,さらに利用価値の高いモデルを構築する。
(2)種々のサンプリング方法で得られた個票データのリスク評価に,多重寸法指標が有用,あるいは不可欠であることがこれまでの研究で分かってきており,この点について引き続き研究を進める。
(3)個票データの秘匿方法,秘匿された個票データの有用性に関する研究について,様々な方法や指標の組み合わせに対する検討を行う。
(4)官庁統計の二次利用の環境は格段に進歩したが,探索的な分析を行ったり,大学院生に対する教育用に使用することは簡単でないため,元の個票データとほぼ同じ情報量を保ちながら,プライバシー侵害の観点から見て完全な匿名性が保証されている疑似個票データを作成するための手法の提案と理論構築を行う。
(5)これまで官庁統計データの公開のために蓄積された理論を,空間統計,PPDM,医学統計などの他分野へ応用する方法について研究する。

このうち(1)については,渋谷,大和,星野らによって,ピットマンモデル,イーベンスモデルを中心に,今年度も着実に研究が進められた。またモデルを用いない制約付きノンパラメトリック推定法について,ペナルティ関数の代わりにピットマンモデルの確率関数を用いる方法が佐井によって提案された。
(2)については,佐井によって,キー変数,キー変数以外の変数によって事後層化された単純無作為標本に対するリスク評価の研究が体系的にまとめられた。キー変数以外によって事後層化された場合には多重寸法指標が利用されているが,その効果は限定的である。また渋谷によって,多重寸法指標に適用可能な多次元ピットマンモデルについて引き続き研究が行われている。
(3)については,伊藤らによって,個票データの有用性の指標とリスクの指標を同時に考慮した分析についての引き続き検討が進められているところである。
(4)については,独立行政法人統計センターにおいて,伊藤の提案した方法を含む形で疑似個票データ(教育用擬似ミクロデータ)の提供が行われており,今年度はサブサンプルデータの提供なども行われている。またこれとは独立に,小林も疑似個票データの作成方法の研究を行い,その研究に基づいて疑似個票データを作成した。
(5)については,がん登録データの公開における問題について,佐井らによって,これまで蓄積された研究成果を基に解決が図られた。これは,あるデータベースに重複して登録されているレコード数を推定する問題で,別のデータベースと寸法指標を比較することによってその値を推定するものである。また生物統計の問題についても,渋谷を中心に海外のエキスパートとともに問題解決を図っているところである。

これらの研究成果については,2012年9月に北海道大学で行われた統計関連学会連合大会などの学会やシンポジウムにおいて報告を行うとともに,研究集会などでも報告,討論を行った。特に,2012年10月26日,27日には,統計数理研究所において,科学研究費補助金グループ(基盤研究 (B)(研究代表者:佐井至道))との合同研究集会を開催し,本研究グループ以外の研究者や官庁統計の実務者との意見交換も行った。
このような研究活動の結果,官庁統計の公開に関する基礎理論が更に蓄積されたと考える。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

本研究に関するホームページアドレスは以下の通りである。
http://www.osu.ac.jp/~sai/index.html

今年度,この研究に関連して新たに発表された論文(発表決定を含む)は次の通りである。

事後層化による個票データのリスク評価の改善, 佐井至道, 岡山商大論叢, 第48巻, 第1号, 1-25, 2012.
若年の就業状況に与える家計の資産所得の影響, 伊藤伸介,出島敬久, 一橋大学経済研究所 Discussion Paper Series A, No.571, 1-23, 2012.
教育用疑似ミクロデータの開発とその利用〜平成16年全国消費実態調査を例として〜, 秋山裕美,山口幸三,伊藤伸介,星野なおみ,後藤武彦, 製表技術参考資料, No.16, 1-43, 2012.
ミンサー型賃金関数による賃金の期待値と実現値の比較とその応用 - 『賃金センサス』と『就業構造基本調査』をもとにして - , 伊藤伸介,出島敬久,小林良行, 一橋大学経済研究所 Discussion Paper Series A, No.576,1-45, 2012.
社会生活行動の積極性と世帯属性から見た若年者の就業と生活活動, 伊藤伸介,勝浦正樹, 総務省統計研修所『リサーチペーパー』, 第31号,1-91, 2012.
Madeiraarkov bases for typical block effect models of two-way contingency tables, Ogawa, M. and Takemura, A., Journal of Multivariate Analysis, Vol.112, 219-229, 2012.
Approximations and asymptotics of upper hedging prices in multinomial models, Nakajima, R., Kumon, M., Takemura, A. and Takeuchi, K., Japan Journal of Industrial and Applied Mathematics, Vol.25, NO.1, 1-21, 2012.
Stochastic Processes and their Applications, Vol.122, No.1, 1-30, 2012.
Markov chain Monte Carlo test of toric homogeneous Markov chains, Takemura, A. and Hara, H., Statistical Methodology, Vol.9, 392-406, 2012.
Hierarchical subspace models for contingency tables, Hara, H., Sei, T. and Takemura, A., Journal of Multivariate Analysis, Vol.103, 19-34, 2012.
Generalized extreme value distribution with time-dependence using the AR and MA models in state space form, Nakajima, J., Kunihama, T., Omori, Y. and Fruhwirth-Schnatter, S., Computational Statistics and Data Analysis, Vol.56, No.11, 3241-3259, 2012.
Efficient Bayesian estimation of a multivariate stochastic volatility model with cross leverage and heavy-tailed errors, Ishihara,T. and Omori, Y., Computational Statistics and Data Analysis, Vol.56, No.11, 3674-3689, 2012.
Stochastic volatility model with leverage and asymmetrically heavy-tailed error using GH skew Student's t-distribution, Nakajima, J. and Omori, Y., Computational Statistics and Data Analysis, Vol.56, No.11, 3690-3704, 2012.
Bayesian analysis of time-varying quantiles using a smoothing spline, Kurose, Y. and Omori, Y., Journal of the Japan Statistical Society, Vol.42, No.1, 23-46, 2012.
Random partitioning over a sparse contingency table, Hoshino, N., Annals of the Institute of Statistical Mathematics, Vol.64, 457-474, 2012.
Production technology and agglomeration for Japanese prefectures during 1991-2000, Kakamu, K., Polasek, W. and Wago, H., Papers in Regional Science, Vol.91, No.1, 29-41, 2012.
Asymptotic distribution of number of distinct observations among a sample from mixture of Dirichlet processes, Yamato, H., Bulletin of Informatics and Cybernetics, Vol.44, 41-47, 2012.

他10編

今年度,学会などにおける報告は次の通りである。

小川光紀, 竹村彰通, 二元分割表のブロック効果モデルに対するマルコフ基底, 応用統計学会2012年度年会, 2012年5月24日, 統計数理研究所(東京都).
Omori, Y., A class of multivariate stochastic volatility models with leverage, ISBA2012, 2012年6月28日, Kyoto TERRSA(京都府).
Hoshino, N., Invitation to mathematical statistical disclosure control, imsAPRM2012, 2012年7月3日, Tsukuba International Congress Center(茨城県).
Sai, S., Nonparametric estimation for population size indices, imsAPRM2012, 2012年7月3日, Tsukuba International Congress Center(茨城県).
Sibuya, M., Random partition of number and multi-index, imsAPRM2012, 2012年7月3日, Tsukuba International Congress Center(茨城県).
Yamato, H., Random partitions of integers based on mixtures of Dirichlet processes, imsAPRM2012, 2012年7月3日, Tsukuba International Congress Center(茨城県).
佐井至道, 寸法指標のノンパラメトリック推定に対する種々の改善, 2012年度統計関連学会連合大会, 2012年9月10日, 北海道大学(北海道).
小川光紀, 竹村彰通, 二元分割表の副表和モデルに対するマルコフ基底, 2012年度統計関連学会連合大会, 2012年9月10日, 北海道大学(北海道).
原尚幸, 赤坂拓哉, 竹村彰通, Toric homogeneous Markov chain モデルのマルコフ基底と格子基底, 2012年度統計関連学会連合大会, 2012年9月10日, 北海道大学(北海道).
黒瀬雄大, 大森裕浩, Dynamic Equicorrelation Stochastic Volatility, 2012年度統計関連学会連合大会, 2012年9月10日, 北海道大学(北海道).
大森裕浩, 渡部敏明, Realized Stochastic Volatility モデル-日次リターンとRealized Volatilityの同時モデル化, 2012年度統計関連学会連合大会, 2012年9月10日, 北海道大学(北海道).
星野伸明, エビデンスに基づいた匿名化, 2012年度統計関連学会連合大会, 2012年9月10日, 北海道大学(北海道).
渋谷政昭, Pitman 確率分割とミクロデータ公開リスク管理, 2012年度統計関連学会連合大会, 2012年9月10日, 北海道大学(北海道).
小林良行, 教育用疑似個別データの開発 - 一橋大学での経験をもとに, 2012年度統計関連学会連合大会, 2012年9月10日, 北海道大学(北海道).
本多淳也, 竹村彰通, 多腕バンディット問題におけるモーメント制約付きダイバージェンス最小化について, 2012年度統計関連学会連合大会, 2012年9月11日, 北海道大学(北海道).
大和元, Ewens sampling formula の分割数のエッジワース展開, 2012年度統計関連学会連合大会, 2012年9月11日, 北海道大学(北海道).
伊藤伸介, 出島敬久, 小林良行, 就業構造基本調査と賃金センサスを用いた賃金分布の比較とその応用, 2012年度統計関連学会連合大会, 2012年9月12日, 北海道大学(北海道).
Ito, S. and Hoshino, N., The Potential of Data Swapping as a Disclosure Limitation Method for Official Microdata in Japan: An Empirical Study to Assess Data Utility and Disclosure Risk for Census Microdata, PSD2012, Privacy in Statistical Databases 2012, 2012年9月27日, Palermo, Sicily, Italy.
伊藤伸介, 世帯属性が若年の就業と生活行動に与える影響 - 社会生活基本調査のミクロデータを用いて -, 研究集会「官庁統計データの公開における諸問題の研究と他分野への応用」, 2012年10月26日, 統計数理研究所(東京都).
小林良行, 統計教育に利用可能な疑似個別データの開発, 研究集会「官庁統計データの公開における諸問題の研究と他分野への応用」, 2012年10月26日, 統計数理研究所(東京都).
佐井至道, 寸法指標のノンパラメトリック推定における改善の試み, 研究集会「官庁統計データの公開における諸問題の研究と他分野への応用」, 2012年10月26日, 統計数理研究所(東京都).
稲葉由之, ミクロデータ利用者へのメタデータの提供について, 研究集会「官庁統計データの公開における諸問題の研究と他分野への応用」, 2012年10月27日, 統計数理研究所(東京都).
星野伸明, 匿名化の定量評価, 研究集会「官庁統計データの公開における諸問題の研究と他分野への応用」, 2012年10月27日, 統計数理研究所(東京都).
丸山祐造, 回帰分析のいくつかの統計量を変えない線形変換について, 研究集会「官庁統計データの公開における諸問題の研究と他分野への応用」, 2012年10月27日, 統計数理研究所(東京都).
渋谷政昭, 数の分割からのサンプリングと、その逆過程, 研究集会「官庁統計データの公開における諸問題の研究と他分野への応用」, 2012年10月27日, 統計数理研究所(東京都).
大和元, Ewens sampling formula の分割数のエッジワース展開, 研究集会「官庁統計データの公開における諸問題の研究と他分野への応用」, 2012年10月27日, 統計数理研究所(東京都).
佐井至道, 擬似ミクロデータの教育・研究での利用について, 公的統計のミクロデータの利用に関する研究集会, 2012年11月16日, 統計数理研究所(東京都).
丸山祐造, 許容性に関するいくつかの話題, 研究集会「数理統計学の沃野」, 2012年11月23日, 慶應義塾大学矢上キャンパス(神奈川県).
星野伸明, 確率分割の周辺分布, 研究集会「数理統計学の沃野」, 2012年11月23日, 慶應義塾大学矢上キャンパス(神奈川県).
佐井至道, 事後層化による個票データのリスク評価の改善について, 研究集会「数理統計学の沃野」, 2012年11月23日, 慶應義塾大学矢上キャンパス(神奈川県).

他6件

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

 2012年10月26日,27日の2日間,統計数理研究所において科学研究費補助金の研究グループ(代表者:佐井至道)と合同で研究集会を開催した。総務省統計局など官庁側の実務者を含め33名が参加し,本研究グループの8名を含め16名が報告を行った。また本研究グループ主催の研究会を今年度1回行っている。
 研究集会と研究会の詳細は次の通りである。

研究集会
テーマ: 官庁統計データの公開における諸問題の研究と他分野への応用
日時: 2012年10月26日(金)10:00〜17:00,27日(土)10:00〜16:00
場所: 統計数理研究所・セミナー室5
参加者数: 33名
報告者数: 16名

研究会
テーマ: 調査データベース公有化における個人データ保護の統計理論
日時: 2012年7月28日(土)10:00〜15:50
場所: 統計数理研究所・サテライトオフィス
参加者数: 8名
報告者数: 3名

 

研究参加者一覧

氏名

所属機関

伊藤 伸介

明海大学

稲葉 由之

慶應義塾大学

大森 裕浩

東京大学

小林 良行

総務省

渋谷 政昭

慶応義塾大学

瀧 敦弘

広島大学

竹村 彰通

東京大学

田村 義保

統計数理研究所

星野 伸明

金沢大学

丸山 祐造

東京大学

大和 元

鹿児島大学

和合 肇

京都産業大学