平成262014)年度 一般研究2実施報告書

 

課題番号

26−共研−2031

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

7

研究課題名

官庁統計データの公開と利用における理論の構築と他分野への応用

フリガナ

代表者氏名

サイ シドウ

佐井 至道

ローマ字

Sai Shido

所属機関

岡山商科大学

所属部局

経済学部 経済学科

職  名

教授

配分経費

研究費

40千円

旅 費

196千円

研究参加者数

11 人

 

 

研究目的と成果(経過)の概要

 本研究の主な目的は以下の通りであった。

(1)個票データについて,秘匿方法,リスク評価方法,データの有用性の数量化についてそれぞれ理論の拡充を図るとともに,それらの融合を行う。
(2)表形式データについて,情報量を残しながら秘匿を行う手法の確立を目指す。
(3)疑似個票データについて,元データに直接ノイズを加えるような方法など新たな手法の検討を行い,実データへの適用を図る。
(4)地方自治体,企業,各種団体などで所有している個票データについて,適切な公開方法や対処方法を見いだすことをサポートする研究を行う。また,他分野における個票データの生成方法,秘匿方法,公開方法について,問題整理と個別の解決策を提示する。

 このうち(1)については,渋谷,大和,星野らによって,ピットマンモデル,イーベンスモデルなどの確率分割の理論を中心に,今年度も着実に研究が進められた。モデルを用いない制約付きノンパラメトリック推定法についても佐井によって研究が進められている。また,伊藤らによって,個票データの有用性の指標とリスクの指標を同時に考慮した分析についての引き続き検討が進められているところである。
 (2)については,大きな進展はなかったが,現在も引き続き検討が行われている。
 (3)については,独立行政法人統計センターにおいて,伊藤の提案した方法を含む形で疑似個票データ(擬似ミクロデータ)の提供が行われている。これとは別に,個票データのいくつかの項目に直接ノイズを加える方法についても伊藤らによって研究が行われた。
 (4)については,がん登録データの公開を目指したプロジェクトが国立がん研究センターにおいて昨年度スタートし,佐井が個票データの作成,秘匿,リスク評価の研究スタッフとして参加している。これは400万人のがん患者の新たなデータベースを構築し公開につなげるための研究である。今年度は,試作版の個票データについて,公開方法と第三者が持つ情報について様々なシナリオを想定し,それぞれについて安全な公表方法についての提案を行った。

 これらの研究成果については,2014年9月に行われた統計関連学会連合大会などの学会やシンポジウムにおいて報告を行うとともに,2014年12月に開催した研究会などでも報告,討論を行った。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

 今年度,この研究に関連して新たに発表された論文(発表決定を含む)は10編であった。

1. 院内がん登録における重複登録割合の推定, 渡邊多永子, 東尚弘, 佐井至道 他7名, 厚生の指標, 査読有, 第61巻, 1-4, 2014.
2. Prediction in Ewens-Pitman sampling formula and random samples from number partitions, Sibuya, M., Annals of the Institute of Statistical Mathematics, 査読有, Vol.66, 833-864, 2014.
3. The Erdos-Turan law for mixtures of Dirichlet processes (II), Yamato, H., Bulletin of Informatics and Cybernetics, 査読有, 2014.(採択済み)
4. The Edgeworth expansion for the number of distinct observations with the mixture of Dirichlet processes, Yamato, H. and Kondo, M., Scientiae Mathematicae Japonicae, 査読有, 2014.(採択済み)
5. 有用な匿名化データ---経験からの学習, 星野伸明, 情報処理学会論文誌, 査読有, Vol.55, 1956-1963, 2014.
6. 国勢調査における匿名データの作成とその検証, 星野なおみ, 伊藤伸介, 後藤武彦, 製表技術参考資料, 査読無, No.27, 1-22, 2014.
7. ミクロデータにおける匿名化技法の有効性の検証-全国消費実態調査と家計調査を例に-, 伊藤伸介, 村田磨理子, 高野正博, 統計研究彙報, 査読無, 第71号, 83-124, 2014.
8. Inadmissibility of the best equivariant predictive density in the unknown variance case, Boisbunon, A. and Maruyama, Y., Biometrika, 査読有, Vol.101, 733-740, 2014.
9. Markov degree of the Birkhoff model, Yamaguchi, T., Ogawa, M. and Takemura, A., Journal of Algebraic Combinatorics, 査読有, Vol.40, 293-311, 2014.
10. Markov degree of the three-state toric homogeneous Markov chain model, Haws, D., del Campo, A. M., Takemura, A. and Yoshida, R., Beitrauml;ge zur Algebra und Geometrie, 査読有, Vol.55, 161-188, 2014.

本研究の情報を公開しているホームページ
http://www.osu.ac.jp/~sai/

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

 2014年12月8日に,統計数理研究所サテライトオフィスにおいて他の研究グループと合同で下記の研究会を開催した。

研究会
テーマ:調査データベース公有化における個人データ保護の統計理論
日時:2014年12月8日(月)10:00〜17:00
場所:統計数理研究所・サテライトオフィス
参加者数:5名
報告者数:4名

 

研究参加者一覧

氏名

所属機関

伊藤 伸介

中央大学

小林 良行

総務省

渋谷 政昭

慶応義塾大学

瀧 敦弘

広島大学

竹村 彰通

東京大学

田村 義保

統計数理研究所

星野 伸明

金沢大学

丸山 祐造

東京大学

大和 元

鹿児島大学

和合 肇

統計研究会