平成282016)年度 一般研究2実施報告書

 

課題番号

28−共研−2027

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

7

研究課題名

公的大規模データの利用におけるプライバシー保護の理論と応用

フリガナ

代表者氏名

サイ シドウ

佐井 至道

ローマ字

Sai Shido

所属機関

岡山商科大学

所属部局

経済学部 経済学科

職  名

教授

配分経費

研究費

40千円

旅 費

160千円

研究参加者数

10 人

 

 

研究目的と成果(経過)の概要

 本研究の主な目的は以下の4点であった。

(1)個票データについて,秘匿方法,リスク評価方法,データの有用性の数量化についてそれぞれ理論の拡充を図るとともに,それらの融合を行う。
(2)表形式データについて,情報量を残しながら秘匿を行う手法の確立を目指す。
(3)疑似個票データについて,元データに直接ノイズを加えるような方法など新たな手法の検討を行い,実データへの適用を図る。
(4)地方自治体,企業,各種団体などで所有している個票データについて,適切な公開方法や対処方法を見いだすことをサポートする研究を行う。また,他分野における個票データの生成方法,秘匿方法,公開方法について,問題整理と個別の解決策を提示する。

 このうち(1)については,渋谷,大和,星野らによって,ピットマンモデル,ユーエンスモデルなどの確率分割の理論とその周辺の領域について,今年度も着実に研究が進められた。この点は本研究による最も貢献の大きい部分である。また,秘匿方法とリスク評価との関係についても星野らによって研究が進められ,汎用的なリスク評価についての提案もなされた。さらに,伊藤らによって,個票データの有用性の指標とリスクの指標を同時に考慮した分析についても引き続き検討が進められている。

 (2)については,IPUMSにおける表形式データ提供の現状についての研究や,表形式データに対する秘匿システムであるタウArgusに関する調査研究が進められたが,成果として目立ったものはない。

 (3)については,独立行政法人統計センターにおいて,伊藤の提案した方法を含む形で疑似個票データ(擬似ミクロデータ,一般用ミクロデータ)の提供が行われており,現在も改良が進められている。これとは別に,個票データのいくつかの項目に直接ノイズを加える方法についても伊藤,佐井によって引き続き研究が行われ,ノイズの加え方などの基礎がほぼできあがった。また,第三者が持つ母集団情報の曖昧さを考慮に入れたリスク評価方法についても佐井によって提案がなされた。さらに,諸外国の現状についても幅広く情報が集められた。

 (4)については,他分野の研究グループとの交流が活発に行われた。特に情報処理学会内の組織であるPWS(プライバシーワークショップ)とは頻繁に意見交換などの交流が行われ,2017年2月9日に行われたPWS MeetUpでは,星野と佐井が特別講演を行った。来年度に向けても,9月の統計関連学会連合大会におけるPWSと連携した企画セッションや,10月に予定されているPWS2017における統計関連の特別セッションなどが計画されている。

 本研究の成果については,2016年9月に行われた統計関連学会連合大会などの学会や国内外の各種シンポジウム,研究集会において報告を行うとともに,2016年12月に主催した研究集会などでも報告し,討論,意見交換を行った。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

 今年度(一部は来年度),この研究に関連して新たに発表された論文(発表決定を含む)は29編であった。そのうち主要なものを挙げる。

1. ノイズが挿入された個票データのリスク評価, 佐井至道, 査読無, 岡山商大論叢, 52, 23-50, 2016.

2. 曖昧な母集団情報を考慮に入れたノイズを含む個票データのリスク評価, 佐井至道, 岡山商大論叢, 査読無, 53, 2017.(掲載決定)

3. エビデンスに基づいた匿名化, 星野伸明, 日本統計学会誌, 査読有, 46, 1-42, 2016.

4. 地域特性から見た小売店舗の立地状況について, 伊藤伸介, 統計, 査読無, 2016年4月号,20-24, 2016.

5. 国勢調査における匿名化ミクロデータの有用性と秘匿性の定量的な評価, 伊藤伸介, 星野なおみ, 阿久津文香, 製表技術参考資料, 査読無, No.32, 1-33, 2016.

6. 諸外国における政府統計データの提供の動向について, 伊藤伸介, 中央大学経済研究所 Discussion Paper, 査読無, No.267, 1-13, 2016.

7. Empirical analysis of sensitivity rules: Cells with frequency exceeding 10 that should be suppressed based on descriptive statistics, Shirakawa, K., Abe, Y. and Ito, S., Privacy in Statistical Databases: UNESCO Chair in Data Privacy, International Conference, PSD 2016, Dubrovnik, Croatia, 査読有, 28-40, 2016.

8. Creating an "academic use file" based on descriptive statistics: Synthetic microdata from the perspective of distribution type, Shirakawa, K., Abe, Y. and Ito, S., Privacy in Statistical Databases: UNESCO Chair in Data Privacy, International Conference, PSD 2016, Dubrovnik, Croatia, 査読有, 148-162, 2016.

9. オーストラリアのオンデマンド集計に関する調査研究, 谷道正太郎, 伊藤伸介, 小島健一, 製表技術参考資料, 査読無, No.33, 1-33, 2016.

10. 国勢調査個票データを利用した居住地移動ならびに外国人労働力の統計分析-東京都を対象としたケーススタディ-, 佐藤慶一, 伊藤伸介, リサーチペーパー, 査読無, 第35号, 1-39, 2016.

11. 諸外国における政府統計ミクロデータの提供の現状とわが国の課題, 伊藤伸介, 中央大学経済研究所年報, 査読無, 第48号, 233-249, 2016.

12. わが国における外国人の就業特性について, 伊藤伸介, 統計, 査読無, 2016年10月号, 47-51, 2016.

13. 国勢調査ミクロデータに対する匿名化措置の可能性に関する研究, 伊藤伸介, 星野なおみ, 阿久津文香, 製表技術参考資料, 査読無, No.34, 1-59, 2016.

14. 就業構造基本調査ミクロデータを用いた若年の就業行動と親の学歴に関する実証分析, 伊藤伸介, リサーチペーパー, 査読無, 第36号, 1-18, 2016.

15. 国勢調査ミクロデータにおける匿名化の誤差の評価方法に関する一考察, 伊藤伸介, 経済学論纂(中央大学), 査読無, 57, 189-209, 2017.

16. Limiting Bayes estimates of estimable parameters based on Dirichlet processes, Yamato, H., Journal of the Japan Statistical Society, 査読有, 46, 155-164, 2016.

17. Chi-square mixture representations for the distribution of the scalar Schur complement in a noncentral Wishart matrix, Siriteanu, C., Kuriki, S., Richards, D. and Takemura, A., Statistics and Probability Letters, 査読有, 115, 79-87, 2016.

18. Exponential decay rate of partial autocorrelation coefficients of ARMA and short-memory processes, Takemura, A., Statistics and Probability Letters, 査読有, 110, 207-210, 2016.

19. Conformal geometry of sequential test in multidimensional curved exponential family, Kumon, M., Takemura, A. and Takeuchi, K., Sequential Analysis, 査読有, 35, 30-68, 2016.

20. Estimation of exponential-polynomial distribution by holonomic gradient descent, Hayakawa, J. and Takemura, A., 査読有, Communications in Statistics - Theory and Methods, 45, 6860-6882, 2016.

 また,学会,研究集会等で発表された報告は49件であった。そのうち主要なものを挙げる。

1. 諸外国における政府統計ミクロデータの提供の現状について, 伊藤伸介, 科学研究費補助金・統計数理研究所共同利用研究合同研究会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2016年7月23日, 統計数理研究所サテライトオフィス(東京都中央区).

2. Orders of random partitions, 渋谷政昭, 科学研究費補助金・統計数理研究所共同利用研究合同研究会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2016年7月23日, 統計数理研究所サテライトオフィス(東京都中央区).

3. 諸外国における行政記録データの公的統計への活用状況について, 伊藤伸介, 2016年度統計関連学会連合大会, 2016年9月5日, 金沢大学角間キャンパス(金沢市).

4. ARMA過程の偏自己相関係数の減衰レートについて, 竹村彰通, 2016年度統計関連学会連合大会, 2016年9月6日, 金沢大学角間キャンパス(金沢市).

5. 曖昧な母集団情報を考慮に入れた個票データのリスク評価, 佐井至道, 2016年度統計関連学会連合大会, 2016年9月6日, 金沢大学角間キャンパス(金沢市).

6. Limiting Bayes estimates of estimable parameters based on Dirichlet processes, 大和元, 2016年度統計関連学会連合大会, 2016年9月6日, 金沢大学角間キャンパス(金沢市).

7. オーストラリアにおけるオンデマンド集計の現状, 谷道正太郎, 小島健一, 伊藤伸介, 2016年度統計関連学会連合大会, 2016年9月7日, 金沢大学角間キャンパス(金沢市).

8. ライフイベントに応じたミクロシミュレーションモデルの開発, 佐藤慶一, 伊藤伸介, 2016年度統計関連学会連合大会, 2016年9月6日, 金沢大学角間キャンパス(金沢市).

9. 曖昧な母集団情報を考慮に入れたノイズを含む個票データのリスク評価, 佐井至道, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2016年12月8日, 統計数理研究所(東京都立川市).

10. 米国センサス局におけるミクロデータの地域区分10万人基準の根拠, 稲葉由之, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2016年12月8日, 統計数理研究所(東京都立川市).

11. 匿名データの個票開示リスク, 星野伸明, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2016年12月8日, 統計数理研究所(東京都立川市).

12. ディリクレ過程の汎関数の期待値, 大和元, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2016年12月9日, 統計数理研究所(東京都立川市).

13. Pitman 確率分割における Ewens 仮説の検定, 渋谷政昭, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2016年12月9日, 統計数理研究所(東京都立川市).

14. 統計情報の構造に関する試論的考察 -統計メタデータアーカイブの展開可能性-, 小林良行, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2016年12月9日, 統計数理研究所(東京都立川市).

15. オーストラリアにおける二次的利用について-オンデマンド集計の現状を中心に-, 谷道正太郎, 伊藤伸介, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2016年12月9日, 統計数理研究所(東京都立川市).

16. 国勢調査ミクロデータに対する匿名化措置の可能性に関する実証研究-地域の人口規模に着目して-, 伊藤伸介, 星野なおみ, 阿久津文香, 研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」, 2016年12月9日, 統計数理研究所(東京都立川市).

17. 個体識別リスクの定量管理, 星野伸明, PWS MeetUp, 2017年2月6日, 東京大学本郷キャンパス(東京都文京区).

18. ノイズを含む個票データのリスク評価, 佐井至道, PWS MeetUp, 2017年2月6日, 東京大学本郷キャンパス(東京都文京区).

19. Use of asymptotics for holonomic gradient method, Takemura, A., RIMS workshop, 2016年7月25日, 京都大学(京都市左京区).(招待講演)

20. On the marginals of a random partitioning distribution, Hoshino, N., International Conference on Statistical Distributions and Applications 2016 (ICOSDA 2016), 2016年10月15日, Crowne Plaza Hotel (Niagara Falls, Canada). (招待講演)

21. Harmonic Bayesian prediction under alpha-divergence, Maruyama, Y., International Conference on Statistical Distributions and Applications (ICOSDA 2016), 2016年10月16日, Crowne Plaza Hotel (Niagara Falls, Canada).(招待講演)

 なお本研究で開催した研究集会,研究会に関する情報は,下記のホームページで公開している。

http://www.osu.ac.jp/~sai/

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

研究集会「公的大規模データの利用におけるプライバシー保護の理論と応用」
日時: 2016年12月8日(木) 10:00〜17:10,9日(金) 10:00〜17:10
場所: 統計数理研究所・セミナー室1
参加者数: 41名
報告者数: 18名

研究会「公的大規模データの利用におけるプライバシー保護の理論と応用」
日時: 2016年7月23日(土) 10:00〜16:00
場所: 統計数理研究所サテライトオフィス
参加者数: 7名
報告者数: 4名

研究会「プライバシー保護の統計数理」
日時: 2017年2月13日(月) 13:00〜17:20
場所: 岡山大学東京オフィス
参加者数: 6名
報告者数: 3名

 

研究参加者一覧

氏名

所属機関

伊藤 伸介

中央大学

渋谷 政昭

慶応義塾大学

瀧 敦弘

広島大学

竹村 彰通

滋賀大学

田村 義保

統計数理研究所

星野 伸明

金沢大学

丸山 祐造

東京大学

大和 元

鹿児島大学

和合 肇

統計研究会