研究室訪問

デジタル化社会のプライバシー 保護とレジリエンスの研究

 IT技術の飛躍的な発達により、公共サービスからビジネス、個人レベルの生活情報まで、あらゆる情報がデジタル化され、共有される「ビッグデータ時代」が始まった。莫大な量(Volume)、多用な質(Variety)、高度な産出頻度(Velocity)の情報が、社会の隅々にまで渦巻くようになった。この「3V」への挑戦こそ、統計科学の新たなテーマとして位置づけられる。

 情報洪水の中で人々のライフスタイルも変わろうとしている。生活情報の詳細が公開され、それに対する多用な解析が行われる。まず期待されるのは多種多様な我々の行動履歴データの分析に基づき、社会的な意志決定が高度化されることだろう。その一方では個人情報データが次々に他者に把握され、プライバシー侵害の危険性も高まる。

顔写真

南 和宏
新領域融合研究センター
特任准教授

「セキュリティ」と「プライバシー」

 3Vへの挑戦とは、ビッグデータ時代の明と暗を総合的に理解することも意味している。氾濫する情報に対していかに整合性を与え、人間性を確保し、着実な社会の発展を実現するのか。その手法の確立が喫緊の課題だ。統数研6階の研究室が「新領域」と呼ばれる理由もここにある。

 情報・システム研究機構の特定プロジェクトを担当する南は、そのような研究分野の最先端にいる。総合研究大学院大学の講義や学生の指導を担当せずに、研究だけに専念する。統数研では異色の存在だ。自己紹介のホームページには、「セキュリティ」と「プライバシー」の二つの言葉が、頻繁に躍っている。

 統数研はビッグデータの活用に不可欠な統計科学、機械学習の専門家の集団だ。「その中で私は様々なデータ分析技術の中に潜むセキュリティの問題を探求することで、ビッグデータの影に相当するプライバシーに対する一般の方々の不安を軽減するような研究成果、また一般への情報の発信を行っていければと考えています」と南は研究への抱負を語る。言葉は控え目でていねいだが、3Vに挑戦する大胆な気持ちが表出する。

 具体的には、位置情報のプライバシー保護に関する研究で、南は多くの実績を上げてきた。スマートフォンでも自分の現在位置が分かる時代では、位置情報からその人の行動が容易に推測される。例えば病院に頻繁に行くという事実から何らかの健康問題があると推論できる。たとえ特定の場所を秘匿したとしても、人の移動軌跡によって、その人がどこに行くか推測できてしまう。このような「時空間の相関に基づく推論」をいかに防止するかが、南の最大の関心事であり続けた。

他の人が芸術的な美を感じてくれるような理論または科学的知見の第一の発見者になりたい

データの「匿名化」の研究

 個人情報の保護にむけて誰もが思いつく有効な手法は、「匿(とく)名化」だろう。それは、元データから個人の識別につながるIDや名前を取り除く処理のことを指す。しかし、位置情報の場合、これだけではプライバシー保護に十分ではない。例えば個人の住所録があれば、位置情報の軌跡がその住所に入った時点でその家の住居人に特定されてしまうからだ。SUICAの乗車記録(ある種の移動軌跡情報)のデータが、他社に提供されて大きな批判を受けた事案も記憶に新しい。南は図1〜2を示しながら、個人情報を含む生データの加工の必要性や、複数の情報の組み合わせが匿名化の効果を相殺してしまう事例を説明する。

 この問題に取り組むために、南はNTT基礎理論情報グループと2012年以来、統数研との包括契約に基づく共同研究を行い、匿名化の代わりの偽のIDを動的に割り振る仮名化の手法を考案した。その基礎となる考え方は、複数の人が同時に出会うミックスゾーンで仮名をランダムに交換することで、ミックスゾーン前後の軌跡の関連を分断する手法だった。「これにより、ある目撃情報からの情報漏洩を限定的にすることができます。ただし、この手法は各ユーザーの全軌跡をミックスゾーン単位で分断するので、どの程度まで安全で有益な情報を公開できるのかについては、現在実証的に評価しているところ。現時点では非常によい感触を得ています」と、南は語る。

 今後の研究の展開だが、南は位置情報からさらに視野を広げて行動履歴データを組み合わせることを目指している。「様々な時系列の個人のプライバシー保護を担保したオープンデータとして広く一般に活用される技術を確立したい」と、研究の目標を定めている。

背筋を伸ばし、バランスを保つ研究姿勢

 大学で機械工学を専攻した後、1989年に日本IBM入社。最初はハードディスクのエンジニアだったが、基礎研究に関心を強めた。USダートマス大学コンピュータサイエンスの博士課程に入学し、「ユビキタスコンピューティングにおけるプライバシー保護」をテーマに学位を取得した。イリノイ大学の「データベース」コースの講師も経験し、2012年、システムズ・レジリエンスプロジェクトに従事するために統数研入りした。

 「2011年の東北大震災により、私たちは多くのことを学び、新たな科学技術のテーマを突きつけられました。予測不可能な事態が起きたときに、しなやかに復旧、復興するレジリエントな社会をどのように構築すればよいのか。私は今、そのようなことを真剣に考えています」。

 研究室のパソコンを置く台は手作りだ。木材を自分で削り、自分の姿と目の高さに合わせたベストの状態を実現させている。また、座席のかたわらには、いつも直径約80pのバランスボールを置き、時には体を乗せて運動する。

 「いつも自分の背筋を伸ばし、姿勢をあらためて、バランス感覚を保ちたいと心がけています。ボールの上で揺られながら、他の人が芸術的な美を感じてくれるような理論または科学的知見の第一の発見者になりたいと日々考えています」。高度情報社会の利便性と危険性の双方に目配りしながら、しなやかに粘り強く、3Vへの挑戦が続く。

(広報室)

図1.プライバシー保護データ公開。組織の壁を超えたビッグデータの活用には個人のプライバシーを担保する匿名化されたオープンデータの流通が不可欠である。データパブリッシャーは個人情報を集計、匿名化したオープンデータを公開し、データ利用者による様々なデータ分析を可能とする。図2.外部知識を用いた個人情報の特定(レコードリンク攻撃)。匿名化された医療データが1997年のUSマサチューセッツ州の投票者リストの準識別子と呼ばれる個人の特定に間接的に役立つ情報と付き合わされることで、当時の州知事の病名が特定される事件が起きた。

図3.ミックスゾーン。複数の人々が同時に出会うタイミングで仮名をランダムに交換することで、ユーザーの実名が特定される危険性を局所的なものに限定することができる。

ページトップへ