平成272015)年度 一般研究2実施報告書

 

課題番号

27−共研−2067

分野分類

統計数理研究所内分野分類

g

主要研究分野分類

1

研究課題名

高次元データのハブ現象の数理的解明

フリガナ

代表者氏名

フクミズ ケンジ

福水 健次

ローマ字

Fukumizu Kenji

所属機関

統計数理研究所

所属部局

数理・推論研究系

職  名

教授

配分経費

研究費

40千円

旅 費

23千円

研究参加者数

4 人

 

 

研究目的と成果(経過)の概要

高次元のデータに対して,「ハブ現象」と呼ばれる新しい興味深い現象が発見され,高次元データに対してよく用いられるk近傍法などのデータ解析手法の結果に大きな影響を与えることが指摘されるようになった(Radovanovic et al. JMLR 2010).ハブ現象とは,高次元の場合に,特異的に多数のデータ点のk近傍に属するようなデータが存在しやすくなるという現象で,例えばk近傍法による検索などでは,そのようなデータが多くの検索キーに対して望ましくない類似データとして現れるなどの問題を生じる.このような数理的に興味深い高次元現象を明らかにし,データ解析を高度化することが本研究の目的である.

最近,Hara et al. (AAAI 2015) は,必ずしも高次元でなくともハブ現象が生じることを発見しているが,この解消法の確率も重要な問題である.さらに,従来主として類似度尺度(cosine)において議論されてきたハブ現象を,ユークリッド距離の場合にも議論することは重要な課題である.

本共同研究では,海外研究協力者であり,ハブ現象の提唱者でもある Radovanovic 氏の来日に合わせて,1日の議論の機会を設けた.特に,局所的なハブを解消する方法(AAAI 2015)の改良に関して集中した共同研究を行った.

また,昨年度から継続した共同研究の成果の一部は,情報検索分野のトップ国際会議である,SIGIR 2015 に採択された.




 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

原一夫氏のホームページ
https://sites.google.com/site/kazuohara/home

論文発表
Kazuo Hara, Ikumi Suzuki, Kei Kobayashi, and Kenji Fukumizu. 2015. Reducing Hubness: A Cause of Vulnerability in Recommender Systems. In Proceedings of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR '15). ACM, New York, NY, USA, 815-818. DOI=http://dx.doi.org/10.1145/2766462.2767823

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

研究会は開催していない.

 

研究参加者一覧

氏名

所属機関

小林 景

統計数理研究所

鈴木 郁美

情報・システム研究機構 国立遺伝学研究所

原 一夫

情報・システム研究機構 国立遺伝学研究所