平成212009)年度 一般研究2実施報告書

 

課題番号

21−共研−2022

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

1

研究課題名

類似性データ解析法に関する理論的研究(2)

フリガナ

代表者氏名

ヤドヒサ ヒロシ

宿久 洋

ローマ字

HIROSHI YADOHISA

所属機関

同志社大学

所属部局

文化情報学部文化情報学科

職  名

教授

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

5 人

 

 

研究目的と成果(経過)の概要

社会現象や心理現象を扱う様々な学問分野あるいは応用分野で,2者関係を示すデータは多種多様に存在し,それらを分析する需要は多い.2者間の類似性,混同率,連関性,心理的距離を示すデータは,総称として「類似性データ」と呼ばれる.
様々な分野で取り扱われる類似性データであるが,分野によってはデータの持つ性質が全く異なる.当然ながら,量的な場合もあれば質的な場合もあるし,対称な場合もあれば非対称な場合もある.さらに最近では,多元であるもの,多相であるもの,非常に大きなサイズのデータ,非常にスパースなデータの解析の必要性もでてきている.
本研究では昨年度に引き続き,1)様々な類似性データ解析法の理論的特徴付け,2)既存の類似性データ解析法の総合的な調査,3)類似性データの新解析法の提案,4)類似性データの解析結果の評価法の提案,5)新たな応用分野への手法の適用可能性の検討を目的として研究を行った.
本年度は特に,1),2)のために統計数理研究所にて定期的に研究打ち合わせを行った.その成果として,3)および4)に関連する学会発表および論文執筆を行った.主な成果は,区間値データ,ヒストグラム値データ,分布値データの関連性尺度の提案およびそれらのデータに対応する統計手法の開発である.詳細については以下の論文等を参照されたい.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

[国際会議のProceedings (査読あり)]
[1] Terada, Y. and Yadohisa, H. (2010): Non-Hierarchical Clustering for Distribution-Valued Data. to appear in COMPSTAT 2010: Proceedings in Computational Statistics, Psysica-Verlag, Heidelberg.

[国際会議 発表]
[1] Terada, Y. and Yadohisa, H. (2010): Modal Interval-Valued Dissimilarity Between Histogram-Valued Data. 3rd German-Japanese Workshop ``ADVANCES IN DATA ANALYSIS AND RELATED NEW TECHNIQUES AND APPLICATIONS"", Karlsruhe, German.

[国内学会・研究集会 発表]
[1] 寺田吉壱, 宿久洋. (2009). 区間代数のヒストグラムデータへの拡張について, 日本計算機統計学会第23回シンポジウム論文集, p155-p158.
[2] 谷岡健資, 寺田吉壱, 宿久洋 (2010): データ標準化の階層的クラスタリング結果に及ぼす影響について, 日本分類学会 第26回研究報告会 研究報告予稿集, p25-p26.
[3] 寺田吉壱, 宿久洋. (2010): 区間値非類似性データに対する多次元尺度構成法, 日本分類学会 第26回研究報告会 研究報告予稿集, p27-p30.
[4] 寺田吉壱, 宿久洋. (2010): 分布値データに対するクラスタリングについて, 日本統計学会春季集会(ポスターセッション), 於 青山学院大学.
[5] 齊藤,田村,波多野,宿久(2009): 非対称k-medoids法を用いたWikipedia XMLコーパスの分析, 第37回日本行動計量学会大会抄録, 26-27.
[6] 田村 航弥,波多野 賢治,宿久 洋(2009): 隣接ページのクエリ尤度を考慮した文書特徴付け手法の実装とその評価'', 情報処理学会研究報告, Vol.2009-DBS-149, No.3, pp.1-8, November 2009.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。


 

研究参加者一覧

氏名

所属機関

田村 義保

統計数理研究所

酒折 文武

中央大学

竹内 光悦

実践女子大学

中山 厚穂

立教大学