平成222010)年度 一般研究2実施報告書

 

課題番号

22−共研−2046

分野分類

統計数理研究所内分野分類

f

主要研究分野分類

2

研究課題名

シンボリックデータ解析法に基づくインターネットデータの実践的解析

フリガナ

代表者氏名

ミナミ ヒロユキ

南 弘征

ローマ字

MINAMI, Hiroyuki

所属機関

北海道大学

所属部局

情報基盤センター

職  名

准教授

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

4 人

 

 

研究目的と成果(経過)の概要

もはや社会インフラの一要素ともいえるインターネットは、統計学的な視点からみれば、巨大なデータ収集の場である。たとえば、Webサーバにおいては、特に設定を施すまでもなく、サーバログが蓄積される。また、申請者のみが利用するUNIXサーバ上では、1日あたり数件の不正アクセスの試みがあり、迷惑メールの受信数は申請者だけで1日あたり300を下らない。これらの蓄積データに対する解析は、おのおの目的別に行われているが、たとえばウイルス感染による迷惑メール発出など、発生源が複合的な場合も多く、共通の領域知識を背景とした、包括的な解析アプローチも検討の必要があると思われる。申請者らは,平成20年度に、インターネットの低レベルデータの要約値を基調とした解析研究を行ってきたところである。これらの成果も踏まえ、インターネットを介して得られる複数の、できるだけ平易な(特殊性を持たない)データセット群に対し、主にシンボリックデータ解析の枠組を基調とした複合的な解析技法の開発と,実データへの適用を通じた多角的考察を研究の目的とする.
成果として、具体的には、研究代表者が間接的に保有するインターネットトラフィックデータに対して包括的な解析を、主にシンボリックデータ解析の枠組に従って行い、相応の成果を得、国際会議等で報告したところである。この間、統計数理研究所への出張を通じ、所内研究者との意見交換を行ったほか、9月に開催されたシンボリックデータ解析のワークショップなどでも、意見交換を通じ、間接的な成果を得ることができた。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

Hiroyuki MINAMI:Empirical Studies on the Analysis of a Vast Amount of the Internet Traffic Data in Japan,Abstracts of the 3rd German-Japanese Workshop, University of Karlsruhe, 22.
Kenji TOYODA, Hiroyuki MINAMI, Masahiro MIZUTA:Semi-supervised Discriminant Analysis for Interval-valued Data,19th International Conference on Computational Statistics, 176.
Hiroyuki MINAMI. Masahiro MIZUTA:A Knowledge Engineering Applied Symbolic Data Analysis,Abstracts of the 34th Annual Conference of the German Classification Society (Gfkl), 127.
南 弘征: SDAの応用と展開. ワークショップ「データ縮約のトレンドを追う−PCAとSDA−」, 2010-09-17, 統計数理研究所.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。


 

研究参加者一覧

氏名

所属機関

岸本 直樹

北海道大学

清水 信夫

統計数理研究所

林 邦好

北海道大学