N.Rによるテキストマイニング入門
 【講義レベル:初級】

日時 11月24日(火)10時〜16時 (5時間)
講師 石田 基広(徳島大学)
申込受付 10月19日(月)10時〜30日(金)17時
受講料(税込) 2,500円(学生 1,000円)(受付を確認後、 11月2日(月)〜6日(金)の間に受講証で指定した銀行口座振込みで納入、 期日までに納入されない場合は、キャンセルとなります。)
定員 60名(先着順)
内容  テキストマイニングはコンピューターを使ってテキスト情報を分析する手法である。分析手順は大きく二つに分かれる。まずテキストを単語に分割し(言語学で形態素解析という)、単語の頻度情報などを適当なデータ形式で表現する。次に定型化された言語データを対象にデータマイニングなどの手法で分析を行う。例えばテキスト集合を分類するのが目的であればクラスター分析が使われる。この他、対応分析や潜在意味解析などもしばしば利用されている。
 本講座では、形態素解析とデータ分析を統計解析環境 R で行う方法を基礎から実習形式で解説する。文系の学生や研究者にもなじみやすいよう数理的な背景は省略し、実践的な操作手順や事例を中心に説明を進める予定である。ただしRについては基本操作ができることを前提とする。Rとその基礎については教科書第3章が参考になる。なお当日は受講者各自でノートパソコンを持参されたい。
教科書 : 石田基広(2008)『Rによるテキストマイニング入門』森北出版

【お知らせ】
当研究所内及びその付近には、食堂および売店はありません。(最寄りのコンビニエンスストアまで徒歩15分弱)
飲み物と昼食は各自ご持参ください。
時間割
会場 統計数理研究所 (立川) 講堂 研究所周辺の地図
開場 9時30分