N.Rによるテキストマイニング入門
【講義レベル:初級】
日時 | 11月24日(火)10時〜16時 (5時間) |
講師 | 石田 基広(徳島大学) |
申込受付 | 10月19日(月)10時〜30日(金)17時 |
受講料(税込) | 2,500円(学生 1,000円)(受付を確認後、 11月2日(月)〜6日(金)の間に受講証で指定した銀行口座振込みで納入、 期日までに納入されない場合は、キャンセルとなります。) |
定員 | 60名(先着順) |
内容 | テキストマイニングはコンピューターを使ってテキスト情報を分析する手法である。分析手順は大きく二つに分かれる。まずテキストを単語に分割し(言語学で形態素解析という)、単語の頻度情報などを適当なデータ形式で表現する。次に定型化された言語データを対象にデータマイニングなどの手法で分析を行う。例えばテキスト集合を分類するのが目的であればクラスター分析が使われる。この他、対応分析や潜在意味解析などもしばしば利用されている。 本講座では、形態素解析とデータ分析を統計解析環境 R で行う方法を基礎から実習形式で解説する。文系の学生や研究者にもなじみやすいよう数理的な背景は省略し、実践的な操作手順や事例を中心に説明を進める予定である。ただしRについては基本操作ができることを前提とする。Rとその基礎については教科書第3章が参考になる。なお当日は受講者各自でノートパソコンを持参されたい。 教科書 : 石田基広(2008)『Rによるテキストマイニング入門』森北出版 【お知らせ】 当研究所内及びその付近には、食堂および売店はありません。(最寄りのコンビニエンスストアまで徒歩15分弱) 飲み物と昼食は各自ご持参ください。 |
時間割 | ![]() |
会場 | 統計数理研究所 (立川) 講堂 研究所周辺の地図 |
開場 | 9時30分 |