平成22(2010)年度 重点型研究実施報告書
課題番号 |
22−共研−4201 |
分野分類 |
統計数理研究所内分野分類 |
b |
||||||
主要研究分野分類 |
2 |
|||||||||
研究課題名 |
統計手法に基づく未知語の意味推定 |
|||||||||
重点テーマ |
言語と統計 |
|||||||||
フリガナ 代表者氏名 |
フクモト フミヨ 福本 文代 |
ローマ字 |
Fukumoto Fumiyo |
|||||||
所属機関 |
山梨大学 |
|||||||||
所属部局 |
大学院医学工学総合研究部 生体環境医工学系 |
|||||||||
職 名 |
准教授 |
|||||||||
配分経費 |
研究費 |
0千円 |
旅 費 |
0千円 |
研究参加者数 |
1 人 |
研究目的と成果(経過)の概要 |
知的な知識処理を実現するための技術として, 自然言語の意味処理技術に関心が寄せられ, 実際に利用されつつある. 自然言語の意味処理を行うためには言語知識を大量にもつことが必要となるが, 特に語彙知識は各種の意味処理において必須の知識源となる。語彙知識源として利用されている日本語辞書の一つに分類語彙表(国立国語研究所)と呼ばれる語彙辞書がある. 分類語彙表は87,743語からなる基本単語が人手により32,636クラスに分類されている.従って1クラスあたりの語彙数は2.69であり,大規模データを網羅しているとはいい難い. 従って文書データ中の単語を分類語彙表の分類体系に分類する手法が確立できれば, 次々と創り出され使用される新語に対しても機械処理が可能となり, 情報爆発時代に真に対処可能な知的基盤技術を構築することが可能となる. |
当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等) |
“Semantic Classification of Unknown Words based on Graph-based Semi-supervised Clustering”, F. Fukumoto and Y. Suzuki, International Conference on Knowledge Engineering and Ontology Development, 2011 (論文投稿中) |
研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。 |
テーマ:[言語と統計]研究報告会] |
研究参加者一覧 |
|
氏名 |
所属機関 |