平成6(1994)年度 共同研究A実施報告書
課題番号 |
6−共研−94 |
専門分類 |
8 |
|||||
研究課題名 |
タグ付き英語文章コーパスの統計的解析 |
|||||||
フリガナ 代表者氏名 |
タカハシ カオル 高橋 薫 |
ローマ字 |
|
|||||
所属機関 |
豊田工業高等専門学校 |
|||||||
所属部局 |
|
|||||||
職 名 |
助教授 |
|||||||
所在地 |
|
|||||||
TEL |
|
FAX |
|
|||||
|
|
|||||||
URL |
|
|||||||
配分経費 |
研究費 |
0千円 |
旅 費 |
0千円 |
研究参加者数 |
5 人 |
研究目的と成果(経過)の概要 |
15種類のカテゴリーからなる百万語の英文コーパス(LOB Corpus)のそれぞれの単語に付与されているタグ(品詞情報に関する134種類の記号)に注目し、様々な文体的特徴の数量化をコンピュータを用いて行うことを目的とする。このことによって、従来の語彙レベルの解析が句、節の解析にまで高められることが期待できる。 |
当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等) |
*高橋 薫「文法範疇標示コーパスにおける文体的特徴の推測」コーパス研究会紀要、2号 1995年3月 |
研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。 |
百万語の各単語の品詞情報を示すタグが論説文、随筆、学術書、各小説等、15種類のカテゴリーでいかなる連結をしているのかを統計的に分析し、比較する。それにより、文体的な特徴が明らかになることを予測して研究を進めている。今までのところ、タグの頻度に注目し、多変量統計解析を行った結果、口語文と文語文には明らかな差異が現れることが判明した。 |
研究参加者一覧 |
|
氏名 |
所属機関 |
駒澤 勉 |
統計数理研究所 |
Jin Ming-Zhe |
札幌学院大学 |
古橋 聰 |
中京大学 |
村上 征勝 |
統計数理研究所 |