平成5(1993)年度 共同研究A実施報告書
課題番号 |
5−共研−93 |
専門分類 |
8 |
|||||
研究課題名 |
タグ付き英語文章コーパスの統計的解析 |
|||||||
フリガナ 代表者氏名 |
タカハシ カオル 高橋 薫 |
ローマ字 |
|
|||||
所属機関 |
豊田工業高等専門学校 |
|||||||
所属部局 |
|
|||||||
職 名 |
助教授 |
|||||||
所在地 |
|
|||||||
TEL |
|
FAX |
|
|||||
|
|
|||||||
URL |
|
|||||||
配分経費 |
研究費 |
0千円 |
旅 費 |
0千円 |
研究参加者数 |
5 人 |
研究目的と成果(経過)の概要 |
15種類のカテゴリーからなる百万語の英文コーパス(LOB Corpus)のそれぞれの単語に付与されているタグ(品詞情報に関する134種類の記号)に注目し、様々な文体的特徴の数量化をコンピュータを用いて行うことを目的とする。このことによって、従来の語彙レベルの解析が句、節の解析にまで高められることが期待できる。 |
当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等) |
1。高橋 薫 「検索処理における頻度についての問題」 英語コーパス研究第1号 1994年 |
研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。 |
百万語の各単語の品詞情報を示すタグが論説文、随筆、学術書、各小説等、15種類のカテゴリーでいかなる連結をしているのかを統計的に分析し、比較する。それにより、文体的な特徴が明らかになると推測できる。 |
研究参加者一覧 |
|
氏名 |
所属機関 |
駒澤 勉 |
統計数理研究所 |
Jin Ming-Zhe |
札幌学院大学 |
古橋 聰 |
中京大学 |
村上 征勝 |
統計数理研究所 |