平成23(2011)年度 一般研究2実施報告書
課題番号 |
23−共研−2026 |
分野分類 |
統計数理研究所内分野分類 |
d |
||||||
主要研究分野分類 |
6 |
|||||||||
研究課題名 |
イギリスの巨大コーパスにおける新聞サブコーパスの統計学的言語比較研究 |
|||||||||
フリガナ 代表者氏名 |
タカミ サトコ 高見 敏子 |
ローマ字 |
TAKAMI SATOKO |
|||||||
所属機関 |
北海道大学 |
|||||||||
所属部局 |
大学院メディア・コミュニケーション研究院 |
|||||||||
職 名 |
准教授 |
|||||||||
配分経費 |
研究費 |
40千円 |
旅 費 |
53千円 |
研究参加者数 |
2 人 |
研究目的と成果(経過)の概要 |
本研究の目的は、イギリスの巨大コーパスであるBank of English(BoE)やBritish National Corpus(BNC)に含まれる複数の新聞サブコーパスの語彙頻度・品詞比率などのデータに多変量解析を適用して、高級紙・大衆紙という対立だけでなく、より多角的な視点から分析を深めることである。今年度は改めて作り直した品詞(part-of-speech, POS)タグの相対頻度データにクラスター分析(ウォード法、平方距離を選択)を適用して、BoEとBNCのそれぞれ大衆紙2紙、高級紙3紙の計5紙の英国紙サブコーパス相互の非類似度(距離)関係を調べた。(BNCはテキストファイルの集合体であり、「サブコーパス」という分類はなされていないが、ここでは便宜上同じ新聞のテキストを集めたものを「サブコーパス」と呼ぶこととする。) |
当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等) |
高見敏子 (forthcoming) 「Bank of EnglishとBritsh National Corpusにおける英国全国紙のPOSタグ分布」 『The Northern Review』No. 38, pp.1-29. [2012年5月刊行予定] |
研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。 |
2012年3月7日(水)〜8日(木)に統計数理研究所で開催された統計数理研究所言語系共同研究グループ合同発表会「言語研究と統計2012」にて口頭発表(発表題目「BNCとBoEにおける英国全国紙の語彙頻度データの分析」)。出席者数:55名程度。 |
研究参加者一覧 |
|
氏名 |
所属機関 |