平成212009)年度 重点型研究実施報告書

 

課題番号

21−共研−4306

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

6

研究課題名

言語コーパス分析における数理データの統計的処理手法の検討

重点テーマ

言語と統計

フリガナ

代表者氏名

イシカワシンイチロウ

石川 慎一郎

ローマ字

Shin’ichiro ISHIKAWA

所属機関

神戸大学

所属部局

国際コミュニケーションセンター/国際文化学研究科

職  名

准教授

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

4 人

 

研究目的と成果(経過)の概要

(目的)
 言語研究の新しい方法論としてコーパス言語学に対する注目が集まっている。コーパス言語学ではさまざまな数量データを扱うことになるが,それらを処理する統計手法については必ずしも十分に整理なされていないのが学界の実情である。たとえば,コーパス言語学では,AコーパスとBコーパス間での単語Xの頻度の差を調べて,2つのコーパスの特性の違いを分析するアプローチがしばしば採用されるが,本来,頻度差を基に何らかの議論を行うためには,カイ二乗検定ないしフィッシャーの正確性検定などを利用して有意差検定を行っておく必要がある。本プロジェクトでは,2008年度のプロジェクトを継承し,平均・標準偏差からはじめて多変量解析にいたる各種の基礎的統計手法を言語分析という観点に即して整理し,言語研究に真に必要な手法の精選を行う。
(成果の概要)
本研究プロジェクトにより,コーパス言語学の研究の実行に必要な統計手法を精選し,それぞれについて基礎的な解説と概観を行うことが達成できた。具体的には数次の研究会,ML上での討議を経て,石川・中尾・水本の3名がそれぞれ報告書に論文を執筆した。また,研究プロジェクトに関わる関連論文として4本の論文をあわせて掲載した。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

下記は年度末報告書掲載論文の一覧である。括弧内は各論文の分量である。

水本 篤 「サンプルサイズが小さい場合の統計的検定の比較:コーパス言語学・外国語教育学への適応」(14p)
石川 慎一郎 「『現代日本語書き言葉均衡コーパス』(BCCWJ)における複合動詞『〜出す』の量的分析」(19p)
中尾 桂子 「教師に意識される学生の文章表現上の問題と学生作文の性質の違い」(12p)
李 允昊(イ・ユノ)・石川 慎一郎 「主成分分析を用いた語彙重要度情報の合成:日本語教育のための重要『〜込む』型複合動詞の選定」(17p)
野田 盛一朗・石川 慎一郎 「日本人英語学習者の強意詞使用:学習者コーパスを使用した統計的分析」(10p)
郭 奐君(カク・カンクン)・石川 慎一郎 「日本語コーパスからの重要カタカナ語の抽出:統計的手法の応用」(17p)
井上 聡・石川 慎一郎 「学習者コーパスに見る使役動詞makeの使用の現状:統計的手法に基づいて」(14p)

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

他の研究グループとの共同で,2010年3月27〜28日に「言語研究と統計2010」を大妻女子大学において開催した。参加者は外部21名(概数),プロジェクト内部16名である。当該研究グループからは下記の2名が発表を行った。

石川慎一郎(神戸大学)
「頻度を取り出すことで分かりだすこと:BCCWJに見る日本語複合動詞『〜出す』の用法」
中尾桂子(大妻女子大学)
「教師に意識される学生の文章表現上の問題と学生作文の性質について」

 

研究参加者一覧

氏名

所属機関

中尾桂子

大妻女子大学短期大学部

前田 忠彦

統計数理研究所

水本篤

流通科学大学