平成222010)年度 重点型研究実施報告書

 

課題番号

22−共研−4209

分野分類

統計数理研究所内分野分類

e

主要研究分野分類

6

研究課題名

コーパスを用いた記述的言語研究と統計

重点テーマ

言語と統計

フリガナ

代表者氏名

イシカワ シンイチロウ

石川 慎一郎

ローマ字

Shin’ichiro ISHIKAWA

所属機関

神戸大学

所属部局

国際コミュニケーションセンター/国際文化学研究科

職  名

准教授

配分経費

研究費

0千円

旅 費

0千円

研究参加者数

8 人

 

研究目的と成果(経過)の概要

(目的)
 大規模テクストデータベースの分析によって言語の傾向を特定するコーパス言語学においては,大量の計量データが得られるが,それらを処理する統計手法については必ずしも十分に整理なされていないのが実情である。これまでのプロジェクトにおいて,言語コーパス研究に使用可能な主要統計手法の概観はおよそ完了したが,今後重要になってくるのは,各手法を用いた具体的な言語データの分析実例の作成・収集である。本研究では,新たに日本語コーパス研究やドイツ語コーパス研究の視点を導入し,各種の統計分析手法をコーパスを用いた記述的言語研究にどう活かすかを検討し,分析の実例パッケージを作成することを目指す。

(成果)
 年間2回の研究会を実施し,上記の目標に沿って研究活動を行った。プロジェクトメンバーは,各自の研究バックグラウンドをふまえ,因子分析・主成分分析・対応分析・判別分析などの統計手法を用いて,それぞれが関心を持つドイツ語・英語・日本語のテキストの分析に取り組んだ。研究成果は年度末に刊行した報告書にまとめられている。報告書の所収論文は,分析の対象とする言語種別においても,分析手法においても,また,分析のウェイトの置きようにおいても,それぞれ多様なものであり,「分析の実例パッケージ」を構築するというプロジェクトの目標は大筋において達成されたと言える。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

統計数理研究所共同研究レポート『コーパスを用いた記述的言語研究と統計』(2011年3月刊)所収論文

井上 聡
「英語学習者の主要動詞に対する意識の可視化?統計手法に基づく学習者のアンケート調査?」
紙西 達也
「教育的観点に基づく英語重要コロケーション抽出の試み?コーパスデータと教師の直観の関係?」
今道 晴彦
「リーダビリティと品詞分布から見た学術ドイツ語の文体特性?人文・社会科学系論文を例として?」
李 允昊
「複合動詞の後項動詞『〜込む』の意味特性について?類義語『〜込める』『〜入る』『〜入れる』との比較?」
郭 奐君
「カタカナ語サ変動詞における『を』の出現条件について?コーパスを用いた計量的研究?」
石川 慎一郎
「統計手法を用いた言語データ分類の問題点?BCCWJにおける確信度を示す日本語推量副詞の分類をめぐって?」

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

会合名:言語系共同研究グループ合同研究発表会(非公開)
年 月:2010年8月
参加者:約20名
会 場:統計数理研究所
内 容:重点研究メンバーの研究報告と研究討議

会合名:言語系共同研究グループ公開合同研究発表会「言語研究と統計2011」
年 月:2011年3月
参加者:約15名
会 場:統計数理研究所
内 容:重点研究メンバーの研究方向と研究討議

 

研究参加者一覧

氏名

所属機関

李 允昊

神戸大学

井上 聡

神戸大学

今道 晴彦

神戸大学

郭 奐君

神戸大学

紙西 達也

神戸大学

中尾 桂子

大妻女子大学短期大学部

前田 忠彦

統計数理研究所