平成272015)年度 一般研究2実施報告書

 

課題番号

27−共研−2027

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

6

研究課題名

難易度の異なるESPコーパスの分析と教育への多面的応用

フリガナ

代表者氏名

コヤマ ユキエ

小山 由紀江

ローマ字

Koyama Yukie

所属機関

名古屋工業大学大学院

所属部局

工学研究科

職  名

教授

配分経費

研究費

40千円

旅 費

117千円

研究参加者数

8 人

 

 

研究目的と成果(経過)の概要

本研究は,1)科学技術関連文書コーパスの分析と,2)英作文支援システムとコンピュータ適応型テスト (CAT)という教育への応用部分に分けられる.H27年度はこれまで継続して構築してきた科学技術関連英語コーパスをさらに拡充し,また教育的応用部分として開発してきた英作文支援システムやCATシステムを改良することを目的として研究を行った.以下,それぞれの部分に従って今年度の研究結果を報告する.

1. 科学技術関連コーパス分析:新規コーパスの追加
長年構築してきた工学関連分野の学術論文と一般科学雑誌のコーパスに加え,3年前から大学低学年の学習者を対象として英語圏高等学校の理科教科書(Holt社の3冊の教科書Physics, Biology, Chemistry)のコーパスを構築してきた.この理科教科書コーパスを量的に拡充することが一つ目の課題である.これについては,テキストの整形作業がさらに必要であるが,上記の3冊に加え,オープンエジュケーションを推進している非営利団体CK-12が公開している無料教科書4冊分(Basic Physics - Second Ed, Biology I - Honors, Chemistry - Basic, Engineering - An Introduction for High School)のテキスト,約50万語を追加した.これにより大学低学年により適切な学習語彙・語句のリストを作成し,今後CAT等の項目作成にも応用することが可能となった.

2. 1 科学技術英文作成支援システムの改良と再評価
本システムは,非英語母語話者による科学技術英文作成支援を目指したシステムであり,英語科学技術コーパスの中からユーザによる入力英文に近い英文を検索,例示する.今年度は,本システムの高度化のために,主に次のような研究を行った.
本システムの有効性を示すためにユーザ実験(国内私立大学73名)を行い,以下の3種類のタスクを与えた:1)和文英訳,2)与えられた日英文ペアに対し,英文を日本語文に合わせて校正,3)コーパス内英文を日本語訳したものを与え,元のコーパス内英文を同定.それに伴い,被験者の行動履歴が時系列で効率よく閲覧できるようなWeb上のツールも開発を行った.被験者による具体的な修正例を蓄積し,被験者の挙動・修正動作を把握可能となり,その分析結果も示した.
また,本システムの問題点の一つとして,検索結果が文脈もなしに表示されることもあり,ときに複雑過ぎて,うまく参照できないということがあった.近年,表層的観点で共通性を有す英文集合を簡単化する方法の開発と,本システムの出力モジュールとしての実装を進めている.昨年度より,構文情報まで考慮した方法を提案しているが,今年度はその簡単化手続きを形式的に記述し,定式化した.

2. 2 科学技術語彙・語句CATの改良と妥当性の検証
 本研究のCAT(コンピュータ適応型テスティング)システムは4年前から研究代表者を中心として開発に着手した(小山・木村,2011)ものである.本CATは科学技術コーパス分析から得た語彙・語句をターゲットとしてテスト項目を作成し,ラッシュモデルによる項目分析に基づいたCATをmoodleのモジュールを使って実施する点が特徴である.
今年度は昨年度実施の実施結果で明らかとなった項目の難易度分布が適切でない問題を解決することを目的とし,新たな項目を追加した.この新項目は1.で昨年度追加した生物,物理,化学の教科書コーパスを分析した結果を用いたもので,これまでの科学技術学術論文等のコーパスと比較し易しい語彙が含まれているため問題の難度も低くなることが予想されたためである.この分析結果を用いて,これまでの180問に新たに61問追加され,本CATの項目バンク全体は241問となった.また記入式を増やすなど問題形式も多様にした.その結果, 昨年度十分な項目数のなかった項目困難度 -1.5〜1.0に該当する項目が増え,測定の精度も改善された.今年度のCAT実施の結果では予備試験とCATの結果の相関係数が .54から .68へ上昇した.しかし,依然として-1.0〜0.0 の項目数が不足していることが明らかとなったため,より妥当性信頼性の高いCATを実現するためには今後も適切な困難度の項目を追加することが必要である.また追加項目による項目バンク改善にも現実的な困難があるため,Multistage Testingを視野に入れた手法も研究する必要があると思われる.

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

【論文発表】

木村哲夫. (2016). 「コンピュータ適応型テストの心理学的側面:目標政党確立を調整するシステムへの日本人大学生の反応」統計数理研究所共同研究リポート356,47-56.

木村哲夫. (2016). 「小規模ESP 語彙マルチステージ・テスティング開発の方策--既存のアイテムバンクを使って」石川有香,他(編)『言語研究と量的アプローチ』(金星堂)179-201.

小山由紀江, 木村哲夫. (2016). 「コンピュータ適応型ESPテストの改良-- 科学技術英語の語彙・語句テストを例として」 統計数理研究所共同研究リポート356,57-71.

小山由紀江, 木村哲夫. (2015).「小規模コンピュータ適応型ESPテストの作成と改良」JSET31講演論文集, pp.285-286.

中野智文. (2016). 「ベルヌーイ分布における超パラメータ推定のためのパイロットスタディ」統計数理研究所共同研究リポート356,27-34

藤枝美穂.(2016). 「コーパスを利用したESP語彙研究?医療分野における学習語彙表の開発を中心に?」石川有香,他(編)『言語研究と量的アプローチ』(金星堂)95-107.

藤枝美穂.(2016).「医療系学生向けESP語彙テスト開発のためのパイロットスタディ」統計数理研究所共同リポート356, 35-46.

宮崎佳典.(2016).「科学技術コーパスに基づいた英文書作成支援システムの構築」石川有香,他(編)『言語研究と量的アプローチ』(金星堂), 229-240.

宮崎佳典, 戸沢信晴, 田中省作.(2016).「コーパスを用いた技術英文書作成援用ツールの開発とその評価」統計数理研究所共同研究リポート356,1-16.

渡部孝幸, 田中省作, 宮崎佳典.(2016).「英文汎化における語の品詞化と構文木の非冗長化」統計数理研究所共同研究リポート356,17-25.


【学会発表】

天野翼, 渡部孝幸, 田中省作, 宮崎佳典.(2016)「構文情報を考慮した検索英文集合に対する汎化手法」第14回情報科学技術フォーラム(FIT),愛媛大学(2015年9月)

天野 翼, 渡部 孝幸, 田中 省作, 宮崎 佳典.(2016)「共起関係ならびに構文情報を考慮した英文汎化と英作文支援」2015年度JSiSE学生研究発表会(東海地区),名城大学名駅サテライト(2016年2月)

Kimura, T. & Koyama, Y.. Implementation of small-scale in-house CAT with corpus-driven lexical item bank for ESP. FLEAT VI Boston, USA, http://sched.co/3Mzo. (August, 2015)

Kimura, T. & Koyama, Y.. Improvement and evaluation of a small scale ESP CAT. IACAT Conference 2015 Cambridge, UK.(August, 2015)

木村哲夫.「目標正答確率を調整するCATシステムへの日本人大学生の反応」言語研究と統計2016,統計数理研究所(2016年3月)

小山由紀江, 木村哲夫.「ESPコーパス分析による項目作成とコンピュータ適応型テスト」LET55, 千里ライフサイエンスセンター (2015年8月)

戸沢信晴, 宮崎佳典, 長谷川由美, 田中省作, (2015)「コーパスを用いた技術英文書作成援用ツールの開発とその評価」日本e-Learning学会2015年度学術講演会, 静岡大学浜松キャンパス(2015年10月)

中野智文. 「ベルヌーイ分布における超パラメータ推定のための経験ベイズ法の実装」言語研究と統計2016,統計数理研究所(2016年3月)

Fujieda, M. Integrating multiword unit analysis in corpus-informed ESP wordlist. EuroSLA, Aix-en-Provence, France (August, 2015)

宮崎佳典, 田中省作.「コーパスを用いた技術英文書作成援用ツールの開発とその評価」言語研究と統計2016,統計数理研究所(2016年3月)

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

「言語研究と統計2016」(セミナーシリーズ Vol.11)
統計数理研究所言語系共同研究グループ合同発表会 言語研究と統計2016
●日時:2016年3月15日(火) 10:30〜18:00/16日(水) 09:30〜16:00 
●会場:統計数理研究所(東京都立川市緑町 10-3)
●オーガナイザー 田畑智司(大阪大学),指導講話 前田忠彦(統計数理研究所)
参加者人数 49名

 

研究参加者一覧

氏名

所属機関

金子 恵美子

会津大学

木村 哲夫

新潟青陵大学

田中 省作

立命館大学

中野 智文

株式会社VOYAGE GROUP

藤枝 美穂

京都医療科学大学

前田 忠彦

統計数理研究所

宮崎 佳典

静岡大学