平成242012)年度 一般研究2実施報告書

 

課題番号

24−共研−2023

分野分類

統計数理研究所内分野分類

d

主要研究分野分類

6

研究課題名

科学技術コーパスの特徴表現分析と教育への応用

フリガナ

代表者氏名

コヤマ ユキエ

小山 由紀江

ローマ字

KOYAMA YUKIE

所属機関

名古屋工業大学大学院

所属部局

工学研究科

職  名

教授

配分経費

研究費

40千円

旅 費

130千円

研究参加者数

6 人

 

 

研究目的と成果(経過)の概要

本研究の目的は 1. 重要語句抽出の基本となるコーパスの見直しと、2. 科学技術分野の重要語句抽出の教育的応用であるが、2.はさらに1) 科学技術英語力を推定するCATの開発と 2) 科学技術英文作成支援システムの改善 に分けられる。

1.コーパスの見直し
高校の英語と専門英語の間の橋渡しとして、英米の高等学校の教科書の内容を前年度からコーパス化しているが、昨年のPhysicsに引き続いて2012-13年はBiologyの教科書をデジタル化しテキスト抽出した。今後は,科学技術英文作成支援システムに既に実装されている科学技術論文のコーパスにこれら英語圏の高校教科書のコーパスを加え,引き続きシステムの改善と評価測定を行っていく予定である。(藤枝)
2.1)科学技術英語CATの開発
まず工学の4分野(応用物理、生物工学、機械工学、電気工学)のコーパス約200万語を対象とした分析結果を用いて重要語句のアイテム作成を行った。語彙 の項目は以上の4分野に「構造工学」を加えた約260万語を分析した結果を用いた。いずれも全ての分野に出現する語(語句)を頻度順に高いものから選び、それらの語(語句)を用いた文章を作成して問題とした。語句については今回は連続した語から成るものだけを対象としたため、n-gramの抽出によって対象を 限定した。さらに項目の難易度を推定するアルゴリズムとしてはLRT(Latent Rank Theory) を使用し、このレベル分けによってCATの出題項目が決定された。しかし、今回のパイロット実施の結果では、受検時間、受検項目数等において、CATのメ リットが明らかに示されたわけではなく、中には受検項目数が設定された「最大」の数になった受検者もいた。識別力の低い項目の吟味、シミュレーションの十分な実施等、より精確に科学技術英語力を測定するための今後の課題が明らかとなった。(小山) 
また受検者のCAT受検後の反応からCAT受検によって英語の能力に自信喪失することが解り、別のCATシステムを用いて目標正答確率を通常のCATの50%から70%に引き上げて出題するようにアルゴリズムの見直しを行った。この場合、出題数は数題増えるが終了条件も結果の精度も50%の場合と殆ど変らず、70%の場合の方が英語 テストに対する不安感が軽減することが分かった。(木村)
2. 2)科学技術英文作成支援システムの改善
本年はH23年度までに開発していた本システムの評価をまず行った。14人の被験者に学術論文から抜粋した4つの日本語の文章を英語に訳してもらい、その 後、システムを使ってその英文を書きなおし、pre- と post- の英文をそれぞれ採点した。さらにこのシステムに関する質問紙調査も同時に行った。システムを使った英文と使わないで書いた英文の得点間には 有意差は無かった。また、質問紙ではシステムの利用が難しく、慣れるまでに時間がかかることが指摘された。(小山、藤枝、宮崎)
以上の結果を受けて、本システムに「パターン検索機能」を追加する改良が加えられた。この機能改良により、より速やかにパターンが示されるようになったが、従来の類 似文検索とのツールとしての融合が未完成である。利用者履歴の応用など、この新機能の付加されたシステムについても今後さらに改良の必要があることが明らかになった。(宮崎)


 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

[論文]
統計数理研究所共同研究リポート295「科学技術コーパスの特徴表現分析と教育への応用」 2013年3月、統計数理研究所

藤枝 美穂
「放射線科学分野の英語特徴語彙:大学専門基礎教科書の場合」1-18
中野 智文 
「ESP における語彙頻度の平滑化と未知語率推定に関する考察」19-27
小山 由紀江
「科学技術コーパスの分析に基づくアイテム・バンクの構築と潜在ランク理論によるコンピュータ・アダプティブ・テストの試行」29-49
木村 哲夫
「コンピュータ適応型テストの心理学的側面:受験印象を改善するために目標正答確率を調整するシステムの実装」51-70
山本 昇平・宮崎 佳典 
「技術文献コーパスを用いた英文書作成支援ツールの開発 -類似文検索機能とパターン検索機能-」71-95

[学会]
1. Yukie Koyama, Yoshinori Miyazaki, Shosaku Tanaka, Miho Fujieda,
Development of Corpus-assisted Research Paper Writing System for Science and Technology Students, 5th Independent Learning Association Conference 2012, Aug.30-September2, 2012, University of Victoria, Wellington

2. 小山由紀江、宮崎佳典、藤枝美穂、田中省作、
科学技術コーパスに基づいた 英語論文ライティング支援システムの構築とその評価、第28回日本教育工学会全国大会、2012年9月15-17日、長崎大学

3. 小山由紀江
コーパスとESP -科学技術英語のテキスト分析諸相-、北海道大学メディア・コミュニケーション研究院研究会「計量的言語研究の諸相」、2012年9月19日、北海道大学


研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

テーマ:「言語研究と統計2013」(他の言語統計関連共同利用グループと共催)
日時:2013年3月27日11時-28日17時10分
場所:統計数理研究所
参加者数:54
http://language.sakura.ne.jp/s/stat.html

本グループのメンバーの各発表タイトルは以下の通り
小山由紀江
科学技術コーパスの分析に基づくアイテム・バンクの構築と潜在ランク理論によるコンピュータ・アダプティブ・テストの試行
木村哲夫
コンピュータ適応型テストの心理学的側面:受験印象を改善するために目標正答確率を調整するシステムの実装
藤枝美穂
専門英語教育のための特徴語彙の抽出?放射線科学における専門教科書と研究論文
中野智文
ESPにおける語彙頻度の平滑化と未知語率推定に関する考察



 

研究参加者一覧

氏名

所属機関

木村 哲夫

新潟青陵大学

中野 智文

NTTレゾナント

藤枝 美穂

京都医療科学大学

前田 忠彦

統計数理研究所

宮崎 佳典

静岡大学