平成302018)年度 一般研究1実施報告書

 

課題番号

30−共研−1027

分野分類

統計数理研究所内分野分類

h

主要研究分野分類

2

研究課題名

深層学習による画像処理と自然言語処理の融合

フリガナ

代表者氏名

モチハシ ダイチ

持橋 大地

ローマ字

Mochihashi Daichi

所属機関

統計数理研究所

所属部局

数理・推論研究系

職  名

准教授

 

 

研究目的と成果(経過)の概要

自然言語処理においては長く、デジタル化されたテキストデータが対象として使われてきた。しかし、古い書籍や新聞、法律文書や書道作品、果ては楔形文字の粘土板に至るまで、写真として画像化された貴重な文書データは大量に存在し、その有用性ははるかに大きい。本研究ではこのために、画像を高精度に取り扱うことのできる深層学習の手法を自然言語処理と結びつけることにより、文書の画像データから直接自然言語処理を可能にするための方法論について基礎的な研究を行う。具体的には、画像からの本文領域抽出、抽出した本文からのOCR、背景の汚れや印鑑などの統計的除去、フォントの取り扱い、新聞等の場合の読み順の推定など多岐に渡る研究課題がある。
初年度は、画像からの本文領域抽出によって本文テキストを抽出できるようにすることを目標として研究を行っている。

 

当該研究に関する情報源(論文発表、学会発表、プレプリント、ホームページ等)

「CNNを用いた近代文献画像からのテキスト領域抽出」. 永野雄大, 幡谷龍一郎, 持橋大地, 増田勝也. 電子情報通信学会 PRMU研究会, PRMU2018-47, pp.73-78, 2018.

研究会を開催した場合は、テーマ・日時・場所・参加者数を記入してください。

採択日以降では、
日付:2018/10/26、2018/12/12、2019/1/8
場所:東京大学 第二本部棟
テーマ:レイアウト解析について
参加者数:4名〜5名 (Ahn氏が参加の場合あり)

 

研究参加者一覧

氏名

所属機関

筒井 瑳斗志

インディアナ大学

永野 雄大

東京大学

幡谷 龍一郎

東京大学

増田 勝也

東京大学