JP2012220666A

JP2012220666A - 読解問題回答装置、方法、及びプログラム

Info

Publication number: JP2012220666A
Application number: JP2011085348A
Authority: JP
Inventors: Kaname Kasahara; 要笠原; Hiroyori Taira; 博順平; Masaaki Nagata; 昌明永田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2011-04-07
Filing date: 2011-04-07
Publication date: 2012-11-12

Abstract

【課題】問題文が質問文の内容を含意するか否かを精度良く判定する。
【解決手段】事態抽出部１４で、問題文及び質問文各々において、１つの述語を含む部分の性質を表す事態属性をその述語に付与すると共に、述語を原型に変形し、述語に付与された属性と共に、事態属性が付与された１つの述語及びその述語に直接係る句、または述語に直接係る句が存在しない場合には１つの述語を事態として抽出する。句追加部１６で、問題文及び質問文の照応解析結果に基づいて、各事態の述語に直接係る句が省略されているか否かを判定し、省略された句が存在する場合には、その句を事態に追加する。事態比較判定部１８で、問題文から抽出された事態（句が追加された場合には句追加後の事態）及び事態属性の組と、質問文から抽出された事態（句が追加された場合には句追加後の事態）及び事態属性との組とを比較して、質問文が示す内容が問題文に含まれるか否かを判定する。
【選択図】図１

Description

本発明は、読解問題回答装置、方法、及びプログラムに係り、特に、問題文が質問文の内容を含むか含まないかを回答する読解問題回答装置、方法、及びプログラムに関する。

近年、コンピュータ及び周辺機器の高機能及び低価格化に伴い、パーソナルコンピュータだけでなく、携帯電話、電子書籍端末、交通システム等、コンピュータが組み込まれた機器やシステムが社会に急速に普及しており、日常で利用することが必須になりつつある。一方、人がコンピュータに指示をするときには、コンピュータ毎に予め定義された方法（例えば、選択肢を表すボタンの押下、語句を表す文字のキーボード入力や音声入力等）のみを受け付ける。そのため、コンピュータに不慣れな高齢者や子供等がコンピュータを含む機器やシステムを適切に操作できないことがあり、問題となっている。

このような問題を解決する技術の１つとして、コンピュータによる読解問題回答技術がある。この技術は、国語や外国語学習者の文章読解力を計るためのテストをコンピュータで自動解答するものである。この技術を応用することにより、音声やテキストにより入力された人の指示を、コンピュータが自動的に理解して、指示された処理を適切に実行することができるので、人が人に対して自然言語で自由に指示する場合と同様に、コンピュータを利用できるようになる。

読解問題のテストでは、文章（問題文章）を回答者が読んで、文章に関わる質問に対して選択肢、単語、文章等の指定された形式で回答する。また、コンピュータによる読解問題回答技術では、コンピュータに回答者の役割を実行させる。このような機能によって、人がコンピュータへ指示等を入力する場合に、人間に指示するように自由な自然言語で入力できるようになり、コンピュータを熟知していない人でも、手軽に利用できるようになる。

読解問題回答技術については、これまで、質問のタイプを限定した方法が提案されている。例えば、問題文章に関わる５Ｗ１Ｈ型の質問へ回答する方式（例えば、非特許文献１参照）や、問題文章に関連する文の空白部分に単語を埋める“穴埋め問題”に回答する方式（例えば、非特許文献２参照）が提案されている。これらの技術を利用すれば、例えば、コンピュータに地域の案内情報が書かれたテキストを蓄積しておき、場所に関する自然言語の質問が入力された際に、その場所に関わる案内情報が書かれたテキストを出力する案内システムを実現することができる。

また、読解問題の中には、問題に関する文章に対して質問として与えられたテキストの内容を含むか否かを問うものが多く存在する。このような問題に対する読解問題回答技術として、テキスト含意認識技術が様々提案されている（例えば、非特許文献３及び４参照）。この技術は、２つのテキストを比較して、意味内容の包含関係があるか否かを判定する処理であり、非特許文献３では、その応用として、コンピュータを用いた情報検索、文書比較、読解問題回答、質問応答、情報抽出、機械翻訳、言い換え表現獲得があると述べられている。

このようなテキスト含意認識技術を、読解問題回答技術に応用することで、コンピュータの処理に関する指示をテキストで蓄積しておけば、人が人に指示するように自由に自然言語で入力しても、その内容が含まれる指示に関わるテキストを探し出し、柔軟性が高い汎用の入力インターフェイスを実現可能である。

Lynette Hirschman, Marc Light, Eric Breck and John D. Burger. "Deep READ: a Reading Comprehension system." In Proc. of the 37th Annual Meeting of the Association for Computational Linguistics, pp. 325-332, 1999．関根聡、齋藤真実、岡田美江、井佐原均、「小学2 年生の問題を解く−電脳優子２年生・概要」、言語処理学会第１１回年次大会、ｐｐ．１０６８−１０７１、２００５． Ido Dagan, Oren Glickman and Bernardo Magnini. "The PASCAL Recognising Textual Entailment Challenge", Machine Learning Challenges. Lecture Notes in Computer Science, Vol. 3944, pp. 177-190, Springer, 2006. 笠原要、平博順、永田昌明、「複数文からなる文章読解タスクへのテキスト含意認識の適用可能性の検討」、言語処理学会年次大会、２０１０．

しかしながら、非特許文献１及び２の技術では、質問文のタイプが限定されているため、人に指示するように自由に自然言語で記述されたテキストをコンピュータが自動理解する目的に利用することは困難である、という問題がある。

また、非特許文献３のテキスト含意認識技術では、内容の包含性を比較するテキストは１文から数文程度を想定している。しかし、国語や外国語の読解問題では、１段落から数段落レベルの複数の文から問題文が構成されることがある。また、問題文章の内容を包含するかを問う質問文も数文で構成されることもある。

また、非特許文献４の技術では、複数文からなる問題文の読解問題に通常のテキスト含意認識技術を適用し評価及び分析を行っているが、単純に問題文章を一括または文個別にテキスト含意認識を適用し、その判定結果を集計した場合では、回答精度が高くない、という問題がある。

本発明は上記問題点に鑑みてなされたものであり、問題文が質問文の内容を含意するか否かを精度良く判定することができる読解問題回答装置、方法、及びプログラムを提供することを目的とする。

上記問題を解決するために、本発明の読解問題回答装置は、問題文及び質問文各々において、１つの述語を含む部分の性質を表す属性を該述語に付与し、前記述語に付与された属性と共に、前記１つの述語及び該述語に直接係る句、または前記述語に直接係る句が存在しない場合には前記１つの述語を事態として抽出する抽出手段と、前記問題文及び前記質問文各々の照応解析結果に基づいて、前記事態に含まれる述語に直接係る句が省略されている場合には、該省略された句を前記句が省略された事態に追加する追加手段と、前記問題文から抽出された句が省略されていない事態及び句が追加された事態と、前記質問文から抽出された句が省略されていない事態及び句が追加された事態とを比較すると共に、前記問題文から抽出された事態に付与された属性と、前記質問文から抽出された事態に付与された属性とを比較して、前記質問文が示す内容が前記問題文に含まれるか否かを判定する判定手段と、を含んで構成されている。

本発明の読解問題回答装置によれば、抽出手段が、問題文及び質問文各々において、１つの述語を含む部分の性質を表す属性を述語に付与し、述語に付与された属性と共に、１つの述語及び述語に直接係る句、及び述語に直接係る句が存在しない場合には１つの述語を事態として抽出する。そして、追加手段が、問題文及び質問文各々の照応解析結果に基づいて、事態に含まれる述語に直接係る句が省略されている場合には、省略された句を句が省略された事態に追加し、判定手段が、問題文から抽出された句が省略されていない事態及び句が追加された事態と、質問文から抽出された句が省略されていない事態及び句が追加された事態とを比較すると共に、問題文から抽出された事態に付与された属性と、質問文から抽出された事態に付与された属性とを比較して、質問文が示す内容が問題文に含まれるか否かを判定する。

このように、問題文及び質問文各々から属性を付与した事態を抽出することで、問題文及び質問文が示す内容に関する基本的な単位に基づいた処理が可能となり、また、各事態について省略された句を追加した上で、問題文の事態及び属性と質問文の事態及び属性との比較を行うため、内容の比較がより適切に行えるようになり、問題文が質問文の内容を含意するか否かを精度良く判定することができる。

また、前記判定手段は、前記問題文から抽出された句が省略されていない事態及び句が追加された事態の中に、前記質問文から抽出された句が省略されていない事態及び句が追加された事態各々に含まれる句及び述語を全て含む事態が存在すると共に、前記質問文から抽出された事態に付与された属性と、該事態に含まれる句及び述語を全て含む前記問題文から抽出された事態に付与された属性とが一致する場合に、前記質問文が示す内容が前記問題文に含まれると判定することができる。このような判定を行うことにより、より正確かつ厳格な判定を行うことができる。

また、前記抽出手段は、前記属性が付与された述語を原型に変形した事態を抽出することができる。これにより、事態に付与された属性によって事態の内容を保持したまま、より簡潔かつ柔軟な形で問題文の事態と質問文の事態とを比較することができる。

また、前記省略された句は、前記事態以外の文中に出現し、該事態に含まれる述語に直接係る句であって、該事態中に出現していない句、または代名詞もしくは指示詞に置き換わっている句である。

また、前記属性は、前記部分が示す時制、前記部分が示す内容が肯定か否定か、及び前記部分が示す内容が事実か思索かの少なくとも１つを区別する情報とすることができる。

また、本発明の読解問題回答方法は、抽出手段と、追加手段と、判定手段とを含む読解問題回答装置における読解問題回答方法であって、前記抽出手段は、問題文及び質問文各々において、１つの述語を含む部分の性質を表す属性を該述語に付与し、前記述語に付与された属性と共に、前記１つの述語及び該述語に直接係る句、または前記述語に直接係る句が存在しない場合には前記１つの述語を事態として抽出し、前記追加手段は、前記問題文及び前記質問文各々の照応解析結果に基づいて、前記事態に含まれる述語に直接係る句が省略されている場合には、該省略された句を前記句が省略された事態に追加し、前記判定手段は、前記問題文から抽出された句が省略されていない事態及び句が追加された事態と、前記質問文から抽出された句が省略されていない事態及び句が追加された事態とを比較すると共に、前記問題文から抽出された事態に付与された属性と、前記質問文から抽出された事態に付与された属性とを比較して、前記質問文が示す内容が前記問題文に含まれるか否かを判定する方法である。

また、本発明の読解問題回答プログラムは、コンピュータを、上記の読解問題回答装置を構成する各手段として機能させるためのプログラムである。

以上説明したように、本発明の読解問題回答装置、方法、及びプログラムによれば、問題文及び質問文各々から属性を付与した事態を抽出することで、問題文及び質問文が示す内容に関する基本的な単位に基づいた処理が可能となり、また、各事態について省略された句を追加した上で、問題文の事態及び属性と質問文の事態及び属性との比較を行うため、内容の比較がより適切に行えるようになり、問題文が質問文の内容を含意するか否かを精度良く判定することができる、という効果が得られる。

本実施の形態の読解問題回答装置の機能的構成を示すブロック図である。述語を含む部分と事態属性との対応表の一例を示す図である。本実施の形態の読解問題回答装置における読解問題回答処理ルーチンの内容を示すフローチャートである。問題文及び質問文の一例を示す図である。問題文及び質問文から抽出した事態及び付与された事態属性の一例を示す図である。省略された句が追加された事態の一例を示す図である。

以下、図面を参照して本発明の実施の形態を詳細に説明する。

本実施の形態に係る読解問題回答装置１０は、ＣＰＵ（Central Processing Unit）と、ＲＡＭ（Random Access Memory）と、後述する読解問題回答処理ルーチンを実行するためのプログラムを記憶したＲＯＭ（Read Only Memory）とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図１に示すように、入力部１２、事態抽出部１４、句追加部１６、及び事態比較判定部１８を含んだ構成で表すことができる。

入力部１２は、問題文及び質問文の入力を外部から受け付ける。問題文及び質問文は、それぞれ、自然言語形式のテキストデータであればよく、その内容は、新聞記事、小説、随筆、科学文献、日記等どのようなジャンルであってもよい。また、問題文及び質問文各々を構成する文の数は１以上であればその数は限定されない。また、入力データとして、問題文及び質問文の音声データを入力する場合は、音声データをテキストデータに変換する音声認識部を含んで構成するようにするとよい。

事態抽出部１４は、入力された問題文及び質問文各々から、事態の性質を現す事態属性が付与された事態を抽出する。事態は、１つの述語及びその述語に直接係る句、または述語に直接係る句が存在しない場合には１つの述語で構成されている。具体的には、問題文及び質問文各々を、句点によって１文ずつに分割し、各文について形態素解析処理を行い、その形態素解析結果に対して、句の判定及び係り受け関係を判定する係り受け解析処理を行う。各処理については、既存の形態素解析器（例えば、「黒橋禎夫、長尾真、１９９９、『日本語形態素解析システムＪＵＭＡＮ Version 3.61』、京都大学大学院情報学研究科」参照）や、構文解析器（例えば、「黒橋禎夫、長尾眞、「並列構造の検出に基づく長い日本語文の構文解析」、自然言語処理、Vol.1、No.1、pp.35-57(1994.10)」参照）を用いることができる。

また、事態抽出部１４は、事態を比較する際に区別すべき事態の性質を表す分類の値である事態属性を、各事態に付与する。事態属性は、例えば、｛現在，過去，未来｝、｛事実，思索｝、｛肯定，否定｝等とすることができる。事態属性は、上記３種類の事態属性の組それぞれについて頻出する値に該当する場合には、その値を付与しなくてもよく、少なくとも１つの性質を表す分類の値を付与すればよい。例えば、｛肯定，否定｝の事態属性の組については、「肯定」は頻出する値であるので、事態の性質が「肯定」であっても、事態属性として「肯定」を付与せず、事態の性質が「否定」の場合にのみ、事態属性として「否定」を付与するようにすることができる。また、例えば、｛現在，過去，未来｝については、いずれか１つの事態属性を付与することとしておくと、事態の性質が「肯定」及び「過去」を表す場合には、「過去」が事態属性として付与され、事態の性質が「否定」及び「過去」を表す場合には、「否定」及び「過去」が事態属性として付与される。

事態属性の付与方法は、単語や句またはこれらの組み合わせに対する事態属性の対応表を予め所定の記憶部に格納しておき、１文ずつに分解された問題文及び質問文各々に、対応表に定められた単語や句またはこれらの組み合わせが出現した場合に、対応する事態属性を記憶部に格納された対応表を参照して付与する。

事態の性質は、特に述語を含む部分に表れるため、例えば、図２に示すように、事態属性として｛現在，過去，未来｝及び｛事実，思索｝を用いて、１つの述語を含む表現と事態属性とを対応させた対応表を格納しておくことができる。述語を含む部分に対応した事態属性を付与する際には、付与された事態属性に応じてその述語を原型に変形する。例えば、述語を含む表現「なかった」に対応して事態属性「否定」及び「過去」が対応表に格納されている場合において、文中に「・・・・読まなかった。」という表現が出現した場合には、述語を含む部分「読まなかった」を述語の原型「読む」に変形すると共に、この述語に事態属性として「否定」及び「過去」を付与する。そして、この事態属性が付与された述語に直接係る句が存在する場合には、述語及びその述語に直接係る句を事態として抽出し、述語に直接係る句が存在しない場合には、述語のみを事態として抽出する。述語に付与された事態属性は、その述語を含む事態と共に抽出され、その事態の事態属性となる。

句追加部１６は、問題文及び質問文各々から抽出した各事態について、述語に直接係る句が省略されているか否かを判定し、省略されている句が存在する場合には、その句を事態に追加する。省略されている句とは、その事態中に直接現れない句や、代名詞や指示詞となっている句などである。省略されている句がある場合には、問題文及び質問文全体から、省略されている句に対応する句を抽出して、事態中の適切な位置に追加する。省略されている句の有無の判定、並びに省略されている句に対応する句の抽出及び追加する方法としては、既存の照応解析技術（例えば、「笹野遼平、黒橋禎夫、『小規模タグ付きコーパスと自動獲得した大規模語彙知識を用いた識別モデルに基づくゼロ照応解析』、情報処理学会第１９８回自然言語処理研究会(２０１０)．」参照）を用いることができる。

事態比較判定部１８は、事態抽出部１４で、質問文及び問題文各々から抽出した各事態及び各事態に付与された事態属性の組を順番に比較し、一致する組が存在するか否かを判定する。ここで、一致するとは、質問文から抽出された事態（句が追加された場合には句追加後の事態）各々について、問題文から抽出された事態（句が追加された場合には句追加後の事態）の中に、質問文から抽出された事態に含まれる句及び述語を全て含む事態が存在し、かつその問題文から抽出された事態の事態属性と質問文から抽出された事態の事態属性とが一致する場合をいう。質問文の事態及び事態属性の組の全てについて、一致する問題文の事態及び事態属性の組が存在する場合には、問題文が質問文の内容を含意することを示す値（「含む」）、１つでも一致しない場合には、問題文が質問文の内容を含意しないことを示す値（「含まない」）を、含意認識結果として出力する。

次に、図３を参照して、本実施の形態の読解問題回答装置１０において実行される読解問題回答処理ルーチンについて説明する。本実施の形態では、入力された問題文及び質問文に対して、問題文が質問文の内容を含意するか否かの含意認識結果を出力する読解問題回答処理について説明する。

ステップ１００で、問題文及び質問文の入力を外部から受け付ける。ここでは、図４に示すように、問題文「私は飛行機で島に向かうつもりだった。しかし、敢えて船で向かった。海は大変荒れていたが、島に到着した。」、及び質問文「私は船で島に向かい、到着した。」が取得されたものとする。

次に、ステップ１０２で、上記ステップ１００で取得した問題文及び質問文各々を、句点によって１文ずつに分割し、各文について形態素解析処理を行い、その形態素解析結果に対して、句の判定及び係り受け関係を判定する係り受け解析処理を行う。そして、例えば図２に示したような対応表を参照して、各文に出現した述語に事態属性を付与すると共に、付与した事態属性に応じて述語を原型に変形する。そして、この事態属性が付与された述語に直接係る句が存在する場合には、述語及びその述語に直接係る句を事態として抽出し、述語に直接係る句が存在しない場合には、述語のみを事態として抽出する。また、問題文から抽出された事態及び事態属性に順番に識別番号ｉ（ｉ＝１−１，１−２，・・・，１−ｎ：ｎは問題文から抽出された事態の数）を付与する。同様に、質問文から抽出した事態及び事態属性に順番に識別番号ｊ（ｊ＝２−１，２−２，・・・，２−ｍ：ｍは質問文から抽出された事態の数）を付与する。

問題文の１文目についてみると、「向かうつもりだった」の部分が、対応表の１行目の「述語＋つもりだった→思索，過去」に該当するため、事態属性として「思索」及び「過去」が付与される。また、述語を含む部分「向かうつもりだった」が述語の原型「向かう」に変形される。そして、この述語及び述語に直接係る句で表される［事態１−１］「私は飛行機で島に向かう」が、［事態属性１−１］「思索」及び「過去」が付与されて抽出される。

また、質問文の「私は船で島に向かい、到着した。」のように、１文中に２つ以上の述語が含まれる場合には、各事態について元の文の述語の並び方も考慮して対応表を参照する。質問文の例の場合、述語の並び方が対応表の３行目に該当するため、［事態２−１］及び［事態２−２］には、事態属性として「事実」及び「過去」が共に付与される。さらに、述語を含む部分「向かい」は述語の原型「向かう」に変形され、述語を含む部分「到着した」は述語の原型「到着する」に変形され、［事態２−１］「私は船で島に向かう」、及び［事態２−２］「到着する」が抽出される。

図５に、入力された問題文及び質問文から抽出された事態及び付与された事態属性を示す。各事態は、最後に述語、その前に句が並べられた構成となっている。なお、［事態２−２］は、１つの述語のみで構成された事態の例であり、その他の事態は、１つの述語及びその述語に直接係る句で構成された事態の例である。

次に、ステップ１０４で、変数ｉ及びｊに１をセットして、次に、ステップ１０６で、問題文及び質問文各々について、照応解析を行って、事態ｉ（または事態ｊ）について、述語に直接係る句が省略されているか否かを判定する。例えば、質問文の［事態２−２］については、元となる質問文全体の照応解析によって、［事態２−１］と並列な関係であることが分かるため、［事態２−２］においては、［事態２−１］に含まれている句が省略されていると判定する。句が省略されている場合には、ステップ１０８へ移行して、照応解析結果に基づいて、問題文及び質問文全体から省略されている句に対応する句を抽出して、事態中の適切な位置に追加する。［事態２−２］では、照応解析の結果から、「私は」及び「島に」が省略された句として抽出され、述語「到着する」の前に追加される。

また、例えば、［事態２−２’］として「そこに到着した」が抽出された場合には、照応解析結果に基づいて、［事態２−２’］における「そこに」は、［事態２−１］の「島に」が省略された句であると判定する。従って、［事態２−２’］の「そこに」の位置に「島に」を追加する。

一方、上記ステップ１０６で、句が省略されていないと判定された場合には、上記ステップ１０８をスキップして、ステップ１１０へ移行し、変数ｉがｎとなったか、及び変数ｊがｍとなったか、すなわち抽出された全ての事態について省略された句の有無の判定及び追加の処理を終了したか否かを判定する。未処理の事態が存在する場合には、ステップ１１２へ移行し、ｉを１インクリメント（ｉ＝ｎとなっている場合にはｊを１インクリメント）して、ステップ１０６へ戻り、処理を繰り返す。全ての事態について処理が終了した場合には、ステップ１１４へ移行する。図６に、句が追加された事態を示す。下線で示す部分が追加された句である。

ステップ１１４では、質問文から抽出された事態ｊ及び事態属性ｊの組それぞれについて、問題文の事態ｉ及び事態属性ｉの組と同一か否かを順番に比較する。質問文の事態ｊ及び事態属性ｊの組の全てについて、一致する問題文の事態ｉ及び事態属性ｉの組が存在する場合には、ステップ１１６へ移行して、問題文が質問文の内容を含意することを示す値（「含む」）を含意認識結果として出力して、処理を終了する。一方、１つでも一致しない場合には、ステップ１１８へ移行して、問題文が質問文の内容を含意しないことを示す値（「含まない」）を、含意認識結果として出力して、処理を終了する。

例えば、質問文の［事態２−１］及び［事態属性２−１］の組について、問題文の事態及び事態属性の組と比較すると、［事態１−２］が「事態２−１」に含まれる述語及び句（「私は」、「船で」、「島に」及び「向かう」）を全て含み、かつ［事態属性１−２］が「事態属性２−１」の「事実」及び「過去」と一致すると判定される。次に、質問文の［事態２−２］及び［事態属性２−２］の組について、問題文の事態及び事態属性の組と比較すると、［事態１−４］が「事態２−２」に含まれる述語及び句（「私は」、「島に」及び「到着する」）を全て含み、かつ［事態属性１−４］が「事態属性２−２」の「事実」及び「過去」と一致すると判定される。これにより、質問文の事態及び事態属性の組の全て（［事態２−１］及び［事態属性２−１］の組と［事態２−２］及び［事態属性２−２］の組）について、一致する問題文の事態及び事態属性の組が存在すると判定されたため、含意認識結果として、「含む」が出力される。

また、例えば、質問文が「私は飛行機で島に向かい、到着した」であった場合には、［事態２−１’］は「私は飛行機で島に向かう」、［事態属性２−１’］は「事実」及び「過去」となる。この場合、問題文の［事態１−１］が「事態２−１’」に含まれる述語及び句（「私は」、「飛行機で」、「島に」及び「向かう」）を全て含むが、［事態属性１−１］（「思索」及び「過去」）が「事態属性２−１’」の「事実」及び「過去」と一致しないため、問題文が質問文の内容を「含まない」と判定される。

以上説明したように、本実施の形態の読解問題回答装置によれば、問題文及び質問文各々から事態の性質を示す事態属性を付与した事態を抽出することで、問題文及び質問文が示す内容に関する基本的な単位に基づいた処理が可能となり、また、各事態について省略された句を追加した上で、問題文の事態及び事態属性の組と質問文の事態及び事態属性の組との比較を行うため、内容の比較がより適切に行えるようになり、問題文が質問文の内容を含意するか否かの判定精度を向上させることができる。特に、問題文及び質問文が複数の文で構成されているような場合には、句が省略される傾向が強くなるが、本実施の形態の読解問題回答装置を適用することにより、問題文及び質問文が複数の文で構成されている場合でも、精度良く問題文が質問文の内容を含意するか否かを判定することができる。

また、事態に含まれる述語を原型に変形することで、より簡潔かつ柔軟な形で問題文の事態と質問文の事態とが一致するか否かを判定することができるが、この場合でも、事態に事態属性が付与されていることで、事態の内容を保持したまま判定を行うことができ、判定精度を向上させることができる。

なお、上記実施の形態では、問題文及び質問文中の述語に事態属性を付与した上で、その述語を含む事態を抽出する場合について説明したが、問題文及び質問文から、１つの述語及びその述語に直接係る句、及び直接係る句が存在しない場合には１つの述語を事態として抽出した上で、抽出した事態に含まれる述語に対応した事態属性を付与するようにしてもよい。

また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。

また、上述の読解問題回答装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、ＷＷＷシステムを利用している場合であれば、ホームページ提供環境（あるいは表示環境）も含むものとする。

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。

１０読解問題回答装置
１２入力部
１４事態抽出部
１６句追加部
１８事態比較判定部

Claims

問題文及び質問文各々において、１つの述語を含む部分の性質を表す属性を該述語に付与し、前記述語に付与された属性と共に、前記１つの述語及び該述語に直接係る句、または前記述語に直接係る句が存在しない場合には前記１つの述語を事態として抽出する抽出手段と、
前記問題文及び前記質問文各々の照応解析結果に基づいて、前記事態に含まれる述語に直接係る句が省略されている場合には、該省略された句を前記句が省略された事態に追加する追加手段と、
前記問題文から抽出された句が省略されていない事態及び句が追加された事態と、前記質問文から抽出された句が省略されていない事態及び句が追加された事態とを比較すると共に、前記問題文から抽出された事態に付与された属性と、前記質問文から抽出された事態に付与された属性とを比較して、前記質問文が示す内容が前記問題文に含まれるか否かを判定する判定手段と、
を含む読解問題回答装置。
前記判定手段は、前記問題文から抽出された句が省略されていない事態及び句が追加された事態の中に、前記質問文から抽出された句が省略されていない事態及び句が追加された事態各々に含まれる句及び述語を全て含む事態が存在すると共に、前記質問文から抽出された事態に付与された属性と、該事態に含まれる句及び述語を全て含む前記問題文から抽出された事態に付与された属性とが一致する場合に、前記質問文が示す内容が前記問題文に含まれると判定する請求項１記載の読解問題回答装置。
前記抽出手段は、前記属性が付与された述語を原型に変形した事態を抽出する請求項１または請求項２記載の読解問題回答装置。
前記省略された句は、前記事態以外の文中に出現し、該事態に含まれる述語に直接係る句であって、該事態中に出現していない句、または代名詞もしくは指示詞に置き換わっている句である請求項１〜請求項３のいずれか１項記載の読解問題回答装置。
前記属性は、前記部分が示す時制、前記部分が示す内容が肯定か否定か、及び前記部分が示す内容が事実か思索かの少なくとも１つを区別する情報とした請求項１〜請求項４のいずれか１項記載の読解問題回答装置。
抽出手段と、追加手段と、判定手段とを含む読解問題回答装置における読解問題回答方法であって、
前記抽出手段は、問題文及び質問文各々において、１つの述語を含む部分の性質を表す属性を該述語に付与し、前記述語に付与された属性と共に、前記１つの述語及び該述語に直接係る句、または前記述語に直接係る句が存在しない場合には前記１つの述語を事態として抽出し、
前記追加手段は、前記問題文及び前記質問文各々の照応解析結果に基づいて、前記事態に含まれる述語に直接係る句が省略されている場合には、該省略された句を前記句が省略された事態に追加し、
前記判定手段は、前記問題文から抽出された句が省略されていない事態及び句が追加された事態と、前記質問文から抽出された句が省略されていない事態及び句が追加された事態とを比較すると共に、前記問題文から抽出された事態に付与された属性と、前記質問文から抽出された事態に付与された属性とを比較して、前記質問文が示す内容が前記問題文に含まれるか否かを判定する
読解問題回答方法。
コンピュータを、請求項１〜請求項５のいずれか１項記載の読解問題回答装置を構成する各手段として機能させるための読解問題回答プログラム。