JP2012220666A - 読解問題回答装置、方法、及びプログラム - Google Patents

読解問題回答装置、方法、及びプログラム Download PDF

Info

Publication number
JP2012220666A
JP2012220666A JP2011085348A JP2011085348A JP2012220666A JP 2012220666 A JP2012220666 A JP 2012220666A JP 2011085348 A JP2011085348 A JP 2011085348A JP 2011085348 A JP2011085348 A JP 2011085348A JP 2012220666 A JP2012220666 A JP 2012220666A
Authority
JP
Japan
Prior art keywords
situation
question sentence
predicate
phrase
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011085348A
Other languages
English (en)
Inventor
Kaname Kasahara
要 笠原
Hiroyori Taira
博順 平
Masaaki Nagata
昌明 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011085348A priority Critical patent/JP2012220666A/ja
Publication of JP2012220666A publication Critical patent/JP2012220666A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Electrically Operated Instructional Devices (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】問題文が質問文の内容を含意するか否かを精度良く判定する。
【解決手段】事態抽出部14で、問題文及び質問文各々において、1つの述語を含む部分の性質を表す事態属性をその述語に付与すると共に、述語を原型に変形し、述語に付与された属性と共に、事態属性が付与された1つの述語及びその述語に直接係る句、または述語に直接係る句が存在しない場合には1つの述語を事態として抽出する。句追加部16で、問題文及び質問文の照応解析結果に基づいて、各事態の述語に直接係る句が省略されているか否かを判定し、省略された句が存在する場合には、その句を事態に追加する。事態比較判定部18で、問題文から抽出された事態(句が追加された場合には句追加後の事態)及び事態属性の組と、質問文から抽出された事態(句が追加された場合には句追加後の事態)及び事態属性との組とを比較して、質問文が示す内容が問題文に含まれるか否かを判定する。
【選択図】図1

Description

本発明は、読解問題回答装置、方法、及びプログラムに係り、特に、問題文が質問文の内容を含むか含まないかを回答する読解問題回答装置、方法、及びプログラムに関する。
近年、コンピュータ及び周辺機器の高機能及び低価格化に伴い、パーソナルコンピュータだけでなく、携帯電話、電子書籍端末、交通システム等、コンピュータが組み込まれた機器やシステムが社会に急速に普及しており、日常で利用することが必須になりつつある。一方、人がコンピュータに指示をするときには、コンピュータ毎に予め定義された方法(例えば、選択肢を表すボタンの押下、語句を表す文字のキーボード入力や音声入力等)のみを受け付ける。そのため、コンピュータに不慣れな高齢者や子供等がコンピュータを含む機器やシステムを適切に操作できないことがあり、問題となっている。
このような問題を解決する技術の1つとして、コンピュータによる読解問題回答技術がある。この技術は、国語や外国語学習者の文章読解力を計るためのテストをコンピュータで自動解答するものである。この技術を応用することにより、音声やテキストにより入力された人の指示を、コンピュータが自動的に理解して、指示された処理を適切に実行することができるので、人が人に対して自然言語で自由に指示する場合と同様に、コンピュータを利用できるようになる。
読解問題のテストでは、文章(問題文章)を回答者が読んで、文章に関わる質問に対して選択肢、単語、文章等の指定された形式で回答する。また、コンピュータによる読解問題回答技術では、コンピュータに回答者の役割を実行させる。このような機能によって、人がコンピュータへ指示等を入力する場合に、人間に指示するように自由な自然言語で入力できるようになり、コンピュータを熟知していない人でも、手軽に利用できるようになる。
読解問題回答技術については、これまで、質問のタイプを限定した方法が提案されている。例えば、問題文章に関わる5W1H型の質問へ回答する方式(例えば、非特許文献1参照)や、問題文章に関連する文の空白部分に単語を埋める“穴埋め問題”に回答する方式(例えば、非特許文献2参照)が提案されている。これらの技術を利用すれば、例えば、コンピュータに地域の案内情報が書かれたテキストを蓄積しておき、場所に関する自然言語の質問が入力された際に、その場所に関わる案内情報が書かれたテキストを出力する案内システムを実現することができる。
また、読解問題の中には、問題に関する文章に対して質問として与えられたテキストの内容を含むか否かを問うものが多く存在する。このような問題に対する読解問題回答技術として、テキスト含意認識技術が様々提案されている(例えば、非特許文献3及び4参照)。この技術は、2つのテキストを比較して、意味内容の包含関係があるか否かを判定する処理であり、非特許文献3では、その応用として、コンピュータを用いた情報検索、文書比較、読解問題回答、質問応答、情報抽出、機械翻訳、言い換え表現獲得があると述べられている。
このようなテキスト含意認識技術を、読解問題回答技術に応用することで、コンピュータの処理に関する指示をテキストで蓄積しておけば、人が人に指示するように自由に自然言語で入力しても、その内容が含まれる指示に関わるテキストを探し出し、柔軟性が高い汎用の入力インターフェイスを実現可能である。
Lynette Hirschman, Marc Light, Eric Breck and John D. Burger. "Deep READ: a Reading Comprehension system." In Proc. of the 37th Annual Meeting of the Association for Computational Linguistics, pp. 325-332, 1999. 関根聡、齋藤真実、岡田美江、井佐原均、「小学2 年生の問題を解く−電脳優子2年生・概要」、言語処理学会第11回年次大会、pp.1068−1071、2005. Ido Dagan, Oren Glickman and Bernardo Magnini. "The PASCAL Recognising Textual Entailment Challenge", Machine Learning Challenges. Lecture Notes in Computer Science, Vol. 3944, pp. 177-190, Springer, 2006. 笠原要、平博順、永田昌明、「複数文からなる文章読解タスクへのテキスト含意認識の適用可能性の検討」、言語処理学会年次大会、2010.
しかしながら、非特許文献1及び2の技術では、質問文のタイプが限定されているため、人に指示するように自由に自然言語で記述されたテキストをコンピュータが自動理解する目的に利用することは困難である、という問題がある。
また、非特許文献3のテキスト含意認識技術では、内容の包含性を比較するテキストは1文から数文程度を想定している。しかし、国語や外国語の読解問題では、1段落から数段落レベルの複数の文から問題文が構成されることがある。また、問題文章の内容を包含するかを問う質問文も数文で構成されることもある。
また、非特許文献4の技術では、複数文からなる問題文の読解問題に通常のテキスト含意認識技術を適用し評価及び分析を行っているが、単純に問題文章を一括または文個別にテキスト含意認識を適用し、その判定結果を集計した場合では、回答精度が高くない、という問題がある。
本発明は上記問題点に鑑みてなされたものであり、問題文が質問文の内容を含意するか否かを精度良く判定することができる読解問題回答装置、方法、及びプログラムを提供することを目的とする。
上記問題を解決するために、本発明の読解問題回答装置は、問題文及び質問文各々において、1つの述語を含む部分の性質を表す属性を該述語に付与し、前記述語に付与された属性と共に、前記1つの述語及び該述語に直接係る句、または前記述語に直接係る句が存在しない場合には前記1つの述語を事態として抽出する抽出手段と、前記問題文及び前記質問文各々の照応解析結果に基づいて、前記事態に含まれる述語に直接係る句が省略されている場合には、該省略された句を前記句が省略された事態に追加する追加手段と、前記問題文から抽出された句が省略されていない事態及び句が追加された事態と、前記質問文から抽出された句が省略されていない事態及び句が追加された事態とを比較すると共に、前記問題文から抽出された事態に付与された属性と、前記質問文から抽出された事態に付与された属性とを比較して、前記質問文が示す内容が前記問題文に含まれるか否かを判定する判定手段と、を含んで構成されている。
本発明の読解問題回答装置によれば、抽出手段が、問題文及び質問文各々において、1つの述語を含む部分の性質を表す属性を述語に付与し、述語に付与された属性と共に、1つの述語及び述語に直接係る句、及び述語に直接係る句が存在しない場合には1つの述語を事態として抽出する。そして、追加手段が、問題文及び質問文各々の照応解析結果に基づいて、事態に含まれる述語に直接係る句が省略されている場合には、省略された句を句が省略された事態に追加し、判定手段が、問題文から抽出された句が省略されていない事態及び句が追加された事態と、質問文から抽出された句が省略されていない事態及び句が追加された事態とを比較すると共に、問題文から抽出された事態に付与された属性と、質問文から抽出された事態に付与された属性とを比較して、質問文が示す内容が問題文に含まれるか否かを判定する。
このように、問題文及び質問文各々から属性を付与した事態を抽出することで、問題文及び質問文が示す内容に関する基本的な単位に基づいた処理が可能となり、また、各事態について省略された句を追加した上で、問題文の事態及び属性と質問文の事態及び属性との比較を行うため、内容の比較がより適切に行えるようになり、問題文が質問文の内容を含意するか否かを精度良く判定することができる。
また、前記判定手段は、前記問題文から抽出された句が省略されていない事態及び句が追加された事態の中に、前記質問文から抽出された句が省略されていない事態及び句が追加された事態各々に含まれる句及び述語を全て含む事態が存在すると共に、前記質問文から抽出された事態に付与された属性と、該事態に含まれる句及び述語を全て含む前記問題文から抽出された事態に付与された属性とが一致する場合に、前記質問文が示す内容が前記問題文に含まれると判定することができる。このような判定を行うことにより、より正確かつ厳格な判定を行うことができる。
また、前記抽出手段は、前記属性が付与された述語を原型に変形した事態を抽出することができる。これにより、事態に付与された属性によって事態の内容を保持したまま、より簡潔かつ柔軟な形で問題文の事態と質問文の事態とを比較することができる。
また、前記省略された句は、前記事態以外の文中に出現し、該事態に含まれる述語に直接係る句であって、該事態中に出現していない句、または代名詞もしくは指示詞に置き換わっている句である。
また、前記属性は、前記部分が示す時制、前記部分が示す内容が肯定か否定か、及び前記部分が示す内容が事実か思索かの少なくとも1つを区別する情報とすることができる。
また、本発明の読解問題回答方法は、抽出手段と、追加手段と、判定手段とを含む読解問題回答装置における読解問題回答方法であって、前記抽出手段は、問題文及び質問文各々において、1つの述語を含む部分の性質を表す属性を該述語に付与し、前記述語に付与された属性と共に、前記1つの述語及び該述語に直接係る句、または前記述語に直接係る句が存在しない場合には前記1つの述語を事態として抽出し、前記追加手段は、前記問題文及び前記質問文各々の照応解析結果に基づいて、前記事態に含まれる述語に直接係る句が省略されている場合には、該省略された句を前記句が省略された事態に追加し、前記判定手段は、前記問題文から抽出された句が省略されていない事態及び句が追加された事態と、前記質問文から抽出された句が省略されていない事態及び句が追加された事態とを比較すると共に、前記問題文から抽出された事態に付与された属性と、前記質問文から抽出された事態に付与された属性とを比較して、前記質問文が示す内容が前記問題文に含まれるか否かを判定する方法である。
また、本発明の読解問題回答プログラムは、コンピュータを、上記の読解問題回答装置を構成する各手段として機能させるためのプログラムである。
以上説明したように、本発明の読解問題回答装置、方法、及びプログラムによれば、問題文及び質問文各々から属性を付与した事態を抽出することで、問題文及び質問文が示す内容に関する基本的な単位に基づいた処理が可能となり、また、各事態について省略された句を追加した上で、問題文の事態及び属性と質問文の事態及び属性との比較を行うため、内容の比較がより適切に行えるようになり、問題文が質問文の内容を含意するか否かを精度良く判定することができる、という効果が得られる。
本実施の形態の読解問題回答装置の機能的構成を示すブロック図である。 述語を含む部分と事態属性との対応表の一例を示す図である。 本実施の形態の読解問題回答装置における読解問題回答処理ルーチンの内容を示すフローチャートである。 問題文及び質問文の一例を示す図である。 問題文及び質問文から抽出した事態及び付与された事態属性の一例を示す図である。 省略された句が追加された事態の一例を示す図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
本実施の形態に係る読解問題回答装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する読解問題回答処理ルーチンを実行するためのプログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。このコンピュータは、機能的には、図1に示すように、入力部12、事態抽出部14、句追加部16、及び事態比較判定部18を含んだ構成で表すことができる。
入力部12は、問題文及び質問文の入力を外部から受け付ける。問題文及び質問文は、それぞれ、自然言語形式のテキストデータであればよく、その内容は、新聞記事、小説、随筆、科学文献、日記等どのようなジャンルであってもよい。また、問題文及び質問文各々を構成する文の数は1以上であればその数は限定されない。また、入力データとして、問題文及び質問文の音声データを入力する場合は、音声データをテキストデータに変換する音声認識部を含んで構成するようにするとよい。
事態抽出部14は、入力された問題文及び質問文各々から、事態の性質を現す事態属性が付与された事態を抽出する。事態は、1つの述語及びその述語に直接係る句、または述語に直接係る句が存在しない場合には1つの述語で構成されている。具体的には、問題文及び質問文各々を、句点によって1文ずつに分割し、各文について形態素解析処理を行い、その形態素解析結果に対して、句の判定及び係り受け関係を判定する係り受け解析処理を行う。各処理については、既存の形態素解析器(例えば、「黒橋禎夫、長尾真、1999、『日本語形態素解析システムJUMAN Version 3.61』、京都大学大学院情報学研究科」参照)や、構文解析器(例えば、「黒橋禎夫、長尾 眞、「並列構造の検出に基づく長い日本語文の構文解析」、自然言語処理、Vol.1、No.1、pp.35-57(1994.10)」参照)を用いることができる。
また、事態抽出部14は、事態を比較する際に区別すべき事態の性質を表す分類の値である事態属性を、各事態に付与する。事態属性は、例えば、{現在,過去,未来}、{事実,思索}、{肯定,否定}等とすることができる。事態属性は、上記3種類の事態属性の組それぞれについて頻出する値に該当する場合には、その値を付与しなくてもよく、少なくとも1つの性質を表す分類の値を付与すればよい。例えば、{肯定,否定}の事態属性の組については、「肯定」は頻出する値であるので、事態の性質が「肯定」であっても、事態属性として「肯定」を付与せず、事態の性質が「否定」の場合にのみ、事態属性として「否定」を付与するようにすることができる。また、例えば、{現在,過去,未来}については、いずれか1つの事態属性を付与することとしておくと、事態の性質が「肯定」及び「過去」を表す場合には、「過去」が事態属性として付与され、事態の性質が「否定」及び「過去」を表す場合には、「否定」及び「過去」が事態属性として付与される。
事態属性の付与方法は、単語や句またはこれらの組み合わせに対する事態属性の対応表を予め所定の記憶部に格納しておき、1文ずつに分解された問題文及び質問文各々に、対応表に定められた単語や句またはこれらの組み合わせが出現した場合に、対応する事態属性を記憶部に格納された対応表を参照して付与する。
事態の性質は、特に述語を含む部分に表れるため、例えば、図2に示すように、事態属性として{現在,過去,未来}及び{事実,思索}を用いて、1つの述語を含む表現と事態属性とを対応させた対応表を格納しておくことができる。述語を含む部分に対応した事態属性を付与する際には、付与された事態属性に応じてその述語を原型に変形する。例えば、述語を含む表現「なかった」に対応して事態属性「否定」及び「過去」が対応表に格納されている場合において、文中に「・・・・読まなかった。」という表現が出現した場合には、述語を含む部分「読まなかった」を述語の原型「読む」に変形すると共に、この述語に事態属性として「否定」及び「過去」を付与する。そして、この事態属性が付与された述語に直接係る句が存在する場合には、述語及びその述語に直接係る句を事態として抽出し、述語に直接係る句が存在しない場合には、述語のみを事態として抽出する。述語に付与された事態属性は、その述語を含む事態と共に抽出され、その事態の事態属性となる。
句追加部16は、問題文及び質問文各々から抽出した各事態について、述語に直接係る句が省略されているか否かを判定し、省略されている句が存在する場合には、その句を事態に追加する。省略されている句とは、その事態中に直接現れない句や、代名詞や指示詞となっている句などである。省略されている句がある場合には、問題文及び質問文全体から、省略されている句に対応する句を抽出して、事態中の適切な位置に追加する。省略されている句の有無の判定、並びに省略されている句に対応する句の抽出及び追加する方法としては、既存の照応解析技術(例えば、「笹野遼平、黒橋禎夫、『小規模タグ付きコーパスと自動獲得した大規模語彙知識を用いた識別モデルに基づくゼロ照応解析』、情報処理学会 第198回自然言語処理研究会(2010).」参照)を用いることができる。
事態比較判定部18は、事態抽出部14で、質問文及び問題文各々から抽出した各事態及び各事態に付与された事態属性の組を順番に比較し、一致する組が存在するか否かを判定する。ここで、一致するとは、質問文から抽出された事態(句が追加された場合には句追加後の事態)各々について、問題文から抽出された事態(句が追加された場合には句追加後の事態)の中に、質問文から抽出された事態に含まれる句及び述語を全て含む事態が存在し、かつその問題文から抽出された事態の事態属性と質問文から抽出された事態の事態属性とが一致する場合をいう。質問文の事態及び事態属性の組の全てについて、一致する問題文の事態及び事態属性の組が存在する場合には、問題文が質問文の内容を含意することを示す値(「含む」)、1つでも一致しない場合には、問題文が質問文の内容を含意しないことを示す値(「含まない」)を、含意認識結果として出力する。
次に、図3を参照して、本実施の形態の読解問題回答装置10において実行される読解問題回答処理ルーチンについて説明する。本実施の形態では、入力された問題文及び質問文に対して、問題文が質問文の内容を含意するか否かの含意認識結果を出力する読解問題回答処理について説明する。
ステップ100で、問題文及び質問文の入力を外部から受け付ける。ここでは、図4に示すように、問題文「私は飛行機で島に向かうつもりだった。しかし、敢えて船で向かった。海は大変荒れていたが、島に到着した。」、及び質問文「私は船で島に向かい、到着した。」が取得されたものとする。
次に、ステップ102で、上記ステップ100で取得した問題文及び質問文各々を、句点によって1文ずつに分割し、各文について形態素解析処理を行い、その形態素解析結果に対して、句の判定及び係り受け関係を判定する係り受け解析処理を行う。そして、例えば図2に示したような対応表を参照して、各文に出現した述語に事態属性を付与すると共に、付与した事態属性に応じて述語を原型に変形する。そして、この事態属性が付与された述語に直接係る句が存在する場合には、述語及びその述語に直接係る句を事態として抽出し、述語に直接係る句が存在しない場合には、述語のみを事態として抽出する。また、問題文から抽出された事態及び事態属性に順番に識別番号i(i=1−1,1−2,・・・,1−n:nは問題文から抽出された事態の数)を付与する。同様に、質問文から抽出した事態及び事態属性に順番に識別番号j(j=2−1,2−2,・・・,2−m:mは質問文から抽出された事態の数)を付与する。
問題文の1文目についてみると、「向かうつもりだった」の部分が、対応表の1行目の「述語+つもりだった→思索,過去」に該当するため、事態属性として「思索」及び「過去」が付与される。また、述語を含む部分「向かうつもりだった」が述語の原型「向かう」に変形される。そして、この述語及び述語に直接係る句で表される[事態1−1]「私は飛行機で島に向かう」が、[事態属性1−1]「思索」及び「過去」が付与されて抽出される。
また、質問文の「私は船で島に向かい、到着した。」のように、1文中に2つ以上の述語が含まれる場合には、各事態について元の文の述語の並び方も考慮して対応表を参照する。質問文の例の場合、述語の並び方が対応表の3行目に該当するため、[事態2−1]及び[事態2−2]には、事態属性として「事実」及び「過去」が共に付与される。さらに、述語を含む部分「向かい」は述語の原型「向かう」に変形され、述語を含む部分「到着した」は述語の原型「到着する」に変形され、[事態2−1]「私は船で島に向かう」、及び[事態2−2]「到着する」が抽出される。
図5に、入力された問題文及び質問文から抽出された事態及び付与された事態属性を示す。各事態は、最後に述語、その前に句が並べられた構成となっている。なお、[事態2−2]は、1つの述語のみで構成された事態の例であり、その他の事態は、1つの述語及びその述語に直接係る句で構成された事態の例である。
次に、ステップ104で、変数i及びjに1をセットして、次に、ステップ106で、問題文及び質問文各々について、照応解析を行って、事態i(または事態j)について、述語に直接係る句が省略されているか否かを判定する。例えば、質問文の[事態2−2]については、元となる質問文全体の照応解析によって、[事態2−1]と並列な関係であることが分かるため、[事態2−2]においては、[事態2−1]に含まれている句が省略されていると判定する。句が省略されている場合には、ステップ108へ移行して、照応解析結果に基づいて、問題文及び質問文全体から省略されている句に対応する句を抽出して、事態中の適切な位置に追加する。[事態2−2]では、照応解析の結果から、「私は」及び「島に」が省略された句として抽出され、述語「到着する」の前に追加される。
また、例えば、[事態2−2’]として「そこに到着した」が抽出された場合には、照応解析結果に基づいて、[事態2−2’]における「そこに」は、[事態2−1]の「島に」が省略された句であると判定する。従って、[事態2−2’]の「そこに」の位置に「島に」を追加する。
一方、上記ステップ106で、句が省略されていないと判定された場合には、上記ステップ108をスキップして、ステップ110へ移行し、変数iがnとなったか、及び変数jがmとなったか、すなわち抽出された全ての事態について省略された句の有無の判定及び追加の処理を終了したか否かを判定する。未処理の事態が存在する場合には、ステップ112へ移行し、iを1インクリメント(i=nとなっている場合にはjを1インクリメント)して、ステップ106へ戻り、処理を繰り返す。全ての事態について処理が終了した場合には、ステップ114へ移行する。図6に、句が追加された事態を示す。下線で示す部分が追加された句である。
ステップ114では、質問文から抽出された事態j及び事態属性jの組それぞれについて、問題文の事態i及び事態属性iの組と同一か否かを順番に比較する。質問文の事態j及び事態属性jの組の全てについて、一致する問題文の事態i及び事態属性iの組が存在する場合には、ステップ116へ移行して、問題文が質問文の内容を含意することを示す値(「含む」)を含意認識結果として出力して、処理を終了する。一方、1つでも一致しない場合には、ステップ118へ移行して、問題文が質問文の内容を含意しないことを示す値(「含まない」)を、含意認識結果として出力して、処理を終了する。
例えば、質問文の[事態2−1]及び[事態属性2−1]の組について、問題文の事態及び事態属性の組と比較すると、[事態1−2]が「事態2−1」に含まれる述語及び句(「私は」、「船で」、「島に」及び「向かう」)を全て含み、かつ[事態属性1−2]が「事態属性2−1」の「事実」及び「過去」と一致すると判定される。次に、質問文の[事態2−2]及び[事態属性2−2]の組について、問題文の事態及び事態属性の組と比較すると、[事態1−4]が「事態2−2」に含まれる述語及び句(「私は」、「島に」及び「到着する」)を全て含み、かつ[事態属性1−4]が「事態属性2−2」の「事実」及び「過去」と一致すると判定される。これにより、質問文の事態及び事態属性の組の全て([事態2−1]及び[事態属性2−1]の組と[事態2−2]及び[事態属性2−2]の組)について、一致する問題文の事態及び事態属性の組が存在すると判定されたため、含意認識結果として、「含む」が出力される。
また、例えば、質問文が「私は飛行機で島に向かい、到着した」であった場合には、[事態2−1’]は「私は飛行機で島に向かう」、[事態属性2−1’]は「事実」及び「過去」となる。この場合、問題文の[事態1−1]が「事態2−1’」に含まれる述語及び句(「私は」、「飛行機で」、「島に」及び「向かう」)を全て含むが、[事態属性1−1](「思索」及び「過去」)が「事態属性2−1’」の「事実」及び「過去」と一致しないため、問題文が質問文の内容を「含まない」と判定される。
以上説明したように、本実施の形態の読解問題回答装置によれば、問題文及び質問文各々から事態の性質を示す事態属性を付与した事態を抽出することで、問題文及び質問文が示す内容に関する基本的な単位に基づいた処理が可能となり、また、各事態について省略された句を追加した上で、問題文の事態及び事態属性の組と質問文の事態及び事態属性の組との比較を行うため、内容の比較がより適切に行えるようになり、問題文が質問文の内容を含意するか否かの判定精度を向上させることができる。特に、問題文及び質問文が複数の文で構成されているような場合には、句が省略される傾向が強くなるが、本実施の形態の読解問題回答装置を適用することにより、問題文及び質問文が複数の文で構成されている場合でも、精度良く問題文が質問文の内容を含意するか否かを判定することができる。
また、事態に含まれる述語を原型に変形することで、より簡潔かつ柔軟な形で問題文の事態と質問文の事態とが一致するか否かを判定することができるが、この場合でも、事態に事態属性が付与されていることで、事態の内容を保持したまま判定を行うことができ、判定精度を向上させることができる。
なお、上記実施の形態では、問題文及び質問文中の述語に事態属性を付与した上で、その述語を含む事態を抽出する場合について説明したが、問題文及び質問文から、1つの述語及びその述語に直接係る句、及び直接係る句が存在しない場合には1つの述語を事態として抽出した上で、抽出した事態に含まれる述語に対応した事態属性を付与するようにしてもよい。
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
また、上述の読解問題回答装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 読解問題回答装置
12 入力部
14 事態抽出部
16 句追加部
18 事態比較判定部

Claims (7)

  1. 問題文及び質問文各々において、1つの述語を含む部分の性質を表す属性を該述語に付与し、前記述語に付与された属性と共に、前記1つの述語及び該述語に直接係る句、または前記述語に直接係る句が存在しない場合には前記1つの述語を事態として抽出する抽出手段と、
    前記問題文及び前記質問文各々の照応解析結果に基づいて、前記事態に含まれる述語に直接係る句が省略されている場合には、該省略された句を前記句が省略された事態に追加する追加手段と、
    前記問題文から抽出された句が省略されていない事態及び句が追加された事態と、前記質問文から抽出された句が省略されていない事態及び句が追加された事態とを比較すると共に、前記問題文から抽出された事態に付与された属性と、前記質問文から抽出された事態に付与された属性とを比較して、前記質問文が示す内容が前記問題文に含まれるか否かを判定する判定手段と、
    を含む読解問題回答装置。
  2. 前記判定手段は、前記問題文から抽出された句が省略されていない事態及び句が追加された事態の中に、前記質問文から抽出された句が省略されていない事態及び句が追加された事態各々に含まれる句及び述語を全て含む事態が存在すると共に、前記質問文から抽出された事態に付与された属性と、該事態に含まれる句及び述語を全て含む前記問題文から抽出された事態に付与された属性とが一致する場合に、前記質問文が示す内容が前記問題文に含まれると判定する請求項1記載の読解問題回答装置。
  3. 前記抽出手段は、前記属性が付与された述語を原型に変形した事態を抽出する請求項1または請求項2記載の読解問題回答装置。
  4. 前記省略された句は、前記事態以外の文中に出現し、該事態に含まれる述語に直接係る句であって、該事態中に出現していない句、または代名詞もしくは指示詞に置き換わっている句である請求項1〜請求項3のいずれか1項記載の読解問題回答装置。
  5. 前記属性は、前記部分が示す時制、前記部分が示す内容が肯定か否定か、及び前記部分が示す内容が事実か思索かの少なくとも1つを区別する情報とした請求項1〜請求項4のいずれか1項記載の読解問題回答装置。
  6. 抽出手段と、追加手段と、判定手段とを含む読解問題回答装置における読解問題回答方法であって、
    前記抽出手段は、問題文及び質問文各々において、1つの述語を含む部分の性質を表す属性を該述語に付与し、前記述語に付与された属性と共に、前記1つの述語及び該述語に直接係る句、または前記述語に直接係る句が存在しない場合には前記1つの述語を事態として抽出し、
    前記追加手段は、前記問題文及び前記質問文各々の照応解析結果に基づいて、前記事態に含まれる述語に直接係る句が省略されている場合には、該省略された句を前記句が省略された事態に追加し、
    前記判定手段は、前記問題文から抽出された句が省略されていない事態及び句が追加された事態と、前記質問文から抽出された句が省略されていない事態及び句が追加された事態とを比較すると共に、前記問題文から抽出された事態に付与された属性と、前記質問文から抽出された事態に付与された属性とを比較して、前記質問文が示す内容が前記問題文に含まれるか否かを判定する
    読解問題回答方法。
  7. コンピュータを、請求項1〜請求項5のいずれか1項記載の読解問題回答装置を構成する各手段として機能させるための読解問題回答プログラム。
JP2011085348A 2011-04-07 2011-04-07 読解問題回答装置、方法、及びプログラム Withdrawn JP2012220666A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011085348A JP2012220666A (ja) 2011-04-07 2011-04-07 読解問題回答装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011085348A JP2012220666A (ja) 2011-04-07 2011-04-07 読解問題回答装置、方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2012220666A true JP2012220666A (ja) 2012-11-12

Family

ID=47272255

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011085348A Withdrawn JP2012220666A (ja) 2011-04-07 2011-04-07 読解問題回答装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2012220666A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014134871A (ja) * 2013-01-08 2014-07-24 Nippon Telegr & Teleph Corp <Ntt> 質問応答用検索キーワード生成方法、装置、及びプログラム
US9946763B2 (en) 2014-11-05 2018-04-17 International Business Machines Corporation Evaluating passages in a question answering computer system
CN110909544A (zh) * 2019-11-20 2020-03-24 北京香侬慧语科技有限责任公司 一种数据处理方法和装置
CN112863278A (zh) * 2021-02-09 2021-05-28 柳州智视科技有限公司 一种题目条件替换后的解题方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014134871A (ja) * 2013-01-08 2014-07-24 Nippon Telegr & Teleph Corp <Ntt> 質問応答用検索キーワード生成方法、装置、及びプログラム
US9946763B2 (en) 2014-11-05 2018-04-17 International Business Machines Corporation Evaluating passages in a question answering computer system
CN110909544A (zh) * 2019-11-20 2020-03-24 北京香侬慧语科技有限责任公司 一种数据处理方法和装置
CN112863278A (zh) * 2021-02-09 2021-05-28 柳州智视科技有限公司 一种题目条件替换后的解题方法

Similar Documents

Publication Publication Date Title
Amin et al. Bengali vader: A sentiment analysis approach using modified vader
Broda et al. Measuring Readability of Polish Texts: Baseline Experiments.
Matsuyoshi et al. Overview of the NTCIR-11 Recognizing Inference in TExt and Validation (RITE-VAL) Task.
KR102039393B1 (ko) 발상 지원 장치 및 발상 지원 방법
Al-Kabi et al. Evaluating social context in arabic opinion mining.
Gómez-Adorno et al. A graph based authorship identification approach
Valerio et al. Using automatically generated concept maps for document understanding: A human subjects experiment
Al-Taani et al. A rule-based approach for tagging non-vocalized Arabic words.
Khader et al. Textual entailment for Arabic language based on lexical and semantic matching
KR101333485B1 (ko) 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치
JP2012220666A (ja) 読解問題回答装置、方法、及びプログラム
Nishihara et al. Word complexity estimation for Japanese lexical simplification
Sethi et al. Automated title generation in English language using NLP
Malandrakis et al. Sail: Sentiment analysis using semantic similarity and contrast features
Hao et al. SCESS: a WFSA-based automated simplified chinese essay scoring system with incremental latent semantic analysis
Imane et al. A set of parameters for automatically annotating a Sentiment Arabic Corpus
Lahbari et al. A rule-based method for Arabic question classification
Atwell Using the Web to Model Modern and Qurʾanic Arabic
Alfaries et al. A rule-based annotation system to extract Tajweed rules from Quran
JP5823441B2 (ja) 格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム
Alemu et al. A corpus-based word sense disambiguation for geez language
Kurosawa et al. Logical inference for counting on semi-structured tables
Irmawati et al. Generating artificial error data for indonesian preposition error corrections
Alfaidi et al. Exploring the performance of farasa and CAMeL taggers for arabic dialect tweets.
Basnayake et al. Plagiarism detection in Sinhala language: A software approach

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140701