JP2008282366A - 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体 - Google Patents

質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2008282366A
JP2008282366A JP2007128578A JP2007128578A JP2008282366A JP 2008282366 A JP2008282366 A JP 2008282366A JP 2007128578 A JP2007128578 A JP 2007128578A JP 2007128578 A JP2007128578 A JP 2007128578A JP 2008282366 A JP2008282366 A JP 2008282366A
Authority
JP
Japan
Prior art keywords
question
score
sentence
answer
cause
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007128578A
Other languages
English (en)
Other versions
JP4778474B2 (ja
Inventor
Ryuichiro Higashinaka
竜一郎 東中
Hideki Isozaki
秀樹 磯崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007128578A priority Critical patent/JP4778474B2/ja
Publication of JP2008282366A publication Critical patent/JP2008282366A/ja
Application granted granted Critical
Publication of JP4778474B2 publication Critical patent/JP4778474B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】原因を問うタイプの質問に対する解答の精度を向上させる。
【解決手段】質問応答装置1は、質問文に関連する文書を文書群11から抽出する文書抽出部6と、コーパス12を利用して抽出文書中に含まれる解答候補に原因を表す表現が含まれている可能性がどれくらいあるかを表す第1スコアを算出する原因文スコア算出部21と、コーパス12から求められた原因結果ペアの共起確率を格納した共起確率テーブル13を利用して、質問文と解答候補との間に因果関係を示す表現が含まれている可能性がどれくらいあるかを表す第2スコアを算出する因果関係表現スコア算出部22と、質問文と解答候補との関連度を表す第3スコアを算出する質問回答関連度算出部23と、第1ないし第3スコアを統合した第4スコアを算出し第4スコアの上位20文を質問文に対する解答として出力する解答候補ランキング部8とを備える。
【選択図】図2

Description

本発明は、質問応答装置に係り、特に、原因を問う質問に答える質問応答装置に関する。
近年、情報検索システムの一環として、固有表現を解答とした質問に答えることのできる質問応答システムが多く開発されている。ここで、固有表現とは、人名、地名、数量など一連の単語から構成され、情報抽出タスクの答えとしてよく用いられる表現のことである。このような固有表現を解答とした質問は、例えば、「エッフェル塔の高さは何メートルですか?」という質問や、「眼鏡を日本に伝えたのは誰ですか?」という質問である。このようなタイプの質問応答システムのことをファクトイド(Factoid)型質問応答システムと呼ぶ。
また、例えば、「黒澤明とはどのような人物ですか?」、「0−157とは何ですか?」のように、人物や事物の定義を尋ねる質問に答えることのできる質問応答システムの開発も進められている。このようなタイプの質問応答システムは、定義型質問応答システムと呼ばれており、ファクトイド型質問応答システムよりも高度な意味処理が必要とされる。また、「聖火が消えたらどうしますか?」のように、手続きを問う質問に答えることのできる質問応答システムも出現してきている。さらに、「なぜ女性は痩せたがるのですか?」のように、原因を問う質問に答えるシステム(質問とその解答との間に因果関係があるタイプのシステム)も出現してきている。
本発明は、このような様々な質問応答システムのうち、特に、原因を問う質問に答えるシステムに関するものである。原因を問う質問に答えるシステムとして、英語の「causal verb」と呼ばれる、因果関係に明確に関係するとされる単語(動詞、動詞句)を含む質問に答えるシステムが知られている(非特許文献1参照)。非特許文献1に記載されたシステムは、「causal verb」を含む質問にしか答えることができない。この非特許文献1に記載されたシステムは、人が選び取ったある特定の単語を持つ質問文にしか答えられないので、人が抽出して手動で作ったルールに基づくシステムに近いものと言える。この非特許文献1に記載されたシステムとは異なり、質問を特定の原因に限定しないシステムも知られている(非特許文献2参照)。非特許文献2に記載されたシステムは、手動で作ったルールに基づき、文書から原因を表す表現が含まれている文を複数抽出し、抽出した文を質問文との類似度により並び替え、解答として出力する。なお、原因を問う質問に答えるタイプではないシステムとして、文書から抽出した文(解答候補)が質問文の解答としてふさわしいか否かについて統計的手法を用いて決定するシステムも知られている(非特許文献3参照)。ただし、このシステムは、原因を問う質問に答えるタイプではないので、原因を問う質問を入力とするときの解答の精度は低い。
Roxana Girju,"Automatic detection of causal relations for Question Answering"、Proc. ACL 2003 workshop on Multilingual summarization and question answering、p.76-83、2003 諸岡心、福本淳一、"Why型質問応答のための回答選択手法"、電子情報通信学会技術研究報告Vol.105、No.594、言語理解とコミュニケーション、電子情報通信学会、p.7-12、2006 Radu Soricut and Eric Brill、"Automatic question answering using the web: Beyond the Factoid"、 Journal Information Retrieval、vol.9、no.2、p.191-206、2006
従来の質問応答システムは、手書きのルールまたはそれに近い手動の方法に基づいているため、答えられない質問が多く、そして、原因を表す表現が含まれている文を抽出する精度が低いという問題がある。また、手書きのルールは、「原因を含む文」と「原因を含まない文」とを振り分けるものなので、「原因を含む可能性がある」というような場合に対応することができない。
また、従来の質問応答システムは、前提条件として、解答候補に、原因を表す表現が存在し、かつ、質問文との類似度が高い場合に、その解答候補が解答になりやすいという前提を置いている。したがって、以下のような不都合が生じることがある。例えば、「なぜ彼は逮捕されたのか?」という質問文に対する解答候補として、「彼は詐欺で逮捕された」という第1候補文と、「彼は逮捕されたので悲しんだ」という第2候補文とが抽出された場合を想定する。この場合、質問文に対する解答は、明らかに第1候補文である。従来の質問応答システムは、第1候補文と第2候補文が、質問文に含まれる単語(「彼」、「逮捕」)を、それぞれ含んでいるため、質問文との類似度が高いと判定する。また、従来の質問応答システムは、第1候補文と第2候補文が、原因を表す表現を示す機能語(「〜で」、「〜ので」)を含むため、原因を含む可能性が高いと判定する。このため、従来の質問応答システムは、どちらの解答候補が解答としてより適切であるのかを判断することが困難である。その結果、従来の質問応答システムは、質問者の知りたい情報を正確に提供できない、つまり、解答の精度が低くなってしまう。これは、従来の質問応答システムの前提条件において、「解答候補に含まれる原因」が、「質問文で求められる原因」と異なる可能性について考慮されていないためである。
そこで、本発明では、前記した問題を解決し、原因を問うタイプの質問に対する解答の精度を向上させることのできる質問応答装置を提供することを目的とする。
前記課題を解決するために、本発明に係る質問応答装置は、質問とその解答との間に因果関係があるタイプの質問に応答する質問応答装置であって、入力された質問文に関連する1以上の文書を、予め定められた文書群から抽出する文書抽出部と、分類用のラベルが予め付与されている単語で構成された複数の文を含む予め作成されたコーパスを利用して、前記抽出された文書中に含まれる文を示す複数の解答候補に原因を表す表現が含まれている可能性がどれくらいあるかを表す第1スコアを算出する原因文スコア算出部と、所定の1以上の共起尺度によって前記コーパス中の文に含まれる原因を示す単語と結果を示す単語から予め求められた原因結果ペアの共起確率を複数格納した1以上の共起確率テーブルを利用して、前記入力された質問文と前記解答候補との間に因果関係を示す表現が含まれている可能性がどれくらいあるかを表す第2スコアを前記共起確率テーブルごとに算出する因果関係表現スコア算出部と、前記入力された質問文と前記解答候補との間の内容の関連度を表す第3スコアを算出する質問回答関連度算出部と、前記第1ないし第3スコアを統合した第4スコアを算出し、前記解答候補のうち前記第4スコアの上位の所定数の文を、前記入力された質問文に対する解答として出力する解答候補ランキング部とを備えることを特徴とする。
また、前記課題を解決するために、本発明に係る質問応答方法は、質問とその解答との間に因果関係があるタイプの質問に応答する質問応答装置の質問応答方法であって、文書抽出部によって、入力された質問文に関連する1以上の文書を、予め定められた文書群から抽出する文書抽出ステップと、原因文スコア算出部によって、分類用のラベルが予め付与されている単語で構成された複数の文を含む予め作成されたコーパスを利用して、前記抽出された文書中に含まれる文を示す複数の解答候補に原因を表す表現が含まれている可能性がどれくらいあるかを表す第1スコアを算出する原因文スコア算出ステップと、因果関係表現スコア算出部によって、所定の1以上の共起尺度によって前記コーパス中の文に含まれる原因を示す単語と結果を示す単語から予め求められた原因結果ペアの共起確率を複数格納した1以上の共起確率テーブルを利用して、前記入力された質問文と前記解答候補との間に因果関係を示す表現が含まれている可能性がどれくらいあるかを表す第2スコアを前記共起確率テーブルごとに算出する因果関係表現スコア算出ステップと、質問回答関連度算出部によって、前記入力された質問文と前記解答候補との間の内容の関連度を表す第3スコアを算出する質問回答関連度算出ステップと、解答候補ランキング部によって、前記第1ないし第3スコアを統合した第4スコアを算出し、前記解答候補のうち前記第4スコアの上位の所定数の文を、前記入力された質問文に対する解答として出力する解答候補ランキングステップとを有することを特徴とする。
かかる構成の質問応答装置、または、かかる手順の質問応答方法によれば、質問応答装置は、第1スコアを算出することで、原因を含む解答候補だけではなく、原因を含む可能性がある解答候補も解答として出力できる。そして、質問応答装置は、第2スコアを算出することで、質問文に含まれている結果を生じさせる原因が解答候補に含まれていればその解答候補を解答として出力できる。つまり、システムの前提条件として、解答候補に含まれる原因が質問文で求められる原因と異なる可能性について考慮している。そして、質問応答装置は、第3スコアを算出することで、質問文と類似した内容の解答候補を解答として出力できる。そして、質問応答装置は、第1ないし第3スコアを統合した第4スコアを算出することで、原因を含む可能性があり、かつ、因果関係があり、しかも類似した解答候補を解答として出力できる。
また、本発明に係る質問応答装置は、前記原因文スコア算出部が、入力された質問文を構成する単語間の依存構造を解析し単語をノードとした木構造を生成する単語間依存構造解析手段と、前記生成された木構造のノードのうち内容語を示すノードに品詞情報を付与することで品詞ノードを生成する内容語処理手段と、前記コーパスにおいて意味属性、動詞分類および固有名詞分類のうちの少なくとも1つを示す第1付加情報が、前記生成された品詞ノードで示される内容語に対して付与されているか否かを判別し、前記内容語に前記第1付加情報が付与されている場合に、当該内容語を示す品詞ノードに対して、前記第1付加情報を示す子ノードを追加することで第1特徴量を生成する第1特徴量生成手段と、前記コーパスにおいて予めそれぞれ定められた固有表現情報、良否に関する評価表現であるか否かを示す情報および因果関係に関連することを示す情報のうちの少なくとも1つを示す第2付加情報が、前記生成された品詞ノードで示される内容語に付与されているか否かを判別し、前記内容語に前記第2付加情報が付与されている場合に、当該内容語を示す品詞ノードに対して、前記第2付加情報を示す子ノードを追加することで第2特徴量を生成する第2特徴量生成手段と、前記コーパスを利用して前記第1付加情報および前記第2付加情報に対して予め作成された原因文分類手段と、前記原因文分類手段を用いて、前記質問文に対して生成された第1特徴量および第2特徴量に対する重みを用いて前記第1スコアを算出するスコア算出手段とを備えることを特徴とする。
また、本発明に係る質問応答方法は、前記原因文スコア算出ステップは、単語間依存構造解析手段によって、入力された質問文を構成する単語間の依存構造を解析し単語をノードとした木構造を生成する単語間依存構造解析ステップと、内容語処理手段によって、前記生成された木構造のノードのうち内容語を示すノードに品詞情報を付与することで品詞ノードを生成する内容語処理ステップと、第1特徴量生成手段によって、前記コーパスにおいて意味属性、動詞分類および固有名詞分類のうちの少なくとも1つを示す第1付加情報が、前記生成された品詞ノードで示される内容語に対して付与されているか否かを判別し、前記内容語に前記第1付加情報が付与されている場合に、当該内容語を示す品詞ノードに対して、前記第1付加情報を示す子ノードを追加することで前記第1特徴量を生成する第1特徴量生成ステップと、第2特徴量生成手段によって、前記コーパスにおいて予めそれぞれ定められた固有表現情報、良否に関する評価表現であるか否かを示す情報および因果関係に関連することを示す情報のうちの少なくとも1つを示す第2付加情報が、前記生成された品詞ノードで示される内容語に付与されているか否かを判別し、前記内容語に前記第2付加情報が付与されている場合に、当該内容語を示す品詞ノードに対して、前記第2付加情報を示す子ノードを追加することで第2特徴量を生成する第2特徴量生成ステップと、スコア算出手段によって、前記コーパスを利用して前記第1付加情報および前記第2付加情報に対して予め作成された原因文分類手段を用いて、前記質問文に対して生成された第1特徴量および第2特徴量に対する重みを用いて前記第1スコアを算出するスコア算出ステップとを有することを特徴とする。
かかる構成の質問応答装置、または、かかる手順の質問応答方法によれば、質問応答装置は、第1スコアを算出する際に、質問文を構成する単語をノードとした木構造を生成し、次いで、意味属性、動詞分類および固有名詞分類のうちの少なくとも1つを示す子ノードである第1特徴量を生成すると共に、固有表現情報、良否に関する評価表現であるか否かを示す情報および因果関係に関連することを示す情報のうちの少なくとも1つを示す子ノードである第2特徴量を生成する。そして、質問応答装置は、予め作成された原因文分類手段を用いて、質問文に対して生成された第1特徴量および第2特徴量に対する重みを用いて第1スコアを算出する。これにより、原因を含む文に対してスコア付けができると共に、原因を含む可能性がある文に対してもスコア付けができる。したがって、原因を含む可能性がある文も解答候補として抽出できるようになる。これは、原因を含む文と原因を含まない文とを単純に振り分ける従来の方法では抽出できなかった解答候補である。その結果、本発明によれば、従来の方法よりも解答の抽出精度が高くなる。
また、本発明に係る質問応答装置は、前記因果関係表現スコア算出部が、入力された質問文および前記複数の解答候補を単語に分割する文分割手段と、前記分割された単語から内容語を抽出する内容語抽出手段と、前記入力された質問文中に含まれる結果を示す単語と、前記複数の解答候補に含まれる原因を示す単語とからなる複数の原因結果ペアを抽出し、前記共起確率テーブルを参照して、前記抽出した原因結果ペアが同時に出現する確率の最大値、最小値および平均値のうちの少なくとも1つを前記第2スコアとして算出するスコア算出手段とを備えることを特徴とする。
また、本発明に係る質問応答方法は、前記因果関係表現スコア算出ステップが、文分割手段によって、入力された質問文および前記複数の解答候補を単語に分割する文分割ステップと、内容語抽出手段によって、前記分割された単語から内容語を抽出する内容語抽出ステップと、スコア算出手段によって、前記入力された質問文中に含まれる結果を示す単語と、前記複数の解答候補に含まれる原因を示す単語とからなる複数の原因結果ペアを抽出し、前記共起確率テーブルを参照して、前記抽出した原因結果ペアが同時に出現する確率の最大値、最小値および平均値のうちの少なくとも1つを前記第2スコアとして算出するスコア算出ステップとを有することを特徴とする。
かかる構成の質問応答装置、または、かかる手順の質問応答方法によれば、質問応答装置は、第2スコアを算出する際に、共起確率テーブルを参照して、質問文中に含まれる結果を示す単語と、解答候補に含まれる原因を示す単語とからなる原因結果ペアが同時に出現する確率の最大値、最小値および平均値のうちの少なくとも1つを第2スコアとして算出する。ここで、原因結果ペアは、例えば、質問文中に含まれる結果を示す単語と、解答候補に含まれる原因を示す単語との単語ペアでもよいし、質問文中に含まれる結果を示す単語の意味属性と、解答候補に含まれる原因を示す単語の意味属性との意味属性ペアでもよい。これにより、原因結果ペアにスコア付けができるので、質問文によって原因を問われている内容を示す文がスコアの高い解答候補として抽出できるようになる。したがって、質問者の知りたい情報を従来よりも正確に提供できる。その結果、解答の抽出精度が高くなる。
また、本発明に係る質問応答プログラムは、前記した質問応答方法のいずれかをコンピュータに実行させることを特徴とする。このように構成されることにより、このプログラムをインストールされたコンピュータは、このプログラムに基づいた各機能を実現することができる。
また、本発明に係るコンピュータ読み取り可能な記録媒体は、前記した質問応答プログラムが記録されたことを特徴とする。このように構成されることにより、この記録媒体を装着されたコンピュータは、この記録媒体に記録されたプログラムに基づいた各機能を実現することができる。
本発明によれば、原因を問うタイプの質問に対する解答の精度を向上させることができる。また、機械学習の手法を導入することで、手書きのルールが不必要となり、システム構築コストの削減が期待できる。
以下、図面を参照して本発明の質問応答装置および質問応答方法を実施するための最良の形態(以下「実施形態」という)について詳細に説明する。
[質問応答装置の概要]
図1は、本発明の実施形態に係る質問応答装置の概要を模式的に示す図である。ユーザ(質問者)は、インターネット等の通信ネットワークに接続可能なパーソナルコンピュータ(PC)等の情報処理装置を用いて、ウェブ(Web)上の質問応答装置にアクセスする。そして、ユーザは、PCの画面に表示される質問記入欄に質問を示すテキスト文を入力し、画面上の処理ボタンを選択する。これにより、入力された質問に対する解答がPCの画面に表示される。図1に示した例では、ユーザは、「なぜ月食が起こるのか?」という質問を入力する。これに対して、質問応答装置は、新聞記事から、解答が含まれると考えられる文(解答候補)を抽出した上位20文を表示することで、質問に対する解答をユーザに提示する。なお、図1では、表示画面の関係上、「解答抽出結果」の欄に上位12文のみを表記した。
[質問応答装置の構成]
図2は、質問応答装置の構成を模式的に示す機能ブロック図である。質問応答装置1は、例えば、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、ROM(Read Only Memory)と、HDD(Hard Disk Drive)と、入出力インタフェース等から構成される。この質問応答装置1は、図1に示すように、入力部2と、出力部3と、記憶部4と、質問タイプ判定部5と、文書抽出部6と、解答抽出部7と、解答候補ランキング部8と、タイプ別モジュール群9とを備えている。
入力部2は、所定の入力インタフェースや通信インタフェースから構成される。この入力部2は、例えば、インターネット等の通信ネットワークを介して受信したユーザ(質問者)の質問文を質問タイプ判定部5や解答抽出部7に入力する。なお、入力部2は、質問応答装置1にケーブルで接続されたマウスやキーボード等の入力装置Mから入力される質問文を質問タイプ判定部5や解答抽出部7に入力することも可能である。
出力部3は、所定の出力インタフェースや通信インタフェースから構成される。この出力部3は、解答候補ランキング部8から取得した上位N個(例えば20個)の解答候補を、例えば、インターネット等の通信ネットワークを介してユーザ(質問者)の使用するPCに送信する。なお、出力部3は、上位N個(例えば20個)の解答候補を、質問応答装置1にケーブルで接続された液晶ディスプレイ等の表示装置Dに出力することも可能である。
記憶部4は、例えば、RAMやROMを備えると共に、各種データを格納するために一般的なハードディスクを備えている。この記憶部4は、図1に示すように、文書群11と、コーパス12と、共起確率テーブル13と、質問解答セット群14と、重みテーブル15とを備えている。なお、記憶部4は、各種のデータを1以上の外部記憶装置に蓄積することもできる。
<文書群>
文書群11は、例えば、複数の新聞記事から構成された新聞記事集合である。本実施形態では、文書群11は、新聞記事(毎日新聞98−01年度)で構成した。
<コーパス>
コーパス12は、分類用のラベルが予め付与されている単語で構成された複数の文を含む予め作成されたものである。本実施形態では、コーパス12は、EDR電子化辞書(登録商標)の日本語コーパスから構成される。したがって、コーパス12中の文は、その文に原因が含まれる場合、該当箇所に原因ラベル「cause」が付与されている。
<共起確率テーブル>
共起確率テーブル13は、1以上の共起尺度によってコーパス12中の文に含まれる原因を示す単語と結果を示す単語から予め求められた原因結果ペアの共起確率を複数格納している。共起確率テーブル13は、後記する因果関係表現スコア算出部22によって、予め構築されるものである。図1では1つだけ示したが、本実施形態では2種類のテーブルを備えている。なお、詳細な説明は後記する。
<質問解答セット群>
質問解答セット群14は、質問文とその正答文とからなる予め定められた複数の学習用データであり、重みテーブル15を作成するために利用されるものである。
<重みテーブル>
重みテーブル15は、解答候補ランキング部8が解答抽出部7から出力する14個のスコアに所定の重みを付与する際に利用する重みを記憶したものである。この重みテーブル15の詳細は後記するが、質問解答セット群14とランキングSVM(Ranking Support Vector Machine)とを用いて予め構築される。
質問タイプ判定部5は、手書きのルールに基づいて、入力部2から入力した質問文のタイプが、予め定められた複数のタイプのうちのいずれであるのかを判別するものである。本実施形態では、質問タイプ判定部5は、質問とその解答との間に因果関係があるタイプの質問(原因を問う質問)と、固有表現を解答とした質問(ファクトイド型質問)とのいずれであるのかを判別することとした。
また、質問タイプ判定部5は、「理由」、「原因」というキーワードや、「なぜ」、「どうして」などの単語が質問文に含まれる場合、原因を問う質問であると判定する。例えば、図1に示した「なぜ月食は起こるのか?」という質問は、原因を問う質問(REASONタイプ)であると判定される。また、質問タイプ判定部5は、例えば、「何メートルですか?」、「誰ですか?」といった、人名、地名、数量などの固有表現を問う単語が質問文に含まれる場合、ファクトイド型質問であると判定する。
文書抽出部6は、入力された質問文に関連する1以上の文書を、予め定められた文書群11から抽出するものである。この文書抽出部6は、入力された質問文から検索に有効な1以上の単語(検索単語という)を抽出し、抽出した検索単語と文書群11に含まれる文書との関連度を算出し、算出した関連度の高い文書を複数(例えば20個)抽出する。例えば、図1に示した「なぜ月食は起こるのか?」という質問の場合には、検索単語として「月食」、「起こる」が抽出された。なお、文書抽出部6は、DIDF(Decayed IDF)という指標を用いて関連度を算出する。DIDFについては、「Hideki Isozaki、 “An analysis of a high-Performance Japanese question answering system”、 ACM Transactions on Asian Language Information Processing(TALIP),vol.4, no.3、p.263-279、2005」に詳述されているので説明を省略する。
解答抽出部7は、原因文スコア算出部21と、因果関係表現スコア算出部22と、質問回答関連度算出部23とを備えている。この解答抽出部7について図3を参照して詳細に説明する。図3は、図2に示した解答抽出部の構成を模式的に示す機能ブロック図である。
<原因文スコア算出部>
原因文スコア算出部21は、コーパス12を利用して、文書抽出部6で抽出された文書中に含まれる文を示す複数の解答候補に原因を表す表現が含まれている可能性がどれくらいあるかを表す原因文スコア(第1スコア)を算出するものである。本実施形態では、原因文スコア算出部21は、検索単語を1つ以上含む文のみを解答候補として扱う。この原因文スコア算出部21は、図3に示すように、単語間依存構造解析手段211と、内容語処理手段212と、第1特徴量生成手段213と、第2特徴量生成手段214と、原因文分類器215と、スコア算出手段216とを備えている。
≪単語間依存構造解析手段≫
単語間依存構造解析手段211は、入力された質問文を構成する単語間の依存構造を解析し単語をノードとした木構造を生成するものである。この単語間依存構造解析手段211は、例えば、構文・依存構造解析器「CaboCha」により構成される。例えば、「X(彼)は詐欺で逮捕された」という文は、単語間依存構造解析手段211によって、図4(a)に示すように、単語間の係り受けが解析される。なお、図4(a)に示す「EOS」は文末を示すラベルである。
≪内容語処理手段≫
内容語処理手段212は、単語間依存構造解析手段211で生成された木構造のノードのうち内容語を示すノードに品詞情報を付与することで品詞ノードを生成するものである。内容語は、機能語(助詞、助動詞)以外の単語である。図4(b)に示すように、例えば、内容語「X」を示すノードには、内容語処理手段212によって、品詞情報として「名詞」が付与される。なお、図4に示した「func」は機能語を示す。
≪第1特徴量生成手段≫
第1特徴量生成手段213は、コーパス12において意味属性、動詞分類および固有名詞分類のうちの少なくとも1つを示す第1付加情報が、生成された品詞ノードで示される内容語に対して付与されているか否かを判別し、内容語に第1付加情報が付与されている場合に、当該内容語を示す品詞ノードに対して、第1付加情報を示す子ノードを追加することで第1特徴量を生成するものである。この第1特徴量生成手段213は、例えば、言語解析器「morph」と言語解析器「JTAG」とにより構成される。言語解析器「morph」は、日英翻訳システム「ALT J/E」に付属する言語解析器であり、文に含まれるそれぞれの単語に意味属性を付与することができるものである。言語解析器「JTAG」は、文に含まれるそれぞれの単語について動詞分類、固有名詞分類を付与することができるものである。
この第1特徴量生成手段213によって、図4(c)に示すように、例えば、文頭の名詞ノードには、意味属性“男”を示す子ノード「N−48」が追加される。また、この名詞ノードには、固有名詞分類“人物(男性)”を示す子ノード「PN−69」も追加される。なお、図4(c)において、子ノードのうち、「N−」で始まるものは意味属性を示し、「V−」で始まるものは動詞分類を示し、「PN−」で始まるものは固有名詞分類を表す。また、子ノードの下に記号の説明を表記した。
≪第2特徴量生成手段≫
第2特徴量生成手段214は、コーパス12において予めそれぞれ定められた固有表現情報、良否に関する評価表現であるか否かを示す情報および因果関係に関連することを示す情報のうちの少なくとも1つを示す第2付加情報が、生成された品詞ノードで示される内容語に付与されているか否かを判別し、内容語に第2付加情報が付与されている場合に、当該内容語を示す品詞ノードに対して、第2付加情報を示す子ノードを追加することで第2特徴量を生成するものである。なお、これら3種類の情報(第2付加情報)は、因果関係を扱う従来公知の文献において有効とされたものである。この第2特徴量生成手段214は、例えば、構文・依存構造解析器「CaboCha」を含む。
国有表現情報は、IREX(Information Retrieval and Extraction eXercises)の定義する「ORGANIZATION」、「PERSON」、「LOCATION」、「ARTIFACT」、「DATE」、「TIME」、「MONEY」、「PERCENT」のいずれかである。例えば、人名に関しては、図4(c)に示すように、第2特徴量生成手段214は、固有表現を示す‘NE(Named Entity)’というプレフィックスを持つ、「PERSON」という子ノードを追加する。
良否に関する評価表現(良い・悪いに関係する表現)であるか否かを示す情報は、予め準備された評価に関する図示しない単語リストに対応して設けられている。第2特徴量生成手段214は、良い評価に関してはPOS(positiveの意)、悪い評価に関してはNEG(negativeの意)というラベルを持つ子ノードを追加する。
因果関係に関連することを示す情報は、予め準備された因果関係に関する図示しない単語リストに対応して設けられている。因果関係を表す単語は、諸岡らの文献(非特許文献2)に44種列挙されているので説明を省略する。第2特徴量生成手段214は、品詞ノードがこれら44種の単語に合致する場合に、子ノードとして「CAUSAL_WORD」というラベルを持つノードを追加する。
≪原因文分類器≫
原因文分類器(原因文分類手段)215は、コーパス12を利用して第1付加情報および第2付加情報に対して予め作成された分類器である。原因文分類器215は、例えば、所定の分類ルール(分類関数)で表現される。本実施形態では、コーパス12に格納された文について原因ラベルがあるものを正例、無いものを負例として、機械学習の手法を用いて原因文分類器215を予め構築した。原因文分類器215の学習には、公知の分類アルゴリズム「BACT」を用いた。BACTは、木を入力とすることができ、分類に有効な部分木に対してより大きい重みを与えることで学習を行う。分類には、分類対象に含まれる部分木の重みの総和を使用し、総和が正であれば原因を含む文、負であれば原因を含まない文として分類した。この原因文分類器215の精度(適合率)は約40パーセントであり、手動のルールによる場合の精度である10パーセントを凌ぐものである。なお、BACTについては、「Taku Kudo and Yuji Matsumoto、”A Boosting Algorithm for Classification of Semi-Structured Text”,Proc. EMNLP,pp.301-308,2004」に詳述されているので説明を省略する。
≪スコア算出手段≫
スコア算出手段216は、原因文分類器215を用いて、入力された質問文に対して生成された第1特徴量および第2特徴量に対する重みを用いて第1スコアを算出するものである。このスコア算出手段216は、有効な部分木の重みを用いてそれぞれの解答候補文に与えるスコアを第1スコアとする。
<因果関係表現スコア算出部>
因果関係表現スコア算出部22は、1以上の共起確率テーブル13を利用して、入力された質問文と解答候補との間に因果関係を示す表現が含まれている可能性がどれくらいあるかを表す因果関係表現スコア(第2スコア)を共起確率テーブル13ごとに算出するものである。この因果関係表現スコア算出部22は、質問文と解答候補における表現の組み合わせを列挙し、それぞれの原因・結果としての共起確率を、共起確率テーブル13を照会し、12のスコアとして算出する。
また、因果関係表現スコア算出部22は、図3に示すように、共起確率テーブル作成手段220と、文分割手段221と、内容語抽出手段222と、スコア算出手段223とを備えている。
≪共起確率テーブル作成手段≫
共起確率テーブル作成手段220は、共起確率テーブル13を作成するものである。共起確率テーブル作成手段220は、質問文を入力する前に、コーパス12から、表現が「原因」と「結果」の関係である表現対(原因結果ペア)を自動獲得して、その表現対が共起する確率(共起確率)を算出し、共起確率テーブル13を作成する。なお、このように因果関係を表す表現対を自動獲得する研究としてMarcuらの研究が知られているが、質問応答システムへの組み込みは考えられていない(「Daniel Marcu and Abdessamad Echihabi、”An Unsupervised Approach to Recognizing Discourse Relations”、Proc. ACL、p.368-375、2002」参照)。
コーパス12において、(原因の)結果が、「原因」とラベル付けされている箇所以外に記述されていると仮定すれば、コーパス12に含まれるそれぞれの文は、「原因」のラベルと「結果」のラベルがなされているものであると考えることが可能である。ただし、実際には、「原因」のラベルしか付与されていない。共起確率テーブル作成手段220は、「原因」とラベル付けされている箇所に存在する単語と、そうではない箇所に存在する単語との組合せから、表現対を自動獲得する。
ここで、表現対の具体例を説明する。具体的には、例えば、「なぜ彼は逮捕されたのか?」という質問文に対する解答候補として、「彼は詐欺で逮捕された」という第1候補文と、「彼は逮捕されたので悲しんだ」という第2候補文とが抽出された場合を想定する。この場合に、第1候補文の「詐欺」と質問文の「逮捕」とに因果関係が認められると判断されれば、第1候補文の方が第2候補文よりも解答としてふさわしいと判断することができる。ここでの「詐欺」と「逮捕」のような表現の組を表現対(単語対、意味属性対など)と呼ぶ。
本実施形態では、共起確率テーブル作成手段220は、例えば、構文・依存構造解析器「CaboCha」と、言語解析器「morph」とを備える。共起確率テーブル作成手段220は、コーパス12に含まれるそれぞれの文に含まれる単語のすべての組み合わせについて、図5に示すような2×2の表を作成し、値(図4中ではa,b,c,dで示す)を埋める。ここで、2つの単語の組み合わせ(表現対)のうち一方の単語をw1とし、他方をw2とした。項目名501に示す「単語w1が原因である」とは、文中の原因を示す箇所にその単語w1が存在することを示す。項目名502に示す「単語w1が原因・結果ではない」とは、文中の原因を示す箇所や文中の結果を示す箇所に、その単語w1が存在しないことを示す。項目名503に示す「単語w2が原因である」と、項目名504に示す「単語w2が原因・結果ではない」とは、項目名501,502と同様な意味なので説明を省略する。なお、w1とw2とは、単語対の原因結果ペアである。
共起確率テーブル作成手段220は、図5に示すような2×2の表から、共起の尺度として、φ(標準化されたχ二乗値)とlog likelihood ratio(LLR)とを算出する。LLRを算出している理由は、φでは観測値が少ない場合に正確な値を算出できない可能性が指摘されているためである。表現対として単語対のφとLLRを求めるのであれば、「CaboCha」で解析するだけでもよいが、コーパス12における単語の組み合わせの数は限られており、場合によってはデータが疎である場合がある。そのため、「CaboCha」で解析した文を「morph」でも解析し、意味属性対間のφとLLRも算出した。表1および表2に共起確率テーブル13の例を示す。表1は、共起尺度としてφを用いた場合の上位10単語対の例を示す。また、表2は、共起尺度としてLLRを用いた場合の上位10意味属性対を示す。この上位10意味属性対のLLRの値は、すべて同じ値であり、表の下方に記載したように、「1.386」である。なお、表2においてNの後の数字は、日本語語彙体系における意味属性IDである。
Figure 2008282366
Figure 2008282366
≪文分割手段≫
文分割手段221は、入力された質問文および複数の解答候補を単語に分割するものである。
≪内容語抽出手段≫
内容語抽出手段222は、分割された単語から内容語を抽出するものである。本実施形態では、内容語抽出手段222は、内容語として、名詞、動詞、未知語を抽出することとした。文分割手段221および内容語抽出手段222は、例えば、構文・依存構造解析器「CaboCha」により構成される。
≪スコア算出手段≫
スコア算出手段223は、入力された質問文中に含まれる結果を示す単語と、複数の解答候補に含まれる原因を示す単語とからなる複数の原因結果ペアを抽出し、共起確率テーブル13を参照して、抽出した原因結果ペアが同時に出現する確率の最大値、最小値および平均値のうちの少なくとも1つを第2スコアとして算出するものである。本実施形態では、スコア算出手段223は、原因結果ペアが同時に出現する確率の最大値、最小値および平均値を第2スコアとして算出する。
本実施形態では、スコア算出手段223は、例えば、構文・依存構造解析器「CaboCha」と、言語解析器「morph」とを備える。スコア算出手段223は、例えば、「CaboCha」によって、質問文の内容語と回答候補の内容語とを列挙し、これらのすべての組み合わせについて、回答候補に含まれる内容語が原因、質問文に含まれる内容語が結果として共起する確率(φとLLR)を、共起確率テーブル13から得る。また、スコア算出手段223は、例えば、「morph」によって、質問文の内容語の意味属性と回答候補の内容語の意味属性とを列挙し、これらのすべての組み合わせについて、回答候補に含まれる内容語の意味属性が原因、質問文に含まれる内容語の意味属性が結果として共起する確率(φとLLR)を、共起確率テーブル13から得る。
ここで、スコア算出手段223が、1つの質問文に対して抽出した複数の原因結果ペアについてそれら原因結果ペアに関係するそれぞれの共起確率の値を、どのようにスコア(第2スコア)に関連付けると、そのスコアが、最終的に複数の解答候補の中から最もふさわしい解答候補を上位にランキングさせることに寄与する指標となりうるかということは自明ではない。
例えば、1つの質問文に対して、2つの解答候補があり、かつ、各解答候補に対して2つずつの原因結果ペアが抽出された場合を想定する。この場合、ある解答候補に対して抽出された2つの原因結果ペアに関係する2つの共起確率の最大値、最小値、平均値のいずれをスコアとして算出すれば、その算出したスコアが、2つの解答候補の中から最もふさわしい解答候補を上位にランキングさせることに寄与する指標となるかは分からない。
そこで、本実施形態では、スコア算出手段223は、内容語の表現対について求められるφの最大値、最小値、平均値を3つの観点の第2スコアとして算出する。また、スコア算出手段223は、内容語の意味属性の表現対について求められるφの最大値、最小値、平均値を3つの観点の第2スコアとして算出する。さらに、スコア算出手段223は、φをLLRで置き換えて同様に6つの観点の第2スコアを算出する。したがって、スコア算出手段223は、12の観点の第2スコアを算出することとなる。
ここで、例えば、φの最大値、最小値、平均値について付記しておく。一例として、「なぜアル・カポネは逮捕されたのか?」という質問文に対して、「アル・カポネは[誘拐の容疑]で逮捕された。」という回答候補が抽出された場合を想定する。また、φの共起確率テーブルに、(原因、結果、φ)=(誘拐、逮捕、0.90)のデータ1が存在し、また、(原因、結果、φ)=(容疑、逮捕、0.938)のデータ2が存在しているとする。この場合、内容語の表現対について求められるφの最大値、最小値、平均値とは、それぞれ、0.938、0.90、0.919となる。なお、共起確率テーブルに該当するデータが1つしかない場合には、最大値、最小値および平均値は同一となる。
<質問回答関連度算出部>
質問回答関連度算出部23は、入力された質問文と解答候補との間の内容の関連度を表す関連度スコア(第3スコア)を算出するものである。本実施形態では、質問回答関連度算出部23は、解答候補に含まれる検索単語のDIDFスコアの和を関連度として用いる。なお、関連度として従来法で用いられるコサイン類似度を使うことも可能である。
図1に戻って、質問応答装置1の構成の説明を続ける。
解答候補ランキング部8は、第1ないし第3スコアを統合した第4スコアを算出し、解答候補のうち第4スコアの上位の所定数の文を、入力された質問文に対する解答として出力するものである。本実施形態では、解答候補ランキング部8は、原因文スコア算出部21、因果関係表現スコア算出部22、質問回答関連度算出部23から得られる全部で14のスコアに所定の重みづけを行って統合し、最終的な解答らしさのスコアとして第4スコアを算出し、解答候補をスコア順で並び替えて出力する。また、本実施形態では、並び替えられた解答候補のうち上位20位までをユーザに提示する。例えば、図1においては、「月食は太陽と地球、月が一直線に並び、地球の影に月が入るために起こる現象。」という解答候補が「29.422」のスコアで1位となり、この文は、後に人手で判断したところ正解とされた。
また、本実施形態では、解答候補ランキング部8が、予め準備した質問解答セット群14について、最も高い成績を導き出すように14個の各スコアの重みを調整して重みテーブル15を予め作成した。質問解答セット群14の一例を図6に示す。質問文601は、記事番号「000217262」の記事を元に作成されたものである。なお、「Q13」は質問の通し番号である。Q13の質問は、「なぜパンダは絶滅しそうなのか?」というものである。ここでは、質問文601に対して、4つの解答602〜605が設けられている。解答602〜605には、その解答が含まれる記事番号および行番号が付与されている。また、解答602〜605には、文中に記号‘[’と、記号‘]’とが挿入されている。これらの記号は、間に挟まれた部分が質問文に対する理由を特に述べていると思われることを示すためのマークである。
ここで、質問解答セット群14の作成方法の一例を説明する。まず、元にする複数の新聞記事からなる文書群11からランダムに選んだ新聞記事を専門家が見て思いついた質問により質問文を作成する。次に、作成した質問文を質問応答装置1に入力する。質問応答装置1は、文書抽出部6によって、文書群11から、入力された質問文に関連する記事上位20記事を抽出する。そして、専門家は、抽出された20記事を見て、それぞれの文ごとに「解答」と言えるかどうかを人手で判断する。ここで、解答は1つに限らない。したがって、図6の場合には「解答」が4つであると判定された。これにより、図6のような、質問文と解答文のセットが1つ完成する。同様にして、質問文と解答文のセットを500個作成して保存した。この500セットが保存されたデータベースが、質問解答セット群14である。
ここで、重みテーブル15の作成方法の一例を説明する。まず、質問解答セット群14のうちの1つの質問解答セットを質問応答装置1に入力する。質問応答装置1は、文書抽出部6によって、文書群11から、入力された質問文に関連する記事上位20記事を抽出する。そして、複数の解答候補それぞれに対して、質問応答装置1の14個のスコアをそれぞれ算出する。また、図6の場合には解答が4つあるので、複数の解答候補の中にこの4つの解答が含まれていれば、それぞれに「1」のラベルを付与し、残余の解答候補には「0」のラベルを付与する。そして、式(1)において、各スコアの重みα1〜α14を用いて、複数の解答候補に対して重み線形和をそれぞれ求める。ここで、A1〜A14は14個のスコアを示し、Scoreは第4スコアを示す。
Figure 2008282366
図6に示す質問応答セットの場合には、解答が4個なので、求めた複数の重み線形和のうち、「1」のラベルが付与された解答候補がベスト4となるように(以下、重み調整条件という)、未決定の各スコアの重みα1〜α14を仮調整する。なお、質問応答等セットによってはベスト4とは限らず、ベスト3等である場合もある。同様のことを、作成した500個の質問解答セット群のうちの所定数に対して行う。そして、調整の結果、所定数の質問解答セットが、重み調整条件をなるべく満たすような最良のときに、そのとき調整されている各スコアの重みα1〜α14を、最終的な重みとして決定する。これが、重みテーブル15に格納されている重みである。この重み付けの決定にはランキング最適化の手法であるランキングSVMを用いることが可能であり、本システムではSVM−lightを用いた。このSVM−lightについては、例えば、「Thorsten Joachims, “Optimizing Search Engines Using Clickthrough Data”, Proc. KDD, pp.133-142,2002」に詳述されているので説明を省略する。
図1に戻って、質問応答装置1の構成の説明を続ける。
タイプ別モジュール群9は、質問タイプ判定部5において原因を問う質問ではないと判定されたタイプの質問にそれぞれ応答する複数の質問応答モジュールである。本実施形態では、ファクトイド型質問に応答する質問応答モジュールとして、SAIQAシステムを備えている。SAIQAシステムとは、ファクトイド型の質問応答システムであり、固有表現(人名や地名等の固有名詞)が答えとなる質問に高精度で答えることができるものである。
SAIQAシステムは、まず、ユーザの質問文を解析し、機械学習の手法と人手で作成したルールとに基づいて、質問の内容に関連する文書群から、解答候補の単語を抽出し、質問文に含まれている単語のそれぞれとなるべく距離の近い単語を回答として出力する。例えば、人名が聞かれている場合には、例えば人名事典から解答候補の人名を抽出し、質問文に含まれている単語のそれぞれとなるべく距離の近い人名を回答として出力する。この場合、質問応答装置1は、図示しない人名事典を備えている。なお、SAIQAシステムについては、例えば、「Hideki Isozaki、“NTT’s Question Answering System for NTCIR QAC2”、Working Notes of NTCIR-4、National Institute of Informatics、2004」に詳述されているので説明を省略する。
なお、前記した質問タイプ判定部5と、文書抽出部6と、解答抽出部7と、解答候補ランキング部8と、タイプ別モジュール群9とは、CPUが記憶手段のHDD等に格納された所定のプログラムをRAMに展開して実行することによりその機能が実現されるものである。
[質問応答装置の動作]
質問応答装置1の動作について図7を参照(適宜図2参照)して説明する。図7は、図2に示した質問応答装置の動作を示すフローチャートである。まず、質問応答装置1は、外部から質問文が入力されると、質問タイプ判定部5によって、入力した質問文のタイプが、原因を問う質問(因果関係があるタイプ)と、固有表現を解答とした質問(ファクトイド型質問)とのいずれであるのかを判別する(ステップS1)。原因を問う質問(因果関係があるタイプ)である場合、質問応答装置1は、文書抽出部6によって、入力された質問文に関連する1以上の文書を文書群11から抽出する(ステップS2:文書抽出ステップ)。そして、質問応答装置1は、原因文スコア算出部21によって、第1スコア算出処理を行う(ステップS3:原因文スコア算出ステップ)。この第1スコア算出処理は、原因文分類器215を用いて、文書抽出部6によって抽出された文書中に含まれる解答候補に原因を表す表現が含まれている可能性がどれくらいあるかを表す原因文スコア(第1スコア)を算出するものである。その詳細は後記する。
そして、質問応答装置1は、因果関係表現スコア算出部22によって、第2スコア算出処理を行う(ステップS4:因果関係表現スコア算出ステップ)。この第2スコア算出処理は、2つの共起確率テーブル13を利用して、入力された質問文と解答候補との間に因果関係を示す表現が含まれている可能性がどれくらいあるかを表す因果関係表現スコア(第2スコア)を共起確率テーブル13ごとに算出するものである。その詳細は後記する。そして、質問応答装置1は、質問回答関連度算出部23によって、入力された質問文と解答候補との間の内容の関連度を表す関連度スコア(第3スコア)を算出する(ステップS5:質問回答関連度算出ステップ)。なお、ステップS3〜ステップS5の処理順序はこれに限定されるものではなく任意の順序で行うことができ、並列に行うこともできる。
そして、質問応答装置1は、解答候補ランキング部8によって、第1ないし第3スコアを統合した第4スコアを算出し、解答候補のうち第4スコアの上位の20の文を、入力された質問文に対する解答として出力する(ステップS6:解答候補ランキングステップ)。一方、ステップS1において、固有表現を解答とした質問(ファクトイド型質問)であると判定された場合、質問応答装置1は、タイプ別モジュール群9に格納されたSAIQAシステムのモジュールを起動し、文書群11から抽出した回答を出力する(ステップS7)
<第1スコア算出処理>
図8は、第1スコア算出処理を示すフローチャートである。質問応答装置1は、原因文スコア算出部21の単語間依存構造解析手段211によって、入力された質問文を構成する単語間の依存構造を解析し単語をノードとした木構造を生成する(ステップS11:単語間依存構造解析ステップ)。そして、原因文スコア算出部21は、内容語処理手段212によって、生成された木構造のノードのうち内容語を示すノードに品詞情報を付与することで品詞ノードを生成する(ステップS12:内容語処理ステップ)。そして、原因文スコア算出部21は、第1特徴量生成手段213によって、コーパス12において意味属性、動詞分類および固有名詞分類のうちの少なくとも1つを示す第1付加情報が、生成された品詞ノードで示される内容語に対して付与されているか否かを判別し、内容語に第1付加情報が付与されている場合に、当該内容語を示す品詞ノードに対して、第1付加情報を示す子ノードを追加することで第1特徴量を生成する(ステップS13:第1特徴量生成ステップ)。
そして、原因文スコア算出部21は、第2特徴量生成手段214によって、コーパス12において予めそれぞれ定められた固有表現情報、良否に関する評価表現であるか否かを示す情報および因果関係に関連することを示す情報のうちの少なくとも1つを示す第2付加情報が、生成された品詞ノードで示される内容語に付与されているか否かを判別し、内容語に第2付加情報が付与されている場合に、当該内容語を示す品詞ノードに対して、第2付加情報を示す子ノードを追加することで第2特徴量を生成する(ステップS14:第2特徴量生成ステップ)。そして、原因文スコア算出部21は、スコア算出手段216によって、原因文分類器215を用いて、質問文に対して生成された第1特徴量および第2特徴量に対する重みを用いて第1スコアを算出する(ステップS15:スコア算出ステップ)。
<第2スコア算出処理>
図9は、第2スコア算出処理を示すフローチャートである。質問応答装置1は、質問回答関連度算出部23の文分割手段221によって、入力された質問文および解答候補を単語に分割し(ステップS21:文分割ステップ)、内容語抽出手段222によって、分割された単語から内容語を抽出する(ステップS22:内容語抽出ステップ)。そして、質問回答関連度算出部23は、スコア算出手段223によって、入力された質問文中に含まれる結果を示す単語と、複数の解答候補に含まれる原因を示す単語とからなる複数の原因結果ペアを抽出し、共起確率テーブル13を参照して、抽出した原因結果ペアが同時に出現する確率の最大値、最小値および平均値を第2スコアとしてそれぞれ算出する(ステップS23:スコア算出ステップ)。
本実施形態の質問応答装置1によれば、原因文スコア(第1スコア)を算出することで、原因を含む解答候補だけではなく、原因を含む可能性がある解答候補も解答として出力できる。また、質問応答装置1は、因果関係表現スコア(第2スコア)を算出することで、質問文に含まれている結果を生じさせる原因が解答候補に含まれていればその解答候補を解答として出力できる。また、質問応答装置1は、関連度スコア(第3スコア)を算出することで、質問文と類似した内容の解答候補を解答として出力できる。さらに、質問応答装置は、第1ないし第3スコアを統合した第4スコアを算出することで、原因を問うタイプの質問に対する解答の精度を向上させることができる。また、機械学習の手法を導入することで、手書きのルールが不必要となり、システム構築コストの削減が期待できる。
以上、本発明の実施形態について説明したが、本発明はこれに限定されるものではなく、その趣旨を変えない範囲で実施することができる。例えば、本実施形態では、因果関係表現スコア算出部22は、1つの解答候補に対して12個の観点のスコアを因果関係表現スコア(第2スコア)として算出するものとして説明したが、第2スコアの個数はこれに限定されるものではない。
また、本実施形態では、タイプ別モジュール群9にSAIQAシステムを備えるものとしたが、これに限定されるものではなく、その他のファクトイド型質問応答システムのモジュールを備えるようにしてもよい。また、定義型質問応答システムのモジュールや、手続きを問う質問に答えることのできる質問応答システムのモジュールを備えるようにしてもよい。
また、本実施形態では、文書群11を新聞記事としたが、これに限定されるものではなく、例えば、電子化された各種雑誌、辞書、百科事典や専門書等の図書、ウェブ上の事典等で構成してもよい。また、本実施形態では、コーパス12を日本語コーパスとしたが、言語はこれに限定されるものではなく、例えば、英語コーパス等で構成してもよい。
本実施形態の質問応答装置1である実施例(NAZEQA)とその他のシステムとの性能比較を表3〜表6に示す。
Figure 2008282366
Figure 2008282366
Figure 2008282366
Figure 2008282366
この評価は、質問解答セット群14として500個の質問解答セットを用いて行ったものである。実施例(NAZEQA)に関しては、スコア統合重み調整の必要性から5-fold cross validationの手法で値を算出した。表3〜表6において、比較例中の「従来法」とは、非特許文献2に記載された諸岡らの手法による従来の質問応答システムを用いたことを示す。また、比較例中の「表現対スコア」とは、質問応答装置1の解答抽出部7において、因果関係表現スコア算出部22のみを用いたことを示す。また、比較例中の「関連度スコア」とは、質問応答装置1の解答抽出部7において、質問回答関連度算出部23のみを用いたことを示す。また、比較例中の「原因文スコア」とは、質問応答装置1の解答抽出部7において、原因文スコア算出部21のみを用いたことを示す。このうち、比較例中の「表現対スコア」は、出力される12個のスコアを、それぞれ上位N位を抽出する並べ替えに用いたときに、最も成績のよかったスコアについての性能を代表として表記したものである。また、比較例中の「関連度スコア」と「原因文スコア」は、出力される1個のスコアを用いて単純に上位N位を抽出する並べ替えにそれぞれ用いたものである。したがって、実施例以外は、14個のスコアを統合する解答候補ランキング部8の機能を用いていない。
評価のため、実施例および比較例のシステムについて、上位1位の解答(表3)、上位5位の解答(表4)、上位10位の解答(表5)および上位20位の解答(表4)をそれぞれ出力させた。表3〜表6において、MRR(Mean Reciprocal Rank)とは、最も上位に存在する解答の順位の逆数の平均値を示す。また、Prc.(precision)とは、出力した解答の中に正解が存在する率を示す。また、Rec.(recall)とは、実際の正解のうち実際に出力されたものの率を示す。また、Fとは、F値であり、precisionとrecallとの調和平均を示す。
表3〜表6から分かるとおり、実施例(NAZEQA)は、MRRやF値において「従来法」を上回っている(統計的に有意)。また、実施例(NAZEQA)は、比較例中の「表現対スコア」、「関連度スコア」、「原因文スコア」よりも良い評価を得ている。このことから、第1ないし第3スコアを統合した実施例の有効性が示されたと言える。表6に示す実施例のMRR「0.236」は、おおよそ上位20位まで出力すれば、平均的に、4位と5位との間(4位に近い位置)に、正答を発見できることを示す。一方、表6に示す「従来法」のMRR「0.146」は、おおよそ上位20位まで出力すれば、平均的に、6位と7位との間(7位に近い位置)に、正答を発見できることを示す。つまり、実施例は、「従来法」に比べて正答を大幅に見つけ易くなっていると考えられる。
[具体例]
図10は、図1に示した「なぜ月食が起こるのか?」という質問に対し、因果関係表現スコアを用いない場合の結果を示す図である(比較例)。解答抽出結果の欄を参照すると、正解(図1において符号101で示す第1位の内容)の「月食は太陽と地球、月が一直線に並び、地球の影に月が入るために起こる現象」は、符号1001で示すように、順位が4位に下がっている。本実施例の質問応答装置1においては、質問文と回答候補との因果関係表現として、内容語ペア(単語対)として<現象+名詞_一般、起こる+動詞_自立>が存在し、意味属性ペア(意味属性対)として<理由、名詞>が存在する。そのため、本実施例の質問応答装置1は、因果関係表現スコアを用いない場合(比較例)よりも、正答の文のスコアが押し上げられることとなる。
図11は、「世界で水不足の問題が起きている原因は何か?」という質問に対し、因果関係表現スコアを用いない場合の結果を示す図である(比較例)。また、図12は、「世界で水不足の問題が起きている原因は何か?」という質問に対する実施例の結果を示す図である。図11において解答抽出結果の欄を参照すると、正解(図12において符号1201で示す第1位の内容)の「文明が発達して森が消え、水不足や地球温暖化の原因となる…」は、符号1101で示すように、順位が10位に下がっている。本実施例の質問応答装置1においては、質問文と回答候補との因果関係表現として、意味属性ペア(意味属性対)として<進歩、世界>や<原因、生起>などが存在する。そのため、本実施例の質問応答装置1は、因果関係表現スコアを用いない場合(比較例)よりも、正答の文のスコアが押し上げられることとなる。このように、原因文スコア(第1スコア)と関連度スコア(第3スコア)に加え、因果関係表現スコア(第2スコア)を導入することで、正解の精度を高めることが可能である。
本発明の実施形態に係る質問応答装置の概要を模式的に示す図である。 質問応答装置の構成を模式的に示す機能ブロック図である。 図2に示した解答抽出部の構成を模式的に示す機能ブロック図である。 図3に示した原因文スコア算出部で処理されるデータの一例を示す図である。 図3に示した因果関係表現スコア算出部で処理されるデータの一例を示す図である。 質問解答セットの一例を示す図である。 図2に示した質問応答装置の動作を示すフローチャートである。 第1スコア算出処理を示すフローチャートである。 第2スコア算出処理を示すフローチャートである。 図1に示した「なぜ月食が起こるのか?」という質問に対し、因果関係表現スコアを用いない場合の結果を示す図である(比較例)。 「世界で水不足の問題が起きている原因は何か?」という質問に対し、因果関係表現スコアを用いない場合の結果を示す図である(比較例)。 「世界で水不足の問題が起きている原因は何か?」という質問に対する実施例の結果を示す図である。
符号の説明
1 質問応答装置
4 記憶部
5 質問タイプ判定部
6 文書抽出部
7 解答抽出部
8 解答候補ランキング部
9 タイプ別モジュール群
11 文書群
12 コーパス
13 共起確率テーブル
14 質問解答セット群
15 重みテーブル
21 原因文スコア算出部
211 単語間依存構造解析手段
212 内容語処理手段
213 第1特徴量生成手段
214 第2特徴量生成手段
216 スコア算出手段
22 因果関係表現スコア算出部
220 共起確率テーブル作成手段
221 文分割手段
222 内容語抽出手段
223 スコア算出手段
23 質問回答関連度算出部

Claims (8)

  1. 質問とその解答との間に因果関係があるタイプの質問に応答する質問応答装置であって、
    入力された質問文に関連する1以上の文書を、予め定められた文書群から抽出する文書抽出部と、
    分類用のラベルが予め付与されている単語で構成された複数の文を含む予め作成されたコーパスを利用して、前記抽出された文書中に含まれる文を示す複数の解答候補に原因を表す表現が含まれている可能性がどれくらいあるかを表す第1スコアを算出する原因文スコア算出部と、
    所定の1以上の共起尺度によって前記コーパス中の文に含まれる原因を示す単語と結果を示す単語から予め求められた原因結果ペアの共起確率を複数格納した1以上の共起確率テーブルを利用して、前記入力された質問文と前記解答候補との間に因果関係を示す表現が含まれている可能性がどれくらいあるかを表す第2スコアを前記共起確率テーブルごとに算出する因果関係表現スコア算出部と、
    前記入力された質問文と前記解答候補との間の内容の関連度を表す第3スコアを算出する質問回答関連度算出部と、
    前記第1ないし第3スコアを統合した第4スコアを算出し、前記解答候補のうち前記第4スコアの上位の所定数の文を、前記入力された質問文に対する解答として出力する解答候補ランキング部とを備えることを特徴とする質問応答装置。
  2. 前記原因文スコア算出部は、
    入力された質問文を構成する単語間の依存構造を解析し単語をノードとした木構造を生成する単語間依存構造解析手段と、
    前記生成された木構造のノードのうち内容語を示すノードに品詞情報を付与することで品詞ノードを生成する内容語処理手段と、
    前記コーパスにおいて意味属性、動詞分類および固有名詞分類のうちの少なくとも1つを示す第1付加情報が、前記生成された品詞ノードで示される内容語に対して付与されているか否かを判別し、前記内容語に前記第1付加情報が付与されている場合に、当該内容語を示す品詞ノードに対して、前記第1付加情報を示す子ノードを追加することで第1特徴量を生成する第1特徴量生成手段と、
    前記コーパスにおいて予めそれぞれ定められた固有表現情報、良否に関する評価表現であるか否かを示す情報および因果関係に関連することを示す情報のうちの少なくとも1つを示す第2付加情報が、前記生成された品詞ノードで示される内容語に付与されているか否かを判別し、前記内容語に前記第2付加情報が付与されている場合に、当該内容語を示す品詞ノードに対して、前記第2付加情報を示す子ノードを追加することで第2特徴量を生成する第2特徴量生成手段と、
    前記コーパスを利用して前記第1付加情報および前記第2付加情報に対して予め作成された原因文分類手段と、
    前記原因文分類手段を用いて、前記質問文に対して生成された第1特徴量および第2特徴量に対する重みを用いて前記第1スコアを算出するスコア算出手段とを備えることを特徴とする請求項1に記載の質問応答装置。
  3. 前記因果関係表現スコア算出部は、
    入力された質問文および前記複数の解答候補を単語に分割する文分割手段と、
    前記分割された単語から内容語を抽出する内容語抽出手段と、
    前記入力された質問文中に含まれる結果を示す単語と、前記複数の解答候補に含まれる原因を示す単語とからなる複数の原因結果ペアを抽出し、前記共起確率テーブルを参照して、前記抽出した原因結果ペアが同時に出現する確率の最大値、最小値および平均値のうちの少なくとも1つを前記第2スコアとして算出するスコア算出手段とを備えることを特徴とする請求項1または請求項2に記載の質問応答装置。
  4. 質問とその解答との間に因果関係があるタイプの質問に応答する質問応答装置の質問応答方法であって、
    文書抽出部によって、入力された質問文に関連する1以上の文書を、予め定められた文書群から抽出する文書抽出ステップと、
    原因文スコア算出部によって、分類用のラベルが予め付与されている単語で構成された複数の文を含む予め作成されたコーパスを利用して、前記抽出された文書中に含まれる文を示す複数の解答候補に原因を表す表現が含まれている可能性がどれくらいあるかを表す第1スコアを算出する原因文スコア算出ステップと、
    因果関係表現スコア算出部によって、所定の1以上の共起尺度によって前記コーパス中の文に含まれる原因を示す単語と結果を示す単語から予め求められた原因結果ペアの共起確率を複数格納した1以上の共起確率テーブルを利用して、前記入力された質問文と前記解答候補との間に因果関係を示す表現が含まれている可能性がどれくらいあるかを表す第2スコアを前記共起確率テーブルごとに算出する因果関係表現スコア算出ステップと、
    質問回答関連度算出部によって、前記入力された質問文と前記解答候補との間の内容の関連度を表す第3スコアを算出する質問回答関連度算出ステップと、
    解答候補ランキング部によって、前記第1ないし第3スコアを統合した第4スコアを算出し、前記解答候補のうち前記第4スコアの上位の所定数の文を、前記入力された質問文に対する解答として出力する解答候補ランキングステップとを有することを特徴とする質問応答方法。
  5. 前記原因文スコア算出ステップは、
    単語間依存構造解析手段によって、入力された質問文を構成する単語間の依存構造を解析し単語をノードとした木構造を生成する単語間依存構造解析ステップと、
    内容語処理手段によって、前記生成された木構造のノードのうち内容語を示すノードに品詞情報を付与することで品詞ノードを生成する内容語処理ステップと、
    第1特徴量生成手段によって、前記コーパスにおいて意味属性、動詞分類および固有名詞分類のうちの少なくとも1つを示す第1付加情報が、前記生成された品詞ノードで示される内容語に対して付与されているか否かを判別し、前記内容語に前記第1付加情報が付与されている場合に、当該内容語を示す品詞ノードに対して、前記第1付加情報を示す子ノードを追加することで前記第1特徴量を生成する第1特徴量生成ステップと、
    第2特徴量生成手段によって、前記コーパスにおいて予めそれぞれ定められた固有表現情報、良否に関する評価表現であるか否かを示す情報および因果関係に関連することを示す情報のうちの少なくとも1つを示す第2付加情報が、前記生成された品詞ノードで示される内容語に付与されているか否かを判別し、前記内容語に前記第2付加情報が付与されている場合に、当該内容語を示す品詞ノードに対して、前記第2付加情報を示す子ノードを追加することで第2特徴量を生成する第2特徴量生成ステップと、
    スコア算出手段によって、前記コーパスを利用して前記第1付加情報および前記第2付加情報に対して予め作成された原因文分類手段を用いて、前記質問文に対して生成された第1特徴量および第2特徴量に対する重みを用いて前記第1スコアを算出するスコア算出ステップとを有することを特徴とする請求項4に記載の質問応答方法。
  6. 前記因果関係表現スコア算出ステップは、
    文分割手段によって、入力された質問文および前記複数の解答候補を単語に分割する文分割ステップと、
    内容語抽出手段によって、前記分割された単語から内容語を抽出する内容語抽出ステップと、
    スコア算出手段によって、前記入力された質問文中に含まれる結果を示す単語と、前記複数の解答候補に含まれる原因を示す単語とからなる複数の原因結果ペアを抽出し、前記共起確率テーブルを参照して、前記抽出した原因結果ペアが同時に出現する確率の最大値、最小値および平均値のうちの少なくとも1つを前記第2スコアとして算出するスコア算出ステップとを有することを特徴とする請求項4または請求項5に記載の質問応答方法。
  7. 請求項4ないし請求項6のいずれか一項に記載の質問応答方法をコンピュータに実行させることを特徴とする質問応答プログラム。
  8. 請求項7に記載の質問応答プログラムが記録されたことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2007128578A 2007-05-14 2007-05-14 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体 Active JP4778474B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007128578A JP4778474B2 (ja) 2007-05-14 2007-05-14 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007128578A JP4778474B2 (ja) 2007-05-14 2007-05-14 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2008282366A true JP2008282366A (ja) 2008-11-20
JP4778474B2 JP4778474B2 (ja) 2011-09-21

Family

ID=40143102

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007128578A Active JP4778474B2 (ja) 2007-05-14 2007-05-14 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP4778474B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009157791A (ja) * 2007-12-27 2009-07-16 Nippon Telegr & Teleph Corp <Ntt> 質問応答方法、装置、プログラム並びにそのプログラムを記録した記録媒体
JP2010262383A (ja) * 2009-04-30 2010-11-18 Ntt Docomo Inc レコメンド情報生成装置およびレコメンド情報生成方法
WO2012132388A1 (ja) * 2011-03-28 2012-10-04 日本電気株式会社 テキスト分析装置、問題言動抽出方法および問題言動抽出プログラム
JP2015225415A (ja) * 2014-05-26 2015-12-14 日本電信電話株式会社 結束性判定装置、モデル学習装置、方法、及びプログラム
WO2016000115A1 (en) * 2014-06-30 2016-01-07 Microsoft Technology Licensing, Llc Understanding tables for search
WO2018056423A1 (ja) * 2016-09-26 2018-03-29 国立研究開発法人情報通信研究機構 シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム
WO2018066489A1 (ja) * 2016-10-07 2018-04-12 国立研究開発法人情報通信研究機構 ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム
JP2018063696A (ja) * 2016-10-07 2018-04-19 国立研究開発法人情報通信研究機構 ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム
CN109684443A (zh) * 2018-11-01 2019-04-26 百度在线网络技术(北京)有限公司 智能交互方法和装置
JP2019164669A (ja) * 2018-03-20 2019-09-26 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
WO2020174826A1 (ja) * 2019-02-25 2020-09-03 日本電信電話株式会社 回答生成装置、回答学習装置、回答生成方法、及び回答生成プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729424B (zh) * 2013-12-20 2017-03-15 百度在线网络技术(北京)有限公司 问答社区内回答评价方法和系统

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009157791A (ja) * 2007-12-27 2009-07-16 Nippon Telegr & Teleph Corp <Ntt> 質問応答方法、装置、プログラム並びにそのプログラムを記録した記録媒体
JP2010262383A (ja) * 2009-04-30 2010-11-18 Ntt Docomo Inc レコメンド情報生成装置およびレコメンド情報生成方法
WO2012132388A1 (ja) * 2011-03-28 2012-10-04 日本電気株式会社 テキスト分析装置、問題言動抽出方法および問題言動抽出プログラム
JPWO2012132388A1 (ja) * 2011-03-28 2014-07-24 日本電気株式会社 テキスト分析装置、問題言動抽出方法および問題言動抽出プログラム
JP2015225415A (ja) * 2014-05-26 2015-12-14 日本電信電話株式会社 結束性判定装置、モデル学習装置、方法、及びプログラム
US10853344B2 (en) 2014-06-30 2020-12-01 Microsoft Technology Licensing, Llc Understanding tables for search
WO2016000115A1 (en) * 2014-06-30 2016-01-07 Microsoft Technology Licensing, Llc Understanding tables for search
US9734181B2 (en) 2014-06-30 2017-08-15 Microsoft Technology Licensing, Llc Understanding tables for search
WO2018056423A1 (ja) * 2016-09-26 2018-03-29 国立研究開発法人情報通信研究機構 シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム
US10963646B2 (en) 2016-09-26 2021-03-30 National Institute Of Information And Communications Technology Scenario passage pair recognizer, scenario classifier, and computer program therefor
WO2018066489A1 (ja) * 2016-10-07 2018-04-12 国立研究開発法人情報通信研究機構 ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム
JP2018063696A (ja) * 2016-10-07 2018-04-19 国立研究開発法人情報通信研究機構 ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム
JP2019164669A (ja) * 2018-03-20 2019-09-26 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
CN109684443B (zh) * 2018-11-01 2020-11-24 百度在线网络技术(北京)有限公司 智能交互方法和装置
CN109684443A (zh) * 2018-11-01 2019-04-26 百度在线网络技术(北京)有限公司 智能交互方法和装置
US11372906B2 (en) 2018-11-01 2022-06-28 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for intelligent interaction
WO2020174826A1 (ja) * 2019-02-25 2020-09-03 日本電信電話株式会社 回答生成装置、回答学習装置、回答生成方法、及び回答生成プログラム
JPWO2020174826A1 (ja) * 2019-02-25 2021-11-25 日本電信電話株式会社 回答生成装置、回答学習装置、回答生成方法、及び回答生成プログラム
JP7120433B2 (ja) 2019-02-25 2022-08-17 日本電信電話株式会社 回答生成装置、回答学習装置、回答生成方法、及び回答生成プログラム

Also Published As

Publication number Publication date
JP4778474B2 (ja) 2011-09-21

Similar Documents

Publication Publication Date Title
JP4778474B2 (ja) 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体
US9519634B2 (en) Systems and methods for determining lexical associations among words in a corpus
Can et al. Information retrieval on Turkish texts
US7333966B2 (en) Systems, methods, and software for hyperlinking names
Asian Effective techniques for Indonesian text retrieval
JP5086799B2 (ja) 質問応答方法、装置、プログラム並びにそのプログラムを記録した記録媒体
US9836985B2 (en) Systems and methods for automated scoring of textual responses to picture-based items
JP5710581B2 (ja) 質問応答装置、方法、及びプログラム
JP4911599B2 (ja) 風評情報抽出装置及び風評情報抽出方法
JPH03172966A (ja) 類似文書検索装置
Alian et al. Arabic semantic similarity approaches-review
Vilares et al. Managing misspelled queries in IR applications
Sakai et al. ASKMi: A Japanese Question Answering System based on Semantic Role Analysis.
Walas et al. Named entity recognition in a Polish question answering system
Iqbal et al. CURE: Collection for urdu information retrieval evaluation and ranking
Balog et al. The university of amsterdam at weps2
Patel et al. Influence of Gujarati STEmmeR in supervised learning of web page categorization
Naemi et al. Informal-to-formal word conversion for persian language using natural language processing techniques
Davis Jr et al. Approximate String Matching for Geographic Names and Personal Names.
Balaji et al. Finding related research papers using semantic and co-citation proximity analysis
Sati et al. Arabic text question answering from an answer retrieval point of view: A survey
Kuznetsov et al. A method for obtaining a type of scientific result from the text of an article abstract to improve the quality of recommender systems
Rajamanthri et al. Plagiarism detection tool for sinhala language with internet resources using natural language processing
Ding et al. Drug Name Correction of Medication Records from Aeromedical Certification Exams
Wimalasuriya Automatic text summarization for sinhala

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090715

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110628

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110701

R150 Certificate of patent or registration of utility model

Ref document number: 4778474

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140708

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350