JP2014229275A - 質問応答装置、及び質問応答方法 - Google Patents

質問応答装置、及び質問応答方法 Download PDF

Info

Publication number
JP2014229275A
JP2014229275A JP2013111271A JP2013111271A JP2014229275A JP 2014229275 A JP2014229275 A JP 2014229275A JP 2013111271 A JP2013111271 A JP 2013111271A JP 2013111271 A JP2013111271 A JP 2013111271A JP 2014229275 A JP2014229275 A JP 2014229275A
Authority
JP
Japan
Prior art keywords
question
answer
partial
sentence
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013111271A
Other languages
English (en)
Other versions
JP6095487B2 (ja
Inventor
吉村 健
Takeshi Yoshimura
健 吉村
千晶 森田
Chiaki Morita
千晶 森田
可奈子 大西
Kanako Onishi
可奈子 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2013111271A priority Critical patent/JP6095487B2/ja
Publication of JP2014229275A publication Critical patent/JP2014229275A/ja
Application granted granted Critical
Publication of JP6095487B2 publication Critical patent/JP6095487B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】別の質問を含む質問文に対して回答し得る質問応答装置、及び質問応答方法を提供する。
【解決手段】質問応答装置100においては、質問受付部101が質問文を受け付け、部分質問抽出部102が質問文の一部である部分質問を抽出し、回答取得部104が部分質問の回答を取得し、質問編集部105が質問文における部分質問の箇所を、部分質問の回答に置き換えて、回答取得部104が、置き換えた質問の回答を取得し、回答出力部111が、置き換えた質問の回答を出力する。
【選択図】図1

Description

本発明は、質問に応答する質問応答装置、及び質問応答方法に関する。
ユーザ操作により入力された自然言語の質問文に対し、その質問文に対する回答を提示する質問応答技術が研究されている。たとえば、「富士山の高さは?」という質問に対し、「3776m」という回答を出力するものである。このような技術は、質問を音声で受け付けるアプリケーション等に適用される。
上記の質問応答技術では、大きく分けて2つのアプローチがある。1つは通常のウェブ検索エンジンを利用し、ウェブ検索結果に含まれる文章に基づき、回答を推定するものである。たとえば、「富士山の高さは?」という質問に対し、名詞を抽出して「富士山 高さ」という検索語に変換し、検索エンジンに入力する。
そして、検索エンジンが出力する検索結果ページに含まれるタイトルや概要文から、統計処理により「3776m」という回答を推定する。非特許文献1において、当該技術とそのバリエーションが開示されている。
もう1つのアプローチは、データベースに知識を予め蓄積しておき、質問文から言語解析によりデータベースに問い合せるクエリに変換し、回答を得るものである。
例えば、「富士山の高さは?」という質問に対し、entity(対象物)=“富士山”、property(属性)=“標高”という情報を抽出し、データベース問い合わせ言語であるSQL等に変換し、回答である「3776m」を得るものである。非特許文献2および非特許文献3において当該技術が開示されている。
一般的に前者のアプローチは、回答精度は劣るものの多様な質問に対して回答することができ、後者のアプローチは、質問の対応範囲は狭いものの、正解率の高い回答をすることができる。
磯崎、質問応答システム (自然言語処理シリーズ2)、コロナ社 吉村健、「しゃべってコンシェルと言語処理」、情報処理学会音声言語情報処理研究会SLP93-4、2012年10月 吉村健、「しゃべってコンシェルのQ&A機能を実現する知識検索エンジン開発」,人工知能学会、第88回人工知能基本問題研究会,2013年1月
しかし、非特許文献1〜3の方法では、より複雑な質問には、対応できなくなる。例えば、「○△□(作品名)の作者の誕生日は?」という質問のように、一つの質問文にさらに質問文が内在しているような質問には対応できないという問題点がある。仮に、ウェブ検索エンジンを利用したアプローチにおいて、「○△□ 作者 誕生日」という検索語を検索エンジンに入力したとしても、正しい回答が検索結果に含まれることはほとんどない。また、データベースを用いたアプローチにおいても、単純にentityとpropertyに分解できるわけではなく、そのままデータベース問合せ言語に変換することができない。
そこで、本発明においては、上記の課題を解決するために、別の質問を含む質問文に対して回答し得る質問応答装置、及び質問応答方法を提供することを目的とする。
上述の課題を解決するために、本発明の質問応答装置は、質問文を受け付ける質問文受付手段と、質問文の一部である部分質問を抽出する部分質問抽出手段と、部分質問の回答を取得する部分質問回答取得手段と、質問文における部分質問の箇所を、部分質問回答取得手段が取得した回答に置き換える質問置換手段と、質問置換手段により置き換えられた質問文に対する回答を取得する置換質問回答取得手段と、質問文に対する回答を出力する回答出力手段と、を備える。
また、本発明の質問応答方法は、質問応答装置で実行する質問応答方法であって、質問文を受け付ける質問文受付ステップと、質問文の一部である部分質問を抽出する部分質問抽出ステップと、部分質問の回答を取得する部分質問回答取得ステップと、質問文における部分質問の箇所を、部分質問回答取得ステップで取得した回答に置き換える質問置換ステップと、質問置換ステップにより置き換えられた質問文に対する回答を取得する置換質問回答取得ステップと、質問文に対する回答を出力する回答出力ステップと、を含む。
この発明によれば、質問文に含まれる部分的な質問を抽出して、部分的な質問箇所を、部分的な質問における回答に置き換えて、置き換えた質問の回答を取得するため、別の質問を含む質問文に対して正確に回答することができる。
また、本発明の質問応答装置において、第1のチェックワードリストを有し、部分質問抽出手段は、部分質問に、第1のチェックワードリストのワードが含まれているか否かに基づいて部分質問が適切であるか否かを判断し、部分質問回答取得手段は、部分質問が適切である場合に、部分質問の回答を取得してもよい。
この場合、質問応答装置は、第1のチェックワードリストを用いて部分質問が適切であるか否かを判断するため、部分質問として適切ではない(部分質問として体を成していない)にも関わらず、部分質問として回答を取得してしまうことを回避することができる。
また、本発明の質問応答装置において、第2のチェックワードリストを有し、部分質問抽出手段は、質問文の部分質問を除いた部分に第2のチェックワードリストが含まれているか否かに基づいて部分質問が適切であるか否かを判断し、部分質問回答取得手段は、部分質問が適切である場合に、部分質問の回答を取得するようにしてもよい。
この場合、質問応答装置は、第2のチェックワードリストを用いて、質問文における部分質問が適切であるか否かを判断(質問文が部分質問を有する形式の質問文であるか否かを判断)するため、部分質問として適切ではないにも関わらず、部分質問として回答を取得してしまうことを回避することができる。
また、本発明の質問応答装置において、部分質問回答取得手段が、複数の回答を取得した場合、置換質問回答取得手段は、質問文の部分質問の箇所を、複数の回答のそれぞれに置き換えた質問文に対する回答を取得し、回答出力手段は、置換質問回答取得手段が取得した回答の中から、所定数の回答を出力してもよい。
この場合、質問応答装置は、部分質問に対する回答が複数ある場合に、代表的な回答を出力することができる。
また、本発明の質問応答装置において、部分質問の回答が得られない場合、質問文の回答を取得する全体質問回答取得手段をさらに備え、回答出力手段は、全体質問回答取得手段が取得した回答を出力してもよい。
この場合、質問応答装置は、部分的に質問が存在しない場合でも、受け付けた質問文全体の回答を出力することができる。
また、本発明の質問応答装置において、部分質問回答取得手段は、付記的部分を有する回答を取得した場合、付記的部分を削除した回答を部分質問の回答としてもよい。この場合、質問応答装置は、付記的な箇所を取り除いて質問文を置き換えるため、より正確に回答を得ることができる。
本発明によれば、質問文に含まれる部分的な質問を抽出して、部分的な質問箇所を、部分的な質問の回答に置き換えて、質問の回答を取得するため、別の質問を含む質問文に対して回答することができる。
質問応答装置100の機能を示すブロック図である。 質問応答装置100のハードウェア構成図である。 entity−property型回答DB108で保持しているデータの一例を示す図である。 一問一答型回答DB110で保持しているデータの一例を示す図である。 entity−property型の質問回答の処理を示すフローチャートである。 質問文に対する回答処理を示すフローチャートである。 質問文に対する回答処理を示すフローチャートである。
添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一部分には同一の符号を付して、重複する説明を省略する。
図1は、本実施形態の質問応答装置の機能を示すブロック図である。質問応答装置は、サーバ装置、端末装置等の種々の情報処理装置である。
本実施形態の質問応答装置100の機能構成を示すブロック図である。図1に示されるように、質問応答装置100は、質問受付部101(質問文受付手段)、部分質問抽出部102(部分質問抽出手段)、チェックワードリスト103、回答取得部104(部分質問回答取得手段、置換質問回答取得手段、全体質問回答取得手段)、質問編集部105(質問置換手段)、回答生成部106、entity−property型質問回答部107、entity−property型回答DB部108、一問一答型質問回答部109、一問一答型回答DB部110、及び回答出力部111(回答出力手段)を含んで構成されている。
図2は、質問応答装置100のハードウェア構成図である。図2に示される質問応答装置100は、物理的には、図2に示すように、1又は複数のCPU11、主記憶装置であるRAM12及びROM13、入力デバイスであるキーボード及びマウス等の入力装置14、ディスプレイ等の出力装置15、ネットワークカード等のデータ送受信デバイスである通信モジュール16、半導体メモリ等の補助記憶装置17などを含むコンピュータシステムとして構成されている。図2における各機能は、図3に示すCPU11、RAM12等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU11の制御のもとで入力装置14、出力装置15、通信モジュール16を動作させるとともに、RAM12や補助記憶装置17におけるデータの読み出し及び書き込みを行うことで実現される。以下、図1に示す機能ブロックに基づいて、各機能ブロックを説明する。
質問受付部101は、テキスト情報(音声入力情報をテキスト変換した情報も含む)からなる質問文を受け付ける。具体的には、質問受付部101は、他の装置から通信ネットワークを介して質問文を受け付けたり、入力装置14により入力された質問文を受け付けたりする。
部分質問抽出部102は、形態素に基づいて質問文の一部である部分質問を抽出する。具体的に、部分質問抽出部102は、入力された質問文に対して形態素解析を行い、質問文を形態素に分割する。そして、部分質問抽出部102は、質問文全体から部分質問を抽出する。部分質問抽出部102は、予め部分質問を抽出できるように学習したモデルである学習モデルを定義しておき、当該学習モデルに基づき部分質問を抽出する。ここでいう学習モデルとは、質問文のパターン(質問文に用いられる単語に基づいたパターン)を定義したモデルである。
さらに、部分質問抽出部102は、部分質問を抽出すると、当該部分質問を検証し、部分質問として適切であるか否かを判断する。詳細は、後述する。
チェックワードリスト103は、部分質問が適切であるか否かを判断するためのワードを保持するリスト(部分質問用のチェックワードリスト)を管理するデータベースである。具体的に、チェックワードリスト103は、2つのリストを保持する。具体的には、第1のチェックワードリストであるチェックワードリスト103aは、「標高」「高さ」「大きさ」「作者」「著者」「誕生日」「首相」「大統領」「代表作」「掲載年」「日本で」「世界で」「一番」等の単語や表現を含むリストである。第2のチェックワードリストであるチェックワードリスト103bは、「標高」「高さ」「大きさ」「作者」「著者」「誕生日」「首相」「大統領」「代表作」「掲載年」等の単語や表現を含むリストである。チェックワードリスト103a及びチェックワードリスト103bは、質問形式の文章であるか否かを判断するため単語のリストである。
回答取得部104は、全体質問(質問受付部101が受け付けた質問全体)、部分質問、及び全体質問の部分質問箇所を、部分質問の回答に置き換えた質問である置換質問の何れかの回答を取得する。具体的には、回答取得部104は、全体質問、部分質問、及び置換質問の何れかを回答生成部106へ出力し、当該回答生成部106から質問の回答を取得する。
回答生成部106は、回答取得部104から所定の質問文(全体質問、部分質問、及び置換質問の何れか)を取得し、当該質問文の回答を回答取得部104へ出力する。回答生成部106は、entity−property型質問回答部107、entity−property型DB108、一問一答型質問回答部109、及び一問一答型回答DB110を有する。
回答生成部106は、entity−property型質問回答部107による回答結果、及び一問一答型質問回答部109による回答結果に基づいた、出力用の回答結果を回答取得部104へ出力する。具体的には、回答生成部106は、entity−property型質問回答部107により回答が得られた場合、当該回答を出力用の回答結果として出力し、一問一答型質問回答部109により回答が得られた場合、当該回答を出力用の回答結果として出力し、entity−property型質問回答部107及び一問一答型質問回答部109の何れからも回答が得られなかった場合、回答が得られなかった旨(例えば、「回答なし」)を出力用の回答結果として出力する。
entity−property型質問回答部107は、entity−property型の質問を受け付けた場合、entity−property型回答DB108を参照して回答する。ここで、entity−property型質問とは、所定の対象物の属性を問い合わせる質問をいう。
entity−property型回答DB108は、entity−property型の質問・回答を管理するデータベースである。図3にentity−property型回答DB110のデータ例を示す。図3に示すように、entity−property型回答DB110は、対象物を示す「entity」と、属性を示す「property」と、値を示す「value」とが対応付けられた情報を管理している。
図3の例では、entityが「富士山」で、propertyが「標高」である場合、valueが「3776m」であることを示している。すなわち、富士山の標高が3776mであることを示している。entity−property型質問回答部107による処理の詳細は、後述する。
一問一答型質問回答部109は、一問一答型の質問を受け付けた場合、一問一答型回答DB110を参照して回答する。
一問一答型回答DB110は、一問一答型の質問・回答を管理するデータベースである。図4に一問一答型回答DB108のデータ例を示す。図4に示すように、一問一答型回答DB108は、質問を意味する「question」と、当該質問の回答を意味する「answer」とを有する。図4に示すデータ例によれば、「世界で一番高い山」という質問に対する答えが「エベレスト」であることを示している。
回答出力部111は、回答取得部104が取得した、置換質問の回答又は全体質問の回答を出力する。具体的には、回答出力部111は、質問文を送信した外部装置に対して回答を送信したり、質問応答装置100が備える出力装置15へ回答を出力したりする。
続いて、回答生成部106が質問の回答を生成する処理を説明する。最初に、entity−property型質問回答部107によるentity−property型質問の回答処理を図5に示すフローチャートを用いて説明する。
entity−property型質問回答部107は、最初に質問文を受け付けると(ステップS1)、形態素解析を実行する(ステップS2)。たとえば「富士山の高さは」という質問に対し、entity−property型質問回答部107は、“富士山/の/高さ/は”というように形態素単位に分ける。
続いて、entity−property型質問回答部107は、entityの抽出を行う。entity−property型質問回答部107は、例えば、条件付確率場(CRF)などの機械学習を用いて抽出する。entity−property型質問回答部107は、上記形態素の品詞や隣接する形態素の関係に基づいて、entityの抽出を行う。
上記の質問例(「富士山の高さは」)の場合、entity−property型質問回答部107は、「富士山」をentityとして抽出する(ステップS3)。
続いてentity−property型質問回答部107は、propertyの判定を行う(ステップS4)。具体的に、entity−property型質問回答部107は、例えばマルチクラスSVMのような機械学習によってpropertyを判定する。entity−property型質問回答部107は、上記形態素の品詞や隣接する形態素の関係に基づいて、形態素がpropertyであるか否かを判定し、propertyを特定する。propertyとして予め「標高」、「作者」、「誕生日」等が定義されている場合、entity−property型質問回答部107は、上述の質問例から「標高」がpropertyであると判定する。
続いてentity−property型質問回答部107は、propertyの検証を行う(ステップS5)。entity−property型質問回答部107は、予め定義されている検証ワードリストを参照して、上記判定したpropertyが適切であるか否かを検証する。
例えば、「標高」のpropertyに対応する検証ワードとして、「標高」、「高さ」「大きさ」等のワードが定義されているものとする。上述の質問例では、「高さ」が含まれているため、entity−property型質問回答部107は、検証結果として問題ないと判断し、property判定結果の「標高」を有効とする。
そして、entity−property型質問回答部107は、抽出されたentity「富士山」とproperty「標高」とを検索キーとして、entity-property型回答DB110を検索し、回答「3776m」を得る(ステップS6)。entity−property型質問回答部107は、取得した回答を出力し(ステップS7)、処理を終える。
続いて、一問一答型質問回答部109が実行する一問一答型の回答処理を説明する。一例として、質問文が入力されると、一問一答型質問回答部109は、キーワードと関係しない特定の語尾等(例えば、「は」、「か」、「ですか」)を除去した後、語尾を除去した質問文をクエリとして、一問一答型回答DB110を検索し、回答を得る。たとえば「日本で一番高い山は」という質問が入力されると、一問一答型質問回答部109は、語尾の「は」を除去したのち、「日本で一番高い山」というクエリによって一問一答型回答DB110を検索し、「富士山」という回答を得る。ただし、必ずしも回答が得られるとは限らず、回答が得られない場合は、一問一答型質問回答部109は、回答結果として「回答なし」と出力する。
回答生成部106は、entity−property型及び一問一答型の質問の回答を生成する場合について述べたが、他の形式の質問を回答するようにしてもよい。具体的に、正規表現型の質問の回答を生成するようにしてもよい。例えば、「1+1=」のように、様々な数字が入り得る計算質問の場合、正規表現のパターン(例えば、「数字+数字」等)と質問とをマッチングし、任意の計算質問を抽出し、数字による足し算計算を実行することができる。
(全体処理の説明)
続いて、質問応答装置100が実行する全体処理を、図6に示すフローチャートを用いて説明する。ここで全体処理とは、質問文を受け付けて、当該質問文から部分質問を抽出し、当該部分質問の箇所を部分質問の回答に置き換えて、置き換えた質問の回答を出力する処理をいう。
最初に、質問受付部101が、質問文を受け付けると(ステップS11)、部分質問抽出部102が上記質問文に対して形態素解析を行い、質問文を形態素に分割する(ステップS12)。
例えば、「○△△×の作者の誕生日は」という質問文を受け付けた場合、部分質問抽出部102は、「○△△×」「の」「作者」「の」「誕生日」「は」と分割する。
次に、部分質問抽出部102は、質問全体から部分質問を抽出する(ステップS13)。部分質問抽出部102は、例えば、条件付確率場(CRF)などの機械学習を用いて部分質問を抽出する。すなわち、部分質問抽出部102は、予め部分質問を抽出できるように学習したモデルである学習モデルを定義しておき、当該学習モデルに基づき部分質問を抽出する。例えば、上述の質問文の場合、部分質問抽出部102は、助詞である“の”と、質問文によく使用される名詞である“作者”とに基づいて部分質問があると判断する。そして、部分質問抽出部102は、上記の質問例では「○△△×の作者」を部分質問として抽出する。
部分質問抽出部102が部分質問を抽出しなかった場合(ステップS14;NO)、ステップS22へ移動する。
部分質問抽出部102が部分質問を抽出した場合(ステップS14;YES)、部分質問抽出部102は、当該部分質問を検証する(ステップS15)。具体的に、部分質問抽出部102は、部分質問がチェックワードリスト103aに含まれる単語や表現を含んでいるか否かを判断する。上述の例では、「○△△×の作者」が部分質問であるため、「作者」という単語を含んでおり、チェックワードリスト103aの単語を含むことになる。
また、部分質問抽出部102は、部分質問以外の質問文においてチェックワードリスト103bに含まれる単語や表現を含んでいるか否かを判断する。上述の例では、「の誕生日は」が部分質問を除いた部分であり、当該部分においてチェックワードリスト103bに含まれる単語「誕生日」を含むことになる。なお、チェックワードリスト103a、103bの2つのチェックワードリスト103a、103bを用いて、部分質問のチェック及び、質問文における部分質問以外のチェックを行う場合について述べたが、1つのチェックワードリストを用いて部分質問のチェック及び、質問文における部分質問以外のチェックを行うようにしてもよい。
上述のように、部分質問抽出部102は、上記の2つのチェックを通して部分質問が適切であるか否かを判断(すなわち、部分質問を有する質問形式であるか否かを判断)する。上述の例の場合、部分質問抽出部102は、チェックワードリスト103aを用いた適正判断、及びチェックワードリスト103bを用いた適正判断ともに適切と判断したため、部分質問として適切であると判断し(ステップS16;YES)、ステップS17へ移動する。
なお、部分質問抽出部102は、チェックワードリスト103aを用いた適正判断、及びチェックワードリスト103bを用いた適正判断の少なくともいずれか一方が不適切である場合、部分質問として不適切であると判断し(ステップS16;NO)、ステップS22へ移動する。
なお、部分質問の検証方法は、上記の例に限られず、例えば、チェックワードリスト103aのみ保持し、部分質問内がチェックワードリスト103aの単語や表現を含む場合に、部分質問抽出部102が部分質問として適切であると判断するようにしてもよい。
さらに別の部分質問の検証方法として、チェックワードリスト103bのみ用意して、質問文における部分質問を除いた箇所がチェックワードリスト103bの単語や表現を含む場合に、部分質問抽出部102が、部分質問として適切であると判断するようにしてもよい。
ステップS17では、回答取得部104が、部分質問を回答生成部106へ出力すると共に、部分質問の回答要求を行う(ステップS17)。
回答取得部104は、部分質問の回答を取得した場合(ステップS18;YES)、例えば、上記の部分質問「○△△×の作者」に対して「山田○○」という回答を取得した場合、上記のステップS19へ移動する。回答取得部104は、部分質問の回答を取得しなかった場合(ステップS18;NO)、ステップS22へ移動する。
ステップS19では、質問編集部105は、質問文に対して、部分質問の箇所である「○△△×の作者」を、当該部分質問の回答である「山田○○」に置き換える。
ところで、部分質問の回答として、付記的情報が含まれている場合がある。例えば、「□○国の首長」という質問に対し「[大統領]○△×<改行コード>(2013年4月時点)」という回答が得られたとする。ここで、<改行コード>は改行コードが含まれていることを示している。また、上記回答には、「(2013年4月時点)」と記載のように括弧も含まれている。
このような場合に、質問編集部105は、改行コード以降の回答部分を削除したり、括弧内の部分を削除したりしたものを部分質問の回答としてもよい。すなわち、質問編集部105は、得られた回答の内、付記的部分(改行コード以降の回答部分、括弧内の部分)を除去したものを部分回答とする。これにより、質問編集部105は、回答の本質的部分を部分回答とすることができる。
質問編集部105が、質問文における部分質問の箇所を部分質問の回答に置き換えた後に、回答取得部104は、置き換えた質問を回答生成部106へ出力すると共に、回答生成部106へ回答要求を行い、質問の回答を取得する(ステップS20)。
回答取得部104が回答を取得しなかった場合(ステップS21;NO)、ステップS22へ移動し、回答取得部104が回答を取得した場合(ステップS21;YES)、ステップS24へ移動する。
ステップS22では、部分質問を抽出できなかった場合(ステップS14、S16でNOのとき)又は、部分質問を抽出できた場合でも当該部分質問に対する回答を得られなかった場合(ステップS18でNOのとき)に、回答取得部104は、質問受付部101が受け付けた質問を回答生成部106へ出力すると共に、回答要求を行う(ステップS22)。
ステップS22において、回答取得部104が回答を取得した場合(ステップS23;YES)、ステップS24へ移動し、回答取得部104が回答を取得しなかった場合(ステップS23;NO)、処理を終了する。
ステップS23又はステップS21において回答を取得した場合、、回答出力部111は、回答取得部104が取得した回答を出力して(ステップS24)、処理を終了する。
(変形例)
変形例では、部分質問の回答が複数ある場合の処理について述べる。変形例における、回答取得処理のフローチャートを図7に示す。なお、質問応答装置100の構成は、図1と同様である。
ステップS31〜ステップS37は、ステップS11〜ステップS18とそれぞれ同様であり、ステップS42及びステップS43は、ステップS22及びステップS23とそれぞれ同様であるため省略する。
部分質問抽出部102は、部分質問を抽出する。質問文が「山田○○の代表作の掲載年は」である場合、「山田○○の代表作」という部分質問を抽出し、回答取得部104は、当該部分質問に対する回答を取得する(ステップS31―S37)。
質問編集部105は、回答取得部104が回答を取得した場合において(ステップS38;YES)、回答取得部104が取得した部分質問の回答が複数(例えばN件)ある場合、質問文における、部分質問の箇所を各部分質問の回答に置換する(ステップS39)。即ち、質問編集部105は、部分質問の回答数分(即ちN件)、置換後の質問文を生成する。
回答取得部104は、質問編集部105が生成した質問文を回答生成部106へ出力すると共に、回答要求を行う(ステップS40)。質問編集部105が複数の質問文を生成した場合、回答取得部104は、全ての質問文を回答生成部106へ出力する。
回答取得部104は、1つも回答を取得できなかった場合(ステップS41;NO)、ステップS42へ移動する。
回答取得部104は、1つ以上の回答を取得した場合(ステップS41;YES)、ステップS44へ移動し、取得した回答を出力する。この際に、全ての回答を出力せずに、取得した回答の内、一部の回答を出力するようにしてもよい。
なお、置換質問に対する回答が、さらに複数ある場合もある。その場合においても、置換質問一つあたりM件の回答を出力することとする。したがって最大ではN×M個の回答が出力される。
このように、質問応答装置100では、部分質問の回答が複数あることを許容することにより、ある部分質問の回答に置き換えた質問から回答が得られない場合にも、別の部分質問の回答に置き換えた質問の回答が得られれば、最終的には回答を提示することができるようになる。
次に、本実施形態の質問応答装置100の作用効果について説明する。質問応答装置100においては、質問受付部101が質問文を受け付け、部分質問抽出部102が質問文の一部である部分質問を抽出する。回答取得部104が部分質問の回答を取得し、質問編集部105が質問文における部分質問の箇所を、部分質問の回答に置き換える。回答取得部104が、置き換えた質問の回答を取得し、回答出力部111が、置き換えた質問の回答を出力する。
この場合、質問応答装置100は、質問文に含まれる部分的な質問を抽出して、部分的な質問箇所を、部分的な質問の回答に置き換える。そして、質問応答装置100は、置き換えた質問における回答を当初の質問の回答として取得するため、別の質問を含む質問文に対して正確に回答することができる。
よって、質問応答装置100は、質問文中の単語を抽出して、当該単語をキーワードとして回答を得るという手法では回答が得られない複雑な質問であっても、正確に回答を得ることができる。
例えば、ユーザが、ある作者の誕生日を知りたい場合に、その作者の名前を特定できないときでも、当該作者を特定し得る情報(例えば、代表作○○△)を含めた質問(○○△の作者の誕生日)を提示すれば、質問応答装置100は、回答を出力することができる。すなわち、質問応答装置100は、複雑な質問(比較的曖昧な質問)でも回答を出力することができる。
また、質問応答装置100では、チェックワードリスト103aを有し、部分質問抽出部102は、部分質問にチェックワードリスト103aのワードが含まれているか否かに基づいて部分質問が適切であるか否かを判断し、回答取得部104は、部分質問が適切である場合に、部分質問の回答を取得するようにしてもよい。
この場合、質問応答装置100は、チェックワードリスト103aを用いて部分質問が適切であるか否かを判断するため、部分質問として適切ではないにも関わらず、部分質問として回答を取得してしまうことを回避することができる。
また、質問応答装置100では、チェックワードリスト103bを有し、部分質問抽出部102は、質問文の部分質問を除いた部分にチェックワードリスト103bが含まれているか否かに基づいて部分質問が適切であるか否かを判断し、回答取得部104は、部分質問が適切である場合に、部分質問の回答を取得するようにしてもよい。
この場合も、質問応答装置100は、チェックワードリスト103bを用いて、質問文における部分質問が適切であるか否かを判断(質問文が部分質問を有する形式の質問文であるか否かを判断)するため、部分質問として適切ではないにも関わらず、部分質問として回答を取得してしまうことを回避することができる。
質問応答装置100において、回答取得部104が、複数の回答を取得した場合、回答取得部104は、質問文の部分質問の箇所を、複数の回答のそれぞれに置き換えた質問文に対する回答を取得し、回答出力部111は、回答取得部104が取得した回答の中から、所定数の回答を出力してもよい。
この場合、質問応答装置100は、部分質問に対する回答が複数ある場合に、代表的な回答を出力することができる。
質問応答装置100において、部分質問の回答が得られない場合、回答取得部104が質問文の回答を取得し、回答出力部111は、上記質問文の回答を出力してもよい。この場合、質問応答装置100は、部分的に質問が存在しない場合でも、受け付けた質問文全体の回答を出力することができる。
質問応答装置100において、回答取得部104は、部分質問の回答として、括弧書きのような付記的部分を有する回答を取得した場合、付記的部分を削除した回答を部分質問の回答としてもよい。
この場合、質問応答装置100は、括弧書き部分のような回答として付記的な箇所を取り除いて質問文を置き換えるため、より正確に回答を得ることができる。
質問応答装置100において、回答取得部104は、部分質問の回答として、改行コード以降の文のような付記的部分を有する回答を取得した場合、改行コード以降の回答を削除した回答を部分質問の回答としてもよい。
この場合、質問応答装置100は、改行コード以降の文のような、回答として付記的な箇所を取り除いて質問文を置き換えるため、より正確に回答を得ることができる。
(他の実施形態)
上述の実施形態では、質問応答装置100が回答生成部106を有する場合について述べたが、他の装置(例えば、サーバ等)が回答生成部を有するようにしてもよい。この場合、質問応答装置100は、回答生成部を備える装置へ質問文を送信し、当該回答生成部を備える装置から回答を取得する。
100…質問応答装置、101…質問受付部、102…部分質問抽出部、103…チェックワードリスト、104…回答取得部、105…質問編集部、106…回答生成部、107…一問一答型質問回答部、108…一問一答型回答DB、109…entity−property型質問回答部、110…entity−property型回答DB部、111…回答出力部。

Claims (7)

  1. 質問文を受け付ける質問文受付手段と、
    前記質問文の一部である部分質問を抽出する部分質問抽出手段と、
    前記部分質問の回答を取得する部分質問回答取得手段と、
    前記質問文における前記部分質問の箇所を、前記部分質問回答取得手段が取得した回答に置き換える質問置換手段と、
    前記質問置換手段により置き換えられた質問文に対する回答を取得する置換質問回答取得手段と、
    前記質問文に対する回答を出力する回答出力手段と、を備える質問応答装置。
  2. 第1のチェックワードリストを有し、
    前記部分質問抽出手段は、前記部分質問に前記第1のチェックワードリストのワードが含まれているか否かに基づいて、前記部分質問が適切であるか否かを判断し、
    前記部分質問回答取得手段は、前記部分質問が適切である場合に、部分質問の回答を取得する、請求項1に記載の質問応答装置。
  3. 第2のチェックワードリストを有し、
    前記部分質問抽出手段は、前記質問文の部分質問を除いた部分に前記第2のチェックワードリストが含まれているか否かに基づいて、前記部分質問が適切であるか否かを判断し、
    前記部分質問回答取得手段は、前記部分質問が適切である場合に、部分質問の回答を取得する、請求項1又は2に記載の質問応答装置。
  4. 前記部分質問回答取得手段が、複数の回答を取得した場合、前記置換質問回答取得手段は、前記質問文の部分質問の箇所を前記複数の回答のそれぞれに置き換えた質問文に対する回答を取得し、
    前記回答出力手段は、前記置換質問回答取得手段が取得した回答の中から、所定数の回答を出力することを特徴とする、請求項1から3の何れか一項に記載の質問応答装置。
  5. 前記部分質問の回答が得られない場合、前記質問文の回答を取得する全体質問回答取得手段をさらに備え、
    前記回答出力手段は、前記全体質問回答取得手段が取得した回答を出力する、請求項1から4の何れか一項に記載の質問応答装置。
  6. 前記部分質問回答取得手段は、付記的部分を有する回答を取得した場合、前記付記的部分を削除した回答を部分質問の回答とする、請求項1から5の何れか一項に記載の質問応答装置。
  7. 質問応答装置で実行する質問応答方法であって、
    質問文を受け付ける質問文受付ステップと、
    前記質問文の一部である部分質問を抽出する部分質問抽出ステップと、
    前記部分質問の回答を取得する部分質問回答取得ステップと、
    前記質問文における前記部分質問の箇所を、前記部分質問回答取得ステップで取得した回答に置き換える質問置換ステップと、
    前記質問置換ステップにより置き換えられた質問文に対する回答を取得する置換質問回答取得ステップと、
    前記質問文に対する回答を出力する回答出力ステップと、を含む質問応答方法。
JP2013111271A 2013-05-27 2013-05-27 質問応答装置、及び質問応答方法 Active JP6095487B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013111271A JP6095487B2 (ja) 2013-05-27 2013-05-27 質問応答装置、及び質問応答方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013111271A JP6095487B2 (ja) 2013-05-27 2013-05-27 質問応答装置、及び質問応答方法

Publications (2)

Publication Number Publication Date
JP2014229275A true JP2014229275A (ja) 2014-12-08
JP6095487B2 JP6095487B2 (ja) 2017-03-15

Family

ID=52129016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013111271A Active JP6095487B2 (ja) 2013-05-27 2013-05-27 質問応答装置、及び質問応答方法

Country Status (1)

Country Link
JP (1) JP6095487B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017037588A (ja) * 2015-08-14 2017-02-16 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP6408080B1 (ja) * 2017-06-30 2018-10-17 ヤフー株式会社 生成装置、生成方法及び生成プログラム
JP2018181259A (ja) * 2017-04-21 2018-11-15 日本電信電話株式会社 対話ルール照合装置、対話装置、対話ルール照合方法、対話方法、対話ルール照合プログラム、及び対話プログラム
CN112214582A (zh) * 2019-07-11 2021-01-12 松下知识产权经营株式会社 管理系统、回答显示方法以及记录介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252381A (ja) * 2005-03-14 2006-09-21 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252381A (ja) * 2005-03-14 2006-09-21 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017037588A (ja) * 2015-08-14 2017-02-16 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2018181259A (ja) * 2017-04-21 2018-11-15 日本電信電話株式会社 対話ルール照合装置、対話装置、対話ルール照合方法、対話方法、対話ルール照合プログラム、及び対話プログラム
JP6408080B1 (ja) * 2017-06-30 2018-10-17 ヤフー株式会社 生成装置、生成方法及び生成プログラム
JP2019012439A (ja) * 2017-06-30 2019-01-24 ヤフー株式会社 生成装置、生成方法及び生成プログラム
CN112214582A (zh) * 2019-07-11 2021-01-12 松下知识产权经营株式会社 管理系统、回答显示方法以及记录介质
JP2021015864A (ja) * 2019-07-11 2021-02-12 パナソニックIpマネジメント株式会社 管理システム、回答表示方法およびプログラム
JP7378036B2 (ja) 2019-07-11 2023-11-13 パナソニックIpマネジメント株式会社 管理システム、回答表示方法およびプログラム

Also Published As

Publication number Publication date
JP6095487B2 (ja) 2017-03-15

Similar Documents

Publication Publication Date Title
US10585924B2 (en) Processing natural-language documents and queries
US8131536B2 (en) Extraction-empowered machine translation
CN117056471A (zh) 知识库构建方法及基于生成式大语言模型的问答对话方法和系统
US10354647B2 (en) Correcting voice recognition using selective re-speak
CN110134780B (zh) 文档摘要的生成方法、装置、设备、计算机可读存储介质
CN111026319B (zh) 一种智能文本处理方法、装置、电子设备及存储介质
CN104216913A (zh) 问题回答框架
US10824816B2 (en) Semantic parsing method and apparatus
CN111026320B (zh) 多模态智能文本处理方法、装置、电子设备及存储介质
US11379527B2 (en) Sibling search queries
JP6095487B2 (ja) 質問応答装置、及び質問応答方法
KR20230005797A (ko) 질의어를 처리하는 장치, 방법 및 컴퓨터 프로그램
CN117421413A (zh) 一种问答对生成方法、装置及电子设备
CN111142728B (zh) 车载环境智能文本处理方法、装置、电子设备及存储介质
Rohit et al. System for Enhancing Accuracy of Noisy Text using Deep Network Language Models
CN108920452B (zh) 一种信息处理方法及装置
WO2019231635A1 (en) Method and apparatus for generating digest for broadcasting
US20220035792A1 (en) Determining metadata of a dataset
JP7161255B2 (ja) 文書作成支援装置、文書作成支援方法、及び、文書作成プログラム
CN106547753B (zh) 一种信息分析方法及电子设备
JP6717909B2 (ja) 要約生成サーバ、要約生成システム及び要約生成方法
CN112989013B (zh) 一种对话处理方法、装置、电子设备及存储介质
US20240012995A1 (en) Computerized systems and methods for hierarchical structure parsing and building
US20210109960A1 (en) Electronic apparatus and controlling method thereof
Tan et al. A Semantic Context-Aware Automatic Quality Scoring Method for Machine Translation Based on Pretraining Language Model

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170214

R150 Certificate of patent or registration of utility model

Ref document number: 6095487

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250