JP2004192338A - Question answering device, question answering program and recording medium having the program recorded thereon - Google Patents
Question answering device, question answering program and recording medium having the program recorded thereon Download PDFInfo
- Publication number
- JP2004192338A JP2004192338A JP2002359580A JP2002359580A JP2004192338A JP 2004192338 A JP2004192338 A JP 2004192338A JP 2002359580 A JP2002359580 A JP 2002359580A JP 2002359580 A JP2002359580 A JP 2002359580A JP 2004192338 A JP2004192338 A JP 2004192338A
- Authority
- JP
- Japan
- Prior art keywords
- answer
- question
- information
- elements
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、ユーザから自然言語で入力された質問事項に対し、所定の情報源から回答を検索し出力する情報検索機能を有する質問応答装置に関する。
【0002】
【従来の技術】
コンピュータのユーザが情報検索のために入力した質問に対し、その回答を提示する手法として、後述する特許文献1の特開2002−132812公報に開示された技術がある。この開示技術における質問応答システムは、例えば、「ロシアの大統領は誰ですか?」との質問文に対し、当該質問文の中の「ロシア」および「大統領」をキーワードとして文書検索を行い、検索された文書から「プーチン」および「エリツィン」等の回答候補を得る。さらに、各回答候補について所定の手順でスコアリングを行った後、全ての回答候補の中から適正な回答を選定し、それらを出力する。
【0003】
【特許文献1】
特開2002−132812公報
【0004】
【発明が解決しようとする課題】
しかしながら、従来の質問応答システムでは、複数の回答候補が存在する場合、各々の内容に関わらず各回答候補が回答欄に羅列されることから、たとえその中に同一内容を示す回答候補が存在しても、ユーザは、それらが全て異なる内容を示すものと誤認するおそれがある。また、ユーザが回答候補の羅列を閲覧したとき、各回答候補がどのような関係にあるのか、あるいは、当該質問にとって有益な回答候補はどれであるか等の疑問を生じ易いという不都合がある。
【0005】
本発明は、前記した課題に鑑みてなされたものであり、ユーザからの質問に対し、当該ユーザが適正な回答を円滑に取得することができる質問応答装置を提供することを目的とする。
【0006】
【課題を解決するための手段】
本発明は、以上の点を解決するために、次の構成を採用する。
〈構成1〉
本発明に係る質問応答装置は、質問を示す質問情報を入力されたとき当該質問に対する回答を示す回答情報を出力する質問応答装置であって、質問情報が示す質問により要求される回答の属性を解析し、該解析された属性に基づいて、回答を検索するための検索要素を前記質問情報から抽出する質問解析部と、相互に異なる文書情報を有する文書情報群から前記検索要素を含む文書情報を検索する文書検索部と、前記文書検索部により検索された文書情報から前記回答の属性に対応する全ての回答要素を抽出し該抽出した各回答要素を用いて回答情報を形成する回答形成部と、前記各回答要素を前記回答の属性に関連する所定の関連属性毎に区分し、該区分された回答要素のうちの同一内容を示す回答要素を相互に対応付ける対応付け処理部とを備え、前記回答形成部は、前記回答情報を形成すべく、前記対応付けられた回答候補群毎に前記回答要素を配列する。
【0007】
前記対応付け処理部は、前記所定の関連属性毎に区分された回答要素のうち、相互に部分的に一致する回答要素を対応付けるようにすることができる。
【0008】
〈構成2〉
本発明に係る質問応答装置は、質問を示す質問情報を入力されたとき当該質問に対する回答を示す回答情報を出力する質問応答装置であって、質問情報が示す質問により要求される回答の属性を解析し、該解析された属性に基づいて、回答を検索するための検索要素を前記質問情報から抽出する質問解析部と、相互に異なる文書情報を有する文書情報群から前記検索要素を含む文書情報を検索する文書検索部と、前記文書検索部により検索された文書情報から前記回答の属性に対応する全ての回答要素を抽出し該抽出した各回答要素を用いて回答情報を形成する回答形成部と、回答情報における回答要素の重要度を回答の属性毎に規定する重要度判定情報に基づいて、前記抽出された回答要素の重要度を判定し、該判定の結果を前記回答形成部に供給する重要度判定部とを備え、前記回答形成部は、回答情報を形成すべく、前記判定結果が示す重要度に基づき前記回答要素を配列する。
【0009】
本発明に係る質問応答装置に、さらに、前記回答形成部で抽出された前記各回答要素を前記回答の属性に関連する所定の関連属性毎に区分し、該区分された回答要素のうちの同一内容を示す回答要素を相互に対応付ける対応付け処理部を備えることができる。その場合、前記回答形成部は、前記配列すべき回答要素を、前記対応付けられた回答要素毎に集合させる。
【0010】
〈構成3〉
本発明に係るプログラムは、質問を示す質問情報がコンピュータに供給されたとき当該質問に対する回答を示す回答情報を当該コンピュータに出力させる質問応答プログラムであって、質問情報が示す質問により要求される回答の属性を解析し、該解析された属性に基づいて、回答を検索するための検索要素を前記質問情報から抽出し、相互に異なる文書情報を有する文書情報群から前記検索要素を含む文書情報を検索し、前記検索された文書情報から前記回答の属性に対応する全ての回答要素を抽出し、前記抽出された全ての回答要素を前記回答の属性に関連する所定の関連属性毎に区分し、該区分された回答要素のうちの同一内容を示す回答要素を相互に対応付け、回答情報を形成すべく前記対応付けられた回答候補群毎に前記回答要素を配列する。
【0011】
〈構成4〉
本発明に係る記録媒体は、コンピュータに質問を示す質問情報が供給されたとき当該質問に対する回答を示す回答情報を当該コンピュータに出力させる質問応答プログラムを記録した記録媒体であって、前記質問応答プログラムは、質問情報が示す質問により要求される回答の属性を解析し、該解析された属性に基づいて、回答を検索するための検索要素を前記質問情報から抽出し、相互に異なる文書情報を有する文書情報群から前記検索要素を含む文書情報を検索し、前記検索された文書情報から前記回答の属性に対応する全ての回答要素を抽出し、前記抽出された全ての回答要素を前記回答の属性に関連する所定の関連属性毎に区分し、該区分された回答要素のうちの同一内容を示す回答要素を相互に対応付け、回答情報を形成すべく前記対応付けられた回答候補群毎に前記回答要素を配列することを前記コンピュータに行わせる。
【0012】
【発明の実施の形態】
以下、本発明の実施の形態を具体例を用いて説明する。
〈具体例1〉
図1は、本発明に係る質問応答装置の具体例1の構成を示すブロック図である。
具体例1の質問応答装置101は、ユーザに情報検索サービスを提供すべく、汎用のパーソナルコンピュータあるいは公共機関に設置された情報検索端末等に通信可能に接続され、これらの端末から質問情報を与えられたとき、その回答となる回答情報を出力する。質問応答装置101およびユーザ端末間の接続は、インターネットのようなネットワークを介して行うように構成することができる。
【0013】
質問応答装置101は、図1に示すように、ユーザから入力された質問文を示す質問情報を解析する質問解析部10と、情報検索のための文書情報が予め保持されている文書データベース11と、当該質問に対する回答を検索するための文書情報を文書データベース11から検索する文書検索部12と、該文書検索部で検索された文書情報に対し、従来よく知られた形態素解析のような手法により属性の付与を行う属性付与部13と、回答情報を形成するための回答要素の集合を前記文書情報から抽出し、当該回答要素を用いて回答情報を形成する回答形成部14と、該回答形成部で抽出された回答要素の集合のうち、同一内容を示す回答要素を相互に対応付ける対応付け処理部15とを備える。
【0014】
質問応答装置101における各構成部分の動作を、図2に示すフローチャートに沿って説明する。
質問解析部10は、与えられた質問情報が示す質問文について形態素解析を行い、検索のための検索要素となる検索キーワード、および、当該質問により要求される回答の属性となる回答タイプを求める(ステップS1)。例えば、質問文が「ノーベル賞を受賞したのは誰ですか」である場合、当該質問文の「〜は誰ですか」に着目し、回答タイプが人名であることを解析する。また、形態素解析において、当該質問文は「ノーベル/賞/を/受賞/した/の/は/誰/です/か」のような各形態素に分割され、これらの形態素のうち、「を」「は」のような付属語と、質問意図を示す「誰」とが不要語として削除され、「ノーベル」、「賞」および「受賞」は、検索キーワードとして検出される。
【0015】
文書検索部12は、質問解析部10で求められた検索キーワードに基づいて、文書データベース11の文書情報を検索する(ステップS2)。前記した「ノーベル」、「賞」および「受賞」を検索キーワードとした場合、例えば、文書ファイル1となる「ノーベル賞を受賞した人は、湯川秀樹(物理学)、川端康成(文学)などである。」、および、文書ファイル2となる「湯川博士が中間子理論でノーベル物理学賞を受賞した。」などが検索結果となる。
【0016】
文書検索部12により検索結果が出されると、属性付与部13は、前記した文書ファイル1および2のような各文書情報について、形態素解析により、文書中の自立語に属性付与を行う(ステップS3)。例えば、文書ファイル1においては、「人」:一般名詞、「湯川秀樹」:人名、「川端康成」:人名のように属性が付与される。
【0017】
回答形成部14は、前記した属性付与の結果を受け、回答タイプに対応する属性を持つ全ての回答要素を回答候補として抽出する(ステップS4)。前記例では、回答タイプが人名であることから、回答候補には、文書ファイル1の「湯川秀樹」、「川端康成」、および、文書ファイル2の「湯川」が抽出される。
【0018】
対応付け処理部15は、回答形成部14で抽出された回答候補と、抽出に用いた文書情報とにより、同一内容を示す回答候補の対応付け処理を行い、その結果を回答形成部14に供給する(ステップS5)。
【0019】
ここで、対応付け処理部15による前記した対応付け処理について、図3に示すフローチャートに沿って説明する。
対応付け処理においては、回答タイプに関連する属性が予め設定されており、その属性が示す語句を関連語句として文書情報から取得する(ステップS5−1)。例えば、回答タイプが人名である場合、これに関連する属性としては組織や専門分野などを採用することができる。その他、例えば「〈所属部署〉の〈人名〉さん」のような文の係り受け関係に基づき、関連語句を取得することができる。前記した例においては、「湯川秀樹」に対する関連語句として「物理学」が取得され、「川端康成」には「文学」、「湯川」には「物理学」が得られる。
【0020】
次に、前記ステップS5−1で取得した各関連語句について、当該関連語句に対応する回答候補の中で文字列が最大長となる回答候補を検出する(ステップS5−2)。前記した例では、「物理学」を関連語句とする回答候補は、「湯川秀樹」および「湯川」であり、そのうち文字列が最大のものは「湯川秀樹」である。
【0021】
さらに、最大長の文字列となる回答候補と部分的に一致する回答候補が、同一の関連語句に対応する回答候補の集合内に存在するか否かを調べ、存在すれば、それらを同一内容を示す語句として対応付ける(ステップS5−3)。前記した例では、関連語句が「物理学」となる回答候補は、「湯川秀樹」の他に「湯川」が存在し、この「湯川」は、最大文字列の「湯川秀樹」と部分的に一致することから、両者は同一内容を示すものとして対応付けられる。このとき、同義語展開により、「ゆかわ」のような表記ゆれにも対応するように設定することができる。
【0022】
前記した関連語句について、当該関連語句に対応する他の回答候補があるか否かを判定し(ステップS5−4)、ある場合は前記ステップS5−2へ戻り、無いと判定されれば、後述するステップS5−5へ移行する。前記した例では、関連語句が「物理学」となる回答候補は、「湯川秀樹」および「湯川」の他に存在しないことから、ステップS5−5へ進む。
【0023】
当該関連語句についての処理が終わると、前記S5−2およびS5−3の処理が行われていない他の関連語句を選択し、それらの処理を行う(ステップS5−5)。前記した例では、関連語句の「物理学」については処理が終了したことから、次に「文学」についての処理が行われる。
【0024】
そして、全ての関連語句についての処理が終了したとき、同一内容を示す回答候補の対応付けの結果を回答形成部14へ供給する。これを以って、対応付け処理部15の処理が完了する。
【0025】
回答形成部14は、対応付け処理部15から供給された対応付け処理の結果に基づいて、回答情報を形成し、これを出力する(図2:ステップS6)。
図4に、ユーザに提示される回答情報の表示例を示す。図示の例では、質問文に対する回答の欄に、互いに同一内容を示す「湯川秀樹」および「湯川」が一括的に配置されている。
【0026】
具体例1の質問応答装置101によれば、抽出された回答候補の関連語句を用いて、同一内容を示す回答候補の対応付けを行うことから、ユーザに提示する回答情報においては、同一内容の各回答候補が散在することなく、それらを集合させて表示することができる。これにより、ユーザは、質問に対する回答を適正に把握することができる。
【0027】
具体例1の質問応答装置101に関する前記した説明では、回答タイプが1つである例を示したが、これに限らず、例えば「人名」の他に、その関連属性である「組織名」も回答タイプとする場合にも適用することができる。その場合、「人名」を「組織名」の関連属性として利用する。
【0028】
〈具体例2〉
図5は、本発明に係る質問応答装置の具体例2の構成を示すブロックである。具体例2の質問応答装置102は、図5に示すように、前記した具体例1の質問応答装置101における質問解析部10、文書データベース11、文書検索部12、属性付与部13および回答形成部14と基本的な機能を同じくする、質問解析部20、文書データベース21、文書検索部22、属性付与部23および回答形成部24を備える。
【0029】
質問応答装置102は、さらに、回答形成部24で抽出された回答候補の重要度を判定する重要度判定部26と、該判定部での前記判定の基準を規定する重要度判定情報が保持されている重要度判定データベース27とを備える。
【0030】
回答候補の重要度とは、当該回答候補の関連語句に付与された所定の順位を示し、より上位にある関連語句を持つ回答候補が、回答情報において優先的に提示される。例えば、関連語句の属性が役職名である場合、「社長」、「専務」、「部長」、「課長」、・・・の順に重要度を設定することができ、このような順位を規定する重要度判定情報が重要度判定データベース27に保持されている。
【0031】
質問応答装置102の動作を説明する。以下の説明では、会社内で特定の資格を持つ社員名を検索する例を示す。本具体例の質問応答装置102では、質問を与えられてから、回答要素を抽出するまでの手順は、図2に沿って説明した具体例1の質問応答装置101におけるステップS1〜S4と同様な手順である。従って、ここでは当該ステップの説明は省略する。
【0032】
前記した質問を与えられた後、回答形成部24で回答候補が抽出されると、重要度判定部26は、図6に示すフローチャートの手順に沿って重要度判定処理を行う。
この重要度判定処理では、前記具体例1の質問応答装置101における対応付け処理部15に関するステップS5−1(図2参照)と同様な手順で、各回答候補について関連語句を取得する(ステップS11)。例えば、回答候補となる「鈴木」、「田中」および「佐藤」について、役職名および所属部署名を関連語句とする処理を行った場合、「鈴木」:「課長」「総務部」、「田中」:「課長」「営業部」、「佐藤」:「部長」「営業部」との結果が出される。このとき、文書情報中における各回答候補の出現数を検出する。例えば、「鈴木」:出現数2、「田中」:出現数3、「佐藤」:出現数3との結果を得る。
【0033】
次に、いずれかの関連語句について、当該関連語句を持つ回答候補の出現数を集計する(ステップS12)。前記した例で、所属部署名を選択した場合、それぞれの出現数は、「総務部」:出現数2(鈴木2)、「営業部」:出現数6(田中3、佐藤3)となる。
【0034】
そして、前記関連語句を出現数が多い順に並べる(ステップS13)。前記した例では、「営業部」(出現数6)の次に「総務部」(出現数2)が配置される。
【0035】
また、1つの関連語句に複数の回答候補が対応する場合、重要度判定データベース27から重要度判定情報を取得し、当該情報と他の関連語句に基づいて、いずれの回答候補を優先的に配列するかを決定する(ステップS14)。前記した例では、関連語句の「営業部」に、「田中」および「佐藤」という2つの回答候補が対応していることから、他の関連語句の属性である役職名を用いて優先度を判定する。ここでは、役職名に関し予め設定された重要度判定情報に基づき、「課長」である「田中」よりも、「部長」である「佐藤」の優先順位が高いと判定される。従って、前記した例における3つの回答候補は、「佐藤」、「田中」、「鈴木」の順に重要度が設定され、この設定の内容が重要度判定部26から回答形成部24に通知される。
【0036】
回答形成部24は、重要度判定部26から供給された重要度の判定結果に基づき配列した回答候補から回答情報を形成する。図7に、ユーザに提示される回答情報の表示例を示す。図示の例では、質問文に対する回答欄に、前記した重要度の順位に従って配列された回答候補が表示されている。
【0037】
具体例2の質問応答装置102によれば、抽出された回答候補の関連語句に基づいて、各回答候補の重要度を設定することから、回答情報における回答候補のを所定の順序に沿って配列することができる。これにより、複数の回答候補を提示する際、各回答候補間の関係や、いずれの回答候補が重要であるか等を示唆することができる。従って、例えば、会社内の役職名別の社員検索や、当選順位別の当選者発表のように、各回答候補間の差別化を図る際に利用することにより、ユーザが回答内容を把握し易くなる。
【0038】
本発明の適用範囲は前記した各具体例の内容に限定されず、例えば、具体例2の質問応答装置102における回答形成部24および重要度判定部26間に、具体例1で説明した対応付け処理部15と同様の機能を持つ構成部分を追加した質問応答装置を適用することができる。これにより、同一内容を示す回答候補を集合させて配列しつつ、各回答候補を所定の重要度の順に表示することができる。
【0039】
また、前記した各具体例では、ユーザが利用する端末からの質問に対し、その回答を当該端末に通知する例を示したが、これに替えて、例えば指定した他の端末に回答を供給するように設定することができる。
【0040】
前記した各具体例の動作手順に沿った質問応答プログラムをコンピュータに導入することにより、種々のコンピュータを質問応答装置として動作させることができる。さらに、このプログラムを記録媒体に記録し、当該記録媒体をコンピュータに利用することができる。
【0041】
【発明の効果】
本発明に係る質問応答装置によれば、抽出された回答要素の関連属性を用いて、同一内容を示す回答要素の対応付けを行うことから、ユーザに提示する回答情報においては、同一内容の各回答要素が散在することなく、それらを集合させて表示することができる。これにより、ユーザは、質問に対する回答を適正に把握することができる。
【0042】
また、抽出された回答要素の関連属性に基づいて、各回答要素の重要度を設定することから、回答情報における回答要素のを所定の順序に沿って配列することができる。これにより、複数の回答要素を提示する際、各回答要素間の関連や、より有益な回答要素等を示唆することができ、当該回答を得たユーザの満足感を高めることができる。
【図面の簡単な説明】
【図1】本発明に係る質問応答装置の具体例1の構成を示すブロック図である。
【図2】具体例1の質問応答装置の動作を説明するためのフローチャートである。
【図3】具体例1の対応付け処理の手順を説明するためのフローチャートである。
【図4】具体例1の回答情報を説明するための説明図である。
【図5】本発明に係る質問応答装置の具体例2の構成を示すブロック図である。
【図6】具体例2の重要度判定処理の手順を説明するためのフローチャートである。
【図7】具体例2の回答情報を説明するための説明図である。
【符号の説明】
101、102 質問応答装置
10、20 質問解析部
11、21 文書データベース
12、22 文書検索部
13、23 属性付与部
14、24 回答形成部
15 対応付け処理部
26 重要度判定部
27 重要度判定データベース[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a question answering apparatus having an information search function for searching and outputting an answer from a predetermined information source for a question item input in a natural language from a user.
[0002]
[Prior art]
As a method of presenting an answer to a question input by a computer user for information search, there is a technique disclosed in Japanese Patent Application Laid-Open No. 2002-132812 of
[0003]
[Patent Document 1]
JP 2002-132812 A
[Problems to be solved by the invention]
However, in the conventional question answering system, when there are a plurality of answer candidates, each answer candidate is listed in the answer column regardless of the content of each answer candidate. Even so, there is a risk that the user may mistakenly recognize that they all indicate different contents. In addition, when the user browses the list of answer candidates, there is an inconvenience that it is easy to ask a question as to what relationship each answer candidate has, or which answer candidate is useful for the question.
[0005]
The present invention has been made in view of the above-described problems, and has as its object to provide a question answering apparatus that allows a user to smoothly obtain an appropriate answer to a question from the user.
[0006]
[Means for Solving the Problems]
The present invention employs the following configuration to solve the above points.
<
A question answering apparatus according to the present invention is a question answering apparatus that outputs answer information indicating an answer to the question when question information indicating a question is input, and sets an attribute of an answer required by the question indicated by the question information. Analyzing, based on the analyzed attributes, a question analysis unit for extracting a search element for searching for an answer from the question information, and document information including the search element from a document information group having mutually different document information And a response forming unit that extracts all answer elements corresponding to the attributes of the answer from the document information searched by the document searching unit, and forms answer information using the extracted answer elements. And an associating processing unit that classifies each answer element for each predetermined related attribute related to the attribute of the answer, and associates the answer elements indicating the same content among the sorted answer elements with each other. Wherein the reply forming unit to form the answer information, arranging the reply element for each answer candidate group the associated.
[0007]
The association processing unit may associate, among the answer elements classified for each of the predetermined related attributes, answer elements that partially match each other.
[0008]
<Configuration 2>
A question answering apparatus according to the present invention is a question answering apparatus that outputs answer information indicating an answer to the question when question information indicating a question is input, and sets an attribute of an answer required by the question indicated by the question information. Analyzing, based on the analyzed attributes, a question analysis unit for extracting a search element for searching for an answer from the question information, and document information including the search element from a document information group having mutually different document information And a response forming unit that extracts all answer elements corresponding to the attributes of the answer from the document information searched by the document searching unit, and forms answer information using the extracted answer elements. And the importance of the extracted answer element is determined based on importance determination information that defines the importance of the answer element in the answer information for each attribute of the answer, and the result of the determination is used as the answer formation And a significance determination unit is supplied to the reply formation unit, to form a reply information, the determination result is arranging the reply element based on the importance indicated.
[0009]
In the question answering apparatus according to the present invention, the answer elements extracted by the answer forming unit are further divided into predetermined related attributes related to the attributes of the answer, and the same of the sorted answer elements is selected. An association processing unit for associating answer elements indicating contents with each other can be provided. In this case, the answer forming unit aggregates the answer elements to be arranged for each of the associated answer elements.
[0010]
<Configuration 3>
A program according to the present invention is a question answering program that, when question information indicating a question is supplied to a computer, causes the computer to output answer information indicating an answer to the question, and the answer requested by the question indicated by the question information. Of the query information, extracting a search element for searching for an answer from the question information based on the analyzed attribute, and extracting document information including the search element from a document information group having mutually different document information. Search, extract all answer elements corresponding to the attribute of the answer from the searched document information, classify all the extracted answer elements for each predetermined related attribute related to the attribute of the answer, The answer elements indicating the same contents among the sorted answer elements are associated with each other, and the answer element is set for each of the associated answer candidate groups to form answer information. Sequences.
[0011]
<Configuration 4>
The recording medium according to the present invention is a recording medium recording a question answering program for causing a computer to output answer information indicating an answer to the question when question information indicating the question is supplied to the computer, wherein the question answering program Analyzes the attribute of the answer requested by the question indicated by the question information, extracts a search element for searching for an answer from the question information based on the analyzed attribute, and has mutually different document information. Document information including the search element is searched from the document information group, all answer elements corresponding to the answer attribute are extracted from the searched document information, and all the extracted answer elements are attributed to the answer. Is divided for each predetermined related attribute related to, and the response elements indicating the same contents among the divided response elements are associated with each other to form response information. Causing a arranging the reply element per the associated answer candidates to the computer.
[0012]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described using specific examples.
<Specific example 1>
FIG. 1 is a block diagram showing the configuration of Example 1 of the question answering apparatus according to the present invention.
The
[0013]
The
[0014]
The operation of each component in the
The
[0015]
The
[0016]
When the search result is output by the
[0017]
Upon receiving the result of the attribute assignment described above, the
[0018]
The associating
[0019]
Here, the above-mentioned association processing by the
In the association process, an attribute related to the answer type is set in advance, and the phrase indicated by the attribute is acquired from the document information as a related phrase (step S5-1). For example, when the answer type is a person's name, an organization, a specialty field, or the like can be adopted as an attribute related to this. In addition, a related phrase can be acquired based on a dependency relation of a sentence such as “<person name> of <department>”. In the above example, "physics" is acquired as a related phrase for "Hideki Yukawa", "literature" is obtained for "Yasunari Kawabata", and "physics" is obtained for "Yukawa".
[0020]
Next, for each related phrase acquired in step S5-1, an answer candidate whose character string has the maximum length among answer candidates corresponding to the related phrase is detected (step S5-2). In the above example, the answer candidates with “physics” as a related phrase are “Hideki Yukawa” and “Yukawa”, and the one with the largest character string is “Hideki Yukawa”.
[0021]
Further, it is checked whether or not the answer candidate partially matching the answer candidate having the maximum length character string exists in a set of answer candidates corresponding to the same related phrase. (Step S5-3). In the above example, the answer candidate whose related phrase is "physics" includes "Yukawa" in addition to "Hideki Yukawa", and this "Yukawa" is partially represented by "Hideki Yukawa" of the largest character string. Since they match, both are associated as indicating the same content. At this time, the synonym expansion can be set so as to cope with a spelling variation such as “Yukawa”.
[0022]
It is determined whether there is another answer candidate corresponding to the related phrase (step S5-4). If there is, the process returns to step S5-2. Then, the process proceeds to step S5-5. In the above example, since there is no answer candidate whose related phrase is "physics" other than "Hideki Yukawa" and "Yukawa", the process proceeds to step S5-5.
[0023]
When the processing for the related phrase is completed, another related phrase for which the processing of S5-2 and S5-3 has not been performed is selected and the processing is performed (step S5-5). In the example described above, the processing for the related term “physics” has been completed, and the processing for the “literature” is performed next.
[0024]
Then, when the processing for all the related phrases is completed, the result of associating the answer candidates having the same content is supplied to the
[0025]
The
FIG. 4 shows a display example of answer information presented to the user. In the illustrated example, “Hideki Yukawa” and “Yukawa” indicating the same content are arranged collectively in the column of the answer to the question text.
[0026]
According to the
[0027]
In the above description of the
[0028]
<Specific example 2>
FIG. 5 is a block diagram showing a configuration of a specific example 2 of the question answering apparatus according to the present invention. As shown in FIG. 5, the
[0029]
The
[0030]
The importance of the answer candidate indicates a predetermined order given to the related phrase of the answer candidate, and an answer candidate having a higher related word is preferentially presented in the answer information. For example, when the attribute of the related phrase is the title, the importance can be set in the order of “President”, “Senior Managing Officer”, “Manager”, “Manager”,... The importance determination information is held in the
[0031]
The operation of the
[0032]
When the
In this importance determination process, a related phrase is acquired for each answer candidate in the same procedure as in step S5-1 (see FIG. 2) related to the
[0033]
Next, for any of the related phrases, the number of appearances of answer candidates having the related phrase is counted (step S12). In the above example, when the department name is selected, the number of appearances is “general affairs department”: 2 occurrences (Suzuki 2), and “sales department”: 6 occurrences (Tanaka 3, Sato 3).
[0034]
Then, the related terms are arranged in descending order of the number of appearances (step S13). In the example described above, the “general affairs department” (the number of appearances 2) is arranged after the “sales department” (the number of appearances 6).
[0035]
When a plurality of answer candidates correspond to one related phrase, importance determination information is acquired from the
[0036]
The
[0037]
According to the
[0038]
The scope of application of the present invention is not limited to the contents of the specific examples described above. For example, the correspondence described in the specific example 1 between the
[0039]
Further, in each of the specific examples described above, the example is given in which, in response to the question from the terminal used by the user, the answer is notified to the terminal, but instead, for example, the answer is supplied to another specified terminal. It can be set as follows.
[0040]
Various computers can be operated as a question answering device by introducing a question answering program in accordance with the operation procedure of each of the above specific examples into a computer. Further, this program can be recorded on a recording medium, and the recording medium can be used for a computer.
[0041]
【The invention's effect】
According to the question answering apparatus according to the present invention, since the answer elements indicating the same content are associated with each other by using the related attributes of the extracted answer elements, in the answer information presented to the user, Answer elements can be grouped and displayed without being scattered. Thereby, the user can properly grasp the answer to the question.
[0042]
Further, since the importance of each answer element is set based on the extracted attribute of the answer element, the answer elements in the answer information can be arranged in a predetermined order. Accordingly, when presenting a plurality of answer elements, it is possible to suggest a relation between the answer elements, a more useful answer element, and the like, and it is possible to increase the satisfaction of the user who obtained the answer.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a specific example 1 of a question answering apparatus according to the present invention.
FIG. 2 is a flowchart for explaining the operation of the question answering apparatus of the first embodiment.
FIG. 3 is a flowchart illustrating a procedure of an associating process according to a first specific example;
FIG. 4 is an explanatory diagram for explaining answer information of a specific example 1.
FIG. 5 is a block diagram showing a configuration of a specific example 2 of the question answering apparatus according to the present invention.
FIG. 6 is a flowchart illustrating a procedure of an importance determination process according to the second embodiment.
FIG. 7 is an explanatory diagram for explaining answer information of a specific example 2.
[Explanation of symbols]
101, 102
Claims (6)
質問情報が示す質問により要求される回答の属性を解析し、該解析された属性に基づいて、回答を検索するための検索要素を前記質問情報から抽出する質問解析部と、相互に異なる文書情報を有する文書情報群から前記検索要素を含む文書情報を検索する文書検索部と、前記文書検索部により検索された文書情報から前記回答の属性に対応する全ての回答要素を抽出し該抽出した各回答要素を用いて回答情報を形成する回答形成部と、前記各回答要素を前記回答の属性に関連する所定の関連属性毎に区分し、該区分された回答要素のうちの同一内容を示す回答要素を相互に対応付ける対応付け処理部とを備え、
前記回答形成部は、前記回答情報を形成すべく、前記対応付けられた回答候補群毎に前記回答要素を配列することを特徴とする質問応答装置。A question answering device that outputs answer information indicating an answer to the question when question information indicating the question is input,
A question analysis unit that analyzes an attribute of an answer requested by the question indicated by the question information, and extracts a search element for searching for an answer from the question information based on the analyzed attribute; A document search unit for searching the document information including the search element from the document information group having: and extracting all the answer elements corresponding to the attribute of the answer from the document information searched by the document search unit. An answer forming unit that forms answer information by using answer elements, and an answer indicating the same content among the sorted answer elements by dividing each answer element into predetermined related attributes related to the attribute of the answer An association processing unit that associates elements with each other,
The question answering device, wherein the answer forming unit arranges the answer elements for each of the associated answer candidate groups to form the answer information.
質問情報が示す質問により要求される回答の属性を解析し、該解析された属性に基づいて、回答を検索するための検索要素を前記質問情報から抽出する質問解析部と、相互に異なる文書情報を有する文書情報群から前記検索要素を含む文書情報を検索する文書検索部と、前記文書検索部により検索された文書情報から前記回答の属性に対応する全ての回答要素を抽出し該抽出した各回答要素を用いて回答情報を形成する回答形成部と、回答情報における回答要素の重要度を回答の属性毎に規定する重要度判定情報に基づいて、前記抽出された回答要素の重要度を判定し、該判定の結果を前記回答形成部に供給する重要度判定部とを備え、
前記回答形成部は、回答情報を形成すべく、前記判定結果が示す重要度に基づき前記回答要素を配列することを特徴とする質問応答装置。A question answering device that outputs answer information indicating an answer to the question when question information indicating the question is input,
A question analysis unit that analyzes an attribute of an answer requested by the question indicated by the question information, and extracts a search element for searching for an answer from the question information based on the analyzed attribute; A document search unit for searching the document information including the search element from the document information group having: and extracting all the answer elements corresponding to the attribute of the answer from the document information searched by the document search unit. Determining the importance of the extracted answer element based on an answer forming unit that forms the answer information using the answer element and importance determination information that defines the importance of the answer element in the answer information for each attribute of the answer And an importance determining unit that supplies the result of the determination to the answer forming unit.
The question answering device, wherein the answer forming unit arranges the answer elements based on the importance indicated by the determination result to form answer information.
前記回答形成部は、前記配列すべき回答要素を、前記対応付けられた回答要素毎に集合させる請求項3記載の質問応答装置。Further, the answer elements extracted by the answer forming unit are divided into predetermined related attributes related to the attributes of the answer, and the answer elements indicating the same contents among the sorted answer elements are associated with each other. A correspondence processing unit,
4. The question answering device according to claim 3, wherein the answer forming unit aggregates the answer elements to be arranged for each of the associated answer elements.
質問情報が示す質問により要求される回答の属性を解析し、該解析された属性に基づいて、回答を検索するための検索要素を前記質問情報から抽出し、
相互に異なる文書情報を有する文書情報群から前記検索要素を含む文書情報を検索し、
前記検索された文書情報から前記回答の属性に対応する全ての回答要素を抽出し、
前記抽出された全ての回答要素を前記回答の属性に関連する所定の関連属性毎に区分し、該区分された回答要素のうちの同一内容を示す回答要素を相互に対応付け、
回答情報を形成すべく前記対応付けられた回答候補群毎に前記回答要素を配列することを特徴とする質問応答プログラム。A question answering program that causes the computer to output answer information indicating an answer to the question when question information indicating the question is supplied to the computer,
Analyze the attributes of the answer requested by the question indicated by the question information, based on the analyzed attributes, extract a search element for searching for an answer from the question information,
Searching document information including the search element from a document information group having mutually different document information,
Extract all answer elements corresponding to the attribute of the answer from the searched document information,
All the extracted answer elements are classified for each predetermined attribute related to the attribute of the answer, and the answer elements indicating the same content among the sorted answer elements are associated with each other,
A question answering program characterized by arranging the answer elements for each of the associated answer candidate groups to form answer information.
前記質問応答プログラムは、
質問情報が示す質問により要求される回答の属性を解析し、該解析された属性に基づいて、回答を検索するための検索要素を前記質問情報から抽出し、
相互に異なる文書情報を有する文書情報群から前記検索要素を含む文書情報を検索し、
前記検索された文書情報から前記回答の属性に対応する全ての回答要素を抽出し、
前記抽出された全ての回答要素を前記回答の属性に関連する所定の関連属性毎に区分し、該区分された回答要素のうちの同一内容を示す回答要素を相互に対応付け、
回答情報を形成すべく前記対応付けられた回答候補群毎に前記回答要素を配列することを前記コンピュータに行わせることを特徴とする記録媒体。A recording medium recording a question answering program that causes the computer to output answer information indicating an answer to the question when question information indicating the question is supplied to the computer,
The question answering program,
Analyze the attributes of the answer requested by the question indicated by the question information, based on the analyzed attributes, extract a search element for searching for an answer from the question information,
Searching document information including the search element from a document information group having mutually different document information,
Extract all answer elements corresponding to the attribute of the answer from the searched document information,
All the extracted answer elements are classified for each predetermined related attribute related to the attribute of the answer, and the answer elements indicating the same contents among the sorted answer elements are associated with each other,
A recording medium characterized by causing the computer to arrange the answer elements for each of the associated answer candidate groups to form answer information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002359580A JP4037250B2 (en) | 2002-12-11 | 2002-12-11 | Question answering apparatus, question answering program, and recording medium recording the program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002359580A JP4037250B2 (en) | 2002-12-11 | 2002-12-11 | Question answering apparatus, question answering program, and recording medium recording the program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004192338A true JP2004192338A (en) | 2004-07-08 |
JP4037250B2 JP4037250B2 (en) | 2008-01-23 |
Family
ID=32758942
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002359580A Expired - Fee Related JP4037250B2 (en) | 2002-12-11 | 2002-12-11 | Question answering apparatus, question answering program, and recording medium recording the program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4037250B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006293731A (en) * | 2005-04-12 | 2006-10-26 | Fuji Xerox Co Ltd | Question answering system, data retrieval method, and computer program |
JP2019095940A (en) * | 2017-11-20 | 2019-06-20 | ヤフー株式会社 | Information processing device, information processing method, and information processing program |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2791292A1 (en) | 2010-02-26 | 2011-09-01 | Mmodal Ip Llc | Clinical data reconciliation as part of a report generation solution |
WO2014028529A2 (en) | 2012-08-13 | 2014-02-20 | Mmodal Ip Llc | Maintaining a discrete data representation that corresponds to information contained in free-form text |
US10950329B2 (en) | 2015-03-13 | 2021-03-16 | Mmodal Ip Llc | Hybrid human and computer-assisted coding workflow |
WO2018136417A1 (en) | 2017-01-17 | 2018-07-26 | Mmodal Ip Llc | Methods and systems for manifestation and transmission of follow-up notifications |
US11282596B2 (en) | 2017-11-22 | 2022-03-22 | 3M Innovative Properties Company | Automated code feedback system |
-
2002
- 2002-12-11 JP JP2002359580A patent/JP4037250B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006293731A (en) * | 2005-04-12 | 2006-10-26 | Fuji Xerox Co Ltd | Question answering system, data retrieval method, and computer program |
JP4650072B2 (en) * | 2005-04-12 | 2011-03-16 | 富士ゼロックス株式会社 | Question answering system, data retrieval method, and computer program |
JP2019095940A (en) * | 2017-11-20 | 2019-06-20 | ヤフー株式会社 | Information processing device, information processing method, and information processing program |
Also Published As
Publication number | Publication date |
---|---|
JP4037250B2 (en) | 2008-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110309393B (en) | Data processing method, device, equipment and readable storage medium | |
TWI443530B (en) | Document processing system and method | |
JP2008511075A5 (en) | ||
JP2009169541A (en) | Web page retrieval server and query recommendation method | |
JPH113335A (en) | Question and answer managing device | |
JPH11224256A (en) | Information retrieving method and record medium recording information retrieving program | |
JP2002007450A (en) | Retrieval support system | |
JP2007193697A (en) | Information collection apparatus, information collection method and program | |
Subhashini et al. | Shallow NLP techniques for noun phrase extraction | |
JP2004192338A (en) | Question answering device, question answering program and recording medium having the program recorded thereon | |
JP2009086944A (en) | Information processor and information processing program | |
JP4057962B2 (en) | Question answering apparatus, question answering method and program | |
JP2005128872A (en) | Document retrieving system and document retrieving program | |
JP4428703B2 (en) | Information retrieval method and system, and computer program | |
JP2003308314A (en) | Device for supporting document preparation | |
JP2003208447A (en) | Device, method and program for retrieving document, and medium recorded with program for retrieving document | |
JP2008102790A (en) | Retrieval system | |
KR100494113B1 (en) | An information searching system via Web browser | |
JP2006293616A (en) | Document aggregating method, and device and program | |
Tedmori et al. | Locating knowledge sources through keyphrase extraction | |
JPH09245046A (en) | Information retrieval device | |
JP2005316590A (en) | Information retrieval device | |
JP2005056154A (en) | Document retrieving system | |
JP2010152705A (en) | Experience information retrieval system | |
JP4034503B2 (en) | Document search system and document search method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070801 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071015 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071030 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4037250 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101109 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101109 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111109 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111109 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121109 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121109 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131109 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |