JP2004127003A - 質問応答方法、質問応答装置、質問応答プログラム及び記録媒体 - Google Patents
質問応答方法、質問応答装置、質問応答プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2004127003A JP2004127003A JP2002291221A JP2002291221A JP2004127003A JP 2004127003 A JP2004127003 A JP 2004127003A JP 2002291221 A JP2002291221 A JP 2002291221A JP 2002291221 A JP2002291221 A JP 2002291221A JP 2004127003 A JP2004127003 A JP 2004127003A
- Authority
- JP
- Japan
- Prior art keywords
- question
- answer
- document
- question sentence
- logical expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】自然言語で表現された質問文に対する解答を求めることができ、かつ正解の可能性の高いものだけを出力する。
【解決手段】文書集合を格納する文書集合格納装置100と、質問文を受け取る入力装置102と、前記入力装置から入力された質問文および前記文書集合格納装置から取り出した文書集合中の文書を論埋表現に変換する論理解析装置104と、前記論理解析装置から出力される質問文の論理表現と文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する解答抽出装置106と、前記回答抽出装置から出力される解答を前記質問文に対する解答として出力する出力装置108とを有する。
【選択図】 図1
【解決手段】文書集合を格納する文書集合格納装置100と、質問文を受け取る入力装置102と、前記入力装置から入力された質問文および前記文書集合格納装置から取り出した文書集合中の文書を論埋表現に変換する論理解析装置104と、前記論理解析装置から出力される質問文の論理表現と文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する解答抽出装置106と、前記回答抽出装置から出力される解答を前記質問文に対する解答として出力する出力装置108とを有する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、自然言語処理システム、言語処理システム、知識処理システム、情報検索システム、情報抽出システム等に用いられ、質問文に対する解答を出力する質問応答方法、質問応答装置、質問応答プログラム及び記録媒体に関する。
【0002】
【従来の技術】
従来の情報検索技術は、与えられた文書集合から、ユーザの入力した質問に合致する文書の集合を取り出すものであった。また,従来の情報抽出技術は、与えられた1つの文書について、分野ごとにあらかじめ決められた項目を抽出するものであった。
さらに、従来の日本語質問応答システムは、質問と文書に含まれる単語の表層的な関係を使って解答を選択していた(特許文献1参照)。
【0003】
【特許文献1】
特開2002−132811号公報
【0004】
【発明が解決しようとする課題】
まず、従来の情報検索技術は質問に対する結果を文書の単位で返すため、ユーザが文書の内容を読まなければならない。例えば、「日本の首相は誰ですか?」という質問に対して、返ってきた結果に含まれる文書を読むことにより初めて、「森首相」という答が判る。文書を読まなければならないことは「森首相」といった直接的な解答が欲しいユーザにとっては非常に煩わしいという問題が有った。
【0005】
また、従来の情報抽出技術は、あらかじめ決められた特定の分野でしか使えないため、任意の質問文に対する解答を出力する質問応答システムでは使えない。従来の日本語質問応答システムは、解答の候補を可能性の高い順に列挙するだけで、正解の可能性の高い解答を出力することができなかった。例えば、「四国の県は何ですか?」という質問に、四国の4県だけを丁度答えることはできず、1位から5位の解答のなかに、四国4県のいくつかが含まれるだけであった。
【0006】
本発明は、このような事情に鑑みてなされたものであり、上述した従来の問題を解決するため、質問文の論理表現と文書の論理表現を生成し、2つの論理表現を照合して、解答を取り出すことにより、自然言語で表現された質問文に対する解答を求めることができ、かつ正解の可能性の高いものだけを出力することができる質問応答装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
上記目的を達成するために、請求項1に記載の発明は、文書集合と質問文が与えられると、質問文に対する解答を出力するコンピュータにより構築された質問応答装置において、前記質問応答装置が備える文書集合格納装置が、文書集合を格納する第1のステップと、前記質問応答装置が備える入力装置が、質問文を受け取るステップと、前記質問応答装置が備える論理解析装置が、前記入力装置から入力された質問文および前記文書集合格納装置から取り出した文書集合中の文書を論埋表現に変換する第2のステップと、前記質問応答装置が備える解答抽出装置が、前記論理解析装置から出力される質問文の論理表現と文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する第3のステップと、前記質問応答装置が備える出力装置が、前記回答抽出装置から出力される解答を前記質問文に対する解答として出力する第4のステップと を有することを特徴とする。
【0008】
また、請求項2に記載の発明は、文書集合と質問文が与えられると、質問文に対する解答を出力する質問応答装置において、文書集合を格納する文書集合格納装置と、質問文を受け取る入力装置と、前記入力装置から入力された質問文および前記文書集合格納装置から取り出した文書集合中の文書を論理表現に変換する論理解析装置と、前記論理解析装置から出力される質問文の論理表現と文書の論理表現とを照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する解答抽出装置と、前記回答抽出装置から出力される解答を前記質問文に対する解答として出力する出力装置とを有することを特徴とする。
【0009】
また、請求項3に記載の発明は、文書集合と質問文が与えられると、質問文に対する解答を出力するための質問応答プログラムであって、文書集合を格納する機能と、質問文を受け取る機能と、前記質問文および前記文書集合中の文書を論埋表現に変換する機能と、前記質問文の論理表現と前記文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する機能と、 前記解答を前記質問文に対する解答として出力する機能とをコンピュータに実行させるための質問応答プログラムを要旨とする。
【0010】
また、請求項4に記載の発明は、文書集合と質問文が与えられると、質問文に対する解答を出力するための質問応答プログラムを記録したコンピュータ読み取り可能な記録媒体において、文書集合を格納する機能と、質問文を受け取る機能と、前記質問文および前記文書集合中の文書を論埋表現に変換する機能と、前記質問文の論理表現と前記文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する機能と、前記解答を前記質問文に対する解答として出力する機能とをコンピュータに実行させるための質問応答プログラムを記録した記録媒体を要旨とする。
【0011】
【発明の実施の形態】
以下、本発明の実施形態を、図面を参照して詳細に説明する。本発明の実施形態に係る質問応答装置の構成を図1に示す。同図において、本実施形態に係る質問応答装置10は、文書集合格納装置100と、入力装置102と、論理解析装置104と、解答抽出装置106と、出力装置108とを有している。
【0012】
質問応答装置1を構成する6つの装置は以下のように動作する。文書集合格納装置100には、文書の集合が格納される。
入力装置102は、質問文を入力から受け取り、論理解析装置4に入力する。
論理解析装置104は入力装置から入力された質問文から論理表現を生成する。
論理解析装置104は文書集合格納装置2から取り出した文書の論理表現を生成する。
【0013】
解答抽出装置106は上記質問文の論理表現と上記文書の論理表現を照合し、前記質問文の論理表現に合致する解答を取り出し、出力装置108へ渡す。出力装置108は解答を出力する。
なお、これらの各装置は論理的につながっていればよく、各装置が1台のコンピュータの上で通信しながら動く独立したプロセスとして実装されていても良いし、ネットワークで接続された複数のコンピュータに分散されて実装されていても良い。
【0014】
以下では、例として、入力装置102により入力された質問文Q1「日本に贈られた最初のパンダは何?」に対して、文書集合格納装置100より取り出された文書D1「最初に日本にやってきたパンダはオスのカンカンとメスのランラン」から、「カンカン」と「ランラン」を解答として答える例について述ベる。文書集合格納装置100には、表1に示す文書が格納されている。
【表1】
本実施形態では、説明を容易にするため、文書を1文だけで記述しているが、複数の文書からなる文書でもよい。また。質問文を1つ受けて、解答とその文書の列を返す例について述べているが、これを繰り返すことにより、質問と解答を繰り返すことができる。
【0015】
上記構成において、まず、文書集合格納装置100に文書D1を格納する。
ここでは、表形式で表現しているが、格納の方法は文書が格納できればリストやデータベースなどの他の方法であっても何でもよい。以下、表形式でデータを表した時には同様のことが言える。
【0016】
入力装置102は、入力装置102より質問文Q1を受け取り、論理解析装置104へ渡す。まず、論理解析装置104は、質問文Q1の構文を解析する。構文解析の手法は例えば文献(長尾真編:自然言語処理、岩波書店、1996)に述べられている。構文解析は、一般に、単語分割、文節分割、係り受けの3つの段階からなる。図2は、質問文Q1の構文解析結果を表している。同図において、各行は1つの文節を表し、先頭に文節番号をつけて表現する。「/」は単語の区切りを表している。矢印は、2つの文節の間における係り受けを表している。
【0017】
次に、各文節に含まれる自立語(名詞、動詞、形容詞、副詞、疑問詞)について。次のような変換を行なう。
1.全ての自立語wについて、’wの意味’(変数:w)を作成。
2.疑問詞wについて、’wの意味’(変数:Z)を作成。
3.係り受けの関係がある、全ての2つのw1、w2から作られた、「’w1の意味’(変数1:w1)」「’w2の意味’(変数2:w2)」について、R(変数1,変数2)を作成。
【0018】
ただし、「wの意味」とは、単語wが属する意味的なカテゴリを表す。例えば、単語「日本」の意味カテゴリは「国」である。このような、単語の意味カテゴリはシソーラスや概念辞書などにより、容易に求められる。例えば、文献「日本語語彙大系、岩波書店」に単語とその単語の属する意味カテゴリの一覧が記述されている。疑問詞と意味の関係を表2に示す。
【表2】
これにより、以下のような質問論理表現が得られる。
【0019】
’国’(X1:日本),R(X1,X2)
’贈答’(X2:贈ら),R(X2,X4)
’始め’(X3:最初),R(X3,X4)
’動物’(X4:パンダ)、R(X4,X5)
’名前’(X5:Z)
【0020】
次に、論理解析装置104は、同様に文書D1についても解析する。図3は、文書D1の構文解析結果を表している。
以下に示す文書論理表現が得られる。
’始め’(Y1:最初),R(Y1,Y3)
’国’(Y2:日本),R(Y2,Y3)
’来訪’(Y3:やってき),R(Y3,Y4)
’動物’(Y4:パンダ),R(Y4,Y6),R(Y4,Y8)
’雄’(Y5:オス),R(Y5,Y6)
’名前’(Y6:カンカン),R(Y6,Y8)
’雌’(Y7:メス),R(Y7,Y8)
’名前’(Y8:ランラン)
【0021】
解答抽出装置106は、質問論理表現と文書論理表現との照合を行なう。
1.質問論理表現の各’wの意味’(変数:w)について、以下の条件でマッチする文書論理表現の要素を探し、マッチしなければ、コストCに1加える。ここで、「コストC」とは、質問論理表現における要素と文書論理表現における要素の不一致度を意味する。
(a)意味と単語の両方が同一の要素はマッチする。このとき,質問論理表現の要素の変数を対応する文書論理表現の要素の変数に書き替える。
(b)要素の述語がRの場合、質問論理表現の要素R(Yi,Yj)と文書論理表現の要素R(Yi,Yj)はマッチする。
(c)「単語の意味」が同じ要素はマッチする。但し、質問論理表現の要素の2引数目がZの場合は,Zに文書論理表現の単語をマッチさせる。
2.マッチのさせ方の組合わせ組合わせがいくつかある場合はすべて試す。
3.一番、コストCの小さいマッチのさせ方において、変数Zにマッチしたものを出力する。
【0022】
本実施形態の場合、質問論理表現の’国’(X1:日本)は文書論理表現の’国’(Y2:日本)とマッチし、’国’(Y2:日本)となる。また、’贈答’(X2:贈ら)やR(X2,X4)はマッチしない。’名前’(X5:Z)は’名前’(Y6:カンカン)および’名前’(Y8:ランラン)とマッチし,’名前’(Y6:Z)または’名前’(Y8:Z)となり、このとき、それぞれの状況で、Zには、カンカンとランランがマッチする。
最終的に,本実施形態の場合、*をつけた要素がマッチする。
*’国’(x1:日本),R(X1,X2)
’贈答’(X2:贈ら),R(X2,X4)
*’始め’(X3:最初),R(X3,X4)
*’動物’(X4:パンダ),*R(X4,X5)
* ’名前’(X5:Z)
【0023】
解答抽出装置6は、「カンカン」と「ランラン」は同じコスト4でマッチするので、この2つを解答とし、出力装置6に渡し、結果を出力する。
このようにして、文書集合と「日本に贈られた最初のパンダは何?」という入力文が与えられると、「最初に日本にやってきたパンダはオスのカンカンとメスのランラン」から解答として、「カンカン」と「ランラン」が取り出された。
【0024】
また、図1における質問応答装置10の機能を実現するための質問応答プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録された質問応答プログラムをコンピュータシステムに読み込ませ、実行することにより質問文に対する解答を得るための処理を行ってもよい。
【0025】
ここで、「質問応答プログラム」とは、文書集合と質問文が与えられると、質問文に対する解答を出力するための質問応答プログラムであって、文書集合を格納する機能と、質問文を受け取る機能と、前記質問文および前記文書集合中の文書を論埋表現に変換する機能と、前記質問文の論理表現と前記文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する機能と、前記解答を前記質問文に対する解答として出力する機能とをコンピュータに実行させるための質問応答プログラムである。
【0026】
なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
【0027】
また上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0028】
【発明の効果】
以上説明したように、本発明によれば、自然言語で表現された質問文に対する解答を求めることが可能となる。
質問文に対する直接的な解答とその解答のもとになる文書が求められたことで、ユーザが直接、解答を得ることができる。
【0029】
従来の情報検索では、文書全体の列が提示されるため、大統領の名前は、ユーザが文書を読んで初めて見つけることができ、また、従来の情報抽出は分野に依存していたため、自由な質問文に対する答えを抽出することはできなかった。
また、従来の質問応答システムは、複数の解答だけ丁度探すことができず、解答の可能性のあるものを羅列していた。本発明は、このような問題を解決し、質問文に対する解答をユーザに提示できる効果がある。
【図面の簡単な説明】
【図1】本発明の実施形態に係る質問応答装置の構成を示すブロック図。
【図2】入力装置より入力された質問文の構文解析結果を示す説明図。
【図3】文書集合格納装置から取り出された文書の構文解析結果を示す説明図。
【符号の説明】
10…質問応答装置
100…文書集合格納装置
102…入力装置
104…論理解析装置
106…解答抽出装置
108…出力装置
【発明の属する技術分野】
本発明は、自然言語処理システム、言語処理システム、知識処理システム、情報検索システム、情報抽出システム等に用いられ、質問文に対する解答を出力する質問応答方法、質問応答装置、質問応答プログラム及び記録媒体に関する。
【0002】
【従来の技術】
従来の情報検索技術は、与えられた文書集合から、ユーザの入力した質問に合致する文書の集合を取り出すものであった。また,従来の情報抽出技術は、与えられた1つの文書について、分野ごとにあらかじめ決められた項目を抽出するものであった。
さらに、従来の日本語質問応答システムは、質問と文書に含まれる単語の表層的な関係を使って解答を選択していた(特許文献1参照)。
【0003】
【特許文献1】
特開2002−132811号公報
【0004】
【発明が解決しようとする課題】
まず、従来の情報検索技術は質問に対する結果を文書の単位で返すため、ユーザが文書の内容を読まなければならない。例えば、「日本の首相は誰ですか?」という質問に対して、返ってきた結果に含まれる文書を読むことにより初めて、「森首相」という答が判る。文書を読まなければならないことは「森首相」といった直接的な解答が欲しいユーザにとっては非常に煩わしいという問題が有った。
【0005】
また、従来の情報抽出技術は、あらかじめ決められた特定の分野でしか使えないため、任意の質問文に対する解答を出力する質問応答システムでは使えない。従来の日本語質問応答システムは、解答の候補を可能性の高い順に列挙するだけで、正解の可能性の高い解答を出力することができなかった。例えば、「四国の県は何ですか?」という質問に、四国の4県だけを丁度答えることはできず、1位から5位の解答のなかに、四国4県のいくつかが含まれるだけであった。
【0006】
本発明は、このような事情に鑑みてなされたものであり、上述した従来の問題を解決するため、質問文の論理表現と文書の論理表現を生成し、2つの論理表現を照合して、解答を取り出すことにより、自然言語で表現された質問文に対する解答を求めることができ、かつ正解の可能性の高いものだけを出力することができる質問応答装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
上記目的を達成するために、請求項1に記載の発明は、文書集合と質問文が与えられると、質問文に対する解答を出力するコンピュータにより構築された質問応答装置において、前記質問応答装置が備える文書集合格納装置が、文書集合を格納する第1のステップと、前記質問応答装置が備える入力装置が、質問文を受け取るステップと、前記質問応答装置が備える論理解析装置が、前記入力装置から入力された質問文および前記文書集合格納装置から取り出した文書集合中の文書を論埋表現に変換する第2のステップと、前記質問応答装置が備える解答抽出装置が、前記論理解析装置から出力される質問文の論理表現と文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する第3のステップと、前記質問応答装置が備える出力装置が、前記回答抽出装置から出力される解答を前記質問文に対する解答として出力する第4のステップと を有することを特徴とする。
【0008】
また、請求項2に記載の発明は、文書集合と質問文が与えられると、質問文に対する解答を出力する質問応答装置において、文書集合を格納する文書集合格納装置と、質問文を受け取る入力装置と、前記入力装置から入力された質問文および前記文書集合格納装置から取り出した文書集合中の文書を論理表現に変換する論理解析装置と、前記論理解析装置から出力される質問文の論理表現と文書の論理表現とを照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する解答抽出装置と、前記回答抽出装置から出力される解答を前記質問文に対する解答として出力する出力装置とを有することを特徴とする。
【0009】
また、請求項3に記載の発明は、文書集合と質問文が与えられると、質問文に対する解答を出力するための質問応答プログラムであって、文書集合を格納する機能と、質問文を受け取る機能と、前記質問文および前記文書集合中の文書を論埋表現に変換する機能と、前記質問文の論理表現と前記文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する機能と、 前記解答を前記質問文に対する解答として出力する機能とをコンピュータに実行させるための質問応答プログラムを要旨とする。
【0010】
また、請求項4に記載の発明は、文書集合と質問文が与えられると、質問文に対する解答を出力するための質問応答プログラムを記録したコンピュータ読み取り可能な記録媒体において、文書集合を格納する機能と、質問文を受け取る機能と、前記質問文および前記文書集合中の文書を論埋表現に変換する機能と、前記質問文の論理表現と前記文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する機能と、前記解答を前記質問文に対する解答として出力する機能とをコンピュータに実行させるための質問応答プログラムを記録した記録媒体を要旨とする。
【0011】
【発明の実施の形態】
以下、本発明の実施形態を、図面を参照して詳細に説明する。本発明の実施形態に係る質問応答装置の構成を図1に示す。同図において、本実施形態に係る質問応答装置10は、文書集合格納装置100と、入力装置102と、論理解析装置104と、解答抽出装置106と、出力装置108とを有している。
【0012】
質問応答装置1を構成する6つの装置は以下のように動作する。文書集合格納装置100には、文書の集合が格納される。
入力装置102は、質問文を入力から受け取り、論理解析装置4に入力する。
論理解析装置104は入力装置から入力された質問文から論理表現を生成する。
論理解析装置104は文書集合格納装置2から取り出した文書の論理表現を生成する。
【0013】
解答抽出装置106は上記質問文の論理表現と上記文書の論理表現を照合し、前記質問文の論理表現に合致する解答を取り出し、出力装置108へ渡す。出力装置108は解答を出力する。
なお、これらの各装置は論理的につながっていればよく、各装置が1台のコンピュータの上で通信しながら動く独立したプロセスとして実装されていても良いし、ネットワークで接続された複数のコンピュータに分散されて実装されていても良い。
【0014】
以下では、例として、入力装置102により入力された質問文Q1「日本に贈られた最初のパンダは何?」に対して、文書集合格納装置100より取り出された文書D1「最初に日本にやってきたパンダはオスのカンカンとメスのランラン」から、「カンカン」と「ランラン」を解答として答える例について述ベる。文書集合格納装置100には、表1に示す文書が格納されている。
【表1】
本実施形態では、説明を容易にするため、文書を1文だけで記述しているが、複数の文書からなる文書でもよい。また。質問文を1つ受けて、解答とその文書の列を返す例について述べているが、これを繰り返すことにより、質問と解答を繰り返すことができる。
【0015】
上記構成において、まず、文書集合格納装置100に文書D1を格納する。
ここでは、表形式で表現しているが、格納の方法は文書が格納できればリストやデータベースなどの他の方法であっても何でもよい。以下、表形式でデータを表した時には同様のことが言える。
【0016】
入力装置102は、入力装置102より質問文Q1を受け取り、論理解析装置104へ渡す。まず、論理解析装置104は、質問文Q1の構文を解析する。構文解析の手法は例えば文献(長尾真編:自然言語処理、岩波書店、1996)に述べられている。構文解析は、一般に、単語分割、文節分割、係り受けの3つの段階からなる。図2は、質問文Q1の構文解析結果を表している。同図において、各行は1つの文節を表し、先頭に文節番号をつけて表現する。「/」は単語の区切りを表している。矢印は、2つの文節の間における係り受けを表している。
【0017】
次に、各文節に含まれる自立語(名詞、動詞、形容詞、副詞、疑問詞)について。次のような変換を行なう。
1.全ての自立語wについて、’wの意味’(変数:w)を作成。
2.疑問詞wについて、’wの意味’(変数:Z)を作成。
3.係り受けの関係がある、全ての2つのw1、w2から作られた、「’w1の意味’(変数1:w1)」「’w2の意味’(変数2:w2)」について、R(変数1,変数2)を作成。
【0018】
ただし、「wの意味」とは、単語wが属する意味的なカテゴリを表す。例えば、単語「日本」の意味カテゴリは「国」である。このような、単語の意味カテゴリはシソーラスや概念辞書などにより、容易に求められる。例えば、文献「日本語語彙大系、岩波書店」に単語とその単語の属する意味カテゴリの一覧が記述されている。疑問詞と意味の関係を表2に示す。
【表2】
これにより、以下のような質問論理表現が得られる。
【0019】
’国’(X1:日本),R(X1,X2)
’贈答’(X2:贈ら),R(X2,X4)
’始め’(X3:最初),R(X3,X4)
’動物’(X4:パンダ)、R(X4,X5)
’名前’(X5:Z)
【0020】
次に、論理解析装置104は、同様に文書D1についても解析する。図3は、文書D1の構文解析結果を表している。
以下に示す文書論理表現が得られる。
’始め’(Y1:最初),R(Y1,Y3)
’国’(Y2:日本),R(Y2,Y3)
’来訪’(Y3:やってき),R(Y3,Y4)
’動物’(Y4:パンダ),R(Y4,Y6),R(Y4,Y8)
’雄’(Y5:オス),R(Y5,Y6)
’名前’(Y6:カンカン),R(Y6,Y8)
’雌’(Y7:メス),R(Y7,Y8)
’名前’(Y8:ランラン)
【0021】
解答抽出装置106は、質問論理表現と文書論理表現との照合を行なう。
1.質問論理表現の各’wの意味’(変数:w)について、以下の条件でマッチする文書論理表現の要素を探し、マッチしなければ、コストCに1加える。ここで、「コストC」とは、質問論理表現における要素と文書論理表現における要素の不一致度を意味する。
(a)意味と単語の両方が同一の要素はマッチする。このとき,質問論理表現の要素の変数を対応する文書論理表現の要素の変数に書き替える。
(b)要素の述語がRの場合、質問論理表現の要素R(Yi,Yj)と文書論理表現の要素R(Yi,Yj)はマッチする。
(c)「単語の意味」が同じ要素はマッチする。但し、質問論理表現の要素の2引数目がZの場合は,Zに文書論理表現の単語をマッチさせる。
2.マッチのさせ方の組合わせ組合わせがいくつかある場合はすべて試す。
3.一番、コストCの小さいマッチのさせ方において、変数Zにマッチしたものを出力する。
【0022】
本実施形態の場合、質問論理表現の’国’(X1:日本)は文書論理表現の’国’(Y2:日本)とマッチし、’国’(Y2:日本)となる。また、’贈答’(X2:贈ら)やR(X2,X4)はマッチしない。’名前’(X5:Z)は’名前’(Y6:カンカン)および’名前’(Y8:ランラン)とマッチし,’名前’(Y6:Z)または’名前’(Y8:Z)となり、このとき、それぞれの状況で、Zには、カンカンとランランがマッチする。
最終的に,本実施形態の場合、*をつけた要素がマッチする。
*’国’(x1:日本),R(X1,X2)
’贈答’(X2:贈ら),R(X2,X4)
*’始め’(X3:最初),R(X3,X4)
*’動物’(X4:パンダ),*R(X4,X5)
* ’名前’(X5:Z)
【0023】
解答抽出装置6は、「カンカン」と「ランラン」は同じコスト4でマッチするので、この2つを解答とし、出力装置6に渡し、結果を出力する。
このようにして、文書集合と「日本に贈られた最初のパンダは何?」という入力文が与えられると、「最初に日本にやってきたパンダはオスのカンカンとメスのランラン」から解答として、「カンカン」と「ランラン」が取り出された。
【0024】
また、図1における質問応答装置10の機能を実現するための質問応答プログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録された質問応答プログラムをコンピュータシステムに読み込ませ、実行することにより質問文に対する解答を得るための処理を行ってもよい。
【0025】
ここで、「質問応答プログラム」とは、文書集合と質問文が与えられると、質問文に対する解答を出力するための質問応答プログラムであって、文書集合を格納する機能と、質問文を受け取る機能と、前記質問文および前記文書集合中の文書を論埋表現に変換する機能と、前記質問文の論理表現と前記文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する機能と、前記解答を前記質問文に対する解答として出力する機能とをコンピュータに実行させるための質問応答プログラムである。
【0026】
なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
【0027】
また上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【0028】
【発明の効果】
以上説明したように、本発明によれば、自然言語で表現された質問文に対する解答を求めることが可能となる。
質問文に対する直接的な解答とその解答のもとになる文書が求められたことで、ユーザが直接、解答を得ることができる。
【0029】
従来の情報検索では、文書全体の列が提示されるため、大統領の名前は、ユーザが文書を読んで初めて見つけることができ、また、従来の情報抽出は分野に依存していたため、自由な質問文に対する答えを抽出することはできなかった。
また、従来の質問応答システムは、複数の解答だけ丁度探すことができず、解答の可能性のあるものを羅列していた。本発明は、このような問題を解決し、質問文に対する解答をユーザに提示できる効果がある。
【図面の簡単な説明】
【図1】本発明の実施形態に係る質問応答装置の構成を示すブロック図。
【図2】入力装置より入力された質問文の構文解析結果を示す説明図。
【図3】文書集合格納装置から取り出された文書の構文解析結果を示す説明図。
【符号の説明】
10…質問応答装置
100…文書集合格納装置
102…入力装置
104…論理解析装置
106…解答抽出装置
108…出力装置
Claims (4)
- 文書集合と質問文が与えられると、質問文に対する解答を出力するコンピュータにより構築された質問応答装置において、
前記質問応答装置が備える文書集合格納装置が、文書集合を格納する第1のステップと、
前記質問応答装置が備える入力装置が、質問文を受け取るステップと、
前記質問応答装置が備える論理解析装置が、前記入力装置から入力された質問文および前記文書集合格納装置から取り出した文書集合中の文書を論埋表現に変換する第2のステップと、
前記質問応答装置が備える解答抽出装置が、前記論理解析装置から出力される質問文の論理表現と文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する第3のステップと、
前記質問応答装置が備える出力装置が、前記回答抽出装置から出力される解答を前記質問文に対する解答として出力する第4のステップと、
を有することを特徴とする質問応答方法。 - 文書集合と質問文が与えられると、質問文に対する解答を出力する質問応答装置において、
文書集合を格納する文書集合格納装置と、
質問文を受け取る入力装置と、
前記入力装置から入力された質問文および前記文書集合格納装置から取り出した文書集合中の文書を論埋表現に変換する論理解析装置と、
前記論理解析装置から出力される質問文の論理表現と文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する解答抽出装置と、
前記回答抽出装置から出力される解答を前記質問文に対する解答として出力する出力装置と、
を有することを特徴とする質問応答装置。 - 文書集合と質問文が与えられると、質問文に対する解答を出力するための質問応答プログラムであって、
文書集合を格納する機能と、
質問文を受け取る機能と、
前記質問文および前記文書集合中の文書を論埋表現に変換する機能と、
前記質問文の論理表現と前記文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する機能と、
前記解答を前記質問文に対する解答として出力する機能と、
をコンピュータに実行させるための質問応答プログラム。 - 文書集合と質問文が与えられると、質問文に対する解答を出力するための質問応答プログラムを記録したコンピュータ読み取り可能な記録媒体において、
文書集合を格納する機能と、
質問文を受け取る機能と、
前記質問文および前記文書集合中の文書を論埋表現に変換する機能と、
前記質問文の論理表現と前記文書の論理表現を照合し、前記質問文の論理表現に合致する解答を前記文書の論理表現から抽出する機能と、
前記解答を前記質問文に対する解答として出力する機能と、
をコンピュータに実行させるための質問応答プログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002291221A JP2004127003A (ja) | 2002-10-03 | 2002-10-03 | 質問応答方法、質問応答装置、質問応答プログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002291221A JP2004127003A (ja) | 2002-10-03 | 2002-10-03 | 質問応答方法、質問応答装置、質問応答プログラム及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004127003A true JP2004127003A (ja) | 2004-04-22 |
Family
ID=32282869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002291221A Pending JP2004127003A (ja) | 2002-10-03 | 2002-10-03 | 質問応答方法、質問応答装置、質問応答プログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004127003A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006252382A (ja) * | 2005-03-14 | 2006-09-21 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
WO2010150910A1 (ja) * | 2009-06-26 | 2010-12-29 | 楽天株式会社 | 情報検索装置、情報検索方法、情報検索プログラム、および、情報検索プログラムを記録した記録媒体 |
CN105760359A (zh) * | 2014-11-21 | 2016-07-13 | 财团法人工业技术研究院 | 问句处理系统及其方法 |
CN114637766A (zh) * | 2022-05-18 | 2022-06-17 | 山东师范大学 | 基于自然资源产业链知识图谱的智能问答方法及系统 |
-
2002
- 2002-10-03 JP JP2002291221A patent/JP2004127003A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006252382A (ja) * | 2005-03-14 | 2006-09-21 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
WO2010150910A1 (ja) * | 2009-06-26 | 2010-12-29 | 楽天株式会社 | 情報検索装置、情報検索方法、情報検索プログラム、および、情報検索プログラムを記録した記録媒体 |
JP4768882B2 (ja) * | 2009-06-26 | 2011-09-07 | 楽天株式会社 | 情報検索装置、情報検索方法、情報検索プログラム、および、情報検索プログラムを記録した記録媒体 |
US8296319B2 (en) | 2009-06-26 | 2012-10-23 | Rakuten, Inc. | Information retrieving apparatus, information retrieving method, information retrieving program, and recording medium on which information retrieving program is recorded |
CN105760359A (zh) * | 2014-11-21 | 2016-07-13 | 财团法人工业技术研究院 | 问句处理系统及其方法 |
CN114637766A (zh) * | 2022-05-18 | 2022-06-17 | 山东师范大学 | 基于自然资源产业链知识图谱的智能问答方法及系统 |
CN114637766B (zh) * | 2022-05-18 | 2022-08-26 | 山东师范大学 | 基于自然资源产业链知识图谱的智能问答方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lopez et al. | AquaLog: An ontology-driven question answering system for organizational semantic intranets | |
US9477766B2 (en) | Method for ranking resources using node pool | |
US7526425B2 (en) | Method and system for extending keyword searching to syntactically and semantically annotated data | |
US8140559B2 (en) | Knowledge correlation search engine | |
US20070094183A1 (en) | Jargon-based modeling | |
KR101339103B1 (ko) | 의미적 자질을 이용한 문서 분류 시스템 및 그 방법 | |
US20060195435A1 (en) | System and method for providing query assistance | |
CN103548023A (zh) | 基于本体的自动自助式用户支持 | |
JP2012520528A (ja) | 自然言語テキストの自動的意味ラベリングのためのシステム及び方法 | |
US11301502B1 (en) | Parsing natural language queries without retraining | |
Dahl | Translating spanish into logic through logic | |
Hakkoum et al. | Semantic Q&A System on the Qur’an | |
KR20120001053A (ko) | 문서 감성 분석 시스템 및 그 방법 | |
Stratica et al. | Using semantic templates for a natural language interface to the CINDI virtual library | |
CN112507089A (zh) | 一种基于知识图谱的智能问答引擎及其实现方法 | |
US11620282B2 (en) | Automated information retrieval system and semantic parsing | |
Najmi et al. | Intelligent semantic question answering system | |
AbuTaha et al. | An ontology-based arabic question answering system | |
JP2004127003A (ja) | 質問応答方法、質問応答装置、質問応答プログラム及び記録媒体 | |
Wohlgenannt | Learning Ontology Relations by Combining Corpus-Based Techniques and Reasoning on Data from Semantic Web Sources | |
Hanane et al. | A model of a generic Arabic language interface for multimodel database | |
Dung et al. | Ontology-based information extraction and information retrieval in health care domain | |
WO2020026229A2 (en) | Proposition identification in natural language and usage thereof | |
Plant et al. | A natural language help system shell through functional programming | |
WO2001024053A2 (en) | System and method for automatic context creation for electronic documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040130 |