JP2004272785A - 質問応答装置及び質問応答プログラム - Google Patents

質問応答装置及び質問応答プログラム Download PDF

Info

Publication number
JP2004272785A
JP2004272785A JP2003065297A JP2003065297A JP2004272785A JP 2004272785 A JP2004272785 A JP 2004272785A JP 2003065297 A JP2003065297 A JP 2003065297A JP 2003065297 A JP2003065297 A JP 2003065297A JP 2004272785 A JP2004272785 A JP 2004272785A
Authority
JP
Japan
Prior art keywords
question
explanation
term
semantic role
target term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003065297A
Other languages
English (en)
Other versions
JP4088176B2 (ja
Inventor
Ichiro Yamada
一郎 山田
Hideki Sumiyoshi
英樹 住吉
Takako Maki
香子 牧
Masahiro Shibata
正啓 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2003065297A priority Critical patent/JP4088176B2/ja
Publication of JP2004272785A publication Critical patent/JP2004272785A/ja
Application granted granted Critical
Publication of JP4088176B2 publication Critical patent/JP4088176B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】本発明は、ユーザが入力した最新の時事用語などに関する質問に対してWebページから用語説明と意味的役割を抽出して応答することができる質問応答装置及び質問応答プログラムを提供することを目的とする。
【解決手段】ユーザが入力した質問文から対象用語と、求められている説明の意味的役割を抽出する質問解析手段22と、対象用語を検索キーとして対象用語に関係が深いWebページを獲得する検索手段24と、獲得した複数のWebページから、対象用語に関する説明部分を抽出する説明部分抽出手段26と、抽出された説明部分の対象用語に対する意味的役割を判定する意味的役割判定手段28と、抽出された説明部分のうち意味的役割と同じ意味的役割を持つ説明部分から返答文を生成して質問文に対し応答する応答手段30を有することにより、意味的役割を考慮して質問に答える説明にて応答することができる。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、質問応答装置及び質問応答プログラムに関し、インターネット上のWebページを検索して質問に対する返答文を生成し応答する質問応答装置及び質問応答プログラムに関する。
【0002】
【従来の技術】
従来、Would Wide Web(以下「Web」と略す)を対象とした情報抽出処理としては、文書表現とHTML(HyperText Makeup Language)レイアウトに基づいて、Webから用語説明を抽出する手法が提案されている(例えば、非特許文献1参照。)。この手法では、例えば「“用語A”とは“説明B”です。」、「“用語A”を“説明B”と定め」などの決められた文書表現のみの文パターンを検索キーとして、用語Aの説明Bを抽出している。
【0003】
【非特許文献1】
藤井ほか「Would Wide Webを用いた事典知識情報の抽出と組織化」電子情報通信学会論文誌,Vol.J85D−II No.2,pp300−307(2002)
【0004】
【発明が解決しようとする課題】
従来、提案されている文のパターンを利用した方法や、HTMLレイアウトに基づいた方法では、昔から存在する用語の抽出数は多いが、新語や造語などの最新の時事用語などの抽出数は少ないという問題があった。
【0005】
また、抽出された用語の説明には、用語に対する様々な意味的役割が存在するが、従来手法では、その意味的役割を考慮していないという問題があった。例えば、用語「かぼちゃプリン」の説明の例を以下に示す。
(a)洋風の食べ物
(b)卵を使っているもの
(c)おやつで食べるもの
(d)私が作ったもの
これらを、全て同様に扱った場合、質問応答システムでは問題が生じる。例えば、「かぼちゃプリンって何?」という質問に対して、(a)を使い「洋風の食べ物です」と返答すれば問題ないが、(d)を使い「私が作ったものです」では、かぼちゃプリンが何であるか理解できない。
【0006】
本発明は、上記の点に鑑みなされたもので、最新の時事用語などの説明を抽出して応答することができ、また、意味的役割を考慮して質問に答える説明にて応答することができる質問応答装置及び質問応答プログラムを提供することを目的とする。
【0007】
【課題を解決するための手段】
請求項1,7に記載の発明は、ユーザが入力した質問文から対象用語と、求められている説明の用語に対する意味的役割を抽出する質問解析手段と、対象用語を検索キーとして対象用語に関係が深いWebページをインターネット上で検索し獲得する検索手段と、検索手段で獲得した複数のWebページから、対象用語に関する説明部分を抽出する説明部分抽出手段と、抽出手段で抽出された説明部分の対象用語に対する意味的役割を判定する意味的役割判定手段と、抽出手段で抽出された説明部分のうち質問解析手段で抽出された意味的役割と同じ意味的役割を持つ説明部分から返答文を生成して質問文に対し応答する応答手段を有することにより、意味的役割を考慮して質問に答える説明にて応答することができる。
【0008】
請求項3に記載の発明では、説明部分抽出手段は、対象用語が文で説明されたパターンを前記対象用語に関する説明部分として抽出し、請求項4に記載の発明では、説明部分抽出手段は、対象用語が連体節で説明されたパターンを対象用語に関する説明部分として抽出することにより、最新の時事用語などの説明を抽出して応答することができる。
【0009】
請求項6,8に記載の発明は、抽出手段で抽出された全ての説明集合と各説明の類似性に基づいて各説明の信頼値を評価する評価手段を有することにより、検索キーが何であるかを的確に示す内容の説明を抽出して応答することができる。
【0010】
【発明の実施の形態】
以下、図面を参照して本発明の実施例について説明する。
【0011】
図1は、本発明の質問応答装置のハードウェア構成を示す一実施例のブロック図を示す。質問応答装置は、専用の装置構成とすることもできるが、例えば、汎用のパーソナルコンピュータ、ワークステーション等を適用することができる。
【0012】
図1において、質問応答装置は、入力装置11と、出力装置12と、ドライブ装置13と、補助記憶装置14と、メモリ装置15と、演算処理装置16と、データベース17と、ネットワーク接続装置18から構成されており、これらはシステムバス20で相互に接続されている。
【0013】
入力装置11は、使用者が操作するキーボード及びマウス、音声入力用のマイクロホンを有しており、各種信号を入力する。出力装置12は、質問応答装置のプログラムを操作するのに必要な各種ウィンドウやデータ等を表示するディスプレイを有し、実行プログラムに基づいて表示される。ここで、本発明において、質問応答装置にインストールされる実行プログラムは、例えば、CD−ROM等の記録媒体19等により提供される。プログラムを記録した記録媒体19はドライブ装置13に装着され、記憶媒体19に格納された実行プログラムが、記録媒体19からドライブ装置13を介して補助記憶装置14にインストールされる。
【0014】
演算処理装置16は、メモリ装置15により読み出され格納されている実行プログラムに基づいて、各種演算や後述する各処理を含む質問応答装置全体の処理を制御する。また、プログラムの実行中に必要な各種情報は、データベース17から取得することができ、また格納することもできる。ネットワーク接続装置18は、通信ネットワーク等と接続することにより、インターネット上のWebをアクセスすることができる。
【0015】
図2は、本発明の質問応答装置の一実施例の機能構成図を示す。質問応答装置は、質問解析部22と、検索エンジン部24と、対象用語説明部分抽出部26と、意味的役割推定部28と、返答文生成部30と、ユーザインターフェース部32から構成されている。
【0016】
図2において、質問解析部22は、ユーザの質問から「対象用語」と、求められている説明の用語に対する「意味的役割」を抽出する。検索エンジン部24は、Google,Yahoo,Altavista,goo等の既存の検索エンジンを利用して、質問解析部22から供給される対象用語を検索キーとしてWeb検索を行い、検索結果のWebページを対象用語説明部分抽出部26に供給する。
【0017】
対象用語説明部分抽出部26は、検索エンジン24で得た検索結果のWebページから、対象用語を説明している部分(説明部分)を抽出して意味的役割判定部28及び返答文生成部30に供給する。
【0018】
意味的役割判定部28は、対象用語とその説明部分から特徴を抽出し、最大エントロピー法により、説明の用語に対する意味的役割を判定する。返答文生成部30は、質問解析部22と対象用語説明部分抽出部26と意味的役割判定部28それぞれの出力を利用して、ユーザの質問に対する返答を生成する。
【0019】
ユーザインターフェース部32は、既存技術であるTVML(TV Program Making Language)を利用して、TVMLキャラクタであるエージェントをディスプレイ表示し、ユーザは質問をキーボード等で入力することによりエージェントに質問を投げかけることができる。
【0020】
次に、質問応答装置の動作を説明する。
【0021】
ユーザはユーザインターフェース部32を用いて質問文を入力する。ユーザインターフェース部32は、この質問文を形態素解析処理により形態素に分割し、分割された形態素の集合を質問解析部22に入力する。
【0022】
質問解析部22には、有限オートマトンによるルールが蓄積されている。図3にルールの一例を示す。図3(A)は、ユーザが求める説明の意味的な役割が用語の基本的な定義である場合を示す。ここで、「S」は開始状態を示し、2重丸は最終状態を示す。そして、矢印上の文字と一致したとき矢印方向の次の状態に遷移する。なお、「φ」は「なにもなし」を表し、「*」は0個以上の文字列にマッチングすることを表す。同様に、図3(B)は、ユーザが求める説明の意味的な役割が構成である場合を示す。図3(C)は、ユーザが求める説明の意味的な役割が目的である場合を示す。
【0023】
図4は、質問解析部22が実行する処理のフローチャートを示す。この処理は、ユーザインターフェース部32から質問文を供給されて開始する。同図中、ステップS10では全てのルールを処理したか否かを判別し、全てのルールを処理していなければステップS12で入力された形態素の集合を選択したルールに当てはめ、ステップS14でルールに合致したか否かを判別する。ここでは、各形態素を例えば図3(A)に示すようなルールに当てはめて、2重丸で示す最終状態で形態素が終了すればルールに合致したと判断する。ルールに合致した場合にはステップS16に進み、ルールに合致しない場合にはステップS10に戻って次のルールに質問文を当てはめる。
【0024】
ルールに合致した場合には、ステップS16でルールにより抽出された検索キーをWeb検索エンジンに供給し、ステップS18で、そのルールがもつ「ユーザが求める説明の意味的役割」を返答文生成部30に供給して、処理を終了する。例えば質問文「スーパーカミオカンデとは何」が入力された場合、この質問文は図3(A)に示すルールに当てはまるため、「スーパーカミオカンデ」が検索キーとして抽出され、「ユーザが求める説明の意味的役割」は「用語の基本的な定義」となる。
【0025】
全てのルールを当てはめても最終状態で終了しない場合は、不明な質問であると判断して、ステップS19でユーザインターフェース部32に「質問が理解できません」などの返答を返し、処理を終了する。
【0026】
Web検索エンジン部24は、既存の技術を利用する。既存の技術としては、google,Yahoo,Altavista,gooなど、様々な検索技術が提案され公開されている。この既存の検索エンジン部24に質問解析部22から抽出された検索キーを与えて検索を行う。その検索結果の例えば上位100ページのインターネット上のWebページアドレスを抽出して対象用語説明部分抽出部26に供給する。
【0027】
対象用語説明部分抽出部26では、Web検索エンジン部24で抽出されたインターネット上のアドレスを利用して、対象用語に関連するWebページを獲得し、対象用語を説明している部分を抽出して、意味的役割判定部28に供給する。
【0028】
図5は、対象用語説明部分抽出部26が実行する処理のフローチャートを示す。この処理は、検索エンジン部24から全てのWebページアドレスを供給されて開始する。同図中、ステップS20では全てのWebページアドレスに対する処理を終了したか否かを判別し、処理を終わっていないWebページアドレスがあれば、ステップS22に進む。
【0029】
ステップS22では、1つのWebページアドレスを選択し、インターネットのWebページアドレスをアクセスし、そのWebページのHTML(HyperText Makeup Language)文書を読み取る。HTML文書内で、用語を説明するパターンとして、次に示す4つのパターンが考えられる。(A)用語にリンク先が付加されたパターン
例:<AHREF=”#kaden”>情報家電</A>
<ANAME=kaden>次世代の高速インターネットに対応した家電製品<A>
(B)定義型リスト形式、もしくは、ボールドタグなどにより用語が見出し化されたパターン
例:<DL>
<DT>情報家電
<DD>次世代の高速インターネットに対応した家電製品
<DL>
(C)用語が文で説明されたパターン
例:情報家電は、次世代の高速インターネットに対応した家電製品です。
(D)用語が連体節で説明されたパターン
例:次世代の高速インターネットに対応した情報家電は、〜
対象用語説明部分抽出部26では、(A)〜(D)の各パターンを順次処理するため、ステップS24で、HTML文書の文の区切りを抽出する。文の区切りは、</a>,</font>タグを除く全てのHTMLタグと、句点(。)を区切れ目と判断し、HTML文書内にある改行などは、区切り目と判断しない。この際、文中に出現するHTMLタグはすべて除去する。
【0030】
次に、パターン(A),(B)についての処理を行う。ステップS24では、まず、一つの文が以下の条件1が満たされているかを判別し、条件1が満たされている場合はパターン(A),(B)と判別してステップS28に進む。
【0031】
条件1は以下の条件(a)〜(e)を全て満たす。
(a)検索キーとして入力された用語を含んでいる
(b)単一の文である(<p>タグなどで複数文が囲まれていない)
(c)文中の用語以外の部分に動詞を含まない
(d)<b>,<td>,<dt>,<h[1−6]>,<a>タグのいずれかでマークされている
(e)次の文とそのまた次が<a>タグでマークされていない
条件1を満足する場合に、条件(d)でリンクタグである<a>タグでマークされているときは、ステップS28でパターン(A)と判断してステップS30に進み、それ以外の場合はパターン(B)と判断してステップS32に進む。
【0032】
パターン(A)の場合はステップS30に進み、リンク先が同じWebページ内へのジャンプであれば、ジャンプ先から例えば3文を対象用語説明部分として抽出する。リンク先が他のアドレスに存在するWebページヘのジャンプであれば、そのジャンプ先のHTML文書を獲得し、HTML文書の最初から例えば3文を対象用語説明部分として抽出する。この際、不要なHTMLタグは除去し、自然言語文と判別される部分のみを抽出する。
【0033】
ステップS28でパターン(B)と判別された場合は、ステップS32で条件を満たした文の次から例えば3文を、対象用語説明部分として抽出する。
【0034】
次に、ステップS34でパターン(C)の判別処理を行う。Webページ中の各文に、「対象用語は〜です。」「対象用語とは〜です。」「対象用語は〜で、」「対象用語とは〜で」のパターンがある場合、ステップS36で波線部分を対象用語説明部分として抽出する。
【0035】
最後に、ステップS38で文に対象用語が含まれパターン(D)であるか否かを判別する。パターン(D)と判別された場合は、ステップS40で検索キーとして入力された対象用語が存在するWebページ中の各文に対して、既存技術である構文解析を行って単語間の係り受け関係を判別する。ステップS42で、その結果を基に、対象用語を修飾する従属節(以後、連体節と呼ぶ)の有無を判別し、存在する場合は、ステップS44で連体節を対象用語説明部分として抽出する。
【0036】
ステップS44の実行後は、ステップS20に戻って処理を繰り返す。また、パターン(D)に当てはまらない場合もステップS20に戻って処理を繰り返す。ステップS20で全ての検索キーについて処理が終了している場合にはこの処理を終了する。
【0037】
ところで、ステップS44で抽出される連体節は、動詞の連体形で終わっているため、文として不完全である。そこで、用語の上位概念語を抽出して、この連体節と統合する。パターン(D)の例では「次世代の高速インターネットに対応した」の部分が用語に係る連体節となっている。用語「情報家電」の上位概念として「家電製品」が抽出できれば、「次世代の高速インターネットに対応した家電製品」という他のパターンと同様の説明文が抽出でき、ステップS44では、この上位概念抽出処理も併せて実行する。
【0038】
この上位概念抽出処理としては、例えば、本出願人が先に特願2002−68974号、発明の名称「上位概念抽出装置及び上位概念抽出プログラム」で提案したものを利用する。この方法では、用語の後続文節にある「という」、「と呼ばれる」等の言い換えの特定表現を利用した上位概念抽出、用語に含まれる最終形態素による抽出、用語と並列関係にある名詞句による抽出の3通りの方法を利用して上位概念を特定している。
【0039】
このように、新語や造語などの最新の時事用語の説明に多いパターン(C),(D)を抽出するため、最新の時事用語などの説明を抽出することができる。
【0040】
対象用語説明部分抽出部26で抽出された対象用語説明部分を供給され、この説明部分の意味的役割を判定する意味的役割判定部28としては、本出願人が先に特願2002−265232号、発明の名称「意味解析装置、意味解析方法、意味解析プログラム、及び該プログラムを記録した記録媒体」で提案したものを利用する。ここでは、利用する特徴として下記のものを用いる。連体修飾節中の、用語を直接修飾する動詞の標準表記、時制、態、完了形それぞれの有無、動詞の格、その格が含まれる節の自立語表記、自立語の属性、用語の属性である。
【0041】
ここで、自立語の属性と用語の属性はIREX(Information Retrieval and Extraction eXercise)固有表現抽出タスクにより付加された8つの固有表現である組織名、人名、地名、固有物名、日付表現、時間表現、金額表現、割合表現を利用する。抽出アルゴリズムは、”「最大エントロピーモデルと書き換え規則に基づく固有表現抽出」、内元ほか、自然言語処理Vol.7,No.2,pp63−90,Apr.(2000)”等に記載されている既存の手法を利用することができる。
【0042】
パターン(A)〜(C)で抽出される文の場合、「用語を直接修飾する動詞」が存在しないが、文が「〜+動詞+名詞+{でorですorφ(何もなし)}」のパターンであるもののみを処理対象とし、このパターンに合致する動詞を「用語を直接修飾する動詞」とする。
【0043】
この特徴を利用して、説明部分の対象用語に対する意味的役割が「用語の基本的な定義」、「目的」、「動作主」、「構成」、「時間」、「場所」、「道具」、「メンバー」、「部分」、「包含」の何れに該当するかを推定する。特願2002−265232号では推定アルゴリズムとして、最大エントロピー法を利用しているが、Support Vector Machineなどの既存の分類アルゴリズムを利用することも可能である。
【0044】
最後に、質問解析部22と、対象用語説明部分抽出部26、意味的役割判定部28の出力を返答文生成部30に入力して、返答文を生成する。返答文生成部30では、質問解析部22で解析された「ユーザが求める説明の意味的役割」と、意味的役割判定部28で判定された説明部分の対象用語に対する意味的役割が同じ意味的役割と判定された説明文(対象用語説明部分抽出部26から供給される対象用語説明部分)に「です」などの丁寧語となる接尾辞を付加して返答文とする。これにより、意味的役割を考慮して質問に答える説明にて応答することが可能となる。
【0045】
質問解析部22から抽出された「ユーザが求める説明の意味的役割」と同じ意味的役割と判定された説明文が対象用語説明部分抽出部26で複数抽出されている場合は、後述する説明文評価処理を実行して得られた各説明文の優先順位(信頼値)に基づき、最優先の説明文から順に返答文を生成してユーザインターフェース部32に返す。説明文が抽出できていない場合は、「その情報は見つけられませんでした」との返答文をユーザインターフェース部32に返す。
【0046】
図6は、説明文評価処理のフローチャートを示す。この処理は、対象用語説明部分抽出部26から対象用語説明部分を供給されて開始する。
【0047】
同図中、ステップS56では、対象用語説明部分抽出部24による説明部分抽出結果を利用して、処理対象の検索キーに対する全ての説明部分を処理したか否かを判別する。処理対象の検索キーに対する全ての説明を処理していない場合は、ステップS58で未処理である説明の一つを処理対象とする。
【0048】
次に、ステップS60で、処理対象となった説明の信頼値confidenceを算出する。対象用語説明部分抽出部24で、検索キーQkにより抽出された全ての説明に共通する要素は信頼性が高いと判定する。
【0049】
ここでは、検索キーQkにより抽出された全ての説明集合と個々の説明の類似性を説明毎に算出し説明の信頼値とする。そのために、抽出された全ての説明集合を特徴付けるベクトルと、個々の説明を特徴付けるベクトルを次のように定義する。
【0050】
全ての説明集合に出現する単語をwi(i=1〜n,n:異なる単語の出現数)とし、全ての説明集合中で単語wiが出現した説明の数をdf(wi)とし、全ての説明集合の数をNとし、説明j(j=1〜N)に単語wiが出現したか否かを判定する関数をapp(j,wi)とする。
【0051】
関数app(j,wi)は、説明jに単語wiが出現している場合、app(j,wi)=1であり、説明jに単語wiが出現していない場合、app(j,wi)=0とする。
【0052】
抽出された全ての説明集合を特徴付けるベクトル=[df(w1)/N,df(w2)/N,df(w3)/N,…,df(wn)/N] …(1)
説明jを特徴付けるベクトル=[app(j,w1),app(j,w2),app(j,w3),…,app(j,wn)] …(2)
上記のベクトル表現を利用して、説明jの信頼値confidence(j)を(3)式で定義する。
【0053】
【数1】
Figure 2004272785
(3)式の分子は、抽出された全ての説明集合を特徴付けるベクトルと、説明jを特徴付けるベクトルとの内積を表している。この際、抽出された全ての説明集合を特徴付けるベクトルの各要素で説明jを特徴付けるベクトルの各要素に対する重み付けがなされる。また、分母は、抽出された全ての説明集合を特徴付けるベクトルの大きさと、説明jを特徴付けるベクトルの大きさの和であり、分子の内積を正規化している。
【0054】
図7は、ユーザインターフェース部32によるディスプレイ表示画面を示す。ここには、参加者アバター(ウサギ)40とエージェントアバター(ロボット)42が居る仮想教室44が表示され、その下部に発言ログ域46と発言入力域48が設けられている。ユーザは、発言入力域48に質問文を入力することにより、エージェントアバター42と同じ仮想空間に居る参加者アバター40から、エージェントアバター42に対して質問することができる。
【0055】
質問文の入力により図8に示す画面で質問文が発言ログ域46に表示され、エージェントアバター42がWebページを検索して、質問文の解析を自動で実行する。
【0056】
Webページの検索が終了すると、図9に示す画面が表示され、エージェントアバター42が音声合成により返答し、発言ログ域46に返答文を表示する。図10に、発言ログ域46に表示される質問文と返答文の一実施例を示す。
【0057】
本発明によれば、ユーザは、分からない事柄に関して質問を行い、エージェントはその質問を解釈し、インターネット上のWebページから質問の答えを探しだすことが可能となり、高価な辞書等を整備しなくても、日々最新の用語情報を的確に知ることができる。
【0058】
なお、質問解析部22が請求項記載の質問解析手段に対応し、検索エンジン部24が検索手段に対応し、対象用語説明部分抽出部26が説明部分抽出手段に対応し、意味的役割推定部28が意味的役割判定手段に対応し、返答文生成部30が応答手段に対応し、図6の説明文評価処理が評価手段に対応する。
【0059】
【発明の効果】
上述の如く、請求項1,7に記載の発明によれば、意味的役割を考慮して質問に答える説明にて応答することができる。
【0060】
また、請求項3に記載の発明によれば、最新の時事用語などの説明を抽出して応答することができる。
【0061】
請求項6,8に記載の発明によれば、検索キーが何であるかを的確に示す内容の説明を抽出して応答することができる。
【図面の簡単な説明】
【図1】本発明の質問応答装置のハードウェア構成を示す一実施例のブロック図である。
【図2】本発明の質問応答装置の一実施例の機能構成図である。
【図3】有限オートマトンによるルールを示す図である。
【図4】質問解析部が実行する処理のフローチャートである。
【図5】対象用語説明部分抽出部が実行する処理のフローチャートである。
【図6】説明文評価処理のフローチャートである。
【図7】ユーザインターフェース部によるディスプレイ表示画面を示す図である。
【図8】ユーザインターフェース部によるディスプレイ表示画面を示す図である。
【図9】ユーザインターフェース部によるディスプレイ表示画面を示す図である。
【図10】質問文と返答文の一実施例を示す図である。
【符号の説明】
11 入力装置
12 出力装置
13 ドライブ装置
14 補助記憶装置
15 メモリ装置
16 演算処理装置
17 データベース
18 ネットワーク接続装置
19 記録媒体
20 システムバス
22 質問解析部
24 検索エンジン部
26 対象用語説明部分抽出部
28 意味的役割推定部
30 返答文生成部
32 ユーザインターフェース部
40 参加者アバター
42 エージェントアバター
44 仮想教室
46 発言ログ域
48 発言入力域

Claims (8)

  1. ユーザが入力した質問文から対象用語と、求められている説明の用語に対する意味的役割を抽出する質問解析手段と、
    前記対象用語を検索キーとして前記対象用語に関係が深いWebページをインターネット上で検索し獲得する検索手段と、
    前記検索手段で獲得した複数のWebページから、前記対象用語に関する説明部分を抽出する説明部分抽出手段と、
    前記抽出手段で抽出された説明部分の前記対象用語に対する意味的役割を判定する意味的役割判定手段と、
    前記抽出手段で抽出された説明部分のうち前記質問解析手段で抽出された意味的役割と同じ意味的役割を持つ説明部分から返答文を生成して前記質問文に対し応答する応答手段を
    有することを特徴とする質問応答装置。
  2. 請求項1記載の質問応答装置において、
    前記質問解析手段は、前記質問文の形態素を有限オートマトンによる複数のルールに当てはめて前記対象用語と、求められている説明の用語に対する意味的役割を抽出することを特徴とする質問応答装置。
  3. 請求項1または2記載の質問応答装置において、
    前記説明部分抽出手段は、前記対象用語が文で説明されたパターンを前記対象用語に関する説明部分として抽出することを特徴とする質問応答装置。
  4. 請求項1乃至3のいずれか記載の質問応答装置において、
    前記説明部分抽出手段は、前記対象用語が連体節で説明されたパターンを前記対象用語に関する説明部分として抽出することを特徴とする質問応答装置。
  5. 請求項4記載の質問応答装置において、
    前記説明部分抽出手段は、前記対象用語が連体節で説明されたパターンの前記対象用語の上位概念語を抽出して前記連体節に統合することを特徴とする質問応答装置。
  6. 請求項1乃至5のいずれか記載の質問応答装置において、
    前記抽出手段で抽出された全ての説明集合と各説明の類似性に基づいて各説明の信頼値を評価する評価手段を
    有することを特徴とする質問応答装置。
  7. コンピュータを、
    ユーザが入力した質問文から対象用語と、求められている説明の用語に対する意味的役割を抽出する質問解析手段、
    前記対象用語を検索キーとして前記対象用語に関係が深いWebページをインターネット上で検索し獲得する検索手段、
    前記検索手段で獲得した複数のWebページから、前記対象用語に関する説明部分を抽出する説明部分抽出手段、
    前記抽出手段で抽出された説明部分の前記対象用語に対する意味的役割を判定する意味的役割判定手段、
    前記抽出手段で抽出された説明部分のうち前記質問解析手段で抽出された意味的役割と同じ意味的役割を持つ説明部分から返答文を生成して前記質問文に対し応答する応答手段、
    として機能させるための質問応答プログラム。
  8. 請求項7記載の質問応答プログラムにおいて、
    コンピュータを、
    前記抽出手段で抽出された全ての説明集合と各説明の類似性に基づいて各説明の信頼値を評価する評価手段、
    として機能させるための質問応答プログラム。
JP2003065297A 2003-03-11 2003-03-11 質問応答装置及び質問応答プログラム Expired - Fee Related JP4088176B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003065297A JP4088176B2 (ja) 2003-03-11 2003-03-11 質問応答装置及び質問応答プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003065297A JP4088176B2 (ja) 2003-03-11 2003-03-11 質問応答装置及び質問応答プログラム

Publications (2)

Publication Number Publication Date
JP2004272785A true JP2004272785A (ja) 2004-09-30
JP4088176B2 JP4088176B2 (ja) 2008-05-21

Family

ID=33126354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003065297A Expired - Fee Related JP4088176B2 (ja) 2003-03-11 2003-03-11 質問応答装置及び質問応答プログラム

Country Status (1)

Country Link
JP (1) JP4088176B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510221B (zh) * 2009-02-17 2012-05-30 北京大学 一种用于信息检索的查询语句分析方法与系统
CN116050412A (zh) * 2023-03-07 2023-05-02 江西风向标智能科技有限公司 基于数学语义逻辑关系的高中数学题目的分割方法和系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219361A (ja) * 1998-02-02 1999-08-10 Fujitsu Ltd 文書閲覧装置およびそのプログラムを格納した記憶媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219361A (ja) * 1998-02-02 1999-08-10 Fujitsu Ltd 文書閲覧装置およびそのプログラムを格納した記憶媒体

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
吉岡 琢: "WWW上の文書集合の視覚化による検索支援", データベースとWEB情報システムに関するIPSJ DBS/ACM SIGMOD JAPAN CHAP, vol. 第2000巻 第14号, CSNG200300045009, 6 December 2000 (2000-12-06), JP, pages 143 - 148, ISSN: 0000894011 *
吉岡 琢: "WWW上の文書集合の視覚化による検索支援", データベースとWEB情報システムに関するIPSJ DBS/ACM SIGMOD JAPAN CHAP, vol. 第2000巻 第14号, JPN6007011155, 6 December 2000 (2000-12-06), JP, pages 143 - 148, ISSN: 0000936674 *
安藤 一秋: "日本語定型表現のパターン記述規則と効率的な照合アルゴリズム", 電子情報通信学会論文誌 情報・システムII−情報処理, vol. 第J80-D-II巻 第7号, CSNG199700170025, 25 July 1997 (1997-07-25), JP, pages 1860 - 1869, ISSN: 0000894010 *
安藤 一秋: "日本語定型表現のパターン記述規則と効率的な照合アルゴリズム", 電子情報通信学会論文誌 情報・システムII−情報処理, vol. 第J80-D-II巻 第7号, JPN6007011152, 25 July 1997 (1997-07-25), JP, pages 1860 - 1869, ISSN: 0000936673 *
山田 一郎: "ニュース記事に出現する用語と説明文の意味関係自動獲得", 情報処理学会研究報告, vol. 第2002巻 第104号, CSNG200401453013, 13 November 2002 (2002-11-13), JP, pages 145 - 152, ISSN: 0000894009 *
山田 一郎: "ニュース記事に出現する用語と説明文の意味関係自動獲得", 情報処理学会研究報告, vol. 第2002巻 第104号, JPN6007011150, 13 November 2002 (2002-11-13), JP, pages 145 - 152, ISSN: 0000936672 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510221B (zh) * 2009-02-17 2012-05-30 北京大学 一种用于信息检索的查询语句分析方法与系统
CN116050412A (zh) * 2023-03-07 2023-05-02 江西风向标智能科技有限公司 基于数学语义逻辑关系的高中数学题目的分割方法和系统
CN116050412B (zh) * 2023-03-07 2024-01-26 江西风向标智能科技有限公司 基于数学语义逻辑关系的高中数学题目的分割方法和系统

Also Published As

Publication number Publication date
JP4088176B2 (ja) 2008-05-21

Similar Documents

Publication Publication Date Title
JP4654780B2 (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US7526474B2 (en) Question answering system, data search method, and computer program
JP7089330B2 (ja) 適応可能な処理コンポーネント
US20190236142A1 (en) System and Method of Chat Orchestrated Visualization
US20070118519A1 (en) Question answering system, data search method, and computer program
JP4347226B2 (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
KR102128659B1 (ko) 키워드 추출 및 요약문 생성 시스템 및 방법
MXPA04010820A (es) Sistema para identificar parafrasis utilizando tecnicas de traduccion de maquina.
JP2005122295A (ja) 関係図作成プログラム、関係図作成方法、および関係図作成装置
JP7381052B2 (ja) 問合せ対応支援装置、問合せ対応支援方法、プログラム及び記録媒体
JP2006119991A (ja) Faqデータ作成装置及び方法、整理装置及び方法、faq回答システム
JP2006343925A (ja) 関連語辞書作成装置、および関連語辞書作成方法、並びにコンピュータ・プログラム
JP4088176B2 (ja) 質問応答装置及び質問応答プログラム
JP2008140204A (ja) データ検索システム及びプログラム
JP2008250893A (ja) 情報検索装置、情報検索方法およびそのプログラム
JP2004334699A (ja) テキスト評価装置、テキスト評価方法、プログラム及び記憶媒体
JP4074687B2 (ja) 要約文作成支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003099429A (ja) 用語集生成装置及び用語集生成プログラム並びに用語集検索装置
JP2012243130A (ja) 情報検索装置、方法、及びプログラム
JPH1145269A (ja) 文書管理支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4049141B2 (ja) 文書処理装置、文書処理方法、および、文書処理プログラム
JP2010165041A (ja) 正解判定装置、正解判定システム、正解判定方法および正解判定プログラム
JPH1145249A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3444223B2 (ja) データベース登録装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080222

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110228

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120229

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130228

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140228

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees