JP2007157006A - 質問応答装置、質問応答方法および質問応答プログラム - Google Patents
質問応答装置、質問応答方法および質問応答プログラム Download PDFInfo
- Publication number
- JP2007157006A JP2007157006A JP2005354207A JP2005354207A JP2007157006A JP 2007157006 A JP2007157006 A JP 2007157006A JP 2005354207 A JP2005354207 A JP 2005354207A JP 2005354207 A JP2005354207 A JP 2005354207A JP 2007157006 A JP2007157006 A JP 2007157006A
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- answer
- question
- output
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】キーワード入力部11にキーワードが入力されると、キーワード増加部12が、キーワード抽出技術を用いて、入力された各キーワードと同じ分野のキーワードをキーワード抽出用DB16から抽出し、キーワードの総数を増加させ、解答候補抽出部14が、機械学習の手法を用いて、キーワード増加部12によって増加されたキーワードによって構成される質問に対する解答候補を抽出し、解答表出力部15が、抽出された各解答候補が質問と対応付けられた表を解答表として出力する。
【選択図】図1
Description
村田真樹,井佐原均,質問応答システムにおける逓減加点法に基づく複数記事情報の利用,情報処理学会自然言語処理研究会 2004-NL-160,2004年.九州大学.
1.解表現の推定
質問応答システムは、疑問代名詞の表現などに基づいて解表現(解がどのような言語表現か)を推定する。例えば、入力の質問文が「日本の面積はどのくらいですか」だとすると、「どのくらい」という表現から、解表現は数値表現であろうと推測する。
2.文書検索
質問応答システムは、質問文からキーワードを取り出し、これらのキーワードを用いて文書を検索する。この検索により、解が書いてありそうな文書群を集めることになる。例えば、入力の質問文が、「日本の面積はどのくらいですか」だとすると、「日本」、「面積」がキーワードとして抽出され、これらを含む文書を検索することになる。
3.解の抽出
質問応答システムは、解が書いてありそうな文書群から、推定した解表現に適合する言語表現を抽出し、それを解として出力する。例えば、入力の質問文が、「日本の面積はどのくらいですか」だとすると、文書検索で検索した「日本」、「面積」を含む文書群から、解表現として推定した数値表現にあたる言語表現を解として抽出する。
人手で作成したヒューリスティックルールを使って解表現を推定する。16個のルールを作成する。そのいくつかを以下に示す。
・質問文に「誰」という表現がある場合、解表現は人名である。
・質問文に「いつ」という表現がある場合、解表現は時間表現である。
・質問文に「どのくらいの」という表現がある場合、解表現は数値表現である。
文書検索のためのキーワードは、公知のキーワード抽出ツールであるChaSenにより取り出し、付属語などはキーワードから除外する。文書検索は以下のように行なう。
文献(2):S.E. Robertson, S.Walker, S.Jones, M.M. HancockBeaulieu, and M.Gatford, Okapi at trec-3, TREC-3,(1994).
文献(3):村田真樹,内元清貴,小作浩美,馬青,内山将夫,井佐原均,位置情報と分野情報を用いた情報検索,言語処理学会誌,Vol.7,No.2(2000).
文献(4):Masaki Murata, Qing Ma, and Hitoshi Isahara, High performance information retrieval using many characteristics and many techniques, Proceedings of the Third NTCIR Workshop (CLIR),(2002).
次に、以下の式で記事をリランキングし、上位kdr2 個の記事を取り出す。
文書検索で得た記事から、名詞、未知語連続を取り出し、それらを解の候補とする。それぞれの候補には、解の候補とキーワードの近さに基づく得点Scorenear(c)と解表現の意味制約を満足しているか否かに基づくScoresem (c)の二つの得点を与え、その合計点が最も大きい候補を解とする。
・推定した解表現(人名や地名など)と一致する候補に1000を与える。解の候補が人名か地名かと特定する方法には、例えばSVMに基づく固有表現抽出技術を利用する。固有表現抽出技術の例については、後述する。
・解表現が「国名」の場合に解の候補が国名のときに1000を与える。
・質問文が「何+名詞X」の場合、名詞Xを最後に持つ候補に1000を与える。
(1)オリジナル法
得点の加算を行わない方法。
(2)単純加算法
複数の記事から取り出した解の候補の得点を加算し、その得点をそのまま加算した合計得点に基づき解を出力する。
(3)逓減加点法
複数記事から取り出した候補の得点を加算する。この方法は、i番目の候補の得点にはk(i-1) の値を乗じてから得点を加算する。すなわち、加算結果は、以下の式で表される。
(4)融合法
この方法は、オリジナル法、単純加算法、逓減加点法の組み合わせである。この方法はまず学習データでこれらの方法のうちどの方法が最も良い精度を出すかを調べて、最も精度の高かった方法を利用して問題を解く。
以下に、パターン抽出部121が抽出するパターンについて、該パターンが国名Aである場合を例にとって説明する。
日本
中国
朝鮮
タイ
韓国
・抽出パターンの例(1) :(両端とも利用、スピードは遅いが性能は良い)
日、A軍
人のA人女性
日本はAと
〔A通信・
省。駐A大使な
・抽出パターンの例(2) :(片方のみ利用、片方は平仮名文字、スピードは早い)
[..A国]。
[..A国]側
[..A国]伝来
A語入力
ただし、[..A..]は、それ自体が国名Aにマッチすることを意味する。例えば[A国]だとそのマッチした用語の最後が国であることを意味する。
入力する少数のキーワードとして、例えば、評価データの代表形で毎日新聞での頻度の多い方から有名そうな用語を五つ選択するものとする。また、例えば、CD毎日新聞(コンパクトディスクに記録された毎日新聞)1991−2000年度版をキーワード抽出用DB16とする。抽出の手順例は以下のとおりである。
手法1は、抽出した表現expのScoreとして、パターンci の中でpi が最も大きかったパターンのpi を使用する手法である。ここで、pi はパターンci で抽出される表現expでの入力キーワードの割合(確からしさ、すなわち確信度となる)である。
手法2は、抽出した表現expのScoreとして、全てのパターンci のpi を掛け合わせたものを使用する。
Π((1−Δ)/Δ*pi +1) 式(9)
を利用する構成をとることもできる。ここで、Δは微小値の定数であり、例えば、0.0001を用いる。
手法3は、抽出した表現expのScoreとして、抽出されたパターンの個数(総数)を用いる。つまり、多くのパターンで抽出されたものほどScoreを大きくする。
手法4は、抽出した表現expのScoreとして、pi の重みを加えた抽出されたパターンの個数を用いるものである。
手法5は、抽出した表現expのScoreとして、少なくとも一つは確からしくなる値を用いるものである。
(a)字種とKRを利用する方法
図3に示す例で、抽出方法には、さらに字種とKRを利用する方法を用いた。ここで、字種とは、漢字、カタカナ、ひらがな、記号、数字などであり、例えば英語だと、アルファベット、数字、記号、単語の先頭が大文字かどうかなどである。
品詞に基づく方法では、例えば、入力表現に名詞しかない場合は出力時に名詞以外の表現を省く、また、入力表現に形容詞しかない場合は出力時に形容詞以外の表現を省くというものである。さらに、表現が複数の単語で構成されている場合は、末尾の単語(形態素)の品詞の情報を使うようにすることができる。
入力キーワードとして次のものであった場合、
「楽しい」「哀しい」「嬉しい」「とても嬉しい」「とても哀しい」
抽出物として次のものが得られる場合、
「とても」「新しい」「美しい」「とても美しい」「とても難しい」
上記抽出物の表現中の末尾の単語の品詞を推定し、上記入力キーワードでは、末尾の単語の品詞は「形容詞」しかないので、抽出物の中で、末尾の単語の品詞が「形容詞」でない、副詞(「とても」)を除いて出力するようにする。
入力キーワードとして次のものであった場合、
「楽しい」「歓喜」「悲痛」「悲しい」
上記入力キーワードでは、「形容詞」と「名詞」のように複数種類があった場合は、それらの品詞は出力し、それらの品詞以外の表現は出力しないようにする。
日本語を単語に分割するために、キーワード抽出部122で形態素解析システムを利用することが必要になる。ここではChaSenについて説明する(奈良先端大で開発されている形態素解析システム茶筌。http://chasen.aist-nara.ac.jp/index.html.jp で公開されている)。
へ ヘ へ 助詞−格助詞−一般
行く イク 行く 動詞−自立 五段・カ行促音便 基本形
EOS
このように各行に一個の単語が入るように分割され、各単語に読みや品詞の情報が付与される。
例えば、入力表現がすべて同じ「しい」という共通末尾表現を持っている場合、出力時に「しい」を持たない表現を省くものである。なお、これは末尾だけでなく、先頭の文字列でも同様にできる。
入力キーワードとして次のものであった場合、
「悲しい」「楽しい」「嬉しい」
抽出されるものが次の場合、
「歓喜」「悲痛」「美しい」「新しい」
上記入力キーワードの共通部分文字列が「しい」なので、「しい」を持たない「歓喜」と「悲痛」を削除して出力するものである。
上記では、入力表現から自動で制約を得る方法を説明したが、この制約はユーザにさせることもできる。例えば、ユーザが「漢字のみ」というオプションを選択すると出力では漢字以外の字種を用いた表現を出力しないことができる。また、ユーザが末尾は「しい」というオプションを選択すると出力では「しい」を末尾に持たない表現を出力しないようにすることができる。さらに、ユーザが品詞は名詞というオプションを選択すると出力では名詞以外の表現を出力しないようにする。
(機械学習の手法)
機械学習の手法は、問題−解答の組のセットを多く用意し、それで学習を行ない、どういう問題のときにどういう解答になるかを学習し、その学習結果を利用して、新しい問題のときも解答を推測できるようにする方法である(例えば、下記の文献(7)参照)。
どういう問題のときに、という、問題の状況を機械に伝える際に、素性(解析に用いる情報で問題を構成する各要素)というものが必要になる。問題を素性によって表現するのである。例えば、日本語文末表現の時制の推定の問題において、問題:「彼が話す。」−−−解答「現在」が与えられた場合に、素性の一例は、「彼が話す。」「が話す。」「話す。」「す」「。」となる。
ただし、fmax は以下の式によって与えられる。
文献(9):Eric Sven Ristad, Maximum Entropy Modeling Toolkit, Release 1.6beta, (http://www.mnemonic.com/software/memt,1998) )
サポートベクトルマシン法は、空間を超平面で分割することにより、二つの分類からなるデータを分類する手法である。
sgn(x)=1(x≧0)
−1(otherwise )
であり、また、各αi は式(22)と式(23)の制約のもと式(21)を最大にする場合のものである。
C、dは実験的に設定される定数である。後述する具体例ではCはすべての処理を通して1に固定した。また、dは、1と2の二種類を試している。ここで、αi >0となるxi は、サポートベクトルと呼ばれ、通常、式(20)の和をとっている部分は、この事例のみを用いて計算される。つまり、実際の解析には学習データのうちサポートベクトルと呼ばれる事例のみしか用いられない。
文献(11):Taku Kudoh, Tinysvm:Support Vector machines,(http://cl.aist-nara.ac.jp/taku-ku//software/Tiny SVM/index.html,2000)
サポートベクトルマシン法は、分類の数が2個のデータを扱うものである。したがって、分類の数が3個以上の事例を扱う場合には、通常、これにペアワイズ法またはワンVSレスト法などの手法を組み合わせて用いることになる。
(解答候補の抽出手法1)
<問題の構成>
予め、
問題『質問「X1のY1は?」で答え「Z1」』−−−解答「正解」
問題『質問「X2のY2は?」で答え「Z2」』−−−解答「正解」
問題『質問「X3のY3は?」で答え「Z3」』−−−解答「不正解」
という、問題と解答の対を多数作成する。
・Xi,Yi,Ziの単語自体
・Xi,Yi,Ziの単語の意味クラス
・Xi,Yiで検索した記事数
・Xi,Yiで検索した記事にZiが存在する記事数
・Xi,Yiが近接して(ある単語数の範囲内に)出現した記事数
・Xi,Yi,Ziが近接して(ある単語数の範囲内に)出現した記事数
・Xi,Yiで検索した記事に最も多く出現した単語とZiが一致するかどうか
・Xi,Yiで検索した記事にj番目に多く出現した単語とZiが一致するかどうか
・Xi,Yiをキーワードとして、例えば、解答候補抽出部14が、新聞記事データ・百科事典データなどの文書データ群(図示を省略)から解答の書いてありそうな記事群を取り出し、その取り出した記事群の言語表現を解答の候補として取り出し、取り出された解答の候補を、優先順序(例えば、Scorenear(c))で並び替えた場合に、その順序の最も高い候補とZiが一致したかどうか、また、その順序のj番目の候補とZiが一致したかどうか
上記の処理によって、素性の集合と解答の組の多数のセットが用意される。
問題の具体例:
問題『質問「日本の首都は?」で答え「東京」』−−−解答「正解」
問題『質問「日本の首都は?」で答え「大阪」』−−−解答「不正解」
問題『質問「日本の首都は?」で答え「パン」』−−−解答「不正解」
素性の具体例:
問題『質問「日本の首都は?」で答え「東京」』−−−解答「正解」の場合
・Xiの単語自体:日本
・Yiの単語自体:首都
・Ziの単語自体:東京
・Xiの意味クラス:12590(地名のクラス)
・Yiの意味クラス:12540(都市集落のクラス)
・Ziの意味クラス:12590(地名のクラス)
(意味クラスとして分類語彙表の最初の5桁を利用する。)
・Xi,Yiで検索した記事数:日本と首都を含む記事数。例えば1000
・Xi,Yiで検索した記事にZiが存在する記事数:日本と首都と東京を含む記事数。例えば100
・Xi,Yiが近接して(ある単語数の範囲内に)出現した記事数:例えば、日本と首都が10単語以内にある記事数。例えば500
・Xi,Yi,Ziが近接して(ある単語数の範囲内に)出現した記事数:例えば、日本と首都と東京が10単語以内にある記事数。例えば50
・Xi,Yiで検索した記事に最も多く出現した単語とZiが一致するかどうか:例えば、ここでは特に単語は名詞にしぼり、名詞としては、「こと」が最も頻度が多かったとすると、「こと」と「東京」が一致しないのでこの素性は「いいえ」となる。
・Xi,Yiで検索した記事にj番目に多く出現した単語とZiが一致するかどうか:例えば、ここでは特に単語は名詞にしぼり、名詞としては、「東京」が二番目に頻度が多かったとすると、j=2の場合の素性は「はい」となる。
・Xi,Yiをキーワードとして、例えば、解答候補抽出部14が、新聞記事データ・百科事典データなどの文書データ群から解答の書いてありそうな記事群を取り出し、その取り出した記事群の言語表現を解答の候補を取り出し、取り出された解答の候補を、優先順序(例えば、Scorenear(c))で並び替えた場合に、その順序の最も高い候補とZiが一致したかどうか、また、その順序のj番目の候補とZiが一致したかどうか
例えば、1番目の候補が「こと」、2番目の候補が「東京」の場合は、「その順序の最も高い候補とZiが一致したかどうか」は「いいえ」になり、「その順序のj番目の候補とZiが一致したかどうか」は、j=2のとき「はい」になる。
Yiの単語自体:首都
Ziの意味クラス:12590(地名のクラス)
で、「その順序の最も高い候補とZiが一致したかどうか」は「はい」
または「その順序のj番目の候補とZiが一致したかどうか」のj=2のときが「はい」になれば、
解答「正解」
となるように学習し、
Yiの単語自体:首都
Ziの意味クラス:12590(地名のクラス)以外なら、
解答「不正解」
Yiの単語自体:首都
「その順序の最も高い候補とZiが一致したかどうか」は「いいえ」かつ、
「その順序のj番目の候補とZiが一致したかどうか」のj=2から10全てで「いいえ」ならば、
解答「不正解」
といったことを学習する。
質問「フランスの首都は?」−答え「パリ」については、
Yiの単語自体:首都
Ziの意味クラス:12590(地名のクラス)で、
「その順序の最も高い候補とZiが一致したかどうか」は「はい」または、
「その順序のj番目の候補とZiが一致したかどうか」のj=2のときが「はい」
なので、「正解」と判断する。
質問「フランスの首都は?」−答え「信号」については、上記学習結果を用いて、
Yiの単語自体:首都
Ziの意味クラス:12590(地名のクラス)以外
なので、「不正解」と判断する。
例えば、質問作成部13によって作成された質問、または、質問応答装置1が質問作成部13を備えない構成を採るときはキーワード増加部12によって出力された出力キーワードによって構成される質問「フランスの首都は?」を解く場合について説明する。
問題『質問「フランスの首都は?」で答え「候補1」』
問題『質問「フランスの首都は?」で答え「候補2」』
・・・
を作成する。ここで、「候補1」、「候補2」は、上記の質問の「答え」の表現の候補を示している。
<問題の構成>
解答候補抽出部14は、
問題『質問「X1のY1は?」』−−−解答「地名」
問題『質問「X2のY2は?」』−−−解答「地名」
問題『質問「X3のY3は?」』−−−解答「人名」
問題『質問「X4のY4は?」』−−−解答「数値」
...
という、問題と解答の対を多数作成する。
素性としては、
Xi,Yiの単語自体
Xi,Yiの単語の意味クラス
などが考えられる。
問題構成と素性の定義をすれば、あとは機械学習の手法で扱える。
問題の具体例:
問題『質問「日本の首都は?」』−−−解答「地名」
問題『質問「日本の首相は?」』−−−解答「人名」
問題『質問「日本の面積は?」』−−−解答「数値」
素性の具体例:
問題『質問「日本の首都は?」』−−−解答「地名」の場合、
・Xiの単語自体:日本
・Yiの単語自体:首都
・Xiの意味クラス:12590(地名のクラス)
・Yiの意味クラス:12540(都市集落のクラス)
(意味クラスとして分類語彙表の最初の5桁を利用)
もっと多くの事例で学習すると、例えば、
Yiの単語自体:首都
だと、
解答「地名」
となるように学習し、
Yiの単語自体:首相
だと、
解答「人名」、
Yiの単語自体:面積
だと、
解答「数値」、
といったことを、解答候補抽出部14が学習し、その学習結果を学習DB17内に蓄積する。
例えば、新しい問題:
『質問「フランスの首都は?」』についての解答は、
Yiの単語自体:首都
なので、「地名」と判断する。
例えば、質問作成部13によって作成された質問、または、質問応答装置1が質問作成部13を備えない構成を採るときはキーワード増加部12によって出力された出力キーワードによって構成される質問「フランスの首都は?」を解く場合について説明する。
問題「フランスの首都は?」について、
解答が「地名」であるという結果を取得する。
(1)機械学習を用いる手法
機械学習を用いて固有表現を抽出する手法がある(例えば、以下の文献(12)参照)。
まず、例えば、「日本の首相は小泉さんです。」という文を、各文字に分割し、分割した文字について、以下のように、 B−LOCATION、 I−LOCATION等の正解タグを付与することによって、正解を設定する。以下の一列目は、分割された各文字であり、各文字の正解タグは二列目である。
日 B−LOCATION
本 I−LOCATION
の O
首 O
相 O
は O
小 B−PERSON
泉 I−PERSON
さ O
ん O
で O
す O
。 O
上記において、B −???は、ハイフン以下の固有表現の種類の始まりを意味するタグである。例えば、 B−LOCATIONは、地名という固有表現の始まりを意味しており、 B−PERSONは、人名という固有表現の始まりを意味している。また、I −???は、ハイフン以下の固有表現の種類の始まり以外を意味するタグであり、O はこれら以外である。従って、例えば、文字「日」は、地名という固有表現の始まりに該当する文字であり、文字「本」までが地名という固有表現である。
日 B−LOCATION
の部分は、
日本−B 名詞−B
などの情報を用いる。日本−B は、日本という単語の先頭を意味し、名詞−B は、名詞の先頭を意味する。単語や品詞の認定には、例えば前述したChaSenによる形態素解析を用いる。ChaSenを用いれば、入力された日本語を単語に分割することができる。例えば、ChaSenは、前述したように、日本語文を分割し、さらに、各単語の品詞も推定してくれる。例えば、「学校へ行く」を入力すると以下の結果を得ることができる。
へ ヘ へ 助詞−格助詞−一般
行く イク 行く 動詞−自立 五段・カ行促音便 基本形
EOS
このように各行に一個の単語が入るように分割され、各単語に読みや品詞の情報が付与される。
(2)形態素解析を用いる手法
形態素解析システム(例えば、前述したChaSen)を用いれば、入力された日本語を単語に分割することができる。
へ ヘ へ 助詞−格助詞−一般
行く イク 行く 動詞−自立 五段・カ行促音便 基本形
EOS
このように各行に一個の単語が入るように分割され、各単語に読みや品詞の情報が付与される。
入力:
日本の首都は東京です
出力:
日本ニッポン日本名詞−固有名詞−地域−国
のノの助詞−連体化
首都シュト首都名詞−一般
はハは助詞−係助詞
東京トウキョウ東京名詞−固有名詞−地域−一般
ですデスです助動詞特殊・デス基本形
EOS
は chasen の出力であり、名詞−固有名詞−地域という品詞が出力される。
このシステムを使って、例えば地名の固有表現を取り出すことができる。
入力:
村山首相が言った
出力:
村山ムラヤマ村山名詞−固有名詞−人名−姓
首相シュショウ首相名詞−一般
がガが助詞−格助詞−一般
言っイッ言う動詞−自立五段・ワ行促音便連用タ接続
たタた助動詞特殊・タ基本形
EOS
も chasen の出力であるが、これだと名詞−固有名詞−人名という品詞が出力される。このシステムを使って、例えば人名の固有表現を取り出すことができる。
(3)作成したルールを用いる手法
人手でルールを作って固有表現を取り出すという方法もある。
名詞+「さん」だと人名とする
名詞+「首相」だと人名とする
名詞+「町」だと地名とする
名詞+「市」だと地名とする
などである。
アメリカ:12590 04 192
例えば、両単語の分類番号の上位5レベルにおいて、最初の5桁が一致するので、算出されるキーワード「日本」と分類語彙表中の単語「アメリカ」との類似度は、類似度5である。
人口:12630 10 012
例えば、両単語の分類番号の上位5レベルにおいて、最初の5桁が一致するので、算出されるキーワード「面積」と分類語彙表中の単語「人口」との類似度は、類似度5である。
緯度:12630 10 015
例えば、両単語の分類番号の上位5レベルにおいて、最初の5桁が一致し、また、6レベル目の2桁の数字「10」が一致するので、算出されるキーワード「人口」と分類語彙表中の単語「緯度」との類似度は、類似度7である。
アメリカ:12590 04 192
例えば、両単語の分類番号の上位5レベルにおいて、最初の2桁が一致するため、算出されるキーワード「人口」と分類語彙表中の単語「アメリカ」との類似度は、類似度2である。
第4のキーワード毎に、キーワード増加部12が抽出したパターンci と共起してキーワード抽出用DB16中に出現した回数を算出し、算出した回数を要素とするベクトル(以下、「共起ベクトル」という)を求める。
類似キーワード決定部41は、まず、第4のキーワードを用いて知識DB25を全文検索し、各第4のキーワードと共起して出現した語(共起語)を抽出する。そして、各第4のキーワードが、抽出された共起語と共起して知識DB25中に出現した回数を要素とするベクトルを、各第4のキーワードについての共起ベクトルとして求める。
シソーラスデータが分類語彙表の形式で格納されているシソーラスデータベース(図17では図示を省略)を用意する。類似キーワード決定部41は、シソーラスデータベース内に格納されているシソーラスデータ中の各単語に振られた、10桁の分類番号における各桁の数字の一致の割合を用いて、第4のキーワードと、キーワード入力部11に入力された第2のキーワード(と同一の第4のキーワード)との類似度を求める。
11 キーワード入力部
12、18、60、63 キーワード増加部
13、23、42 質問作成部
14、24、43 解答候補抽出部
15 解答表出力部
16 キーワード抽出用DB
17 学習DB
21 疑問代名詞入力部
22 解答タイプ推定部
25 知識DB
31 解答タイプ入力部
41 類似キーワード決定部
61 単語データDB
62 シソーラスDB
100 類似度算出部
101、122 キーワード抽出部
121 パターン抽出部
Claims (22)
- 自然言語で表現された質問データに対する解答を出力する質問応答装置であって、
複数のキーワードが入力キーワードとして入力されるキーワード入力手段と、
前記入力キーワードに基づいて、前記入力キーワードの数より多いキーワードを抽出して出力キーワードとして出力するキーワード増加手段と、
前記出力キーワードによって構成される質問に対する解答の候補である解答候補を、予め記憶された解答候補の検索対象である文書データ群から抽出する解答候補抽出手段と、
前記抽出された各解答候補が質問と対応付けられた表を解答表として出力する解答表出力手段とを備える
ことを特徴とする質問応答装置。 - 請求項1に記載の質問応答装置において、
前記キーワード増加手段は、
前記入力キーワードをキーワード抽出用の文書データが格納されたキーワード抽出用データベースで全文検索し、前記入力キーワードの周辺に出現したパターンを抽出するパターン抽出手段と、
前記パターン抽出手段で抽出したパターンを前記キーワード抽出用データベースで全文検索し、前記パターンによって抽出される表現を抽出し、前記抽出した表現を出力キーワードとして出力するキーワード抽出手段とを備える
ことを特徴とする質問応答装置。 - 請求項1に記載の質問応答装置において、
前記キーワード増加手段は、
前記入力キーワードと同じ分野の単語を、単語と単語の分野との対応情報が格納されたデータベースから抽出し、出力キーワードとして出力する
ことを特徴とする質問応答装置。 - 請求項1に記載の質問応答装置において、
前記キーワード増加手段は、
予めデータベース中に記憶された、意味的類似による単語の分類情報であるシソーラスデータに基づいて、前記入力された入力キーワードと、前記シソーラスデータ中の単語との類似度を算出する類似度算出手段と、
前記算出された類似度の大きさに基づいてキーワードを抽出し、出力キーワードとして出力するキーワード抽出手段とを備える
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードに基づいて、第4のキーワードを出力キーワードとして出力し、
前記解答候補抽出手段は、予め用意された問題とその問題に対する解答の組の多数のセットを用いて、どういう問題のときにどういう解答になるかを学習し、その学習結果に基づいて、前記出力された第3のキーワードと第4のキーワードとによって構成される質問に対する解答の候補である解答候補を抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードに基づいて、第4のキーワードを出力キーワードとして出力し、
前記解答候補抽出手段は、予め記憶手段中に格納された大量の文書データ群中から前記出力された第3のキーワードと第4のキーワードを含む文書データを取り出し、取り出された文書データの言語表現から、前記大量の文書データ群中に出現する頻度を用いて、前記出力された第3のキーワードと第4のキーワードとによって構成される質問に対する解答候補を抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
前記第2のキーワードに対応付けられた疑問代名詞が入力される疑問代名詞入力手段と、
前記疑問代名詞入力手段に入力された疑問代名詞に基づいて、前記キーワード増加手段によって出力される出力キーワードによって構成される質問に対する解答の候補の言語表現の類型である解答タイプを推定する解答タイプ推定手段とを備え、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードを出力キーワードとして出力し、
前記解答候補抽出手段は、前記解答候補の検索対象である文書データ群から、前記キーワード増加手段によって出力された第3のキーワードと第2のキーワードとを含む文書データを検索し、この検索処理で抽出された文書データから、前記解答タイプ推定手段によって推定された解答タイプに適合する言語表現を、前記第3のキーワードと第2のキーワードとによって構成される質問の解答候補として抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
予め定められた前記第2のキーワードに対応付けられた疑問代名詞に基づいて、前記キーワード増加手段によって出力される出力キーワードによって構成される質問に対する解答の候補の言語表現の類型である解答タイプを推定する解答タイプ推定手段とを備え、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードを出力キーワードとして出力し、
前記解答候補抽出手段は、前記解答候補の検索対象である文書データ群から、前記キーワード増加手段によって出力された第3のキーワードと第2のキーワードとを含む文書データを検索し、この検索処理で抽出された文書データから、前記解答タイプ推定手段によって推定された解答タイプに適合する言語表現を、前記第3のキーワードと第2のキーワードとによって構成される質問の解答候補として抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
疑問代名詞が入力される疑問代名詞入力手段と、
前記疑問代名詞入力手段に入力された疑問代名詞に基づいて、前記キーワード増加手段によって出力される出力キーワードによって構成される質問に対する解答の候補の言語表現の類型である解答タイプを推定する解答タイプ推定手段とを備え、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードに基づいて、第4のキーワードを出力キーワードとして出力し、
前記解答候補抽出手段は、前記解答候補の検索対象である文書データ群から、前記キーワード増加手段によって出力された第3のキーワードと第2のキーワードとを含む文書データを検索し、この検索処理で抽出された文書データから、前記解答タイプ推定手段によって推定された解答タイプに適合する言語表現を、前記第3のキーワードと第4のキーワードとによって構成される質問の解答候補として抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
予め定められた疑問代名詞に基づいて、前記キーワード増加手段によって出力される出力キーワードによって構成される質問に対する解答の候補の言語表現の類型である解答タイプを推定する解答タイプ推定手段とを備え、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードに基づいて、第4のキーワードを出力キーワードとして出力し、
前記解答候補抽出手段は、前記解答候補の検索対象である文書データ群から、前記キーワード増加手段によって出力された第3のキーワードと第2のキーワードとを含む文書データを検索し、この検索処理で抽出された文書データから、前記解答タイプ推定手段によって推定された解答タイプに適合する言語表現を、前記第3のキーワードと第4のキーワードとによって構成される質問の解答候補として抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード増加手段によって出力される出力キーワードによって構成される質問に対する解答の候補の言語表現の類型である解答タイプが入力される解答タイプ入力手段を備え、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードに基づいて、第4のキーワードを出力キーワードとして出力し、
前記解答候補抽出手段は、前記解答候補の検索対象である文書データ群から、前記キーワード増加手段によって出力された第3のキーワードと第4のキーワードとを含む文書データを検索し、この検索処理で抽出された文書データから、前記解答タイプ入力手段に入力された解答タイプに適合する言語表現を、前記出力された第3のキーワードと第4のキーワードとによって構成される質問の解答候補として抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードに基づいて、第4のキーワードを出力キーワードとして出力し、
前記解答候補抽出手段は、前記解答候補の検索対象である文書データ群から、前記キーワード増加手段によって出力された第3のキーワードと第4のキーワードとを含む文書データを検索し、この検索処理で抽出された文書データから、予め定められた解答タイプに適合する言語表現を、前記出力された第3のキーワードと第4のキーワードとによって構成される質問の解答候補として抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
前記キーワード増加手段によって出力される出力キーワードによって構成される質問に対する解答の候補の言語表現の類型である解答タイプであって、前記キーワード入力手段に入力された第2のキーワードに対応付けられた解答タイプが入力される解答タイプ入力手段を備え、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードを出力キーワードとして出力し、
前記解答候補抽出手段は、前記解答候補の検索対象である文書データ群から、前記キーワード増加手段によって出力された第3のキーワードと第2のキーワードとを含む文書データを検索し、この検索処理で抽出された文書データから、前記解答タイプ入力手段に入力された解答タイプに適合する言語表現を、前記出力された第3のキーワードと第2のキーワードとによって構成される質問の解答候補として抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードを出力キーワードとして出力し、
前記解答候補抽出手段は、前記解答候補の検索対象である文書データ群から、前記キーワード増加手段によって出力された第3のキーワードと第2のキーワードとを含む文書データを検索し、この検索処理で抽出された文書データから、予め定められた、前記第2のキーワードに対応付けられた解答タイプに適合する言語表現を、前記出力された第3のキーワードと第2のキーワードとによって構成される質問の解答候補として抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
前記キーワード増加手段によって出力される出力キーワードによって構成される質問に対する解答の候補の言語表現の類型である解答タイプであって、前記キーワード入力手段に入力された第2のキーワードに対応付けられた解答タイプが入力される解答タイプ入力手段を備え、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードに基づいて、第4のキーワードを出力キーワードとして出力し、
前記第2のキーワードのうち前記出力された第4のキーワードに類似するものを、前記第4のキーワードのそれぞれについて、類似キーワードとして決定する類似キーワード決定手段を備え、
前記解答候補抽出手段は、前記解答候補の検索対象である文書データ群から、前記キーワード増加手段によって出力された第3のキーワードと第4のキーワードを含む文書データを検索し、この検索処理で抽出された文書データから、前記出力された第4のキーワードが類似する類似キーワードに対応付けられて前記解答タイプ入力手段に入力された解答タイプに適合する言語表現を、前記出力された第3のキーワードと第4のキーワードとによって構成される質問の解答候補として抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードに基づいて、第4のキーワードを出力キーワードとして出力し、
前記第2のキーワードのうち前記出力された第4のキーワードに類似するものを、前記第4のキーワードのそれぞれについて、類似キーワードとして決定する類似キーワード決定手段を備え、
前記解答候補抽出手段は、前記解答候補の検索対象である文書データ群から、前記キーワード増加手段によって出力された第3のキーワードと第4のキーワードを含む文書データを検索し、この検索処理で抽出された文書データから、前記出力された第4のキーワードが類似する類似キーワードに予め対応付けられた解答タイプに適合する言語表現を、前記出力された第3のキーワードと第4のキーワードとによって構成される質問の解答候補として抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
前記第2のキーワードに対応付けられた疑問代名詞が入力される疑問代名詞入力手段と、
前記疑問代名詞入力手段に入力された疑問代名詞に基づいて、前記キーワード増加手段によって出力される出力キーワードによって構成される質問に対する解答の候補の言語表現の類型である解答タイプを推定する解答タイプ推定手段とを備え、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードに基づいて、第4のキーワードを出力キーワードとして出力し、
前記第2のキーワードのうち前記出力された第4のキーワードに類似するものを、前記第4のキーワードのそれぞれについて、類似キーワードとして決定する類似キーワード決定手段を備え、
前記解答候補抽出手段は、前記解答候補の検索対象である文書データ群から、前記キーワード増加手段によって出力された第3のキーワードと第4のキーワードを含む文書データを検索し、この検索処理で抽出された文書データから、前記出力された第4のキーワードが類似する類似キーワードに対応付けられて前記疑問代名詞入力手段に入力された疑問代名詞に基づいて解答タイプ推定手段が推定した解答タイプに適合する言語表現を、前記出力された第3のキーワードと第4のキーワードとによって構成される質問の解答候補として抽出する
ことを特徴とする質問応答装置。 - 請求項1乃至請求項4のいずれか1項に記載の質問応答装置において、
前記キーワード入力手段には、前記入力キーワードとして第1のキーワードと第2のキーワードとが入力され、
予め定められた、前記第2のキーワードに対応付けられた疑問代名詞に基づいて、前記キーワード増加手段によって出力される出力キーワードによって構成される質問に対する解答の候補の言語表現の類型である解答タイプを推定する解答タイプ推定手段とを備え、
前記キーワード増加手段は、前記入力された第1のキーワードに基づいて、第3のキーワードを出力キーワードとして出力し、前記入力された第2のキーワードに基づいて、第4のキーワードを出力キーワードとして出力し、
前記第2のキーワードのうち前記出力された第4のキーワードに類似するものを、前記第4のキーワードのそれぞれについて、類似キーワードとして決定する類似キーワード決定手段を備え、
前記解答候補抽出手段は、前記解答候補の検索対象である文書データ群から、前記キーワード増加手段によって出力された第3のキーワードと第4のキーワードを含む文書データを検索し、この検索処理で抽出された文書データから、前記出力された第4のキーワードが類似する類似キーワードに対応付けられた疑問代名詞に基づいて解答タイプ推定手段が推定した解答タイプに適合する言語表現を、前記出力された第3のキーワードと第4のキーワードとによって構成される質問の解答候補として抽出する
ことを特徴とする質問応答装置。 - 請求項15乃至請求項18のいずれか1項に記載の質問応答装置において、
前記類似キーワード決定手段は、
予め記憶手段内に格納された大量の文書データ群中から、前記キーワード抽出手段によって出力された第4のキーワードと共起して出現する語である共起語を抽出するとともに、前記第4のキーワードのそれぞれについて、前記抽出された各共起語と共起して前記文書データ群中に出現する回数を要素とするベクトルである共起ベクトルを求め、
各第4のキーワードについての共起ベクトルと前記キーワード入力手段に入力された第2のキーワードと同一の第4のキーワードについての共起ベクトルとの類似の度合いを求め、求められた類似の度合いに基づいて決まる、前記各第4のキーワードと類似する第2のキーワードと同一の第4のキーワードを、前記類似キーワードとする
ことを特徴とする質問応答装置。 - 請求項15乃至請求項18のいずれか1項に記載の質問応答装置において、
前記類似キーワード決定手段は、
予めデータベース中に記憶された、意味的類似による単語の分類情報であるシソーラスデータに基づいて、前記キーワード増加手段によって出力された第4のキーワード毎に、前記第4のキーワードと同一の単語と、前記キーワード入力手段に入力された第2のキーワードと同一の単語との類似度を算出する類似度算出手段と、
前記算出された類似度の大きさに基づいて決まる、前記第4のキーワードと類似する第2のキーワードを、前記類似キーワードとする
ことを特徴とする質問応答装置。 - 自然言語で表現された質問データに対する解答を出力する質問応答方法であって、
複数のキーワードを入力キーワードとして入力するステップと、
前記入力キーワードに基づいて、前記入力キーワードの数より多いキーワードを抽出して出力キーワードとして出力するステップと、
前記出力キーワードによって構成される質問に対する解答の候補である解答候補を、予め記憶された解答候補の検索対象である文書データ群から抽出するステップと、
前記抽出された各解答候補が質問と対応付けられた表を解答表として出力するステップとを有する
ことを特徴とする質問応答方法。 - 自然言語で表現された質問データに対する解答を出力する質問応答装置が備えるコンピュータに実行させるためのプログラムであって、
前記コンピュータに、
複数のキーワードを入力キーワードとして入力する処理と、
前記入力キーワードに基づいて、前記入力キーワードの数より多いキーワードを抽出して出力キーワードとして出力する処理と、
前記出力キーワードによって構成される質問に対する解答の候補である解答候補を、予め記憶された解答候補の検索対象である文書データ群から抽出する処理と、
前記抽出された各解答候補が質問と対応付けられた表を解答表として出力する処理とを実行させるための質問応答プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005354207A JP4849596B2 (ja) | 2005-12-08 | 2005-12-08 | 質問応答装置、質問応答方法および質問応答プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005354207A JP4849596B2 (ja) | 2005-12-08 | 2005-12-08 | 質問応答装置、質問応答方法および質問応答プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007157006A true JP2007157006A (ja) | 2007-06-21 |
JP4849596B2 JP4849596B2 (ja) | 2012-01-11 |
Family
ID=38241266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005354207A Expired - Fee Related JP4849596B2 (ja) | 2005-12-08 | 2005-12-08 | 質問応答装置、質問応答方法および質問応答プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4849596B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010157199A (ja) * | 2008-12-02 | 2010-07-15 | Mie Univ | 自動演習システム及び自動演習プログラム |
KR20170046611A (ko) * | 2014-08-21 | 2017-05-02 | 코쿠리츠켄큐카이하츠호진 죠호츠신켄큐키코 | 질문문 생성 장치 및 컴퓨터 프로그램 |
JP2019012379A (ja) * | 2017-06-30 | 2019-01-24 | 富士通株式会社 | 学習用データ生成プログラム、学習用データ生成装置及び学習用データ生成方法 |
KR20190082453A (ko) * | 2018-01-02 | 2019-07-10 | (주)뤼이드 | 기계학습 모델링을 위한 신규 학습 콘텐츠 분석 방법, 장치 및 컴퓨터 프로그램 |
JP2020042757A (ja) * | 2018-09-07 | 2020-03-19 | 株式会社フジクラ | 加工装置、加工方法、加工プログラム、及び検査装置 |
US20220261556A1 (en) * | 2018-10-16 | 2022-08-18 | Nippon Telegraph And Telephone Corporation | Utterance generation device, method, and program |
JP2022175251A (ja) * | 2021-05-13 | 2022-11-25 | 株式会社日立製作所 | 単語間スコア算出装置、質問応答抽出システム、及び単語間スコア算出方法 |
CN116739003A (zh) * | 2023-06-01 | 2023-09-12 | 中国南方电网有限责任公司 | 电网管理智能问答实现方法、装置、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002222147A (ja) * | 2001-01-26 | 2002-08-09 | Seiko Epson Corp | 掲示板式情報提供システム |
JP2005157524A (ja) * | 2003-11-21 | 2005-06-16 | National Institute Of Information & Communication Technology | 質問応答システムおよび質問応答処理方法 |
-
2005
- 2005-12-08 JP JP2005354207A patent/JP4849596B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002222147A (ja) * | 2001-01-26 | 2002-08-09 | Seiko Epson Corp | 掲示板式情報提供システム |
JP2005157524A (ja) * | 2003-11-21 | 2005-06-16 | National Institute Of Information & Communication Technology | 質問応答システムおよび質問応答処理方法 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010157199A (ja) * | 2008-12-02 | 2010-07-15 | Mie Univ | 自動演習システム及び自動演習プログラム |
KR20170046611A (ko) * | 2014-08-21 | 2017-05-02 | 코쿠리츠켄큐카이하츠호진 죠호츠신켄큐키코 | 질문문 생성 장치 및 컴퓨터 프로그램 |
KR102408082B1 (ko) | 2014-08-21 | 2022-06-13 | 코쿠리츠켄큐카이하츠호진 죠호츠신켄큐키코 | 질문문 생성 장치 및 컴퓨터 프로그램 |
US11354580B2 (en) | 2017-06-30 | 2022-06-07 | Fujitsu Limited | Non-transitory computer-readable storage medium, training data generation apparatus, and training data generation method |
JP2019012379A (ja) * | 2017-06-30 | 2019-01-24 | 富士通株式会社 | 学習用データ生成プログラム、学習用データ生成装置及び学習用データ生成方法 |
KR20190082453A (ko) * | 2018-01-02 | 2019-07-10 | (주)뤼이드 | 기계학습 모델링을 위한 신규 학습 콘텐츠 분석 방법, 장치 및 컴퓨터 프로그램 |
KR20200084816A (ko) * | 2018-01-02 | 2020-07-13 | (주)뤼이드 | 콜드 스타트를 해결하기 위한 신규 컨텐츠 분석 분석 방법, 장치 및 컴퓨터 프로그램 |
KR102269606B1 (ko) | 2018-01-02 | 2021-06-25 | (주)뤼이드 | 콜드 스타트를 해결하기 위한 신규 컨텐츠 분석 분석 방법, 장치 및 컴퓨터 프로그램 |
KR102117908B1 (ko) | 2018-01-02 | 2020-06-02 | (주)뤼이드 | 기계학습 모델링을 위한 신규 학습 콘텐츠 분석 방법, 장치 및 컴퓨터 프로그램 |
JP2020042757A (ja) * | 2018-09-07 | 2020-03-19 | 株式会社フジクラ | 加工装置、加工方法、加工プログラム、及び検査装置 |
JP7213701B2 (ja) | 2018-09-07 | 2023-01-27 | 株式会社フジクラ | 加工装置、加工方法、加工プログラム、及び検査装置 |
US20220261556A1 (en) * | 2018-10-16 | 2022-08-18 | Nippon Telegraph And Telephone Corporation | Utterance generation device, method, and program |
JP2022175251A (ja) * | 2021-05-13 | 2022-11-25 | 株式会社日立製作所 | 単語間スコア算出装置、質問応答抽出システム、及び単語間スコア算出方法 |
JP7261262B2 (ja) | 2021-05-13 | 2023-04-19 | 株式会社日立製作所 | 単語間スコア算出装置、質問応答抽出システム、及び単語間スコア算出方法 |
CN116739003A (zh) * | 2023-06-01 | 2023-09-12 | 中国南方电网有限责任公司 | 电网管理智能问答实现方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4849596B2 (ja) | 2012-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Al-Saleh et al. | Automatic Arabic text summarization: a survey | |
Nie et al. | Multimedia answering: enriching text QA with media information | |
JP4849596B2 (ja) | 質問応答装置、質問応答方法および質問応答プログラム | |
Murdock | Aspects of sentence retrieval | |
JP4778474B2 (ja) | 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体 | |
JP2005157524A (ja) | 質問応答システムおよび質問応答処理方法 | |
JP4911599B2 (ja) | 風評情報抽出装置及び風評情報抽出方法 | |
JP5229782B2 (ja) | 質問応答装置、質問応答方法、及びプログラム | |
JP2008287517A (ja) | 強調表示装置及びプログラム | |
Santhanavijayan et al. | Automatic generation of multiple choice questions for e-assessment | |
Wiegand et al. | Non-syntactic word prediction for AAC | |
Jones | Text and context: document storage and processing | |
JP4931114B2 (ja) | データ表示装置、データ表示方法及びデータ表示プログラム | |
JP2009237640A (ja) | 情報抽出装置、情報抽出方法および情報抽出プログラム | |
JP5182845B2 (ja) | 情報抽出装置、情報抽出方法及び情報抽出プログラム | |
Molino et al. | Distributed representations for semantic matching in non-factoid question answering. | |
Greevy | Automatic text categorisation of racist webpages | |
JP4919386B2 (ja) | 情報抽出・表示装置 | |
Goh et al. | An assessment of substitute words in the context of academic writing proposed by pre-trained and specific word embedding models | |
Zhuang | Architecture of Knowledge Extraction System based on NLP | |
Perez-Tellez et al. | Weblog and short text feature extraction and impact on categorisation | |
Al-sharman et al. | Generating summaries through selective part of speech tagging | |
Makkonen | Semantic classes in topic detection and tracking | |
Solorio et al. | Question classification in Spanish and Portuguese | |
Huetle Figueroa et al. | On detecting keywords for concept mapping in plain text |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081114 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090428 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090428 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110329 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110712 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110829 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111011 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111014 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141028 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |