JP2002132811A - 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体 - Google Patents

質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体

Info

Publication number
JP2002132811A
JP2002132811A JP2000319998A JP2000319998A JP2002132811A JP 2002132811 A JP2002132811 A JP 2002132811A JP 2000319998 A JP2000319998 A JP 2000319998A JP 2000319998 A JP2000319998 A JP 2000319998A JP 2002132811 A JP2002132811 A JP 2002132811A
Authority
JP
Japan
Prior art keywords
document
answer
question
question sentence
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000319998A
Other languages
English (en)
Inventor
Yutaka Sasaki
裕 佐々木
Hideki Isozaki
秀樹 磯崎
Hiroyori Taira
博順 平
Hideto Kazawa
秀人 賀沢
Keiichi Hirota
啓一 廣田
Hiroyuki Nakajima
浩之 中島
Tsutomu Hirao
努 平尾
Tsuneaki Kato
恒昭 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000319998A priority Critical patent/JP2002132811A/ja
Publication of JP2002132811A publication Critical patent/JP2002132811A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 文書集合が与えられると質問文に対する回答
とその文書を出力できるようにする。 【解決手段】 文書集合と質問文が与えられると、質問
文に対する回答と文書の列を出力する質問応答システム
であって、文書集合を格納する文書集合格納装置100
と、質問文を受けとる入力装置102と、入力装置から
得られた質問文から検索語集合と質問種別を判定する質
問解析装置104と、前記検索語集合と質問種別に従っ
て、文書集合格納装置に格納された文書集合から関連文
書集合を検索する文書検索装置106と、関連文書集合
中の各文書から質問文に対する回答を抽出し、該回答と
該回答を抽出した文書の列を質問文に対する応答結果と
して作成する回答抽出装置108と、応答結果を出力す
る出力装置110とを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自然言語処理シス
テム、言語処理システム、知識処理システム、情報検索
システム、情報抽出システム等に用いられ、質問文に対
する回答を出力する質問応答方法、質問応答システム及
び質問応答プログラムを記録した記録媒体に関する。
【0002】
【従来の技術】従来の情報検索技術は、与えられた文書
集合から、ユーザの入力した質問に合致する文書の集合
を取り出すものであった。また、従来の情報抽出技術
は、与えられた1つの文書について、分野ごとに予め決
められた項目を抽出するものであった。従来の日本語質
問応答システムは、回答として単語や単語の列を出力し
ていたが、その回答の元となる記事を同時に出力してい
なかった。
【0003】さらに、固有名詞の抽出技術の利用や、質
問文に対する回答を含む可能性のある文書を検索する際
の文書スコア、及び回答を抽出する際の抽出スコアの両
方スコアを総合的に用いて、質問に対して出力する回答
と文書の列の順序を決める等の、回答の精度を向上させ
るための工夫が行なわれていなかった。
【0004】
【発明が解決しようとする課題】まず、従来の情報検索
技術は質問に対する結果を文書の単位で応答するため、
ユーザが文書の内容を読まなければならない。例えば、
「日本の首相は誰ですが?」という質問に対して、返っ
てきた結果に含まれる文書を読むことにより初めて、
「森首相」という答が判る。文書を読まなければならな
いことは「森首相」といった直接的な回答が欲しいユー
ザにとっては非常に煩わしいという問題が有った。
【0005】次に、従来の情報抽出技術は、予め決めら
れた特定の分野でしか使えないため、任意の質問文に対
する回答を出力する質問応答システムでは使えない。従
来の日本語質問応答システムは、回答として単語や単語
の列を出力していたが、回答の元となる記事を返してい
なかったため、回答を裏付ける情報をユーザが得ること
ができながった。例えば、「ジンバブエの大統領は誰で
すか?」という質問に対して、「ムガべ大統領」と回答
が返ってきても、ユーザが本当に「ムガべ大統領」が正
しいがどうかを確認できないという問題が有った。
【0006】本発明はこのような事情に鑑みてなされた
ものであり、質問文に対する直接的な回答とその回答の
元となる文書を提示することにより回答の信頼性をユー
ザが確認することができる質問応答方法、質問応答シス
テム及び質問応答プログラムを記録した記録媒体を提供
することを目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、請求項1に記載の発明は、文書集合と質問文が与え
られると、該質問文に対する回答と文書の列を出力する
コンピュータシステムを使用した質問応答方法であっ
て、入力された質問文から検索語集合と質問種別を判定
し、該検索語集合および該質問種別に従って、前記与え
られた文書集合から関連文書集合を検索し、該関連文書
集合の各文書から回答を抽出し、該回答と該回答を抽出
した文書の列を前記質問文に対する応答結果として出力
することを特徴とする。
【0008】請求項1に記載の発明によれば、入力され
た質問文から検索語集合と質問種別を判定し、該検索語
集合および該質問種別に従って、前記与えられた文書集
合から関連文書集合を検索し、該関連文書集合の各文書
から回答を抽出し、該回答と該回答を抽出した文書の列
を前記質問文に対する応答結果として出力するようにし
たので、質問文に対する直接的な回答とその回答の元と
なる文書を提示することにより回答の信頼性をユーザが
確認することができる。
【0009】また請求項2に記載の発明は、請求項1に
記載の質問応答方法において、前記関連文書集合の要素
は文書全体ではなく、文書の一部として前記文書集合か
ら前記関連文書集合を検索することを特徴とする。
【0010】請求項2に記載の発明によれば、請求項1
に記載の質問応答方法において、前記関連文書集合の要
素は文書全体ではなく、文書の一部として前記文書集合
から前記関連文書集合を検索するようにしたので、直接
的な回答が得られる。
【0011】また、請求項3に記載の発明は、請求項1
または2のいずれかに記載の質問応答方法において、前
記関連文書集合を検索する際に計算した各文書のスコア
である文書スコアと前記関連文書集合の各文書から回答
を抽出する際に計算した抽出スコアの2つのスコアに従
って、回答と文書の列を順序付けることを特徴とする。
【0012】請求項3に記載の発明によれば、請求項1
または2のいずれかに記載の質問応答方法において、前
記関連文書集合を検索する際に計算した各文書のスコア
である文書スコアと前記関連文書集合の各文書から回答
を抽出する際に計算した抽出スコアの2つのスコアに従
って、回答と文書の列を順序付けるようにしたので、質
問文に対する回答の精度の向上が図れる。
【0013】また、請求項4に記載の発明は、請求項1
乃至3のいずれかに記載の質問応答方法において、前記
関連文書集の各文書から回答を抽出する際に、固有名詞
や数値表現の認識を行なうことを特徴とする。
【0014】請求項4に記載の発明によれば、請求項1
乃至3のいずれかに記載の質問応答方法において、前記
関連文書集の各文書から回答を抽出する際に、固有名詞
や数値表現の認識を行なうようにしたので、質問文に対
する精度の向上が図れる。
【0015】また、請求項5に記載の発明は、文書集合
と質問文が与えられると、該質問文に対する回答と文書
の列を出力する質問応答システムであって、文書集合を
格納する文書集合格納装置と、質問文を受けとる入力装
置と、該入力装置から得られた前記質問文から検索語集
合と質問種別を判定する質問解析装置と、前記検索語集
合と質問種別に従って、前記文書集合格納装置に格納さ
れた文書集合から関連文書集合を検索する文書検索装置
と、関連文書集合中の各文書から質問文に対する回答を
抽出し、該回答と該回答を抽出した文書の列を前記質問
文に対する応答結果として作成する回答抽出装置と、前
記応答結果を出力する出力装置とを有することを特徴と
する。
【0016】請求項5に記載の発明によれば、文書集合
を格納する文書集合格納装置と、質問文を受けとる入力
装置と、該入力装置から得られた前記質問文から検索語
集合と質問種別を判定する質問解析装置と、前記検索語
集合と質問種別に従って、前記文書集合格納装置に格納
された文書集合から関連文書集合を検索する文書検索装
置と、関連文書集合中の各文書から質問文に対する回答
を抽出し、該回答と該回答を抽出した文書の列を前記質
問文に対する応答結果として作成する回答抽出装置と、
前記応答結果を出力する出力装置とを有するので、質問
文に対する直接的な回答とその回答の元となる文書を提
示することにより回答の信頼性をユーザが確認すること
ができる。
【0017】また、請求項6に記載の発明は、請求項5
に記載の質問応答システムにおいて、前記文書検索装置
は、関連文書集合の要素を文書全体ではなく、文書の一
部として前記文書集合から前記関連文書集合を検索する
ことを特徴とする。
【0018】請求項6に記載の発明によれば、請求項5
に記載の質問応答システムにおいて、前記文書検索装置
は、関連文書集合の要素を文書全体ではなく、文書の一
部として前記文書集合から前記関連文書集合を検索する
ので、直接的な回答が得られる。
【0019】また、請求項7に記載の発明は、請求項5
または6のいずれかに記載の質問応答システムにおい
て、前記回答抽出装置は、前記文書検索装置が関連文書
集合を検索する際に計算した各文書のスコアである文書
スコアと前記回答抽出装置が前記関連文書集合の各文書
から回答を抽出する際に計算した抽出スコアの2つのス
コアに従って、回答と文書の列を順序付けることを特徴
とする。
【0020】請求項7に記載の発明によれば、請求項5
または6のいずれかに記載の質問応答システムにおい
て、前記回答抽出装置は、前記文書検索装置が関連文書
集合を検索する際に計算した各文書のスコアである文書
スコアと前記回答抽出装置が前記関連文書集合の各文書
から回答を抽出する際に計算した抽出スコアの2つのス
コアに従って、回答と文書の列を順序付けるようにした
ので、質問文に対する回答の精度の向上が図れる。
【0021】また、請求項8に記載の発明は、請求項5
乃至7のいずれかに記載の質問応答システムにおいて、
前記回答抽出装置は、前記関連文書集合の各文書から回
答を抽出する際に、固有名詞や数値表現の認識を行なう
ことを特徴とする。
【0022】請求項8に記載の発明によれば、請求項5
乃至7のいずれかに記載の質問応答システムにおいて、
前記回答抽出装置は、前記関連文書集合の各文書から回
答を抽出する際に、固有名詞や数値表現の認識を行なう
ので、質問文に対する回答の精度の向上が図れる。
【0023】また、請求項9に記載の発明は、文書集合
と質問文が与えられると、該質問文に対する回答と文書
の列を出力する質問応答を行うための質問応答プログラ
ムを記録したコンピュータ読み取り可能な記録媒体にお
いて、質問文を受け取る第1のステップと、入力された
質問文から検索語集合と質問種別を判定する第2のステ
ップと、前記検索語集合および質問種別に従って、前記
与えられた文書集合から関連文書集合を検索する第3の
ステップと、前記関連文書集合の各文書から回答を抽出
し、該回答と該回答を抽出した文書の列を作成する第4
のステップと、前記回答と該回答を抽出した文書の列を
前記質問文に対する応答結果として出力するステップと
をコンピュータに実行させる質問応答プログラムを記録
した記録媒体を要旨とする。
【0024】請求項9に記載の発明によれば、文書集合
と質問文が与えられると、該質問文に対する回答と文書
の列を出力する質問応答を行うための質問応答プログラ
ムを記録したコンピュータ読み取り可能な記録媒体にお
いて、質問文を受け取る第1のステップと、入力された
質問文から検索語集合と質問種別を判定する第2のステ
ップと、前記検索語集合および質問種別に従って、前記
与えられた文書集合から関連文書集合を検索する第3の
ステップと、前記関連文書集合の各文書から回答を抽出
し、該回答と該回答を抽出した文書の列を作成する第4
のステップと、前記回答と該回答を抽出した文書の列を
前記質問文に対する応答結果として出力する第5のステ
ップとをコンピュータに実行させる質問応答プログラム
を記録媒体に記録したので、この記録媒体に記録した質
問応答プログラムをコンピュータシステムに読み込ま
せ、実行することにより、質問文に対する直接的な回答
とその回答の元となる文書を提示することにより回答の
信頼性をユーザが確認することができる。
【0025】
【発明の実施の形態】以下、本発明の実施の形態を、図
面を参照して詳細に説明する。図1に本発明の実施の形
態に係る質問応答システムの構成を示す。本発明の実施
の形態に係る質問応答システムは、質問文に対する直接
的な回答として文書の一部を取り出すとともに、回答を
取り出した文書をユーザに出力することにより、回答の
信頼性をユーザが確認できるようにしている。
【0026】また、固有名詞の抽出技術や、与えられた
文書集合から関連文書を検索する際における文書スコア
および関連文書集合から回答を抽出する際における抽出
スコアの両方を総合的に用いて評価することより、出力
する回答と文書の列の順序を決めることにより、質問に
対する正しい回答を回答と文書の列のより上位に並べる
ことを可能にしている。
【0027】すなわち、本発明の実施の形態に係る質問
応答システムは、文書集合と質問文が与えられると、該
質問文に対する回答と文書の列を出力するコンピュータ
システムを使用した質問応答方法であって、入力された
質問文から検索語集合と質問種別を判定し、該検索語集
合および該質問種別に従って、前記与えられた文書集合
から関連文書集合を検索し、該関連文書集合の各文書か
ら回答を抽出し、該回答と該回答を抽出した文書の列を
前記質問文に対する応答結果として出力することを特徴
とする質問応答方法を実施するための装置である。
【0028】図1において、本発明に係る質問応答シス
テム10は、与えられた文書集合を格納する文書集合格
納装置100と、質問文を受け取る入力装置102と、
質問文を解析し、上記質問文から検索語集合と質問種別
を判定する質問解析装置104と、検索語集合と質問種
別に従って文書集合格納装置100に格納されている文
書集合から関連文書集合を検索する文書検索装置106
と、関連文書集合から上記質問文に対する回答を抽出
し、該回答と該回答を通出した文書の列を上記質問文に
対する応答結果として作成する回答抽出装置108と、
上記応答結果を出力する出力装置110とを有してい
る。
【0029】上記構成からなる本実施の形態に係る質問
応答システム10の処理内容を図2に示すフローチャー
トに基づいて説明する。まず、文書集合格納装置100
に、与えられた文書の集合が格納される(ステップ20
0)。入力装置102は、質問文が入力されると、その
質問文を質問解析装置104に渡す(ステップ20
1)。質問解析装置104は質問文に対して形態素解析
を行い、質問文から検索語集合と質問種別を判定し、検
索語集合と質問種別を文書検索装置106に渡す(ステ
ップ202)。
【0030】文書検索装置106は質問解析装置104
から受け取った検索語集合と質問種別に従って、文書集
合格納装置2に格納された文書集合を検索し、関連文書
集合を抽出し、該関連文書集合の各文書に対して検索語
が含まれている度合いを示す文書スコアを算出し、上記
関連文書集合を、検索語集合及び質問種別と共に回答抽
出装置108へ渡す(ステップ203)。
【0031】回答抽出装置108は文書検索装置106
から受け取った関連文書集合中の各文書について形態素
解析を行う(ステップ204)。そして回答抽出装置1
08は、形態素解析を行った各文書に対して質問種別に
従った単語を抽出対象とし、抽出すると共に(ステップ
205)、上記抽出対象についてその抽出対象が含まれ
る文書中における検索語との距離に基づいて抽出スコア
を算出する(ステップ206)。
【0032】次いで、回答抽出装置108は、文書検索
装置106で算出した文書スコアと上記抽出スコアに従
って、上記関連文書集合中の各文書から質問文に対する
回答を抽出し、この回答と、この回答を抽出した元とな
る文書の列を取り出し、回答及び文書の列の順序付けを
行う(207)。そして回答抽出装置108は、順序付
けを行った回答及び文書を示す文書番号の列を応答結果
として出力装置110へ渡す。出力装置110は回答と
その文書番号の列を応答結果として出力する(ステップ
208)。
【0033】なお、本実施の形態に係る質問応答システ
ムを構成する各装置は論理的につながっていればよく、
各装置が1台のコンピュータの上で通信しながら動く独
立したプロセスとして実装されていても良いし、ネット
ワークで接続された複数のコンピュータに分散されて実
装されていても良い。
【0034】次に、本発明の実施の形態に係る質問応答
システムの具体的動作について説明する。以下では、例
として、質問文Q1「アメリカの大統領は誰ですか?」
に対して、回答「クリントン」と記事番号「D1」を得
る例を述べる。まず、文書集合が表1に示すように、3
つの文書D1、D2、D3からなるとする。
【表1】 本発明の実施の形態では、説明を容易にするため、文書
を1文だけで記述しているが、複数の文書からなる文書
でもよい。また、質問文を1つ受けて、回答とその文書
の列を返す例を述べているが、これを繰り返すことによ
り、質問と回答を繰り返すことができる。
【0035】まず、文書集合格納装置100に文書D
1、D2、D3を格納する。ここでは、表形式で表現し
ているが、格納の方法は文書が格納できればリストやデ
ータベースなどの他の方法であっても何でもよい。以
下、表形式でデータを表した時には同様のことが言え
る。
【0036】入力装置102は、質問文を受けとり、質
問解析装置104へ渡す。まず、質問解析装置104
は、質問文の質問種別を判定する。本実施の形態では、
質問種別は人名を聞くwho,場所を聞くwhere,
日時を聞くwhenの3種類とする。なお、この他の物
の名前を聞くwhatや、方法を聞くhowなどの質問
種別があったとしても、同様な方法で質問種別を判定す
ることができる。
【0037】質問種別の判定には、表2に示すような判
定表現を持つ判定表を用いる。なお、判定表現は質問の
種別を分けるために使える語であれば、他の語でもよ
い。
【表2】 判定表現が質問文Q1に含まれるかどうかをチェック
し、判定表現が含まれる質問種別をQ1の質問種別QT
とする。Q1には「誰」が含まれるので、Q1の質問種
別はwhoとなる。
【0038】質問解析装置104は、質問文を形態素解
析し、単語に分けるとともに、品詞の情報を得る。形態
素解析の手法は例えば文献(長尾真編:自然言語処理、
岩波書店、1996)に述べられている。形態素解析
は、辞書に含まれる単語が文に現れるかどうかを調べ、
文を辞書にある単語の列に分割し、辞書に書かれている
各単語の品詞のうち、前後の単語の関係から最適な品詞
を選択することにより実現される。
【0039】現在の例では、「アメリカの大統領は誰で
すか?」は、表3のように形態素解析されるとする。
【表3】 なお、ここで品詞名は言語学や自然言語処理において利
用されるものであれば何でもよい。例えば、普通名詞を
一般名詞と表現してもよい。このうち、普通名詞、固有
名詞などの自立語を検索語集合KWとする。
【0040】上記質問文から検索語集合KWは、 KW={アメリカ、大統領} (1) と書ける。ここで、自立語のみを検索語集合とするの
は、説明の簡単化と検索精度の向上を図るためであるの
で、すべての単語を検索語集合にしたり、他の選択法に
よって検索語集合を選択したりしてもかまわない。
【0041】質問解析装置104は検索語集合KWと質
問種別QTを文書検索装置106に渡す。文書検索装置
106は、検索語集合KWがより多く含まれる文書を文
書集合格納装置100に格納されている文書集合から探
す。検索語集合の含まれている数を数え、それを各文書
(文書番号で表される。)の文書スコアとする。この結
果を表4に示す。
【表4】
【0042】文書番号D1の文書には「アメリカ」、
「大統領」の2つの検索語集合の要素が含まれるので、
文書番号D1の文書の文書スコアは2となる。また、文
書番号D2の文書スコアは、検索語集合の要素である
「大統領」しか含まないので文書スコアは1となる。さ
らに、文書番号D3の文書は、検索語集合の要素を含ま
ないので文書スコアは0である。
【0043】文書検索装置106は文書スコアが0より
大きい文書を関連文書集合RDとする。したがって、 RD={D1,D2} (2) となる。なお、文書スコアの計算法はIDF法やTFI
DF法など、当業界において用いられる方法ならなんで
もよい。IDF法やTFIDF法の計算式や検索の高速
化のためのインデックス作成法は、例えば、文献(徳永
健伸:情報検索と言語処理、東京大学出版会、1999
年)に述べられている。
【0044】また、ここでは文書スコアの計算には、各
文書中に検索語集合の要素が現れるかどうかを文書中の
文字で調べたが、文書を形態素解析し、単語に分けてか
ら文書中の単語と検索語を比較してもよい。さらに、文
書全体を1まとまりとしなくても、文書の各段落を検索
の単位としたり、100文字といったパッセージを検索
の単位としてもよい。文書検索装置106は関連文書集
合RDを、検索語集合及び質問種別と共に、回答抽出装
置108に渡す。なお、関連文書集合RDは文書全体を
渡しても良いし、文書の名前だけを渡してもよい。
【0045】回答抽出装置108は、関連文書集合RD
中の文書を形態素解析する。文書番号D1と文書番号D
2の各文書の形態素解析結果をそれぞれ表5、表6に示
す。
【0046】次に固有表現抽出法により、文書中の各単
語が<人名>、<地名>、<日時>という3種類の固有
表現のどれかに該当するかどうかを判定し、該当する場
合はその種別を単語に付与する。基本的には固有名詞の
辞書と周囲の単語により人名、地名、日時であるかを判
定する。固有表現の抽出法については、例えば特開平1
1−067562に記載されている。固有表現の判定後
の結果を表7、表8に示す。
【0047】
【表5】
【表6】
【0048】回答抽出装置108は、質問種別に従って
単語を抽出対象とする。whoの場合は品詞・固有表現
が<人名>である単語を抽出対象とし、whereの場
合は品詞・固有表現が<場所>である単語を抽出対象と
し、whenの場合は品詞・固有表現が<日時>である
単語を抽出対象とする。但し、質問種別に対応する抽出
対象はこれに限るわけではない。例えば、whereの
抽出対象に組職名を加えても良い。また、“「我輩は猫
である」”のようなカギ括弧で括られた部分を抽出対象
に加えても良い。
【0049】
【表7】
【表8】
【0050】本実施の形態の場合は、質問種別がwho
であるので、文書番号D1の文書における単語「森」、
「クリントン」、文書番号D2の文書における単語「プ
ーチン」が抽出対象となる。これらの抽出対象につい
て、検索語KWとの距離を使って抽出スコアを計算す
る。ここでは、抽出対象と検索語KWの各要素が何単語
離れて出現するかを求めそれを距離とし、各要素につい
て求められた距離の逆数の和を抽出スコアとする。
【0051】具体的には、単語間の距離は2つの単語の
単語番号の差の絶対値とする。文書番号D1の文書にお
ける単語「森」は単語「アメリカ」と5単語、単語「大
統領」と6単語離れているので単語「森」の抽出スコア
は1/5+1/6=0.37となる。また、文書番号D1の
文書「クリントン」は「アメリカ」と2単語、「大統
領」と3単語離れているので「クリントン」の抽出スコ
アは1/2+1/3=0.83となる。さらに、文書番号D
1の文書における単語「プーチン」は単語「大統領」と
1単語離れているので単語「プーチン」の抽出スコアは
1となる。なお、抽出スコアの計算は当業界で使われる
ものであれば、他のものでもよい。
【0052】次に、回答抽出装置108は、各文書中の
抽出対象について、総合スコアを次のような総合計算式
で求める。 総合スコア=a×文書スコア+b×抽出スコア (3) 但し、a、bはそれぞれ文書スコア、抽出スコアの重み
を表すパラメータであり様々な定め方がある。ここで
は、a=1,b=1とする。なお、スコアの計算法は当
業界で用いられるものであれば他の方法でも構わない。
【0053】例えば、a、b、c、dをパラメータとし
て、 総合スコア=a×文書スコア+b×段落スコア+c×文スコア+d ×抽出スコア (4) のように多段化してもよい。ここで、文書スコアの「文
書」は、読点で区切られた複数の文書の集合体であり、
文スコアの「文」は、読点までをひとかたまりとした文
字列の集合体である。各文書中の抽出対象についての抽
出スコア、文書スコア、総合スコアを計算した結果を表
9に示す。
【0054】
【表9】
【0055】さらに、回答抽出装置108は、抽出対象
の総合スコアの大きい順に抽出対象を回答とし、その文
書番号を出力装置110に渡し、結果を出力する。ここ
では、次ように出力される。 1.回答=「クリントン」、文書=D1 2.回答=「森」、文書=D1 3.回答=「プーチン」、文書=D2 なお、出力の形式は同じ内容を表していれば、他の形式
でもよい。このようにして、文書集合と「アメリカ大統
領は誰ですか?」という入力文が与えられると、それに
対する答えを文書集合から取り出し、回答とその回答を
含む文書の列として出力された。
【0056】尚、図2に示す処理内容を質問応答プログ
ラムとして作成し、このプログラムをコンピュータによ
り読み取り可能な記録媒体に記録し、この記録媒体を使
用することによりコンピュータシステムに質問応答プロ
グラムを実行させることにより質問応答システムの機能
を実現するようにしてもよい。
【0057】すなわち、文書集合と質問文が与えられる
と、該質問文に対する回答と文書の列を出力する質問応
答を行うための質問応答プログラムを記録したコンピュ
ータ読み取り可能な記録媒体において、質問文を受け取
る第1のステップと、入力された質問文から検索語集合
と質問種別を判定する第2のステップと、前記検索語集
合および質問種別に従って、前記与えられた文書集合か
ら関連文書集合を検索する第3のステップと、前記関連
文書集合の各文書から回答を抽出し、該回答と該回答を
抽出した文書の列を作成する第4のステップと、前記回
答と該回答を抽出した文書の列を前記質問文に対する応
答結果として出力する第5のステップとをコンピュータ
に実行させる質問応答プログラムを記録媒体に記録し、
この記録媒体に記録した質問応答プログラムをコンピュ
ータシステムに読み込ませ、実行することにより、質問
応答システムの機能を実現するようにしてもよい。
【0058】なお、ここでいう「コンピュータシステ
ム」とは、OSや周辺機器等のハードウェアを含むもの
とする。また、「コンピュータ読み取り可能な記録媒
体」とは、フロッピー(登録商標)ディスク、光磁気デ
ィスク、ROM、CD−ROM等の可般媒体、コンピュ
ータシステムに内蔵されるハードディスク等の記憶装置
のことをいう。
【0059】さらに「コンピュータ読み取り可能な記録
媒体」とは、インターネット等のネットワークや電話回
線等の通信回線を介してプログラムを送信する場合の通
信線のように、短時間の間、動的にプログラムを保持す
るもの(伝送媒体ないしは伝送波)、その場合のサーバ
やクライアントとなるコンピュータシステム内部の揮発
性メモリのように、一定時間プログラムを保持している
ものも含むものとする。
【0060】また上記プログラムは、前述した機能の一
部を実現するためのものであっても良く、さらに前述し
た機能をコンピュータシステムにすでに記録されている
プログラムとの組み合わせで実現できるもの、所謂差分
ファイル(差分プログラム)であっても良い。
【0061】以上説明したように、本発明の実施の形態
に係る質問応答方法、質問応答システム及び質問応答プ
ログラムを記録した記録媒体によれば、自然言語で表現
された質問文に対する回答を求めることが可能となる。
また、本発明の実施の形態に係る質問応答方法、質問応
答システム及び質問応答プログラムを記録した記録媒体
によれば、質問文に対する直接的な回答とその回答のも
とになる文書が求められるので、ユーザが直接回答を得
るとともに、その回答の根拠を文書でチェックできる。
【0062】従来の情報検索技術では、文書全体の列が
提示されるため、上記実施の形態において質問文の内容
である「大統領の名前」は、ユーザが文書を読んで初め
て見つけることができたにすぎない。また、従来の情報
抽出技術は分野に依存していたため、自由な質問文に対
する答えを抽出することはできなかった。従来の質問応
答システムは、回答ととも文書を提示していなかったの
で、ユーザが回答の正しさを計ることができなかった。
【0063】さらに、従来の質問応答システムでは、日
本語の処理に必要な単語分けを含む形態素解析を行なっ
ていなかったり、固有表現の抽出を行なっていなかった
り、抽出対象のスコアを評価する際に検索時のスコアを
利用したりしていなかったため、回答の精度が低くなっ
ていた。
【0064】例えば、実施例において、検索スコアを無
視して、総合スコアを抽出スコアとすると、回答の列の
順序が、「プーチン」「クリントン」「森」の順になっ
てしまう。また、形態素解析や固有表現の抽出を行なわ
ないと、抽出対象の単語が決まらず、回答の精度が低く
なる。本発明の実施の形態に係る質問応答方法、質問応
答システム及び質問応答プログラムを記録した記録媒体
は、このような問題を解決し、質問文に対する回答とそ
の文書の列をユーザに提示できる効果がある。
【0065】
【発明の効果】以上に説明したように、請求項1に記載
の発明によれば、入力された質問文から検索語集合と質
問種別を判定し、該検索語集合および該質問種別に従っ
て、前記与えられた文書集合から関連文書集合を検索
し、該関連文書集合の各文書から回答を抽出し、該回答
と該回答を抽出した文書の列を前記質問文に対する応答
結果として出力するようにしたので、質問文に対する直
接的な回答とその回答の元となる文書を提示することに
より回答の信頼性をユーザが確認することができる。
【0066】請求項2に記載の発明によれば、請求項1
に記載の質問応答方法において、前記関連文書集合の要
素は文書全体ではなく、文書の一部として前記文書集合
から前記関連文書集合を検索するようにしたので、直接
的な回答が得られる。
【0067】請求項3に記載の発明によれば、請求項1
または2のいずれかに記載の質問応答方法において、前
記関連文書集合を検索する際に計算した各文書のスコア
である文書スコアと前記関連文書集合の各文書から回答
を抽出する際に計算した抽出スコアの2つのスコアに従
って、回答と文書の列を順序付けるようにしたので、質
問文に対する回答の精度の向上が図れる。
【0068】請求項4に記載の発明によれば、請求項1
乃至3のいずれかに記載の質問応答方法において、前記
関連文書集の各文書から回答を抽出する際に、固有名詞
や数値表現の認識を行なうようにしたので、質問文に対
する精度の向上が図れる。
【0069】請求項5に記載の発明によれば、文書集合
を格納する文書集合格納装置と、質問文を受けとる入力
装置と、該入力装置から得られた前記質問文から検索語
集合と質問種別を判定する質問解析装置と、前記検索語
集合と質問種別に従って、前記文書集合格納装置に格納
された文書集合から関連文書集合を検索する文書検索装
置と、関連文書集合中の各文書から質問文に対する回答
を抽出し、該回答と該回答を抽出した文書の列を前記質
問文に対する応答結果として作成する回答抽出装置と、
前記応答結果を出力する出力装置とを有するので、質問
文に対する直接的な回答とその回答の元となる文書を提
示することにより回答の信頼性をユーザが確認すること
ができる。
【0070】請求項6に記載の発明によれば、請求項5
に記載の質問応答システムにおいて、前記文書検索装置
は、関連文書集合の要素を文書全体ではなく、文書の一
部として前記文書集合から前記関連文書集合を検索する
ので、直接的な回答が得られる。
【0071】請求項7に記載の発明によれば、請求項5
または6のいずれかに記載の質問応答システムにおい
て、前記回答抽出装置は、前記文書検索装置が関連文書
集合を検索する際に計算した各文書のスコアである文書
スコアと前記回答抽出装置が前記関連文書集合の各文書
から回答を抽出する際に計算した抽出スコアの2つのス
コアに従って、回答と文書の列を順序付けるようにした
ので、質問文に対する回答の精度の向上が図れる。
【0072】請求項8に記載の発明によれば、請求項5
乃至7のいずれかに記載の質問応答システムにおいて、
前記回答抽出装置は、前記関連文書集合の各文書から回
答を抽出する際に、固有名詞や数値表現の認識を行なう
ので、質問文に対する回答の精度の向上が図れる。請求
項8に記載の発明によれば、請求項5乃至7のいずれか
に記載の質問応答システムにおいて、前記回答抽出装置
は、前記関連文書集合の各文書から回答を抽出する際
に、固有名詞や数値表現の認識を行なうので、質問文に
対する回答の精度の向上が図れる。
【0073】請求項9に記載の発明によれば、文書集合
と質問文が与えられると、該質問文に対する回答と文書
の列を出力する質問応答を行うための質問応答プログラ
ムを記録したコンピュータ読み取り可能な記録媒体にお
いて、質問文を受け取る第1のステップと、入力された
質問文から検索語集合と質問種別を判定する第2のステ
ップと、前記検索語集合および質問種別に従って、前記
与えられた文書集合から関連文書集合を検索する第3の
ステップと、前記関連文書集合の各文書から回答を抽出
し、該回答と該回答を抽出した文書の列を作成する第4
のステップと、前記回答と該回答を抽出した文書の列を
前記質問文に対する応答結果として出力する第5のステ
ップとをコンピュータに実行させる質問応答プログラム
を記録媒体に記録したので、この記録媒体に記録した質
問応答プログラムをコンピュータシステムに読み込ま
せ、実行することにより、質問文に対する直接的な回答
とその回答の元となる文書を提示することにより回答の
信頼性をユーザが確認することができる。
【図面の簡単な説明】
【図1】 本発明の実施の形態に係る質問応答システム
の構成を示すブロック図。
【図2】 図1に示す質問応答システムの処理内容を示
すフローチャート。
【符号の説明】
10 質問応答システム 100 文書集合格納装置 102 入力装置 104 質問解析装置 106 文書検索装置 108 回答抽出装置 110 出力装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 平 博順 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 賀沢 秀人 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 廣田 啓一 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 中島 浩之 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 平尾 努 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 加藤 恒昭 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B075 ND03 NK32 PP24 PQ02 PQ74 5B091 AA11 AB06 CA02

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 文書集合と質問文が与えられると、該質
    問文に対する回答と文書の列を出力するコンピュータシ
    ステムを使用した質問応答方法であって、 入力された質問文から検索語集合と質問種別を判定し、
    該検索語集合および該質問種別に従って、前記与えられ
    た文書集合から関連文書集合を検索し、該関連文書集合
    の各文書から回答を抽出し、該回答と該回答を抽出した
    文書の列を前記質問文に対する応答結果として出力する
    ことを特徴とする質問応答方法。
  2. 【請求項2】 前記関連文書集合の要素は文書全体では
    なく、文書の一部として前記文書集合から前記関連文書
    集合を検索することを特徴とする請求項1に記載の質問
    応答方法。
  3. 【請求項3】 前記関連文書集合を検索する際に計算し
    た各文書のスコアである文書スコアと前記関連文書集合
    の各文書から回答を抽出する際に計算した抽出スコアの
    2つのスコアに従って、回答と文書の列を順序付けるこ
    とを特徴とする請求項1または2のいずれかに記載の質
    問応答方法。
  4. 【請求項4】 前記関連文書集の各文書から回答を抽出
    する際に、固有名詞や数値表現の認識を行なうことを特
    徴とする請求項1乃至3のいずれかに記載の質問応答方
    法。
  5. 【請求項5】 文書集合と質問文が与えられると、該質
    問文に対する回答と文書の列を出力する質問応答システ
    ムであって、 文書集合を格納する文書集合格納装置と、 質問文を受けとる入力装置と、 該入力装置から得られた前記質問文から検索語集合と質
    問種別を判定する質問解析装置と、 前記検索語集合と質問種別に従って、前記文書集合格納
    装置に格納された文書集合から関連文書集合を検索する
    文書検索装置と、 関連文書集合中の各文書から質問文に対する回答を抽出
    し、該回答と該回答を抽出した文書の列を前記質問文に
    対する応答結果として作成する回答抽出装置と、 前記応答結果を出力する出力装置と、 を有することを特徴とする質問応答システム。
  6. 【請求項6】 前記文書検索装置は、関連文書集合の要
    素を文書全体ではなく、文書の一部として前記文書集合
    から前記関連文書集合を検索することを特徴とする請求
    項5に記載の質問応答システム。
  7. 【請求項7】 前記回答抽出装置は、前記文書検索装置
    が関連文書集合を検索する際に計算した各文書のスコア
    である文書スコアと前記回答抽出装置が前記関連文書集
    合の各文書から回答を抽出する際に計算した抽出スコア
    の2つのスコアに従って、回答と文書の列を順序付ける
    ことを特徴とする請求項5または6のいずれかに記載の
    質問応答システム。
  8. 【請求項8】 前記回答抽出装置は、前記関連文書集合
    の各文書から回答を抽出する際に、固有名詞や数値表現
    の認識を行なうことを特徴とする請求項5乃至7のいず
    れかに記載の質問応答システム。
  9. 【請求項9】 文書集合と質問文が与えられると、該質
    問文に対する回答と文書の列を出力する質問応答を行う
    ための質問応答プログラムを記録したコンピュータ読み
    取り可能な記録媒体において、 質問文を受け取る第1のステップと、 入力された質問文から検索語集合と質問種別を判定する
    第2のステップと、 前記検索語集合および質問種別に従って、前記与えられ
    た文書集合から関連文書集合を検索する第3のステップ
    と、 前記関連文書集合の各文書から回答を抽出し、該回答と
    該回答を抽出した文書の列を作成する第4のステップ
    と、 前記回答と該回答を抽出した文書の列を前記質問文に対
    する応答結果として出力する第5のステップと、 をコンピュータに実行させる質問応答プログラムを記録
    した記録媒体。
JP2000319998A 2000-10-19 2000-10-19 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体 Pending JP2002132811A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000319998A JP2002132811A (ja) 2000-10-19 2000-10-19 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000319998A JP2002132811A (ja) 2000-10-19 2000-10-19 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2002132811A true JP2002132811A (ja) 2002-05-10

Family

ID=18798352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000319998A Pending JP2002132811A (ja) 2000-10-19 2000-10-19 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2002132811A (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005041068A1 (ja) * 2003-10-24 2005-05-06 Toshiba Solutions Corporation 質問応答型文書検索のためのシステム及び方法
JP2006323733A (ja) * 2005-05-20 2006-11-30 Nippon Telegr & Teleph Corp <Ntt> 方法説明検索方法、方法説明検索装置およびプログラム
JP2006323670A (ja) * 2005-05-19 2006-11-30 Nippon Telegr & Teleph Corp <Ntt> 方法質問応答方法、方法質問応答装置およびプログラム
JP2006338457A (ja) * 2005-06-03 2006-12-14 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US7359896B2 (en) 2003-07-02 2008-04-15 Oki Electric Industry Co., Ltd. Information retrieving system, information retrieving method, and information retrieving program
US7461047B2 (en) 2005-03-14 2008-12-02 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
US7526474B2 (en) 2005-03-14 2009-04-28 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
US7580835B2 (en) 2003-12-25 2009-08-25 Kabushiki Kaisha Toshiba Question-answering method, system, and program for answering question input by speech
US7587389B2 (en) 2005-06-10 2009-09-08 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
WO2009113494A1 (ja) * 2008-03-10 2009-09-17 国立大学法人横浜国立大学 Wwwを情報源として記述的な回答が可能な質問応答システム
US7844598B2 (en) 2005-03-14 2010-11-30 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
CN103034657A (zh) * 2011-09-29 2013-04-10 日立(中国)研究开发有限公司 文档摘要生成方法和装置
JP2016053782A (ja) * 2014-09-03 2016-04-14 カシオ計算機株式会社 質問応答装置、質問応答方法、プログラム
JP2017162112A (ja) * 2016-03-08 2017-09-14 日本電信電話株式会社 単語抽出装置、方法、及びプログラム
JP2021507350A (ja) * 2017-12-15 2021-02-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 複雑な回答の補強証拠取り出し
KR20210105830A (ko) * 2020-02-19 2021-08-27 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 엔티티 단어 인식 방법 및 장치
DE112019006199T5 (de) 2018-12-13 2021-09-23 Sony Group Corporation Datenverarbeitungsvorrichtung, Datenverarbeitungssystem und Datenverarbeitungsverfahren und Programm

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02112068A (ja) * 1988-10-21 1990-04-24 Hitachi Ltd テキスト簡略表示方式
JPH0756954A (ja) * 1993-06-24 1995-03-03 Xerox Corp 文書検索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02112068A (ja) * 1988-10-21 1990-04-24 Hitachi Ltd テキスト簡略表示方式
JPH0756954A (ja) * 1993-06-24 1995-03-03 Xerox Corp 文書検索方法

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7359896B2 (en) 2003-07-02 2008-04-15 Oki Electric Industry Co., Ltd. Information retrieving system, information retrieving method, and information retrieving program
US7587420B2 (en) 2003-10-24 2009-09-08 Kabushiki Kaisha Toshiba System and method for question answering document retrieval
WO2005041068A1 (ja) * 2003-10-24 2005-05-06 Toshiba Solutions Corporation 質問応答型文書検索のためのシステム及び方法
US7580835B2 (en) 2003-12-25 2009-08-25 Kabushiki Kaisha Toshiba Question-answering method, system, and program for answering question input by speech
US7844598B2 (en) 2005-03-14 2010-11-30 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
US7461047B2 (en) 2005-03-14 2008-12-02 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
US7526474B2 (en) 2005-03-14 2009-04-28 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
JP2006323670A (ja) * 2005-05-19 2006-11-30 Nippon Telegr & Teleph Corp <Ntt> 方法質問応答方法、方法質問応答装置およびプログラム
JP2006323733A (ja) * 2005-05-20 2006-11-30 Nippon Telegr & Teleph Corp <Ntt> 方法説明検索方法、方法説明検索装置およびプログラム
JP4526080B2 (ja) * 2005-05-20 2010-08-18 日本電信電話株式会社 方法説明検索装置およびプログラム
JP4654776B2 (ja) * 2005-06-03 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US7418443B2 (en) 2005-06-03 2008-08-26 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
JP2006338457A (ja) * 2005-06-03 2006-12-14 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US7587389B2 (en) 2005-06-10 2009-09-08 Fuji Xerox Co., Ltd. Question answering system, data search method, and computer program
WO2009113494A1 (ja) * 2008-03-10 2009-09-17 国立大学法人横浜国立大学 Wwwを情報源として記述的な回答が可能な質問応答システム
JP5461388B2 (ja) * 2008-03-10 2014-04-02 国立大学法人横浜国立大学 Wwwを情報源として記述的な回答が可能な質問応答システム
CN103034657A (zh) * 2011-09-29 2013-04-10 日立(中国)研究开发有限公司 文档摘要生成方法和装置
CN103034657B (zh) * 2011-09-29 2015-12-02 日立(中国)研究开发有限公司 文档摘要生成方法和装置
JP2016053782A (ja) * 2014-09-03 2016-04-14 カシオ計算機株式会社 質問応答装置、質問応答方法、プログラム
JP2017162112A (ja) * 2016-03-08 2017-09-14 日本電信電話株式会社 単語抽出装置、方法、及びプログラム
JP2021507350A (ja) * 2017-12-15 2021-02-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 複雑な回答の補強証拠取り出し
JP7232831B2 (ja) 2017-12-15 2023-03-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 複雑な回答の補強証拠取り出し
DE112019006199T5 (de) 2018-12-13 2021-09-23 Sony Group Corporation Datenverarbeitungsvorrichtung, Datenverarbeitungssystem und Datenverarbeitungsverfahren und Programm
KR20210105830A (ko) * 2020-02-19 2021-08-27 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 엔티티 단어 인식 방법 및 장치
JP2021131858A (ja) * 2020-02-19 2021-09-09 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド エンティティワードの認識方法と装置
US11361002B2 (en) 2020-02-19 2022-06-14 Beijing Baidu Netcom Science Technology Co., Ltd. Method and apparatus for recognizing entity word, and storage medium
JP7096919B2 (ja) 2020-02-19 2022-07-06 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド エンティティワードの認識方法と装置
KR102431568B1 (ko) 2020-02-19 2022-08-11 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 엔티티 단어 인식 방법 및 장치

Similar Documents

Publication Publication Date Title
Gupta et al. A survey of text question answering techniques
Amjad et al. “Bend the truth”: Benchmark dataset for fake news detection in Urdu language and its evaluation
KR101136007B1 (ko) 문서 감성 분석 시스템 및 그 방법
US20020002450A1 (en) Article and method of automatically filtering information retrieval results using text genre
JP2002132811A (ja) 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体
US11893537B2 (en) Linguistic analysis of seed documents and peer groups
Hasibi et al. On the reproducibility of the TAGME entity linking system
JP2002132812A (ja) 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体
JP2014106665A (ja) 文書検索装置、文書検索方法
JP5718405B2 (ja) 発話選択装置、方法、及びプログラム、対話装置及び方法
JP4065346B2 (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5251099B2 (ja) 用語共起度抽出装置、用語共起度抽出方法及び用語共起度抽出プログラム
JP2000163437A (ja) 文書分類方法および文書分類装置ならびに文書分類処理プログラムを記録した記録媒体
JP4525433B2 (ja) 文書集約装置及びプログラム
Patel et al. An automatic text summarization: A systematic review
JP7122773B2 (ja) 辞書構築装置、辞書の生産方法、およびプログラム
Fatima et al. STEMUR: An automated word conflation algorithm for the Urdu language
JPH1145268A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4057962B2 (ja) 質問応答装置、質問応答方法及びプログラム
Sariki et al. A book recommendation system based on named entities
JPH10307837A (ja) 検索装置並びに検索プログラムを記録した記録媒体
JP2005202924A (ja) 対訳判断装置、方法及びプログラム
JP2006139484A (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
Balaji et al. Finding related research papers using semantic and co-citation proximity analysis
JP2002108888A (ja) ディジタルコンテンツのキーワード抽出装置、方法及びコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040824

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050104