JP4116599B2 - 質問応答システム、方法及びプログラム - Google Patents
質問応答システム、方法及びプログラム Download PDFInfo
- Publication number
- JP4116599B2 JP4116599B2 JP2004217904A JP2004217904A JP4116599B2 JP 4116599 B2 JP4116599 B2 JP 4116599B2 JP 2004217904 A JP2004217904 A JP 2004217904A JP 2004217904 A JP2004217904 A JP 2004217904A JP 4116599 B2 JP4116599 B2 JP 4116599B2
- Authority
- JP
- Japan
- Prior art keywords
- answer
- question
- candidate
- user
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(第1の実施形態)
図1に示されるように、本発明の第1の実施形態に係る質問応答システムは、質問解析部101、文書集合を蓄積した文書データベース103から検索キーワードに従って文書を検索する文書検索部102、回答候補抽出部104、回答候補順位付け部105、回答候補表示部106、ユーザ入力部107、ユーザ回答データ記憶部108及び回答検索部109を有する。
次に、本発明のより具体的な第2の実施形態について説明する。質問応答サービスを不特定多数のユーザがアクセス可能なボータルサイトで提供する場合、質問文の分布はいわいる「Zipfの法則」に従うと想定される。すなわち、「頻出質問」と呼ぶべき、少数だが出現頻度の大きい質問が存在する。このような頻出質問に対しては、システム管理者が予め正解を作成し、システム回答データベースに記憶しておくことが有効である。
質問解析部301は、第1の実施形態と同様に入力された質問文から文書検索のためのキーワードを作成し、文書から抽出すべき回答の種類及び単語配列を規定した回答パターンを決定する。より具体的には、質問解析部301は質問文の単語分割及び品詞付与を行い、名詞・形容詞・副詞などの内容語、及びカタカナ列・英文字列・数字列などのキーワードになりやすい未知語を文書検索のためのキーワードとして抽出する。例えば、「鉄腕アトムの誕生日は?」という質問文に対しては、「鉄腕アトム」「誕生日」がキーワード集合として抽出される。
Web検索部302は、質問解析部301が作成したキーワード集合を用いてインターネット(Web)303からWeb文書を検索する。すなわち、本実施形態では文書データベースとしてインターネット303を使用する。文書検索部に相当するWeb検索部302としては、キーワードの周囲のテキストを取得可能なインターネット検索エンジンを使用する。Web検索部302は、キーワード検索が可能でかつキーワードの周囲のテキストを取得できるものならば何でもよい。キーワード検索が可能でかつ当該キーワードの周囲のテキスト(KWIC)を表示できるインターネット検索エンジンとしては、例えばgoo (http://goo.ne.jp)がある。
回答候補抽出部304は、質問解析部301により決定された回答パターンを用いて、Web検索部302により検索された文書から回答候補(第1の回答候補)を抽出する。本実施形態では、インターネット検索エンジンにより検索された文書を当該文書を蓄積したURL(Uniform Resource Locater)からダウンロードし、文書全体から回答候補を抽出するのではなく、インターネット検索エンジンが検索結果の一部として表示した、当該文書中のキーワードの周囲のテキスト(KWIC)から回答候補を抽出する。
回答検索部309は、少なくともユーザ回答データ記憶部308から、入力された質問文に対する回答データを回答候補(第2の回答候補)として検索する。回答検索の対象としては、ユーザ回答データ記憶部308に記憶されている、ユーザにより選択または入力された回答データのみでなく、例えば質問応答システムのシステム管理者が予め作成してシステム回答データ記憶部314に記憶させた正解の回答データ(これをシステム回答データと呼ぶ)を用いてもよい。
システム回答データ記憶部314には、例えば以下のような手順によって作成されるシステム回答データが記憶される。
回答候補順位付け部305は、基本的には第1の実施形態と同様であり、回答候補抽出部304により文書集合から抽出した第1の回答候補と回答検索部309によりユーザ回答データ記憶部308から検索した第2の回答候補の和集合を求める。次に、回答候補順位付け部305は以下の3つの観点から各回答候補の尤度を求める。
(2)検索キーワードの近くに出現する回答候補の方が尤もらしい;
(3)何度も出現する回答候補の方が尤もらしい。
(a)そもそも適切な回答パターンが存在しない;
(b)質問解析規則の不備により、適切な回答パターンの選択に失敗した;
(c)適切な回答パターンを選択したが、形態素解析または固有表現抽出の誤りや意味カテゴリ辞書の不備(単語に意味カテゴリが付与されていない)により、文書の概要文と回答パターンとの照合に失敗した;など、様々なケースが存在する。
回答候補表示部306は、尤度が大きい順に回答候補を表示してユーザに提示し、表示された回答候補の中から正解をユーザに選択してもらうか、または質問に対する正しい回答をユーザに直接入力してもらうように促す。
・ちがいない(≧0.8);
・だよね?(≧0.6);
・かな?(≧0.4);
・かもしれない(≧0.2);
・じゃないよね?(≧0.05);
・わけないか...(≧0)
図5においては、各回答候補の右端に「回答候補の評価」として「役に立った」というラベルを持つチェックボックスが表示されている。このチェックボックスをユーザがチェックすると、その回答候補が、入力された質問文に対する正解としてユーザ回答データ記憶部308に記憶される。
102…文書検索部
103…文書データベース
104…回答候補抽出部
105…回答候補順位付け部
106…回答候補表示部
107…ユーザ入力部
108…ユーザ回答データ記憶部
109…回答検索部
301…質問解析部
302…Web検索部
303…インターネット
304…回答候補抽出部
305…回答候補順位付け部
306…回答候補表示部
307…ユーザ入力部
308…ユーザ回答データ記憶部
309…回答検索部
310…質問ログテータ記憶部
311…質問頻度計算部
312…質問頻度データ記憶部
313…システム回答データ記憶部
Claims (15)
- 入力された質問文に対して回答を提示する質問応答システムにおいて、
前記入力された質問文を解析することにより文書検索のためのキーワード、及び文書から抽出すべき回答の種類と単語配列を規定する回答パターンを生成する質問解析手段と、
文書集合を蓄積した文書データベースから前記質問解析手段により生成されたキーワードを検索キーワードとして文書を検索する文書検索手段と、
検索された文書から前記回答パターンを用いて第1の回答候補を抽出する回答候補抽出手段と、
複数の質問文の各々に対してユーザにより選択または入力された回答データを記憶するユーザ回答データ記憶手段と、
前記ユーザ回答データ記憶手段から前記入力された質問文に対応する回答データを第2の回答候補として検索する回答検索手段と、
前記第1の回答候補及び第2の回答候補の和集合に対して尤度による順位付けを行う際に、前記ユーザ回答データ記憶手段に記憶された回答データを選択または入力したユーザの数に応じた重みを前記第2の回答候補に付与して前記順位付けを行う回答候補順位付け手段と、
順位付けられた回答候補をユーザに提示するために表示する回答候補表示手段とを具備し、
前記ユーザ回答データ記憶手段は、前記回答候補表示手段により表示された回答候補のうちからユーザが回答候補を選択することによる回答データの入力、またはユーザによる新たな回答データの入力があった場合には、該入力の回答データを質問文に対応させて記憶することを特徴とする質問応答システム。 - 前記回答候補順位付け手段は、前記第1の回答候補及び前記第2の回答候補の和集合のうち、尤度が大きい順に予め定められた数の回答候補のみを前記回答候補表示手段に渡すことを特徴とする請求項1に記載の質問応答システム。
- 前記回答候補順位付け手段は、前記第1の回答候補及び前記第2の回答候補の和集合のうち、尤度がある閾値以上の回答候補のみを前記回答候補表示手段に渡すことを特徴とする請求項1に記載の質問応答システム。
- 前記文書検索手段における文書検索に先立って、前記回答検索手段が前記第2の回答候補の選択を行い、前記文書検索手段が前記質問解析手段により生成されたキーワードに加えて前記第2の回答候補を前記検索キーワードとして用いることを特徴とする請求項1に記載の質問応答システム。
- 前記回答候補抽出手段は、前記文書検索手段により検索された文書のうち前記質問解析手段により生成されたキーワードの周囲のテキストから前記第1の回答候補を抽出することを特徴とする請求項1に記載の質問応答システム。
- 前記入力された質問文を表す質問ログデータを記憶する質問ログデータ記憶部と、
前記質問ログデータから前記質問文毎の入力回数を示す質問頻度データを求める質問頻度計算手段と、
前記質問頻度データに基づいて前記入力回数が一定値以上の質問文に対して予め作成された正解の回答データを記憶するシステム回答データ記憶部とをさらに具備し、
前記回答検索手段は、前記ユーザ回答データ記憶部及びシステム回答データ記憶部から前記第2の回答候補を検索することを特徴とする請求項1乃至5のいずれか1項に記載の質問応答システム。 - 前記文書データベースはインターネットであり、前記検索手段はインターネット検索エンジンであることを特徴とする請求項1記載の質問応答システム。
- 入力された質問文に対して回答を提示する質問応答方法において、
質問解析手段が前記入力された質問文を解析することにより文書検索のためのキーワード、及び文書から抽出すべき回答の種類と単語配列を規定する回答パターンを生成するステップと、
文書検索手段が文書集合を蓄積した文書データベースから前記生成されたキーワードを検索キーワードとして文書を検索するステップと、
回答候補抽出手段が検索された文書から前記回答パターンを用いて第1の回答候補を抽出するステップと、
ユーザ回答データ記憶手段が複数の質問文の各々に対してユーザにより選択または入力された回答データを記憶するステップと、
回答検索手段が記憶された回答データのうちから前記入力された質問文に対応する回答データを第2の回答候補として検索するステップと、
回答候補順位付け手段が、前記第1の回答候補及び第2の回答候補の和集合に対して尤度による順位付けを行う際に、前記ユーザ回答データ記憶手段に記憶された回答データを選択または入力したユーザの数に応じた重みを前記第2の回答候補に付与して前記順位付けを行うステップと、
回答候補表示手段が順位付けられた回答候補をユーザに提示するために表示するステップと、
前記ユーザ回答データ記憶手段が、前記回答候補表示手段が表示した回答候補のうちからユーザが回答候補を選択することによる回答データの入力、またはユーザによる新たな回答データの入力があった場合に、該入力の回答データを質問文に対応させて記憶するステップとを具備することを特徴とする質問応答方法。 - 前記回答候補順位付け手段が前記第1の回答候補及び前記第2の回答候補の和集合のうち、尤度が大きい順に予め定められた数の回答候補のみを前記回答候補表示手段に渡すことを特徴とする請求項8に記載の質問応答方法。
- 前記回答候補順位付け手段が前記第1の回答候補及び前記第2の回答候補の和集合のうち、尤度がある閾値以上の回答候補のみを前記回答候補表示手段に渡すことを特徴とする請求項8に記載の質問応答方法。
- 前記文書検索手段における文書検索に先立って、前記回答検索手段が前記第2の回答候補の選択を行い、前記文書検索手段が前記質問解析手段により生成されたキーワードに加えて前記第2の回答候補を前記検索キーワードとして用いることを特徴とする請求項8に記載の質問応答方法。
- 前記回答候補抽出手段が前記文書検索手段により検索された文書のうち前記質問解析手段により生成されたキーワードの周囲のテキストから前記第1の回答候補を抽出することを特徴とする請求項8に記載の質問応答方法。
- 質問ログデータ記憶部が前記入力された質問文を表す質問ログデータを記憶するステップと、
質問頻度計算手段が前記質問ログデータから前記質問文毎の入力回数を示す質問頻度データを求めるステップと、
システム回答データ記憶部が前記質問頻度データに基づいて前記入力回数が一定値以上の質問文に対して予め作成された正解の回答データを記憶するステップとをさらに具備し、
前記回答検索手段が前記ユーザ回答データ記憶部及びシステム回答データ記憶部から前記第2の回答候補を検索することを特徴とする請求項8乃至12のいずれか1項に記載の質問応答方法。 - 前記文書データベースはインターネットであり、前記検索手段はインターネット検索エンジンであることを特徴とする請求項8記載の質問応答方法。
- 入力された質問文に対して回答を提示する処理をコンピュータに実行させるプログラムにおいて、
質問解析手段が前記入力された質問文を解析することにより文書検索のためのキーワード、及び文書から抽出すべき回答の種類と単語配列を規定する回答パターンを生成する処理と、
文書検索手段が文書集合を蓄積した文書データベースから前記生成されたキーワードを検索キーワードとして文書を検索する処理と、
回答候補抽出手段が検索された文書から前記回答パターンを用いて第1の回答候補を抽出する処理と、
ユーザ回答データ記憶手段が複数の質問文の各々に対してユーザにより選択または入力された回答データを記憶する処理と、
回答検索手段が記憶された回答データのうちから前記入力された質問文に対応する回答データを第2の回答候補として検索する処理と、
回答候補順位付け手段が前記第1の回答候補及び第2の回答候補の和集合に対して尤度による順位付けを行う際に、前記ユーザ回答データ記憶手段に記憶された回答データを選択または入力したユーザの数に応じた重みを前記第2の回答候補に付与して前記順位付けを行う処理と、
回答候補表示手段が順位付けられた回答候補をユーザに提示するために表示する処理と、
前記ユーザ回答データ記憶手段が、前記回答候補表示手段が表示した回答候補のうちからユーザが回答候補を選択することによる回答データの入力、またはユーザによる新たな回答データの入力があった場合に、該入力の回答データを質問文に対応させて記憶する処理とを前記コンピュータに実行させるための質問応答プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004217904A JP4116599B2 (ja) | 2004-07-26 | 2004-07-26 | 質問応答システム、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004217904A JP4116599B2 (ja) | 2004-07-26 | 2004-07-26 | 質問応答システム、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006039881A JP2006039881A (ja) | 2006-02-09 |
JP4116599B2 true JP4116599B2 (ja) | 2008-07-09 |
Family
ID=35904826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004217904A Active JP4116599B2 (ja) | 2004-07-26 | 2004-07-26 | 質問応答システム、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4116599B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009113494A1 (ja) * | 2008-03-10 | 2009-09-17 | 国立大学法人横浜国立大学 | Wwwを情報源として記述的な回答が可能な質問応答システム |
JP2010211563A (ja) * | 2009-03-11 | 2010-09-24 | Kansai Electric Power Co Inc:The | 回答支援方法及びシステム |
JP2013190985A (ja) * | 2012-03-13 | 2013-09-26 | Sakae Takeuchi | 知識応答システム、方法およびコンピュータプログラム |
JP6192714B2 (ja) * | 2012-05-24 | 2017-09-06 | サウンドハウンド,インコーポレイテッド | 自然言語処理を可能にするシステム及び方法 |
US10289729B2 (en) * | 2016-03-17 | 2019-05-14 | Google Llc | Question and answer interface based on contextual information |
JP6860010B2 (ja) * | 2016-05-06 | 2021-04-14 | ソニー株式会社 | 情報処理システム、情報処理方法、および情報処理プログラム |
JP7014646B2 (ja) * | 2018-03-14 | 2022-02-01 | Kddi株式会社 | 応答装置、応答方法、応答プログラム及び応答システム |
JP6458183B1 (ja) * | 2018-04-05 | 2019-01-23 | アビームコンサルティング株式会社 | モータスポーツにおける自動音声回答システム及びプログラム |
WO2019239543A1 (ja) * | 2018-06-14 | 2019-12-19 | 日本電気株式会社 | 質問応答装置、質問応答方法および記録媒体 |
CN112905768A (zh) * | 2021-02-08 | 2021-06-04 | 中国工商银行股份有限公司 | 一种数据交互方法、装置及存储介质 |
CN116975395B (zh) * | 2023-09-22 | 2024-01-23 | 安徽淘云科技股份有限公司 | 错误反馈数据的处理方法、装置、设备以及介质 |
-
2004
- 2004-07-26 JP JP2004217904A patent/JP4116599B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2006039881A (ja) | 2006-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106663125B (zh) | 提问句生成装置以及记录介质 | |
US9965547B2 (en) | System and methods for automating trademark and service mark searches | |
JP4650072B2 (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
JP4881878B2 (ja) | マルチリンガル情報検索のためのシステム、方法、ソフトウエア、およびインタフェース | |
US10552467B2 (en) | System and method for language sensitive contextual searching | |
US20140351228A1 (en) | Dialog system, redundant message removal method and redundant message removal program | |
JP2013016172A (ja) | データを処理するシステム及び方法 | |
US20080154853A1 (en) | English-language translation of exact interpretations of keyword queries | |
Benajiba et al. | Implementation of the ArabiQA question answering system's components | |
JP4116599B2 (ja) | 質問応答システム、方法及びプログラム | |
JP2014120053A (ja) | 質問応答装置、方法、及びプログラム | |
JP4967037B2 (ja) | 情報検索装置、情報検索方法、端末装置、およびプログラム | |
JP2008152522A (ja) | データマイニングシステム、データマイニング方法及びデータ検索システム | |
JP2000200281A (ja) | 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体 | |
JPWO2003034279A1 (ja) | 情報検索方法、情報検索プログラム、情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
WO2009113494A1 (ja) | Wwwを情報源として記述的な回答が可能な質問応答システム | |
JP2004355550A (ja) | 自然文検索装置、その方法及びプログラム | |
JP7167997B2 (ja) | 文献検索方法および文献検索システム | |
JP4499179B1 (ja) | 端末装置 | |
JPH0844771A (ja) | 情報検索装置 | |
JP2007164635A (ja) | 同義語彙獲得方法及び装置及びプログラム | |
JP4860439B2 (ja) | 質問文の自動生成システム | |
JP2006227914A (ja) | 情報検索装置、情報検索方法、プログラム、記憶媒体 | |
KR100494113B1 (ko) | 웹 브라우저를 이용한 정보 검색 시스템 | |
JP2006139484A (ja) | 情報検索方法及びそのシステム並びにコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080115 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080415 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080417 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110425 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4116599 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110425 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120425 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130425 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140425 Year of fee payment: 6 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |