JP2005063185A - Document retrieval system, question-answering system, and document retrieval method - Google Patents

Document retrieval system, question-answering system, and document retrieval method Download PDF

Info

Publication number
JP2005063185A
JP2005063185A JP2003293178A JP2003293178A JP2005063185A JP 2005063185 A JP2005063185 A JP 2005063185A JP 2003293178 A JP2003293178 A JP 2003293178A JP 2003293178 A JP2003293178 A JP 2003293178A JP 2005063185 A JP2005063185 A JP 2005063185A
Authority
JP
Japan
Prior art keywords
search
user
information type
document
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003293178A
Other languages
Japanese (ja)
Other versions
JP4114927B2 (en
Inventor
Tetsuya Sakai
哲也 酒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003293178A priority Critical patent/JP4114927B2/en
Publication of JP2005063185A publication Critical patent/JP2005063185A/en
Application granted granted Critical
Publication of JP4114927B2 publication Critical patent/JP4114927B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To provide a highly precise document retrieval system capable of providing a retrieval result desired by a user. <P>SOLUTION: An information type desired by the user is detected from a retrieval request sentence inputted by the user. The retrieval request sentence is morphologically analyzed to generate a retrieval condition. A retrieval term appropriate for the detected information type is added to the generated retrieval condition to correct the retrieval condition. A retrieval is performed by use of the corrected retrieval condition. The retrieval result is presented to the user. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は利用者が入力した検索要求に基づいてデータベース検索を行って文書を提示する文書検索システム、及び利用者が入力した質問に基づいてデータベース検索を行って回答を提示する文書検索システムに関する。   The present invention relates to a document search system that presents a document by performing a database search based on a search request input by a user, and a document search system that presents an answer by performing a database search based on a question input by a user.

利用者が入力した検索要求に基づいて電子化された膨大なデータの中から情報を検索する際に、検索要求の文から抽出した語句を検索タームとした検索条件を生成することが広く行われている。検索精度を向上させるために、シソーラス、同義語辞書、異表記辞書あるいは共起語辞書等を用いて検索要求を解析して、検索タームの関連語(例えば、同義語、類義語、共起語等)を検索条件に付加する検索条件拡張処理を行う手法が提案されている(例えば、特許文献1、特許文献2)。
特許2970443号公報 特開2002−269133公報
When searching for information from an enormous amount of data that has been digitized based on a search request entered by a user, it is common practice to generate a search condition that uses a word extracted from the search request sentence as a search term. ing. In order to improve search accuracy, the search request is analyzed using a thesaurus, synonym dictionary, different notation dictionary, or co-occurrence word dictionary, etc., and related terms of the search term (for example, synonyms, synonyms, co-occurrence words, etc.) ) Has been proposed (for example, Patent Document 1 and Patent Document 2).
Japanese Patent No. 2970443 JP 2002-269133 A

従来の検索条件拡張処理では、利用者が求めている情報のタイプを考慮せずに、単に関連語であるというだけで検索タームを付加している。これでは、必ずしも利用者が求める情報を検索する上で有効な検索タームを付加することができるとは限らない。従って、従来の手法では検索結果の精度が悪くなって利用者の要求を十分に満たせないことがある。   In the conventional search condition expansion process, a search term is added simply by being a related term without considering the type of information that the user is seeking. In this case, it is not always possible to add a search term effective for searching for information required by the user. Therefore, in the conventional method, the accuracy of the search result is deteriorated and the user's request may not be sufficiently satisfied.

そこで、本発明では、利用者が求めている情報のタイプを考慮して検索条件拡張処理を行うことで、従来より精度良く文書を検索することができるシステムを提供することを目的とする。   Accordingly, an object of the present invention is to provide a system capable of searching for a document with higher accuracy than before by performing search condition expansion processing in consideration of the type of information requested by a user.

上記課題を解決するため本発明の文書検索システムは、文書データを記憶している文書データベースを利用者が入力した検索要求文に基づいて検索する検索システムであって以下の構成を備えるものである。
(1)利用者の検索要求文を入力する入力部。
(2)前記検索要求文から利用者が求めている情報タイプを判定する情報タイプ判定部。(3)前記検索要求文から検索タームを抽出し、前記検索タームと前記情報タイプに応じた語句とを用いて検索条件を生成する検索条件生成部。
(4)前記検索条件を用いて前記文書データベースを検索する検索部。
(5)この検索結果を利用者に提示する出力部。
In order to solve the above problems, a document search system of the present invention is a search system for searching a document database storing document data based on a search request sentence input by a user, and has the following configuration. .
(1) An input unit for inputting a user search request text.
(2) An information type determination unit that determines an information type requested by a user from the search request text. (3) A search condition generation unit that extracts a search term from the search request sentence and generates a search condition using the search term and a word or phrase corresponding to the information type.
(4) A search unit that searches the document database using the search condition.
(5) An output unit for presenting the search result to the user.

また、本発明の質問応答システムは、知識データを記憶している知識データベースを利用者が入力した質問文に基づいて検索し、前記質問文に対する回答を求める質問応答システムであって、以下の構成を備えるものである。
(1)利用者の質問文を入力する入力部。
(2)前記質問文から利用者が求めている情報タイプを判定する情報タイプ判定部。
(3)前記質問分から検索タームを抽出し、前記検索タームと前記情報タイプに応じた語句とを用いて検索条件を生成する検索条件生成部。
(4)前記検索条件を用いて前記知識データベースを検索する検索部。
(5)この検索結果に基づいて質問文に対する回答を生成する回答生成部。
(6)この生成した回答を利用者に提示する出力部。
The question answering system of the present invention is a question answering system that searches a knowledge database storing knowledge data based on a question sentence input by a user and obtains an answer to the question sentence. Is provided.
(1) An input unit for inputting a user's question text.
(2) An information type determination unit that determines an information type requested by the user from the question text.
(3) A search condition generation unit that extracts a search term from the question and generates a search condition using the search term and a phrase according to the information type.
(4) A search unit that searches the knowledge database using the search condition.
(5) An answer generator that generates an answer to the question sentence based on the search result.
(6) An output unit for presenting the generated answer to the user.

本発明ならば、利用者が求めている情報のタイプを考慮して検索条件拡張処理を行うので従来より精度良く文書を検索することができる。   According to the present invention, the search condition expansion process is performed in consideration of the type of information requested by the user, so that a document can be searched with higher accuracy than before.

また、本発明ならば、利用者が求めている情報のタイプを考慮して検索範囲の限定を行うので従来より効率良く文書を検索することができる。   Further, according to the present invention, the search range is limited in consideration of the type of information requested by the user, so that documents can be searched more efficiently than before.

以下、図面を参照して本発明の実施形態について説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

以下に説明する本発明の各実施形態は、いずれもワークステーション(WS)やパーソナルコンピュータ(PC)等のコンピュータで動作させるプログラムとして実現する。図16は各実施形態において用いるコンピュータの図である。   Each embodiment of the present invention described below is realized as a program that is operated by a computer such as a workstation (WS) or a personal computer (PC). FIG. 16 is a diagram of a computer used in each embodiment.

このコンピュータは、プログラムを実行する中央演算装置1601と、プログラムやプログラムが処理中のデータを格納するメモリ1602と、プログラム、検索対象のデータ及びOS(Operating System)を格納しておく磁気ディスクドライブ1603と、光ディスクにプログラムやデータを読み書きする光ディスクドライブ1604とを備える。   The computer includes a central processing unit 1601 that executes a program, a memory 1602 that stores the program and data being processed by the program, and a magnetic disk drive 1603 that stores the program, data to be searched, and an OS (Operating System). And an optical disc drive 1604 for reading and writing programs and data on the optical disc.

さらに、ディスプレイ等に画面を表示させるためのインターフェースである画像出力部1605と、キーボード・マウス・タッチパネル等からの入力を受ける入力受付部1606と、外部機器との出入力インターフェース(例えばUSB(Universal Serial Bus)、音声出力端子等)である出入力部1607とを備える。   Furthermore, an image output unit 1605 that is an interface for displaying a screen on a display, an input receiving unit 1606 that receives input from a keyboard, a mouse, a touch panel, and the like, and an input / output interface (for example, USB (Universal Serial) Bus), audio output terminal, etc.).

また、LCD、CRT、プロジェクタ等の表示装置1608と、キーボードやマウス等の入力装置1609と、メモリカードリーダ・スピーカー等の外部機器1610とを備える。   Further, the display device 1608 includes a display device 1608 such as an LCD, CRT, and projector, an input device 1609 such as a keyboard and a mouse, and an external device 1610 such as a memory card reader / speaker.

中央演算装置1601は、磁気ディスクドライブ1603からプログラムを読み出してメモリ1602に記憶させた後にプログラムを実行する。プログラム実行中に、磁気ディスクドライブ1603から検索対象データの一部或いは全部を読み出してメモリ1602に記憶させておいても良い
基本的な動作は、入力装置1609を介して利用者からの検索要求を受け、検索要求に応じて磁気ディスクドライブ1603やメモリ1602に記憶させた検索対象データを検索する。そして、表示装置1608に検索結果を表示させる。
The central processing unit 1601 executes the program after reading the program from the magnetic disk drive 1603 and storing it in the memory 1602. During the program execution, a part or all of the search target data may be read from the magnetic disk drive 1603 and stored in the memory 1602. The basic operation is that a search request from the user is input via the input device 1609. In response to the search request, the search target data stored in the magnetic disk drive 1603 or the memory 1602 is searched. Then, the search result is displayed on the display device 1608.

検索結果は表示装置1608に表示させるだけでなく、例えば外部機器1610としてスピーカーを接続しておいて音声で利用者に提示しても良い。あるいは、外部機器1610としてプリンタを接続しておいて、印刷物として提示しても良い。   The search result may be displayed not only on the display device 1608 but also presented to the user by voice by connecting a speaker as the external device 1610, for example. Alternatively, a printer may be connected as the external device 1610 and presented as a printed matter.

(第1の実施形態)図1は本発明の第1の実施形態に係る文書検索システムの概略構成を説明する図である。本実施形態はデータベースを検索して利用者が求めていると思われる文書を求め、利用者に文書のリストを提示するというものである。本実施形態の文書検索システムはコンピュータで動作させるプログラムとして実現する。   (First Embodiment) FIG. 1 is a diagram for explaining a schematic configuration of a document search system according to a first embodiment of the present invention. In this embodiment, a database is searched for a document that the user seems to be seeking, and a list of documents is presented to the user. The document search system of this embodiment is realized as a program that is operated by a computer.

本実施形態の文書検索システムは、利用者が検索要求を入力する入力部101と、検索
要求から利用者が求めている情報のタイプを判定する情報タイプ判定部102と、検索要求から検索条件を生成して検索を行う検索部103と、検索結果を出力する出力部104とを備える。
The document search system according to the present embodiment includes an input unit 101 through which a user inputs a search request, an information type determination unit 102 that determines the type of information that the user is seeking from the search request, and a search condition from the search request. A search unit 103 that generates and searches, and an output unit 104 that outputs a search result are provided.

入力部101に入力された検索要求は、情報タイプ判定部102に出力される。情報タイプ判定部102は、形態素解析辞書113を利用した形態素解析を行い、情報タイプ判定知識111を利用して利用者が求めている情報タイプを推定する。   The search request input to the input unit 101 is output to the information type determination unit 102. The information type determination unit 102 performs morpheme analysis using the morpheme analysis dictionary 113 and estimates the information type requested by the user using the information type determination knowledge 111.

検索部103は、検索条件拡張辞書114と推定された情報タイプとを用いて検索条件を生成し、文書データベース112に記憶されている情報を検索する。出力部104は、検索結果を画面に表示させて利用者に出力する。   The search unit 103 generates a search condition using the search condition expansion dictionary 114 and the estimated information type, and searches information stored in the document database 112. The output unit 104 displays the search result on the screen and outputs it to the user.

(情報タイプ判定部102)情報タイプの判定とは、文書検索の際に利用者が入力した検索要求の文(検索要求文)から、利用者がどのような種類の情報を要求しているのかを判定する技術である。   (Information type determination unit 102) Information type determination refers to what kind of information the user is requesting from the search request text (search request text) input by the user during document search. Is a technique for determining

図2は本実施形態の情報タイプ判定部102における処理の流れを説明する図である。   FIG. 2 is a diagram for explaining the flow of processing in the information type determination unit 102 of this embodiment.

(S201)入力部101から利用者が入力した検索要求文を受け取る。検索要求文は、例えば「○○大統領が生まれたのはどこか」というようなものである。   (S201) The search request text input by the user is received from the input unit 101. The search request text is, for example, “Where was President XX born?”.

(S202)検索要求文について形態素解析辞書113を用いて形態素解析を行う。   (S202) Morphological analysis is performed on the search request sentence using the morphological analysis dictionary 113.

(S203)情報タイプ判定知識111を参照して検索要求文から利用者が求めている情報タイプを判定する。   (S203) With reference to the information type determination knowledge 111, the information type requested by the user is determined from the search request sentence.

本実施形態の情報タイプ判定知識111は「表現パターン」と「情報タイプ」とを関連付けたデータである。本実施形態では「表現パターン」は正規表現によって記述されているものとする。従って、「表現パターン」は語句だけの場合もあるし、検索要求文中における位置(文頭、文末など)も含んだ情報になっている場合もある。   The information type determination knowledge 111 of this embodiment is data in which “expression pattern” and “information type” are associated with each other. In the present embodiment, it is assumed that the “expression pattern” is described by a regular expression. Therefore, the “expression pattern” may be only a word or phrase, or may be information including a position (a sentence head, a sentence end, etc.) in a search request sentence.

情報タイプ判定知識111では、例えば、「『どこか』や『場所は?』で終わる」という表現パターンには、情報タイプ「PLACE(場所)」が関連付けられている。「『いつか』や『何日か』で終わる」という表現パターンには、情報タイプ「DATE(日時)」が関連付けられている。また、「『誰か?』で終わる」という表現パターンには、情報タイプが「PERSON(人名)」が関連付けられている。   In the information type determination knowledge 111, for example, an information type “PLACE (location)” is associated with an expression pattern “ending in“ somewhere ”or“ where is? ””. An information type “DATE (date and time)” is associated with an expression pattern “ending in“ someday ”or“ someday ””. The expression pattern “PERSON (person name)” is associated with the expression pattern “ending with“ someone? ”.

情報タイプの判定S203では、検索要求文の中から情報タイプ判定知識111に登録された「表現パターン」を正規表現のパターンマッチングによって検出する。検出された「表現パターン」に関連付けられた「情報タイプ」を判定結果とする。   In the information type determination S203, the “expression pattern” registered in the information type determination knowledge 111 is detected from the search request text by pattern matching of a regular expression. The “information type” associated with the detected “expression pattern” is set as the determination result.

尚、情報タイプ判定知識111は予め用意しておく。   Information type determination knowledge 111 is prepared in advance.

(S204)形態素解析結果と情報タイプ判定結果とを検索部103に出力する。   (S204) The morphological analysis result and the information type determination result are output to the search unit 103.

(検索部103)図3は本実施形態における検索部103の処理の流れを説明する図である。   (Search Unit 103) FIG. 3 is a diagram for explaining the flow of processing of the search unit 103 in this embodiment.

(S301)本実施形態の検索部103は、検索要求文の形態素解析結果並びに情報タイプの判定結果を、情報タイプ判定部102から受け取る。   (S301) The search unit 103 according to the present embodiment receives the morphological analysis result of the search request statement and the information type determination result from the information type determination unit 102.

(S302)形態素解析結果から検索条件を作成する。情報タイプ判定部102において形態素解析がなされた結果、検索要求文は単語毎に分解可能になっている。そこで、形態素解析結果をもとに検索要求文から検索タームとする語句を抽出して検索条件を生成する。例えば、「○○大統領が生まれたのはどこか」という検索要求文から、「○○」「大統領」「生まれた」という語句を検索タームとして抽出して検索条件を生成する。   (S302) A search condition is created from the morphological analysis result. As a result of the morphological analysis performed by the information type determination unit 102, the search request sentence can be decomposed for each word. Therefore, a search condition is generated by extracting a phrase as a search term from a search request sentence based on a morphological analysis result. For example, from the search request sentence “Where President XX was born”, the phrases “XX”, “President” and “Born” were extracted as search terms to generate search conditions.

(S303)検索条件拡張辞書114を参照して、情報タイプに基づいて検索条件を拡張する。   (S303) With reference to the search condition expansion dictionary 114, the search condition is expanded based on the information type.

検索条件を拡張する際、検索タームに関連する語句(例えば、同義語・類義語などを含む関連語)を付加することが考えられる。しかし、関連語が検索に適切か否かは利用者が求めている情報のタイプによって異なるはずである。   When expanding the search condition, it is conceivable to add a phrase related to the search term (for example, a related term including synonyms and synonyms). However, whether a related word is appropriate for a search should vary depending on the type of information that the user is seeking.

例えば「生まれた」という検索タームがあったとする。この語句から類推される関連語には「誕生日」「出身地」「生地」「生年月日」・・・などがある。利用者が知りたい情報が「生まれた場所」であるのなら「出身地」「生地」という語句を付加するのが妥当であろう。この場合「誕生日」「生年月日」という語句を付加するのは妥当ではなく、逆に検索結果にノイズを混入させる可能性すらある。   For example, there is a search term “born”. Related words that can be inferred from this phrase include “birthday”, “birthplace”, “fabric”, “date of birth”, and so on. If the information that the user wants to know is “place of birth”, it would be appropriate to add the phrases “place of birth” and “fabric”. In this case, it is not appropriate to add the phrases “birthday” and “birth date”, and conversely, there is a possibility of adding noise to the search result.

ところが、検索条件だけに着目しても適切な語を付加することが難しいことが多い。   However, it is often difficult to add an appropriate word even if focusing only on the search condition.

例えば、S302において「○○大統領が生まれたのはいつか」という検索要求文から検索条件を生成すると、「○○」「大統領」「生まれた」を検索タームとする検索条件が生成される可能性がある。「どこ」「いつ」等の疑問詞そのものは検索において有効でないことが多く、通常は検索タームに含めないからである。   For example, if a search condition is generated from the search request sentence “when is President XX born” in S302, a search condition with search terms “XX”, “President” and “born” may be generated. There is. This is because the interrogative words such as “where” and “when” are often not effective in the search and are not usually included in the search term.

そこで、本実施形態では検索条件拡張辞書114を参照して、情報タイプに基づいて適切な検索タームを付加するようにした。   Therefore, in this embodiment, an appropriate search term is added based on the information type with reference to the search condition expansion dictionary 114.

図4は本実施形態の検索条件拡張辞書114の一例を説明する図である。検索条件拡張辞書114は、原語401と、情報タイプ402と、関連語403とを関連付けたデータである。   FIG. 4 is a diagram for explaining an example of the search condition expansion dictionary 114 of the present embodiment. The search condition expansion dictionary 114 is data in which the original word 401, the information type 402, and the related word 403 are associated with each other.

例えば「生まれた」という原語に対しては、情報タイプがPLACE(場所)である関連語として「生地」「出身地」が関連付けられており、情報タイプがDATE(日時)である関連語として「誕生日」「生年月日」が関連付けられている。   For example, for the original word “born”, “dough” and “birthplace” are associated as related words whose information type is PLACE (location), and “related information” whose information type is DATE (date and time) is “ “Birthday” and “Birth date” are associated.

従って、検索条件拡張辞書114を参照して、情報タイプに基づいて上述の検索条件「○○」「大統領」「生まれた」を拡張すると以下のようになる。
1.情報タイプがPLACE(場所)である検索要求文に対しては、「生地」「出身地」という語句が付加されて、検索条件は「○○」「大統領」「生まれた」「生地」「出身地」となる。
2.情報タイプがDATE(日時)である検索要求文に対しては、「誕生日」「生年月日」という語句が付加されて、検索条件は「○○」「大統領」「生まれた」「誕生日」「生年月日」となる。
Therefore, referring to the search condition expansion dictionary 114 and expanding the above-described search conditions “XX”, “President”, and “Born” based on the information type are as follows.
1. For search request texts with the information type PLACE (place), the words “fabric” and “birthplace” are added, and the search conditions are “XX”, “President”, “Born”, “Dough”, “Born” Earth ".
2. For search request sentences with the information type DATE (date and time), the words “birthday” and “birth date” are added, and the search conditions are “XX”, “President”, “Born”, “Birthday” "Birth date".

(S304)拡張された検索条件を用いて、文書データベース112を検索する。   (S304) The document database 112 is searched using the extended search condition.

(S305)検索結果を出力部104に出力する。   (S305) The search result is output to the output unit 104.

(本実施形態の効果)以上に説明したように本実施形態では、検索要求文に含まれる表現パターンから判定した「利用者が求めている情報のタイプ」に相応しい関連語を用いて検索条件を拡張した上で検索を行っている。従って、検索結果から「利用者が求めていない情報」を減らすことができ、精度良く検索を行うことができる。   (Effects of the present embodiment) As described above, in the present embodiment, the search condition is set by using a related term suitable for the “type of information requested by the user” determined from the expression pattern included in the search request sentence. The search is performed after expanding. Therefore, “information not requested by the user” can be reduced from the search result, and the search can be performed with high accuracy.

(変形例)図5(a)(b)は、本実施形態において情報タイプ判定結果及び検索条件拡張結果を利用者に提示するようにした場合の表示画面の一例である。   (Modification) FIGS. 5A and 5B are examples of display screens when the information type determination result and the search condition expansion result are presented to the user in this embodiment.

図5(a)は、利用者が「○×大統領が生まれたのはどこか」という検索要求文を入力した場合の例である。   FIG. 5A shows an example of a case where the user inputs a search request sentence “Where is XX President born?”.

情報タイプ解析結果「PLACE(場所)」と、検索要求文から得られた検索条件「○×」「大統領」「生まれた」とが表示されている。さらに、「生まれた」という検索タームと検索条件拡張辞書114とを用いて得られる拡張された検索ターム(拡張ターム)「生地」「出身地」「誕生日」「生年月日」も表示されている。   The information type analysis result “PLACE (location)” and the search conditions “Ox”, “President” and “born” obtained from the search request text are displayed. Further, an expanded search term (extended term) “fabric”, “birthplace”, “birthday”, “birth date” obtained using the search term “born” and the search condition expansion dictionary 114 is also displayed. Yes.

今、情報タイプが「PLACE(場所)」であるから、拡張タームとして「生地」「出身地」を採用することをチェックボックス501〜504を用いて利用者に提案している。   Now, since the information type is “PLACE (place)”, it is proposed to the user using the check boxes 501 to 504 to adopt “fabric” and “birthplace” as the expansion term.

図5(b)は、利用者が「○×大統領が生まれたのはいつか」という検索要求文を入力した場合の例である。こちらの例では情報タイプ判定結果が「DATE(日付)」となっている。そして、拡張タームとして「誕生日」「生年月日」を採用することをチェックボックス505〜508を用いて利用者に提案している。   FIG. 5B shows an example of a case where the user inputs a search request sentence “when the president was born”. In this example, the information type determination result is “DATE (date)”. And it proposes to the user using check boxes 505 to 508 to adopt “birthday” and “birth date” as the expansion term.

このように、情報タイプに応じた検索条件の拡張案を利用者に提示し、チェックボックスの操作により最終的に使用する検索タームを利用者に決定させても良い。   As described above, the expansion plan of the search condition according to the information type may be presented to the user, and the user may determine the search term to be finally used by operating the check box.

(追記)第1の実施形態では、検索要求文から利用者の求める情報タイプを判定し、検索要求文から検索条件を生成し、検索条件拡張辞書を用いて検索条件を拡張するという流れで説明した。すなわち、検索要求文から一旦検索条件を生成した後に、検索条件を拡張するとして説明した。   (Additional note) In the first embodiment, the information type requested by the user is determined from the search request sentence, the search condition is generated from the search request sentence, and the search condition is extended using the search condition expansion dictionary. did. That is, it has been described that the search condition is once generated from the search request sentence and then the search condition is extended.

しかし、検索要求文から利用者の求める情報タイプを判定し、検索要求文と検索条件拡張辞書と情報タイプとを用いて検索条件を生成しても良い。すなわち、検索条件を生成する際に検索条件拡張辞書を参照して情報タイプに応じた適切な検索タームを含んだ検索条件を生成するようにしても良い。   However, the information type requested by the user may be determined from the search request text, and the search condition may be generated using the search request text, the search condition expansion dictionary, and the information type. That is, when a search condition is generated, a search condition including an appropriate search term corresponding to the information type may be generated by referring to the search condition expansion dictionary.

例えば、検索要求文に対する形態素解析の結果抽出された語句の各々について、検索条件拡張辞書から情報タイプに相応しい関連語を求める。そして、抽出された語句と求めた関連語とを用いて検索条件を生成しても良い。   For example, for each word extracted as a result of morphological analysis for the search request sentence, a related word suitable for the information type is obtained from the search condition expansion dictionary. Then, a search condition may be generated using the extracted word and the obtained related word.

(第2の実施形態)以下、本発明の第2の実施形態である質問応答システムについて説明する。本実施形態はデータベースを検索して利用者の質問に対する回答を求めるものである。   (Second Embodiment) A question answering system according to a second embodiment of the present invention will be described below. In the present embodiment, a database is searched for an answer to a user's question.

第1の実施形態の文書検索システムでは、利用者の検索要求文を利用者が求めている情報タイプに応じて適宜拡張してデータベース検索を行い、利用者が必要としていると思われる文書のリストを提示していた。   In the document search system according to the first embodiment, a search request sentence of a user is appropriately expanded according to the information type requested by the user, a database search is performed, and a list of documents that the user thinks is necessary. Was presenting.

これに対し、本実施形態の質問応答システムでは、利用者の質問を利用者が求めている情報タイプに応じて適宜拡張してデータベース検索を行い、利用者が必要としていると思われる回答を提示する。   On the other hand, in the question answering system according to the present embodiment, the user's question is appropriately expanded according to the information type requested by the user, the database search is performed, and the answer that the user thinks necessary is presented. To do.

図6は本実施形態の質問応答システムの概略構成を説明する図である。本実施形態の質問応答システムは、利用者が質問文を入力する入力部101と、質問文から利用者が求めている情報のタイプを判定する情報タイプ判定部102と、質問文から検索条件を生成して検索を行う検索部103と、検索結果を出力する出力部104とを備える。   FIG. 6 is a diagram illustrating a schematic configuration of the question answering system according to the present embodiment. The question answering system according to the present embodiment includes an input unit 101 through which a user inputs a question sentence, an information type determination unit 102 that determines a type of information requested by the user from the question sentence, and a search condition from the question sentence. A search unit 103 that generates and searches, and an output unit 104 that outputs a search result are provided.

入力部101に入力された質問文は、情報タイプ判定部102に出力される。情報タイプ判定部102は、形態素解析辞書113を利用して質問文の形態素解析を行うとともに、情報タイプ判定知識111を利用して利用者が求めている情報タイプを推定する。   The question text input to the input unit 101 is output to the information type determination unit 102. The information type determination unit 102 performs morphological analysis of the question sentence using the morphological analysis dictionary 113 and estimates the information type requested by the user using the information type determination knowledge 111.

検索部103は、検索条件拡張辞書114と推定された情報タイプとを用いて検索条件を生成し、知識データベース220に記憶されている情報を検索する。出力部104は、検索結果を画面に表示させて利用者に出力する。   The search unit 103 generates a search condition using the search condition expansion dictionary 114 and the estimated information type, and searches information stored in the knowledge database 220. The output unit 104 displays the search result on the screen and outputs it to the user.

尚、利用者の質問文から検索条件を生成する部分については、第1の実施形態において検索要求文から検索条件を生成するのと同様なので異なる部分を中心に説明する。   Since the part for generating the search condition from the user's question sentence is the same as that for generating the search condition from the search request sentence in the first embodiment, the different part will be mainly described.

(システム利用前の準備)本実施形態では、利用者によるシステム利用に先立って、文書データから検索用データを生成して、知識データベース220に記憶させておく。   (Preparation before System Use) In this embodiment, search data is generated from document data and stored in the knowledge database 220 prior to system use by the user.

情報抽出部222は、形態素解析辞書113を用いた形態素解析を行う。さらに、抽出用知識223に記憶されている辞書やパターンマッチングルール等に基づいて、文書データ中の固有名詞や日付などへの情報タイプ別のタグの埋め込みも行って、検索用データの生成を行う。   The information extraction unit 222 performs morphological analysis using the morphological analysis dictionary 113. Further, based on the dictionary or pattern matching rule stored in the extraction knowledge 223, tags for each information type are embedded in proper nouns and dates in the document data to generate search data. .

図7は検索用データの一例である。文書700において、「○×太郎」には「<PERSON>(人名)」というタグが割り付けられていて、「△△△△年○月×日」には「<DATE>(日付)」というタグが割り付けられている。さらに文書700にはDOCUMENT_IDとして00001が割り当てられている。DOCUMENT_IDは文書の識別子である。   FIG. 7 shows an example of search data. In the document 700, a tag “<PERSON> (person name)” is assigned to “○ × Taro”, and a tag “<DATE> (date)” is assigned to “△△△△ year ○ month × day”. Is assigned. Further, 00001 is assigned to the document 700 as DOCUMENT_ID. DOCUMENT_ID is an identifier of a document.

登録部221は、生成された検索用データを知識データベース220に登録する。   The registration unit 221 registers the generated search data in the knowledge database 220.

尚、利用者がシステムを利用していない空き時間を利用して、知識データベース220に新たなデータを追加するようにしても良い。或いは利用者がシステムを利用中でもバックグラウンドで行っても良い。   It should be noted that new data may be added to the knowledge database 220 using the idle time when the user is not using the system. Alternatively, it may be performed in the background while the user is using the system.

(システムの動作)以下、図8に沿って本実施形態の質問応答システムの動作を説明する。   (System Operation) The operation of the question answering system of this embodiment will be described below with reference to FIG.

利用者により質問文が入力されると、第1の実施形態と同様にして、情報タイプ判定部102は、質問文に対して形態素解析を行うとともに、利用者が求めている情報タイプの判定を行う。検索部103において、検索条件の生成を行うとともに、検索条件拡張辞書114を参照して情報タイプに応じて検索タームを付加して検索条件を拡張する(ステップS801−ステップS803)。   When the user inputs a question sentence, the information type determination unit 102 performs morphological analysis on the question sentence and determines the information type requested by the user in the same manner as in the first embodiment. Do. The search unit 103 generates a search condition and adds a search term according to the information type with reference to the search condition expansion dictionary 114 to expand the search condition (steps S801 to S803).

検索部103は拡張した検索条件を用いて知識データベース220を検索し、検索結果上位の文書の情報抽出結果から利用者が求めている情報タイプに基づいて回答を求める。そして、出力部104から回答を出力する(ステップS804−ステップS806)。   The search unit 103 searches the knowledge database 220 using the extended search condition, and obtains an answer based on the information type requested by the user from the information extraction result of the document higher in the search result. And an answer is output from the output part 104 (step S804-step S806).

例えば「○×大統領の生まれた日は?」という質問文から、検索条件拡張により「○×」「大統領」「生まれた」「誕生日」「生年月日」という検索条件が生成されたとする。そして、図7のDOCUMENT_IDが00001である文書700が検索結果最上位だったとする。   For example, it is assumed that search conditions “XX”, “President”, “Born”, “Birthday”, and “Birth date” are generated from the question sentence “? Then, it is assumed that the document 700 with DOCUMENT_ID 00001 in FIG.

今、質問文は「○×大統領の生まれた日は?」であるから、情報タイプ判定部102で利用者が求めている情報タイプはDATEであると判定される。そこで、文書700の中で情報タイプDATEに合致し、かつ「○×」「生年月日」という検索タームの近くにある「△△△△年○月×日」という文字列を回答として求める。   Now, since the question sentence is “What was the day when the president was born?”, The information type determination unit 102 determines that the information type requested by the user is DATE. Therefore, the character string “ΔΔΔΔ year * month * day” that matches the information type DATE and is near the search term “◯ ×” “date of birth” in the document 700 is obtained as an answer.

尚、情報タイプがDATEである文字列が複数ある場合は、近傍にある検索タームの数とその距離(文字列と検索タームとの間にある文字数)とを用いて評価する。例えば、検索ターム数÷距離を評価値として評価を行っても良い。   When there are a plurality of character strings whose information type is DATE, evaluation is performed using the number of search terms in the vicinity and the distance (the number of characters between the character string and the search terms). For example, evaluation may be performed using the number of search terms ÷ distance as an evaluation value.

(本実施形態の効果)以上本実施形態によれば、質問応答システムにおいても利用者が求めている情報タイプに応じて適切な検索タームを付加することができる。   (Effects of the present embodiment) As described above, according to the present embodiment, an appropriate search term can be added according to the information type requested by the user in the question answering system.

(第3の実施形態)以下、図面を参照して本発明の第3の実施形態について説明する。図9は本実施形態の文書検索システムの構成を説明する図である。本実施形態では文書データを予めN個の文書データベース112−1から112−Nに分割している。これは、例えば新聞記事データを年代別や分野別に文書データベースに登録してあることに相当する。   (Third Embodiment) Hereinafter, a third embodiment of the present invention will be described with reference to the drawings. FIG. 9 is a diagram for explaining the configuration of the document search system of this embodiment. In the present embodiment, the document data is divided in advance into N document databases 112-1 to 112-N. This corresponds to, for example, registering newspaper article data in a document database by age group or field.

検索部103を除いては第1の実施形態と同様なので説明を省略する。検索部103は、後述する検索対象限定ルール900を用いて検索対象を限定して検索を行う。   Except for the search unit 103, the description is omitted because it is the same as the first embodiment. The search unit 103 performs a search by limiting the search target using a search target limiting rule 900 described later.

図10は、本実施形態における検索部103の処理を説明する図である。   FIG. 10 is a diagram for explaining processing of the search unit 103 in the present embodiment.

検索部103は情報タイプ判定部102から検索要求文の形態素解析結果と情報タイプ判定結果とを受け取る(ステップS1001)。検索部103は形態素解析結果から検索条件を生成する(ステップS1002)。   The search unit 103 receives the morphological analysis result and the information type determination result of the search request sentence from the information type determination unit 102 (step S1001). The search unit 103 generates a search condition from the morphological analysis result (step S1002).

検索部103は、検索対象限定ルール900を参照して、情報タイプ判定結果に応じて検索対象となる文書データベース112−x(x=1〜Nのいずれか、または複数)を限定する(ステップS1003)。そして、限定された文書データベース112−xに対して検索を行い(ステップS1004)、検索結果を出力部104に渡す(ステップS1005)。   The search unit 103 refers to the search target limitation rule 900 and limits the document database 112-x (x = 1 to N or a plurality of search targets) according to the information type determination result (step S1003). ). Then, the limited document database 112-x is searched (step S1004), and the search result is passed to the output unit 104 (step S1005).

図11に検索対象限定ルール900の一例を示す。検索対象限定ルール900は、検索対象限定トリガー1101と、限定方法1103と、情報タイプ1102とを有する。   FIG. 11 shows an example of the search target restriction rule 900. The search target limitation rule 900 includes a search target limitation trigger 1101, a limitation method 1103, and an information type 1102.

検索対象限定トリガー1101は、検索対象を限定する手がかりとなる情報である。本実施形態では、検索対象限定トリガー1101は正規表現パターンで記述しておく(尚、図11では、記載を簡略化するために本来の正規表現とは異なる表記にしてある。例えば、西暦の年号全般にマッチする正規表現は、簡略化して「XXXX年」と表記している。)。検索部103では、まず検索条件中に検索対象限定トリガー1101に合致する表現
があるかを調べる。
The search target limitation trigger 1101 is information that serves as a clue to limit the search target. In the present embodiment, the search target limiting trigger 1101 is described in a regular expression pattern (in FIG. 11, the description is different from the original regular expression in order to simplify the description. For example, the year of the year Regular expressions that match all issues are abbreviated as “XXXX year”.) The search unit 103 first checks whether there is an expression that matches the search target limitation trigger 1101 in the search condition.

情報タイプ1102は、情報タイプ判定部102の判定結果に応じて限定の仕方を変えるための情報である。情報タイプ1102の各項目の値は、情報タイプ判定部102で判定可能な情報タイプのいずれかに該当するか、若しくは「その他」という値を持つ。検索対象限定トリガー1101の各項目は独立に情報タイプ1102の項目を持つ。   The information type 1102 is information for changing the way of limitation according to the determination result of the information type determination unit 102. The value of each item of the information type 1102 corresponds to one of the information types that can be determined by the information type determination unit 102, or has a value of “other”. Each item of the search target limitation trigger 1101 has an item of information type 1102 independently.

限定方法1103は、実際の限定手法を持つ情報である。限定情報1103の各項目の値は、例えば検索すべきデータベースの特徴(分野・年代等)を表すものか、若しくは「限定しない」という値である。情報タイプ1102の各項目は限定方法1103の各項目と関連付けられている。情報タイプ1102のどの項目も、対応する限定方法1103の項目を一つだけ持つ。   The limiting method 1103 is information having an actual limiting method. The value of each item of the limited information 1103 represents, for example, the characteristics (field, age, etc.) of the database to be searched, or a value “not limited”. Each item of the information type 1102 is associated with each item of the limiting method 1103. Every item of the information type 1102 has only one corresponding restriction method 1103 item.

図11では、検索対象限定トリガー1101が「XXXX年」という項目については、情報タイプ1102として「ACCIDENT(事故)」「EVENT(行事)」「その他」という項目が設定してあり、各項目はそれぞれ限定方法1103として「XXXX年以降」「(XXXX−1)年以降」「限定しない」という項目と関連付けられている。   In FIG. 11, for items whose search target limitation trigger 1101 is “XXXX year”, items “ACCIDENT (accident)”, “EVENT (event)”, and “others” are set as the information type 1102, and each item is The limiting method 1103 is associated with the items “after XXXXXX”, “after (XXXX-1)”, and “not limited”.

限定方法1103をこのように設定した趣旨は次のとおりである。「ACCIDENT(事故)」は事前に予測することができない性質の事象である。よって事故が起こる以前の情報を検索する意味はないと考えられる。一方「EVENT(行事)」はその行事が実行される前から話題になり、情報が流れる性質の事象である。従って、事前に遡って検索範囲を広く設定する方が検索結果に良い影響を与えると考えられるからである。   The purpose of setting the limiting method 1103 in this way is as follows. “ACCIDENT” is an event that cannot be predicted in advance. Therefore, it is considered meaningless to search for information before the accident occurred. On the other hand, “EVENT (event)” is an event that becomes a topic before the event is executed and information flows. Therefore, it is considered that setting a wide search range retroactively affects the search results.

検索部103は検索対象限定トリガー1101と情報タイプ1102とで特定される限定方法1103に従って検索対象限定を行う。   The search unit 103 limits the search target according to the limiting method 1103 specified by the search target limiting trigger 1101 and the information type 1102.

以下、具体例を挙げながら、検索部103における検索対象限定ルール900を用いた検索対象の限定処理について説明する。   Hereinafter, the search target limiting process using the search target limiting rule 900 in the search unit 103 will be described with specific examples.

利用者の検索要求文に対して検索対象限定トリガー1101を用いた正規表現パターンマッチングを行う。検索要求文が例えば、
(検索要求文1)「1999年6月27日に起きた列車事故は何か」
(検索要求文2)「2002年に日韓共同で開催されたスポーツ行事は何か」
であるとすると、図11の「XXXX年」というトリガーがマッチし、(検索要求文1)は「XXXX=1999」となり、(検索要求文2)は「XXXX=2002」となる。
Regular expression pattern matching using the search target restriction trigger 1101 is performed on the user's search request text. For example, if the search request is
(Search Request 1) “What is the train accident that occurred on June 27, 1999?”
(Search Request 2) “What are sports events held jointly between Japan and Korea in 2002?”
11, the trigger “XXXX year” in FIG. 11 matches, (Search request sentence 1) becomes “XXXX = 1999”, and (Search request sentence 2) becomes “XXXX = 2002”.

仮に、情報タイプ判定部102で(検索要求文1)の情報タイプが「ACCIDENT(事故)」と判定され、(検索要求文2)の情報タイプが「EVENT(行事)」と判定されていたとする。   Suppose that the information type determination unit 102 determines that the information type of (search request sentence 1) is “ACCIDENT (accident)” and the information type of (search request sentence 2) is “EVENT (event)”. .

この場合、図11の「XXXX年」というトリガーが持つ情報タイプ1102の各項目に従って、(検索要求文1)については検索対照限定方法1103として「1999年以降」が選択される。(検索要求文2)については検索対照限定方法1103として「(2002−1)年以降」すなわち「2001年以降」という検索対象限定が選択されることになる。   In this case, according to each item of the information type 1102 included in the trigger “XXXX year” in FIG. 11, “after 1999” is selected as the search contrast limiting method 1103 for (search request sentence 1). For (search request sentence 2), the search target limitation “after (2002-1)”, that is, “after 2001” is selected as the search contrast limiting method 1103.

(本実施形態の効果)このように、本実施形態によれば、検索要求文から判定した情報タイプに応じて柔軟に検索対象を限定して検索を行うことができる。これにより利用者が求めている情報により近いものを検索結果として抽出しやすくなる。   (Effects of this embodiment) As described above, according to this embodiment, it is possible to flexibly limit the search object according to the information type determined from the search request sentence. As a result, information closer to the information requested by the user can be easily extracted as a search result.

(変形例)図12(a)(b)及び図13(a)(b)は検索部103において検索対象を限定した結果を利用者に提示する場合のインターフェースの一例の図である。利用者がチェックボックス1201〜1206及びチェックボックス1301〜1304を操作して限定範囲を適宜変更しても良い。   (Modification) FIGS. 12A and 12B and FIGS. 13A and 13B are diagrams showing an example of an interface when the search unit 103 presents the result of limiting the search target to the user. The user may change the limited range as appropriate by operating the check boxes 1201 to 1206 and the check boxes 1301 to 1304.

(第4の実施形態)図14は本発明の第4の実施形態である質問応答システムの構成を説明する図である。第3の実施形態が文書のリストを出力する文書検索システムであったのに対し、本実施形態は質問文に対する回答を出力する質問応答システムである点が異なる。また、第2の実施形態では使用する知識データベースの限定を行っていないが、本実施形態では利用者の質問文に応じて限定を行うようにする点で異なる。以下、第2の実施形態及び第3の実施形態と異なる点を中心に説明する。   (Fourth Embodiment) FIG. 14 is a diagram for explaining the configuration of a question answering system according to a fourth embodiment of the present invention. The third embodiment is a document retrieval system that outputs a list of documents, whereas the present embodiment is a question answering system that outputs an answer to a question sentence. Further, the knowledge database to be used is not limited in the second embodiment, but the present embodiment is different in that the limitation is performed according to the question text of the user. The following description will focus on differences from the second and third embodiments.

本実施形態では、文書データを予め年代別或いは分野別等に分類しておき、それぞれに対して第2の実施形態と同様にして情報抽出部222で情報抽出を行い、N個の知識データベース220−1、220−2、・・・、220−Nを生成しておく。   In the present embodiment, document data is classified in advance by age or field, and information is extracted by the information extraction unit 222 in the same manner as in the second embodiment, and N knowledge databases 220 are extracted. -1, 220-2,..., 220-N are generated.

情報タイプ判定部102は第2の実施形態と同様にして、利用者の入力した質問文に対して形態素解析及び情報タイプの判定を行う。検索部103は第3の実施形態と同様に、情報タイプ判定結果と検索対象限定ルール900とを用いて検索対象とする知識データベース200−x(x=1〜N)を限定する。限定された知識データベース200−x(x=1〜N)を検索して回答を選定し、出力部104に出力する。尚、知識データベースは1個に限定する必要はなく、複数個に限定しても良い。   As in the second embodiment, the information type determination unit 102 performs morphological analysis and information type determination on a question sentence input by the user. Similarly to the third embodiment, the search unit 103 limits the knowledge database 200-x (x = 1 to N) to be searched using the information type determination result and the search target limiting rule 900. The limited knowledge database 200-x (x = 1 to N) is searched to select an answer and output to the output unit 104. The knowledge database need not be limited to one, and may be limited to a plurality.

図15は本実施形態における検索部103の処理の流れを説明する図である。検索部103は、情報タイプ判定部102から利用者が入力した質問文の形態素解析結果及び情報タイプ判定結果とを受け取る(ステップS1501)。形態素解析結果に基づいて検索条件を作成する(ステップS1502)。   FIG. 15 is a diagram for explaining the flow of processing of the search unit 103 in this embodiment. The search unit 103 receives the morphological analysis result and the information type determination result of the question text input by the user from the information type determination unit 102 (step S1501). Search conditions are created based on the morphological analysis results (step S1502).

次に、第3の実施形態と同様に、例えば、図11に示したような検索対象限定ルール900を用いて検索対象限定方法を決定し、検索対象とする知識データベースを限定する。(ステップS1503)。   Next, as in the third embodiment, for example, a search target limiting method is determined using a search target limiting rule 900 as shown in FIG. 11, and the knowledge database to be searched is limited. (Step S1503).

そして、限定された範囲で知識データベースの検索を行って(ステップS1504)、検索結果上位の文書の情報抽出結果から情報タイプ判定結果に合致する回答を取得し(ステップS1505)、回答を出力部104に渡す(ステップS1506)。   Then, the knowledge database is searched within a limited range (step S1504), and an answer that matches the information type determination result is obtained from the information extraction result of the upper document of the search result (step S1505). (Step S1506).

例えば、「1999年6月27日に起きた列車事故は何か」という質問文が入力されたとする。情報タイプ判定部102で、この質問文の情報タイプは「ACCIDENT(事故)」と判定される。検索部103で、この質問文に対する検索条件が生成されるとともに、検索対象の限定が行われる。ここでは図11に示した検索対象限定ルール900が用いられるとすると、検索対象の限定方法は「1999年以降」となる。   For example, it is assumed that a question text “What is a train accident that occurred on June 27, 1999” is input. The information type determination unit 102 determines that the information type of this question is “ACCIDENT (accident)”. The search unit 103 generates a search condition for the question sentence and limits the search target. Here, if the search target limiting rule 900 shown in FIG. 11 is used, the search target limiting method is “after 1999”.

検索部103は「1999年以降」の情報が格納された知識データベースを検索する。検索の結果、最上位に得られた文書から第2の実施形態と同様にして<ACCIDENT>というタグのついた文字列を抽出し、出力部104を介して利用者に回答として提示する。   The retrieval unit 103 retrieves a knowledge database storing information “after 1999”. As a result of the search, the character string with the tag <ACCIDENT> is extracted from the document obtained at the top as in the second embodiment, and presented to the user via the output unit 104 as an answer.

(本実施形態の効果)以上に説明したように、本実施形態では質問文から検出された情報タイプに応じた柔軟な検索対象限定を行うことができるため、知識データベースのから
適切な回答を得ることができるようになる。
(Effects of the present embodiment) As described above, in the present embodiment, flexible search target limitation according to the information type detected from the question sentence can be performed, so an appropriate answer is obtained from the knowledge database. Will be able to.

(変形例)第4の実施形態では知識データベースが複数あるとしたが、単一のデータベースとして構成し、「年代」「分野」等の属性情報を持たせるようにしても良い。この場合、検索対象限定は属性情報に対する検索条件として用いれば良い。   (Modification) In the fourth embodiment, there are a plurality of knowledge databases. However, it may be configured as a single database and may have attribute information such as “age” and “field”. In this case, the search target limitation may be used as a search condition for the attribute information.

また、以上に説明した第1〜第4の実施形態は、組み合わせて実施しても良い。すなわち、文書検索と質問応答の両方を行うシステムを構築しても良いし、情報タイプに応じた検索条件拡張と情報タイプに応じた検索対象の限定との両方を行うシステムを構築しても良い。   Moreover, you may implement combining the 1st-4th embodiment demonstrated above. That is, a system that performs both document search and question answering may be constructed, or a system that performs both search condition expansion according to the information type and search target limitation according to the information type may be constructed. .

また、第1〜第4の実施形態の説明では日本語による文書検索および質問応答について説明したが、本発明は言語の種類に限定されるものではない。   In the description of the first to fourth embodiments, the document search and the question answering in Japanese have been described. However, the present invention is not limited to the language type.

第1の実施形態の文書検索システムの図。The figure of the document search system of a 1st embodiment. 第1の実施形態の情報タイプ判定部の処理の流れの図。The figure of the flow of processing of the information type judgment part of a 1st embodiment. 第1の実施形態の検索部の処理の流れの図。The figure of the flow of processing of the search part of a 1st embodiment. 検索条件拡張辞書のデータ構造の一例の図。The figure of an example of the data structure of a search condition expansion dictionary. (a)情報タイプ判定結果及び検索条件修正結果を利用者に提示するインターフェースの一例。(b)情報タイプ判定結果及び検索条件修正結果を利用者に提示するインターフェースの一例。(A) An example of an interface for presenting information type determination results and search condition correction results to the user. (B) An example of an interface for presenting information type determination results and search condition correction results to the user. 第2の実施形態の質問応答システムの図。The figure of the question answering system of a 2nd embodiment. 情報抽出結果のデータ構造の一例の図。The figure of an example of the data structure of an information extraction result. 第2の実施形態の検索部の処理の流れの図。The figure of the flow of processing of the search part of a 2nd embodiment. 第3の実施形態の文書検索システムの図。The figure of the document search system of 3rd Embodiment. 第3の実施形態における検索部の処理の流れの図。The figure of the flow of processing of the search part in a 3rd embodiment. 検索対象限定ルールの一例の図。The figure of an example of a search object limitation rule. (a)検索対象限定結果を利用者に提示するインターフェースの一例。(b)検索対象限定結果を利用者に提示するインターフェースの一例の図。(A) An example of an interface for presenting a search target limited result to a user. (B) The figure of an example of the interface which presents a search object limitation result to a user. (a)検索対象限定結果を利用者に提示するインターフェースの一例の図。(b)検索対象限定結果を利用者に提示するインターフェースの一例の図。(A) The figure of an example of the interface which presents a search object limitation result to a user. (B) The figure of an example of the interface which presents a search object limitation result to a user. 第4の実施形態の質問応答システムの図。The figure of the question answering system of a 4th embodiment. 第4の実施形態の検索部の処理の流れの図。The figure of the flow of processing of the search part of a 4th embodiment. 第1〜第4実施形態で利用するコンピュータの図。The figure of the computer utilized in 1st-4th embodiment.

符号の説明Explanation of symbols

101 入力部
102 情報タイプ判定部
103 検索部
104 出力部
111 情報タイプ判定知識
112、112−1、112−2、112−N 文書データベース
113 形態素解析辞書
114 検索条件拡張辞書
220、220−1、220−2、220−N 知識データベース
221 登録部
222 情報抽出部
223 抽出用知識
900 検索対象限定ルール
101 Input unit 102 Information type determination unit 103 Search unit 104 Output unit 111 Information type determination knowledge 112, 112-1, 112-2, 112-N Document database 113 Morphological analysis dictionary 114 Search condition expansion dictionary 220, 220-1, 220 -2, 220-N Knowledge database 221 Registration unit 222 Information extraction unit 223 Extraction knowledge 900 Search target limitation rule

Claims (11)

文書データを記憶している文書データベースを利用者が入力した検索要求文に基づいて検索する検索システムであって、
利用者の検索要求文を入力する入力部と、
前記検索要求文から利用者が求めている情報タイプを判定する情報タイプ判定部と、
前記検索要求文から検索タームを抽出し、
前記検索タームと、
前記情報タイプに応じた語句と、
を用いて検索条件を生成する検索条件生成部と、
前記検索条件を用いて前記文書データベースを検索する検索部と、
この検索結果を利用者に提示する出力部と、
を備える文書検索システム。
A search system for searching a document database storing document data based on a search request sentence input by a user,
An input unit for inputting a user search request sentence;
An information type determination unit that determines an information type requested by the user from the search request sentence;
Extracting a search term from the search request sentence;
The search term;
A phrase according to the information type;
A search condition generation unit that generates a search condition using
A search unit for searching the document database using the search condition;
An output unit for presenting the search result to the user;
A document retrieval system comprising:
前記検索条件生成部は、
前記検索要求文から検索タームを抽出する手段と、
前記検索タームを用いて検索条件を生成する手段と、
前記情報タイプに応じた語句を用いて前記検索条件を拡張する手段と、
を備える、請求項1記載の文書検索システム。
The search condition generation unit
Means for extracting a search term from the search request sentence;
Means for generating a search condition using the search term;
Means for extending the search condition using a phrase according to the information type;
The document search system according to claim 1, comprising:
前記文書データベースは、分類別に文書データを記憶している文書データベースであり、
前記検索条件を拡張する手段は、前記検索条件に、前記文書データベースの検索範囲を前記分類のうち前記情報タイプに応じたもの限定する条件を付加する手段を備える、
請求項2記載の文書検索システム。
The document database is a document database storing document data by classification,
The means for expanding the search condition comprises means for adding a condition for limiting the search range of the document database according to the information type in the classification to the search condition.
The document search system according to claim 2.
分類別に文書データを記憶している文書データベースを利用者が入力した検索要求文に基づいて検索する検索システムであって、
利用者の検索要求文を入力する入力部と、
前記検索要求文から利用者が求めている情報タイプを判定する情報タイプ判定部と、
前記検索要求文から検索条件を生成する検索条件生成部と、
前記文書データベースの検索範囲を前記分類のうち前記情報タイプに応じたものに限定する検索対象限定部と、
この限定された検索範囲内で、前記検索条件を用いて前記文書データベースを検索する検索部と、
この検索結果を利用者に提示する出力部と、
を備える文書検索システム。
A search system for searching a document database storing document data by classification based on a search request sentence input by a user,
An input unit for inputting a user search request sentence;
An information type determination unit that determines an information type requested by the user from the search request sentence;
A search condition generator for generating a search condition from the search request sentence;
A search target limiting unit that limits a search range of the document database to those according to the information type among the classifications;
Within this limited search range, a search unit that searches the document database using the search condition;
An output unit for presenting the search result to the user;
A document retrieval system comprising:
知識データを記憶している知識データベースを利用者が入力した質問文に基づいて検索し、前記質問文に対する回答を求める質問応答システムであって、
利用者の質問文を入力する入力部と、
前記質問文から利用者が求めている情報タイプを判定する情報タイプ判定部と、
前記質問分から検索タームを抽出し、
前記検索タームと、
前記情報タイプに応じた語句と、
を用いて検索条件を生成する検索条件生成部と、
前記検索条件を用いて前記知識データベースを検索する検索部と、
この検索結果に基づいて質問文に対する回答を生成する回答生成部と、
この生成した回答を利用者に提示する出力部と、
を備える質問応答システム。
A question answering system that searches a knowledge database storing knowledge data based on a question sentence input by a user and obtains an answer to the question sentence,
An input unit for inputting a user's question text;
An information type determination unit for determining an information type requested by the user from the question sentence;
Extract search terms from the question,
The search term;
A phrase according to the information type;
A search condition generation unit that generates a search condition using
A search unit for searching the knowledge database using the search condition;
An answer generator for generating an answer to the question sentence based on the search results;
An output unit for presenting the generated answer to the user;
A question answering system comprising:
前記検索条件生成部は、
前記質問文から検索タームを抽出する手段と、
前記検索タームから検索条件を生成する手段と、
前記情報タイプに応じた語句を用いて、前記検索条件を拡張する手段と、
を備える請求項5記載の質問応答システム。
The search condition generation unit
Means for extracting a search term from the question sentence;
Means for generating a search condition from the search term;
Means for extending the search condition using a phrase according to the information type;
The question answering system according to claim 5 provided with.
前記知識データベースは、分類別に知識データを記憶している知識データベースであり、
前記検索条件を拡張する手段は、前記検索条件に、前記知識データベースの検索範囲を前記分類のうち前記情報タイプに応じたものに限定するための条件を付加する手段を備える、
請求項6記載の質問応答システム。
The knowledge database is a knowledge database storing knowledge data by classification,
The means for extending the search condition includes means for adding a condition for limiting the search range of the knowledge database to the search condition according to the information type among the classifications.
The question answering system according to claim 6.
分類別に知識データを記憶している知識データベースを、利用者が入力した質問文に基づいて検索し、前記質問に対する回答を求める質問応答システムであって、
利用者の質問文を入力する入力部と、
前記質問文から利用者が求めている情報タイプを判定する情報タイプ判定部と、
前記質問文から検索条件を生成する検索条件生成部と、
分類別に知識データを記憶している知識データベースと、
前記知識データベースの検索範囲を前記分類のうち前記情報タイプに応じたものに限定する検索対象限定部と、
前記検索条件を用いて、限定された検索範囲内で前記知識データベースを検索する検索部と、
検索結果を質問文に対する回答として利用者に提示する出力部と、
を備える質問応答システム。
It is a question answering system that searches a knowledge database storing knowledge data by classification based on a question sentence input by a user and obtains an answer to the question,
An input unit for inputting a user's question text;
An information type determination unit for determining an information type requested by the user from the question sentence;
A search condition generator for generating a search condition from the question sentence;
A knowledge database that stores knowledge data by category;
A search target limiting unit that limits a search range of the knowledge database to a type corresponding to the information type among the classifications;
A search unit that searches the knowledge database within a limited search range using the search condition;
An output unit that presents the search result to the user as an answer to the question text;
A question answering system comprising:
文書データを記憶している文書データベースから文書を検索する方法であって、
利用者からの検索要求文を受け、
前記検索要求文から利用者が求めている情報タイプを判定し、
前記検索要求文から検索タームを抽出して検索条件を生成し、
前記情報タイプに応じた語句を用いて前記検索条件を拡張し、
拡張された検索条件を用いて前記文書データベースを検索し、
検索結果を利用者に提示する、
文書検索方法。
A method of retrieving a document from a document database storing document data,
In response to a search request from a user,
Determine the information type that the user is seeking from the search request text,
A search term is generated by extracting a search term from the search request sentence,
Extending the search criteria with words according to the information type,
Search the document database using extended search criteria;
Present search results to users,
Document search method.
文書データを記憶している文書データベースから文書を検索する方法であって、
利用者からの検索要求文を受け、
前記検索要求文から利用者が求めている情報タイプを判定し、
前記検索要求文から検索タームを抽出し、
前記検索タームと前記情報タイプに応じた語句とを用いて検索条件を生成し、
前記検索条件を用いて前記文書データベースを検索し、
検索結果を利用者に提示する、
文書検索方法。
A method of retrieving a document from a document database storing document data,
In response to a search request from a user,
Determine the information type that the user is seeking from the search request text,
Extracting a search term from the search request sentence;
A search condition is generated using the search term and the phrase according to the information type,
Search the document database using the search condition,
Present search results to users,
Document search method.
分類別に文書データを記憶している文書データベースから文書を検索する方法であって、
利用者の検索要求文を受け、
前記検索要求文から利用者が求めている情報タイプを判定し、
前記検索要求文から検索条件を生成し、
前記文書データベースの検索範囲を前記分類のうち前記情報タイプに応じたものに限定し、
前記検索条件を用いて、限定された検索範囲内で前記文書データベースを検索し、
検索結果を利用者に提示する、
文書検索方法。
A method of retrieving a document from a document database storing document data by classification,
In response to a user search request,
Determine the information type that the user is seeking from the search request text,
Generating a search condition from the search request sentence;
The search range of the document database is limited to the classification according to the information type,
Using the search condition, search the document database within a limited search range,
Present search results to users,
Document search method.
JP2003293178A 2003-08-13 2003-08-13 Document search system, question answering system, document search method Expired - Fee Related JP4114927B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003293178A JP4114927B2 (en) 2003-08-13 2003-08-13 Document search system, question answering system, document search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003293178A JP4114927B2 (en) 2003-08-13 2003-08-13 Document search system, question answering system, document search method

Publications (2)

Publication Number Publication Date
JP2005063185A true JP2005063185A (en) 2005-03-10
JP4114927B2 JP4114927B2 (en) 2008-07-09

Family

ID=34370256

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003293178A Expired - Fee Related JP4114927B2 (en) 2003-08-13 2003-08-13 Document search system, question answering system, document search method

Country Status (1)

Country Link
JP (1) JP4114927B2 (en)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252380A (en) * 2005-03-14 2006-09-21 Fuji Xerox Co Ltd Question answering system, data retrieval method, and computer program
WO2008049206A1 (en) * 2006-10-27 2008-05-02 Looknow Ltd. Method and apparatus for reading documents and answering questions using material from these documents
JP2008250893A (en) * 2007-03-30 2008-10-16 Fujitsu Ltd Information retrieval device, information retrieval method and its program
JP2009037603A (en) * 2007-07-05 2009-02-19 Nec (China) Co Ltd Query requirement expander and query requirement expansion method
US7580835B2 (en) 2003-12-25 2009-08-25 Kabushiki Kaisha Toshiba Question-answering method, system, and program for answering question input by speech
WO2013046413A1 (en) * 2011-09-29 2013-04-04 富士通株式会社 Search method and information management device
JP2014085947A (en) * 2012-10-25 2014-05-12 Nippon Telegr & Teleph Corp <Ntt> Apparatus, method and program for answering question
JP2019121392A (en) * 2018-01-05 2019-07-22 Jfeスチール株式会社 Information search system
JP2021036409A (en) * 2019-08-30 2021-03-04 トッパン・フォームズ株式会社 Search support system, search support method and program
JP2021036408A (en) * 2019-08-30 2021-03-04 トッパン・フォームズ株式会社 Search support system, learning system, method for supporting search, and program
US20210397786A1 (en) * 2018-11-02 2021-12-23 Universal Entertainment Corporation Information providing system, information providing method, and data structure of knowledge data

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7580835B2 (en) 2003-12-25 2009-08-25 Kabushiki Kaisha Toshiba Question-answering method, system, and program for answering question input by speech
JP4645242B2 (en) * 2005-03-14 2011-03-09 富士ゼロックス株式会社 Question answering system, data retrieval method, and computer program
JP2006252380A (en) * 2005-03-14 2006-09-21 Fuji Xerox Co Ltd Question answering system, data retrieval method, and computer program
WO2008049206A1 (en) * 2006-10-27 2008-05-02 Looknow Ltd. Method and apparatus for reading documents and answering questions using material from these documents
JP2008250893A (en) * 2007-03-30 2008-10-16 Fujitsu Ltd Information retrieval device, information retrieval method and its program
JP2009037603A (en) * 2007-07-05 2009-02-19 Nec (China) Co Ltd Query requirement expander and query requirement expansion method
US8180628B2 (en) 2007-07-05 2012-05-15 Nec (China) Co., Ltd. Apparatus and method for expanding natural language query requirement
JPWO2013046413A1 (en) * 2011-09-29 2015-03-26 富士通株式会社 Search method and information management apparatus
WO2013046413A1 (en) * 2011-09-29 2013-04-04 富士通株式会社 Search method and information management device
JP2014085947A (en) * 2012-10-25 2014-05-12 Nippon Telegr & Teleph Corp <Ntt> Apparatus, method and program for answering question
JP2019121392A (en) * 2018-01-05 2019-07-22 Jfeスチール株式会社 Information search system
US20210397786A1 (en) * 2018-11-02 2021-12-23 Universal Entertainment Corporation Information providing system, information providing method, and data structure of knowledge data
JP2021036409A (en) * 2019-08-30 2021-03-04 トッパン・フォームズ株式会社 Search support system, search support method and program
JP2021036408A (en) * 2019-08-30 2021-03-04 トッパン・フォームズ株式会社 Search support system, learning system, method for supporting search, and program
JP7234078B2 (en) 2019-08-30 2023-03-07 トッパン・フォームズ株式会社 SEARCH SUPPORT SYSTEM, LEARNING SYSTEM, SEARCH SUPPORT METHOD, AND PROGRAM
JP7234079B2 (en) 2019-08-30 2023-03-07 トッパン・フォームズ株式会社 SEARCH SUPPORT SYSTEM, SEARCH SUPPORT METHOD, AND PROGRAM

Also Published As

Publication number Publication date
JP4114927B2 (en) 2008-07-09

Similar Documents

Publication Publication Date Title
Maynard et al. Architectural elements of language engineering robustness
JP5362095B2 (en) Input method editor
US20060173682A1 (en) Information retrieval system, method, and program
JP2012248210A (en) System and method for retrieving content of complicated language such as japanese
JP4347226B2 (en) Information extraction program, recording medium thereof, information extraction apparatus, and information extraction rule creation method
KR20100047221A (en) Dictionary word and phrase determination
JP4114927B2 (en) Document search system, question answering system, document search method
Soni et al. A systematic review of automated grammar checking in English language
JP4631795B2 (en) Information search support system, information search support method, and information search support program
US20060248037A1 (en) Annotation of inverted list text indexes using search queries
Pouliquen et al. Automatic construction of multilingual name dictionaries
JP5463494B2 (en) Technology trend information generator
van der Meer et al. A framework for automatic annotation of web pages using the Google rich snippets vocabulary
JP5491446B2 (en) Topic word acquisition apparatus, method, and program
JP5285491B2 (en) Information retrieval system, method and program, index creation system, method and program,
Surdeanu et al. Design and performance analysis of a factoid question answering system for spontaneous speech transcriptions
JP4953440B2 (en) Morphological analysis device, morphological analysis method, morphological analysis program, and recording medium storing computer program
JP2008234003A (en) Medicine information management program, medicine information management device and medicine information management method
JPH11238051A (en) Chinese input conversion processor, chinese input conversion processing method and recording medium stored with chinese input conversion processing program
JP2010191851A (en) Article feature word extraction device, article feature word extraction method and program
JP5326781B2 (en) Extraction rule creation system, extraction rule creation method, and extraction rule creation program
JPH1145249A (en) Information retrieval device and computer-readable recording medium where program for making computer function as same device is recorded
JP7302267B2 (en) Search program, search method and search device
JP4145776B2 (en) Question answering apparatus and question answering method
JP4390039B2 (en) Search system and method

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050415

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070928

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080414

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees