JP2014085874A - Information search device, information search system, and information search method - Google Patents
Information search device, information search system, and information search method Download PDFInfo
- Publication number
- JP2014085874A JP2014085874A JP2012234811A JP2012234811A JP2014085874A JP 2014085874 A JP2014085874 A JP 2014085874A JP 2012234811 A JP2012234811 A JP 2012234811A JP 2012234811 A JP2012234811 A JP 2012234811A JP 2014085874 A JP2014085874 A JP 2014085874A
- Authority
- JP
- Japan
- Prior art keywords
- search
- information
- candidate
- attribute
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 188
- 230000008569 process Effects 0.000 claims description 171
- 238000001514 detection method Methods 0.000 claims description 46
- 238000004891 communication Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 abstract description 31
- 238000010586 diagram Methods 0.000 description 12
- 239000000284 extract Substances 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 241000233805 Phoenix Species 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、ユーザが所望する所望情報を検索する情報検索装置、当該情報検索装置を備える情報検索システム、及び当該情報検索装置が行う情報検索方法に関する。 The present invention relates to an information search apparatus that searches for desired information desired by a user, an information search system including the information search apparatus, and an information search method performed by the information search apparatus.
従来、音声認識技術やタッチパネルを活用したユーザインタフェースの進化、無線通信技術の進化により、ユーザからの特定の分野に限定されない様々な分野に関する質問に回答するマルチドメイン型の質問応答システムが普及しつつある。 Conventionally, multi-domain question answering systems that answer questions related to various fields, not limited to specific fields, are becoming widespread due to the advancement of user interfaces using voice recognition technology and touch panels, and the advancement of wireless communication technology. is there.
マルチドメイン型の質問応答システムでは、ユーザの日常生活に関するあらゆる質問が想定されており、映画といったエンターテイメントに関する情報、地理歴史といった一般常識の情報等についての問い合わせに対して回答する。これらの情報は、システム内部のデータベース管理システム又はシステムと通信接続可能な外部サービス実施サーバ等から取得される。 In the multi-domain question answering system, all questions related to the daily life of the user are assumed, and answers to inquiries about information about entertainment such as movies, information on common sense such as geographic history, and the like. These pieces of information are acquired from a database management system in the system or an external service execution server that can be connected to the system.
情報を検索するにあたって、ユーザが問い合わせた対象物(エンティティ)が格納されているデータベースから如何にして適切にエンティティを取り出すかが重要である。データベースに格納された情報をユーザが全て把握しているとは限らないため、ユーザが入力した検索フレーズ(検索ワード)をそのまま用いて検索しても、検索結果が適切に出力されるとは限らない。例えば、ユーザが、「テリーポッターと秘密の部屋」という作品名を取り出すことを意図して、「テリーポッター」という検索ワードを指定しても、「テリーポッターと秘密の部屋」のみが検索結果として出力される可能性は低いことからユーザにとっての利便性が低くなることがある。 When retrieving information, it is important how to properly extract an entity from a database in which an object (entity) inquired by a user is stored. Since the user does not always know all the information stored in the database, even if the search phrase (search word) input by the user is used as it is, the search result is not always output appropriately. Absent. For example, even if the user specifies the search word “Terry Potter” with the intention of taking out the work name “Terry Potter and the Secret Room”, only “Terry Potter and the Secret Room” is the search result. Since the possibility of output is low, the convenience for the user may be low.
このような問題に対処する場合、前方一致検索の実施が検討されることが一般的である。前方一致検索は、検索ワードの文字列の表現を先頭(前方)から全て含む文字列を、データベースの中から検索して検索結果として出力する方法である。前方一致検索を行うことにより、上記の例を用いれば、「テリーポッターと秘密の部屋」、「テリーポッターと不死鳥の騎士団」といった、先頭から「テリーポッター」を含む作品名を全て検索結果として出力することができる。これにより、シリーズを構成する作品群の作品名を、作品名のサブタイトルに関係なく取り出すこと等が可能なため、ユーザが意図した作品名を列挙して出力できる可能性がある。 When dealing with such a problem, it is common to consider performing a forward matching search. The forward matching search is a method of searching a database for a character string including all of the expression of the character string of the search word from the beginning (front) and outputting it as a search result. If you use the above example by performing a forward match search, all the titles that contain “Terry Potter” from the top, such as “Terry Potter and the Secret Room” and “Terry Potter and the Order of the Phoenix”, will be used as search results. Can be output. As a result, it is possible to extract the work names of the work groups constituting the series regardless of the subtitles of the work names, and thus there is a possibility that the work names intended by the user can be listed and output.
しかしながら、前方一致検索を実施すると、様々に表現された作品名が検索対象となるため、ユーザが意図していないものも検索結果として出力されてしまう可能性もある。例えば、「テリー」という作品名の作品が存在している状況で、ユーザが、「テリーポッターと秘密の部屋」を検索結果として得ようとするために、「テリー」を検索ワードとして指定したとする。この場合、「テリーポッターと秘密の部屋」及び「テリーポッターと不死鳥の騎士団」だけでなく、ユーザが意図していない「テリー」も検索結果として含まれて出力されてしまう。 However, when the forward matching search is performed, since variously expressed work names are to be searched, there is a possibility that what is not intended by the user may be output as a search result. For example, in the situation where a work with the title "Terry" exists, the user specifies "Terry" as a search word in order to obtain "Terry Potter and the Secret Room" as a search result. To do. In this case, not only “Terry Potter and the Secret Room” and “Terry Potter and the Order of the Phoenix” but also “Terry” which is not intended by the user is included and output as a search result.
例えば、特許文献1に記載のナビゲーション装置では、ユーザにより入力された文字に対して部分一致するキーワードを絞り込み、選択可能なキーワードとして表示する。ユーザは、該当するキーワードを選択することにより、入力操作を省略することができる。例えば、最短一文字の入力操作と選択操作の計二つの操作により、三文字以上のキーワードを選択することで、操作を短縮することが可能になる。 For example, in the navigation device described in Patent Document 1, keywords that partially match a character input by a user are narrowed down and displayed as selectable keywords. The user can omit the input operation by selecting the corresponding keyword. For example, the operation can be shortened by selecting a keyword having three or more characters by a total of two operations, that is, an input operation of the shortest one character and a selection operation.
しかしながら、ユーザによる音声検索等の一回のインタラクション(検索のための音声等の入力から、出力された検索結果の確認までの一連の操作)による、ユーザの心理面への負担(コスト)及びユーザを待たせることの負担を考慮すると、適切な検索結果を出力するまでに何度もユーザに検索操作をさせることは望ましくない。このため、ユーザによる一度の検索ワードの指定で、より適切な検索結果を出力することが求められる。 However, the user's psychological burden (cost) and user's psychological burden caused by a single interaction (a series of operations from input of speech for search to confirmation of output search results) by the user, etc. In view of the burden of waiting, it is not desirable for the user to perform a search operation many times before outputting an appropriate search result. For this reason, it is required to output a more appropriate search result by specifying the search word once by the user.
そこで本発明は、ユーザによる一度の検索ワードの指定で、より適切な検索結果を出力することが可能な情報検索装置、情報検索システム、及び情報検索方法を提供することを目的とする。 Accordingly, an object of the present invention is to provide an information search device, an information search system, and an information search method that can output a more appropriate search result by specifying a search word once by a user.
本発明の一形態に係る情報検索装置は、ユーザが所望する所望情報を検索する情報検索装置であって、所望情報を検索するための検索語を取得する検索語取得手段と、検索語取得手段により取得された検索語から、所望情報に関連する関連ワードと、所望情報の属性を示す属性情報とを検出する検出手段と、関連ワードの候補である関連ワード候補情報と、属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、検出手段により検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、検出手段により検出された属性情報に対応付けられている、所望情報を検索する第一の検索処理を行う検索手段と、を備え、検索手段は、第一の検索処理の検索結果がゼロ件の場合に、候補記憶手段から、検出手段により検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、所望情報を検索する第二の検索処理を行う、ことを特徴とする。 An information search apparatus according to an aspect of the present invention is an information search apparatus that searches for desired information desired by a user, and includes a search word acquisition unit that acquires a search word for searching for desired information, and a search word acquisition unit Detection means for detecting a related word related to desired information and attribute information indicating an attribute of the desired information, related word candidate information that is a candidate for the related word, and candidate attribute information The related word that completely matches the related word detected by the detecting means from the candidate storing means for storing the attribute candidate information, the related word candidate information and the desired information specified from the attribute candidate information in association with each other. Search means for performing a first search process for searching for desired information, which is associated with the candidate information and associated with the attribute information detected by the detection means; The search means is associated with the related word candidate information partially matching with the related word detected by the detection means from the candidate storage means when the search result of the first search process is zero. A second search process for searching for desired information is performed.
本発明の一形態に係る情報検索装置によれば、検索語が取得され、取得された検索語から上記の関連ワードと属性情報とが検出される。そして、検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに属性情報に対応付けられている所望情報を検索する第一の検索処理が行われる。ここで、第一の検索処理の検索結果がゼロ件の場合に、検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている所望情報を検索する第二の検索処理が行われる。このように、上記の第一の検索処理(例として完全一致検索)の検索結果がゼロ件の場合に、検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている所望情報を検索する第二の検索処理(例として前方一致検索、後方一致検索等の部分一致検索)が行われるため、ユーザによる一度の検索語の指定で、より適切な検索結果を出力することが可能になる。 According to the information search device according to one aspect of the present invention, a search word is acquired, and the related word and the attribute information are detected from the acquired search word. Then, a first search process is performed for searching for desired information that is associated with the related word candidate information that completely matches the detected related word and that is associated with the attribute information. Here, when the search result of the first search process is zero, the second search process for searching for desired information associated with the related word candidate information partially matching the detected related word is performed. Is called. Thus, when the search result of the first search process (exact search as an example) is zero, desired information associated with the related word candidate information partially matching the detected related word Because the second search process (for example, partial match search such as forward match search and backward match search) is performed, more appropriate search results can be output by specifying the search term once by the user. become.
別の形態に係る情報検索装置では、検索手段は、第一の検索処理の検索結果がゼロ件の場合、且つ、予め定められた所定の文字数よりも関連ワードの文字数の方が大きい場合に、第二の検索処理を行ってもよい。 In the information search apparatus according to another aspect, the search means has zero search results in the first search process, and when the number of characters in the related word is larger than a predetermined number of characters, A second search process may be performed.
この形態では、第一の検索処理の検索結果がゼロ件の場合、且つ、予め定められた所定の文字数よりも関連ワードの文字数の方が大きい場合に、第二の検索処理が行われる。関連ワードの文字数の方が大きくなればなるほど、上記の第一の検索処理(例として完全一致検索)の検索結果がゼロ件になる可能性も高くなる。このため、所定の文字数よりも関連ワードの文字数の方が大きいため第二の検索処理を行う方がより適切な状態である場合に、第二の検索処理を行うことが可能になる。 In this form, the second search process is performed when the search result of the first search process is zero and the number of characters in the related word is larger than a predetermined number of characters. The greater the number of characters in the related word, the higher the possibility that the search result of the first search process (for example, exact match search) becomes zero. For this reason, since the number of characters of the related word is larger than the predetermined number of characters, the second search process can be performed when the second search process is more appropriate.
別の形態に係る情報検索装置では、検出手段により検出される属性情報と、所望情報に関連する関連ワードのカテゴリを示すカテゴリ情報とを、対応付けて記憶するカテゴリ記憶手段と、カテゴリ情報と、予め定められた所定の文字数とを、対応付けて記憶する文字数記憶手段と、を更に備え、検索手段は、検出手段により検出された属性情報と対応付けて記憶されるカテゴリ情報をカテゴリ記憶手段から取得し、当該カテゴリ情報と対応付けて記憶される予め定められた所定の文字数を文字数記憶手段から取得してもよい。 In an information search device according to another embodiment, category storage means for storing attribute information detected by the detection means and category information indicating a category of a related word related to desired information in association with each other, category information, A number-of-characters storage unit that stores a predetermined number of characters in association with each other, and the search unit stores category information stored in association with the attribute information detected by the detection unit from the category storage unit. A predetermined number of characters that are acquired and stored in association with the category information may be acquired from the character number storage means.
この形態では、検出された属性情報と対応付けて記憶されるカテゴリ情報が取得され、当該カテゴリ情報と対応付けて記憶される所定の文字数が取得される。検出された属性情報に適した所定の文字数が取得され、所定の文字数よりも関連ワードの文字数の方が大きいために第二の検索処理を行うのが、より適切な状態である場合に、第二の検索処理を行うことが可能になる。 In this form, category information stored in association with the detected attribute information is acquired, and a predetermined number of characters stored in association with the category information is acquired. When a predetermined number of characters suitable for the detected attribute information is acquired and the number of characters in the related word is larger than the predetermined number of characters, the second search process is performed in a more appropriate state. Second search processing can be performed.
別の形態に係る情報検索装置では、関連ワード候補情報と、当該関連ワード候補情報から派生した派生語とを、対応付けて記憶する派生語記憶手段を更に備え、検索手段は、検出手段により検出された関連ワードから派生した文字列と完全一致する派生語に対応付けて記憶される関連ワード候補情報に対応付けられている所望情報を候補記憶手段から検索する処理を第一の検索処理として行い、第一の検索処理の検索結果がゼロ件の場合に、検出手段により検出された関連ワードから派生した文字列と部分一致する派生語に対応付けて記憶される関連ワード候補情報に対応付けられている所望情報を候補記憶手段から検索する処理を第二の検索処理として行ってもよい。 The information search apparatus according to another aspect further includes derivative word storage means for storing related word candidate information and derivative words derived from the related word candidate information in association with each other, and the search means is detected by the detection means. A process for searching the desired information associated with the related word candidate information stored in association with the derived word that completely matches the character string derived from the related word is performed as the first search process. , When the search result of the first search process is zero, it is associated with the related word candidate information stored in association with the derived word partially matching the character string derived from the related word detected by the detecting means. A process for searching for desired information from the candidate storage means may be performed as the second search process.
この形態では、検出された関連ワードから派生した文字列と完全一致する派生語に対応付けて記憶される関連ワード候補情報に対応付けられている所望情報を候補記憶手段から検索する処理が第一の検索処理として行われ、第一の検索処理の検索結果がゼロ件の場合に、検出手段により検出された関連ワードから派生した文字列と部分一致する派生語に対応付けて記憶される関連ワード候補情報に対応付けられている所望情報を候補記憶手段から検索する処理が第二の検索処理として行われる。これにより、検出された関連ワードが、関連ワードとして適切なものから派生したものであっても、適切な関連ワードの取得及び検出が可能になる。 In this mode, the first process is to search the candidate storage means for desired information associated with the related word candidate information stored in association with the derived word that is completely matched with the character string derived from the detected related word. The related word stored in association with the derived word partially matching the character string derived from the related word detected by the detecting means when the search result of the first search process is zero. A process of searching for desired information associated with the candidate information from the candidate storage unit is performed as a second search process. As a result, even if the detected related word is derived from an appropriate related word, it is possible to acquire and detect an appropriate related word.
別の形態に係る情報検索装置では、検出手段は、検索語取得手段により取得された検索語から、関連ワードと属性情報との組を複数検出し、検索手段は、検出された関連ワードと属性情報との組を複数用いて第一の検索処理を行って検索結果が一件以上となった時点で当該検索結果を出力するとともに、第一の検索処理の検索結果がゼロ件の場合に、検出された関連ワードと属性情報との組を複数用いて第二の検索処理を行って検索結果が一件以上となった時点で当該検索結果を出力してもよい。 In the information search apparatus according to another aspect, the detection means detects a plurality of sets of related words and attribute information from the search words acquired by the search word acquisition means, and the search means detects the detected related words and attributes. When the first search process is performed using multiple pairs of information and the search result becomes one or more, the search result is output, and when the search result of the first search process is zero, The search result may be output when the second search process is performed using a plurality of pairs of detected related words and attribute information and the search result becomes one or more.
この形態では、検索語から、関連ワードと属性情報との組が複数検出され、検出された関連ワードと属性情報との組を複数用いて第一の検索処理を行って検索結果が一件以上となった時点で当該検索結果が出力されるとともに、第一の検索処理の検索結果がゼロ件の場合に、検出された関連ワードと属性情報との組を複数用いて第二の検索処理を行って検索結果が一件以上となった時点で当該検索結果が出力される。このように、検出された関連ワードと属性情報との組を複数用いて検索結果が一件以上となった時点で当該検索結果が出力されるため、検索処理に必要な時間を短縮することが可能になる。 In this form, a plurality of pairs of related words and attribute information are detected from the search word, and the first search process is performed using a plurality of pairs of detected related words and attribute information, and one or more search results are obtained. At that time, the search result is output, and when the search result of the first search process is zero, the second search process is performed using a plurality of combinations of the detected related word and attribute information. When the search result becomes one or more, the search result is output. In this way, since the search result is output when the search result becomes one or more using a plurality of combinations of the detected related word and attribute information, the time required for the search process can be shortened. It becomes possible.
本発明の一形態に係る情報検索システムは、ユーザが所望する所望情報を検索する情報検索装置と、当該情報検索装置と通信可能な通信端末とを備える情報検索システムであって、情報検索装置は、所望情報を検索するための検索語を通信端末から取得する検索語取得手段と、検索語取得手段により取得された検索語から、所望情報に関連する関連ワードと、所望情報の属性を示す属性情報とを検出する検出手段と、関連ワードの候補である関連ワード候補情報と、属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、検出手段により検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、検出手段により検出された属性情報に対応付けられている、所望情報を検索する第一の検索処理を行う検索手段と、を有し、検索手段は、第一の検索処理の検索結果がゼロ件の場合に、候補記憶手段から、検出手段により検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、所望情報を検索する第二の検索処理を行い、通信端末は、検索語を情報検索装置に送信する送信手段と、検索手段による第一の検索処理又は第二の検索処理の検索結果を情報検索装置から取得する結果取得手段と、を有する、ことを特徴とする。 An information search system according to an aspect of the present invention is an information search system including an information search device that searches for desired information desired by a user and a communication terminal that can communicate with the information search device. A search word acquisition means for acquiring a search word for searching for desired information from the communication terminal, a related word related to the desired information from the search word acquired by the search word acquisition means, and an attribute indicating an attribute of the desired information Detection means for detecting information, related word candidate information that is a candidate for related words, attribute candidate information that is a candidate for attribute information, and desired information specified from the related word candidate information and the attribute candidate information The associated word candidate information that is completely matched with the associated word detected by the detecting means from the candidate storage means for storing the associated information. A search means for performing a first search process for searching for desired information associated with the attribute information detected by the search means, and the search means has zero search results in the first search process Then, a second search process is performed for searching for desired information associated with the related word candidate information partially matching the related word detected by the detecting means from the candidate storage means. Transmission means for transmitting the information to the information search apparatus, and result acquisition means for acquiring the search result of the first search process or the second search process by the search means from the information search apparatus.
本発明の一形態に係る情報検索システムによれば、検索語が取得され、取得された検索語から上記の関連ワードと属性情報とが検出される。そして、検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに属性情報に対応付けられている所望情報を検索する第一の検索処理が行われる。ここで、第一の検索処理の検索結果がゼロ件の場合に、検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている所望情報を検索する第二の検索処理が行われる。このように、上記の第一の検索処理(例として完全一致検索)の検索結果がゼロ件の場合に、検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている所望情報を検索する第二の検索処理(例として前方一致検索、後方一致検索等の部分一致検索)が行われるため、ユーザによる一度の検索語の指定で、より適切な検索結果を出力することが可能になる。 According to the information search system of one aspect of the present invention, a search word is acquired, and the related word and attribute information are detected from the acquired search word. Then, a first search process is performed for searching for desired information that is associated with the related word candidate information that completely matches the detected related word and that is associated with the attribute information. Here, when the search result of the first search process is zero, the second search process for searching for desired information associated with the related word candidate information partially matching the detected related word is performed. Is called. Thus, when the search result of the first search process (exact search as an example) is zero, desired information associated with the related word candidate information partially matching the detected related word Because the second search process (for example, partial match search such as forward match search and backward match search) is performed, more appropriate search results can be output by specifying the search term once by the user. become.
本発明の一形態に係る情報検索方法は、ユーザが所望する所望情報を検索する情報検索装置が行う情報検索方法であって、所望情報を検索するための検索語を情報検索装置が取得する検索語取得ステップと、検索語取得ステップにより取得された検索語から、所望情報に関連する関連ワードと、所望情報の属性を示す属性情報とを情報検索装置が検出する検出ステップと、関連ワードの候補である関連ワード候補情報と、属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、検出ステップにより検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、検出ステップにより検出された属性情報に対応付けられている、所望情報を検索する第一の検索処理を情報検索装置が行う検索ステップと、を有し、検索ステップでは、第一の検索処理の検索結果がゼロ件の場合に、候補記憶手段から、検出ステップにより検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、所望情報を検索する第二の検索処理を情報検索装置が行う、ことを特徴とする。 An information search method according to an aspect of the present invention is an information search method performed by an information search device that searches for desired information desired by a user, wherein the information search device acquires a search word for searching for desired information. A word acquisition step; a detection step in which an information search device detects a related word related to desired information and attribute information indicating an attribute of the desired information from the search word acquired in the search word acquisition step; From the candidate storage means for storing the related word candidate information, the attribute candidate information that is a candidate of attribute information, and the desired information specified from the related word candidate information and the attribute candidate information in association with each other. Corresponds to the related word candidate information that completely matches with the related word detected by, and corresponds to the attribute information detected by the detection step A search step in which the information search apparatus performs a first search process for searching for desired information. In the search step, if the search result of the first search process is zero, candidate storage is performed. The information search apparatus performs a second search process for searching for desired information associated with the related word candidate information partially matching the related word detected by the detecting step.
本発明の一形態に係る情報検索方法によれば、検索語が取得され、取得された検索語から上記の関連ワードと属性情報とが検出される。そして、検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに属性情報に対応付けられている所望情報を検索する第一の検索処理が行われる。ここで、第一の検索処理の検索結果がゼロ件の場合に、検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている所望情報を検索する第二の検索処理が行われる。このように、上記の第一の検索処理(例として完全一致検索)の検索結果がゼロ件の場合に、検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている所望情報を検索する第二の検索処理(例として前方一致検索、後方一致検索等の部分一致検索)が行われるため、ユーザによる一度の検索語の指定で、より適切な検索結果を出力することが可能になる。 According to the information search method of one aspect of the present invention, a search word is acquired, and the related word and the attribute information are detected from the acquired search word. Then, a first search process is performed for searching for desired information that is associated with the related word candidate information that completely matches the detected related word and that is associated with the attribute information. Here, when the search result of the first search process is zero, the second search process for searching for desired information associated with the related word candidate information partially matching the detected related word is performed. Is called. Thus, when the search result of the first search process (exact search as an example) is zero, desired information associated with the related word candidate information partially matching the detected related word Because the second search process (for example, partial match search such as forward match search and backward match search) is performed, more appropriate search results can be output by specifying the search term once by the user. become.
本発明によれば、ユーザによる一度の検索ワードの指定で、より適切な検索結果を出力することが可能な情報検索装置、情報検索システム、及び情報検索方法を提供することができる。 According to the present invention, it is possible to provide an information search apparatus, an information search system, and an information search method capable of outputting a more appropriate search result by specifying a search word once by a user.
以下、添付図面を参照しながら本発明の好適な実施形態を説明する。なお、図面の説明において同一要素には同一符号を付し、重複する説明を省略する。 Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings. In the description of the drawings, the same elements are denoted by the same reference numerals, and redundant description is omitted.
(1)情報検索システムの構成
まず、本実施形態に係る情報検索システム全体の構成について、図1及び図2を用いて説明する。本実施形態に係る情報検索システム1は、本実施形態に係る情報検索装置であるデータベース検索装置10と、データベース検索装置10との通信ネットワークNWを介した通信が可能なユーザ端末20(通信端末)とを備えている。図1は、情報検索システム1の主な機能構成の概略を説明するための機能ブロック図であり、図2は、データベース検索装置10の主な物理構成の概略を説明するための物理構成図である。通信ネットワークNWは、インターネットなどの公衆通信網、専用線、同一物理装置内の通信バス等の組み合わせであってもよく、これらの物理的な配置は限定されない。
(1) Configuration of Information Search System First, the configuration of the entire information search system according to the present embodiment will be described with reference to FIGS. 1 and 2. The information search system 1 according to the present embodiment is a user terminal 20 (communication terminal) capable of communicating with a
データベース検索装置10は、ユーザ端末20のユーザが所望する情報である所望情報を検索するサーバ装置である。また、ユーザ端末20は、携帯電話端末、スマートフォン、パーソナルコンピュータ等の端末装置である。ユーザ端末20は、タッチパネルディスプレイ等のディスプレイ、CPU(Central Processing Unit)、記憶装置、通信モジュール、キーボード等の入力モジュール、録音モジュール、音声認識処理モジュール等の一般的な構成要素を有しており、これら構成要素の組合せにより、ユーザによる質問(検索語)の入力を受け付けてデータベース検索装置10に出力し、この出力に対するデータベース検索装置10からの回答の出力を受信することが可能である。
The
データベース検索装置10は、図2に示されるように、主な物理的な構成要素としてCPU11、主記憶装置であるRAM12(Random Access Memory)及びROM13(Read Only Memory)、通信を行うための通信モジュール14、並びにハードディスク等の補助記憶装置15等のハードウェアを備えるコンピュータとして構成される。なお、主記憶装置は、RAM、ROMといったものに限定されず、例えばフラッシュメモリといった主記憶装置の役割を果たすものに置き換えてもよい。データベース検索装置10は、上記の記憶装置に記憶されたプログラムにおける命令によって、これらの構成要素が動作することにより、各種処理を実行する機能が発揮される。
As shown in FIG. 2, the
データベース検索装置10は、図1に示されるように、主な機能的な構成要素として、入出力制御部101(検索語取得手段)、キー候補検出部102(検出手段)、完全一致制御部103(検索手段)、完全一致検索部104(検索手段)、エンティティ属性データベース105(候補記憶手段)、マッチング情報データベース106(派生語記憶手段)、前方一致制御部107(検索手段)、前方一致検索部108(検索手段)、エンティティカテゴリ判定部109(情報記憶手段)、属性エンティティカテゴリデータベース110(カテゴリ記憶手段)、前方一致文字数判定部111(判定手段)、及び前方一致最低文字数データベース112(文字数記憶手段)を有している。なお、データベース検索装置10における各機能は、単一のサーバ装置内に配置されていなくてもよく、物理的な構成は限定されない。各機能が、LAN(Local Area Network)やインターネットで接続された別個のサーバ装置内に配置されていてもよい。
As shown in FIG. 1, the
入出力制御部101は、ユーザ端末20との通信を行う通信処理部分である。例えば、入出力制御部101は、上記の所望情報を検索するための検索語を含む検索情報をユーザ端末20から受信して、受信した検索情報から検索語を取得する処理を行うことが可能である。入出力制御部101は、ユーザ端末20においてユーザにより入力された検索フレーズ(検索情報)を受信すると、この検索フレーズから検索語を取得する。そして、入出力制御部101は、この検索語をキー候補検出部102に渡す。
The input /
また、入出力制御部101は、完全一致制御部103又は前方一致制御部107により得られた後述の検索結果を受け取って、ユーザ端末20に出力して送信することが可能である。検索フレーズは、ユーザ端末20において入力された音声に対して音声認識処理が行われて得られた文字等の情報であってもよく、ユーザ端末20のキーボードやタッチパネルを用いて入力されたものであってもよい。検索フレーズは、例えば、ある映画の監督を問い合わせるものから、歴史的な事実を尋ねるものまで、様々な分野について質問する型式で入力される。検索フレーズの一例として、「テリーポッター」という題名の映画が存在すると仮定した場合に、「テリーポッターの監督は誰」といった自然文の検索フレーズ、「テリーポッター 監督」といった複数の検索キーワードの組合せである検索フレーズ等がある。
Further, the input /
キー候補検出部102は、入出力制御部101により取得された検索語から、所望情報に関連するエンティティ検索キー(関連ワード)と、所望情報の属性を示す属性検索キー(属性情報)とを決定して検出する演算処理部分である。エンティティ検索キーは、所望情報に関連する情報を表現するキーワードであり、属性検索キーは、所望情報の側面を示す属性を表現するキーワードである。キー候補検出部102は、入出力制御部101により取得された検索語によっては、この検索語から、エンティティ検索キーと属性検索キーとのペア(組)を複数決定して検出する場合がある。キー候補検出部102は、検出したエンティティ検索キー及び属性検索キー(場合によってはエンティティ検索キー及び属性検索キーの複数のペア)を完全一致制御部103に渡す。キー候補検出部102によるエンティティ検索キー及び属性検索キーの抽出方法には、後述する種々の方法が考えられる。
The key
例えば、入出力制御部101により取得された検索語が二つの検索キーワードの組合せである場合、キー候補検出部102は、一つ目の検索キーワードがエンティティ検索キーであると判断してエンティティ検索キーを検出し、二つ目の検索キーワードが属性検索キーであると判断して属性検索キーを検出する。より詳しくは、例えば、入出力制御部101により取得された検索語が「テリーポッター 監督」である場合、一つ目の検索キーワードである「テリーポッター」がエンティティ検索キーであるとして検出され、二つ目の検索キーワードである「監督」が属性検索キーであるとして検出される。
For example, when the search term acquired by the input /
また、エンティティ検索キー及び属性検索キーのペア(組み合わせ)は、複数であってもよい。例えば、入出力制御部101により取得された検索語が「テリーポッター 監督」である場合、「テリーポッター」がエンティティ検索キーであるとして検出されて且つ「監督」という文字列を含む「映画監督」が属性検索キーであるとして検出される組み合わせだけでなく、更に、「テリーポッター」がエンティティ検索キーであるとして検出されて且つ「監督」という文字列を含む「サッカーチーム監督」が属性検索キーであるとして検出される組み合わせが存在してもよい。すなわち、キー候補検出部102は、二つ目の検索キーワードを含む文字列を候補として予め複数記憶しておき、二つ目の検索キーワードの文字列を含むこれら複数の文字列が属性検索キーであるとして検出してもよい。この場合、エンティティ検索キー及び属性検索キーの一つ目のペアは「テリーポッター」及び「映画監督」となり、二つ目のペアは「テリーポッター」及び「サッカーチーム監督」となる。
There may be a plurality of pairs (combinations) of entity search keys and attribute search keys. For example, if the search term acquired by the input /
また、キー候補検出部102は、入出力制御部101により取得される検索語の候補である雛形(すなわち、自然文形態の質問パターン)と、当該検索語の候補に対応する属性検索キーとを対応付けて記憶することが可能である。例えば、入出力制御部101により取得される検索語の候補である雛形としての「〜の監督は誰」(〜の部分は任意の文字列であり、エンティティ検索キーとして判断される文字列)と、この候補に対応する属性検索キーとしての「監督」とが、対応付けて記憶される。そして、入出力制御部101により取得された検索語が「テリーポッターの監督は誰」である場合、キー候補検出部102が上記のパターンに当てはまったと判定することにより、「テリーポッター」がエンティティ検索キーであるとして検出され、「監督」が属性検索キーであるとして検出される。
Further, the key
エンティティ属性データベース105は、エンティティ検索キーの候補である「エンティティ」(関連ワード候補情報)と、属性検索キーの候補である「属性」(属性候補情報)と、当該エンティティ検索キー及び当該属性検索キーの組み合わせから特定される「値」(所望情報及びその候補)とを、対応付けて記憶するデータベースである。エンティティ属性データベース105のテーブル構成図の一例が、図3に示されている。ここでは、「エンティティ」としての「テリーポッターと秘密の部屋」と、「属性」としての「映画監督」と、「値」としての「AAAAAA」(すなわち、「テリーポッターと秘密の部屋」の映画監督の名前)とが、対応付けて記憶されている。エンティティ属性データベース105は、MySQL(登録商標)、PostgreSQL(登録商標)等のデータベース管理システムを用いて構成され、SQL等の問い合わせ言語を受け付けるシステムであってもよいし、データベース検索装置10の内部メモリに記憶されたハッシュ等のデータであってもよい。
The
マッチング情報データベース106は、エンティティ検索キーの候補である「エンティティ」(関連ワード候補情報)と、この「エンティティ」から派生した派生語とを、対応付けて記憶するデータベースである。マッチング情報データベース106の「エンティティ」における内容と、エンティティ属性データベース105の「エンティティ」における内容とは、通常、一致している。マッチング情報データベース106のテーブル構成図の一例が、図4に示されている。ここでは、「エンティティ」としての「テリーポッターと秘密の部屋」と、「エンティティマッチング文字列」としての「テリポタ1作目」とが、対応付けて記憶されている。上記の派生語は、上記の「エンティティ」の文字列に対して後述する正規化処理が行われて得られた文字列であり、例えば、上記の「エンティティ」の文字列の一部、「ー」(長音符)、「〜」(長音符)等の長音、「ッ」等の促音が除去処理された文字列、この除去処理された文字列の一部、この除去処理された文字列の一部に「エンティティ」の特徴、説明等を示す修飾ワードが付加された文字列、この除去処理された文字列の一部に「揺らぎ」(ユーザによって異なる可能性のある表記の違い)が加えられた文字列等である。マッチング情報データベース106は、MySQL(登録商標)、PostgreSQL(登録商標)等のデータベース管理システムを用いて構成され、SQL等の問い合わせ言語を受け付けるシステムであってもよいし、データベース検索装置10の内部メモリに記憶されたハッシュ等のデータであってもよい。
The matching
完全一致制御部103は、完全一致検索部104による完全一致検索処理(第一の検索処理)を制御する制御部分である。例えば、完全一致制御部103は、キー候補検出部102から受けたエンティティ検索キー及び属性検索キーを、完全一致検索部104に渡して、完全一致検索処理を実行させるよう指示する。また、完全一致制御部103は、完全一致検索部104から受信した検索結果が一件以上であると判定した場合に、当該検索結果を入出力制御部101に渡す。これにより、当該検索結果がユーザ端末20に出力される。なお、完全一致制御部103は、完全一致検索部104から受信した検索結果がゼロ件であると判定した場合に、キー候補検出部102から受けたエンティティ検索キー及び属性検索キーを、前方一致制御部107に渡す。
The complete
完全一致検索部104は、完全一致制御部103から受けたエンティティ検索キーと完全一致する上記の「エンティティ」に対応付けられているとともに、キー候補検出部102により検出された属性検索キーに対応付けられている(完全に一致)、所望情報を検索する完全一致検索処理実行部分である。完全一致検索部104は、エンティティ属性データベース105にアクセスして、エンティティ検索キーと完全一致する上記の「エンティティ」に対応付けられている「値」の候補を抽出し(「エンティティ」一つに対する「値」の候補が複数の場合もある)、この「値」の候補から、属性検索キーに対応付けられている「値」を抽出することにより、完全一致検索処理を行う。完全一致検索部104は、検索結果を完全一致制御部103に渡す。また、完全一致検索部104は、完全一致制御部103から受けたエンティティ検索キー及び属性検索キーの組み合わせが複数存在する場合、各組み合わせについて順次、完全一致検索処理を行う。完全一致検索処理の検索結果が一件以上となった時点で当該検索結果を完全一致制御部103に出力する。
The exact
なお、完全一致検索部104は、完全一致制御部103から受けたエンティティ検索キーを正規化処理することによって、エンティティ検索キーから派生した文字列である派生文字列を取得することが可能である。エンティティ検索キーの正規化処理とは、所定のルールに従ってエンティティ検索キーを変換することにより、検索語の入力時において検索語に加えられた「揺らぎ」(ユーザによって異なる可能性のある表記の違い)を排除する処理のことである。上記の正規化処理は、例えば、エンティティ検索キーにおける、「ー」(長音符)、「〜」(長音符)等の長音、「ッ」等の促音を除去する処理、全角及び半角のカナを何れか一方(例えば、全角)に変換して揃える処理等である。例えば、完全一致検索部104は、完全一致制御部103から受けたエンティティ検索キーが「テリーポッター」である場合、このエンティティ検索キーを正規化処理することによって、派生文字列「テリポタ」を取得することが可能である。
The exact
そして、完全一致検索部104は、取得した派生文字列と完全一致する「エンティティマッチング文字列」を、マッチング情報データベース106にアクセスして取得する。また、完全一致検索部104は、取得した「エンティティマッチング文字列」に対応付けて記憶される「エンティティ」を、マッチング情報データベース106にアクセスして取得する。更に、完全一致検索部104は、取得した「エンティティ」に対応付けられており且つ属性検索キーに対応付けられている「値」を、エンティティ属性データベース105にアクセスして抽出する。完全一致検索部104は、この抽出処理を上記の完全一致検索処理として行う。ここで、完全一致検索部104が、マッチング情報データベース106から取得した「エンティティ」と同一の「エンティティ」がエンティティ属性データベース105に存在しないことを検出することがあったとする。この場合、完全一致検索部104は、マッチング情報データベース106から取得した「エンティティ」と部分一致する「エンティティ」を、エンティティ属性データベース105から取得してもよい。そして、完全一致検索部104は、検索結果を完全一致制御部103に渡す。例えば、取得した派生文字列が「テリポタ」である場合、この「テリポタ」と完全一致する文字列が「エンティティマッチング文字列」としてマッチング情報データベース106から取得される。
Then, the exact
そして、取得された「エンティティマッチング文字列」と対応付けて記憶される「エンティティ」がマッチング情報データベース106から取得される。そして、完全一致検索部104は、取得した「エンティティ」に対応付けられており且つ属性検索キーに対応付けられている「値」を、エンティティ属性データベース105にアクセスして抽出する。完全一致検索部104は、この抽出処理を上記の完全一致検索処理として行う。
The “entity” stored in association with the acquired “entity matching character string” is acquired from the matching
前方一致制御部107は、前方一致検索部108による部分一致検索処理(第二の検索処理)を制御する制御部分である。以下では、部分一致検索処理の一例として前方一致検索処理が制御される構成について説明するが、部分一致検索処理であれば特に限定されず、前方一致検索処理の代わりが例えば後方一致検索処理であってもよい。前方一致制御部107は、完全一致制御部103から受けたエンティティ検索キー及び属性検索キーを、前方一致検索部108に渡して、前方一致検索処理を実行させるよう指示する。また、前方一致制御部107は、前方一致検索部108から受信した検索結果を入出力制御部101に渡す。なお、前方一致制御部107は、前方一致検索部108から受信した検索結果が一件以上となった時点で、当該検索結果を入出力制御部101に渡す。これにより、当該検索結果がユーザ端末20に出力される。
The forward
前方一致検索部108は、前方一致制御部107から受けたエンティティ検索キーと前方一致する上記の「エンティティ」に対応付けられている、所望情報を検索する前方一致検索処理実行部分である。なお、前方一致検索部108は、後述する予め定められた所定の文字数よりも、エンティティ検索キーの文字数の方が大きい場合に、前方一致検索処理を行う。前方一致検索部108は、エンティティ属性データベース105にアクセスして、エンティティ検索キーと前方一致する上記の「エンティティ」に対応付けられている「値」の候補を抽出し(「エンティティ」一つに対する「値」の候補が複数の場合もある)、この「値」の候補から、属性検索キーに対応付けられている「値」を抽出することにより、前方一致検索処理を行う。前方一致検索部108は、検索結果を入出力制御部101に渡す。なお、後述する予め定められた所定の文字数が、エンティティ検索キーの文字数以上である場合に、前方一致検索部108は、検索結果がゼロ件である旨を示す情報を入出力制御部101に渡す。また、前方一致検索部108は、前方一致制御部107から受けたエンティティ検索キー及び属性検索キーの組み合わせが複数存在する場合、各組み合わせについて順次、前方一致検索処理を行う。前方一致検索処理の検索結果が一件以上となった時点で当該検索結果を前方一致制御部107に出力する。
The forward
なお、前方一致検索部108は、前方一致制御部107から受けたエンティティ検索キーを正規化処理することによって、エンティティ検索キーから派生した文字列である派生文字列を取得することが可能である。エンティティ検索キーの正規化処理の詳細については既に述べたのでここでは割愛する。例えば、前方一致検索部108は、前方一致制御部107から受けたエンティティ検索キーが「テリーポッター」である場合、このエンティティ検索キーを正規化処理することによって、派生文字列「テリポタ」を取得することが可能である。
The forward
そして、前方一致検索部108は、取得した派生文字列を先頭(前方)から全て含む(前方一致する)「エンティティマッチング文字列」を、マッチング情報データベース106にアクセスして取得する。また、前方一致検索部108は、取得した「エンティティマッチング文字列」に対応付けて記憶される「エンティティ」を、マッチング情報データベース106にアクセスして取得する。更に、前方一致検索部108は、取得した「エンティティ」に対応付けられており且つ属性検索キーに対応付けられている「値」を、エンティティ属性データベース105にアクセスして抽出する。前方一致検索部108は、この抽出処理を上記の前方一致検索処理として行う。ここで、前方一致検索部108が、マッチング情報データベース106から取得した「エンティティ」と同一の「エンティティ」がエンティティ属性データベース105に存在しないことを検出することがあったとする。この場合、前方一致検索部108は、マッチング情報データベース106から取得した「エンティティ」と部分一致する「エンティティ」を、エンティティ属性データベース105から取得してもよい。そして、前方一致検索部108は、検索結果を前方一致制御部107に渡す。例えば、取得した派生文字列が「テリポタ」である場合、この「テリポタ」を先頭(前方)から全て含む文字列である「テリポタ1作目」及び「テリポタ2作目」(他にも、「テリポタ」で始まるエンティティマッチング文字列の全て)が「エンティティマッチング文字列」としてマッチング情報データベース106から取得される。
Then, the forward
そして、「テリポタ1作目」と対応付けて記憶される「テリーポッターと秘密の部屋」及び「テリポタ2作目」と対応付けて記憶される「テリーポッターとアズガバンの囚人」が「エンティティ」としてマッチング情報データベース106から取得される。次に、前方一致検索部108は、取得した「テリーポッターと秘密の部屋」に対応付けられており且つ属性検索キーに対応付けられている「値」を抽出する。前方一致検索部108は、この抽出処理を上記の前方一致検索処理として行い、更に、「テリーポッターとアズガバンの囚人」に対応付けられており且つ属性検索キーに対応付けられている「値」を抽出する。前方一致検索部108は、この抽出処理を上記の前方一致検索処理として行う。ここで、属性検索キーが「映画監督」である場合、図3に示されるように、「値」としての「AAAAAA」(すなわち、「テリーポッターと秘密の部屋」の映画監督の名前)及び「BBBBBBB」(すなわち、「テリーポッターとアズガバンの囚人」の映画監督の名前)が抽出される。
Then, “Terry Potter and the Secret Room” stored in association with “Terpotter 1st Work” and “Terry Potter and Prisoner of Azghavan” stored in association with “Terpotter 2nd Work” are “entities”. Obtained from the matching
なお、前方一致検索部108は、予め定められた所定の文字数を取得するために、まず、エンティティカテゴリ判定部109にアクセスして、前方一致制御部107から受けた属性検索キーと対応付けて記憶されるカテゴリ情報を属性エンティティカテゴリデータベース110から取得する。カテゴリ情報は、属性検索キーによって示される属性が何れのカテゴリ(分野)に分類されるかを示す情報である。そして、前方一致検索部108は、前方一致文字数判定部111にアクセスして、属性エンティティカテゴリデータベース110から取得したカテゴリ情報と対応付けて記憶される、後述する予め定められた所定の文字数を、前方一致最低文字数データベース112から取得する。
The forward
属性エンティティカテゴリデータベース110は、属性検索キーに対応する「属性」と、所望情報に関連するエンティティ検索キーのカテゴリ(分野)を示すカテゴリ情報に対応する「エンティティカテゴリ」とを、対応付けて記憶するデータベースである。属性エンティティカテゴリデータベース110のテーブル構成図の一例が、図5に示されている。ここでは、「属性」としての「映画監督」と、「エンティティカテゴリ」としての「映画作品」とが、対応付けて記憶されている。属性エンティティカテゴリデータベース110は、MySQL(登録商標)、PostgreSQL(登録商標)等のデータベース管理システムを用いて構成され、SQL等の問い合わせ言語を受け付けるシステムであってもよいし、データベース検索装置10の内部メモリに記憶されたハッシュ等のデータであってもよい。
The attribute
前方一致最低文字数データベース112は、所望情報に関連するエンティティ検索キーのカテゴリ(分野)を示すカテゴリ情報に対応する「エンティティカテゴリ」と、後述する予め定められた所定の文字数に対応する「前方一致実施最低文字数」とを、対応付けて記憶するデータベースである。前方一致最低文字数データベース112のテーブル構成図の一例が、図6に示されている。ここでは、「エンティティカテゴリ」としての「映画作品」と、「前方一致実施最低文字数」としての「4」とが、対応付けて記憶されている。前方一致最低文字数データベース112は、MySQL(登録商標)、PostgreSQL(登録商標)等のデータベース管理システムを用いて構成され、SQL等の問い合わせ言語を受け付けるシステムであってもよいし、データベース検索装置10の内部メモリに記憶されたハッシュ等のデータであってもよい。なお、属性エンティティカテゴリデータベース110及び前方一致最低文字数データベース112は、図7に示されるように、「属性」をキーにして統合されてもよい。
The forward matching minimum
例えば、前方一致検索部108は、前方一致制御部107を介してエンティティカテゴリ判定部109にアクセスして、前方一致制御部107から受けた属性検索キー「映画監督」と対応付けて記憶されるカテゴリ情報「映画作品」を、属性エンティティカテゴリデータベース110から取得する。そして、前方一致検索部108は、前方一致制御部107を介して前方一致文字数判定部111にアクセスして、属性エンティティカテゴリデータベース110から取得したカテゴリ情報「映画作品」と対応付けて記憶される、予め定められた所定の文字数「4」を、前方一致最低文字数データベース112から取得する。
For example, the front
また、前方一致検索部108は、前方一致制御部107から受けたエンティティ検索キー及び属性検索キーの組み合わせが複数存在する場合、各組み合わせについて順次、前方一致検索処理を行う。前方一致検索処理の検索結果が一件以上となった時点で当該検索結果を前方一致制御部107に出力する。例えば、エンティティ検索キー及び属性検索キーの組み合わせが二つだけ存在し、一つ目の組み合わせのエンティティ検索キーが「テリーポッター」であって属性検索キーが「映画監督」であり、二つ目の組み合わせのエンティティ検索キーが「テリーポッター」であって属性検索キーが「サッカーチーム監督」であるとする。この場合、前方一致検索部108は、まず、上記のように、属性検索キー「映画監督」と対応付けて記憶されるカテゴリ情報「映画作品」を属性エンティティカテゴリデータベース110から取得し、カテゴリ情報「映画作品」と対応付けて記憶される予め定められた所定の文字数「4」を取得する。所定の文字数「4」よりも、エンティティ検索キー「テリーポッター」の文字数「7」の方が大きいため、前方一致検索処理が行われる。
Further, when there are a plurality of combinations of the entity search key and the attribute search key received from the forward
この前方一致検索処理の検索結果がゼロ件であった場合、二つ目の組み合わせについても同様に、前方一致検索処理の実行可否を判定する処理が行われる。すなわち、前方一致検索部108は、上記のように、属性検索キー「サッカーチーム監督」と対応付けて記憶されるカテゴリ情報「スポーツ関連人物」を属性エンティティカテゴリデータベース110から取得し、カテゴリ情報「スポーツ関連人物」と対応付けて記憶される予め定められた所定の文字数「2」を取得する。所定の文字数「2」よりも、エンティティ検索キー「テリーポッター」の文字数「7」の方が大きいため、前方一致検索処理が行われる。この前方一致検索処理の検索結果がゼロ件であった場合、エンティティ検索キーと属性検索キーのペア(組み合わせ)全てについて前方一致検索処理が完了したと判定されて、前方一致検索部108が、検索結果がゼロ件である旨を示す情報を入出力制御部101に渡す。なお、前方一致検索部108は、前方一致検索処理を行う際に、上記の正規化処理によって得られた派生文字列に対しても、この派生文字列と所定の文字数との比較結果に基づく前方一致検索処理の実施判定を行ってもよい。
If the search result of the forward match search process is zero, a process for determining whether or not the forward match search process can be executed is performed for the second combination as well. That is, as described above, the front
エンティティカテゴリ判定部109は、前方一致制御部107から属性検索キーを受けると、属性エンティティカテゴリデータベース110から、属性検索キーと対応付けて記憶されるカテゴリ情報を取得して、前方一致制御部107を介して前方一致検索部108に渡す判定処理部分である。
When the entity
前方一致文字数判定部111は、前方一致制御部107からカテゴリ情報を受けると、前方一致最低文字数データベース112から、カテゴリ情報と対応付けて記憶される予め定められた所定の文字数を取得して、前方一致制御部107を介して前方一致検索部108に渡す判定処理部分である。
When the front matching character
ユーザ端末20は、図1に示されるように、主な機能的な構成要素として、送信部201(送信手段)及び取得部202(結果取得手段)を有している。
As shown in FIG. 1, the
送信部201は、データベース検索装置10との通信を行う通信処理部分である。例えば、送信部201は、上記の所望情報を検索するための検索語を含む検索情報を、データベース検索装置10に送信することが可能である。例えば、送信部201は、ユーザ端末20においてユーザにより入力された検索フレーズ(検索情報)を、データベース検索装置10に送信することが可能である。検索フレーズは、ユーザ端末20において入力された音声に対して音声認識処理が行われて得られた文字等の情報であってもよく、ユーザ端末20のキーボードやタッチパネルを用いて入力されたものであってもよい。
The
取得部202は、データベース検索装置10との通信を行う通信処理部分である。例えば、取得部202は、データベース検索装置10における完全一致検索処理及び前方一致検索処理の検索結果を、データベース検索装置10から受信して取得することが可能である。取得部202が取得した検索結果は、ユーザ端末20のディスプレイ等に表示される。
The
(2)データベース検索装置における検索処理の流れ
引き続き、データベース検索装置10における検索処理の流れ(情報検索方法)について、図8を用いて説明する。図8は、データベース検索装置10における検索処理の流れを説明するためのフローチャートである。図8のフローチャートに示される処理は、データベース検索装置10に検索フレーズ(検索ワード)が入力される度に実行開始され、入力された検索フレーズのそれぞれに関する後述する一連の処理の完了まで実行される。
(2) Flow of Search Processing in Database Search Device Subsequently, the flow of search processing (information search method) in the
まず、入出力制御部101が、上記の所望情報を検索するための検索語を含む検索情報を、ユーザ端末20から受信して、受信した検索情報から検索語を取得する(ステップS01、検索語取得ステップ)。これにより、検索語の入力が受け付けられる。そして、入出力制御部101は、この検索語をキー候補検出部102に渡す。検索フレーズは、ユーザ端末20において入力された音声に対して音声認識処理が行われて得られた文字等の情報であってもよく、キーボードやタッチパネルを用いて入力されたものであってもよい。検索フレーズは、例えば、ある映画の監督を問い合わせるものから、歴史的な事実を尋ねるものまで、様々な分野について質問する型式で入力される。検索フレーズの一例として、「テリーポッター」という題名の映画が存在すると仮定した場合に、「テリーポッターの監督は誰」といった自然文の検索フレーズ、「テリーポッター 監督」といった二つの検索キーワードの組合せである検索フレーズ等がある。
First, the input /
次に、キー候補検出部102が、入出力制御部101により取得された検索語から、所望情報に関連するエンティティ検索キーと、所望情報の属性を示す属性検索キーとを抽出して検出する(ステップS02、検出ステップ)。キー候補検出部102は、検出したエンティティ検索キー及び属性検索キーを完全一致制御部103に渡す。例えば、入出力制御部101により取得された検索語が二つの検索キーワードの組合せである場合、キー候補検出部102は、一つ目の検索キーワードがエンティティ検索キーであると判断してエンティティ検索キーを検出し、二つ目の検索キーワードが属性検索キーであると判断して属性検索キーを検出する。より詳しくは、例えば、入出力制御部101により取得された検索語が「テリーポッター 監督」である場合、一つ目の検索キーワードである「テリーポッター」がエンティティ検索キーであるとして検出され、二つ目の検索キーワードである「監督」が属性検索キーであるとして検出される。
Next, the key
また、エンティティ検索キー及び属性検索キーの組み合わせは、複数であってもよい。例えば、入出力制御部101により取得された検索語が「テリーポッター 監督」である場合、「テリーポッター」がエンティティ検索キーであるとして検出され、「映画監督」が属性検索キーであるとして検出される組み合わせだけでなく、更に、「テリーポッター」がエンティティ検索キーであるとして検出され、「サッカーチーム監督」が属性検索キーであるとして検出される組み合わせが存在してもよい。また、入出力制御部101により取得された検索語が「テリーポッターの監督は誰」である場合、キー候補検出部102が上記のパターンに当てはまったと判定することにより、「テリーポッター」がエンティティ検索キーであるとして検出され、「監督」が属性検索キーであるとして検出される。
There may be a plurality of combinations of entity search keys and attribute search keys. For example, when the search term acquired by the input /
次に、完全一致制御部103が、キー候補検出部102から受けたエンティティ検索キー及び属性検索キーを、完全一致検索部104に渡して、上記の完全一致検索処理を実行させるよう指示する(ステップS03、検索ステップ)。完全一致検索部104は、エンティティ属性データベース105にアクセスして、エンティティ検索キーと完全一致する上記の「エンティティ」に対応付けられている「値」の候補を抽出し(「エンティティ」一つに対する「値」の候補が複数の場合もある)、この「値」の候補から、属性検索キーに対応付けられている「値」を抽出することにより、完全一致検索処理を行う。
Next, the exact
次に、完全一致制御部103が、完全一致検索部104から受信した検索結果が一件以上であるか否かを判定する(ステップS04)。完全一致検索部104から受信した検索結果が一件以上であると判定された場合、後述のステップS05に移行する。一方、完全一致検索部104から受信した検索結果がゼロ件であると判定された場合、後述のステップS06に移行する。
Next, the exact
ステップS05では、完全一致制御部103又は前方一致制御部107が、完全一致検索部104又は前方一致検索部108から受信した検索結果を入出力制御部101に渡す。これにより、当該検索結果がユーザ端末20に出力される。そして、一連の処理は完了する。
In step S05, the exact
ステップS06では、完全一致制御部103が、エンティティ検索キーと属性検索キーのペア(組み合わせ)全てについて完全一致検索処理が完了したか否かを判定する。エンティティ検索キーと属性検索キーのペア全てについて完全一致検索処理が完了していないと判定された場合、完全一致制御部103が、完全一致検索処理が完了していないエンティティ検索キー及び属性検索キーの組み合わせを、完全一致検索部104に渡して、前述のステップS03に移行する。一方、エンティティ検索キーと属性検索キーのペア(組み合わせ)全てについて完全一致検索処理が完了したと判定された場合、完全一致制御部103が、キー候補検出部102から受けたエンティティ検索キー及び属性検索キーを、前方一致制御部107に渡す。前方一致制御部107は、完全一致制御部103から受けたエンティティ検索キー及び属性検索キーを、前方一致検索部108に渡して、前方一致検索処理を実行させるよう指示する。
In step S06, the exact
そして、前方一致検索部108が、エンティティカテゴリ判定部109にアクセスして、前方一致制御部107から受けた属性検索キーと対応付けて記憶されるカテゴリ情報を属性エンティティカテゴリデータベース110から取得する(ステップS07)。
Then, the forward
そして、前方一致検索部108が、前方一致文字数判定部111にアクセスして、属性エンティティカテゴリデータベース110から取得したカテゴリ情報と対応付けて記憶される、上記の予め定められた所定の文字数(前方一致実施最低文字数)を、前方一致最低文字数データベース112から取得する(ステップS08)。例えば、前方一致検索部108は、前方一致文字数判定部111にアクセスして、属性エンティティカテゴリデータベース110から取得したカテゴリ情報「映画作品」と対応付けて記憶される、予め定められた所定の文字数「4」を、前方一致最低文字数データベース112から取得する。
Then, the forward
そして、前方一致検索部108が、上記の予め定められた所定の文字数よりも、前方一致制御部107から受けたエンティティ検索キーの文字数の方が、大きいか否かを判定する(ステップS09)。上記の予め定められた所定の文字数よりも、前方一致制御部107から受けたエンティティ検索キーの文字数の方が、大きいと判定された場合、後述のステップS10に移行する。一方、前方一致制御部107から受けたエンティティ検索キーの文字数が、上記の予め定められた所定の文字数以下であると判定された場合、後述のステップS12に移行する。
Then, the forward
ステップS10では、前方一致検索部108が、エンティティ属性データベース105にアクセスして、エンティティ検索キーと前方一致する上記の「エンティティ」に対応付けられている所望情報の候補を抽出し(「エンティティ」一つに対する「値」の候補が複数の場合もある)、この所望情報の候補から、属性検索キーに対応付けられている所望情報を抽出することにより、前方一致検索処理を行う(検索ステップ)。前方一致検索部108は、検索結果を入出力制御部101に渡す。そして、ステップS11に移行する。
In step S10, the front
より詳しくは、前方一致検索部108は、例えば、エンティティ検索キーが「テリーポッター」である場合、このエンティティ検索キーを正規化処理することによって、派生文字列「テリポタ」を取得する。そして、前方一致検索部108は、派生文字列「テリポタ」を先頭(前方)から全て含む「エンティティマッチング文字列」である「テリポタ1作目」及び「テリポタ2作目」を、マッチング情報データベース106にアクセスして取得する。そして、前方一致検索部108は、取得した「エンティティマッチング文字列」である「テリポタ1作目」に対応付けられて記憶されている「テリーポッターと秘密の部屋」を「エンティティ」として取得し、取得した「テリーポッターと秘密の部屋」に対応付けられており且つ属性検索キーに対応付けられている「値」をエンティティ属性データベース105から抽出することにより、上記の前方一致検索処理を行う。ここで、属性検索キーが「映画監督」である場合、図3に示されるように、「値」としての「AAAAAA」(すなわち、「テリーポッターと秘密の部屋」の映画監督の名前)が抽出される。更に、前方一致検索部108は、取得した「エンティティマッチング文字列」である「テリポタ2作目」に対応付けられて記憶されている「テリーポッターとアズガバンの囚人」を「エンティティとして取得し、取得した「テリーポッターとアズガバンの囚人」に対応付けられており且つ属性検索キーに対応付けられている「値」をエンティティ属性データベース105から抽出することにより、上記の前方一致検索処理を行う。ここで、属性検索キーが「映画監督」である場合、図3に示されるように、「値」としての「BBBBBBB」(すなわち、「テリーポッターとアズガバンの囚人」の映画監督の名前)が抽出される。
More specifically, for example, when the entity search key is “Terry Potter”, the front
ステップS11では、前方一致制御部107が、前方一致検索部108から受信した検索結果が一件以上であるか否かを判定する。前方一致検索部108から受信した検索結果が一件以上であると判定された場合、前述のステップS05に移行する。一方、前方一致検索部108から受信した検索結果がゼロ件であると判定された場合、後述のステップS12に移行する。
In step S11, the front
ステップS12では、前方一致制御部107が、エンティティ検索キーと属性検索キーのペア(組み合わせ)全てについて前方一致検索処理が完了したか否かを判定する。エンティティ検索キーと属性検索キーのペア全てについて前方一致検索処理が完了していないと判定された場合、前方一致制御部107が、前方一致検索処理が完了していないエンティティ検索キー及び属性検索キーの組み合わせを、前方一致検索部108に渡して、前述のステップS07に移行する。一方、エンティティ検索キーと属性検索キーのペア(組み合わせ)全てについて前方一致検索処理が完了したと判定された場合、前方一致検索部108が、検索結果がゼロ件である旨を示す情報を入出力制御部101に渡す(ステップS13)。そして、前述のステップS05に移行する。
In step S12, the front
(3)本発明による作用及び効果
データベース検索装置10によれば、検索語が取得され、取得された検索語から上記のエンティティ検索キー及び属性検索キーが検出される。そして、検出されたエンティティ検索キーと完全一致する「エンティティ」に対応付けられているとともに属性検索キーに対応付けられている所望情報を検索する完全一致検索処理が行われる。ここで、完全一致検索処理の検索結果がゼロ件の場合に、検出されたエンティティ検索キーと前方一致する「エンティティ」に対応付けられている所望情報を検索する前方一致検索処理が行われる。このように、上記の完全一致検索処理の検索結果がゼロ件の場合に、検出されたエンティティ検索キーと前方一致する「エンティティ」に対応付けられている所望情報を検索する前方一致検索処理が行われるため、ユーザによる一度の検索語の指定で、より適切な検索結果を出力することが可能になる。
(3) Operation and Effect of the Present Invention According to the
また、データベース検索装置10によれば、完全一致検索処理の検索結果がゼロ件の場合、且つ、予め定められた所定の文字数よりもエンティティ検索キーの文字数の方が大きい場合に、前方一致検索処理が行われる。エンティティ検索キーの文字数の方が大きくなればなるほど、上記の完全一致検索処理の検索結果がゼロ件になる可能性も高くなる。このため、所定の文字数よりもエンティティ検索キーの文字数の方が大きいため前方一致検索処理を行う方がより適切な状態である場合に、前方一致検索処理を行うことが可能になる。また、完全一致検索処理と前方一致検索処理が組み合わせられているため、ユーザ端末20のユーザが適切な検索情報を入力することにより、入力された検索情報の文字数が前方一致検索処理の実行に繋がる文字数であるか否かに関わらず、検索結果の出力が担保される。
Further, according to the
また、データベース検索装置10によれば、検出された属性検索キーと対応付けて記憶されるカテゴリ情報が取得され、当該カテゴリ情報と対応付けて記憶される所定の文字数が取得される。検出された属性検索キーに適した所定の文字数が取得され、所定の文字数よりも関連ワードの文字数の方が大きいため前方一致検索処理を行う方がより適切な状態である場合に、前方一致検索処理を行うことが可能になる。また、カテゴリ情報が異なれば所定の文字数も異なるように変更設定が可能である。このため、短い文字数の文字列長で前方一致検索処理を行うことが適切な分野では、このような短い文字数の文字列長で検索することが可能になる。その結果、ユーザ端末20のユーザの期待する結果を表示しないようにする処理を必要以上に行わないようにすることができる。
Moreover, according to the
また、データベース検索装置10によれば、検出されたエンティティ検索キーから派生した文字列と完全一致する派生語に対応付けて記憶される「エンティティ」に対応付けられている「値」をエンティティ属性データベース105から検索する処理が完全一致検索処理として行われ、完全一致検索処理の検索結果がゼロ件の場合に、検出されたエンティティ検索キーから派生した文字列と部分一致する派生語に対応付けて記憶される「エンティティ」に対応付けられている「値」をエンティティ属性データベース105から検索する処理が前方一致検索処理として行われる。これにより、検出されたエンティティ検索キーが、エンティティ検索キーとして適切なものから派生したもの(例えば、揺らぎを有するもの)であっても、適切なエンティティ検索キーの取得及び検出が可能になる。
Further, according to the
また、データベース検索装置10によれば、検索語から、エンティティ検索キーと属性検索キーとの組が複数検出され、検出されたエンティティ検索キーと属性検索キーとの組を複数用いて完全一致検索処理を行って検索結果が一件以上となった時点で当該検索結果が出力されるとともに、完全一致検索処理の検索結果がゼロ件の場合に、検出されたエンティティ検索キーと属性検索キーとの組を複数用いて前方一致検索処理を行って検索結果が一件以上となった時点で当該検索結果が出力される。このように、検出されたエンティティ検索キーと属性検索キーとの組を複数用いて検索結果が一件以上となった時点で当該検索結果が出力されるため、検索処理に必要な時間を短縮することが可能になる。
Further, according to the
(4)変形例
上記の実施例では、図8に示されるように、完全一致制御部103が、完全一致検索部104から受信した検索結果が一件以上であるか否かを判定し(ステップS04)、完全一致検索部104から受信した検索結果が一件以上であると判定された場合、完全一致制御部103が、完全一致検索部104から受信した検索結果を入出力制御部101に渡す(ステップS05)。これにより、当該検索結果がユーザ端末20に出力される。
(4) Modification In the above embodiment, as shown in FIG. 8, the complete
ここで、ステップS02において、エンティティ検索キー及び属性検索キーの組み合わせの候補が複数検出された場合(例えば、エンティティ検索キー及び属性検索キーの組み合わせの候補C1,C2,C3が検出された場合)、ステップS04において、複数の候補のそれぞれについての検索結果の合計件数(候補C1の検索結果の件数と、候補C2の検索結果の件数と、候補C3の検索結果の件数の合計件数)が一件以上であるか否かを判定する構成としてもよい。 Here, when a plurality of combinations of entity search key and attribute search key combinations are detected in step S02 (for example, candidate combinations C1, C2, and C3 of entity search key and attribute search key are detected), In step S04, the total number of search results for each of a plurality of candidates (the total number of search results for candidate C1, the number of search results for candidate C2, and the number of search results for candidate C3) is one or more. It is good also as a structure which determines whether it is.
この構成を採用する場合、ステップS05では、複数の候補のそれぞれについての検索結果の合計件数が一件以上であると判定された場合、完全一致制御部103は、この合計件数を示す検索結果を入出力制御部101に渡す。これにより、この合計件数を示す検索結果がユーザ端末20に出力されるようになる。
When this configuration is adopted, in step S05, when it is determined that the total number of search results for each of the plurality of candidates is one or more, the exact
このため、エンティティ検索キー及び属性検索キーの検出精度が低い場合でも、上記のようにエンティティ検索キー及び属性検索キーの組み合わせの複数の候補を利用して各候補についての検索結果を得ることにより、より適切な検索結果を得ることができる場面を増やすことが可能になる。 For this reason, even when the detection accuracy of the entity search key and the attribute search key is low, by obtaining a search result for each candidate using a plurality of candidates for the combination of the entity search key and the attribute search key as described above, It is possible to increase the number of scenes where more appropriate search results can be obtained.
なお、上述したように、上記の実施例では部分一致検索処理の一例として前方一致検索処理が制御される構成について説明したが、部分一致検索処理であれば特に限定されず、例えば後方一致検索処理であってもよい。 As described above, in the above embodiment, the configuration in which the forward match search process is controlled as an example of the partial match search process has been described. However, the partial match search process is not particularly limited. For example, the backward match search process It may be.
本発明によれば、ユーザによる一度の検索ワードの指定で、より適切な検索結果を出力することが可能な情報検索装置、情報検索システム、及び情報検索方法を提供することができる。 According to the present invention, it is possible to provide an information search apparatus, an information search system, and an information search method capable of outputting a more appropriate search result by specifying a search word once by a user.
1…情報検索システム、10…データベース検索装置、20…ユーザ端末、101…入出力制御部、102…キー候補検出部、103…完全一致制御部、104…完全一致検索部、105…エンティティ属性データベース、106…マッチング情報データベース、107…前方一致制御部、108…前方一致検索部、109…エンティティカテゴリ判定部、110…属性エンティティカテゴリデータベース、111…前方一致文字数判定部、112…前方一致最低文字数データベース、201…送信部、202…取得部、NW…通信ネットワーク。 DESCRIPTION OF SYMBOLS 1 ... Information search system, 10 ... Database search device, 20 ... User terminal, 101 ... Input / output control part, 102 ... Key candidate detection part, 103 ... Perfect match control part, 104 ... Perfect match search part, 105 ... Entity attribute database , 106 ... matching information database, 107 ... forward match control section, 108 ... forward match search section, 109 ... entity category determination section, 110 ... attribute entity category database, 111 ... forward match character count determination section, 112 ... forward match minimum character count database , 201 ... transmission unit, 202 ... acquisition unit, NW ... communication network.
本発明の一形態に係る情報検索装置は、ユーザが所望する所望情報を検索する情報検索装置であって、所望情報を検索するための検索語を取得する検索語取得手段と、検索語取得手段により取得された検索語から、所望情報に関連する関連ワードと、所望情報の属性を示す属性情報とを検出する検出手段と、関連ワードの候補である関連ワード候補情報と、属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、検出手段により検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、検出手段により検出された属性情報に対応付けられている、所望情報を検索する第一の検索処理を行う検索手段と、を備え、検索手段は、第一の検索処理の検索結果がゼロ件の場合、且つ、予め定められた所定の文字数よりも関連ワードの文字数の方が大きい場合に、候補記憶手段から、検出手段により検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、所望情報を検索する第二の検索処理を行う、ことを特徴とする。 An information search apparatus according to an aspect of the present invention is an information search apparatus that searches for desired information desired by a user, and includes a search word acquisition unit that acquires a search word for searching for desired information, and a search word acquisition unit Detection means for detecting a related word related to desired information and attribute information indicating an attribute of the desired information, related word candidate information that is a candidate for the related word, and candidate attribute information The related word that completely matches the related word detected by the detecting means from the candidate storing means for storing the attribute candidate information, the related word candidate information and the desired information specified from the attribute candidate information in association with each other. Search means for performing a first search process for searching for desired information, which is associated with the candidate information and associated with the attribute information detected by the detection means; Provided, the search means, when the search result of the first search process of 5-zero, and, in the case than a predetermined number set in advance is larger in number of related words, from the candidate storing means, the detecting means A second search process for searching for desired information associated with the related word candidate information partially matching the detected related word is performed.
本発明の一形態に係る情報検索システムは、ユーザが所望する所望情報を検索する情報検索装置と、当該情報検索装置と通信可能な通信端末とを備える情報検索システムであって、情報検索装置は、所望情報を検索するための検索語を前記通信端末から取得する検索語取得手段と、検索語取得手段により取得された前記検索語から、所望情報に関連する関連ワードと、前記所望情報の属性を示す属性情報とを検出する検出手段と、関連ワードの候補である関連ワード候補情報と、属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、検出手段により検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、検出手段により検出された属性情報に対応付けられている、所望情報を検索する第一の検索処理を行う検索手段と、を有し、検索手段は、第一の検索処理の検索結果がゼロ件の場合、且つ、予め定められた所定の文字数よりも関連ワードの文字数の方が大きい場合に、候補記憶手段から、検出手段により検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、所望情報を検索する第二の検索処理を行い、通信端末は、検索語を情報検索装置に送信する送信手段と、検索手段による第一の検索処理又は第二の検索処理の検索結果を情報検索装置から取得する結果取得手段と、を有する、ことを特徴とする。 An information search system according to an aspect of the present invention is an information search system including an information search device that searches for desired information desired by a user and a communication terminal that can communicate with the information search device. A search word acquisition means for acquiring a search word for searching for desired information from the communication terminal, a related word related to the desired information from the search word acquired by the search word acquisition means, and an attribute of the desired information Detecting means for detecting attribute information indicating, related word candidate information that is a candidate for related words, attribute candidate information that is a candidate for attribute information, and desired information specified from the related word candidate information and the attribute candidate information Information is associated with the related word candidate information that completely matches the related word detected by the detecting means from the candidate storing means for storing the information in association with each other. And a search means for performing a first search process for searching for desired information associated with the attribute information detected by the detection means. The search means has a search result of the first search process. In the case of zero , and when the number of characters in the related word is larger than a predetermined number of characters, the related word candidate information partially matching with the related word detected by the detecting unit is stored in the candidate storage unit. The communication terminal performs a second search process for searching for the associated desired information, and the communication terminal transmits a search term to the information search apparatus, and a first search process or a second search process by the search means And a result acquisition means for acquiring the search result from the information search device.
本発明の一形態に係る情報検索方法は、ユーザが所望する所望情報を検索する情報検索装置が行う情報検索方法であって、所望情報を検索するための検索語を情報検索装置が取得する検索語取得ステップと、検索語取得ステップにより取得された検索語から、所望情報に関連する関連ワードと、所望情報の属性を示す属性情報とを情報検索装置が検出する検出ステップと、関連ワードの候補である関連ワード候補情報と、属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、検出ステップにより検出された関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、検出ステップにより検出された属性情報に対応付けられている、所望情報を検索する第一の検索処理を情報検索装置が行う検索ステップと、を有し、検索ステップでは、第一の検索処理の検索結果がゼロ件の場合、且つ、予め定められた所定の文字数よりも関連ワードの文字数の方が大きい場合に、候補記憶手段から、検出ステップにより検出された関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、所望情報を検索する第二の検索処理を情報検索装置が行う、ことを特徴とする。 An information search method according to an aspect of the present invention is an information search method performed by an information search device that searches for desired information desired by a user, wherein the information search device acquires a search word for searching for desired information. A word acquisition step; a detection step in which an information search device detects a related word related to desired information and attribute information indicating an attribute of the desired information from the search word acquired in the search word acquisition step; From the candidate storage means for storing the related word candidate information, the attribute candidate information that is a candidate of attribute information, and the desired information specified from the related word candidate information and the attribute candidate information in association with each other. Corresponds to the related word candidate information that completely matches with the related word detected by, and corresponds to the attribute information detected by the detection step Being kicked, anda search steps of the first search processing information search apparatus performs to search for desired information, the search step, if the results for the first search process of 5-zero, and, in advance Desired information associated with the related word candidate information partially matching the related word detected by the detection step from the candidate storage means when the number of characters of the related word is larger than the predetermined number of characters determined The information search apparatus performs a second search process for searching for the information.
Claims (7)
前記所望情報を検索するための検索語を取得する検索語取得手段と、
前記検索語取得手段により取得された前記検索語から、前記所望情報に関連する関連ワードと、前記所望情報の属性を示す属性情報とを検出する検出手段と、
前記関連ワードの候補である関連ワード候補情報と、前記属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、前記検出手段により検出された前記関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、前記検出手段により検出された前記属性情報に対応付けられている、前記所望情報を検索する第一の検索処理を行う検索手段と、
を備え、
前記検索手段は、前記第一の検索処理の検索結果がゼロ件の場合に、前記候補記憶手段から、前記検出手段により検出された前記関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、前記所望情報を検索する第二の検索処理を行う、情報検索装置。 An information retrieval device for retrieving desired information desired by a user,
Search word acquisition means for acquiring a search word for searching for the desired information;
Detecting means for detecting a related word related to the desired information and attribute information indicating an attribute of the desired information from the search word acquired by the search word acquiring means;
Candidate for storing associated word candidate information that is a candidate for the related word, attribute candidate information that is a candidate for the attribute information, and desired information identified from the related word candidate information and the candidate attribute information. Corresponding to the related word candidate information that completely matches the related word detected by the detecting means from the storage means, and corresponding to the attribute information detected by the detecting means Search means for performing a first search process for searching for information;
With
When the search result of the first search process is zero, the search means is associated with the related word candidate information partially matching the related word detected by the detection means from the candidate storage means. An information search apparatus that performs a second search process for searching for the desired information.
前記カテゴリ情報と、前記予め定められた所定の文字数とを、対応付けて記憶する文字数記憶手段と、
を更に備え、
前記検索手段は、前記検出手段により検出された前記属性情報と対応付けて記憶される前記カテゴリ情報を前記カテゴリ記憶手段から取得し、当該カテゴリ情報と対応付けて記憶される前記予め定められた所定の文字数を前記文字数記憶手段から取得する、
請求項2に記載の情報検索装置。 Category storage means for storing the attribute information detected by the detection means and category information indicating the category of the related word related to the desired information in association with each other;
A character number storage means for storing the category information and the predetermined predetermined number of characters in association with each other;
Further comprising
The search means acquires the category information stored in association with the attribute information detected by the detection means from the category storage means, and stores the predetermined information stored in association with the category information. Obtaining the number of characters from the character number storage means,
The information search device according to claim 2.
前記検索手段は、前記検出手段により検出された前記関連ワードから派生した文字列と完全一致する前記派生語に対応付けて記憶される前記関連ワード候補情報に対応付けられている前記所望情報を前記候補記憶手段から検索する処理を前記第一の検索処理として行い、前記第一の検索処理の検索結果がゼロ件の場合に、前記検出手段により検出された前記関連ワードから派生した文字列と部分一致する前記派生語に対応付けて記憶される前記関連ワード候補情報に対応付けられている前記所望情報を前記候補記憶手段から検索する処理を前記第二の検索処理として行う、
請求項1〜3のいずれか1項に記載の情報検索装置。 Further comprising derived word storage means for storing the related word candidate information and a derived word derived from the related word candidate information in association with each other;
The search means includes the desired information associated with the related word candidate information stored in association with the derived word that completely matches the character string derived from the related word detected by the detecting means. The process of searching from the candidate storage means is performed as the first search process, and when the search result of the first search process is zero, the character string and the part derived from the related word detected by the detection means A process for searching the desired information associated with the related word candidate information stored in association with the matching derived word from the candidate storage unit is performed as the second search process.
The information search device according to any one of claims 1 to 3.
前記検索手段は、前記検出された前記関連ワードと前記属性情報との組を複数用いて前記第一の検索処理を行って検索結果が一件以上となった時点で当該検索結果を出力するとともに、前記第一の検索処理の検索結果がゼロ件の場合に、前記検出された前記関連ワードと前記属性情報との組を複数用いて前記第二の検索処理を行って検索結果が一件以上となった時点で当該検索結果を出力する、請求項1〜4のいずれか1項に記載の情報検索装置。 The detection means detects a plurality of pairs of the related word and the attribute information from the search word acquired by the search word acquisition means,
The search means performs the first search process using a plurality of sets of the detected related word and the attribute information, and outputs the search result when the search result becomes one or more. When the search result of the first search process is zero, the second search process is performed using a plurality of sets of the detected related word and the attribute information, and one or more search results are obtained. The information search device according to any one of claims 1 to 4, wherein the search result is output at a point of time.
前記情報検索装置は、
前記所望情報を検索するための検索語を前記通信端末から取得する検索語取得手段と、
前記検索語取得手段により取得された前記検索語から、前記所望情報に関連する関連ワードと、前記所望情報の属性を示す属性情報とを検出する検出手段と、
前記関連ワードの候補である関連ワード候補情報と、前記属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、前記検出手段により検出された前記関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、前記検出手段により検出された前記属性情報に対応付けられている、前記所望情報を検索する第一の検索処理を行う検索手段と、
を有し、
前記検索手段は、前記第一の検索処理の検索結果がゼロ件の場合に、前記候補記憶手段から、前記検出手段により検出された前記関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、前記所望情報を検索する第二の検索処理を行い、
前記通信端末は、
前記検索語を前記情報検索装置に送信する送信手段と、
前記検索手段による前記第一の検索処理又は前記第二の検索処理の検索結果を前記情報検索装置から取得する結果取得手段と、
を有する、情報検索システム。 An information search system comprising an information search device for searching for desired information desired by a user and a communication terminal capable of communicating with the information search device,
The information search device includes:
Search term acquisition means for acquiring a search term for searching for the desired information from the communication terminal;
Detecting means for detecting a related word related to the desired information and attribute information indicating an attribute of the desired information from the search word acquired by the search word acquiring means;
Candidate for storing associated word candidate information that is a candidate for the related word, attribute candidate information that is a candidate for the attribute information, and desired information identified from the related word candidate information and the candidate attribute information. Corresponding to the related word candidate information that completely matches the related word detected by the detecting means from the storage means, and corresponding to the attribute information detected by the detecting means Search means for performing a first search process for searching for information;
Have
When the search result of the first search process is zero, the search means is associated with the related word candidate information partially matching the related word detected by the detection means from the candidate storage means. And performing a second search process for searching for the desired information,
The communication terminal is
Transmitting means for transmitting the search term to the information search device;
A result acquisition means for acquiring a search result of the first search process or the second search process by the search means from the information search device;
An information retrieval system.
前記所望情報を検索するための検索語を前記情報検索装置が取得する検索語取得ステップと、
前記検索語取得ステップにより取得された前記検索語から、前記所望情報に関連する関連ワードと、前記所望情報の属性を示す属性情報とを前記情報検索装置が検出する検出ステップと、
前記関連ワードの候補である関連ワード候補情報と、前記属性情報の候補である属性候補情報と、当該関連ワード候補情報及び当該属性候補情報から特定される所望情報とを、対応付けて記憶する候補記憶手段から、前記検出ステップにより検出された前記関連ワードと完全一致する当該関連ワード候補情報に対応付けられているとともに、前記検出ステップにより検出された前記属性情報に対応付けられている、前記所望情報を検索する第一の検索処理を前記情報検索装置が行う検索ステップと、
を有し、
前記検索ステップでは、前記第一の検索処理の検索結果がゼロ件の場合に、前記候補記憶手段から、前記検出ステップにより検出された前記関連ワードと部分一致する当該関連ワード候補情報に対応付けられている、前記所望情報を検索する第二の検索処理を前記情報検索装置が行う、情報検索方法。 An information search method performed by an information search device for searching for desired information desired by a user,
A search word acquisition step in which the information search device acquires a search word for searching for the desired information;
A detection step in which the information search device detects a related word related to the desired information and attribute information indicating an attribute of the desired information from the search word acquired by the search word acquisition step;
Candidate for storing associated word candidate information that is a candidate for the related word, attribute candidate information that is a candidate for the attribute information, and desired information identified from the related word candidate information and the candidate attribute information. Corresponding to the related word candidate information that completely matches the related word detected by the detecting step from the storage means, and corresponding to the attribute information detected by the detecting step A search step in which the information search device performs a first search process for searching for information;
Have
In the search step, when the search result of the first search process is zero, it is associated with the related word candidate information partially matching the related word detected by the detection step from the candidate storage unit. An information search method in which the information search apparatus performs a second search process for searching for the desired information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012234811A JP5544003B2 (en) | 2012-10-24 | 2012-10-24 | Information search device, information search system, and information search method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012234811A JP5544003B2 (en) | 2012-10-24 | 2012-10-24 | Information search device, information search system, and information search method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014085874A true JP2014085874A (en) | 2014-05-12 |
JP5544003B2 JP5544003B2 (en) | 2014-07-09 |
Family
ID=50788874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012234811A Active JP5544003B2 (en) | 2012-10-24 | 2012-10-24 | Information search device, information search system, and information search method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5544003B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102121975B1 (en) * | 2018-12-26 | 2020-06-11 | 주식회사 엘지씨엔에스 | Method for providing actual data through synchronized table and data managing system |
JP2020173611A (en) * | 2019-04-10 | 2020-10-22 | 富士通株式会社 | Search processing program, search processing method, and search processing device |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62221027A (en) * | 1986-03-20 | 1987-09-29 | Fujitsu Ltd | Word candidate retrieving system for word dividing device |
JPH05242147A (en) * | 1991-11-29 | 1993-09-21 | Nec Corp | Natural language interpreting method |
JP2005011149A (en) * | 2003-06-20 | 2005-01-13 | Oki Electric Ind Co Ltd | Information retrieval system and retrieval request device |
JP2010225137A (en) * | 2009-02-27 | 2010-10-07 | Fujitsu Ltd | Retrieval program and retrieval method |
-
2012
- 2012-10-24 JP JP2012234811A patent/JP5544003B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62221027A (en) * | 1986-03-20 | 1987-09-29 | Fujitsu Ltd | Word candidate retrieving system for word dividing device |
JPH05242147A (en) * | 1991-11-29 | 1993-09-21 | Nec Corp | Natural language interpreting method |
JP2005011149A (en) * | 2003-06-20 | 2005-01-13 | Oki Electric Ind Co Ltd | Information retrieval system and retrieval request device |
JP2010225137A (en) * | 2009-02-27 | 2010-10-07 | Fujitsu Ltd | Retrieval program and retrieval method |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102121975B1 (en) * | 2018-12-26 | 2020-06-11 | 주식회사 엘지씨엔에스 | Method for providing actual data through synchronized table and data managing system |
JP2020173611A (en) * | 2019-04-10 | 2020-10-22 | 富士通株式会社 | Search processing program, search processing method, and search processing device |
JP7279481B2 (en) | 2019-04-10 | 2023-05-23 | 富士通株式会社 | Search processing program, search processing method and search processing device |
Also Published As
Publication number | Publication date |
---|---|
JP5544003B2 (en) | 2014-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100754768B1 (en) | System and method for providing recommended word of adjustment each user and computer readable recording medium recording program for implementing the method | |
JP6413256B2 (en) | CONFERENCE SUPPORT DEVICE, CONFERENCE SUPPORT DEVICE CONTROL METHOD, AND PROGRAM | |
US8577882B2 (en) | Method and system for searching multilingual documents | |
US20120323839A1 (en) | Entity recognition using probabilities for out-of-collection data | |
JP2019507417A (en) | User interface for multivariable search | |
JP2012533818A (en) | Ranking search results based on word weights | |
WO2012139475A1 (en) | Method and device for acquiring candidate character string corresponding to input key sequence | |
KR101446468B1 (en) | System and method for prividing automatically completed query | |
CN110543484A (en) | prompt word recommendation method and device, storage medium and processor | |
US20180039632A1 (en) | Information processing apparatus, information processing method, and computer program | |
CN109815390B (en) | Method, device, computer equipment and computer storage medium for retrieving multilingual information | |
JP5221664B2 (en) | Information map management system and information map management method | |
JP2018504686A (en) | Method and apparatus for processing search data | |
JP5544003B2 (en) | Information search device, information search system, and information search method | |
JP6210865B2 (en) | Data search system and data search method | |
US9886497B2 (en) | Indexing presentation slides | |
JP5790768B2 (en) | Search method and information management apparatus | |
TWI550420B (en) | System and method for obtaining information, and storage device | |
JP2018005633A (en) | Related content extraction device, related content extraction method, and related content extraction program | |
JP5127553B2 (en) | Information processing apparatus, information processing method, program, and recording medium | |
KR101349969B1 (en) | System and method for proving recommendation query | |
KR20220068688A (en) | Apparatus for providing answer | |
JP2017004260A (en) | Information processing apparatus, information processing method, and information processing program | |
JP5792871B1 (en) | Representative spot output method, representative spot output device, and representative spot output program | |
WO2015109835A1 (en) | Searching method and terminal device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140430 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140509 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5544003 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |