JP2010266971A - Terminal equipment - Google Patents

Terminal equipment Download PDF

Info

Publication number
JP2010266971A
JP2010266971A JP2009116026A JP2009116026A JP2010266971A JP 2010266971 A JP2010266971 A JP 2010266971A JP 2009116026 A JP2009116026 A JP 2009116026A JP 2009116026 A JP2009116026 A JP 2009116026A JP 2010266971 A JP2010266971 A JP 2010266971A
Authority
JP
Japan
Prior art keywords
search
information
sentence
match
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009116026A
Other languages
Japanese (ja)
Other versions
JP4499179B1 (en
Inventor
Tatsuhiko Okada
達彦 岡田
Takenori Watari
健典 亘
Takashi Mizobuchi
敬司 溝渕
Sadaji Takai
貞治 高井
Takamitsu Ishioka
隆光 石岡
Tsugunori Inoue
世紀 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SYNTAX KK
WEBPRODUCE CORP
NTT Data Group Corp
Original Assignee
SYNTAX KK
WEBPRODUCE CORP
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SYNTAX KK, WEBPRODUCE CORP, NTT Data Corp filed Critical SYNTAX KK
Priority to JP2009116026A priority Critical patent/JP4499179B1/en
Application granted granted Critical
Publication of JP4499179B1 publication Critical patent/JP4499179B1/en
Publication of JP2010266971A publication Critical patent/JP2010266971A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To more efficiently achieve easily understandable display by using a retrieval result under the significant consideration of an implication of a sentence. <P>SOLUTION: An information retrieval device includes: a retrieval processing part for collating a retrieval key sentence corresponding to associated matching conditions with match dictionary information on the basis of match profile information, and for obtaining positional information showing a position where a word satisfying the matching conditions appears in the sentence of the match dictionary information as the result of collation; and a communication part for transmitting retrieval result information obtained by associating a sentence including the words satisfying the matching conditions with the positional information on the basis of the result of the collation obtained by the retrieval processing part to terminal equipment. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、入力されたテキストデータを解析した結果に応じた検索を行う情報検索装置、情報検索方法、端末装置、およびプログラムに関する。   The present invention relates to an information search device, an information search method, a terminal device, and a program for performing a search according to a result of analyzing input text data.

例えば、電子メールによるユーザの意見や企業内の電子文書を収集し、テキストデータに変換してデータベース等に蓄積しておく。そして、オペレーターによるユーザからの問い合わせ対応や苦情対応の際に、オペレーターが入力した文章を検索キーとして、該当する対応方法をデータベースから検索し、オペレーターが使用する端末に送信する検索方法がある。
このようなオペレーターによる対応シーンでは、お客様を待たせないためにも、検索結果が分かりやすいように検索結果を表示する技術が求められている。
特に、このような対応シーンでの検索では、ユーザからの問い合わせや苦情等の、文の意味やユーザの意図を含む文章が検索キーとして利用されているため、このようなシーンでは、単語やキーワード等を検索キーとして検索する一般的な検索ではなく、検索キーである文章の意味やユーザの意図をより重視した検索を行う必要がある。
For example, a user's opinion by electronic mail or an electronic document in a company is collected, converted into text data, and stored in a database or the like. Then, when responding to an inquiry or complaint from a user by an operator, there is a search method in which a corresponding response method is searched from a database using a sentence input by the operator as a search key and transmitted to a terminal used by the operator.
In such a response situation by an operator, there is a demand for a technique for displaying a search result so that the search result is easy to understand so as not to wait for the customer.
In particular, in a search in such a corresponding scene, a sentence including the meaning of a sentence and a user's intention, such as an inquiry or complaint from a user, is used as a search key. It is necessary to perform a search that places more emphasis on the meaning of the text that is the search key and the user's intention, rather than a general search that uses the search key as a search key.

例えば、文書中の全文検索において、複数のキーワードと類似する類義語や同義語ごとに、グループ化して強調表示するものがある。これにより、検索キーワードの数が増えた場合でも、類似するグループを同様の強調表示とすることができるため、検索結果の閲覧時において、ユーザは類似するグループを迅速に判別することができる(例えば、特許文献1参照)。   For example, in a full-text search in a document, some synonyms and synonyms similar to a plurality of keywords are grouped and highlighted. As a result, even when the number of search keywords increases, similar groups can be displayed with the same highlighting. Therefore, when browsing search results, the user can quickly determine similar groups (for example, , See Patent Document 1).

また、文書に対して形態素解析や構文解析を行った後、それぞれの単語の出現頻度やカテゴリ(属性)を判断し、判断結果に基づいて強調表示を行うか否かを判断するものがある。これにより、ユーザ(読み手)が希望する部分(単語)を強調表示することができ、文章の迅速な理解を支援することができる(例えば、特許文献2参照)。   In addition, after performing morphological analysis and syntax analysis on a document, the appearance frequency and category (attribute) of each word are determined, and it is determined whether to perform highlighting based on the determination result. Thereby, the part (word) which a user (reader) desires can be highlighted, and quick understanding of a text can be supported (for example, refer to patent documents 2).

特開2005−84879号公報JP 2005-84879 A 特開2004−151882号公報JP 2004-151882 A

しかしながら、特許文献1のように、類義語等に基づきグループ化して強調表示したとしても、単に検索に使用された文字が強調表示されるだけでは、どの検索結果が検索キーの意味に近い検索結果なのかをユーザが理解し難いという問題がある。
例えば、「ネットワークが接続できない」という文章をキーとして検索を行った場合、複数の検索結果が得られる場合がある。この場合、例えば、「ネットワーク」や「接続」を含む全ての検索結果において、「ネットワーク」と「接続」の単語が強調表示されたとしても、検索に使用された文字が強調表示されているだけで、文章の意味が軽視されている。このため、「ネットワークが接続できない」という意味に近い検索結果を、強調して表示することが困難であるという問題がある。
However, even if grouped based on synonyms etc. and highlighted as in Patent Document 1, any search result is a search result close to the meaning of the search key simply by highlighting the characters used for the search. There is a problem that it is difficult for the user to understand.
For example, when a search is performed using a sentence “network cannot be connected” as a key, a plurality of search results may be obtained. In this case, for example, in all search results including “network” and “connection”, even if the words “network” and “connection” are highlighted, only the characters used for the search are highlighted. And the meaning of the sentence is neglected. For this reason, there is a problem that it is difficult to highlight and display a search result close to the meaning of “network cannot be connected”.

また、特許文献2は、文書内における単語の属性を判断して、同じ単語であっても、ユーザが希望する部分を特定することができる。
これによれば、文章の意味やユーザの意図を重視した表示が可能な場合もあるが、単語の属性や意味を判断するため、形態素解析や構文解析により得られた解析結果や、辞書データが必要となる。よって、文章解析を行い辞書データを参照して検索を行う検索部と、検索結果を表示する表示部とが、例えば、検索サーバとクライアント端末装置のように異なる装置である場合、文章解析が繰り返し行われることとなり、作業効率が悪いという問題がある。つまり、検索時に、検索サーバによって文章解析が行われ、閲覧(結果表示)時に、クライアント端末装置によって検索結果に対して文章解析が行われることとなる。
Further, Patent Literature 2 can determine the attribute of a word in a document and specify a portion desired by the user even if the word is the same.
According to this, there are cases where display that emphasizes the meaning of the sentence and the intention of the user is possible, but in order to determine the attribute and meaning of the word, the analysis results obtained by morphological analysis and syntactic analysis, and the dictionary data Necessary. Therefore, when the search unit that performs sentence analysis and performs search by referring to the dictionary data and the display unit that displays the search result are different devices such as a search server and a client terminal device, the sentence analysis is repeated. There is a problem that work efficiency is poor. That is, the sentence analysis is performed by the search server at the time of search, and the sentence analysis is performed on the search result by the client terminal device at the time of browsing (result display).

本発明は、このような事情を考慮してなされたものであり、その目的は、文の意味合いを重視した検索結果を用いて、分かりやすい表示を効率よく実現するための情報検索装置、情報検索方法、端末装置、情報検索システム、およびプログラムを提供することにある。   The present invention has been made in consideration of such circumstances, and an object of the present invention is to provide an information search apparatus and information search for efficiently realizing easy-to-understand display using search results that emphasize sentence meaning. A method, a terminal device, an information search system, and a program are provided.

上述した課題を解決するために、本発明の情報検索装置は、複数の単語から構成される検索キー文が入力される入力部と、前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得る解析部と、少なくとも1つの単語によって構成される文節を部分木ノードとして木構造に構成した辞書であって、少なくとも1つの前記文節によって構成される文に関するマッチ辞書情報として、当該文に含まれる前記文節に関する情報を表すルール情報を記憶するマッチ辞書記憶部と、前記マッチ辞書記憶部に記憶されている前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられているマッチプロファイル情報を記憶するマッチプロファイル記憶部と、前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果として、前記マッチング条件を満たす単語が、前記マッチ辞書情報の文中に出現する位置を表す位置情報を得る検索処理部と、前記検索処理部によって得られた照合の結果に基づき、前記マッチング条件を満たす単語を含む文と前記位置情報とが関連付けられている検索結果情報を、端末装置に送信する通信部と、を備えることを特徴とする。   In order to solve the above-described problems, an information search apparatus according to the present invention includes an input unit to which a search key sentence composed of a plurality of words is input, and analyzes the search key sentence to form the search key sentence. An analysis unit for obtaining an analysis result relating to the word, and a dictionary configured in a tree structure with a clause constituted by at least one word as a subtree node, and match dictionary information relating to a sentence constituted by at least one of the clauses The match dictionary storage unit that stores rule information representing the information related to the clause included in the sentence, and the relationship between the match dictionary information stored in the match dictionary storage unit and the search key sentence are collated A match profile storage unit for storing match profile information associated with a matching condition for the match profile information, Then, the search key sentence corresponding to the associated matching condition is matched with the match dictionary information, and a word satisfying the matching condition appears in the sentence of the match dictionary information as a result of the matching. A search processing unit that obtains position information representing the position, and a search result information in which the position information is associated with a sentence including a word that satisfies the matching condition based on a result of matching obtained by the search processing unit, And a communication unit that transmits to the apparatus.

また、この情報検索装置は、前記マッチプロファイル情報が、当該マッチング条件を満たす単語に対して前記検索キー文との照合の度合いを評価するための評価基準をさらに含み、前記検索処理部が、前記照合の結果、前記マッチング条件を満たす文に対して、前記マッチプロファイル情報に関連付けられている前記評価基準に従って、前記検索キー文とマッチング辞書情報との照合の度合いを表すスコアを算出することを特徴とする。   Further, the information search device further includes an evaluation criterion for evaluating the degree of matching with the search key sentence for a word for which the match profile information satisfies the matching condition, and the search processing unit includes: As a result of collation, for a sentence satisfying the matching condition, a score representing a degree of collation between the search key sentence and the matching dictionary information is calculated according to the evaluation criterion associated with the match profile information. And

また、この情報検索装置は、前記評価基準が、前記マッチング条件を満たす単語に対して前記照合の度合いに応じた点数を与えるか否かを表し、前記検索処理部が、前記評価基準に従って、前記マッチング条件を満たす単語に対して与えられた前記点数を、前記マッチング条件を満たす文毎に算出して、前記スコアを得ることを特徴とする。   Further, the information search device represents whether the evaluation criterion gives a score corresponding to the degree of matching for a word satisfying the matching condition, and the search processing unit is configured to perform the evaluation according to the evaluation criterion. The score given to the word satisfying the matching condition is calculated for each sentence satisfying the matching condition to obtain the score.

また、上述した課題を解決するために、本発明の端末情報検索装置は、上述に記載の情報検索装置によって得られた検索結果が入力される端末装置であって、前記複数の単語から構成される検索キー文の入力を受け付け、および、指定された単語の再検索を受け付ける入力部と、前記情報検索装置によって、マッチング条件に応じた前記検索キー文とマッチ辞書情報との照合が実行され、得られた照合の結果に基づき、前記マッチング条件を満たす単語を含む文と、前記マッチング条件を満たす単語が前記マッチ辞書情報の文中に出現する位置を表す位置情報とが関連付けられている検索結果情報を記憶する記憶部と、表示データを表示する表示部と、前記検索結果情報の位置情報を参照して、前記入力部を介して再検索の単語として指定された単語を検索キーとした、前記検索結果のマッチング条件を満たす単語を含む文の再検索を行い、検索結果を表示部に表示させる表示データを作成するデータ処理部と、を有することを特徴とする。   In order to solve the above-described problem, a terminal information search device according to the present invention is a terminal device to which a search result obtained by the information search device described above is input, and is configured from the plurality of words. The input key for receiving the search key sentence and the input search part for receiving the re-search of the specified word, and the information search device, the matching between the search key sentence and the match dictionary information according to the matching condition is executed, Search result information in which a sentence including a word satisfying the matching condition is associated with position information indicating a position where the word satisfying the matching condition appears in the sentence of the match dictionary information based on the obtained collation result , A display unit for displaying display data, and the position information of the search result information, and designated as a re-search word via the input unit. A data processing unit that performs a re-search of a sentence including a word that satisfies the matching condition of the search result, using the acquired word as a search key, and generates display data for displaying the search result on the display unit, To do.

また、この端末装置は、前記データ処理部が、前記検索キーに基づく検索によって再検索結果が得られた場合、前記マッチング条件を満たす単語を強調して表示するための表示ルールに従って、前記再検索の単語として指定された単語と、前記再検索結果の関連する部分とを、強調して表示する前記表示データを作成することを特徴とする。   Further, in the terminal device, when the data processing unit obtains a re-search result by the search based on the search key, the re-search is performed according to a display rule for highlighting and displaying a word satisfying the matching condition. The display data is generated to highlight and display the word designated as the word and the related portion of the re-search result.

また、上述した課題を解決するために、本発明の情報検索方法は、入力部が、複数の単語から構成される検索キー文の入力を受け付け、解析部が、前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得て、検索処理部が、前記マッチ辞書記憶部に記憶されている前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられているマッチプロファイル情報を記憶するマッチプロファイル記憶部から前記マッチプロファイル情報を読み出し、少なくとも1つの単語によって構成される文節を部分木ノードとして木構造に構成した辞書であって、少なくとも1つの前記文節によって構成される文に関するマッチ辞書情報として、当該文に含まれる前記文節に関する情報を表すルール情報を記憶するマッチ辞書記憶部の前記マッチ辞書情報を利用して、前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果として、前記マッチング条件を満たす単語が、前記マッチ辞書情報の文中に出現する位置を表す位置情報を検出し、通信部が、前記検索処理部によって得られた照合の結果に基づき、前記マッチング条件を満たす単語を含む文と前記位置情報とが関連付けられている検索結果情報を、端末装置に送信することを特徴とする。   In order to solve the above-described problem, in the information search method of the present invention, the input unit accepts input of a search key sentence composed of a plurality of words, and the analysis unit analyzes the search key sentence. For obtaining an analysis result on the word constituting the search key sentence, and for the search processing unit to collate the relationship between the match dictionary information stored in the match dictionary storage unit and the search key sentence A dictionary in which the match profile information is read from a match profile storage unit that stores match profile information associated with a matching condition, and a clause composed of at least one word is configured as a sub-tree node in a tree structure, As match dictionary information related to a sentence composed of one of the phrases, a rule representing information related to the phrase included in the sentence. Based on the match profile information, the search key sentence corresponding to the associated matching condition and the match dictionary information are collated using the match dictionary information of the match dictionary storage unit that stores information on the match dictionary. As a result of collation, a word satisfying the matching condition is detected as position information indicating a position where the word appears in the sentence of the match dictionary information, and the communication unit is based on the collation result obtained by the search processing unit, Search result information in which a sentence including a word satisfying the matching condition is associated with the position information is transmitted to the terminal device.

また、本発明は、コンピュータを、複数の単語から構成される検索キー文が入力される入力手段、前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得る解析手段、前記マッチ辞書記憶部に記憶されている前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられているマッチプロファイル情報を記憶するマッチプロファイル記憶部から前記マッチプロファイル情報を読み出し、少なくとも1つの単語によって構成される文節を部分木ノードとして木構造に構成した辞書であって、少なくとも1つの前記文節によって構成される文に関するマッチ辞書情報として、当該文に含まれる前記文節に関する情報を表すルール情報を記憶するマッチ辞書記憶部の前記マッチ辞書情報を利用して、前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果として、前記マッチング条件を満たす単語が、前記マッチ辞書情報の文中に出現する位置を表す位置情報を検出する検索処理手段、前記検索処理部によって得られた照合の結果に基づき、前記マッチング条件を満たす単語を含む文と前記位置情報とが関連付けられている検索結果情報を、端末装置に送信する通信手段として機能させるためのプログラムであることを特徴とする。   According to another aspect of the present invention, there is provided an input unit for inputting a search key sentence composed of a plurality of words, an analysis for analyzing the search key sentence, and obtaining an analysis result relating to the words constituting the search key sentence. Means from the match profile storage unit for storing match profile information associated with a matching condition for checking the relationship between the match dictionary information stored in the match dictionary storage unit and the search key sentence A dictionary in which profile information is read and a clause composed of at least one word is used as a sub-tree node in a tree structure, and is included in the sentence as match dictionary information regarding a sentence composed of at least one of the clauses The match dictionary of a match dictionary storage unit that stores rule information representing information on the phrase Information is used to collate the search key sentence according to the associated matching condition with the match dictionary information based on the match profile information, and as a result of the collation, a word satisfying the matching condition is obtained. Search processing means for detecting position information representing a position appearing in the sentence of the match dictionary information, based on a result of matching obtained by the search processing unit, a sentence including a word that satisfies the matching condition, and the position information Is a program for functioning as a communication means for transmitting search result information associated with a terminal device.

また、本発明は、情報検索装置によって得られた検索結果が入力されるコンピュータを、表示データを表示する表示手段、前記複数の単語から構成される検索キー文の入力を受け付け、および、指定された単語の再検索を受け付ける入力手段、前記情報検索装置によって、マッチング条件に応じた前記検索キー文とマッチ辞書情報との照合が実行され、得られた照合の結果に基づき、前記マッチング条件を満たす単語を含む文と、前記マッチング条件を満たす単語が前記マッチ辞書情報の文中に出現する位置を表す位置情報とが関連付けられている検索結果情報を記憶する記憶手段、前記検索結果情報の位置情報を参照して、前記入力手段を介して再検索の単語として指定された単語を検索キーとした、前記検索結果のマッチング条件を満たす単語を含む文の再検索を行い、検索結果を表示部に表示させる表示データを作成するデータ処理手段として機能させるためのプログラムであることを特徴とする。   Further, the present invention provides a computer to which a search result obtained by an information search device is input, a display means for displaying display data, an input of a search key sentence composed of the plurality of words, and a designation. The input retrieval unit that accepts the re-search of the word, and the information search device, the search key sentence corresponding to the matching condition is matched with the match dictionary information, and the matching condition is satisfied based on the obtained matching result Storage means for storing search result information in which a sentence including a word and position information indicating a position where a word satisfying the matching condition appears in the sentence of the match dictionary information is associated; and position information of the search result information. Referring to the search result matching condition using the word specified as the word for re-search through the input means as a search key. And re-search for sentences that contain words, characterized in that it is a program for functioning as a data processing means for generating display data to be displayed on the display unit the search results.

この発明によれば、文の意味合いを重視した検索結果を用いて、分かりやすい表示を効率よく実現することができる。   According to the present invention, an easy-to-understand display can be efficiently realized using a search result that emphasizes the meaning of a sentence.

本実施の形態に係る情報検索システムの一例を示すブロック図である。It is a block diagram which shows an example of the information search system which concerns on this Embodiment. 本実施の形態に係るクライアント端末装置の一例を示すブロック図である。It is a block diagram which shows an example of the client terminal device which concerns on this Embodiment. 本実施の形態に係るWEBサーバの一例を示すブロック図である。It is a block diagram which shows an example of the WEB server which concerns on this Embodiment. 本実施の形態に係る日本語解析サーバの一例を示すブロック図である。It is a block diagram which shows an example of the Japanese language analysis server concerning this Embodiment. 本実施の形態に係るマッチプロファイル記憶部に記憶されているマッチプロファイルの一例を示す概略図である。It is the schematic which shows an example of the match profile memorize | stored in the match profile memory | storage part which concerns on this Embodiment. 本実施の形態に係るマッチ辞書記憶部に記憶されているマッチ辞書データの一例を示す概略図である。It is the schematic which shows an example of the match dictionary data memorize | stored in the match dictionary memory | storage part which concerns on this Embodiment. 本実施の形態に係る日本語解析サーバの一例を示すブロック図である。It is a block diagram which shows an example of the Japanese language analysis server concerning this Embodiment. 本実施の形態に係る構文解析部によって作成される構造木の一例を示す概略図である。It is the schematic which shows an example of the structure tree produced by the syntax analysis part which concerns on this Embodiment. 単語要素マッチングについて説明するための概略図である。It is the schematic for demonstrating word element matching. 係りうけマッチングについて説明するための概略図である。It is the schematic for demonstrating pending matching. 属性マッチングについて説明するための概略図である。It is the schematic for demonstrating attribute matching. 本実施の形態に係る情報検索システムにおけるマッチ辞書データの作成方法の一例を示すフローチャートである。It is a flowchart which shows an example of the creation method of the match dictionary data in the information search system which concerns on this Embodiment. 本実施の形態に係る情報検索システムにおける検索方法の一例を示すフローチャートである。It is a flowchart which shows an example of the search method in the information search system which concerns on this Embodiment. 本実施の形態に係る情報検索システムにおけるマッチング処理とスコアリング処理の一例について詳細に説明するフローチャートである。It is a flowchart explaining in detail about an example of the matching process and scoring process in the information search system which concerns on this Embodiment. 本実施の形態に係る検索結果データの一例について説明する概略図である。It is the schematic explaining an example of the search result data which concern on this Embodiment. 本実施の形態に係る検索結果について説明するための参考図である。It is a reference figure for demonstrating the search result which concerns on this Embodiment. 本実施の形態に係る情報検索システムにおける検索開始処理の一例を示すフローチャートである。It is a flowchart which shows an example of the search start process in the information search system which concerns on this Embodiment. 本実施の形態に係る情報検索システムにおける検索結果の表示方法の一例を示すフローチャートである。It is a flowchart which shows an example of the display method of the search result in the information search system which concerns on this Embodiment. 本実施の形態に係るクライアント端末装置の表示部に表示される検索結果を表す画像の一例を示す概略図である。It is the schematic which shows an example of the image showing the search result displayed on the display part of the client terminal device which concerns on this Embodiment. 図19に示す検索結果から、絞り込み検索を行った後に表示される画面の一例を示す概略図である。FIG. 20 is a schematic diagram illustrating an example of a screen displayed after performing a narrow search from the search result illustrated in FIG. 19. 検索キー文の一例を示す参考図である。It is a reference figure which shows an example of a search key sentence. マッチした単文の一例を示す参考図である。It is a reference figure which shows an example of the matched single sentence. マッチプロファイルの設定の一例を説明するための参考図である。FIG. 10 is a reference diagram for explaining an example of setting a match profile. マッチプロファイルAに基づき得られた検索結果を表示されている画面の一例を示す概略図である。It is the schematic which shows an example of the screen on which the search result obtained based on the match profile A is displayed. マッチプロファイルBに基づき得られた検索結果を表示されている画面の一例を示す概略図である。It is the schematic which shows an example of the screen on which the search result obtained based on the match profile B is displayed. マッチプロファイルCに基づき得られた検索結果を表示されている画面の一例を示す概略図である。It is the schematic which shows an example of the screen on which the search result obtained based on the match profile C is displayed. マッチプロファイルの設定の他の例を説明するための参考図である。FIG. 10 is a reference diagram for explaining another example of setting a match profile. 特定のマッチモードによって得られた検索結果の一例を示す概略図である。It is the schematic which shows an example of the search result obtained by specific match mode. 特定のマッチモードによって得られた検索結果の他の例を示す概略図である。It is the schematic which shows the other example of the search result obtained by specific match mode. 特定のマッチモードによって得られた検索結果の他の例を示す概略図である。It is the schematic which shows the other example of the search result obtained by specific match mode. 特定のマッチモードによって得られた検索結果の他の例を示す概略図である。It is the schematic which shows the other example of the search result obtained by specific match mode.

以下、本発明の一実施形態を、図面を参照して説明する。図1は、本実施の形態に係る情報検索システムの一例を示すブロック図である。
図1に示す通り、情報検索システム1は、クライアント端末装置100と、WEBサーバ300と、日本語解析サーバ500と、データベースファイルサーバ700とを備える。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an example of an information search system according to this embodiment.
As shown in FIG. 1, the information search system 1 includes a client terminal device 100, a WEB server 300, a Japanese language analysis server 500, and a database file server 700.

クライアント端末装置100は、例えば、パーソナルコンピュータ等の情報計算処理装置であって、検索キー文が入力される入力部と、入力部を介してユーザから入力された検索キー文を、ネットワークを介してWEBサーバ300に送信する。なお、詳細については図2を用いて後述する。   The client terminal device 100 is, for example, an information calculation processing device such as a personal computer, and an input unit to which a search key sentence is input and a search key sentence input from a user via the input unit via a network. It transmits to the WEB server 300. Details will be described later with reference to FIG.

WEBサーバ300は、クライアント端末装置100と日本語解析サーバ500間の通信を行い、例えば、クライアント端末装置100から受信した検索キー文を日本語解析サーバ500に送信し、日本語解析サーバ500から受信した検索結果をクライアント端末装置100に送信する。なお、詳細については、図3を用いて後述する。   The WEB server 300 performs communication between the client terminal device 100 and the Japanese language analysis server 500, for example, transmits a search key sentence received from the client terminal device 100 to the Japanese language analysis server 500 and receives from the Japanese language analysis server 500. The retrieved result is transmitted to the client terminal device 100. Details will be described later with reference to FIG.

日本語解析サーバ500は、検索処理部501と、マッチプロファイル記憶部502と、マッチ辞書記憶部503と、辞書作成部504と、文書解析部505と、メモリ領域506を備える。日本語解析サーバ500は、WEBサーバ300から検索キー文を受信すると、この検索キー文に基づく検索を行い、検索結果をWEBサーバ300を介してクライアント端末装置100に送信する。なお、詳細については図4〜8を用いて後述する。   The Japanese analysis server 500 includes a search processing unit 501, a match profile storage unit 502, a match dictionary storage unit 503, a dictionary creation unit 504, a document analysis unit 505, and a memory area 506. When receiving the search key sentence from the WEB server 300, the Japanese analysis server 500 performs a search based on the search key sentence, and transmits the search result to the client terminal device 100 via the WEB server 300. Details will be described later with reference to FIGS.

データベースファイルサーバ700は、日本語解析サーバ500の検索対象となる情報(以下、検索対象情報)を記憶する記憶部であって、例えば、問い合わせの対応履歴や、修理のマニュアルに関する情報、あるいは、電子メールによってユーザ等から取得された意見や苦情等の、企業や取扱い製品やサービスに関する情報を、テキストデータとして記憶する記憶装置であるデータソース701を備える。
また、データベースファイルサーバ700は、例えば、企業においてデータウェアハウスとして利用される蓄積装置が利用可能である。
The database file server 700 is a storage unit that stores information to be searched by the Japanese analysis server 500 (hereinafter referred to as search target information), and includes, for example, information on response to inquiries, information on a repair manual, A data source 701 is provided as a storage device that stores information on companies, products handled, and services such as opinions and complaints acquired from users by e-mail as text data.
The database file server 700 can use, for example, a storage device used as a data warehouse in a company.

次に、図2を用いて、クライアント端末装置100について詳細に説明する。図2は、本実施の形態に係るクライアント端末装置100の一例を示すブロック図である。
図2に示す通り、クライアント端末装置100は、ブラウザ(表示制御部)101と、表示部102と、入力部103と、通信部104とを備える。
表示部102、例えば、液晶表示装置等であって、操作画面や検索結果画面等の表示データを表示する。
入力部103は、例えば、キーボードやマウスからなる入力インターフェースであって、ユーザからの操作指示や検索キー文の入力を受け付ける。
通信部104は、入力部102を介して、ユーザから検索サービスの種類が指定された場合、指定された検索サービスによる検索の実行を要求するリクエスト制御信号を、WEBサーバ300を介して日本語解析サーバ500に送信する。また、通信部104は、入力部102を介してユーザから入力された検索キー文を、ネットワークを介してWEBサーバ300に送信する。
Next, the client terminal device 100 will be described in detail with reference to FIG. FIG. 2 is a block diagram illustrating an example of the client terminal device 100 according to the present embodiment.
As illustrated in FIG. 2, the client terminal device 100 includes a browser (display control unit) 101, a display unit 102, an input unit 103, and a communication unit 104.
The display unit 102 is a liquid crystal display device, for example, and displays display data such as an operation screen and a search result screen.
The input unit 103 is an input interface including a keyboard and a mouse, for example, and accepts an operation instruction and a search key sentence input from a user.
When the type of search service is specified by the user via the input unit 102, the communication unit 104 analyzes a request control signal for requesting execution of the search by the specified search service via the WEB server 300. Send to server 500. In addition, the communication unit 104 transmits the search key text input from the user via the input unit 102 to the WEB server 300 via the network.

ブラウザ101は、例えば、WEBサーバ300から受信したウェブページを表示部102に表示させるためのプログラム(例えば、javascript(登録商標)等)をWEBサーバ300から受信して、このプログラムを実行する表示制御部である。また、ブラウザ101は、このプログラムとして機能し、表示部102によって表示される表示データを生成し、表示部102に出力する。
ブラウザ101は、記憶部111と、データ処理部112と、表示処理部113とを含み、各構成について以下説明する。
The browser 101 receives, for example, a program (for example, javascript (registered trademark)) for displaying the web page received from the WEB server 300 on the display unit 102, and executes display control. Part. The browser 101 functions as this program, generates display data displayed by the display unit 102, and outputs the display data to the display unit 102.
The browser 101 includes a storage unit 111, a data processing unit 112, and a display processing unit 113. Each configuration will be described below.

記憶部111は、データ処理部112や表示処理部113によって処理される際のプログラムや所定の設定値等を記憶する。また、記憶部111は、日本語解析サーバ500によって得られた検索結果(例えば、マッチした文章、マッチした単文、マッチした単語、これらのマッチングに用いられたマッチング条件、あるいはマッチ位置情報を含むマッチ情報等)や、絞り込み検索を実行する際の検索ルール情報(例えば、入力部103を介して指定されたマッチした単語を検索キーとして、検索結果から、絞り込み対象を検索するためのプログラムや設定値等)を記憶する。   The storage unit 111 stores a program and predetermined set values that are processed by the data processing unit 112 and the display processing unit 113. In addition, the storage unit 111 stores search results obtained by the Japanese language analysis server 500 (for example, a matched sentence, a matched single sentence, a matched word, a matching condition used for the matching, or a match including match position information) Information, etc.) and search rule information when performing a refinement search (for example, a program or setting value for retrieving a refinement target from a search result using a matched word specified via the input unit 103 as a search key) Etc.).

データ処理部112は、WEBサーバ300から受信されるブラウザ101上のプログラムとして動作し、WEBサーバ300から受信される表示データを表示部102の画面に表示するための表示データに変換し、表示処理部113を制御して表示部102に表示データを表示させる。また、データ処理部112は、記憶部111に記憶されている検索結果に基づき、マッチング条件を満たす単語に対して強調表示を表すタグ情報を付与した結果表示データを作成する。
表示処理部113は、データ処理112によって制御され、データ処理部112が変換した表示データを表示部102に表示させる。
The data processing unit 112 operates as a program on the browser 101 received from the WEB server 300, converts display data received from the WEB server 300 into display data for display on the screen of the display unit 102, and performs display processing. The display unit 102 is controlled to display display data on the display unit 102. Further, the data processing unit 112 creates result display data in which tag information representing emphasis display is given to words satisfying the matching condition based on the search result stored in the storage unit 111.
The display processing unit 113 is controlled by the data processing 112 and causes the display unit 102 to display the display data converted by the data processing unit 112.

次に、図3を用いて、WEBサーバ300について詳細に説明する。図3は、本実施の形態に係るWEBサーバ300の一例を示すブロック図である。
図3に示す通り、WEBサーバ300は、通信部301と、リクエスト処理部302と、データ変換部303と、記憶部304とを備える。
通信部301は、例えば、ネットワークを介してクライアント端末装置100および日本語解析サーバ500と通信する。
リクエスト処理部302は、通信部301を介してクライアント端末装置100から受信したリクエスト制御信号に基づき、クライアント端末装置100の表示部102によって表示される表示データのウェブページのデータを作成するようデータ変換部303を制御する。また、リクエスト処理部302は、クライアント端末装置100からリクエスト制御信号を受信して、クライアント端末装置100によって実行されるコードファイルや、表示データの表示に関する設定データを作成し、クライアント端末装置100に送信する。
Next, the WEB server 300 will be described in detail with reference to FIG. FIG. 3 is a block diagram showing an example of the WEB server 300 according to the present embodiment.
As illustrated in FIG. 3, the WEB server 300 includes a communication unit 301, a request processing unit 302, a data conversion unit 303, and a storage unit 304.
The communication unit 301 communicates with the client terminal device 100 and the Japanese language analysis server 500 via a network, for example.
The request processing unit 302 performs data conversion so as to create web page data of display data displayed by the display unit 102 of the client terminal device 100 based on the request control signal received from the client terminal device 100 via the communication unit 301. The unit 303 is controlled. Further, the request processing unit 302 receives a request control signal from the client terminal device 100, creates a code file executed by the client terminal device 100 and setting data related to display of display data, and transmits the setting data to the client terminal device 100. To do.

データ変換部303は、リクエスト処理部302によって制御され、日本語解析サーバ500から受信した検索結果等に基づき、クライアント端末装置100に対して送信するウェブページのデータを作成する。
記憶部304は、リクエスト処理部302やデータ変換部303によって利用される設定データ等や、日本語解析サーバ500の検索によって得られた検索結果を一時的に記憶する。
The data conversion unit 303 is controlled by the request processing unit 302 and creates web page data to be transmitted to the client terminal device 100 based on the search result received from the Japanese analysis server 500.
The storage unit 304 temporarily stores setting data and the like used by the request processing unit 302 and the data conversion unit 303 and search results obtained by the search of the Japanese analysis server 500.

なお、WEBサーバ300は、例えば、社内LAN(Local area network)に接続され、コールセンターのオペレーターによってなされる、ユーザからの問い合わせの対応に適した情報を提供するWEBサーバであってよく、社内における知識共有用のデータを提供するためのWEBサーバであってもよい。このように、WEBサーバ300は、情報検索システム1の検索の目的に応じて、複数あってもよい。   The WEB server 300 may be, for example, a WEB server that is connected to an in-house LAN (Local area network) and provides information suitable for handling inquiries from users made by a call center operator. It may be a WEB server for providing data for sharing. As described above, there may be a plurality of WEB servers 300 depending on the purpose of the search of the information search system 1.

次に、図4を用いて、日本語解析サーバ500について詳細に説明する。図4は、本実施の形態に係る日本語解析サーバ500の一例を示すブロック図である。
図4に示す通り、検索処理部501は、異なる検索サービスα、βをクライアント端末装置100に提供するためのプログラムを実行する機能を供え、ユーザによって指定された検索サービスαによる検索を実行するための制御信号をWEBサーバ300から受信した場合、検索サービスαのプログラムを起動させ、検索サービスαと関連付けられているマッチプロファイルをマッチプロファイル記憶部502から読み出す。また、検索処理部501は、マッチ辞書記憶部503に記憶されているマッチ辞書データを読み出す。さらに、検索処理部501は、読み出したマッチプロファイルおよびマッチ辞書データを、メモリ領域506に展開して辞書オブジェクトを作成する。
Next, the Japanese language analysis server 500 will be described in detail with reference to FIG. FIG. 4 is a block diagram showing an example of the Japanese language analysis server 500 according to the present embodiment.
As shown in FIG. 4, the search processing unit 501 has a function of executing a program for providing different search services α and β to the client terminal device 100, and executes a search by the search service α designated by the user. When the control signal is received from the WEB server 300, the search service α program is started, and the match profile associated with the search service α is read from the match profile storage unit 502. In addition, the search processing unit 501 reads match dictionary data stored in the match dictionary storage unit 503. Further, the search processing unit 501 expands the read match profile and match dictionary data in the memory area 506 to create a dictionary object.

また、検索処理部501は、WEBサーバ300を介してクライアント端末装置100から検索キー文を受信すると、受信した検索キー文を文書解析部505に出力し、検索結果を書き込むための検索結果オブジェクト(空の状態)をメモリ領域506に生成する。これにより、検索結果を記録するためのメモリ領域を確保することができる。
さらに、検索処理部501は、マッチプロファイル記憶部502から読み出したマッチプロファイルにおいて予め決められているマッチモードに従って、解析された検索キー文と、メモリ領域506の辞書オブジェクトに展開されているマッチ辞書データとの照合(以下、マッチングという)を行い、マッチモードの条件を満たす文章等の検索を行う(以下、マッチング処理という)。
When the search processing unit 501 receives a search key sentence from the client terminal device 100 via the WEB server 300, the search processing unit 501 outputs the received search key sentence to the document analysis unit 505 and writes a search result object ( (Empty state) is generated in the memory area 506. Thereby, a memory area for recording the search result can be secured.
The search processing unit 501 further analyzes the search key sentence analyzed in accordance with the match mode predetermined in the match profile read from the match profile storage unit 502 and the match dictionary data developed in the dictionary object in the memory area 506. Are matched (hereinafter referred to as matching), and a sentence or the like that satisfies the match mode is searched (hereinafter referred to as matching processing).

また、検索処理部501は、マッチプロファイルにおいて予め決められているスコアモードに従って、マッチングによって得られた文章(以下、マッチした文章という)における、検索キー文とのマッチングの程度を評価するスコアを算出する(以下、スコアリング処理という)。なお、詳細は後述するが、検索処理部501は、例えば、マッチングによって得られた単文(以下、マッチした単文という)に含まれる単語のスコアを算出し、この単語のスコアの和を算出することによって、マッチした文章のスコアやマッチした単文のスコアを算出する。
さらに、検索処理部501は、マッチングによって得られた文章等の文章ID等と、当該文章等のスコアを関連付けて、メモリ領域506の検索結果オブジェクトに検索結果として格納する。また、検索処理部501は、この検索結果オブジェクトの検索結果を、WEBサーバ300を介してクライアント端末装置100に送信する。
In addition, the search processing unit 501 calculates a score that evaluates the degree of matching with a search key sentence in a sentence obtained by matching (hereinafter referred to as a matched sentence) in accordance with a score mode predetermined in the match profile. (Hereinafter referred to as scoring process). Although details will be described later, for example, the search processing unit 501 calculates the score of a word included in a single sentence obtained by matching (hereinafter referred to as a matched single sentence), and calculates the sum of the scores of the words. To calculate the score of the matched sentence and the score of the matched single sentence.
Further, the search processing unit 501 associates a sentence ID or the like of a sentence obtained by matching with a score of the sentence or the like and stores it as a search result in a search result object in the memory area 506. Also, the search processing unit 501 transmits the search result of the search result object to the client terminal device 100 via the WEB server 300.

メモリ領域506は、一時的に情報を記憶する記憶領域であって、例えば、検索処理部501によって作成される辞書オブジェクトや検索結果オブジェクトが作成される領域である。   The memory area 506 is a storage area for temporarily storing information. For example, a dictionary object or a search result object created by the search processing unit 501 is created.

マッチプロファイル記憶部502には、例えば、各検索サービスα、β・・・に応じたマッチプロファイルA、B・・・が格納されている。ここで、マッチプロファイルとは、予め決定されているマッチモードを定義するマッチモード情報と、当該マッチモードで抽出された結果に適用されるスコアの算出手法を定義するスコアモード情報とを含む。例えば、マッチプロファイルAのマッチモード定義においては、検索サービスαとマッチプロファイルAとが予め関連づけられている。よって、ユーザによって検索サービスが指定されると、この検索サービスに応じて予め決定されているマッチプロファイルと、このマッチプロファイルにおいて予め決められているマッチモードやスコアモードが、決定される。
なお、本発明はこれに限られず、クライアント端末装置100が、これら検索サービスの種類、マッチプロファイルの種類、マッチモードの種類の組み合わせを表す情報をリクエスト制御信号とともにWEBサーバ300を介して日本語解析サーバ500に送信する場合、ユーザによって、これらの組み合わせが決定される構成であってもよい。
The match profile storage unit 502 stores, for example, match profiles A, B... Corresponding to each search service α, β. Here, the match profile includes match mode information that defines a predetermined match mode and score mode information that defines a score calculation method applied to a result extracted in the match mode. For example, in the match mode definition of match profile A, search service α and match profile A are associated in advance. Therefore, when a search service is designated by the user, a match profile determined in advance according to the search service, and a match mode and score mode determined in advance in the match profile are determined.
The present invention is not limited to this, and the client terminal device 100 analyzes Japanese information via the WEB server 300 through the WEB server 300 together with the request control signal and information indicating the combination of the search service type, the match profile type, and the match mode type. When transmitting to the server 500, the combination of these may be determined by the user.

ここで、マッチプロファイルについて、図5を用いて詳細に説明する。図5は、本実施の形態に係るマッチプロファイル記憶部502に記憶されているマッチプロファイルの一例を示す概略図である。
図5に示す通り、マッチプロファイルAは、マッチモード情報として、マッチモード定義PA1を含み、スコアモード情報として、相対出現頻度フラグPA2と、相対出現頻度重視係数PA3と、文章出現位置PA4と、検索キー出現位置PA5と、述語属性マッチ係数PA6と、係りうけマッチ係数PA7と、品詞カテゴリPA8と、接続詞評価PA9と、同義語マッチ係数PA10と、を含む。
Here, the match profile will be described in detail with reference to FIG. FIG. 5 is a schematic diagram illustrating an example of a match profile stored in the match profile storage unit 502 according to the present embodiment.
As shown in FIG. 5, the match profile A includes a match mode definition PA1 as match mode information, a relative appearance frequency flag PA2, a relative appearance frequency emphasis coefficient PA3, a sentence appearance position PA4 as search mode information, and a search. Key appearance position PA5, predicate attribute match coefficient PA6, dependency match coefficient PA7, part-of-speech category PA8, conjunction evaluation PA9, and synonym match coefficient PA10 are included.

マッチモード定義PA1とは、検索サービスα、β・・・に応じて予め決定されているマッチモードの組み合わせに関する情報である。ここで、マッチモードとは、検索キー文とマッチ辞書データのマッチングを行う際の手法を表すものであって、例えば、図9〜11において後述するような、単語要素マッチング、係りうけマッチング、属性マッチングがあり、その組み合わせとして定義される。   The match mode definition PA1 is information relating to a combination of match modes determined in advance according to the search services α, β,. Here, the match mode represents a technique for performing matching between the search key sentence and the match dictionary data. For example, as described later with reference to FIGS. There is a match and it is defined as the combination.

スコアモード情報は、マッチモードに応じて得られた結果に対する、スコア条件や重みの付け方に関する情報を含み、マッチした文章や単文のスコアを算出する際に参照される情報である。
スコアモード情報は、相対出現頻度フラグPA2、相対出現頻度重視係数PA3、文章出現位置PA4、および検索キー出現位置PA5、述語属性マッチ係数PA6、係りうけマッチ係数PA7、品詞カテゴリPA8、接続詞評価PA9、および同義語マッチ係数PA10を含み、いずれのマッチモードにおいても利用可能なスコアモードに関する情報である。ここで、マッチモード情報とスコアモード情報は、マッチモード定義PA1において予め決められているマッチングモードに関わらず、任意に組み合わせが可能である。
The score mode information is information referred to when calculating a score of a matched sentence or a single sentence, including information on a score condition and a weighting method for a result obtained according to the match mode.
The score mode information includes a relative appearance frequency flag PA2, a relative appearance frequency importance coefficient PA3, a sentence appearance position PA4, and a search key appearance position PA5, a predicate attribute match coefficient PA6, a dependency match coefficient PA7, a part of speech category PA8, a conjunction evaluation PA9, And a score mode that can be used in any match mode, including the synonym match coefficient PA10. Here, the match mode information and the score mode information can be arbitrarily combined regardless of the matching mode predetermined in the match mode definition PA1.

また、スコアモード情報は、マッチした単語に対して付与されるスコアを算出するか否かを表す情報であって、算出することを表す情報が設定されている場合、それぞれにおいて付与される係数や得点が設定値として決められている。つまり、検索処理部501は、マッチングモード情報を利用して、マッチした文章や単文に対して、スコアモード情報を利用して、さらにマッチングした文章や単文と、検索キー文とのマッチングの度合いを評価するためのスコアを算出することができる。ここで、スコアは、マッチングした文章や単文と、検索キー文とのマッチングの度合いを示すものであって、例えば、マッチした文章等と検索キー文との関係において、文章構成や係りうけ関係が一致している、あるいは、述語属性が一致している等によって、文としての意味合いがどのくらい類似しているかを評価するための点数である。   The score mode information is information indicating whether or not to calculate a score to be given to the matched word, and when information representing the calculation is set, a coefficient given in each The score is determined as a set value. In other words, the search processing unit 501 uses the matching mode information to calculate the degree of matching between the matched sentence or single sentence and the search key sentence using the score mode information for the matched sentence or single sentence. A score for evaluation can be calculated. Here, the score indicates the degree of matching between the matched sentence or single sentence and the search key sentence. For example, in the relationship between the matched sentence or the like and the search key sentence, there is a sentence structure or a relation relationship. This is a score for evaluating how similar the meaning of a sentence is due to the match or the predicate attribute being matched.

相対出現頻度フラグPA2は、相対出現頻度(tf×idf)に基づく重み付けの利用を行うか否かを表す。フラグがオンとなっている状態では、この重み付けを行うことを表し、フラグがオフとなっている状態では行わないことを表す。
ここで、相対出現頻度(tf×idf)は、キーワード(重要語)抽出の手がかりとして一般的に用いられる相対値であって、以下の各系数(tf,idf)係数を乗じたものである。
なお、tf( term frequency )は、ある文章における、特定の単語の相対出現頻度であって、idf( inversed document frequency )は、特定の単語が含まれる文章数の逆数である。つまり、どの文章にも含まれるようなありふれた単語ほど、相対出現頻度は小さくなる。したがって、ある文章は、それに含まれ相対出現頻度(tf×idf)の高い単語によって特徴づけられる。
The relative appearance frequency flag PA2 indicates whether to use weighting based on the relative appearance frequency (tf × idf). When the flag is on, this weighting is performed, and when the flag is off, it is not performed.
Here, the relative appearance frequency (tf × idf) is a relative value that is generally used as a key for keyword (important word) extraction, and is multiplied by the following coefficient (tf, idf).
Note that tf (term frequency) is the relative frequency of occurrence of a specific word in a sentence, and idf (inversed document frequency) is the reciprocal of the number of sentences containing the specific word. In other words, the more common words that are included in any sentence, the lower the relative appearance frequency. Therefore, a certain sentence is characterized by a word contained in it and having a high relative appearance frequency (tf × idf).

相対出現頻度重視係数PA3は、相対出現頻度フラグPA2がオンの状態で行われる、tf値のスコアに対する重み付けの係数である。   The relative appearance frequency importance coefficient PA3 is a weighting coefficient for the score of the tf value, which is performed in a state where the relative appearance frequency flag PA2 is on.

文章出現位置PA4は、文章や単文における文の出現位置に応じた重み付けを行うか否かを表す情報である。例えば、文章出現位置PA4が出現位置に応じた重み付けを行うことを表している状態で、マッチ辞書記憶部503に記憶されている文章の先頭に近い単語から傾斜的な係数を付与することを表している。ここでは、先頭に近い位置に出現する単語に対しては、重み付けを重くし、文末に近い位置に出現する単語ほど重み付けが軽くなるような係数が設定されている。なお、この係数は、任意に設定可能である。   The sentence appearance position PA4 is information indicating whether or not weighting is performed according to the sentence appearance position in a sentence or a single sentence. For example, in a state where the sentence appearance position PA4 represents weighting according to the appearance position, this indicates that a gradient coefficient is given from a word close to the head of the sentence stored in the match dictionary storage unit 503. ing. Here, a coefficient is set such that a word appearing at a position near the beginning is weighted more and a word that appears closer to the end of the sentence is lighter. This coefficient can be set arbitrarily.

検索キー出現位置PA5は、検索キー文における文の出現位置に応じた重み付けを行うか否かを表す情報である。例えば、検索キー出現位置PA5は、出現位置に応じた重み付けを行うことを表している状態で、検索キー文とマッチした単語が、検索キー文において出現する位置に応じて、先頭に近い位置に出現した単語等の文字列から傾斜的な係数を付与することを表している。ここでは、検索キー文の先頭に近い位置に出現する単語に対しては、重み付けを重くし、検索キー文の文末に近い位置に出現する単語ほど重み付けが軽くなるような係数が設定されている。なお、この係数は、任意に設定可能である。   The search key appearance position PA5 is information indicating whether or not weighting is performed according to the sentence appearance position in the search key sentence. For example, the search key appearance position PA5 indicates that weighting according to the appearance position is performed, and a word that matches the search key sentence is positioned closer to the head depending on the position at which the search key sentence appears. This indicates that a gradient coefficient is given from a character string such as an appearing word. Here, for words that appear near the beginning of the search key sentence, a weight is set to be heavy, and a coefficient is set so that the weight that appears closer to the end of the search key sentence is lighter. . This coefficient can be set arbitrarily.

述語属性マッチ係数PA6は、述語属性一致の際のノードのスコア係数を表す情報である。例えば、マッチした単語や係りうけ関係にある単語に対して、これらマッチした単語と検索キー文の対応する単語との述語属性がさらに一致した場合に、どれだけ重み付けを加算するかが規定されている。なお、単純に名詞など属性が無い場合は、重み付けの加算は行わず、否定などの属性が付与され、一致した場合の重み付けの加算は、乗数としてのスコア計数を任意に設定可能である。なお、単純な名詞文節などのように属性が無い場合は、重み付けの加算は行わない。属性が付与され一致した場合の重み付けの加算は、乗数としてのスコア計数を任意に設定可能である。   The predicate attribute match coefficient PA6 is information representing the score coefficient of the node when the predicate attribute matches. For example, it is specified how much weight is added to a matched word or a related word when the predicate attribute of the matched word and the corresponding word in the search key statement further matches. Yes. If there is simply no attribute such as a noun, weighting addition is not performed, and an attribute such as negation is given, and weighting addition in the case of matching can arbitrarily set a score count as a multiplier. If there is no attribute such as a simple noun phrase, weighting is not added. In addition of weights when attributes are assigned and they match, score counting as a multiplier can be arbitrarily set.

係りうけマッチ係数PA7は、係りうけ単位で一致した場合のスコア係数を表す情報である。例えば、マッチした単語同士が係りうけ関係にある単語(以下、係りうけペアという)に対して重み付けを行うか否かが規定されている。なお、スコア計数は、乗数として任意に設定可能である。   The pending match coefficient PA7 is information representing a score coefficient when matching is performed in the pending units. For example, it is defined whether or not weighting is performed on words in which matched words are related to each other (hereinafter referred to as “related pairs”). The score count can be arbitrarily set as a multiplier.

品詞カテゴリPA8は、品詞カテゴリごとの重み付けを表す情報であって、例えば、ユーザー単語 > 固有名詞 > 一般名詞 > 形容詞・形容動調 > 動詞といった優先順位に応じて、品詞ごとに傾斜的な係数を与えるか否かを表している。なお、品詞ごとに傾斜的な係数を任意に設定可能である。   The part-of-speech category PA8 is information representing weighting for each part-of-speech category. For example, a slope coefficient is given to each part-of-speech according to the priority order such as user word> proprietary noun> general noun> adjective / adjective tone> verb. Indicates whether or not to give. Note that an inclined coefficient can be arbitrarily set for each part of speech.

接続詞評価PA9は、検索キー文とマッチした文章等において、特定の接続詞が含まれている場合、当該マッチした文全体を重視(または軽視)するか否かを表す情報である。例えば、接続詞評価PA9は、特定の接続詞がある場合に文全体を重視することを表す状態で、特定の接続詞が含まれているマッチした文章の各単語に乗じる係数や、特定の接続詞が含まれているマッチした文章のうちマッチした単語にのみ乗じられる係数等が規定されている。   The conjunction evaluation PA9 is information indicating whether or not the entire matched sentence is emphasized (or neglected) when a specific conjunction is included in the sentence matched with the search key sentence. For example, the conjunction evaluation PA9 is a state that emphasizes the whole sentence when there is a specific conjunction, and includes a coefficient to be multiplied to each word of the matched sentence including the specific conjunction, or a specific conjunction. Coefficients to be multiplied only for the matched words among the matched sentences are defined.

同義語マッチ係数PA10は、後述する文書解析部505の類義語処理部による文字列置換が行われた文字列のスコアを何倍にするかを表す情報である。また、同義語マッチ係数PA10は、単語そのものが一致した場合に比較して、同義語や類義語との一致のスコア順位を落とすために用いる情報である。   The synonym match coefficient PA10 is information indicating how many times the score of the character string that has been subjected to character string replacement by the synonym processing unit of the document analysis unit 505 described later is to be increased. The synonym match coefficient PA10 is information used to drop the score ranking of matching with synonyms and synonyms compared to when the words themselves match.

マッチ辞書記憶部503は、マッチ辞書データを記憶し、このマッチ辞書データは、例えば、シンボルIDに置き換えられた単語情報との対応関係を表すシンボルマップMD1と、各文章に関することを表す文章情報MD2と、この文章に含まれる単文情報MD3とを含む。
ここで、マッチ辞書データについて、図6を用いて詳細に説明する。図6は、本実施の形態に係るマッチ辞書記憶部503に記憶されているマッチ辞書データの一例を示す概略図である。
The match dictionary storage unit 503 stores match dictionary data. The match dictionary data includes, for example, a symbol map MD1 indicating a correspondence relationship with word information replaced with a symbol ID, and sentence information MD2 indicating a relation with each sentence. And single sentence information MD3 included in the sentence.
Here, the match dictionary data will be described in detail with reference to FIG. FIG. 6 is a schematic diagram showing an example of match dictionary data stored in the match dictionary storage unit 503 according to the present embodiment.

シンボルマップMD1は、シンボルIDによって識別される単語情報のテキストデータと、単語情報を識別するためのシンボルIDとを対応付ける情報である。これにより、マッチ辞書記憶部503は、文章情報MD2および単文情報MD3において、単語情報をテキストデータで記憶することなく、シンボルマップMD1において対応付けられているシンボルIDに置き換えて格納することができる。   The symbol map MD1 is information that associates text data of word information identified by a symbol ID with a symbol ID for identifying the word information. As a result, the match dictionary storage unit 503 can store the word information in the sentence information MD2 and the single sentence information MD3 by replacing them with the symbol IDs associated with the symbol map MD1 without storing them as text data.

文章情報MD2は、解析された文章の構造木(詳細については後述する)をマッチ辞書記憶部503に登録するために必要な登録情報であって、文章ID21と、この文章ID21によって識別される文章の文章テキストデータ22と、当該文章が検索対象情報としてデータベースファイルサーバ700に格納された日時やデータソース701での格納場所を表すアドレス等の情報を含む文章付加情報23と、用語マップ24とを含む。ここで、用語マップ24は、文章内に含まれる単語情報の出現回数を表す情報であって、単語情報毎の出現回数とシンボルIDとが対応付けられている。   The sentence information MD2 is registration information necessary for registering an analyzed sentence structure tree (details will be described later) in the match dictionary storage unit 503. The sentence information is identified by the sentence ID 21 and the sentence ID 21. Sentence text data 22, sentence addition information 23 including information such as the date and time when the sentence was stored in the database file server 700 as search target information and the storage location in the data source 701, and the term map 24. Including. Here, the term map 24 is information indicating the number of appearances of the word information included in the sentence, and the number of appearances for each word information is associated with the symbol ID.

一方、単文情報MD3は、単文に含まれる文節毎に、構造木(図8参照にて、詳細は後述する)における部分木ノードの情報を表すルール(ルール情報)32を含み、各単文を識別するための単文ID31が付与されている。
単文情報MD3に含まれるルール32は、例えば、語情報321、述語属性322、親ルールID323、重み値324、接続詞種別325、カテゴリ326、子ノード有フラグ327等を含む。
On the other hand, the simple sentence information MD3 includes a rule (rule information) 32 representing information of a subtree node in a structure tree (see FIG. 8 for details) for each clause included in the simple sentence, and identifies each simple sentence. A simple sentence ID 31 is assigned.
The rule 32 included in the simple sentence information MD3 includes, for example, word information 321, predicate attribute 322, parent rule ID 323, weight value 324, conjunction type 325, category 326, child node presence flag 327, and the like.

語情報321は、例えば、シンボルIDや、単文内における単語情報の位置を表す位置情報等を含む。なお、語情報321は、単文内に含まれる単語の数に応じた数の語情報1、語情報2、・・・、語情報nを含み、例えば、単語情報のシンボルID、単文における単語の位置情報(開始位置と終了位置)を含む。
述語情報322は、例えば、語IDや、動詞形容詞等の句の属性、および句の意味(否定、否定の傾向、願望、肯定・・・等)を表す属性シンボルID等を含む。
The word information 321 includes, for example, a symbol ID and position information indicating the position of word information in a single sentence. The word information 321 includes the number of word information 1, word information 2,..., Word information n corresponding to the number of words included in the single sentence, for example, the symbol ID of the word information, the word information in the single sentence Includes position information (start position and end position).
The predicate information 322 includes, for example, a word ID, an attribute of a phrase such as a verb adjective, and an attribute symbol ID representing the meaning of the phrase (negative, negative tendency, desire, affirmation, etc.).

親ルールID323は、親子の係りうけ関係にある親の部分木ノードの文節を表す情報である。
重み値324は、例えば、文章内での主語や述語に応じた重みを付与する係数等である。また、重み値324は、後述するスコアリングにおいて、当該ルール(ノード)がマッチした際に基準となる点数を規定する係数等である。通常は辞書全体で任意の一つの値に設定されるが、辞書の作成時に、文章内での主語や述語に応じた重みを付与する事ができる。
接続詞種別325は、ルール32に対応する文節(句)が、「したがって、だから、すなわち、・・・」等の接続詞である場合、その接続詞を表す情報である。
カテゴリ326は、動詞、名詞、副詞、接続詞・・・等の品詞の種類を表す情報である。
子ノード有フラグ327は、親子の係りうけ関係にある子の部分木ノードの文節の有無を表す情報であって、フラグがオンされている状態で、当該部分木ノードが親の部分木ノードであることを表す情報である。
The parent rule ID 323 is information representing a clause of a parent subtree node that has a parent-child relationship.
The weight value 324 is, for example, a coefficient that gives a weight according to the subject or predicate in the sentence. In addition, the weight value 324 is a coefficient that defines a reference score when the rule (node) matches in scoring described later. Normally, the entire dictionary is set to an arbitrary value, but weights corresponding to the subject and predicate in the sentence can be given when the dictionary is created.
The conjunction type 325 is information representing the conjunction when the clause (phrase) corresponding to the rule 32 is a conjunction such as “so, that is, that is,...
The category 326 is information indicating the type of part of speech such as a verb, noun, adverb, conjunction,.
The child node presence flag 327 is information indicating the presence / absence of a clause of a child subtree node having a parent-child relationship, and the subtree node is a parent subtree node when the flag is on. This is information indicating that there is.

次に、図7を用いて、検索処理部501、辞書作成部504、および文書解析部505について詳細に説明する。図7は、本実施の形態に係る日本語解析サーバ500の一例を示すブロック図である。
辞書作成部504は、データベースファイルサーバ700から、検索対象となる文章(検索対象情報)を読み出し、検索対象情報に含まれる文章を、例えば句点ごとに区切って単文の単位に変換し、文書解析部505に出力する。例えば、検索対象情報に含まれる文章Aのテキストデータが「PC内にある画像を送信したところ受信できませんでした。また、携帯内にある画像を送信したところ受信できました。」である場合、句点「。」で区切って2つの単文に分割し、単文A1「PC内にある画像を送信したところ受信できませんでした。」と、単文A2「また、携帯内にある画像を送信したところ受信できました。」を文書解析部505に出力する。
また、辞書作成部504は、文書解析部505によって解析された結果を、文書解析部505から受け取った場合、マッチ辞書記憶部503に格納する。
なお、辞書作成部504は、データベースファイルサーバ700から読み出した検索対象情報を、適当な長さに区切るものであればよく、例えば、ピリオド、箇条書きの一文、スペースや改行によって一文と判断される一文で、区切るものであってもよい。
Next, the search processing unit 501, the dictionary creation unit 504, and the document analysis unit 505 will be described in detail with reference to FIG. FIG. 7 is a block diagram showing an example of the Japanese language analysis server 500 according to the present embodiment.
The dictionary creation unit 504 reads the text to be searched (search target information) from the database file server 700, converts the text contained in the search target information into, for example, units of single sentences by dividing each phrase, and the document analysis unit Output to 505. For example, if the text data of sentence A included in the search target information is "I could not receive it when I sent an image in my PC. And I received it when I sent an image in my phone." Divided into two single sentences separated by a punctuation mark “.”, The simple sentence A1 “I couldn't receive it when I sent the image in the PC.” Is output to the document analysis unit 505.
When the dictionary analysis unit 504 receives the result analyzed by the document analysis unit 505 from the document analysis unit 505, the dictionary creation unit 504 stores the result in the match dictionary storage unit 503.
Note that the dictionary creation unit 504 only needs to divide the search target information read from the database file server 700 into an appropriate length. For example, the dictionary creation unit 504 is determined to be one sentence by a period, a single bullet, a space, or a line feed. The sentence may be separated by a single sentence.

文書解析部505は、辞書作成部504によってマッチ辞書データが作成される際に、例えば、単文単位に区切られた検索対象情報を、辞書作成部504から受け取り、文書解析を行って、解析結果を辞書作成部504に出力する。
また、文書解析部505は、クライアント端末装置100から特定の検索サービスによる検索を実行するようなリクエスト制御信号を受信した場合、検索処理部501から受け取った検索キー文に対して文書解析を行い、解析結果を検索処理部501に出力する。以下、文書解析部505について詳細に説明する。
When the match creation data is created by the dictionary creation unit 504, the document analysis unit 505 receives, for example, search target information divided into single sentence units from the dictionary creation unit 504, performs document analysis, and obtains an analysis result. The data is output to the dictionary creation unit 504.
When the document analysis unit 505 receives a request control signal for executing a search by a specific search service from the client terminal device 100, the document analysis unit 505 performs document analysis on the search key sentence received from the search processing unit 501, The analysis result is output to the search processing unit 501. Hereinafter, the document analysis unit 505 will be described in detail.

文書解析部505は、辞書部550と、解析部551とを備える。
辞書部550は、システム辞書5501と、ユーザ辞書5502と、類義語辞書5503とを備える。一方、解析部551は、形態素解析部5511と、構文解析部5512と、類義語処理部5513とを備える。
The document analysis unit 505 includes a dictionary unit 550 and an analysis unit 551.
The dictionary unit 550 includes a system dictionary 5501, a user dictionary 5502, and a synonym dictionary 5503. On the other hand, the analysis unit 551 includes a morphological analysis unit 5511, a syntax analysis unit 5512, and a synonym processing unit 5513.

システム辞書5501は、例えば、形態素として意味を持つ最小単位の単語と、この単語の意味や品詞、属性情報等が対応付けられている辞書データである。
ユーザ辞書5502は、例えば、日本語解析サーバ500を利用する管理者等によって、システム辞書5501に追加される辞書データである。
類義語辞書は、複数の類義語や同義語を置き換えるため、単語とその類義語等とを対応付けている辞書データであって、例えば、マッチ辞書記憶部503のマッチ辞書データの単語情報と、その類義語が対応付けられている。
The system dictionary 5501 is, for example, dictionary data in which a minimum unit word having meaning as a morpheme is associated with the meaning, part of speech, attribute information, and the like of the word.
The user dictionary 5502 is dictionary data added to the system dictionary 5501 by, for example, an administrator who uses the Japanese language analysis server 500.
The synonym dictionary is dictionary data in which a word and its synonym are associated with each other in order to replace a plurality of synonyms and synonyms. For example, word information of match dictionary data in the match dictionary storage unit 503 and its synonyms are It is associated.

形態素解析部5511は、例えば、辞書作成部504によって、単文ごとに区切られた検索対象情報を受け取り、検索対象となる文章を複数の形態素(単語情報)に分解する。例えば、形態素解析部5511は、文章Aが入力されると、文章Aに含まれる単文A1を、複数の形態素(「PC」「内」「に」「ある」「画像」「を」「送信」「した」「ところ」「受信」「できませんでした」)に分解する。
このようにして、形態素解析部5511は、マッチ辞書データ作成の際に、検索対象情報を形態素に分解することができるが、これに限られず、検索キー文を入力して検索を行う際には、検索処理部501によって単文ごとに区切られた検索キー文を受け取り、形態素に分解する。
The morpheme analysis unit 5511 receives, for example, search target information divided for each single sentence by the dictionary creation unit 504, and decomposes the text to be searched into a plurality of morphemes (word information). For example, when the sentence A is input, the morpheme analysis unit 5511 converts the single sentence A1 included in the sentence A into a plurality of morphemes (“PC”, “inside”, “in”, “present”, “image”, “in”, “out”). "I did", "Place", "Receive", "I couldn't").
In this way, the morpheme analysis unit 5511 can decompose search target information into morphemes when creating match dictionary data, but is not limited to this, and when performing a search by inputting a search key sentence. The search processing unit 501 receives a search key sentence divided for each single sentence and decomposes it into morphemes.

また、形態素解析部5511は、システム辞書5501やユーザ辞書5502を参照して、分解した形態素の品詞を検索し、得られた品詞情報に基づき、文章中の係りうけ関係や形態素の意味に応じた文節を作成する。例えば、構文解析部5512は、単文A1から分解された形態素に基づき、文節A101「PC内に」と、文節A102「ある」と、文節A103「画像を」と、文節A104「送信したところ」と、文節A105「受信できませんでした」とを作成する。なお、ここで、文節とは、少なくとも1つの単語を含む文字列の単位である。また、単文とは、少なくとも1つの文節を含み1つの文からなる文字列の単位であって、例えば、句点等で区切られる。さらに、文章とは、複数の単文を含む文の単位である。なお、文は、単文と文章の両方を含むものとする。   Further, the morpheme analysis unit 5511 searches the part of speech of the decomposed morpheme with reference to the system dictionary 5501 and the user dictionary 5502, and based on the obtained part of speech information, the morpheme analysis unit 5511 responds to the dependency relationship in the sentence and the meaning of the morpheme. Create a clause. For example, based on the morpheme decomposed from the single sentence A1, the syntax analysis unit 5512, the phrase A101 “in the PC”, the phrase A102 “is”, the phrase A103 “image”, and the phrase A104 “sent” , Phrase A105 “Could not be received” is created. Here, the phrase is a unit of a character string including at least one word. A single sentence is a unit of a character string including one sentence including at least one clause, and is delimited by, for example, a phrase. Furthermore, a sentence is a unit of a sentence including a plurality of simple sentences. A sentence includes both a simple sentence and a sentence.

さらに、形態素解析部5511は、システム辞書5501およびユーザ辞書5502に記憶されている辞書データを参照して、それぞれ品詞のカテゴリ(例えば、動詞、名詞、副詞、接続詞・・・等)や、接続詞の種類(例えば、したがって、だから、といった・・・等)、動詞や形容詞等の句の意味を表す属性(例えば、否定、否定の傾向、願望、肯定・・・等)を検索し、検索によって得られた情報を形態素や文節に付与する。
例えば、形態素解析部5511は、文節A105「受信できません」を解析して、品詞は“名詞(サ変接続)”であって、句の意味は“否定”であることを解析結果として得て、この解析結果を文節A105に付与する。
Further, the morpheme analysis unit 5511 refers to the dictionary data stored in the system dictionary 5501 and the user dictionary 5502, respectively, the category of part of speech (for example, verb, noun, adverb, conjunction, etc.) Search by attribute (eg, negation, negative tendency, desire, affirmation, etc.) that represents the meaning of the phrase (eg, therefore, so on, etc.), verbs, adjectives, etc. Information is given to morphemes and phrases.
For example, the morpheme analysis unit 5511 analyzes the phrase A105 “cannot be received”, obtains as an analysis result that the part of speech is “noun (sa modification connection)” and the meaning of the phrase is “negative”. The analysis result is given to the phrase A105.

構文解析部5512は、形態素解析部5511によって解析された情報に基づき、文章を構成する文節の品詞や意味、属性情報、文章内での位置、並び等を評価し、文章における文節どうしの係りうけ関係を解析し、解析結果を類義語処理部5513に出力する。   Based on the information analyzed by the morphological analysis unit 5511, the syntax analysis unit 5512 evaluates the part of speech and meaning of the clauses constituting the sentence, attribute information, the position in the sentence, the arrangement, and the like. The relationship is analyzed, and the analysis result is output to the synonym processing unit 5513.

さらに、構文解析部5512は、検索対象情報を解析した際に、各文章を識別するための文章IDを付与し、この文章をマッチ辞書記憶部503に登録(記憶)する際に必要な登録情報を生成する。また、構文解析部5512は、単語情報や文節等の解析結果を利用して、文節同士の係りうけ関係に基づき、図8に示すような構造木を作成し、部分木ノード毎のルールを表す情報を生成して、類義語処理部5513に出力する。
なお、ルールとは、図8に示す構造木を構成する部分木ノード毎に対応付けられている情報であって、図6に示したように、語情報321、述語属性322、親ルールID323、重み値324、接続詞種別325、カテゴリ326、子ノード有フラグ327等を含む。
Further, the syntax analysis unit 5512 gives a sentence ID for identifying each sentence when the search target information is analyzed, and registration information necessary for registering (storing) the sentence in the match dictionary storage unit 503. Is generated. Further, the syntax analysis unit 5512 creates a structural tree as shown in FIG. 8 based on the relationship between clauses using the analysis results of word information and clauses, and represents the rules for each subtree node. Information is generated and output to the synonym processing unit 5513.
The rule is information associated with each sub-tree node constituting the structural tree shown in FIG. 8, and as shown in FIG. 6, word information 321, predicate attribute 322, parent rule ID 323, A weight value 324, a conjunction type 325, a category 326, a child node presence flag 327, and the like are included.

ここで、図8を用いて構文解析部5512によって作成される構造木について説明する。図8は、構文解析部5512によって作成される構造木の一例を示す概略図である。
図8に示す通り、部分木ノードに対応するルールは、形態素解析部5511によって区分された文節毎に作成されている。また、部分木ノードによって構成される構造木は、文章の前後関係に応じた係りうけ関係によって作成されている。
Here, a structural tree created by the syntax analysis unit 5512 will be described with reference to FIG. FIG. 8 is a schematic diagram illustrating an example of a structural tree created by the syntax analysis unit 5512.
As shown in FIG. 8, the rule corresponding to the subtree node is created for each phrase segmented by the morphological analysis unit 5511. In addition, the structure tree constituted by the subtree nodes is created by the relationship relationship according to the context of the sentence.

類義語処理部5513は、類義語辞書5503を参照して、分解された形態素や文節に対して、統一すべき類義語があるか否かを検索し、該当する類義語があれば、類義語辞書5503から検索によって得られた類義語への置換えを行う。   The synonym processing unit 5513 refers to the synonym dictionary 5503 and searches the decomposed morphemes and clauses for whether there is a synonym to be unified. If there is a corresponding synonym, the synonym processor 5513 performs a search from the synonym dictionary 5503. Replace with the obtained synonym.

ここで、辞書作成部504が、データベースファイルサーバ700から検索対象情報を読み出して、単文に区切られた検索対象情報を文書解析部505に出力した場合、文書解析部505は、上述のような文書解析を行い、解析結果を辞書作成部504に出力する。
辞書作成部504は、文書解析部505から解析結果を受け取り、単文を構成する文節のルールとしての情報、例えば、単語情報、シンボルID、各単語語情報の述語属性、ルール(部分木ノード)間のつながりを表す親ルールIDや子ノード有フラグ、重み値、接続詞種別、カテゴリ、等のマッチ辞書記憶部503の登録に必要な情報を得る。
Here, when the dictionary creation unit 504 reads the search target information from the database file server 700 and outputs the search target information divided into simple sentences to the document analysis unit 505, the document analysis unit 505 reads the document as described above. The analysis is performed, and the analysis result is output to the dictionary creation unit 504.
The dictionary creation unit 504 receives the analysis result from the document analysis unit 505, and information as a rule of a clause constituting a single sentence, for example, word information, symbol ID, predicate attribute of each word word information, between rules (subtree nodes) Information necessary for registration in the match dictionary storage unit 503 such as a parent rule ID, a child node presence flag, a weight value, a conjunction type, a category, and the like representing the connection of

また、辞書作成部504は、マッチ辞書記憶部503から読み出したシンボルマップMD1を確認して、マッチ辞書記憶部503内で統一的に利用されている単語情報を、シンボルIDに置き換える。さらに辞書作成部504は、文章IDや、文章テキスト、文章付加情報や用語マップ等を含む文章情報MD2と、単語ID31とルール32とを含む単語情報MD3とを作成し、マッチ辞書登録用のデータを作成する。また、辞書作成部504は、このマッチ辞書登録用のデータを、マッチ辞書記憶部503のマッチ辞書データに追加する。
なお、辞書作成部504は、文書解析部505から受け取った解析結果の中に、シンボルマップMD1に対応するシンボルIDがない単語情報が存在した場合、当該単語情報に対して、新たなシンボルIDを付与して、当該単語情報と新たなシンボルIDとの対応関係をシンボルマップMD1に追加する。
Further, the dictionary creation unit 504 confirms the symbol map MD1 read from the match dictionary storage unit 503, and replaces the word information used uniformly in the match dictionary storage unit 503 with the symbol ID. Further, the dictionary creation unit 504 creates sentence information MD2 including a sentence ID, sentence text, sentence additional information, a term map, and the like, and word information MD3 including a word ID 31 and a rule 32, and data for registering a match dictionary. Create Further, the dictionary creation unit 504 adds the match dictionary registration data to the match dictionary data in the match dictionary storage unit 503.
Note that the dictionary creation unit 504, when the word information having no symbol ID corresponding to the symbol map MD1 exists in the analysis result received from the document analysis unit 505, a new symbol ID is assigned to the word information. And the correspondence between the word information and the new symbol ID is added to the symbol map MD1.

次に、図9〜11を用いて、検索処理部501によって実行されるマッチモードについて詳細に説明する。図9は、単語要素マッチングについて説明するための概略図である。図10は、係りうけマッチングについて説明するための概略図である。図11は、属性マッチングについて説明するための概略図である。   Next, the match mode executed by the search processing unit 501 will be described in detail with reference to FIGS. FIG. 9 is a schematic diagram for explaining word element matching. FIG. 10 is a schematic diagram for explaining the pending matching. FIG. 11 is a schematic diagram for explaining attribute matching.

図9(a)〜(c)に示す通り、単語要素マッチングは、積集合タイプと、全集合タイプと、部分集合タイプの3タイプがある。単語要素マッチングでは、検索処理部501が、マッチ辞書記憶部503に記憶されているマッチ辞書データのルール32と、検索キー文においてルール32と対応する文字列(例えば、文節)との照合を行う。なお、検索処理部501は、単語要素マッチングがマッチプロファイルのマッチモード定義PA1において、積集合タイプと、全集合タイプと、部分集合タイプのうち、いずれか1つのタイプを実行する。   As shown in FIGS. 9A to 9C, there are three types of word element matching: product set type, full set type, and subset type. In word element matching, the search processing unit 501 compares the match dictionary data rule 32 stored in the match dictionary storage unit 503 with a character string (for example, a phrase) corresponding to the rule 32 in the search key sentence. . Note that the search processing unit 501 executes any one of a product set type, a full set type, and a subset type in the match mode definition PA1 in which the word element matching is a match profile.

ここで、積集合タイプとは、マッチ辞書記憶部503のマッチ辞書データのルールの文字列(部分木ノードに対応する文節)の少なくとも一部と、検索キー文に含まれる文字列(部分木ノードに対応する文節)の少なくとも一部とが一致する場合、この一致する文字列をマッチモードの条件を満たす単語として得るマッチモードである。なお、一部でも一致する単語がなかった場合、マッチモードの条件を満たす単文が得られなかったという結果となる。   Here, the product set type means at least a part of a rule character string (a clause corresponding to a subtree node) of the match dictionary data in the match dictionary storage unit 503 and a character string (subtree node) included in the search key sentence. When at least a part of the phrase corresponding to the phrase matches, the matching character string is obtained as a word that satisfies the condition of the match mode. If there is no matching word even in part, the result is that a single sentence that satisfies the match mode condition cannot be obtained.

例えば、図9(a)に示す通り、マッチ辞書記憶部503のマッチ辞書データのルールに対応する文節「サッカー 観戦」と、検索キー文に含まれる文節「サッカー 少年」、「観戦 ツアー」および「戦」とがそれぞれ照合された場合、検索キー文に含まれる文節「サッカー 少年」は、その一部である単語「サッカー」において、ルールに対応する文節「サッカー 観戦」の一部と一致している。この場合、ルールに対応する文節「サッカー 観戦」は、マッチモードの条件を満たす。
また、検索キー文に含まれる文節「観戦 ツアー」は、その一部である単語「観戦」が、ルールに対応する文節「サッカー 観戦」の一部と一致しており、マッチモードの条件を満たす。
このように、マッチモードの条件を満たす場合、マッチング処理の結果として、ルールに対応する文節「サッカー 観戦」が得られる。また、検索処理部501は、このマッチモードの条件を満たす単語をマッチした単語として検出する。
For example, as shown in FIG. 9A, the clause “watching soccer” corresponding to the rule of the match dictionary data in the match dictionary storage unit 503 and the clauses “soccer boy”, “watching tour” and “ When the word “Soccer” is matched, the phrase “Soccer Boy” included in the search key sentence matches the part of the phrase “Soccer Watch” corresponding to the rule in the word “Soccer”. Yes. In this case, the phrase “watching soccer” corresponding to the rule satisfies the condition of match mode.
In addition, the phrase “watching tour” included in the search key sentence has the same word “watching” as part of the phrase “watching soccer” corresponding to the rule, and satisfies the condition of match mode. .
As described above, when the condition of the match mode is satisfied, the phrase “watching soccer” corresponding to the rule is obtained as a result of the matching process. Further, the search processing unit 501 detects a word that satisfies the condition of the match mode as a matched word.

一方、検索キー文に含まれる文節「戦」は、ルールに対応する文節「サッカー 観戦」に含まれる単語の単位で、一致する部分がないため、マッチモードの条件を満たさない。このため、マッチング処理の結果としては、マッチモードの条件を満たす単文が得られなかったという結果となる。なお、単語「戦」は、文節「サッカー 観戦」の単語「観戦」の一部に含まれる文字であるが、単語単位で比較した場合、「戦」と「観戦」とは異なる文字列(単語)となるため、ここでは、一致しないと判断される。   On the other hand, the phrase “battle” included in the search key sentence is a unit of words included in the phrase “watching soccer game” corresponding to the rule and does not satisfy the match mode condition because there is no matching part. For this reason, as a result of the matching process, a simple sentence that satisfies the condition of the match mode cannot be obtained. Note that the word “war” is a character included in a part of the word “watching” in the phrase “watching soccer”, but when compared word by word, “war” and “watching” are different character strings (word Therefore, it is determined that they do not match.

次に、全集合タイプについて図9(b)を用いて説明する。
全集合タイプは、マッチ辞書記憶部503のマッチ辞書データのルールの文字列(部分木ノードに対応する文節)と、検索キー文に含まれる文字列(部分木ノードに対応する文節)の全てが一致する場合、一致した文字列がマッチモードの条件を満たす単語(マッチした単語)として得られるマッチモードである。この場合、上述の積集合と異なり、一部でも(単語1つでも)一致する文節があった場合であって、文節の全ての文字列が一致しなければ、マッチモードの条件を満たす単文が得られなかったという結果となる。
例えば、図9(b)に示す通り、マッチ辞書記憶部503のマッチ辞書データのルールに対応する文節「サッカー 観戦」と、検索キー文に含まれる文節「サッカー 観戦」「観戦」とが照合された場合、文節「サッカー 観戦」は、ルールに対応する文節と、検索キー文の両方ともが完全に一致しており、マッチモードの条件を満たすため、マッチング処理の結果として、文節「サッカー 観戦」(マッチした文節)が得られる。
一方、検索キー文の文節「観戦」は、ルールに対応する文節「サッカー 観戦」の一部とは一致するものの、全ての文字列が一致していなため、マッチモードの条件を満たさず、マッチング処理の結果としては、マッチモードの条件を満たす単文が得られなかったという結果となる。
Next, all set types will be described with reference to FIG.
The entire set type includes all of the character string (phrase corresponding to the subtree node) of the match dictionary data in the match dictionary storage unit 503 and the character string (phrase corresponding to the subtree node) included in the search key sentence. When they match, the matched character string is a match mode obtained as a word (matched word) that satisfies the match mode condition. In this case, unlike the product set described above, if there is a phrase that matches even at least (even one word), and if all the character strings in the phrase do not match, a simple sentence that satisfies the match mode condition is The result is that it was not obtained.
For example, as shown in FIG. 9B, the phrases “watching soccer” corresponding to the rule of the match dictionary data in the match dictionary storage unit 503 are compared with the phrases “watching soccer” and “watching” included in the search key sentence. In this case, the phrase “watching soccer” matches both the phrase corresponding to the rule and the search key sentence and satisfies the match mode condition. (Matched phrase) is obtained.
On the other hand, the phrase “watching” of the search key sentence matches the part of the phrase “watching soccer” corresponding to the rule, but all the character strings do not match. As a result of the processing, a simple sentence that satisfies the match mode condition cannot be obtained.

次に、部分集合タイプについて図9(c)を用いて説明する。
部分集合タイプは、マッチ辞書記憶部503のマッチ辞書データのルールの文字列(部分木ノードに対応する文節)が、検索キー文に含まれる文字列(部分木ノードに対応する文節)の一部と完全に一致する場合、一致している文字列をマッチモードの条件を満たす単語として得るマッチモードである。この場合、上述の積集合タイプと異なり、少なくともルールに対応する文節の全てを含んでいれば、マッチモードの条件を満たし、一致する単語や文節をマッチした単語あるいはマッチした文節して得る。一方、検索キー文に含まれる文節が、ルールに対応する文節の全てを含むものでなければ、マッチモードの条件を満たす語情報が得られなかったという結果となる。
Next, the subset type will be described with reference to FIG.
The subset type is a part of a character string (a clause corresponding to a subtree node) in which a character string (a clause corresponding to the subtree node) of the rule of the match dictionary data in the match dictionary storage unit 503 is included in the search key sentence. Is a match mode that obtains a matching character string as a word that satisfies the condition of the match mode. In this case, unlike the product set type described above, if at least all of the clauses corresponding to the rule are included, the match mode condition is satisfied, and a matching word or clause is obtained as a matched word or a matched clause. On the other hand, if the phrase included in the search key sentence does not include all of the phrases corresponding to the rule, the result is that word information satisfying the match mode condition cannot be obtained.

例えば、図9(c)に示す通り、マッチ辞書記憶部503のマッチ辞書データのルールに対応する文節「サッカー 観戦」と、検索キー文に含まれる文節「サッカー 観戦 ツアー」「観戦 ツアー」とが照合された場合、ルールに対応する文節「サッカー 観戦」は、検索キー文に含まれる文節「サッカー 観戦 ツアー」の一部であって、その文節を構成する全ての単語が、検索キー文に含まれる文節に含まれる単語として一致しているため、マッチモードの条件を満たす。このように、マッチモードの条件を満たす場合、マッチング処理の結果として、ルールに対応する文節「サッカー 観戦」(マッチした文節)が得られる。
一方、検索キー文の文節「観戦 ツアー」は、ルールに対応する文節「サッカー 観戦」の一部の単語「観戦」が一致するものの、ルールに対応する文節の全てが検索キー文の一部と一致していなため、マッチモードの条件を満たさず、マッチング処理の結果としては、マッチモードの条件を満たす単文が得られなかったという結果となる。
For example, as shown in FIG. 9C, the phrases “watching soccer” corresponding to the rule of the match dictionary data in the match dictionary storage unit 503 and the phrases “watching soccer watching tour” and “watching tour” included in the search key sentence are included. When matched, the phrase “watching soccer” corresponding to the rule is part of the phrase “watching soccer watching tour” included in the search key sentence, and all the words constituting the phrase are included in the search key sentence. Since it matches as a word included in the phrase, the condition of the match mode is satisfied. Thus, when the condition of the match mode is satisfied, the phrase “watching soccer” (matched phrase) corresponding to the rule is obtained as a result of the matching process.
On the other hand, the phrase “watching tour” in the search key sentence matches part of the word “watching” in the phrase “soccer watching” corresponding to the rule, but all the clauses corresponding to the rule are part of the search key sentence. Since they do not match, the match mode condition is not satisfied, and as a result of the matching process, a simple sentence that satisfies the match mode condition is not obtained.

次に、係りうけマッチングの例について図10(a)〜(b)を用いて説明する。
図10(a)〜(b)に示す通り、係りうけマッチングは、係りうけの関係のあるものを抽出するノード親子関係タイプと、係り受けの評価を行わないノード単独タイプの2タイプがある。係りうけマッチングでは、検索処理部501によって、マッチ辞書記憶部503に記憶されているマッチ辞書データのルール32の文字列(部分木ノードに対応する文節)の係りうけ関係と、検索キー文に含まれる文字列(部分木ノードに対応する文節)の係りうけ関係との照合が行われる。なお、検索処理部501は、係りうけマッチングがマッチプロファイルのマッチモード定義PA1おいて、ノード親子関係タイプと、ノード単独タイプのうち、いずれか1つのタイプを実行する。
Next, an example of pending matching will be described with reference to FIGS.
As shown in FIGS. 10A and 10B, there are two types of dependency matching: a node parent-child relationship type that extracts a relationship having a dependency relationship, and a node single type that does not perform dependency evaluation. In the dependency matching, the search processing unit 501 includes the dependency relationship of the character string (the clause corresponding to the subtree node) of the rule 32 of the match dictionary data stored in the match dictionary storage unit 503 and the search key sentence. The character string (the clause corresponding to the subtree node) is checked against the dependency relationship. Note that the search processing unit 501 executes any one of the node parent-child relationship type and the node single type in the match mode definition PA1 of the match profile for the match matching.

ここで、ノード親子関係タイプは、単語要素マッチングの集積合タイプによってマッチングした単語同士の係りうけ関係についての条件であって、マッチ辞書記憶部503のマッチ辞書データのルールの文字列(部分木ノードに対応する文節)の親子関係と、検索キー文に含まれる文字列のうち単語要素マッチングの集積合タイプによって得られたマッチした単語(部分木ノードに対応する文節)の親子関係が一致する場合、この一致する文字列をマッチモードの条件を満たす単語として得るマッチモードである。なお、親子関係が一致する文字列がなかった場合、マッチモードの条件を満たす単文が得られなかったという結果となる。   Here, the node parent-child relationship type is a condition for the relationship between words matched by the integrated type of word element matching, and is a character string (partial tree node) of the rule of match dictionary data in the match dictionary storage unit 503 And the parent-child relationship of the matched word (phrase corresponding to the subtree node) obtained by the word element matching integrated type in the character string included in the search key sentence matches In this match mode, the matching character string is obtained as a word that satisfies the match mode condition. If there is no character string having a matching parent-child relationship, a simple sentence that satisfies the match mode condition cannot be obtained.

例えば、図10(a)に示す通り、マッチ辞書記憶部503のマッチ辞書データの親子関係において、親ルールに対応する文節が「行く」、子ルールに対応する文節が「サッカー 観戦」である場合、この親子関係と一致するパターンは、以下の2つである。つまり、親ルールに対応する文節が「行く」であって、子ルールに対応する文節が「サッカー」であるパターンと、親ルールに対応する文節が「行く」であって、子ルールに対応する文節が「観戦」であるパターンである。
よって、検索キー文に含まれる文字列として、親ルールに対応する文節が「行く」、子ルールに対応する文節が「サッカー」であるもの親子関係「(サッカー)−(行く)」は、マッチモードの条件を満たす。このように、マッチモードの条件を満たす場合、マッチング処理の結果として、ルールに対応する文節「サッカー 観戦」―「行く」の親子関係が得られる。
一方、検索キー文に含まれる文字列として、子ルールに対応する文節が「サッカー 観戦」であって、親ルールに対応する文節がないものや、子ルールに対応する文節が「行く」であって、親ルールに対応する文節がないものは、マッチモードの条件を満たさない。
For example, as shown in FIG. 10A, in the parent-child relationship of the match dictionary data in the match dictionary storage unit 503, the phrase corresponding to the parent rule is “go” and the phrase corresponding to the child rule is “watching soccer”. The following two patterns coincide with this parent-child relationship. In other words, the phrase corresponding to the parent rule is “go” and the phrase corresponding to the child rule is “soccer”, and the phrase corresponding to the parent rule is “go” and corresponds to the child rule. It is a pattern in which the phrase is “watching”.
Therefore, as a character string included in the search key sentence, a phrase corresponding to the parent rule is “go” and a phrase corresponding to the child rule is “soccer”. Meet the mode conditions. As described above, when the condition of the match mode is satisfied, the parent-child relationship of the phrase “watching soccer”-“go” corresponding to the rule is obtained as a result of the matching process.
On the other hand, as a character string included in the search key sentence, the phrase corresponding to the child rule is “watching soccer” and there is no phrase corresponding to the parent rule, or the phrase corresponding to the child rule is “go”. If there is no clause corresponding to the parent rule, the match mode condition is not satisfied.

次に、図10(b)を用いて、ノード単独タイプについて説明する。
ノード単独タイプは、マッチ辞書記憶部503のマッチ辞書データのルールの文字列(部分木ノードに対応する文節)の親子関係と、検索キー文に含まれる文字列(部分木ノードに対応する文節)の親子関係において、親ノードあるいは子ノードの少なくともいずれか一方が一致する場合、この一致する文字列をマッチモードの条件を満たす単語として得るマッチモードである。すなわち、実際には係り受けの評価は行われないことになる。なお、ノード内の文字列の比較は、単語要素マッチングに応じたタイプで行われるが、親ノードあるいは子ノードのいずれか一方でも一致する文字列がなかった場合、マッチモードの条件を満たす単文が得られなかったという結果となる。
Next, the node single type will be described with reference to FIG.
The node single type includes a parent-child relationship of a character string (a clause corresponding to a subtree node) of a rule of match dictionary data in the match dictionary storage unit 503, and a character string (a clause corresponding to a subtree node) included in a search key sentence. In the parent-child relationship, when at least one of the parent node and the child node matches, this matching mode obtains the matching character string as a word that satisfies the condition of the match mode. In other words, the dependency is not actually evaluated. Note that the comparison of character strings in a node is performed with a type corresponding to word element matching. However, if there is no matching character string in either the parent node or the child node, a simple sentence that satisfies the match mode condition is The result is that it was not obtained.

例えば、図10(b)に示す通り、マッチ辞書記憶部503のマッチ辞書データの親子関係が、親ノードに対応する文節「サッカー 観戦」、子ノードに対応する文節が「行く」である場合、親ノードに対応する文節として「サッカー」を含む検索キー文は、マッチモードの条件を満たし、マッチング処理の結果として、ルールに対応する文節「サッカー 観戦」―「行く」の親子関係が得られる。
また、子ノードに対応する文節として「行く」を含む検索キー文は、マッチング条件を満たす。一方、子ノードに対応する文節として「する」を含む検索キー文は、親ノードあるいは子ノードのいずれか一方でも一致する文字列がないため、マッチモードの条件を満たさない。
例えば、マッチプロファイルのマッチモード定義PA1においては、係りうけマッチングを行うか否かが予め決められており、上述した複数のタイプのうち、いずれか一方が予め決められている。
For example, as shown in FIG. 10B, when the parent-child relationship of the match dictionary data in the match dictionary storage unit 503 is a phrase “watching soccer” corresponding to the parent node, and a phrase corresponding to the child node “going”, The search key sentence including “soccer” as the clause corresponding to the parent node satisfies the condition of the match mode, and the parent-child relationship of the clause “soccer watching”-“go” corresponding to the rule is obtained as a result of the matching process.
A search key sentence including “go” as a clause corresponding to the child node satisfies the matching condition. On the other hand, the search key sentence including “Yes” as the clause corresponding to the child node does not satisfy the match mode condition because there is no matching character string in either the parent node or the child node.
For example, in the match mode definition PA1 of the match profile, it is determined in advance whether or not the pending matching is performed, and any one of the above-described types is determined in advance.

次に、属性マッチングについて説明する。属性マッチングは、文属性一致タイプと、係り受けマッチングと同様に、実質的には属性のマッチを評価しない単語一致タイプがある。
ここでは、文属性一致タイプを図11に示す。
属性マッチングでは、検索処理部501によって、マッチ辞書記憶部503に記憶されているマッチ辞書データのルールの文字列(部分木ノードに対応する文節)の属性と、検索キー文における対応する文字列(部分木ノードに対応する文節)の属性との照合が行われる。
ここで、文属性の一致のタイプは、マッチ辞書記憶部503のマッチ辞書データのルールの文節の少なくとも一部と、検索キー文に含まれる文節のうち少なくとも一部(単語)が一致しており、この一致している部分の属性もそれぞれ一致する場合、この一致する文字列をマッチモードの条件を満たす単語として得られるマッチモードである。なお、文字列が一致していても、属性が異なる場合は、マッチモードの条件を満たす単文が得られなかったという結果となる。
Next, attribute matching will be described. As attribute matching, there are a sentence attribute matching type and a word matching type that does not substantially evaluate attribute matching, similar to dependency matching.
Here, the sentence attribute match type is shown in FIG.
In attribute matching, the search processing unit 501 uses the attribute of the rule string of the match dictionary data stored in the match dictionary storage unit 503 (the clause corresponding to the subtree node) and the corresponding character string in the search key sentence ( The attribute of the clause corresponding to the subtree node is checked.
Here, the sentence attribute match type is that at least a part of the rule clause of the match dictionary data in the match dictionary storage unit 503 matches at least a part (word) of the clauses included in the search key sentence. When the attributes of the matching parts are also matched, the matching character string is a match mode obtained as a word that satisfies the match mode conditions. Even if the character strings match, if the attributes are different, a simple sentence that satisfies the match mode condition cannot be obtained.

例えば、マッチ辞書記憶部503のマッチ辞書データのルール32において、ルールと対応する文節「サッカー 観戦」の述語属性が「否定」であって、検索キー文に含まれる文節「観戦」の述語属性が「否定」である場合、マッチモードの条件を満たす。つまり、「サッカー 観戦しない」の場合、「サッカー(名詞)」+「観戦(名詞)」+「しない(助動詞)」に分解されるが、「しない(助動詞)」の属性が「否定」である。このため、「サッカー 観戦」の述語属性が「否定」となり、マッチモードの条件を満たす。
一方、検索キー文に含まれる文節「サッカー 観戦」の述語属性が「可能」である場合、文節「サッカー 観戦」の文字列は一致しているものの、属性が異なるため、マッチモードの条件を満たさない。つまり、「サッカー観戦できる」の場合、「サッカー(名詞)」+「観戦(名詞)」+「できる(助動詞)」に分解されるが、「できる(助動詞)」の属性が「可能」である。このため、「サッカー 観戦」の述語属性は「可能」となり、マッチモードの条件を満たさない。
ここでいう「属性」とは、助動詞の意味情報のことで、否定、疑問、可能などがある。例えば、「使えない」という語に対しては、「使う(動詞)」+「ない(助動詞)」に分解されるが、「ない(助動詞)」の属性は「否定」である。
なお、属性マッチングにおいては、名詞など「属性なし」同士でマッチしてもマッチモードの条件を満たすと判定する。
For example, in the rule 32 of the match dictionary data in the match dictionary storage unit 503, the predicate attribute of the clause “watching soccer” corresponding to the rule is “denial”, and the predicate attribute of the clause “watching” included in the search key sentence is If “No”, the condition of the match mode is satisfied. That is, in the case of “do not watch soccer”, it is decomposed into “soccer (noun)” + “watching (noun)” + “do not (auxiliary verb)”, but the attribute of “do not (auxiliary verb)” is “denial” . For this reason, the predicate attribute of “watching soccer” is “negative”, which satisfies the condition of the match mode.
On the other hand, if the predicate attribute of the phrase “Soccer watching” included in the search key sentence is “possible”, the character string of the clause “Soccer watching” matches, but the attributes are different, so the match mode condition is met. Absent. In other words, in the case of “can watch soccer”, it is decomposed into “soccer (noun)” + “watching (noun)” + “can (auxiliary verb)”, but the attribute of “can (auxiliary verb)” is “possible” . For this reason, the predicate attribute of “watching soccer” is “possible” and does not satisfy the match mode condition.
The “attribute” here means semantic information of an auxiliary verb, and there are denial, doubt, possibility, and the like. For example, the word “cannot be used” is decomposed into “use (verb)” + “not (auxiliary verb)”, but the attribute of “not (auxiliary verb)” is “denial”.
In the attribute matching, it is determined that the match mode condition is satisfied even if “no attributes” such as nouns are matched.

次に、図12を用いて、本実施の形態に係る情報検索システム1におけるマッチ辞書データの作成方法の一例について説明する。図12は、本実施の形態に係る情報検索システム1におけるマッチ辞書データの作成方法の一例を示すフローチャートである。
図12に示す通り、マッチ辞書データの作成が、例えば日本語解析サーバ500の操作部(図示せず)から指示された場合、辞書作成部504は、データベースファイルサーバ700のデータソース701から検索対象となる文章を読み出し、文章を句点等ごとに区切って単文の単位として、文書解析部505に出力する。例えば、検索対象となる文章Aのテキストデータが「PC内にある画像を送信したところ受信できませんでした。また、携帯内にある画像を送信したところ受信できました。」である場合、句点「。」で区切られている2つの単文に区切って、単文A1「PC内にある画像を送信したところ受信できませんでした。」と、単文A2「また、携帯内にある画像を送信したところ受信できました。」を文書解析部505に出力する(ステップST1)。
Next, an example of a method for creating match dictionary data in the information search system 1 according to the present embodiment will be described with reference to FIG. FIG. 12 is a flowchart illustrating an example of a method for creating match dictionary data in the information search system 1 according to the present embodiment.
As shown in FIG. 12, when the creation of match dictionary data is instructed from, for example, an operation unit (not shown) of the Japanese language analysis server 500, the dictionary creation unit 504 searches the data source 701 of the database file server 700 for a search target. The sentence is read out, and the sentence is divided into phrases and output to the document analysis unit 505 as a single sentence unit. For example, if the text data of sentence A to be searched is "I couldn't receive it when I sent an image in my PC. And I couldn't receive it when I sent an image in my phone." . ”Is divided into two simple sentences separated by“. ”, And the simple sentence A1“ I couldn't receive it when I sent the image in the PC. ” Is output to the document analysis unit 505 (step ST1).

単文A1を受け取った文書解析部505の形態素解析部5511は、単文Aを形態素(例えば単語単位)に分離して、検索対象となる文章を複数の形態素に分解する。例えば、形態素解析部5511は、文章Aが入力されると、文章Aに含まれる単文A1を複数の単語「PC」「内」「に」「ある」「画像」「を」「送信」「した」「ところ」「受信」「できませんでした」に分解する。
そして、形態素解析部5511は、システム辞書5501やユーザ辞書5502を参照して、分解した形態素の品詞や属性、意味等を解析し、解析結果として得る(ステップST2)。
The morpheme analysis unit 5511 of the document analysis unit 505 that has received the single sentence A1 separates the single sentence A into morphemes (for example, in units of words), and decomposes the sentence to be searched into a plurality of morphemes. For example, when the sentence A is input, the morpheme analysis unit 5511 performs a single sentence A1 included in the sentence A by a plurality of words “PC”, “inside”, “in”, “present”, “image”, “send”, “send”, and “send”. ”“ Place ”“ Receive ”“ Disabled ”.
Then, the morpheme analysis unit 5511 analyzes the part of speech, attributes, meaning, and the like of the decomposed morpheme with reference to the system dictionary 5501 and the user dictionary 5502 to obtain an analysis result (step ST2).

次いで、構文解析部5512は、少なくとも1つ以上の形態素を組み合わせて、構造木の部分木ノードに対応する文節を作成する。なお、ここでは、部分木ノードに対応する文字列として、文章を構成する構成要素の1つであって、文章を実際の言葉として不自然にならない程度に区切ったときに得られる最小のひとまとまりである文節を1つの単位とした例について説明する。しかし、本発明はこれに限られない。   Next, the syntax analysis unit 5512 creates a clause corresponding to the subtree node of the structural tree by combining at least one morpheme. Note that here, the character string corresponding to the subtree node is one of the constituent elements of the sentence, and is the smallest set obtained when the sentence is divided as an actual word so as not to be unnatural. An example in which a phrase is a unit will be described. However, the present invention is not limited to this.

そして、構文解析部5512は、形態素解析部5511によって解析された解析結果に基づき、文章を構成する単語の品詞や意味、属性情報、文章内での位置、並び等を評価し、文章における文節同士の係りうけ関係を解析し、文節どうしの係りうけ関係や、単語の出現位置、文章中での文の成分(主語や述語等)等を解析結果として得る。また、構文解析部5512は、各単文を識別するための単文IDを単文毎に付与する。
次いで、構文解析部5512は、解析結果に基づき、文節を部分木ノードとする構造木を作成し、解析結果を類義語処理部5513に出力する(ステップST3)。
Based on the analysis result analyzed by the morphological analysis unit 5511, the syntax analysis unit 5512 evaluates the part of speech and meaning of words constituting the sentence, the attribute information, the position in the sentence, the arrangement, and the like. The relationship between clauses is analyzed, and the relationship between clauses, the appearance position of words, sentence components (sentences, predicates, etc.) in sentences are obtained as analysis results. Further, the syntax analysis unit 5512 assigns a single sentence ID for identifying each single sentence for each single sentence.
Next, the syntax analysis unit 5512 creates a structure tree with the clause as a subtree node based on the analysis result, and outputs the analysis result to the synonym processing unit 5513 (step ST3).

類義語処理部5513は、類義語辞書5503を参照して、分解された単語に対して、統一すべき類義語や同意語があるか否かを検索し、該当する類義語等があれば、該当する単語を、類義語辞書5503から検索によって得られた類義語等に置換える(ステップST4)。そして、類義語処理部5513は、解析部551による解析結果を辞書作成部504に出力する。   The synonym processing unit 5513 refers to the synonym dictionary 5503 and searches the decomposed words for synonyms and synonyms to be unified. If there are corresponding synonyms, the synonym processing unit 5513 selects the corresponding words. The synonym dictionary 5503 is replaced with a synonym obtained by searching (step ST4). Then, the synonym processing unit 5513 outputs the analysis result by the analysis unit 551 to the dictionary creation unit 504.

解析結果を受け取った辞書作成部504は、この解析結果から、文節毎のルールとして、例えば、語情報テキストデータ、各語情報の述語属性、ルール(部分木ノード)間のつながりを表す親ルールIDや子ノード有フラグ、重み値、接続詞種別、カテゴリ、等のマッチ辞書記憶部503の登録に必要な情報を得る。そして、辞書作成部504は、これら文節によって構成される単文毎に、各文節のルールと単文IDとをまとめて、マッチ辞書データの単文情報MD3として登録可能な登録用データを作成する。   The dictionary creation unit 504 that has received the analysis result, based on the analysis result, as a rule for each clause, for example, word information text data, a predicate attribute of each word information, a parent rule ID representing a connection between rules (subtree nodes) Information necessary for registration in the match dictionary storage unit 503, such as a child node presence flag, a weight value, a conjunction type, and a category, is obtained. Then, the dictionary creation unit 504 creates the registration data that can be registered as the single sentence information MD3 of the match dictionary data by putting together the rules and the single sentence IDs of each phrase for each single sentence constituted by these phrases.

また、辞書作成部504は、マッチ辞書記憶部503からシンボルマップMD1を読み出して、検索対象である文章に、マッチ辞書記憶部503内で統一的に利用されている語情報があるか否かを確認し、単語情報と同一の単語があった場合は、この単語を、シンボルIDに置き換える。なお、シンボルマップMD1内に置き換えるべき同一の単語情報がない場合、辞書作成部504は、新たなシンボルIDを当該単語情報に与える。
そして、辞書作成部504は、文章IDや、文章テキスト、文章付加情報や用語マップ等を含む文章情報(文章の登録のために必要な情報)、および単文情報に基づくマッチ辞書の登録用データを作成する(ステップST5)。
Further, the dictionary creation unit 504 reads the symbol map MD1 from the match dictionary storage unit 503, and determines whether there is word information used in the match dictionary storage unit 503 in the sentence to be searched. If there is a word identical to the word information, this word is replaced with the symbol ID. When there is no identical word information to be replaced in the symbol map MD1, the dictionary creation unit 504 gives a new symbol ID to the word information.
Then, the dictionary creation unit 504 stores sentence ID, sentence text, sentence information including sentence additional information, a term map, and the like (information necessary for registering sentences) and match dictionary registration data based on simple sentence information. Create (step ST5).

次いで、辞書作成部504は、作成したマッチ辞書の登録用データをマッチ辞書記憶部503に書込み、解析結果をマッチ辞書データとして登録する(ステップST6)。   Next, the dictionary creation unit 504 writes the created match dictionary registration data in the match dictionary storage unit 503, and registers the analysis result as match dictionary data (step ST6).

次に、図13を用いて、本実施の形態に係る情報検索システム1におけるマッチ辞書データの基づく検索方法の一例について説明する。図13は、本実施の形態に係る情報検索システム1における検索方法の一例を示すフローチャートである。
図13に示す通り、例えば、ユーザによってクライアント端末装置100の入力部103から検索サービスαが指定された場合、クライアント端末装置100は、指定された検索サービスαによる検索を実行するためのリクエスト制御信号を、WEBサーバ300を介して日本語解析サーバ500に送信する。
Next, an example of a search method based on match dictionary data in the information search system 1 according to the present embodiment will be described with reference to FIG. FIG. 13 is a flowchart showing an example of a search method in the information search system 1 according to the present embodiment.
As illustrated in FIG. 13, for example, when the search service α is designated by the user from the input unit 103 of the client terminal device 100, the client terminal device 100 performs a request control signal for executing a search using the designated search service α. Is transmitted to the Japanese language analysis server 500 via the WEB server 300.

日本語解析サーバ500は、この検索リクエスト制御信号を受信すると、検索処理部501が検索サービスαのプログラムを起動させ、検索サービスαと関連付けられているマッチプロファイルをマッチプロファイル記憶部502から読み出す。ここでは、マッチプロファイルAのマッチモード定義において、予め検索サービスαとマッチプロファイルAとが関連づけられているため、検索プログラムαが起動されることにより、検索処理部501がマッチプロファイルAを読み出す。また、検索処理部501は、マッチ辞書記憶部503に記憶されているマッチ辞書データを読み出す(ステップST10)。   When the Japanese analysis server 500 receives this search request control signal, the search processing unit 501 activates the search service α program and reads the match profile associated with the search service α from the match profile storage unit 502. Here, since the search service α and the match profile A are associated in advance in the match mode definition of the match profile A, the search processing unit 501 reads the match profile A when the search program α is started. Further, the search processing unit 501 reads the match dictionary data stored in the match dictionary storage unit 503 (step ST10).

そして、検索処理部501は、例えば、読み出したマッチプロファイルAおよびマッチ辞書データとを、メモリ領域506に展開して辞書オブジェクトを作成する(ステップST11)。なお、検索処理部501は、マッチプロファイルAから、各文章に付与された用語マップ24を読み出し、単語情報の出現頻度情報を計算し、メモリ領域506に一時的に記憶させておいてもよい。このように、辞書オブジェクトを作成するメモリ展開時に、予め各単語情報の出現頻度情報を得て置くことにより、マッチング処理の際に、単語情報の出現頻度情報を計算する処理負荷が軽減される。   Then, for example, the search processing unit 501 expands the read match profile A and match dictionary data in the memory area 506 to create a dictionary object (step ST11). Note that the search processing unit 501 may read the term map 24 attached to each sentence from the match profile A, calculate the appearance frequency information of the word information, and temporarily store it in the memory area 506. As described above, by obtaining the appearance frequency information of each word information in advance when expanding the memory for creating the dictionary object, the processing load for calculating the appearance frequency information of the word information is reduced during the matching process.

ここで、クライアント端末装置100の入力部103から、ユーザによって検索キー文が入力されると、クライアント端末装置100は、検索キー文を、WEBサーバ300を介して日本語解析サーバ500に送信する(ステップST12)。
そして、日本語解析サーバ500は、この検索キー文を受信すると(ステップST13)、以下に示す通り、この検索キー文に基づく検索を行う。
Here, when a search key sentence is input by the user from the input unit 103 of the client terminal apparatus 100, the client terminal apparatus 100 transmits the search key sentence to the Japanese analysis server 500 via the WEB server 300 ( Step ST12).
When receiving the search key sentence (step ST13), the Japanese analysis server 500 performs a search based on the search key sentence as shown below.

まず、検索処理部501は、検索サービスαに対する検索結果をクライアント端末装置100に返信するため、メモリ領域506に、空のオブジェクトである検索結果オブジェクトを生成し、結果記録用の記憶領域を確保する(ステップST14)。
そして、検索処理部501は、検索サービスαのプログラムに従って、検索キー文の解析を行う。すなわち、形態素解析部5511は、検索処理部501によって分割された単文の形態素解析を行い形態素に分割し、システム辞書5501およびユーザ辞書5502を参照して、品詞や属性等を検索する。そして、形態素解析部5511は、得られた品詞や属性等を表す情報に基づき、文章中の係りうけ関係や形態素の意味に応じた文節を作成する。
First, the search processing unit 501 generates a search result object, which is an empty object, in the memory area 506 in order to return a search result for the search service α to the client terminal device 100, and secures a storage area for recording the result. (Step ST14).
Then, the search processing unit 501 analyzes the search key sentence according to the program of the search service α. That is, the morpheme analysis unit 5511 analyzes the morpheme of the single sentence divided by the search processing unit 501, divides it into morphemes, and searches the system dictionary 5501 and the user dictionary 5502 to search for parts of speech, attributes, and the like. Then, the morpheme analysis unit 5511 creates a phrase according to the relationship between the sentence and the meaning of the morpheme based on the obtained information indicating the part of speech or the attribute.

次いで、構文解析部5512は、形態素解析部5511による解析結果に基づき、文章を構成する文節の品詞や意味、属性情報、文章内での位置、並び等を評価し、文章における文節同士の係りうけ関係を解析し、解析結果を類義語処理部5513に出力する。
類義語処理部5513は、類義語辞書5503を参照して、分解された単語や文節に対して、統一すべき類義語や同義語があるか否かを検索し、該当する類義語等があれば、該当する単語や文節を、類義語辞書5503から検索によって得られた類義語等に置換える。そして、類義語処理部5513は、解析部551による解析結果を検索処理部501に出力する(ステップST15)。
Next, the syntax analysis unit 5512 evaluates the part of speech and meaning of the clauses constituting the sentence, the attribute information, the position in the sentence, the arrangement, and the like based on the analysis result by the morpheme analysis unit 5511, and determines the relationship between the phrases in the sentence. The relationship is analyzed, and the analysis result is output to the synonym processing unit 5513.
The synonym processing unit 5513 refers to the synonym dictionary 5503 and searches the decomposed word or phrase for whether there is a synonym or synonym that should be unified. The word or phrase is replaced with a synonym or the like obtained by searching from the synonym dictionary 5503. Then, the synonym processing unit 5513 outputs the analysis result by the analysis unit 551 to the search processing unit 501 (step ST15).

そして、検索処理部501は、マッチプロファイルAにおいて予め決められているマッチモードに従って、解析された検索キー文と、メモリ領域506の辞書オプジェクトに展開されているマッチ辞書データとのマッチングを行い、各マッチングのどのタイプに属するかを判定し、マッチモード定義の条件を満たす文章等の検索(マッチング処理)を行う(ステップST16)。なお、詳細については、後述する。
さらに、検索処理部501は、ステップST16において、マッチプロファイルAにおいて予め決められているスコアモードに従って、マッチングによって得られた文章等における、検索キー文とのマッチングの程度を評価するスコアを算出する(スコアリング処理)。
The search processing unit 501 performs matching between the analyzed search key sentence and the match dictionary data expanded in the dictionary object in the memory area 506 according to a match mode predetermined in the match profile A, and The type of matching is determined, and a sentence or the like that satisfies the condition of the match mode definition is searched (matching process) (step ST16). Details will be described later.
Further, in step ST16, the search processing unit 501 calculates a score that evaluates the degree of matching with the search key sentence in a sentence obtained by matching according to a score mode predetermined in the match profile A ( Scoring process).

そして、検索処理部501は、マッチング処理における検索によって得られたマッチモードの条件を満たす文章と、スコアリング処理によって得られたスコアとを、メモリ領域506の検索結果オブジェクトに書き込む(ステップST17)。
そして、検索処理部501は、WEBサーバ300を介してクライアント端末装置100に、検索結果オブジェクトの内容を送信する(ステップST18)。
Then, the search processing unit 501 writes the sentence satisfying the match mode obtained by the search in the matching process and the score obtained by the scoring process in the search result object in the memory area 506 (step ST17).
Then, the search processing unit 501 transmits the contents of the search result object to the client terminal device 100 via the WEB server 300 (step ST18).

次に、図14を用いて、本実施の形態に係る情報検索システム1におけるマッチング処理とスコアリング処理の一例について詳細に説明する。図14は、本実施の形態に係る情報検索システム1におけるマッチング処理とスコアリング処理の一例について詳細に説明するフローチャートである。なお、図14に示す処理は、図13のステップST16に対応する処理を詳細に記載したものである。
図14に示す通り、検索処理部501は、マッチ辞書データのシンボルマップMD1を参照して、図13のステップST15において文書解析部505によって解析された検索キー文の単語情報をシンボルIDに置き換える(ステップST20)。
そして、検索処理部501は、マッチプロファイルAにおいて予め決められているマッチモードに従ってマッチング処理を行う。本実施の形態において、検索処理部501は、
単語要素マッチング、係りうけマッチング、属性マッチングについて、それぞれどのタイプに合致するかを判定し、マッチモード定義PA1によって定義された条件に合致する単文を抽出する(ステップST21)。これにより、検索処理部501は、マッチング処理によって検索キー文とマッチした文章を、マッチ辞書データから検索によって得ることができる。
Next, an example of matching processing and scoring processing in the information search system 1 according to the present embodiment will be described in detail with reference to FIG. FIG. 14 is a flowchart illustrating in detail an example of matching processing and scoring processing in the information search system 1 according to the present embodiment. The process shown in FIG. 14 is a detailed description of the process corresponding to step ST16 in FIG.
As shown in FIG. 14, the search processing unit 501 refers to the symbol map MD1 of the match dictionary data and replaces the word information of the search key sentence analyzed by the document analysis unit 505 in step ST15 of FIG. Step ST20).
Then, the search processing unit 501 performs a matching process according to a match mode determined in advance in the match profile A. In the present embodiment, the search processing unit 501
For word element matching, dependency matching, and attribute matching, which type is matched is determined, and a single sentence that matches the condition defined by the match mode definition PA1 is extracted (step ST21). Thereby, the search processing unit 501 can obtain a sentence that matches the search key sentence by the matching process from the match dictionary data.

検索処理部501はマッチング処理によって得られた結果に対し、各マッチングモードで判定されたマッチタイプの情報と、マッチプロファイルAによって定義されているスコアモードを利用してスコアを算出し、これらの和をメモリ領域506に一時的に記憶させる(ステップST22)。ここで、スコアの算出にあたっては、、実際に結果の抽出に用いられたマッチモード定義とは関連なく行われる。これは、マッチモード定義を条件としたマッチングは、検索結果そのものの抽出である一方、スコア算出の処理は、抽出された結果の中で、より検索の意図に適した結果を得やすくするための評価を行う処理であり、抽出した結果に対して、マッチモード定義の条件にかかわらず再度、単語要素、係りうけ、属性の観点で結果を評価することが有用だからである。   The search processing unit 501 calculates the score using the match type information determined in each matching mode and the score mode defined by the match profile A for the result obtained by the matching process, and sums these values. Is temporarily stored in the memory area 506 (step ST22). Here, the score is calculated irrespective of the match mode definition actually used for extracting the result. This is because matching based on the match mode definition is extraction of the search result itself, while the score calculation process is intended to make it easier to obtain a result more suitable for the purpose of the search among the extracted results. This is an evaluation process, and it is useful to evaluate the extracted result again in terms of word elements, involvement, and attributes regardless of the match mode definition conditions.

例えば、係りうけマッチングにおいて、図10(b)のように、ノード単独タイプが行われていた場合、ルールに対応する文節が「(サッカー 観戦)−(行く)」であり、検索キー文に含まれる文節が「(サッカー)−(行く)」、「(サッカー)−(する)」であった場合、いずれもマッチング結果としては、一致すると判断されるが、マッチプロファイルにおける係りうけマッチ係数PA7は、検索キー文の係りうけとして一致する「(サッカー)−(行く)」に対して、係数を適用してスコアが算出される。
つまり、検索処理部501は、このような係りうけマッチングの条件を満たす文章や単文が得られた場合、このマッチした文章や単文と、検索キー文とを比較して、スコアモード情報が示すような関係であった場合、係数を適用してスコアを算出することができる。
For example, in the case of multi-person matching, when the node single type is performed as shown in FIG. 10B, the clause corresponding to the rule is “(Watch soccer game) − (go)” and is included in the search key sentence. When the phrases to be played are “(soccer) − (go)” and “(soccer) − (s)”, it is determined that the matching results are the same, but the match coefficient PA7 in the match profile is Then, a score is calculated by applying a coefficient to “(soccer)-(go)” that matches the search key sentence.
That is, when a sentence or a single sentence satisfying such dependency matching conditions is obtained, the search processing unit 501 compares the matched sentence or single sentence with the search key sentence, and the score mode information indicates If the relationship is negative, the score can be calculated by applying a coefficient.

そして、検索処理部501は、マッチした文章と、この文章のスコアに基づき、マッチした文章のマッチ情報(例えば、マッチング処理において利用したマッチモードの種類、マッチした単語やマッチした文節の文章内における出現位置(以下、マッチ位置情報という)、スコア)を生成する(ステップST23)。
次いで、検索処理部501は、例えば、ステップST22によって算出されたスコアの点数が高い順にマッチした文章を並び替える(ステップST24)。そして、検索処理部501は、検索キー文、マッチした文章、マッチした単文およびマッチ情報を関連付けて、メモリ領域506の検索結果オブジェクトに書き込む(ステップST25)。
Then, the search processing unit 501 based on the matched sentence and the score of this sentence, the matching information of the matched sentence (for example, the type of match mode used in the matching process, the word in the matched word or the sentence of the matched phrase) An appearance position (hereinafter referred to as match position information) and score) is generated (step ST23).
Next, for example, the search processing unit 501 rearranges the matched sentences in descending order of score score calculated in step ST22 (step ST24). Then, the search processing unit 501 associates the search key sentence, the matched sentence, the matched single sentence, and the match information, and writes them in the search result object in the memory area 506 (step ST25).

そして、検索処理部501は、WEBサーバ300に検索結果オブジェクトの内容を送信する(ステップST26)。WEBサーバ300は、受信した検索結果オブジェクトを記憶部304に一時的に記憶させ、クライアント端末装置100の表示部102によって表示可能な検索結果の表示データ(ウェブページ)を作成しクライアント端末装置100に送信する。クライアント端末装置100は、この表示データに基づき、検索結果の表示データを表示部102に表示する。
なお、マッチ位置情報とは、マッチング条件を満たす単語(マッチした単語)が、このマッチした単語を含むマッチした単文や文章の文中に出現する文字位置を表す情報である。
Then, the search processing unit 501 transmits the contents of the search result object to the WEB server 300 (step ST26). The WEB server 300 temporarily stores the received search result object in the storage unit 304, creates search result display data (web page) that can be displayed by the display unit 102 of the client terminal device 100, and stores the search result object in the client terminal device 100. Send. The client terminal device 100 displays the search result display data on the display unit 102 based on the display data.
Note that the match position information is information indicating a character position at which a word satisfying the matching condition (matched word) appears in a matched single sentence or sentence including the matched word.

ここで、図15を用いて、検索結果オブジェクトの内容である検索結果データの一例について説明する。図15は、検索結果データの一例について説明する概略図である。
図15に示す通り、検索結果データは、クライアント端末装置100においてユーザによって入力された“検索キー文”と、日本語解析サーバ500によるマッチング処理によって得られた検索キー文とマッチした“マッチした文章”と、検索キー文とマッチした単文であって、マッチした文章に含まれる単文であることを表す“マッチした単文”と、このマッチした単文に含まれる文節毎に生成される“マッチ情報”とが、それぞれ関連付けられている。
Here, an example of the search result data, which is the content of the search result object, will be described with reference to FIG. FIG. 15 is a schematic diagram illustrating an example of search result data.
As shown in FIG. 15, the search result data includes a “matched sentence” that matches the “search key sentence” input by the user in the client terminal device 100 and the search key sentence obtained by the matching process by the Japanese analysis server 500. ", A single sentence that matches the search key sentence and is a single sentence included in the matched sentence, and a" match information "generated for each clause included in this matched single sentence Are associated with each other.

次に、図16を用いて、検索結果オブジェクトの内容として、クライアント端末装置100に送信される検索結果データの一例について、より詳細に説明する。
図16(a)に示す通り、検索キー文が「インターネットがつながらない」であって、日本語解析サーバ500によって、例えば、検索結果1として、単文ID「001−1」、テキスト「インターネットがつながらない場合でも操作は可能ですか?」と、検索結果2として、単文ID「002−3」、テキスト「突然、インターネットができなくなりました」が得られた場合について以下説明する。
Next, an example of search result data transmitted to the client terminal device 100 as the content of the search result object will be described in more detail with reference to FIG.
As shown in FIG. 16A, when the search key sentence is “Internet is not connected” and the Japanese analysis server 500, for example, as the search result 1, the single sentence ID “001-1” and the text “Internet is not connected” However, the case where the simple sentence ID “002-3” and the text “Suddenly the Internet could not be made” is obtained as the search result 2 will be described below.

図16(b)は、検索キー文や検索結果で得られた文章のマッチ位置情報を表す文字位置について説明する図である。図16(b)に示す通り、例えば、検索キー文は、文章の先頭から順番に、一文字ずつ「1,2,3,・・・,12」という文字位置を表す番号が付与されている。この文字位置を表す番号によって、マッチした単文や文章の文中に出現するマッチした単語の文字位置を表すことができる。   FIG. 16B is a diagram for explaining a character position representing match position information of a sentence obtained from a search key sentence or a search result. As shown in FIG. 16B, for example, the search key sentence is given a number indicating the character position “1, 2, 3,..., 12” one by one from the beginning of the sentence. The number representing the character position can represent the character position of the matched word appearing in the matched single sentence or sentence.

図16(c)は、検索結果の一例を示す。図16(c)に示す通り、検索結果1は、文章IDが「001」、単文IDが「001−1」であって、マッチモードが「係りうけマッチング」の場合では、スコアが「8.9」であって、マッチ位置情報が「key1:7,res1:7」「key9:12,res9:12」であることが示されている。ここで、マッチ位置は、当該マッチモードにおいてマッチングした単語を示しており、マッチ位置情報「key1:7,res1:7」は、検索キー文の「インターネット」を、マッチ位置情報「key9:12,res9:12」は、検索キー文の「つながらない」を、意味している。つまり、この「インターネット」と「つながらない」は、係りうけマッチングにおいて、検索キー文における親子関係と、検索結果1の文章における親子関係のマッチングの程度がスコア「8.9」と評価されていることを意味している。   FIG. 16C shows an example of the search result. As shown in FIG. 16C, the search result 1 has a score of “8.” when the sentence ID is “001”, the single sentence ID is “001-1”, and the match mode is “relevant matching”. 9 ”and the match position information is“ key1: 7, res1: 7 ”,“ key9: 12, res9: 12 ”. Here, the match position indicates a word matched in the match mode, and the match position information “key1: 7, res1: 7” indicates “Internet” of the search key sentence and the match position information “key9: 12”. “res9: 12” means “not connected” in the search key sentence. In other words, the “Internet” and “not connected” have a score of “8.9” for the matching between the parent-child relationship in the search key sentence and the parent-child relationship in the sentence of the search result 1 in the dependency matching. Means.

ここで、マッチ位置情報「key1:7,res1:7」とは、マッチした単語の文中における位置を表す情報であって、「key1:7」は、検索キー文の先頭から数えて、1番目から7番目までの文字列が、マッチした単語に該当することを表している。また、「res1:7」は、マッチした単文(あるいはマッチした文章)の先頭から数えて、1番目から7番目までの文字列が、マッチした単語に該当することを表している。なお、この数字は、文の先頭を基点として数えられる文字の数であって、文中における文字の位置を表す情報である。
このように、検索結果は、マッチング条件を満たす単語を含む文と、当該文に含まれるマッチした単語のマッチ位置情報とが関連付けられている情報を含む。
Here, the match position information “key1: 7, res1: 7” is information indicating the position of the matched word in the sentence, and “key1: 7” is the first counted from the head of the search key sentence. The seventh to seventh character strings correspond to matching words. “Res1: 7” indicates that the first to seventh character strings from the beginning of the matched single sentence (or matched sentence) correspond to the matched word. This number is the number of characters counted from the beginning of the sentence and is information indicating the position of the character in the sentence.
As described above, the search result includes information in which a sentence including a word satisfying the matching condition is associated with match position information of a matched word included in the sentence.

次に、図17を用いて、本実施の形態に係る情報検索システム1における検索開始処理の一例について説明する。図17は、本実施の形態に係る情報検索システム1における検索開始処理の一例を示すフローチャートである。
図17に示す通り、例えば、クライアント端末装置100の入力部103が日本語解析サーバ500による検索サービスを利用するリクエストをユーザから受け付けると、クライアント端末装置100は、日本語解析サーバ500による検索用表示データを送信するよう、WEBサーバ300に対してリクエスト制御信号を送信する。
Next, an example of a search start process in the information search system 1 according to the present embodiment will be described using FIG. FIG. 17 is a flowchart showing an example of a search start process in the information search system 1 according to the present embodiment.
As illustrated in FIG. 17, for example, when the input unit 103 of the client terminal device 100 receives a request for using the search service by the Japanese analysis server 500 from the user, the client terminal device 100 displays the search for display by the Japanese analysis server 500. A request control signal is transmitted to the WEB server 300 so as to transmit data.

WEBサーバ300は、通信部301を介して、クライアント端末装置100からリクエスト制御信号を受信すると、リクエスト処理部302が、このリクエスト制御信号に基づき、クライアント端末装置100の表示部102によって表示される表示データのウェブページのデータを作成するようデータ変換部303を制御する。次いで、データ変換部303は、記憶部304から必要な設定データ等を読み出し、ユーザによって検索キー文が入力されるテキストボックスを表示する検索用表示データを作成する。そして、通信部301は、この検索用表示データを、クライアント端末装置100に送信する(ステップST30)。
例えば、データ変換部303は、クライアント端末装置100に対して検索用表示データを表示させるためのHTML文章等で構成された表示データを作成する。そして、リクエスト処理部302は、この表示データと、検索結果を表示するためのルールが記載されたルール情報(例えば、CSSファイルで構成されたもの)、あるいは、検索結果をクライアント端末装置100の表示部102に表示されるために利用されるプログラム(例えば、javascript等)であって、ブラウザ101上で動作するプログラムコードを、通信部301を介して、クライアント端末装置100に送信する。
When the WEB server 300 receives a request control signal from the client terminal device 100 via the communication unit 301, the request processing unit 302 displays on the display unit 102 of the client terminal device 100 based on the request control signal. The data converter 303 is controlled so as to create data of the data web page. Next, the data conversion unit 303 reads necessary setting data from the storage unit 304 and creates search display data for displaying a text box in which a search key sentence is input by the user. And the communication part 301 transmits this display data for a search to the client terminal device 100 (step ST30).
For example, the data conversion unit 303 creates display data composed of HTML text or the like for causing the client terminal device 100 to display search display data. Then, the request processing unit 302 displays the display data and rule information (for example, configured with a CSS file) in which a rule for displaying the search result is described, or displays the search result on the client terminal device 100. A program code (for example, javascript or the like) that is used to be displayed on the unit 102 and that runs on the browser 101 is transmitted to the client terminal device 100 via the communication unit 301.

クライアント端末装置100は、WEBサーバ300から表示データやプログラム等を受信すると、このプログラムを起動させる。そして、データ処理部112は、このプログラムに従って、WEBサーバ300から受信される検索用表示データを、表示部102によって表示される表示データを生成し、表示処理部113を制御する。そして、表示処理部113は、データ処理112によって生成された表示データを、表示部102に表示させる。
クライアント端末装置100の入力部103を介して、ユーザから特定の検索サービスが指定されると、クライアント端末装置100は、指定された検索サービスによる検索を実行するためのリクエスト制御信号を生成する。
また、ユーザによって検索キー文が入力されると、入力部103はこれを受け付ける(ステップST31)。
When the client terminal device 100 receives display data or a program from the WEB server 300, the client terminal device 100 starts this program. Then, the data processing unit 112 generates display data displayed by the display unit 102 from the display data for search received from the WEB server 300 according to this program, and controls the display processing unit 113. The display processing unit 113 causes the display unit 102 to display the display data generated by the data processing 112.
When a specific search service is specified by the user via the input unit 103 of the client terminal device 100, the client terminal device 100 generates a request control signal for executing a search by the specified search service.
Further, when a search key sentence is input by the user, the input unit 103 receives this (step ST31).

次いで、クライアント端末装置100は、ユーザによって指定された検索サービスの種類や、入力された検索キー文を、検索リクエストメッセージとともに、通信部104を介してWEBサーバ300に送信する。
WEBサーバ300は、クライアント端末装置100から検索リクエストメッセージを受信すると、この検索リクエストメッセージから検索キー文を取り出し、日本語解析サーバ500に、例えば、検索サービスαによる検索を要求する(ステップST32)。
Next, the client terminal device 100 transmits the type of search service designated by the user and the input search key text to the WEB server 300 via the communication unit 104 together with the search request message.
When receiving the search request message from the client terminal device 100, the WEB server 300 extracts a search key sentence from the search request message and requests the Japanese analysis server 500 to perform a search using, for example, the search service α (step ST32).

次に、図18を用いて、本実施の形態に係る情報検索システム1における検索結果の表示方法の一例について説明する。図18は、本実施の形態に係る情報検索システム1における検索結果の表示方法の一例を示すフローチャートである。
図18に示す通り、WEBサーバ300は、日本語解析サーバ500から検索結果を受信すると、記憶部304に一時的に記憶させる。そして、データ変換部303が、クライアント端末装置100に表示させるためのルール情報を記憶部304から読み出す。次いで、データ変換部303は、このルール情報に基づき、検索結果をクライアント端末装置100の表示装置102において表示するためのウェブページの表示データを作成し、検索結果のメッセージとして、通信部301を介して、クライアント端末装置100に送信する(ステップST40)。
例えば、データ変換部303は、検索キー文ごとに、マッチした文章へのリンク情報、マッチした単文、適用したマッチモード、マッチ位置情報、スコア等のそれぞれに所定のタグを付与して、クライアント端末装置100側のデータ処理部112によって取り扱い可能なデータ(XMLファイル)を作成し、検索結果として送信する。
Next, an example of a search result display method in the information search system 1 according to the present embodiment will be described with reference to FIG. FIG. 18 is a flowchart showing an example of a search result display method in the information search system 1 according to the present embodiment.
As shown in FIG. 18, when the WEB server 300 receives the search result from the Japanese analysis server 500, the WEB server 300 temporarily stores it in the storage unit 304. Then, the data conversion unit 303 reads out rule information to be displayed on the client terminal device 100 from the storage unit 304. Next, the data conversion unit 303 creates display data of a web page for displaying the search result on the display device 102 of the client terminal device 100 based on the rule information, and transmits the search result message via the communication unit 301 as a search result message. Then, it transmits to the client terminal device 100 (step ST40).
For example, for each search key sentence, the data conversion unit 303 assigns a predetermined tag to each of link information to the matched sentence, matched single sentence, applied match mode, match position information, score, etc. Data (XML file) that can be handled by the data processing unit 112 on the apparatus 100 side is created and transmitted as a search result.

クライアント端末装置100のデータ処理部112は、この検索結果を受信すると、この検索結果(XMLファイル)を記憶部111に一時的に記憶させる。そして、データ処理部112は、記憶部111に記憶されているルール情報に基づき、このXMLファイルの電文に含まれるマッチ位置に該当する単語に対して、適用したマッチモードに対応した表示用のタグを挿入する(ステップST41)。
例えば、図16(c)に示すような検索結果の場合、データ処理部112は、マッチ位置情報の「key1:7、res1:7」に該当する「インターネット」に対して、適用したマッチモードとして「係りうけマッチング」であることを表す表示用のタグを、検索結果を表示するためのルールが記載されたルール情報(CSSファイル)を参照することで作成する。例えば、データ処理部112は、検索結果を表示するための情報として、特定の単語を強調して表示する強調表示設定情報をルール情報に基づき作成し、タグとしてマッチ位置情報に該当する単語に付与する。この強調表示設定情報としては、例えば、マッチした単語には下線を付加して表示するための設定情報や、あるいは、単語要素マッチングのマッチモードによってマッチした単語等を赤色で表示し、属性マッチングのマッチモードによってマッチした単語等を青色で表示することによって、マッチモードごとにユーザが視覚的に区別して認識することができるように表示するための設定情報が含まれている。
When receiving the search result, the data processing unit 112 of the client terminal device 100 temporarily stores the search result (XML file) in the storage unit 111. Based on the rule information stored in the storage unit 111, the data processing unit 112 displays a tag corresponding to the match mode applied to the word corresponding to the match position included in the message of the XML file. Is inserted (step ST41).
For example, in the case of a search result as shown in FIG. 16C, the data processing unit 112 sets the applied match mode to “Internet” corresponding to “key 1: 7, res1: 7” in the match position information. A display tag indicating that “relevant matching” is created by referring to rule information (CSS file) in which a rule for displaying a search result is described. For example, the data processing unit 112 creates highlight setting information for emphasizing and displaying a specific word as information for displaying the search result based on the rule information, and assigns it to the word corresponding to the match position information as a tag To do. As the highlight setting information, for example, setting information for adding an underline to the matched word or displaying the word matched by the word element matching match mode in red, and the attribute matching Setting information for displaying the words matched by the match mode in blue so that the user can visually distinguish and recognize each match mode is included.

また、強調表示設定情報としては、マッチしたと判断されるマッチモードが複数ある場合、予めユーザによって設定されている優先順位に従って、優先的に表示させるように設定されているマッチモードとマッチした単語等を強調表示するようなものであってもよく、スコアの高い順に優先的に強調表示するようなものであってもよい。
さらに、検索結果として、上述のように予めユーザによってマッチモードの優先順位が決定されている場合、マッチした単文や文章が複数あれば、この優先順位に従って、マッチした単文等を表示させるものであってもよい。
また、検索キー文の文頭に近いマッチした単語から順番に、検索結果として、優先的に表示させるものであってもよい。
In addition, as highlight setting information, when there are a plurality of match modes that are determined to match, a word that matches a match mode that is set to be displayed preferentially according to a priority set in advance by the user Etc. may be highlighted, or may be preferentially highlighted in descending order of score.
Furthermore, as a search result, when the priority order of the match mode is determined in advance by the user as described above, if there are a plurality of matched single sentences or sentences, the matched single sentences are displayed according to the priority order. May be.
Moreover, you may display preferentially as a search result in order from the matched word close | similar to the head of a search key sentence.

このような強調表示設定情報に基づき、検索結果をクライアント端末装置100の表示部102に表示させる。このとき、ユーザによって、検索結果として表示されているマッチした単文等の中から、強調して表示されているマッチした単語等が選択されると、入力部102は、これを受け付ける。そして、データ処理部112は、記憶部111に一時的に記憶されている検索結果のマッチ位置情報から、ユーザによって選択されたマッチした単語等の位置を特定し、このユーザによって選択されたマッチした単語等に応じた絞み込み検索をさらに行う(ステップST42)。   Based on such highlight setting information, the search result is displayed on the display unit 102 of the client terminal device 100. At this time, when the user selects a matched word or the like displayed in an emphasized manner from the matched single sentences or the like displayed as the search results, the input unit 102 accepts this. Then, the data processing unit 112 identifies the position of the matched word or the like selected by the user from the match position information of the search result temporarily stored in the storage unit 111, and the matching selected by the user A narrow-down search according to the word or the like is further performed (step ST42).

ここで、絞り込み検索について、図19、20を用いて、詳細に説明する。図19は、検索結果表示データに基づき、クライアント端末装置100の表示部102に表示される検索結果を表す画像の一例を示す概略図である。
図19に示す通り、クライアント端末装置100の表示部102は、検索結果表示データに基づき画面102Aを表示し、この画面102Aの左側には、検索キー文を表示するテキストボックス102Bが、右側には検索結果を表示するサジェスト画面102Cが表示されている。
テキストボックス102Bには、検索キー文「クレジットカードの支払方法を登録したのですが料金サポート窓口から請求書が届きます。」が表示されている。
Here, the refinement search will be described in detail with reference to FIGS. FIG. 19 is a schematic diagram illustrating an example of an image representing a search result displayed on the display unit 102 of the client terminal device 100 based on the search result display data.
As shown in FIG. 19, the display unit 102 of the client terminal device 100 displays a screen 102A based on the search result display data. On the left side of the screen 102A is a text box 102B that displays a search key sentence, and on the right side. A suggestion screen 102C for displaying the search result is displayed.
In the text box 102B, a search key sentence “I have registered a credit card payment method but I receive a bill from the charge support window” is displayed.

サジェスト画面102Cには、この検索キー文102C1と、この検索キー文に基づき日本語解析サーバ500による検索が行われた検索結果であるマッチした単文102C2が表示されている。
例えば、サジェスト画面102Cでは、検索キー文102C1のマッチした単語が、それぞれマッチモードに応じた色ごとに強調表示されている。マッチした単文102C2では、複数の単文が表示されている場合、通常の検索結果として、マッチした単文が、スコアが高い順番で表示されている。また、マッチした単文102C2に含まれるマッチした単語(例えば、「クレジットカードで支払方法を登録したのですが、料金サポート窓口から請求書が届きます。」)は、検索キー文102C1に含まれるマッチした単語と同様な強調して表示されており、同じマッチモードによって検索された単語に対しては、同じ色で強調して表示されている。
なお、サジェスト画面102Cの検索キー文102C1において強調して表示されているマッチした単語は、クライアント端末装置100の入力部102からの選択指示を受け付け、ユーザによって選択可能である。
WEBサーバ300は、検索結果が得られた場合、図19に示すような検索結果の表示データを作成し、クライアント端末装置100に送信する。
The suggestion screen 102C displays the search key sentence 102C1 and a matched single sentence 102C2 that is a search result obtained by the search by the Japanese analysis server 500 based on the search key sentence.
For example, on the suggestion screen 102C, the matched word of the search key sentence 102C1 is highlighted for each color corresponding to the match mode. In the matched simple sentence 102C2, when a plurality of simple sentences are displayed, the matched simple sentences are displayed in the order of the highest score as a normal search result. In addition, the matched word included in the matched simple sentence 102C2 (for example, “I registered the payment method with a credit card, but I receive an invoice from the charge support window”) is included in the search key sentence 102C1 The highlighted words are displayed in the same color as the selected words, and the words searched in the same match mode are highlighted in the same color.
Note that the matched word highlighted and displayed in the search key sentence 102C1 on the suggestion screen 102C can be selected by the user by receiving a selection instruction from the input unit 102 of the client terminal device 100.
When a search result is obtained, the WEB server 300 creates search result display data as shown in FIG. 19 and transmits it to the client terminal device 100.

次に、図20を用いて、図19に示す画面から絞込み検索を行う方法について説明する。図20は、図19に示す画面から、絞り込み検索を行った後に表示される画面の一例を示す概略図である。なお、クライアント端末装置100は、日本語検索サーバ500から受信した検索結果(例えば、マッチした文章、マッチした単文、マッチした単語、これらのマッチングに用いられたマッチング条件、あるいはマッチ位置情報を含むマッチ情報やスコア等)や、絞り込み検索を実行する際の検索ルール情報(例えば、入力部103を介して指定されたマッチした単語を検索キーとして、検索結果から、絞り込み対象を検索するためのプログラムや設定値等)を記憶部111に記憶しておく。 図20に示す通り、例えば、サジェスト画面102Cの検索キー文102C1のうち、強調して表示されているマッチした単語の「クレジットカード」が、ユーザによって選択された場合(例えば、マウスによって画面上のポインタが「クレジットカード」と表示されている部分を指示した状態で、ダブルクリック等の操作によって絞込み検索の対象として指定された場合)、クライアント端末装置100のデータ処理部112が、入力部103を介して、ユーザからの選択指示を受け付け、「クレジットカード」による絞り込み検索を実行する。   Next, a method for performing a narrow search from the screen shown in FIG. 19 will be described with reference to FIG. FIG. 20 is a schematic diagram illustrating an example of a screen displayed after performing a narrowing search from the screen illustrated in FIG. Note that the client terminal device 100 uses the search result received from the Japanese search server 500 (for example, a matched sentence, a matched single sentence, a matched word, a matching condition used for the matching, or a match including match position information) Information, score, etc.), search rule information when performing a refinement search (for example, a program for retrieving a refinement target from a search result using a matched word specified via the input unit 103 as a search key, Set values and the like) are stored in the storage unit 111. As shown in FIG. 20, for example, when the “credit card” of the matched word highlighted in the search key sentence 102C1 on the suggestion screen 102C is selected by the user (for example, on the screen with the mouse) The data processing unit 112 of the client terminal device 100 uses the input unit 103 in the state where the pointer indicates “credit card” and the data processing unit 112 of the client terminal device 100 is designated as a narrowing search target by an operation such as double click. The user receives a selection instruction from the user, and executes a refinement search by “credit card”.

データ処理部112は、記憶部111に記憶されている検索結果や検索ルール情報を参照して、検索キー文の「クレジットカード」のマッチ位置情報を検出する。また、データ処理部112は、「クレジットカード」のマッチ位置情報に基づき、検索キー文の「クレジットカード」とマッチする単語としてマッチ位置情報において関連付けられているマッチした単語を含むマッチした単文や文章を検索する。
例えば、図19に示す場合、検索キー文内の「クレジットカード」は、マッチ位置が「1:8」であるため、検索結果において、マッチ位置情報が「key1:8,res1:8」であって、同じマッチモードによってマッチした単語を含むマッチした文章を検索する。
さらに、データ処理部112は、この検索によって得られたマッチした単文や文章を、検索結果表示データの検索結果の上位に表示する表示データ(画面102A−1、図20の上方に示す図を参照)を作成する。これにより、表示処理部112は、絞り込み検索によって得られたマッチした文章を上位に表示するような表示データを、表示部102に表示させる。
The data processing unit 112 refers to the search result and search rule information stored in the storage unit 111 and detects the match position information of “credit card” in the search key sentence. Further, the data processing unit 112, based on the match position information of “credit card”, matches a single sentence or sentence including a matched word associated in the match position information as a word that matches “credit card” of the search key sentence. Search for.
For example, in the case shown in FIG. 19, the match position of the “credit card” in the search key sentence is “1: 8”, and therefore the match position information in the search result is “key1: 8, res1: 8”. Search for matching sentences that contain words that match in the same match mode.
Further, the data processing unit 112 displays display data (screen 102A-1, see the figure shown in the upper part of FIG. 20) that displays the matched single sentence or sentence obtained by this search at the top of the search result of the search result display data. ). As a result, the display processing unit 112 causes the display unit 102 to display display data that displays the matched sentence obtained by the narrowing search at the top.

そして、表示部102は、図20の上部に示す検索結果の画面102A−1の通り、検索結果のマッチした単文102C2の最上位として「クレジットカード支払いへの変更について」(スコア:2.2)を、その次に、「クレジットカードで支払方法を登録したのですが、料金サポート窓口から請求書が届きます。」(スコア:1.4)を表示する。
これにより、クライアント端末装置100は、検索結果のマッチ位置情報を利用して、マッチした単語に基づく再検索を実行することができ、マッチした単語に関してマッチングの程度が高い順に、マッチした単文を表示することができる。
なお、ここでは、絞り込み検索として、検索キー文のマッチした単語が指定された場合、単語要素マッチングにおいてマッチした単語であって、かつ、マッチ位置情報が一致する単語を、データ処理部112が、記憶部111に記憶されている検索結果に基づき、再検索する一例について説明したが、本発明はこれに限られない。
Then, as shown in the search result screen 102A-1 shown in the upper part of FIG. 20, the display unit 102 sets “the change to credit card payment” as the highest level of the matched sentence 102C2 (score: 2.2). Next, “I have registered a payment method with a credit card, but I receive an invoice from the charge support desk” (score: 1.4) is displayed.
Accordingly, the client terminal device 100 can execute a re-search based on the matched word using the match position information of the search result, and displays the matched single sentences in descending order of matching with respect to the matched word. can do.
Here, as a refinement search, when a word that matches the search key sentence is specified, the data processing unit 112 selects a word that matches in the word element matching and matches the match position information. Although an example of performing a re-search based on the search result stored in the storage unit 111 has been described, the present invention is not limited to this.

例えば、サジェスト画面102Cの検索キー文102C1のうち、強調して表示されているマッチした単語の「請求書」が、ユーザによって選択された場合、データ処理部112は、入力部103を介して、ユーザからの選択指示を受け付け、「請求書」による絞り込み検索を実行する。
データ処理部112は、記憶部111に記憶されている検索結果や検索ルール情報を参照して、検索キー文の「請求書」のマッチ位置情報を検出する。また、データ処理部112は、「請求書」のマッチ位置情報に基づき、検索キー文の「請求書」とマッチする単語としてマッチ位置情報において関連付けられているマッチした単語を含むマッチした単文や文章を検索する。
例えば、図19に示す場合、検索キー文内の「請求書」は、マッチ位置が「33:35」であるため、検索結果において、マッチ位置情報が「key33:35,res33:35」であって、同じマッチモードによってマッチした単語を含むマッチした文章を検索する。
For example, when the user selects the “invoice” of the matched word displayed highlighted in the search key sentence 102C1 on the suggestion screen 102C, the data processing unit 112, via the input unit 103, A selection instruction from the user is accepted, and a refinement search by “invoice” is executed.
The data processing unit 112 refers to the search result and search rule information stored in the storage unit 111 and detects the match position information of “invoice” in the search key sentence. In addition, the data processing unit 112, based on the match position information of “Bill”, matches a single sentence or sentence including a matched word associated in the match position information as a word that matches “Bill” of the search key sentence. Search for.
For example, in the case shown in FIG. 19, since the invoice in the search key sentence has a match position of “33:35”, the match position information in the search result is “key33: 35, res33: 35”. Search for matching sentences that contain words that match in the same match mode.

そして、データ処理部112は、この検索によって得られたマッチした文書を、検索結果表示データの検索結果の上位に表示する表示データ(画面102A−2、図20の下方に示す図を参照)を作成する。表示処理部113は、絞り込み検索によって得られたマッチした文章を上位に表示するような表示データを、表示部102に表示させる。
表示部102は、この表示データを表示し、図20の下部に示す検索結果の画面102A−2の通り、検索結果のマッチした単文102C2の最上位として「料金センタから請求書が届くのですが、請求書明細の内訳について確認したいです。」(スコア:4.0)を、その次に、「解約したにも関わらず、請求書が届いたのですが。」(スコア:2.5)・・・を表示する。
Then, the data processing unit 112 displays display data (see the screen 102A-2, the diagram shown in the lower part of FIG. 20) that displays the matched document obtained by this search at the top of the search result display data. create. The display processing unit 113 causes the display unit 102 to display display data that displays the matched sentence obtained by the narrowing search at the top.
The display unit 102 displays this display data, and as shown in the search result screen 102A-2 shown at the bottom of FIG. 20, the invoice arrives from the charge center as the highest sentence of the matched single sentence 102C2. I would like to confirm the breakdown of the invoice details. ”(Score: 4.0), then“ I received the invoice despite the cancellation ”(score: 2.5) ... is displayed.

このように、検索結果をクライアント端末装置100の記憶部111に記憶させておき、マッチング位置情報を利用することで、データ処理部112は、マッチした単語に基づく再検索を行うことができる。これにより、クライアント端末装置100は、絞り込み検索がユーザによって指示(リクエスト)された場合、検索結果に対して、形態素分解や構文解析等の解析を行うことなく、文章内におけるマッチした単語の位置を、マッチ位置情報を利用して得ることができる。また、マッチ位置情報は、マッチモードごとに作成されているため、マッチモードに応じて異なる強調表示をするためのタグをマッチした単語に付与することできる。従って、クライアント端末装置100は、再検索された検索結果を、表示部102に表示することで、絞り込み検索の検索結果を得ることができる。   As described above, the search result is stored in the storage unit 111 of the client terminal device 100, and the data processing unit 112 can perform a search again based on the matched word by using the matching position information. As a result, when the refinement search is instructed (requested) by the user, the client terminal device 100 determines the position of the matched word in the sentence without performing analysis such as morphological decomposition or syntax analysis on the search result. , And can be obtained using the match position information. Moreover, since the match position information is created for each match mode, a tag for different highlighting according to the match mode can be given to the matched word. Therefore, the client terminal device 100 can obtain the search result of the narrow search by displaying the search result that has been searched again on the display unit 102.

このように、マッチ位置や、マッチパターンを含む検索結果をクライアント端末装置100の記憶部111に記憶しておき、かつデータ処理部112による絞り込み検索のキーとなる単語が入力部103を介して指定されると、対応する単語の位置情報とマッチパターンのみから簡単に絞り込みの検索結果を得ることができる。このため、クライアント端末装置100は、絞り込み検索による再検索結果の表示データを再構築できる。
一方、本実施の形態と異なり、マッチ位置情報が検索結果として記憶部111に記憶されていない場合、クライアント端末装置100によって絞り込み検索が指定された単語が、マッチした文章やマッチした単文の何処に含まれているのかを、文章を解析しなければ検出することができない問題があったと考えられる。また、本実施の形態にように、マッチモードごとにマッチした単語のマッチ位置情報が検索結果としてクライアント端末装置100に記憶されていない場合、マッチモードごとに同じ色、あるいは同じフォント等で強調して表示できない問題があったと考えられる。本実施の形態に係る情報検索システム1は、上述のような構成とすることによって、上記問題を解決することができる。
As described above, the search result including the match position and the match pattern is stored in the storage unit 111 of the client terminal device 100, and a word that is a key for the narrowing search by the data processing unit 112 is specified via the input unit 103. Then, a narrowed search result can be easily obtained from only the position information of the corresponding word and the match pattern. For this reason, the client terminal apparatus 100 can reconstruct the display data of the re-search result by the narrow-down search.
On the other hand, unlike the present embodiment, when the match position information is not stored in the storage unit 111 as a search result, the word specified by the narrow-down search by the client terminal device 100 is located anywhere in the matched sentence or the matched single sentence. It is considered that there was a problem that it cannot be detected unless the sentence is analyzed. Further, as in the present embodiment, when the match position information of the word matched for each match mode is not stored as a search result in the client terminal device 100, the match is emphasized with the same color or the same font for each match mode. It seems that there was a problem that could not be displayed. The information search system 1 according to the present embodiment can solve the above problem by adopting the configuration as described above.

また、本実施の形態に係るクライアント端末装置100は、マッチ位置情報を用いて、マッチした単文や文章の文中におけるマッチした単語の位置が分かるため、マッチした単語を文中から抽出することができる。このため、形態素解析や構文解析等の文書解析を行うことなく、再検索ができる。また、マッチした単語の位置が分かることにより、クライアント端末装置100は、マッチした単語を強調表示する表示データを作成し、表示することができる。
一方、マッチ位置情報がない場合、クライアント端末装置100は、検索結果に対して文書解析を行わない限り、強調表示するための単語が文中のどこにあるのかわからないため、強調表示することができない。また、マッチ条件に応じて異なる色で強調表示することもできない。
なお、上述の処理はクライアント端末装置100側のデータ処理部112で絞り込み検索を実施し、再表示を行ったが、クライアント端末装置100から、ユーザによって選択された単語情報をWEBサーバ300側に送信し、WEBサーバ300側に絞り込みの処理を実施させてもよい。この場合、検索結果や検索ルール情報は、日本語解析サーバからWEBサーバ300に送信され、記憶部304に記憶しておく。
In addition, the client terminal device 100 according to the present embodiment can use the match position information to know the position of the matched word in the matched single sentence or sentence, so that the matched word can be extracted from the sentence. Therefore, re-searching can be performed without performing document analysis such as morphological analysis and syntax analysis. Also, by knowing the position of the matched word, the client terminal device 100 can create and display display data that highlights the matched word.
On the other hand, if there is no match position information, the client terminal device 100 cannot highlight the word because the word for highlighting is not found in the sentence unless document analysis is performed on the search result. Also, it cannot be highlighted with different colors depending on the match condition.
In the above-described process, the data processing unit 112 on the client terminal device 100 side performs a narrowing search and re-displays. However, the client terminal device 100 transmits the word information selected by the user to the WEB server 300 side. Then, the narrowing process may be performed on the WEB server 300 side. In this case, search results and search rule information are transmitted from the Japanese language analysis server to the WEB server 300 and stored in the storage unit 304.

次に、マッチング処理とスコアリング処理の一例について詳細に説明する。
なお、ここでは、検索サービスαがユーザによって指定されており、検索サービスαのマッチプロファイルとして予め決められているマッチプロファイルAがメモリ領域506の辞書オブジェクトに展開されている例について説明する。
Next, an example of matching processing and scoring processing will be described in detail.
Here, an example will be described in which the search service α is designated by the user, and a match profile A predetermined as a match profile of the search service α is expanded in the dictionary object in the memory area 506.

図21は、検索キー文の一例を示す図である。
図21に示すように、検索キー文「ETCカードがお店で使えません。」が、日本語解析サーバ500に入力される。これにより、日本語解析サーバ500によって照合が行われると、図22に示すようなマッチした単文が得られる。図22には、マッチした単文が複数示されており、例えば「ETCカードが使えない」「クレジットカードが使えない」「ETCカードを使いたい」「クレジットカードを使いたい」「ETCカードは使いやすい」「ETCカードを無くした。」等のマッチした単文が検索によって得られている。
FIG. 21 is a diagram illustrating an example of a search key sentence.
As shown in FIG. 21, a search key sentence “ETC card cannot be used at a store” is input to the Japanese language analysis server 500. Thus, when collation is performed by the Japanese analysis server 500, a matched single sentence as shown in FIG. 22 is obtained. FIG. 22 shows a plurality of matched single sentences. For example, “ETC card cannot be used”, “Credit card cannot be used”, “I want to use ETC card”, “I want to use credit card”, “ETC card is easy to use A matched single sentence such as “I lost the ETC card” has been obtained by the search.

図23は、マッチプロファイル記憶部502に記憶されているマッチプロファイルA〜Cの設定を説明するための概略図である。図23に示す通り、マッチプロファイルA〜Cの設定は、図5に示したマッチプロファイル記憶部502に記憶されているマッチモードの組み合わせが決定されているマッチモード定義PA1を含むマッチモード情報と、相対出現頻度フラグPA2から同義語マッチ係数PA10に相当する情報を含むスコアモード情報である。なお、マッチモードは、図27を用いて後述するとおり、(1)〜(4)に示す組み合わせパターンが利用可能である。ここでは、(2)単語要素マッチング+属性マッチングがマッチプロファイルのマッチ情報として予め決められている例について説明する。   FIG. 23 is a schematic diagram for explaining setting of match profiles A to C stored in the match profile storage unit 502. As shown in FIG. 23, the setting of the match profiles A to C includes match mode information including a match mode definition PA1 in which a match mode combination stored in the match profile storage unit 502 shown in FIG. The score mode information includes information corresponding to the synonym match coefficient PA10 from the relative appearance frequency flag PA2. Note that the combination mode shown in (1) to (4) can be used as the match mode, as will be described later with reference to FIG. Here, an example will be described in which (2) word element matching + attribute matching is predetermined as match information of the match profile.

マッチプロファイルAは、マッチモード情報(マッチモード定義PA1)として、(2)単語要素マッチングと属性マッチングが行われることが予め決められており、マッチング処理の結果に対しての重み付けは実行されないこと(例えば、係数1.0)が予め決められている。また、マッチプロファイルBは、マッチモード情報(マッチモード定義PA1)として、単語要素マッチングと属性マッチングが行われることが予め決められており、マッチング処理の結果に対しての重み付けは、係りつけマッチ係数PA7に基づく係りうけマッチングにおける重み付けを実行すること(例えば、係数2.0)が予め決められている。さらに、マッチプロファイルCは、マッチモード情報(マッチモード定義PA1)として、単語要素マッチングと属性マッチングが行われることが予め決められており、マッチング処理の結果に対しての重み付けは、述語属性マッチ係数PA6に基づき、属性マッチングにおいてマッチした単文には述語属性マッチ係数に従った重み付けを実行すること(例えば、係数2.0)が予め決められている。   The match profile A is determined beforehand as match mode information (match mode definition PA1) (2) word element matching and attribute matching are performed, and weighting is not performed on the result of the matching process ( For example, the coefficient 1.0) is predetermined. The match profile B is preliminarily determined to be subjected to word element matching and attribute matching as match mode information (match mode definition PA1), and the weighting on the result of the matching process is an associated match coefficient. Execution of weighting in dependency matching based on PA7 (for example, coefficient 2.0) is predetermined. Further, the match profile C is preliminarily determined to be subjected to word element matching and attribute matching as match mode information (match mode definition PA1), and the weighting on the result of the matching process is a predicate attribute match coefficient. Based on PA6, it is predetermined to execute weighting according to the predicate attribute match coefficient (for example, coefficient 2.0) for a single sentence matched in attribute matching.

次に、図24を用いて、図21〜23に示した例において、マッチプロファイルAに基づき得られた検索結果について説明する。図24は、マッチプロファイルAに基づき得られた検索結呆をサジェスト画面102Cに表示されている画面の一例を示す概略図である。
ここで、マッチプロファイルAのマッチモード定義PA1は単語要素+属性であるから、図24にはこれらの条件に一致した結果(単文)が抽出されている。
図24に示すスコアリング処理において、スコアモード情報としては、特に重み付け等は設定されていない(例えば、係数0.0もしくは1.0)。また、各ノード(ルール)がマッチした場合は、基準点を付与し、さらに、スコアモード情報による重み付けの計算を行う。なお、本実施例では基準点は、マッチ辞書内に記憶された各ルール(ノード)の重み値が適用されるが、単純に装置全体で所定の値を設定してもよい。今回は基準点を1.2点として、説明する。
例えば、「ETCカードが使えない」は、「ETC」「カード」「使え」という単語がマッチし、さらに、「ETC」、「カード」は名詞なので、「属性なし」で、それぞれ1.2点、「使え」は「使う(否定)」の属性がマッチしているので、1.2点×1.0(述語属性マッチ係数)で、1.2点となり、3.6点である。また「ETC」と「使え」、「カード」と「使え」のそれぞれに係り受けペアが含まれる事から、係り受けマッチ係数なし(1.0)が適用され1.2点×1.0×2で2.4点が加算され、合計で6.0点である。
以上のように、マッチモードでは係りうけマッチングは行われていないが、マッチプロファイルのスコアモードで、係り受けマッチ係数を定義しておけば、得られた結果に対して、スコアの算出において、柔軟に重み付けをする事ができる。
Next, search results obtained based on the match profile A in the example shown in FIGS. 21 to 23 will be described with reference to FIG. FIG. 24 is a schematic diagram illustrating an example of a screen on which the search ligation obtained based on the match profile A is displayed on the suggestion screen 102C.
Here, since the match mode definition PA1 of the match profile A is a word element + attribute, a result (single sentence) that matches these conditions is extracted in FIG.
In the scoring process shown in FIG. 24, no particular weighting or the like is set as the score mode information (for example, coefficient 0.0 or 1.0). Further, when each node (rule) matches, a reference point is assigned, and weighting is calculated based on the score mode information. In the present embodiment, the weight value of each rule (node) stored in the match dictionary is applied to the reference point, but a predetermined value may be simply set for the entire apparatus. This time, the reference point will be 1.2 points.
For example, “ETC card cannot be used” matches the words “ETC”, “card” and “useable”, and “ETC” and “card” are nouns, so there are no attributes and 1.2 points each. , “Use” matches the “Use (Negative)” attribute, so 1.2 points × 1.0 (predicate attribute match coefficient), which is 1.2 points, which is 3.6 points. In addition, since there is a dependency pair in each of “ETC” and “usable”, “card” and “usable”, no dependency match coefficient (1.0) is applied and 1.2 points × 1.0 × In 2.4, 2.4 points are added, for a total of 6.0 points.
As described above, dependency matching is not performed in the match mode, but if the dependency match coefficient is defined in the score mode of the match profile, it is possible to flexibly calculate the score for the obtained result. Can be weighted.

一方、「ETCカードを使いたい」は、「ETC」「カード」という単語・属性なしがマッチしている。この場合、1.2点+1.2点により、2.4点である。また、述語属性マッチ係数・係りうけマッチ係数が適用されるものはないため、その分の加点はない。
また、「クレジットカードが使えない」は、「使え」という単語と属性「使う(否定)」がマッチしている。この場合、1.2点×1.0で1.2点である。また、係り受けマッチ係数が適用されるものはないため、その分の加点はない。よって、図24に示す通り、スコア順に並べられた検索締果は、最上位が「ETCカードが使えない」(スコア6.0点)、その次が、「ETCカードを使いたい」(スコア2.4点)となる。
なお、本実施例では、「クレジットカード」と「ETCカード」は、「カード」の部分で共通しているが、「クレジット」単独での形で形態素解析をおこなう際のシステム辞書5501に登録がなければ、単語要マッチングにおいて、全要素のタイプが実行されているため、両者はマッチした文節として得られない。
On the other hand, “I want to use an ETC card” matches the words “ETC” and “card” with no word / attribute. In this case, it is 2.4 points by 1.2 points + 1.2 points. In addition, since there is no predicate attribute match coefficient or dependency match coefficient, there is no additional point.
In addition, the word “use credit” and the attribute “use (deny)” match “cannot use credit card”. In this case, 1.2 points × 1.0 is 1.2 points. In addition, since there is no application of the dependency match coefficient, there is no additional point. Therefore, as shown in FIG. 24, the search results arranged in the order of the score are “the ETC card cannot be used” at the top (score 6.0 points), followed by “I want to use the ETC card” (score 2 4 points).
In this embodiment, “credit card” and “ETC card” are common in the “card” part, but are registered in the system dictionary 5501 when performing morphological analysis in the form of “credit” alone. Otherwise, since all element types are executed in word matching, both cannot be obtained as matched phrases.

次に、図25を用いて、図21〜23に示した例において、マッチプロファイルBに基づき得られた検索結果について説明する。図25は、マッチプロファイルBに基づき得られた検索結果をサジェスト画面102Cに表示されている画面の一例を示す概略図である。
図25に示すスコアリング処理において、スコアモード情報としては、係り受けマッチ係数が、“あり”(点数に2.0を乗じる)に予め決定している。例えば、「ETCカードが使えない」は、「ETC」「カード」「使え」という単語・属性がマッチし、プロファイルAと同様に3.6点である。また「ETC」と「使え」、「カード」と「使え」のそれぞれに係り受けペアが含まれる事から、係り受けマッチ係数あり(2.0)が適用され1.2点×2.0×2で4.8点が加算され、合計で7.2点である。なお、その他のマッチした単文に対してのスコア処理は図24での説明と同様であるために、詳細な説明は省略する。
Next, search results obtained based on the match profile B in the example shown in FIGS. 21 to 23 will be described with reference to FIG. FIG. 25 is a schematic diagram illustrating an example of a screen in which search results obtained based on the match profile B are displayed on the suggest screen 102C.
In the scoring process shown in FIG. 25, as the score mode information, the dependency match coefficient is determined to be “present” (multiply the score by 2.0). For example, “ETC card cannot be used” matches the words / attributes “ETC”, “card”, and “use” and has 3.6 points as in profile A. In addition, since there is a dependency pair in each of “ETC” and “usable”, “card” and “usable”, there is a dependency match coefficient (2.0) and 1.2 points × 2.0 × 4.8 points are added at 2, which gives a total of 7.2 points. Since the score processing for other matched single sentences is the same as that described with reference to FIG. 24, detailed description thereof is omitted.

次に、図26を用いて、図21〜23に示した例において、マッチプロファイルCに基づき得られた検索結果について説明する。図26は、マッチプロファイルCに基づき得られた検索結果をサジェスト画面102Cに表示されている画面の一例を示す概略図である。
図26に示すスコアリング処理において、スコアモード情報としては、述語属性マッチ係数があり(点数に2.0を乗じる)に予め決定している。例えば、「ETCカードが使えない」は、「ETC」「カード」という単語・属性なしがマッチし、1.2点+1.2点で2.4点、さらに「使え」が単語、「使う(否定)」の属性でマッチしているので述語属性マッチ係数あり(2.0)が適用され1.2点×2.0で2.4点である。
また、プロファイルAと同様に「ETC」と「使え」、「カード」と「使え」のそれぞれに係り受けペアが含まれる事から、係り受けマッチ係数なし(1.0)が適用され1.2点×1.0×2で2.4点が加算され、合計で7.2点である。一方、「クレジットカードが使えない」は「使え」が単語、「使う(否定)」の属性でマッチしているだけなので、
述語属性マッチ係数あり(2.0)が適用され1.2点×2.0で2.4点である。
Next, search results obtained based on the match profile C in the example shown in FIGS. 21 to 23 will be described with reference to FIG. FIG. 26 is a schematic diagram illustrating an example of a screen in which search results obtained based on the match profile C are displayed on the suggest screen 102C.
In the scoring process shown in FIG. 26, the score mode information includes a predicate attribute match coefficient (multiply the score by 2.0) and is determined in advance. For example, “ETC card cannot be used” matches “ETC” and “card” without word / attribute, 1.2 points + 1.2 points, 2.4 points, and “use” is word, “use ( (No) ”, the predicate attribute match coefficient (2.0) is applied, and 1.2 points × 2.0 is 2.4 points.
Similarly to profile A, “ETC” and “usable”, “card” and “usable” each include a dependency pair, so no dependency match coefficient (1.0) is applied and 1.2. 2.4 points are added at points × 1.0 × 2, for a total of 7.2 points. On the other hand, “Can't use credit card” matches only “Use” is a word and “Use (Negation)” attribute.
Predicate attribute match coefficient exists (2.0) is applied, which is 1.2 points × 2.0 and 2.4 points.

このように、異なるスコアモード情報が設定されているマッチプロファイルA〜Cを用いて、異なる検索結果を得ることができる。
これにより、利用するマッチモードに応じて、マッチ辞書データを作成したり、マッチ辞書データをマッチモードに応じて作成したりする必要がなく、1つのマッチ辞書データを利用して、複数のマッチモードやその組み合わせによる検索を行うことができる。
In this way, different search results can be obtained using match profiles A to C in which different score mode information is set.
This eliminates the need to create match dictionary data according to the match mode to be used or to create match dictionary data according to the match mode. Or a combination thereof.

次に、マッチモードに応じた検索結果の特徴について、図27〜31を用いて、説明する。
図27は、検索結果を示し、マッチした単文と、このマッチした単文が得られたマッチモードの組み合わせを示す図である。
例えば、「ETCカードが使えない」は、(1)単語要素マッチング、(2)単語要素マッチングと属性マッチングの組み合わせ、(3)係りうけマッチング、(4)係りうけマッチングと属性マッチングの組み合わせの全てにおいて、マッチした単文として得られたものであることを示している。なお、検索キー文は「ETCカードがお店で使えません。」である。
Next, the characteristics of the search result according to the match mode will be described with reference to FIGS.
FIG. 27 shows a search result, and shows a combination of a matched single sentence and a match mode in which the matched single sentence is obtained.
For example, “ETC card cannot be used” means (1) word element matching, (2) combination of word element matching and attribute matching, (3) modification matching, and (4) combination of modification matching and attribute matching. Indicates that it was obtained as a matched single sentence. The search key sentence is “ETC card cannot be used at the store”.

図28は、マッチプロファイルのマッチモード定義PA1において、(1)単語要素マッチングによって得られた検索結果を示す概略図である。図28に示す通り、マッチした単文としては、「ETCカードが使えない」と「ETCカードを使いたい」のように、意味が正反対の文章もマッチしている。一方、「ETCカードを失くした。」等の「ETCカード」という単語だけマッチしている文章や、「クレジットカードが使えない」等の「使え」という単語だけマッチしている文章も、マッチした文章として検索によって得られる。
このように、このマッチプロファイルでは、広い範囲にわたって、類似文章も含めて集めてくる検索ができる。よって、複数のマッチした単文が得られる。ここで、複数のマッチした単文が膨大に得られる場合、却ってユーザの利便性が害される場合がある。しかし、日本語解析サーバ500は、マッチした単語の重み付けを行うことによって、スコアに基づき、評価されたマッチした単文を検索結果として表示することができる。よって、広い範囲にわたって複数の類似文章を検索した場合であっても、これら検索結果に優先順位を与え、スコアに基づき優先順位に応じた順番で表示することができる。
FIG. 28 is a schematic diagram showing search results obtained by (1) word element matching in match mode definition PA1 of the match profile. As shown in FIG. 28, as matched single sentences, sentences having opposite meanings such as “I cannot use an ETC card” and “I want to use an ETC card” are matched. On the other hand, sentences that match only the word “ETC card” such as “I lost my ETC card” or sentences that only match the word “use” such as “I cannot use a credit card” are also matched. Obtained by searching as a sentence.
As described above, in this match profile, it is possible to perform a search including a similar sentence over a wide range. Thus, a plurality of matched simple sentences are obtained. Here, if a large number of matched single sentences are obtained, the user's convenience may be adversely affected. However, the Japanese analysis server 500 can display the evaluated matched single sentence as a search result based on the score by weighting the matched word. Therefore, even when a plurality of similar sentences are searched over a wide range, priority can be given to these search results, and the results can be displayed in the order according to the priority based on the score.

図29は、マッチプロファイルのマッチモード定義PA1において、(2)単語要素マッチングと属性マッチングの組み合わせによって得られた検索結果を示す概略図である。図29に示す通り、マッチした単文としては、「ETCカードが使えない」と「ETCカードを使いたい」のように、意味が正反対の文章もマッチしている。ただし、ここでは「使え」は「使う(否定)」の属性としてマッチするため、両者のスコアの差分は、図28に示した例に比べて大きくできる。このように、マッチする単文の属性に対してもスコアの重み付けを行うことによって、検索キー文と意味の近いマッチした単文を、上位に表示することができる。   FIG. 29 is a schematic diagram showing search results obtained by (2) a combination of word element matching and attribute matching in match mode definition PA1 of the match profile. As shown in FIG. 29, as matched single sentences, sentences having opposite meanings such as “I cannot use an ETC card” and “I want to use an ETC card” are matched. However, since “use” matches as the “use (deny)” attribute here, the difference between the scores of both can be made larger than in the example shown in FIG. In this way, by assigning scores to matching single sentence attributes, matched single sentences having a meaning similar to that of the search key sentence can be displayed at the top.

図30は、マッチプロファイルのマッチモード定義PA1において、(3)係りうけマッチングによって得られた検索結果を示す概略図である。図30に示す通り、マッチした単文としては、「ETCカードが使えない」、「ETCカードを使いたい」、「ETCカードが使いやすい」といったように、意味は異なるが、“ETCカードを使うこと”に関連する単文がマッチしている。このようなマッチングモードを使用した場合、属性に係らず、係りうけ関係を重視した検索を行うことができる。   FIG. 30 is a schematic diagram showing search results obtained by (3) dependency matching in the match mode definition PA1 of the match profile. As shown in FIG. 30, the matched single sentences have different meanings such as “ETC card cannot be used”, “I want to use an ETC card”, “ETC card is easy to use”, but “Use an ETC card” A single sentence related to "" matches. When such a matching mode is used, it is possible to perform a search with an emphasis on the relationship, regardless of the attribute.

また、図31は、マッチプロファイルのマッチモード定義PA1において、(4)係りうけマッチングと属性マッチングの組み合わせによって得られた検索結果を示す概略図である。図31に示す通り、マッチした単文としては、「ETCカードが使えない」というような、検索キー結果に対してかなり近い意味の単文を検索により得ることができる。これは、係りうけマッチングのノードの親子関係のタイプで、係りうけ関係の親ノードと子ノードがそれぞれマッチし、かつ、係りうけ関係の親ノードあるいは子ノードに対応する単語に属性がマッチする場合にのみ検索結果が得られるものである。   FIG. 31 is a schematic diagram showing search results obtained by the combination of (4) dependency matching and attribute matching in the match profile definition PA1 of the match profile. As shown in FIG. 31, as a matched single sentence, a single sentence having a meaning very close to the search key result such as “ETC card cannot be used” can be obtained by searching. This is the type of parent-child relationship of a node for dependency matching, where the parent node and child node of the dependency relationship match, and the attribute matches the word corresponding to the parent node or child node of the dependency relationship Search results can be obtained only for.

よって、例えば、コールセンターにおけるオペレーターのように、お客様の問い合わせに対して的確な回答を短時間で検索し、回答する必要がある場合複数のマッチモードの組み合わせによって、係りうけ関係や単語に含まれる属性に応じた、より少ない数の検索結果に絞り込むことができ、例えば、どのような商品に対するどのような要望あるいはクレームなのか、どのようなことが分かり難いための問い合わせなのか等の、細かい意味の違いに応じた検索を行うことができる。   Therefore, for example, when an operator needs to search for an accurate answer in a short time, such as an operator in a call center, and answer it, the attribute included in the relationship or word by combining multiple match modes Can be narrowed down to a smaller number of search results, for example, what kind of request or claim for a product, what kind of inquiry is difficult to understand, etc. Search according to the difference.

上述の通り、本実施の形態に係るクライアント端末装置100は、記憶部111に、日本語解析サーバ500によって得られた検索結果を記憶させておき、当該検索結果に含まれるマッチング位置情報を利用することで、マッチした単語に基づく再検索を行うことができるようにした。これにより、クライアント端末装置100は、マッチ位置情報に基づき、マッチした単語がマッチした文章や単文の何処にあるのかを把握することができるため、検索結果に対して形態素解析や構文解析等の文書解析を行うことなく、検索の際に文書解析された検索結果を用いて、再検索を行うことができる。よって、クライアント端末装置100の再検索の処理速度が向上し、効率的な再検索を行うことができる。
また、例えば、ユーザが、検索の目的や条件に応じて、特定の単語において関連性の高いマッチした文章を、検索結果から得たい場合、クライアント端末装置100は、マッチ位置情報を用いて再検索を行うことができるため、日本語解析サーバ500も、再度、形態素解析や構文解析等の文書解析を行うことなく、検索結果を用いて再検索を行うことができる。
As described above, the client terminal device 100 according to the present embodiment stores the search result obtained by the Japanese analysis server 500 in the storage unit 111 and uses the matching position information included in the search result. By doing so, it was possible to perform a re-search based on the matched word. As a result, the client terminal device 100 can grasp where the matched word is located in the matched sentence or single sentence based on the match position information. Re-searching can be performed using the search result obtained by document analysis at the time of searching without performing analysis. Therefore, the processing speed of the re-search of the client terminal device 100 is improved, and an efficient re-search can be performed.
Further, for example, when the user wants to obtain a matched sentence having high relevance in a specific word from the search result according to the purpose and condition of the search, the client terminal device 100 performs a re-search using the match position information. Therefore, the Japanese analysis server 500 can perform a search again using the search result without performing document analysis such as morphological analysis and syntax analysis again.

また、本実施の形態のように、検索結果をクライアント端末装置100の記憶部111に記憶させておくことによって、例えば、絞り込み検索を日本語解析サーバ500に対して再度リクエスト信号を送信しなくて済むため、再検索の際にWEBサーバ300に対する通信を必要とせず、処理速度を向上させ、クライアント端末装置100の処理負担を軽減することができる。
さらに、クライアント端末装置100は、マッチ位置情報に基づき、マッチング条件によって得られたマッチした単語の文中における位置を把握できるようにした。これにより、再検索によって得られた結果を、マッチング条件に応じて表示することができ、ユーザに対して、検索キー文との関係において文の意味合いがより近い(重視された)文章や単語を理解しやすく表示することができる。
Further, by storing the search result in the storage unit 111 of the client terminal device 100 as in the present embodiment, for example, the search signal is not transmitted again to the Japanese analysis server 500 for the refinement search. Therefore, communication with the WEB server 300 is not required at the time of re-search, the processing speed can be improved, and the processing load on the client terminal device 100 can be reduced.
Further, the client terminal device 100 can grasp the position in the sentence of the matched word obtained by the matching condition based on the match position information. As a result, the result obtained by the re-search can be displayed according to the matching condition, and a sentence or word whose meaning of the sentence is closer (emphasized) in relation to the search key sentence to the user. Easy to understand and display.

なお、本実施形態に係るクライアント端末装置100は、例えば、コールセンターなどでの入力業務に用いる入力端末装置であって、ワークステーションやパーソナルコンピュータなどの情報処理装置から構成されるものが好ましい。また、本実施形態に係るクライアント端末装置100にあっては、携帯電話のユーザサポート業務を行うコールセンターにおいて、ユーザに対する電話応答時に頻出する語彙を基に、マッチ辞書データが構成されているものであってもよい。
これにより、電話による応対の内容をリアルタイムに入力する必要のあるコールセンターの作業などにおいて、より効率的な文字入力を実現することができる。
Note that the client terminal device 100 according to the present embodiment is an input terminal device used for input work in a call center, for example, and preferably includes an information processing device such as a workstation or a personal computer. In the client terminal device 100 according to the present embodiment, match dictionary data is configured based on a vocabulary that frequently appears at the time of a telephone response to a user at a call center that performs a user support service for a mobile phone. May be.
As a result, it is possible to realize more efficient character input in a call center operation or the like where it is necessary to input the contents of reception by telephone in real time.

また、上述の情報検索システム1における動作の過程は、コンピュータに実行させるためのプログラムや、このプログラムとしてコンピュータ読み取り可能な記録媒体として利用可能であり、コンピュータシステムが読み出して実行することによって、上記処理が行われる。なお、ここでいう「コンピュータシステム」とは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
The operation process in the information retrieval system 1 described above can be used as a program to be executed by a computer or a computer-readable recording medium as the program, and the computer system reads and executes the above process. Is done. The “computer system” here includes a CPU, various memories, an OS, and hardware such as peripheral devices.
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The “computer-readable recording medium” means a flexible disk, a magneto-optical disk, a ROM, a writable nonvolatile memory such as a flash memory, a portable medium such as a CD-ROM, a hard disk built in a computer system, etc. This is a storage device.

さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に記憶したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムに既に記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
Further, the “computer-readable recording medium” means a volatile memory (for example, DRAM (Dynamic DRAM) in a computer system that becomes a server or a client when a program is transmitted through a network such as the Internet or a communication line such as a telephone line. Random Access Memory)), etc., which hold programs for a certain period of time.
The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.

上述した課題を解決するために、本発明は、複数の単語から構成される検索キー文が入力される入力部と、前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得る解析部と、少なくとも1つ以上の単語によって構成された文節からなる一文について、その文節を部分木ノードとして木構造に構成し、各ノードに関する情報を表すルール情報として、複数の文を記憶するマッチ辞書記憶部と、前記マッチ辞書記憶部に記憶されている前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられているマッチプロファイル情報を記憶するマッチプロファイル記憶部と、前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果として、少なくとも一つ以上の前記マッチング条件に適合する単語が、前記マッチ辞書情報の文中に出現する位置を表すマッチ辞書内位置情報を得る検索処理部と、前記検索処理部によって得られた照合の結果、前記マッチング条件に適合する単語を含む文、前記単語に適合したマッチング条件の適合種別および前記マッチ辞書内位置情報、前記単語の検索キー文内における位置情報とが関連付けられた検索結果情報として、端末装置に送信する通信部と、を備えることを特徴とする。 In order to solve the above-described problem, the present invention relates to an input unit to which a search key sentence composed of a plurality of words is input, and the word that constitutes the search key sentence by analyzing the search key sentence. For a sentence composed of an analysis unit that obtains an analysis result and a clause composed of at least one word, the clause is configured as a subtree node in a tree structure, and a plurality of sentences are used as rule information representing information about each node. A match dictionary storage unit for storing match information, and match profile information associated with a matching condition for checking the relationship between the match dictionary information stored in the match dictionary storage unit and the search key sentence A match profile storage unit, and the search key sentence according to the matching condition associated with the match profile information; Matches with a serial matching dictionary information, as a result of the collation, the word fits into at least one of the matching conditions is to obtain a match dictionary position information indicating the position appearing in the text of the matching dictionary information retrieval process and parts, the result of the comparison obtained by the retrieval processing unit, sentence containing a word matching the matching condition, fit type and the matching dictionary location information of the matching condition adapted for said word, a search key of said word and a search result information and position information associated with the statement, characterized in that it comprises a communication unit that transmits to the terminal device.

また、本発明は、前記マッチプロファイル情報は、当該マッチング条件を満たす単語に対して前記検索キー文との照合の度合いを評価するための評価基準をさらに含み、前記検索処理部は、前記照合の結果、前記マッチング条件に適合する文に対して、前記マッチプロファイル情報に関連付けられている前記評価基準に従って、前記検索キー文とマッチング辞書情報との照合の度合いを表すスコアを算出することを特徴とする。 The match profile information may further include an evaluation criterion for evaluating a degree of matching with the search key sentence for a word satisfying the matching condition, and the search processing unit result, and wherein the relative fits statement matching condition, in accordance with the above evaluation standards associated with the matching profile information, calculates a score indicating a degree of matching between said search key sentences matching dictionary information To do.

また、本発明は、前記評価基準は、前記マッチング条件を満たす単語に対して前記照合の度合いに応じた点数を与えるか否かを表し、前記検索処理部は、前記評価基準に従って、前記マッチング条件を満たす単語に対して与えられた前記点数を、少なくとも一つ以上の前記マッチング条件に適合した文毎に算出して、前記スコアを得ることを特徴とする。 Further, the present invention represents whether or not the evaluation criterion gives a score corresponding to the degree of matching to a word that satisfies the matching condition, and the search processing unit is configured to match the matching condition according to the evaluation criterion. The score given to a word satisfying the condition is calculated for each sentence that meets at least one of the matching conditions, and the score is obtained.

また、本発明は、上述の情報検索装置によって得られた検索結果が入力される端末装置であって、表示データを表示する表示部と、前記複数の単語から構成される検索キー文の入力を受け付ける入力部と、前記情報検索装置から受信した検索結果情報、強調表示のための表示ルールを記憶する記憶部と、前記記憶部から、検索結果情報を読み出し、検索結果として得られた文について、前記表示ルールに従って、前記適合種別と、前記マッチ辞書内位置情報に基づいて、文中の単語を強調して表示する表示データを作成するデータ処理部を有することを特徴とする。 The present invention is also a terminal device to which a search result obtained by the above-described information search device is input, wherein a display unit that displays display data and a search key sentence composed of the plurality of words are input. An input unit that accepts, search result information received from the information search device, a storage unit that stores display rules for highlighting, and a sentence obtained as a search result by reading the search result information from the storage unit, According to the display rule, a data processing unit that creates display data for emphasizing and displaying words in a sentence based on the matching type and the position information in the match dictionary is provided.

また、本発明は、前記入力部はさらに、再検索のため、表示された検索結果情報の中から、単語の指定を受け付け、前記データ処理部は、前記入力部を介して前記指定された単語について、前記記憶部から読み出した前記検索結果情報を参照し、該単語の位置情報と適合種別を等しくする単語を含む文を抽出し、再検索結果として、表示部に表示させる表示データを作成することを特徴とする。 Further, the word present invention, the input unit further for re-searching, from the search result information displayed, accepting designation of a word, the data processing unit, said designated through the input section Referring to the search result information read from the storage unit, a sentence including a word having the same matching type as the position information of the word is extracted, and display data to be displayed on the display unit is generated as a re-search result It is characterized by that.

上述した課題を解決するために、本発明は、複数の単語から構成される検索キー文が入力される入力部と、前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得る解析部と、少なくとも1つ以上の単語によって構成された文節からなる一文について、その文節を部分木ノードとして木構造に構成し、各ノードに関する情報を表すルール情報として、複数の文を記憶するマッチ辞書記憶部と、前記マッチ辞書記憶部に記憶されている前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が1つ以上関連付けられているマッチプロファイル情報を記憶するマッチプロファイル記憶部と、前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果として、少なくとも一つ以上の前記マッチング条件に適合する単語が、前記マッチ辞書情報の文中に出現する位置を表す情報であって、文の先頭を基点として数えられる文字の数で、前記文中における単語の位置を表すマッチ辞書内位置情報を得る検索処理部と、前記検索処理部によって得られた照合の結果を、前記マッチング条件に適合する単語を含む文、前記単語に適合したマッチング条件および前記マッチ辞書内位置情報、前記単語の検索キー文内における位置情報について、全ての適合したマッチング条件毎に、関連付けられた検索結果情報として、端末装置に送信する通信部と、を備える情報検索装置によって得られた検索結果が入力される端末装置であって、表示データを表示する表示部と、前記複数の単語から構成される検索キー文の入力を受け付ける入力部と、前記情報検索装置から受信した検索結果情報、強調表示のための表示ルールを記憶する記憶部と、前記記憶部から、検索結果情報を読み出し、検索結果として得られた文について、前記表示ルールに従って、前記マッチング条件と、前記マッチ辞書内位置情報に基づいて、文中の単語を強調して表示する表示データを作成するデータ処理部を有し、前記入力部はさらに、前記表示部に表示された検索結果情報の中から、単語の指定を受け付け、前記データ処理部は、前記入力部を介して前記指定された単語について、前記記憶部から読み出した前記検索結果情報に基づいて、該単語の位置情報とマッチング条件を等しくする単語を含む文を抽出し、再検索結果として、表示部に表示させる表示データを作成することを特徴とする。 In order to solve the above-described problem, the present invention relates to an input unit to which a search key sentence composed of a plurality of words is input, and the word that constitutes the search key sentence by analyzing the search key sentence. For a sentence consisting of an analysis unit that obtains an analysis result and a clause composed of at least one or more words, the clause is configured as a subtree node in a tree structure, and a plurality of sentences are used as rule information indicating information about each node. A match dictionary storage unit that stores information, and match profile information associated with one or more matching conditions for checking the relationship between the match dictionary information stored in the match dictionary storage unit and the search key sentence A match profile storage unit for storing the search, and the search according to the matching condition associated with the match profile information based on the match profile information Matches with a _Bun and the match dictionary information, as a result of the collation, the word fits into at least one of the matching conditions is information indicating the position appearing in the text of the match dictionary information, statements A search processing unit that obtains position information in a match dictionary that indicates the position of a word in the sentence with the number of characters counted from the beginning of the match, and a matching result obtained by the search processing unit conforms to the matching condition statements containing the words, matching conditions you and the match dictionary in the position information that conforms to the word, about the location information in the search key sentence of the word, to each of all of the matched matching condition, associated with search result information as, a terminal apparatus search result obtained by the information retrieval apparatus is input and a communication unit for transmitting to the terminal device, the display data A display unit for displaying; an input unit for receiving an input of a search key sentence composed of the plurality of words; search result information received from the information search device; a storage unit for storing display rules for highlighting; A display that reads out search result information from the storage unit, and displays a sentence obtained as a search result by emphasizing words in the sentence based on the matching condition and the position information in the match dictionary according to the display rule. A data processing unit for creating data, wherein the input unit further accepts designation of a word from the search result information displayed on the display unit, and the data processing unit is configured to transmit the data via the input unit. For a specified word, based on the search result information read from the storage unit, extract a sentence containing a word that makes the matching condition equal to the position information of the word, Display data to be displayed on the display unit is created as a re-search result .

Claims (8)

複数の単語から構成される検索キー文が入力される入力部と、
前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得る解析部と、
少なくとも1つの単語によって構成される文節を部分木ノードとして木構造に構成した辞書であって、少なくとも1つの前記文節によって構成される文に関するマッチ辞書情報として、当該文に含まれる前記文節に関する情報を表すルール情報を記憶するマッチ辞書記憶部と、
前記マッチ辞書記憶部に記憶されている前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられているマッチプロファイル情報を記憶するマッチプロファイル記憶部と、
前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果として、前記マッチング条件を満たす単語が、前記マッチ辞書情報の文中に出現する位置を表す位置情報を得る検索処理部と、
前記検索処理部によって得られた照合の結果に基づき、前記マッチング条件を満たす単語を含む文と前記位置情報とが関連付けられている検索結果情報を、端末装置に送信する通信部と、
を備えることを特徴とする情報検索装置。
An input unit for inputting a search key sentence composed of a plurality of words;
An analysis unit that analyzes the search key sentence and obtains an analysis result related to the word constituting the search key sentence;
A dictionary configured in a tree structure with a clause composed of at least one word as a sub-tree node, and information about the clause included in the sentence as match dictionary information about a sentence composed of at least one of the clauses A match dictionary storage for storing rule information to be represented;
A match profile storage unit for storing match profile information associated with a matching condition for checking the relationship between the match dictionary information stored in the match dictionary storage unit and the search key sentence;
Based on the match profile information, the search key sentence corresponding to the associated matching condition and the match dictionary information are collated, and as a result of the collation, a word satisfying the matching condition is A search processing unit for obtaining position information representing a position appearing in the sentence;
Based on the result of the collation obtained by the search processing unit, a communication unit that transmits to the terminal device search result information in which a sentence including the word satisfying the matching condition and the position information is associated;
An information retrieval apparatus comprising:
前記マッチプロファイル情報は、
当該マッチング条件を満たす単語に対して前記検索キー文との照合の度合いを評価するための評価基準をさらに含み、
前記検索処理部は、
前記照合の結果、前記マッチング条件を満たす文に対して、前記マッチプロファイル情報に関連付けられている前記評価基準に従って、前記検索キー文とマッチング辞書情報との照合の度合いを表すスコアを算出することを特徴とする請求項1に記載の情報検索装置。
The match profile information is
Further including an evaluation criterion for evaluating the degree of matching with the search key sentence for a word that satisfies the matching condition,
The search processing unit
As a result of the collation, for a sentence satisfying the matching condition, a score representing a degree of collation between the search key sentence and the matching dictionary information is calculated according to the evaluation criterion associated with the match profile information. The information search apparatus according to claim 1, wherein
前記評価基準は、
前記マッチング条件を満たす単語に対して前記照合の度合いに応じた点数を与えるか否かを表し、
前記検索処理部は、
前記評価基準に従って、前記マッチング条件を満たす単語に対して与えられた前記点数を、前記マッチング条件を満たす文毎に算出して、前記スコアを得ることを特徴とする請求項2に記載の情報検索装置。
The evaluation criteria are:
Represents whether or not to give a score according to the degree of matching for words that meet the matching condition,
The search processing unit
The information search according to claim 2, wherein the score is obtained by calculating, for each sentence satisfying the matching condition, the score given to the word satisfying the matching condition according to the evaluation criterion. apparatus.
請求項1から3のうちいずれか一項に記載の情報検索装置によって得られた検索結果が入力される端末装置であって、
前記複数の単語から構成される検索キー文の入力を受け付け、および、指定された単語の再検索を受け付ける入力部と、
前記情報検索装置によって、マッチング条件に応じた前記検索キー文とマッチ辞書情報との照合が実行され、得られた照合の結果に基づき、前記マッチング条件を満たす単語を含む文と、前記マッチング条件を満たす単語が前記マッチ辞書情報の文中に出現する位置を表す位置情報とが関連付けられている検索結果情報を記憶する記憶部と、
表示データを表示する表示部と、
前記検索結果情報の位置情報を参照して、前記入力部を介して再検索の単語として指定された単語を検索キーとした、前記検索結果のマッチング条件を満たす単語を含む文の再検索を行い、検索結果を表示部に表示させる表示データを作成するデータ処理部と、
を有することを特徴とする端末装置。
A terminal device to which a search result obtained by the information search device according to any one of claims 1 to 3 is input,
Receiving an input of a search key sentence composed of the plurality of words, and an input unit for receiving a re-search of a specified word;
The information search device performs matching between the search key sentence according to matching conditions and match dictionary information, and based on the obtained matching result, a sentence including a word that satisfies the matching condition, and the matching condition A storage unit for storing search result information associated with position information representing a position where a word that satisfies the position appears in the sentence of the match dictionary information;
A display unit for displaying display data;
With reference to the position information of the search result information, a sentence including a word that satisfies the matching condition of the search result is re-searched using a word specified as a re-search word via the input unit as a search key. A data processing unit for creating display data for displaying the search result on the display unit;
The terminal device characterized by having.
前記データ処理部は、
前記検索キーに基づく検索によって再検索結果が得られた場合、前記マッチング条件を満たす単語を強調して表示するための表示ルールに従って、前記再検索の単語として指定された単語と、前記再検索結果の関連する部分とを、強調して表示する前記表示データを作成することを特徴とする請求項4に記載の端末装置。
The data processing unit
When a re-search result is obtained by the search based on the search key, the word specified as the re-search word according to the display rule for highlighting and displaying the word satisfying the matching condition, and the re-search result The terminal device according to claim 4, wherein the display data for highlighting and displaying related portions of the terminal device is created.
入力部が、
複数の単語から構成される検索キー文の入力を受け付け、
解析部が、
前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得て、
検索処理部が、
前記マッチ辞書記憶部に記憶されている前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられているマッチプロファイル情報を記憶するマッチプロファイル記憶部から前記マッチプロファイル情報を読み出し、
少なくとも1つの単語によって構成される文節を部分木ノードとして木構造に構成した辞書であって、少なくとも1つの前記文節によって構成される文に関するマッチ辞書情報として、当該文に含まれる前記文節に関する情報を表すルール情報を記憶するマッチ辞書記憶部の前記マッチ辞書情報を利用して、前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、
照合の結果として、前記マッチング条件を満たす単語が、前記マッチ辞書情報の文中に出現する位置を表す位置情報を検出し、
通信部が、
前記検索処理部によって得られた照合の結果に基づき、前記マッチング条件を満たす単語を含む文と前記位置情報とが関連付けられている検索結果情報を、端末装置に送信する
ことを特徴とする情報検索方法。
The input section is
Accept input of search key sentence consisting of multiple words,
The analysis department
Analyzing the search key sentence, obtaining an analysis result relating to the word constituting the search key sentence,
The search processor
The match profile information from the match profile storage unit that stores match profile information associated with matching conditions for collating the relationship between the match dictionary information stored in the match dictionary storage unit and the search key sentence Read
A dictionary configured in a tree structure with a clause composed of at least one word as a sub-tree node, and information about the clause included in the sentence as match dictionary information about a sentence composed of at least one of the clauses Using the match dictionary information in the match dictionary storage unit that stores the rule information to represent, based on the match profile information, matching the search key sentence and the match dictionary information according to the associated matching condition Done
As a result of the collation, position information representing a position where a word satisfying the matching condition appears in the sentence of the match dictionary information is detected,
The communication department
Based on the result of collation obtained by the search processing unit, search result information in which a sentence including a word satisfying the matching condition and the position information is associated is transmitted to the terminal device. Method.
コンピュータを、
複数の単語から構成される検索キー文が入力される入力手段、
前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得る解析手段、
前記マッチ辞書記憶部に記憶されている前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられているマッチプロファイル情報を記憶するマッチプロファイル記憶部から前記マッチプロファイル情報を読み出し、少なくとも1つの単語によって構成される文節を部分木ノードとして木構造に構成した辞書であって、少なくとも1つの前記文節によって構成される文に関するマッチ辞書情報として、当該文に含まれる前記文節に関する情報を表すルール情報を記憶するマッチ辞書記憶部の前記マッチ辞書情報を利用して、前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果として、前記マッチング条件を満たす単語が、前記マッチ辞書情報の文中に出現する位置を表す位置情報を検出する検索処理手段、
前記検索処理部によって得られた照合の結果に基づき、前記マッチング条件を満たす単語を含む文と前記位置情報とが関連付けられている検索結果情報を、端末装置に送信する通信手段
として機能させるためのプログラム。
Computer
An input means for inputting a search key sentence composed of a plurality of words;
Analyzing means for analyzing the search key sentence and obtaining an analysis result relating to the word constituting the search key sentence;
The match profile information from the match profile storage unit that stores match profile information associated with matching conditions for checking the relationship between the match dictionary information stored in the match dictionary storage unit and the search key sentence Is a dictionary having a tree structure including a clause composed of at least one word as a sub-tree node, and the phrase included in the sentence as match dictionary information regarding the sentence composed of at least one of the clauses Using the match dictionary information of the match dictionary storage unit that stores rule information representing information related to, based on the match profile information, the search key sentence according to the matching condition associated with the match dictionary information, As a result of the matching, the matching Search processing means a word which satisfies the matter is, to detect the position information indicating the position appearing in the text of the match dictionary information,
Based on the result of collation obtained by the search processing unit, for causing search result information in which a sentence including a word satisfying the matching condition and the position information are associated to function as a communication unit that transmits to a terminal device program.
情報検索装置によって得られた検索結果が入力されるコンピュータを、
表示データを表示する表示手段、
前記複数の単語から構成される検索キー文の入力を受け付け、および、指定された単語の再検索を受け付ける入力手段、
前記情報検索装置によって、マッチング条件に応じた前記検索キー文とマッチ辞書情報との照合が実行され、得られた照合の結果に基づき、前記マッチング条件を満たす単語を含む文と、前記マッチング条件を満たす単語が前記マッチ辞書情報の文中に出現する位置を表す位置情報とが関連付けられている検索結果情報を記憶する記憶手段、
前記検索結果情報の位置情報を参照して、前記入力手段を介して再検索の単語として指定された単語を検索キーとした、前記検索結果のマッチング条件を満たす単語を含む文の再検索を行い、検索結果を表示部に表示させる表示データを作成するデータ処理手段
として機能させるためのプログラム。
A computer to which a search result obtained by an information search device is input,
Display means for displaying display data;
An input means for receiving an input of a search key sentence composed of the plurality of words, and receiving a re-search of a specified word;
The information search device performs matching between the search key sentence according to matching conditions and match dictionary information, and based on the obtained matching result, a sentence including a word that satisfies the matching condition, and the matching condition Storage means for storing search result information associated with position information indicating a position where a word that satisfies the position appears in the sentence of the match dictionary information;
Referring to the position information of the search result information, a search is performed again for a sentence including a word satisfying the search result matching condition, using a word specified as a re-search word via the input means as a search key. A program for functioning as data processing means for creating display data for displaying search results on a display unit.
JP2009116026A 2009-05-12 2009-05-12 Terminal device Active JP4499179B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009116026A JP4499179B1 (en) 2009-05-12 2009-05-12 Terminal device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009116026A JP4499179B1 (en) 2009-05-12 2009-05-12 Terminal device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010025999A Division JP4967037B2 (en) 2010-02-08 2010-02-08 Information search device, information search method, terminal device, and program

Publications (2)

Publication Number Publication Date
JP4499179B1 JP4499179B1 (en) 2010-07-07
JP2010266971A true JP2010266971A (en) 2010-11-25

Family

ID=42575658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009116026A Active JP4499179B1 (en) 2009-05-12 2009-05-12 Terminal device

Country Status (1)

Country Link
JP (1) JP4499179B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014241034A (en) * 2013-06-11 2014-12-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Device, method and program to retrieve sentence
CN106716408A (en) * 2014-09-22 2017-05-24 甲骨文国际公司 Semantic text search
JP2018156328A (en) * 2017-03-16 2018-10-04 富士通株式会社 Search support program, search support device, and search support method
JP2021149580A (en) * 2020-03-19 2021-09-27 ヤフー株式会社 Information processing device, information processing method, and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0844771A (en) * 1994-05-25 1996-02-16 Fuji Xerox Co Ltd Information retrieval device
JPH10105555A (en) * 1996-09-26 1998-04-24 Sharp Corp Translation-with-original example sentence retrieving device
JP2003167898A (en) * 2001-12-04 2003-06-13 Tokyo Soft Kk Information retrieving system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0844771A (en) * 1994-05-25 1996-02-16 Fuji Xerox Co Ltd Information retrieval device
JPH10105555A (en) * 1996-09-26 1998-04-24 Sharp Corp Translation-with-original example sentence retrieving device
JP2003167898A (en) * 2001-12-04 2003-06-13 Tokyo Soft Kk Information retrieving system

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014241034A (en) * 2013-06-11 2014-12-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Device, method and program to retrieve sentence
US9767186B2 (en) 2013-06-11 2017-09-19 International Business Machines Corporation Retrieving a specific sentence from a document
CN106716408A (en) * 2014-09-22 2017-05-24 甲骨文国际公司 Semantic text search
JP2017528842A (en) * 2014-09-22 2017-09-28 オラクル・インターナショナル・コーポレイション Semantic text search
JP2018156328A (en) * 2017-03-16 2018-10-04 富士通株式会社 Search support program, search support device, and search support method
JP2021149580A (en) * 2020-03-19 2021-09-27 ヤフー株式会社 Information processing device, information processing method, and program
JP7323484B2 (en) 2020-03-19 2023-08-08 ヤフー株式会社 Information processing device, information processing method, and program

Also Published As

Publication number Publication date
JP4499179B1 (en) 2010-07-07

Similar Documents

Publication Publication Date Title
US6662152B2 (en) Information retrieval apparatus and information retrieval method
JP3820242B2 (en) Question answer type document search system and question answer type document search program
JP4967037B2 (en) Information search device, information search method, terminal device, and program
JP2004157981A (en) Device for expressing summary
Capstick et al. A system for supporting cross-lingual information retrieval
JPH11161682A (en) Device and method for retrieving information and recording medium
JP2006004399A (en) Information extraction program, its recording medium, information extraction device and information extraction rule creation method
Atwan et al. Semantically enhanced pseudo relevance feedback for Arabic information retrieval
JP4631795B2 (en) Information search support system, information search support method, and information search support program
KR20010108845A (en) Term-based cluster management system and method for query processing in information retrieval
JP4499179B1 (en) Terminal device
US20040246237A1 (en) Information access method, system and storage medium
KR101478016B1 (en) Apparatus and method for information retrieval based on sentence cluster using term co-occurrence
JP4065346B2 (en) Method for expanding keyword using co-occurrence between words, and computer-readable recording medium recording program for causing computer to execute each step of the method
JP5439028B2 (en) Information search apparatus, information search method, and program
WO2020079752A1 (en) Document search method and document search system
JP2007164635A (en) Method, device and program for acquiring synonymous vocabulary
JP4428703B2 (en) Information retrieval method and system, and computer program
JP2003108584A (en) Information retrieving system and program
JP4378106B2 (en) Document search apparatus, document search method and program
JP2005202924A (en) Translation determination system, method, and program
JP3985483B2 (en) SEARCH DEVICE, SEARCH SYSTEM, SEARCH METHOD, PROGRAM, AND RECORDING MEDIUM USING LANGUAGE SENTENCE
JP2012079160A (en) Information retrieval device and computer program
Eldin et al. Cross-language semantic web service discovery to improve the selection mechanism by using data mining techniques
JP2005234772A (en) Documentation management system and method

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100316

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100414

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4499179

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140423

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350