JP5439028B2 - Information search apparatus, information search method, and program - Google Patents
Information search apparatus, information search method, and program Download PDFInfo
- Publication number
- JP5439028B2 JP5439028B2 JP2009116025A JP2009116025A JP5439028B2 JP 5439028 B2 JP5439028 B2 JP 5439028B2 JP 2009116025 A JP2009116025 A JP 2009116025A JP 2009116025 A JP2009116025 A JP 2009116025A JP 5439028 B2 JP5439028 B2 JP 5439028B2
- Authority
- JP
- Japan
- Prior art keywords
- match
- sentence
- information
- search
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 58
- 238000012545 processing Methods 0.000 claims description 120
- 238000011156 evaluation Methods 0.000 claims description 23
- 230000008569 process Effects 0.000 description 36
- 238000010586 diagram Methods 0.000 description 33
- 230000015654 memory Effects 0.000 description 22
- 238000004891 communication Methods 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 10
- 230000000877 morphologic effect Effects 0.000 description 8
- 101100194362 Schizosaccharomyces pombe (strain 972 / ATCC 24843) res1 gene Proteins 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 101001139126 Homo sapiens Krueppel-like factor 6 Proteins 0.000 description 1
- 101000661807 Homo sapiens Suppressor of tumorigenicity 14 protein Proteins 0.000 description 1
- 101000585359 Homo sapiens Suppressor of tumorigenicity 20 protein Proteins 0.000 description 1
- 102100029860 Suppressor of tumorigenicity 20 protein Human genes 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000012559 user support system Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
本発明は、入力されたテキストデータを解析した結果に応じた検索を行う情報検索装置、情報検索方法、およびプログラムに関する。 The present invention relates to an information retrieval apparatus for searching corresponding to the result of analyzing the input text data, information retrieval method, a contact and a program.
例えば、電子メールによるユーザの意見や企業内の電子文書を収集し、テキストデータに変換してデータベース等に蓄積しておく。そして、オペレーターによるユーザからの問い合わせ対応や苦情対応の際に、オペレーターが入力した文章を検索キーとして、該当する対応方法をデータベースから検索して、オペレーターが使用する端末に送信する検索方法がある。
このようなオペレーターによる対応シーンでは、お客様を待たせないためにも、検索キーに適した検索結果をより絞り込んで検索しなければならない。しかし、このような対応シーンでの検索では、ユーザからの問い合わせや苦情等の、文の意味やユーザの意図を含む文章が検索キーとして利用されている。このため、単語やキーワード等を検索キーとして用いる一般的な検索ではなく、文章の意味やユーザの意図をより重視した検索を行う必要がある。
例えば、検索装置によって検索される辞書データを作成する際に、検索対象となる文章の構文構造や意味を解析し、解析した文章の語の品詞や係りうけ関係を抽出し、抽出された情報をマッチングの条件とする木構造の辞書データを作成しておく。そして、検索キーとして入力された検索文章を解析し、マッチングの条件と合致する解析結果を辞書データから検索して、得られた検索結果としてユーザの端末に表示させるものがある(例えば、特許文献1参照)。
For example, a user's opinion by electronic mail or an electronic document in a company is collected, converted into text data, and stored in a database or the like. Then, when responding to an inquiry or complaint from a user by an operator, there is a search method in which a corresponding input method is searched from a database using a sentence input by the operator as a search key and transmitted to a terminal used by the operator.
In such a response scene by an operator, it is necessary to narrow down the search results suitable for the search key in order to keep the customer from waiting. However, in such a search in the corresponding scene, a sentence including the meaning of the sentence and the user's intention, such as an inquiry or complaint from the user, is used as a search key. For this reason, it is necessary to perform a search that emphasizes the meaning of the sentence and the user's intention, rather than a general search using words, keywords, and the like as search keys.
For example, when creating dictionary data to be searched by a search device, the syntax structure and meaning of the sentence to be searched are analyzed, the part of speech and the relationship between the words of the analyzed sentence are extracted, and the extracted information is Create tree-structured dictionary data as matching conditions. Then, the search text input as a search key is analyzed, an analysis result that matches the matching condition is searched from the dictionary data, and the obtained search result is displayed on the user terminal (for example, patent document) 1).
しかしながら、特許文献1のような辞書データを利用した検索においては、マッチングの目的や条件に応じて、辞書データをそれぞれ作り込む必要があるという問題がある。
例えば、「携帯電話がつながりにくい」「携帯電話がつながらない」という二つの文章を利用して、“使用方法に関する問い合わせ”に適したマッチングの条件に応じた辞書データを作成する場合は、以下のような辞書データを作り込む。例えば、上記二つの文章は、携帯電話の使用方法に関する問い合わせの意味合いを持っている。このため、上記二つの文章は、ここでのマッチングの条件として関連付けられる文章である。よって、“使用方法に関する問い合わせ”のための辞書データを作成する場合、上記二つの文章は、共に検索される対象としてそれぞれが関連付けられるマッチング条件の下、辞書データが作成される必要がある。
However, a search using dictionary data as in
For example, to create dictionary data according to matching conditions suitable for “inquiry about usage” using two sentences “mobile phone is difficult to connect” and “cell phone cannot be connected” The correct dictionary data. For example, the above two sentences have implications for inquiries regarding how to use a mobile phone. For this reason, the above-mentioned two sentences are sentences associated as matching conditions here. Therefore, when creating dictionary data for “inquiry about usage”, it is necessary to create dictionary data under matching conditions in which the above two sentences are associated with each other as a search target.
一方、“企業に対する意見に関する対応”に適したマッチングの条件に基づく辞書データを作成する場合、「携帯電話がつながりにくい」という文章は、ユーザによる改善の要望という意味合いを持ち、「携帯電話がつながらない」という文章は、ユーザからの苦情いう意味合いを持っている。このため、ユーザからの改善の要望を検索する場合、後者ではなく前者のみが検索結果として得られることが好ましい。従って、このような場合、“企業に対する意見に関する対応”に適したマッチングの条件に基づく辞書データを作成する必要がある。 On the other hand, when creating dictionary data based on matching conditions suitable for “responding to opinions about companies”, the sentence “cell phone is difficult to connect” has the meaning of a request for improvement by the user, and “cell phone is not connected” "Has the meaning of a complaint from the user. For this reason, when searching for improvement requests from users, it is preferable that only the former, not the latter, be obtained as a search result. Therefore, in such a case, it is necessary to create dictionary data based on matching conditions suitable for “responding to opinions about companies”.
つまり、上述のように、検索の目的が異なる場合、その目的に応じたマッチングの条件に基づく辞書データをそれぞれ作成する必要があったため、辞書データを作るための労力が増大するという問題があった。
また、膨大なデータ量の辞書データを、マッチングの条件に応じてそれぞれ記憶しておかなければならないため、効率的な記憶領域の活用が図られないという問題があった。
In other words, as described above, when the purpose of the search is different, it is necessary to create dictionary data based on matching conditions according to the purpose, and thus there is a problem that labor for creating dictionary data increases. .
In addition, since a huge amount of dictionary data must be stored in accordance with matching conditions, there is a problem that efficient use of the storage area cannot be achieved.
本発明は、このような事情を考慮してなされたものであり、その目的は、一つの辞書データを利用して異なるマッチング条件に基づく検索ができる情報検索装置、情報検索方法、およびプログラムを提供することにある。 The present invention has been made in view of such circumstances, and its object is an information retrieval device capable search based on different matching conditions by using one dictionary data, information retrieval method, the contact and program It is to provide.
上述した課題を解決するために、本発明の情報検索装置は、複数の単語から構成される検索キー文が入力される入力部と、前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得る解析部と、少なくとも1つの前記単語によって構成される文節を部分木ノードとして木構造に構成した辞書であって、少なくとも1つの前記文節によって構成される文に関するマッチ辞書情報として、当該文に含まれる前記文節に関する情報を表すルール情報を記憶するマッチ辞書記憶部と、前記マッチ辞書記憶部に記憶されている前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられており、当該マッチング条件を満たす単語に対して前記検索キー文との照合の度合いを評価するための評価基準を有するマッチプロファイル情報を記憶するマッチプロファイル記憶部と、前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に従って、前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果、前記マッチング条件を満たす前記文に対して、当該マッチプロファイル情報に関連付けられている前記評価基準に従って、前記検索キー文と前記マッチ辞書情報との照合の度合いを表すスコアを算出する検索処理部と、を備えることを特徴とする。 In order to solve the above-described problems, an information search apparatus according to the present invention includes an input unit to which a search key sentence composed of a plurality of words is input, and analyzes the search key sentence to form the search key sentence. An analysis unit that obtains an analysis result related to the word, and a dictionary configured in a tree structure with a clause constituted by at least one of the words as a subtree node, and a match dictionary related to a sentence constituted by at least one of the clauses The match dictionary storage unit that stores rule information representing information about the clause included in the sentence as information, and the relationship between the match dictionary information stored in the match dictionary storage unit and the search key sentence is collated In order to evaluate the degree of matching with the search key sentence with respect to a word satisfying the matching condition A match profile storage unit that stores match profile information having an evaluation criterion, and based on the match profile information, the search key sentence and the match dictionary information are collated according to the associated matching condition, and the result of the collation A search processing unit that calculates a score representing a degree of matching between the search key sentence and the match dictionary information according to the evaluation criterion associated with the match profile information for the sentence that satisfies the matching condition; It is characterized by providing.
また、この情報検索装置は、前記評価基準が、前記マッチング条件を満たす単語に対して前記照合の度合いに応じた点数を与えるか否かを表し、前記検索処理部が、前記評価基準に従って、前記マッチング条件を満たす単語に対して与えられる前記点数を、前記マッチング条件を満たす文毎に算出して、前記スコアを得ることを特徴とする。 Further, the information search device represents whether the evaluation criterion gives a score corresponding to the degree of matching for a word satisfying the matching condition, and the search processing unit is configured to perform the evaluation according to the evaluation criterion. The score given to the word satisfying the matching condition is calculated for each sentence satisfying the matching condition to obtain the score.
また、この情報検索装置は、前記マッチプロファイル記憶部が、それぞれ異なる特性を有する複数の前記マッチング条件のうち、少なくとも1つのマッチング条件と関連付けられている前記マッチプロファイル情報を、検索の目的に応じて複数備えることを特徴とする。 In the information search apparatus, the match profile storage unit may search the match profile information associated with at least one matching condition among the plurality of matching conditions having different characteristics according to the purpose of the search. It is characterized by comprising a plurality.
また、この情報検索装置は、前記マッチプロファイル記憶部は、前記マッチング条件として、単語要素マッチング、属性マッチング、あるいは係りうけマッチングのうち、少なくとも1つが関連づけられていることを特徴とする。 In the information search apparatus, the match profile storage unit is associated with at least one of word element matching, attribute matching, and dependency matching as the matching condition.
また、この情報検索装置は、前記入力部が、複数の単語から構成される検索対象文を入力し、前記解析部が、前記検索対象文を解析して、前記検索対象文を構成する前記単語に関する解析結果を得て、前記解析結果に基づき、前記単語の文字列に関する文字情報、および前記単語の属性を表す属性情報を含む前記ルール情報を、少なくとも1つの前記単語によって構成される文節と対応付けて、部分木ノードとして木構造に構成した辞書情報であって、少なくとも1つの前記文節によって構成される文に関する前記マッチ辞書情報を作成して前記マッチ辞書記憶部に記憶させる辞書作成部を、さらに備えることを特徴とする。 Further, the word the information retrieval apparatus, the input unit, which inputs the configured search subject sentence from the plurality of words, the analysis unit is analyzing the search subject sentence, constituting said search subject sentence analysis results obtained regarding the analysis based on the results, corresponding to the rule information including attribute information indicating character information, and the attribute of the word related to the character string of the word, a phrase composed of at least one of said word attached to, a dictionary information configured in a tree structure as a sub-tree nodes, the dictionary creation unit for creating and storing the matching dictionary storage unit said matching dictionary information about configured sentence by at least one of the clauses, It is further provided with the feature.
上述した課題を解決するために、本発明の情報検索方法は、入力部が、複数の単語から構成される検索キー文の入力を受け付け、解析部が、前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得て、検索処理部が、前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられており、当該マッチング条件を満たす単語に対して前記検索キー文との照合の度合いを評価するための評価基準を有するマッチプロファイル情報を記憶するマッチプロファイル記憶部から前記マッチプロファイル情報を読み出し、少なくとも1つの前記単語によって構成される文節を部分木ノードとして木構造に構成した辞書であって、少なくとも1つの前記文節によって構成される文に関するマッチ辞書情報として、当該文に含まれる前記文節に関する情報を表すルール情報を記憶するマッチ辞書記憶部の前記マッチ辞書情報を利用して、前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果、前記マッチング条件を満たす前記文に対して、当該マッチプロファイル情報に関連付けられている前記評価基準に従って、前記検索キー文と前記マッチ辞書情報との照合の度合いを表すスコアを算出することを特徴とする。 In order to solve the above-described problem, in the information search method of the present invention, the input unit accepts input of a search key sentence composed of a plurality of words, and the analysis unit analyzes the search key sentence, An analysis result regarding the word constituting the search key sentence is obtained, and the search processing unit is associated with a matching condition for checking the relationship between the match dictionary information and the search key sentence. The match profile information is read from a match profile storage unit that stores match profile information having an evaluation criterion for evaluating the degree of matching with the search key sentence for a word that satisfies, and is configured by at least one of the words A dictionary in which clauses are constructed in a tree structure with subtree nodes, and is a matrix related to a sentence composed of at least one of the clauses. As the dictionary information, using the match dictionary information of the match dictionary storage unit that stores rule information representing information about the clause included in the sentence, based on the match profile information, the associated matching condition The search key sentence is matched with the match dictionary information, and the search key sentence is determined according to the evaluation criterion associated with the match profile information for the sentence that satisfies the matching condition as a result of the matching. And a score representing the degree of matching between the match dictionary information and the match dictionary information.
また、本発明は、コンピュータを、複数の単語から構成される検索キー文が入力される入力手段、前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得る解析手段、前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられており、当該マッチング条件を満たす単語に対して前記検索キー文との照合の度合いを評価するための評価基準を有するマッチプロファイル情報を記憶するマッチプロファイル記憶部から前記マッチプロファイル情報を読み出し、少なくとも1つの前記単語によって構成される文節を部分木ノードとして木構造に構成した辞書であって、少なくとも1つの前記文節によって構成される文に関するマッチ辞書情報として、当該文に含まれる前記文節に関する情報を表すルール情報を記憶するマッチ辞書記憶部の前記マッチ辞書情報を利用して、前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果、前記マッチング条件を満たす前記文に対して、当該マッチプロファイル情報に関連付けられている前記評価基準に従って、前記検索キー文と前記マッチ辞書情報との照合の度合いを表すスコアを算出する検索処理手段として機能させるためのプログラムであることを特徴とする。 According to another aspect of the present invention, there is provided an input unit for inputting a search key sentence composed of a plurality of words, an analysis for analyzing the search key sentence and obtaining an analysis result relating to the words constituting the search key sentence. Means for associating a matching condition for collating the relationship between the match dictionary information and the search key sentence, and for evaluating a degree of matching with the search key sentence for a word satisfying the matching condition A dictionary in which the match profile information is read out from a match profile storage unit that stores match profile information having the evaluation criteria, and a clause composed of at least one word is configured as a sub-tree node in a tree structure, The phrase included in the sentence as match dictionary information related to the sentence constituted by the two phrases Using the match dictionary information of the match dictionary storage unit that stores rule information representing information related thereto, based on the match profile information, the search key sentence according to the matching condition associated with the match dictionary information, As a result of the collation, the degree of collation between the search key sentence and the match dictionary information is represented according to the evaluation criteria associated with the match profile information for the sentence that satisfies the matching condition. It is a program for functioning as a search processing means for calculating a score.
また、前記入力手段は、複数の単語から構成される検索対象文を入力し、前記解析手段は、前記検索対象文を解析して、前記検索対象文を構成する前記単語に関する解析結果を得て、前記コンピュータを、さらに前記解析結果に基づき、前記単語の文字列に関する文字情報、および前記単語の属性を表す属性情報を含む前記ルール情報を、少なくとも1つの前記単語によって構成される文節と対応付けて、部分木ノードとして木構造に構成した辞書情報であって、少なくとも1つの前記文節によって構成される文に関する前記マッチ辞書情報を作成して前記マッチ辞書記憶部に記憶させる辞書作成手段として機能させるためのプログラムである。 Further, the input means inputs the retrieval sentence composed of a plurality of words, said analysis means, said search by analyzing the sentence to obtain the analysis result regarding the words constituting said search subject sentence , the computer, on the basis of further result of the analysis, the association and configured clause the rule information including attribute information indicating character information, and the attribute of the word related to the character string of the word, by at least one of said word Te, a dictionary information configured in a tree structure as a sub-tree nodes, to function as a dictionary creation means for storing and generating the match dictionary information about configured sentence by at least one of the clauses in the matching dictionary storage unit It is a program for.
この発明によれば、一つの辞書データを利用して異なるマッチング条件に基づく検索を実現することができる。 According to this invention, it is possible to realize a search based on different matching conditions using a single dictionary data.
以下、本発明の一実施形態を、図面を参照して説明する。図1は、本実施の形態に係る情報検索システムの一例を示すブロック図である。
図1に示す通り、情報検索システム1は、クライアント端末装置100と、WEBサーバ300と、日本語解析サーバ500と、データベースファイルサーバ700とを備える。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an example of an information search system according to this embodiment.
As shown in FIG. 1, the
クライアント端末装置100は、例えば、パーソナルコンピュータ等の情報計算処理装置であって、検索キー文が入力される入力部と、入力部を介してユーザから入力された検索キー文を、ネットワークを介してWEBサーバ300に送信する。なお、詳細については図2を用いて後述する。
The
WEBサーバ300は、クライアント端末装置100と日本語解析サーバ500間の通信を行い、例えば、クライアント端末装置100から受信した検索キー文を日本語解析サーバ500に送信し、日本語解析サーバ500から受信した検索結果をクライアント端末装置100に送信する。なお、詳細については、図3を用いて後述する。
The
日本語解析サーバ500は、検索処理部501と、マッチプロファイル記憶部502と、マッチ辞書記憶部503と、辞書作成部504と、文書解析部505と、メモリ領域506を備える。日本語解析サーバ500は、WEBサーバ300から検索キー文を受信すると、この検索キー文に基づく検索を行い、検索結果をWEBサーバ300を介してクライアント端末装置100に送信する。なお、詳細については図4〜8を用いて後述する。
The
データベースファイルサーバ700は、日本語解析サーバ500の検索対象となる情報(以下、検索対象情報)を記憶する記憶部であって、例えば、問い合わせの対応履歴や、修理のマニュアルに関する情報、あるいは、電子メールによってユーザ等から取得された意見や苦情等の、企業や取扱い製品やサービスに関する情報を、テキストデータとして記憶する記憶装置であるデータソース701を備える。
また、データベースファイルサーバ700は、例えば、企業においてデータウェアハウスとして利用される蓄積装置が利用可能である。
The
The
次に、図2を用いて、クライアント端末装置100について詳細に説明する。図2は、本実施の形態に係るクライアント端末装置100の一例を示すブロック図である。
図2に示す通り、クライアント端末装置100は、ブラウザ(表示制御部)101と、表示部102と、入力部103と、通信部104とを備える。
表示部102、例えば、液晶表示装置等であって、操作画面や検索結果画面等の表示データを表示する。
入力部103は、例えば、キーボードやマウスからなる入力インターフェースであって、ユーザからの操作指示や検索キー文の入力を受け付ける。
通信部104は、入力部102を介して、ユーザから検索サービスの種類が指定された場合、指定された検索サービスによる検索の実行を要求するリクエスト制御信号を、WEBサーバ300を介して日本語解析サーバ500に送信する。また、通信部104は、入力部102を介してユーザから入力された検索キー文を、ネットワークを介してWEBサーバ300に送信する。
Next, the
As illustrated in FIG. 2, the
The
The
When the type of search service is specified by the user via the
ブラウザ101は、例えば、WEBサーバ300から受信したウェブページを表示部102に表示させるためのプログラム(例えば、javascript(登録商標)等)をWEBサーバ300から受信して、このプログラムを実行する表示制御部である。また、ブラウザ101は、このプログラムとして機能し、表示部102によって表示される表示データを生成し、表示部102に出力する。
ブラウザ101は、記憶部111と、データ処理部112と、表示処理部113とを含み、各構成について以下説明する。
The
The
記憶部111は、データ処理部112や表示処理部113によって処理される際のプログラムや所定の設定値等を記憶する。また、記憶部111は、日本語解析サーバ500によって得られた検索結果(例えば、マッチした文章、マッチした単文、マッチした単語、これらのマッチングに用いられたマッチング条件、あるいはマッチ位置情報を含むマッチ情報等)や、絞り込み検索を実行する際の検索ルール情報(例えば、入力部103を介して指定されたマッチした単語を検索キーとして、検索結果から、絞り込み対象を検索するためのプログラムや設定値等)を記憶する。
The storage unit 111 stores a program and predetermined set values that are processed by the
データ処理部112は、WEBサーバ300から受信されるブラウザ101上のプログラムとして動作し、WEBサーバ300から受信される表示データを表示部102の画面に表示するための表示データに変換し、表示処理部113を制御して表示部102に表示データを表示させる。また、データ処理部112は、記憶部111に記憶されている検索結果に基づき、マッチング条件を満たす単語に対して強調表示を表すタグ情報を付与した結果表示データを作成する。
表示処理部113は、データ処理112によって制御され、データ処理部112が変換した表示データを表示部102に表示させる。
The
The
次に、図3を用いて、WEBサーバ300について詳細に説明する。図3は、本実施の形態に係るWEBサーバ300の一例を示すブロック図である。
図3に示す通り、WEBサーバ300は、通信部301と、リクエスト処理部302と、データ変換部303と、記憶部304とを備える。
通信部301は、例えば、ネットワークを介してクライアント端末装置100および日本語解析サーバ500と通信する。
リクエスト処理部302は、通信部301を介してクライアント端末装置100から受信したリクエスト制御信号に基づき、クライアント端末装置100の表示部102によって表示される表示データのウェブページのデータを作成するようデータ変換部303を制御する。また、リクエスト処理部302は、クライアント端末装置100からリクエスト制御信号を受信して、クライアント端末装置100によって実行されるコードファイルや、表示データの表示に関する設定データを作成し、クライアント端末装置100に送信する。
Next, the
As illustrated in FIG. 3, the
The
The
データ変換部303は、リクエスト処理部302によって制御され、日本語解析サーバ500から受信した検索結果等に基づき、クライアント端末装置100に対して送信するウェブページのデータを作成する。
記憶部304は、リクエスト処理部302やデータ変換部303によって利用される設定データ等や、日本語解析サーバ500の検索によって得られた検索結果を一時的に記憶する。
The
The
なお、WEBサーバ300は、例えば、社内LAN(Local area network)に接続され、コールセンターのオペレーターによってなされる、ユーザからの問い合わせの対応に適した情報を提供するWEBサーバであってよく、社内における知識共有用のデータを提供するためのWEBサーバであってもよい。このように、WEBサーバ300は、情報検索システム1の検索の目的に応じて、複数あってもよい。
The
次に、図4を用いて、日本語解析サーバ500について詳細に説明する。図4は、本実施の形態に係る日本語解析サーバ500の一例を示すブロック図である。
図4に示す通り、検索処理部501は、異なる検索サービスα、βをクライアント端末装置100に提供するためのプログラムを実行する機能を供え、ユーザによって指定された検索サービスαによる検索を実行するための制御信号をWEBサーバ300から受信した場合、検索サービスαのプログラムを起動させ、検索サービスαと関連付けられているマッチプロファイルをマッチプロファイル記憶部502から読み出す。また、検索処理部501は、マッチ辞書記憶部503に記憶されているマッチ辞書データを読み出す。さらに、検索処理部501は、読み出したマッチプロファイルおよびマッチ辞書データを、メモリ領域506に展開して辞書オブジェクトを作成する。
Next, the Japanese
As shown in FIG. 4, the
また、検索処理部501は、WEBサーバ300を介してクライアント端末装置100から検索キー文を受信すると、受信した検索キー文を文書解析部505に出力し、検索結果を書き込むための検索結果オブジェクト(空の状態)をメモリ領域506に生成する。これにより、検索結果を記録するためのメモリ領域を確保することができる。
さらに、検索処理部501は、マッチプロファイル記憶部502から読み出したマッチプロファイルにおいて予め決められているマッチモードに従って、解析された検索キー文と、メモリ領域506の辞書オブジェクトに展開されているマッチ辞書データとの照合(以下、マッチングという)を行い、マッチモードの条件を満たす文章等の検索を行う(以下、マッチング処理という)。
When the
Further, the
また、検索処理部501は、マッチプロファイルにおいて予め決められているスコアモードに従って、マッチングによって得られた文章(以下、マッチした文章という)における、検索キー文とのマッチングの程度を評価するスコアを算出する(以下、スコアリング処理という)。なお、詳細は後述するが、検索処理部501は、例えば、マッチングによって得られた単文(以下、マッチした単文という)に含まれる単語のスコアを算出し、この単語のスコアの和を算出することによって、マッチした文章のスコアやマッチした単文のスコアを算出する。
さらに、検索処理部501は、マッチングによって得られた文章等の文章ID等と、当該文章等のスコアを関連付けて、メモリ領域506の検索結果オブジェクトに検索結果として格納する。また、検索処理部501は、この検索結果オブジェクトの検索結果を、WEBサーバ300を介してクライアント端末装置100に送信する。
In addition, the
Further, the
メモリ領域506は、一時的に情報を記憶する記憶領域であって、例えば、検索処理部501によって作成される辞書オブジェクトや検索結果オブジェクトが作成される領域である。
The
マッチプロファイル記憶部502には、例えば、各検索サービスα、β・・・に応じたマッチプロファイルA、B・・・が格納されている。ここで、マッチプロファイルとは、予め決定されているマッチモードを定義するマッチモード情報と、当該マッチモードで抽出された結果に適用されるスコアの算出手法を定義するスコアモード情報とを含む。例えば、マッチプロファイルAのマッチモード定義においては、検索サービスαとマッチプロファイルAとが予め関連づけられている。よって、ユーザによって検索サービスが指定されると、この検索サービスに応じて予め決定されているマッチプロファイルと、このマッチプロファイルにおいて予め決められているマッチモードやスコアモードが、決定される。
なお、本発明はこれに限られず、クライアント端末装置100が、これら検索サービスの種類、マッチプロファイルの種類、マッチモードの種類の組み合わせを表す情報をリクエスト制御信号とともにWEBサーバ300を介して日本語解析サーバ500に送信する場合、ユーザによって、これらの組み合わせが決定される構成であってもよい。
The match
The present invention is not limited to this, and the
ここで、マッチプロファイルについて、図5を用いて詳細に説明する。図5は、本実施の形態に係るマッチプロファイル記憶部502に記憶されているマッチプロファイルの一例を示す概略図である。
図5に示す通り、マッチプロファイルAは、マッチモード情報として、マッチモード定義PA1を含み、スコアモード情報として、相対出現頻度フラグPA2と、相対出現頻度重視係数PA3と、文章出現位置PA4と、検索キー出現位置PA5と、述語属性マッチ係数PA6と、係りうけマッチ係数PA7と、品詞カテゴリPA8と、接続詞評価PA9と、同義語マッチ係数PA10と、を含む。
Here, the match profile will be described in detail with reference to FIG. FIG. 5 is a schematic diagram illustrating an example of a match profile stored in the match
As shown in FIG. 5, the match profile A includes a match mode definition PA1 as match mode information, a relative appearance frequency flag PA2, a relative appearance frequency emphasis coefficient PA3, a sentence appearance position PA4 as search mode information, and a search. It includes a key appearance position PA5, a predicate attribute match coefficient PA6, a dependency match coefficient PA7, a part of speech category PA8, a conjunction evaluation PA9, and a synonym match coefficient PA10.
マッチモード定義PA1とは、検索サービスα、β・・・に応じて予め決定されているマッチモードの組み合わせに関する情報である。ここで、マッチモードとは、検索キー文とマッチ辞書データのマッチングを行う際の手法を表すものであって、例えば、図9〜11において後述するような、単語要素マッチング、係りうけマッチング、属性マッチングがあり、その組み合わせとして定義される。 The match mode definition PA1 is information relating to a combination of match modes determined in advance according to the search services α, β,. Here, the match mode represents a technique for performing matching between the search key sentence and the match dictionary data. For example, as described later with reference to FIGS. There is a match and it is defined as the combination.
スコアモード情報は、マッチモードに応じて得られた結果に対する、スコア条件や重みの付け方に関する情報を含み、マッチした文章や単文のスコアを算出する際に参照される情報である。
スコアモード情報は、相対出現頻度フラグPA2、相対出現頻度重視係数PA3、文章出現位置PA4、および検索キー出現位置PA5、述語属性マッチ係数PA6、係りうけマッチ係数PA7、品詞カテゴリPA8、接続詞評価PA9、および同義語マッチ係数PA10を含み、いずれのマッチモードにおいても利用可能なスコアモードに関する情報である。ここで、マッチモード情報とスコアモード情報は、マッチモード定義PA1において予め決められているマッチングモードに関わらず、任意に組み合わせが可能である。
The score mode information is information that is referred to when calculating the score of a matched sentence or a single sentence, including information on a score condition and a weighting method for a result obtained according to the match mode.
The score mode information includes a relative appearance frequency flag PA2, a relative appearance frequency importance coefficient PA3, a sentence appearance position PA4, a search key appearance position PA5, a predicate attribute match coefficient PA6, a dependency match coefficient PA7, a part of speech category PA8, a conjunction evaluation PA9, And a score mode that can be used in any match mode, including the synonym match coefficient PA10. Here, the match mode information and the score mode information can be arbitrarily combined regardless of the matching mode predetermined in the match mode definition PA1.
また、スコアモード情報は、マッチした単語に対して付与されるスコアを算出するか否かを表す情報であって、算出することを表す情報が設定されている場合、それぞれにおいて付与される係数や得点が設定値として決められている。つまり、検索処理部501は、マッチングモード情報を利用して、マッチした文章や単文に対して、スコアモード情報を利用して、さらにマッチングした文章や単文と、検索キー文とのマッチングの度合いを評価するためのスコアを算出することができる。ここで、スコアは、マッチングした文章や単文と、検索キー文とのマッチングの度合いを示すものであって、例えば、マッチした文章等と検索キー文との関係において、文章構成や係りうけ関係が一致している、あるいは、述語属性が一致している等によって、文としての意味合いがどのくらい類似しているかを評価するための点数である。
Further, the score mode information is information indicating whether or not to calculate a score to be given to a matched word, and when information representing the calculation is set, a coefficient given in each The score is determined as a set value. In other words, the
相対出現頻度フラグPA2は、相対出現頻度(tf×idf)に基づく重み付けの利用を行うか否かを表す。フラグがオンとなっている状態では、この重み付けを行うことを表し、フラグがオフとなっている状態では行わないことを表す。
ここで、相対出現頻度(tf×idf)は、キーワード(重要語)抽出の手がかりとして一般的に用いられる相対値であって、以下の各系数(tf,idf)係数を乗じたものである。
なお、tf( term frequency )は、ある文章における、特定の単語の相対出現頻度であって、idf( inversed document frequency )は、特定の単語が含まれる文章数の逆数である。つまり、どの文章にも含まれるようなありふれた単語ほど、相対出現頻度は小さくなる。したがって、ある文章は、それに含まれ相対出現頻度(tf×idf)の高い単語によって特徴づけられる。
The relative appearance frequency flag PA2 indicates whether to use weighting based on the relative appearance frequency (tf × idf). When the flag is on, this weighting is performed, and when the flag is off, it is not performed.
Here, the relative appearance frequency (tf × idf) is a relative value that is generally used as a key for keyword (important word) extraction, and is multiplied by the following coefficient (tf, idf).
Note that tf (term frequency) is the relative frequency of occurrence of a specific word in a sentence, and idf (inversed document frequency) is the reciprocal of the number of sentences containing the specific word. In other words, the more common words that are included in any sentence, the lower the relative appearance frequency. Therefore, a certain sentence is characterized by a word contained in it and having a high relative appearance frequency (tf × idf).
相対出現頻度重視係数PA3は、相対出現頻度フラグPA2がオンの状態で行われる、tf値のスコアに対する重み付けの係数である。 The relative appearance frequency importance coefficient PA3 is a weighting coefficient for the score of the tf value, which is performed in a state where the relative appearance frequency flag PA2 is on.
文章出現位置PA4は、文章や単文における文の出現位置に応じた重み付けを行うか否かを表す情報である。例えば、文章出現位置PA4が出現位置に応じた重み付けを行うことを表している状態で、マッチ辞書記憶部503に記憶されている文章の先頭に近い単語から傾斜的な係数を付与することを表している。ここでは、先頭に近い位置に出現する単語に対しては、重み付けを重くし、文末に近い位置に出現する単語ほど重み付けが軽くなるような係数が設定されている。なお、この係数は、任意に設定可能である。
The sentence appearance position PA4 is information indicating whether or not weighting is performed according to the sentence appearance position in a sentence or a single sentence. For example, in a state where the sentence appearance position PA4 represents weighting according to the appearance position, this indicates that a gradient coefficient is given from a word close to the head of the sentence stored in the match
検索キー出現位置PA5は、検索キー文における文の出現位置に応じた重み付けを行うか否かを表す情報である。例えば、検索キー出現位置PA5は、出現位置に応じた重み付けを行うことを表している状態で、検索キー文とマッチした単語が、検索キー文において出現する位置に応じて、先頭に近い位置に出現した単語等の文字列から傾斜的な係数を付与することを表している。ここでは、検索キー文の先頭に近い位置に出現する単語に対しては、重み付けを重くし、検索キー文の文末に近い位置に出現する単語ほど重み付けが軽くなるような係数が設定されている。なお、この係数は、任意に設定可能である。 The search key appearance position PA5 is information indicating whether or not weighting is performed according to the sentence appearance position in the search key sentence. For example, the search key appearance position PA5 indicates that weighting according to the appearance position is performed, and a word that matches the search key sentence is positioned closer to the head depending on the position at which the search key sentence appears. This indicates that a gradient coefficient is given from a character string such as an appearing word. Here, for words that appear near the beginning of the search key sentence, a weight is set to be heavy, and a coefficient is set so that the weight that appears closer to the end of the search key sentence is lighter. . This coefficient can be set arbitrarily.
述語属性マッチ係数PA6は、述語属性一致の際のノードのスコア係数を表す情報である。例えば、マッチした単語や係りうけ関係にある単語に対して、これらマッチした単語と検索キー文の対応する単語との述語属性がさらに一致した場合に、どれだけ重み付けを加算するかが規定されている。なお、単純に名詞など属性が無い場合は、重み付けの加算は行わず、否定などの属性が付与され、一致した場合の重み付けの加算は、乗数としてのスコア計数を任意に設定可能である。なお、単純な名詞文節などのように属性が無い場合は、重み付けの加算は行わない。属性が付与され一致した場合の重み付けの加算は、乗数としてのスコア計数を任意に設定可能である。 The predicate attribute match coefficient PA6 is information representing the score coefficient of the node when the predicate attribute matches. For example, it is specified how much weight is added to a matched word or a related word when the predicate attribute of the matched word and the corresponding word in the search key statement further matches. Yes. If there is simply no attribute such as a noun, weighting addition is not performed, and an attribute such as negation is given, and weighting addition in the case of matching can arbitrarily set a score count as a multiplier. If there is no attribute such as a simple noun phrase, weighting is not added. In addition of weights when attributes are assigned and they match, score counting as a multiplier can be arbitrarily set.
係りうけマッチ係数PA7は、係りうけ単位で一致した場合のスコア係数を表す情報である。例えば、マッチした単語同士が係りうけ関係にある単語(以下、係りうけペアという)に対して重み付けを行うか否かが規定されている。なお、スコア計数は、乗数として任意に設定可能である。 The pending match coefficient PA7 is information representing a score coefficient when matching is performed in the pending units. For example, it is defined whether or not weighting is performed on words in which matched words are related to each other (hereinafter referred to as “related pairs”). The score count can be arbitrarily set as a multiplier.
品詞カテゴリPA8は、品詞カテゴリごとの重み付けを表す情報であって、例えば、ユーザー単語 > 固有名詞 > 一般名詞 > 形容詞・形容動調 > 動詞といった優先順位に応じて、品詞ごとに傾斜的な係数を与えるか否かを表している。なお、品詞ごとに傾斜的な係数を任意に設定可能である。 The part-of-speech category PA8 is information representing weighting for each part-of-speech category. For example, a slope coefficient is given to each part-of-speech according to the order of priority such as user word> proprietary noun> general noun> adjective / adjective tone> verb. Indicates whether or not to give. Note that an inclined coefficient can be arbitrarily set for each part of speech.
接続詞評価PA9は、検索キー文とマッチした文章等において、特定の接続詞が含まれている場合、当該マッチした文全体を重視(または軽視)するか否かを表す情報である。例えば、接続詞評価PA9は、特定の接続詞がある場合に文全体を重視することを表す状態で、特定の接続詞が含まれているマッチした文章の各単語に乗じる係数や、特定の接続詞が含まれているマッチした文章のうちマッチした単語にのみ乗じられる係数等が規定されている。 The conjunction evaluation PA9 is information indicating whether or not the entire matched sentence is emphasized (or neglected) when a specific conjunction is included in the sentence matched with the search key sentence. For example, the conjunction evaluation PA9 is a state that emphasizes the whole sentence when there is a specific conjunction, and includes a coefficient to be multiplied to each word of the matched sentence including the specific conjunction, or a specific conjunction. Coefficients to be multiplied only for the matched words among the matched sentences are defined.
同義語マッチ係数PA10は、後述する文書解析部505の類義語処理部による文字列置換が行われた文字列のスコアを何倍にするかを表す情報である。また、同義語マッチ係数PA10は、単語そのものが一致した場合に比較して、同義語や類義語との一致のスコア順位を落とすために用いる情報である。
The synonym match coefficient PA10 is information indicating how many times the score of the character string that has been subjected to character string replacement by the synonym processing unit of the
マッチ辞書記憶部503は、マッチ辞書データを記憶し、このマッチ辞書データは、例えば、シンボルIDに置き換えられた単語情報との対応関係を表すシンボルマップMD1と、各文章に関することを表す文章情報MD2と、この文章に含まれる単文情報MD3とを含む。
ここで、マッチ辞書データについて、図6を用いて詳細に説明する。図6は、本実施の形態に係るマッチ辞書記憶部503に記憶されているマッチ辞書データの一例を示す概略図である。
The match
Here, the match dictionary data will be described in detail with reference to FIG. FIG. 6 is a schematic diagram showing an example of match dictionary data stored in the match
シンボルマップMD1は、シンボルIDによって識別される単語情報のテキストデータと、単語情報を識別するためのシンボルIDとを対応付ける情報である。これにより、マッチ辞書記憶部503は、文章情報MD2および単文情報MD3において、単語情報をテキストデータで記憶することなく、シンボルマップMD1において対応付けられているシンボルIDに置き換えて格納することができる。
The symbol map MD1 is information that associates text data of word information identified by a symbol ID with a symbol ID for identifying the word information. As a result, the match
文章情報MD2は、解析された文章の構造木(詳細については後述する)をマッチ辞書記憶部503に登録するために必要な登録情報であって、文章ID21と、この文章ID21によって識別される文章の文章テキストデータ22と、当該文章が検索対象情報としてデータベースファイルサーバ700に格納された日時やデータソース701での格納場所を表すアドレス等の情報を含む文章付加情報23と、用語マップ24とを含む。ここで、用語マップ24は、文章内に含まれる単語情報の出現回数を表す情報であって、単語情報毎の出現回数とシンボルIDとが対応付けられている。
The sentence information MD2 is registration information necessary for registering an analyzed sentence structure tree (details will be described later) in the match
一方、単文情報MD3は、単文に含まれる文節毎に、構造木(図8参照にて、詳細は後述する)における部分木ノードの情報を表すルール(ルール情報)32を含み、各単文を識別するための単文ID31が付与されている。
単文情報MD3に含まれるルール32は、例えば、語情報321、述語属性322、親ルールID323、重み値324、接続詞種別325、カテゴリ326、子ノード有フラグ327等を含む。
On the other hand, the single sentence information MD3 includes a rule (rule information) 32 representing information of a subtree node in a structure tree (see FIG. 8 for details) for each clause included in the single sentence, and identifies each single sentence. A
The
語情報321は、例えば、シンボルIDや、単文内における単語情報の位置を表す位置情報等を含む。なお、語情報321は、単文内に含まれる単語の数に応じた数の語情報1、語情報2、・・・、語情報nを含み、例えば、単語情報のシンボルID、単文における単語の位置情報(開始位置と終了位置)を含む。
述語情報322は、例えば、語IDや、動詞形容詞等の句の属性、および句の意味(否定、否定の傾向、願望、肯定・・・等)を表す属性シンボルID等を含む。
The
The
親ルールID323は、親子の係りうけ関係にある親の部分木ノードの文節を表す情報である。
重み値324は、例えば、文章内での主語や述語に応じた重みを付与する係数等である。また、重み値324は、後述するスコアリングにおいて、当該ルール(ノード)がマッチした際に基準となる点数を規定する係数等である。通常は辞書全体で任意の一つの値に設定されるが、辞書の作成時に、文章内での主語や述語に応じた重みを付与する事ができる。
接続詞種別325は、ルール32に対応する文節(句)が、「したがって、だから、すなわち、・・・」等の接続詞である場合、その接続詞を表す情報である。
カテゴリ326は、動詞、名詞、副詞、接続詞・・・等の品詞の種類を表す情報である。
子ノード有フラグ327は、親子の係りうけ関係にある子の部分木ノードの文節の有無を表す情報であって、フラグがオンされている状態で、当該部分木ノードが親の部分木ノードであることを表す情報である。
The
The
The
The
The child
次に、図7を用いて、検索処理部501、辞書作成部504、および文書解析部505について詳細に説明する。図7は、本実施の形態に係る日本語解析サーバ500の一例を示すブロック図である。
辞書作成部504は、データベースファイルサーバ700から、検索対象となる文章(検索対象情報)を読み出し、検索対象情報に含まれる文章を、例えば句点ごとに区切って単文の単位に変換し、文書解析部505に出力する。例えば、検索対象情報に含まれる文章Aのテキストデータが「PC内にある画像を送信したところ受信できませんでした。また、携帯内にある画像を送信したところ受信できました。」である場合、句点「。」で区切って2つの単文に分割し、単文A1「PC内にある画像を送信したところ受信できませんでした。」と、単文A2「また、携帯内にある画像を送信したところ受信できました。」を文書解析部505に出力する。
また、辞書作成部504は、文書解析部505によって解析された結果を、文書解析部505から受け取った場合、マッチ辞書記憶部503に格納する。
なお、辞書作成部504は、データベースファイルサーバ700から読み出した検索対象情報を、適当な長さに区切るものであればよく、例えば、ピリオド、箇条書きの一文、スペースや改行によって一文と判断される一文で、区切るものであってもよい。
Next, the
The
When the
Note that the
文書解析部505は、辞書作成部504によってマッチ辞書データが作成される際に、例えば、単文単位に区切られた検索対象情報を、辞書作成部504から受け取り、文書解析を行って、解析結果を辞書作成部504に出力する。
また、文書解析部505は、クライアント端末装置100から特定の検索サービスによる検索を実行するようなリクエスト制御信号を受信した場合、検索処理部501から受け取った検索キー文に対して文書解析を行い、解析結果を検索処理部501に出力する。以下、文書解析部505について詳細に説明する。
When the match creation data is created by the
When the
文書解析部505は、辞書部550と、解析部551とを備える。
辞書部550は、システム辞書5501と、ユーザ辞書5502と、類義語辞書5503とを備える。一方、解析部551は、形態素解析部5511と、構文解析部5512と、類義語処理部5513とを備える。
The
The
システム辞書5501は、例えば、形態素として意味を持つ最小単位の単語と、この単語の意味や品詞、属性情報等が対応付けられている辞書データである。
ユーザ辞書5502は、例えば、日本語解析サーバ500を利用する管理者等によって、システム辞書5501に追加される辞書データである。
類義語辞書は、複数の類義語や同義語を置き換えるため、単語とその類義語等とを対応付けている辞書データであって、例えば、マッチ辞書記憶部503のマッチ辞書データの単語情報と、その類義語が対応付けられている。
The system dictionary 5501 is, for example, dictionary data in which a minimum unit word having meaning as a morpheme is associated with the meaning, part of speech, attribute information, and the like of the word.
The
The synonym dictionary is dictionary data in which a word and its synonym are associated with each other in order to replace a plurality of synonyms and synonyms. For example, word information of match dictionary data in the match
形態素解析部5511は、例えば、辞書作成部504によって、単文ごとに区切られた検索対象情報を受け取り、検索対象となる文章を複数の形態素(単語情報)に分解する。例えば、形態素解析部5511は、文章Aが入力されると、文章Aに含まれる単文A1を、複数の形態素(「PC」「内」「に」「ある」「画像」「を」「送信」「した」「ところ」「受信」「できませんでした」)に分解する。
このようにして、形態素解析部5511は、マッチ辞書データ作成の際に、検索対象情報を形態素に分解することができるが、これに限られず、検索キー文を入力して検索を行う際には、検索処理部501によって単文ごとに区切られた検索キー文を受け取り、形態素に分解する。
The morpheme analysis unit 5511 receives, for example, the search target information divided for each single sentence by the
In this way, the morpheme analysis unit 5511 can decompose the search target information into morphemes when creating match dictionary data, but is not limited to this, and when performing a search by inputting a search key sentence. The
また、形態素解析部5511は、システム辞書5501やユーザ辞書5502を参照して、分解した形態素の品詞を検索し、得られた品詞情報に基づき、文章中の係りうけ関係や形態素の意味に応じた文節を作成する。例えば、構文解析部5512は、単文A1から分解された形態素に基づき、文節A101「PC内に」と、文節A102「ある」と、文節A103「画像を」と、文節A104「送信したところ」と、文節A105「受信できませんでした」とを作成する。なお、ここで、文節とは、少なくとも1つの単語を含む文字列の単位である。また、単文とは、少なくとも1つの文節を含み1つの文からなる文字列の単位であって、例えば、句点等で区切られる。さらに、文章とは、複数の単文を含む文の単位である。なお、文は、単文と文章の両方を含むものとする。
Further, the morpheme analysis unit 5511 searches the part of speech of the decomposed morpheme with reference to the system dictionary 5501 and the
さらに、形態素解析部5511は、システム辞書5501およびユーザ辞書5502に記憶されている辞書データを参照して、それぞれ品詞のカテゴリ(例えば、動詞、名詞、副詞、接続詞・・・等)や、接続詞の種類(例えば、したがって、だから、といった・・・等)、動詞や形容詞等の句の意味を表す属性(例えば、否定、否定の傾向、願望、肯定・・・等)を検索し、検索によって得られた情報を形態素や文節に付与する。
例えば、形態素解析部5511は、文節A105「受信できません」を解析して、品詞は“名詞(サ変接続)”であって、句の意味は“否定”であることを解析結果として得て、この解析結果を文節A105に付与する。
Further, the morpheme analysis unit 5511 refers to the dictionary data stored in the system dictionary 5501 and the
For example, the morpheme analysis unit 5511 analyzes the phrase A105 “cannot be received”, obtains as an analysis result that the part of speech is “noun (sa modification connection)” and the meaning of the phrase is “negative”. The analysis result is given to the phrase A105.
構文解析部5512は、形態素解析部5511によって解析された情報に基づき、文章を構成する文節の品詞や意味、属性情報、文章内での位置、並び等を評価し、文章における文節どうしの係りうけ関係を解析し、解析結果を類義語処理部5513に出力する。
Based on the information analyzed by the morphological analysis unit 5511, the
さらに、構文解析部5512は、検索対象情報を解析した際に、各文章を識別するための文章IDを付与し、この文章をマッチ辞書記憶部503に登録(記憶)する際に必要な登録情報を生成する。また、構文解析部5512は、単語情報や文節等の解析結果を利用して、文節同士の係りうけ関係に基づき、図8に示すような構造木を作成し、部分木ノード毎のルールを表す情報を生成して、類義語処理部5513に出力する。
なお、ルールとは、図8に示す構造木を構成する部分木ノード毎に対応付けられている情報であって、図6に示したように、語情報321、述語属性322、親ルールID323、重み値324、接続詞種別325、カテゴリ326、子ノード有フラグ327等を含む。
Furthermore, the
The rule is information associated with each subtree node constituting the structural tree shown in FIG. 8, and as shown in FIG. 6,
ここで、図8を用いて構文解析部5512によって作成される構造木について説明する。図8は、構文解析部5512によって作成される構造木の一例を示す概略図である。
図8に示す通り、部分木ノードに対応するルールは、形態素解析部5511によって区分された文節毎に作成されている。また、部分木ノードによって構成される構造木は、文章の前後関係に応じた係りうけ関係によって作成されている。
Here, a structural tree created by the
As shown in FIG. 8, the rule corresponding to the subtree node is created for each phrase segmented by the morphological analysis unit 5511. In addition, the structure tree constituted by the subtree nodes is created by the relationship based on the context of the sentence.
類義語処理部5513は、類義語辞書5503を参照して、分解された形態素や文節に対して、統一すべき類義語があるか否かを検索し、該当する類義語があれば、類義語辞書5503から検索によって得られた類義語への置換えを行う。
The
ここで、辞書作成部504が、データベースファイルサーバ700から検索対象情報を読み出して、単文に区切られた検索対象情報を文書解析部505に出力した場合、文書解析部505は、上述のような文書解析を行い、解析結果を辞書作成部504に出力する。
辞書作成部504は、文書解析部505から解析結果を受け取り、単文を構成する文節のルールとしての情報、例えば、単語情報、シンボルID、各単語語情報の述語属性、ルール(部分木ノード)間のつながりを表す親ルールIDや子ノード有フラグ、重み値、接続詞種別、カテゴリ、等のマッチ辞書記憶部503の登録に必要な情報を得る。
Here, when the
The
また、辞書作成部504は、マッチ辞書記憶部503から読み出したシンボルマップMD1を確認して、マッチ辞書記憶部503内で統一的に利用されている単語情報を、シンボルIDに置き換える。さらに辞書作成部504は、文章IDや、文章テキスト、文章付加情報や用語マップ等を含む文章情報MD2と、単語ID31とルール32とを含む単語情報MD3とを作成し、マッチ辞書登録用のデータを作成する。また、辞書作成部504は、このマッチ辞書登録用のデータを、マッチ辞書記憶部503のマッチ辞書データに追加する。
なお、辞書作成部504は、文書解析部505から受け取った解析結果の中に、シンボルマップMD1に対応するシンボルIDがない単語情報が存在した場合、当該単語情報に対して、新たなシンボルIDを付与して、当該単語情報と新たなシンボルIDとの対応関係をシンボルマップMD1に追加する。
In addition, the
Note that the
次に、図9〜11を用いて、検索処理部501によって実行されるマッチモードについて詳細に説明する。図9は、単語要素マッチングについて説明するための概略図である。図10は、係りうけマッチングについて説明するための概略図である。図11は、属性マッチングについて説明するための概略図である。
Next, the match mode executed by the
図9(a)〜(c)に示す通り、単語要素マッチングは、積集合タイプと、全集合タイプと、部分集合タイプの3タイプがある。単語要素マッチングでは、検索処理部501が、マッチ辞書記憶部503に記憶されているマッチ辞書データのルール32と、検索キー文においてルール32と対応する文字列(例えば、文節)との照合を行う。なお、検索処理部501は、単語要素マッチングがマッチプロファイルのマッチモード定義PA1において、積集合タイプと、全集合タイプと、部分集合タイプのうち、いずれか1つのタイプを実行する。
As shown in FIGS. 9A to 9C, there are three types of word element matching: product set type, full set type, and subset type. In word element matching, the
ここで、積集合タイプとは、マッチ辞書記憶部503のマッチ辞書データのルールの文字列(部分木ノードに対応する文節)の少なくとも一部と、検索キー文に含まれる文字列(部分木ノードに対応する文節)の少なくとも一部とが一致する場合、この一致する文字列をマッチモードの条件を満たす単語として得るマッチモードである。なお、一部でも一致する単語がなかった場合、マッチモードの条件を満たす単文が得られなかったという結果となる。
Here, the product set type means at least a part of a rule character string (a clause corresponding to a subtree node) of the match dictionary data in the match
例えば、図9(a)に示す通り、マッチ辞書記憶部503のマッチ辞書データのルールに対応する文節「サッカー 観戦」と、検索キー文に含まれる文節「サッカー 少年」、「観戦 ツアー」および「戦」とがそれぞれ照合された場合、検索キー文に含まれる文節「サッカー 少年」は、その一部である単語「サッカー」において、ルールに対応する文節「サッカー 観戦」の一部と一致している。この場合、ルールに対応する文節「サッカー 観戦」は、マッチモードの条件を満たす。
また、検索キー文に含まれる文節「観戦 ツアー」は、その一部である単語「観戦」が、ルールに対応する文節「サッカー 観戦」の一部と一致しており、マッチモードの条件を満たす。
このように、マッチモードの条件を満たす場合、マッチング処理の結果として、ルールに対応する文節「サッカー 観戦」が得られる。また、検索処理部501は、このマッチモードの条件を満たす単語をマッチした単語として検出する。
For example, as shown in FIG. 9A, the phrase “watching soccer” corresponding to the rule of the match dictionary data in the match
In addition, the phrase “watching tour” included in the search key sentence has the same word “watching game” as the part of the phrase “watching soccer game” corresponding to the rule, and satisfies the condition of match mode. .
As described above, when the condition of the match mode is satisfied, the phrase “watching soccer” corresponding to the rule is obtained as a result of the matching process. In addition, the
一方、検索キー文に含まれる文節「戦」は、ルールに対応する文節「サッカー 観戦」に含まれる単語の単位で、一致する部分がないため、マッチモードの条件を満たさない。このため、マッチング処理の結果としては、マッチモードの条件を満たす単文が得られなかったという結果となる。なお、単語「戦」は、文節「サッカー 観戦」の単語「観戦」の一部に含まれる文字であるが、単語単位で比較した場合、「戦」と「観戦」とは異なる文字列(単語)となるため、ここでは、一致しないと判断される。 On the other hand, the phrase “battle” included in the search key sentence is a unit of words included in the phrase “watching soccer game” corresponding to the rule and does not satisfy the match mode condition because there is no matching part. For this reason, as a result of the matching process, a simple sentence that satisfies the condition of the match mode cannot be obtained. Note that the word “war” is a character included in a part of the word “watching” in the phrase “watching soccer”, but when compared word by word, “war” and “watching” are different character strings (word Therefore, it is determined that they do not match.
次に、全集合タイプについて図9(b)を用いて説明する。
全集合タイプは、マッチ辞書記憶部503のマッチ辞書データのルールの文字列(部分木ノードに対応する文節)と、検索キー文に含まれる文字列(部分木ノードに対応する文節)の全てが一致する場合、一致した文字列がマッチモードの条件を満たす単語(マッチした単語)として得られるマッチモードである。この場合、上述の積集合と異なり、一部でも(単語1つでも)一致する文節があった場合であって、文節の全ての文字列が一致しなければ、マッチモードの条件を満たす単文が得られなかったという結果となる。
例えば、図9(b)に示す通り、マッチ辞書記憶部503のマッチ辞書データのルールに対応する文節「サッカー 観戦」と、検索キー文に含まれる文節「サッカー 観戦」「観戦」とが照合された場合、文節「サッカー 観戦」は、ルールに対応する文節と、検索キー文の両方ともが完全に一致しており、マッチモードの条件を満たすため、マッチング処理の結果として、文節「サッカー 観戦」(マッチした文節)が得られる。
一方、検索キー文の文節「観戦」は、ルールに対応する文節「サッカー 観戦」の一部とは一致するものの、全ての文字列が一致していなため、マッチモードの条件を満たさず、マッチング処理の結果としては、マッチモードの条件を満たす単文が得られなかったという結果となる。
Next, all set types will be described with reference to FIG.
The entire set type includes all of the character string (phrase corresponding to the subtree node) of the match dictionary data in the match
For example, as shown in FIG. 9B, the phrases “watching soccer” corresponding to the rule of the match dictionary data in the match
On the other hand, the phrase “watching” of the search key sentence matches the part of the phrase “watching soccer” corresponding to the rule, but all the character strings do not match. As a result of the processing, a simple sentence satisfying the match mode condition cannot be obtained.
次に、部分集合タイプについて図9(c)を用いて説明する。
部分集合タイプは、マッチ辞書記憶部503のマッチ辞書データのルールの文字列(部分木ノードに対応する文節)が、検索キー文に含まれる文字列(部分木ノードに対応する文節)の一部と完全に一致する場合、一致している文字列をマッチモードの条件を満たす単語として得るマッチモードである。この場合、上述の積集合タイプと異なり、少なくともルールに対応する文節の全てを含んでいれば、マッチモードの条件を満たし、一致する単語や文節をマッチした単語あるいはマッチした文節して得る。一方、検索キー文に含まれる文節が、ルールに対応する文節の全てを含むものでなければ、マッチモードの条件を満たす語情報が得られなかったという結果となる。
Next, the subset type will be described with reference to FIG.
The subset type is a part of a character string (a clause corresponding to a subtree node) in which a character string (a clause corresponding to the subtree node) of the rule of the match dictionary data in the match
例えば、図9(c)に示す通り、マッチ辞書記憶部503のマッチ辞書データのルールに対応する文節「サッカー 観戦」と、検索キー文に含まれる文節「サッカー 観戦 ツアー」「観戦 ツアー」とが照合された場合、ルールに対応する文節「サッカー 観戦」は、検索キー文に含まれる文節「サッカー 観戦 ツアー」の一部であって、その文節を構成する全ての単語が、検索キー文に含まれる文節に含まれる単語として一致しているため、マッチモードの条件を満たす。このように、マッチモードの条件を満たす場合、マッチング処理の結果として、ルールに対応する文節「サッカー 観戦」(マッチした文節)が得られる。
一方、検索キー文の文節「観戦 ツアー」は、ルールに対応する文節「サッカー 観戦」の一部の単語「観戦」が一致するものの、ルールに対応する文節の全てが検索キー文の一部と一致していなため、マッチモードの条件を満たさず、マッチング処理の結果としては、マッチモードの条件を満たす単文が得られなかったという結果となる。
For example, as shown in FIG. 9C, the phrases “watching soccer” corresponding to the rules of the match dictionary data in the match
On the other hand, the phrase “watching tour” in the search key sentence matches some words “watching” in the phrase “watching soccer game” corresponding to the rule, but all the clauses corresponding to the rule are part of the search key sentence. Since they do not match, the match mode condition is not satisfied, and as a result of the matching process, a simple sentence that satisfies the match mode condition is not obtained.
次に、係りうけマッチングの例について図10(a)〜(b)を用いて説明する。
図10(a)〜(b)に示す通り、係りうけマッチングは、係りうけの関係のあるものを抽出するノード親子関係タイプと、係り受けの評価を行わないノード単独タイプの2タイプがある。係りうけマッチングでは、検索処理部501によって、マッチ辞書記憶部503に記憶されているマッチ辞書データのルール32の文字列(部分木ノードに対応する文節)の係りうけ関係と、検索キー文に含まれる文字列(部分木ノードに対応する文節)の係りうけ関係との照合が行われる。なお、検索処理部501は、係りうけマッチングがマッチプロファイルのマッチモード定義PA1おいて、ノード親子関係タイプと、ノード単独タイプのうち、いずれか1つのタイプを実行する。
Next, an example of pending matching will be described with reference to FIGS.
As shown in FIGS. 10A and 10B, there are two types of dependency matching: a node parent-child relationship type that extracts a relationship having a dependency relationship and a node single type that does not perform dependency evaluation. In the dependency matching, the
ここで、ノード親子関係タイプは、単語要素マッチングの集積合タイプによってマッチングした単語同士の係りうけ関係についての条件であって、マッチ辞書記憶部503のマッチ辞書データのルールの文字列(部分木ノードに対応する文節)の親子関係と、検索キー文に含まれる文字列のうち単語要素マッチングの集積合タイプによって得られたマッチした単語(部分木ノードに対応する文節)の親子関係が一致する場合、この一致する文字列をマッチモードの条件を満たす単語として得るマッチモードである。なお、親子関係が一致する文字列がなかった場合、マッチモードの条件を満たす単文が得られなかったという結果となる。
Here, the node parent-child relationship type is a condition for the relationship between words matched by the integrated type of word element matching, and is a character string (partial tree node) of the rule of match dictionary data in the match
例えば、図10(a)に示す通り、マッチ辞書記憶部503のマッチ辞書データの親子関係において、親ルールに対応する文節が「行く」、子ルールに対応する文節が「サッカー 観戦」である場合、この親子関係と一致するパターンは、以下の2つである。つまり、親ルールに対応する文節が「行く」であって、子ルールに対応する文節が「サッカー」であるパターンと、親ルールに対応する文節が「行く」であって、子ルールに対応する文節が「観戦」であるパターンである。
よって、検索キー文に含まれる文字列として、親ルールに対応する文節が「行く」、子ルールに対応する文節が「サッカー」であるもの親子関係「(サッカー)−(行く)」は、マッチモードの条件を満たす。このように、マッチモードの条件を満たす場合、マッチング処理の結果として、ルールに対応する文節「サッカー 観戦」―「行く」の親子関係が得られる。
一方、検索キー文に含まれる文字列として、子ルールに対応する文節が「サッカー 観戦」であって、親ルールに対応する文節がないものや、子ルールに対応する文節が「行く」であって、親ルールに対応する文節がないものは、マッチモードの条件を満たさない。
For example, as shown in FIG. 10A, in the parent-child relationship of the match dictionary data in the match
Therefore, as a character string included in the search key sentence, a phrase corresponding to the parent rule is “go” and a phrase corresponding to the child rule is “soccer”. Meet the mode conditions. As described above, when the condition of the match mode is satisfied, the parent-child relationship of the phrase “watching soccer”-“go” corresponding to the rule is obtained as a result of the matching process.
On the other hand, as a character string included in the search key sentence, the phrase corresponding to the child rule is “watching soccer” and there is no phrase corresponding to the parent rule, or the phrase corresponding to the child rule is “go”. If there is no clause corresponding to the parent rule, the match mode condition is not satisfied.
次に、図10(b)を用いて、ノード単独タイプについて説明する。
ノード単独タイプは、マッチ辞書記憶部503のマッチ辞書データのルールの文字列(部分木ノードに対応する文節)の親子関係と、検索キー文に含まれる文字列(部分木ノードに対応する文節)の親子関係において、親ノードあるいは子ノードの少なくともいずれか一方が一致する場合、この一致する文字列をマッチモードの条件を満たす単語として得るマッチモードである。すなわち、実際には係り受けの評価は行われないことになる。なお、ノード内の文字列の比較は、単語要素マッチングに応じたタイプで行われるが、親ノードあるいは子ノードのいずれか一方でも一致する文字列がなかった場合、マッチモードの条件を満たす単文が得られなかったという結果となる。
Next, the node single type will be described with reference to FIG.
The node single type includes a parent-child relationship of a character string (a clause corresponding to a subtree node) of a rule of match dictionary data in the match
例えば、図10(b)に示す通り、マッチ辞書記憶部503のマッチ辞書データの親子関係が、親ノードに対応する文節「サッカー 観戦」、子ノードに対応する文節が「行く」である場合、親ノードに対応する文節として「サッカー」を含む検索キー文は、マッチモードの条件を満たし、マッチング処理の結果として、ルールに対応する文節「サッカー 観戦」―「行く」の親子関係が得られる。
また、子ノードに対応する文節として「行く」を含む検索キー文は、マッチング条件を満たす。一方、子ノードに対応する文節として「する」を含む検索キー文は、親ノードあるいは子ノードのいずれか一方でも一致する文字列がないため、マッチモードの条件を満たさない。
例えば、マッチプロファイルのマッチモード定義PA1においては、係りうけマッチングを行うか否かが予め決められており、上述した複数のタイプのうち、いずれか一方が予め決められている。
For example, as shown in FIG. 10B, when the parent-child relationship of the match dictionary data in the match
A search key sentence including “go” as a clause corresponding to the child node satisfies the matching condition. On the other hand, the search key sentence including “Yes” as the clause corresponding to the child node does not satisfy the match mode condition because there is no matching character string in either the parent node or the child node.
For example, in the match mode definition PA1 of the match profile, it is determined in advance whether or not to perform the matching matching, and one of the above-described types is determined in advance.
次に、属性マッチングについて説明する。属性マッチングは、文属性一致タイプと、係り受けマッチングと同様に、実質的には属性のマッチを評価しない単語一致タイプがある。
ここでは、文属性一致タイプを図11に示す。
属性マッチングでは、検索処理部501によって、マッチ辞書記憶部503に記憶されているマッチ辞書データのルールの文字列(部分木ノードに対応する文節)の属性と、検索キー文における対応する文字列(部分木ノードに対応する文節)の属性との照合が行われる。
ここで、文属性の一致のタイプは、マッチ辞書記憶部503のマッチ辞書データのルールの文節の少なくとも一部と、検索キー文に含まれる文節のうち少なくとも一部(単語)が一致しており、この一致している部分の属性もそれぞれ一致する場合、この一致する文字列をマッチモードの条件を満たす単語として得られるマッチモードである。なお、文字列が一致していても、属性が異なる場合は、マッチモードの条件を満たす単文が得られなかったという結果となる。
Next, attribute matching will be described. As attribute matching, there are a sentence attribute matching type and a word matching type that does not substantially evaluate attribute matching, similar to dependency matching.
Here, the sentence attribute match type is shown in FIG.
In attribute matching, the
Here, the sentence attribute match type is such that at least a part of the rule clause of the match dictionary data in the match
例えば、マッチ辞書記憶部503のマッチ辞書データのルール32において、ルールと対応する文節「サッカー 観戦」の述語属性が「否定」であって、検索キー文に含まれる文節「観戦」の述語属性が「否定」である場合、マッチモードの条件を満たす。つまり、「サッカー 観戦しない」の場合、「サッカー(名詞)」+「観戦(名詞)」+「しない(助動詞)」に分解されるが、「しない(助動詞)」の属性が「否定」である。このため、「サッカー 観戦」の述語属性が「否定」となり、マッチモードの条件を満たす。
一方、検索キー文に含まれる文節「サッカー 観戦」の述語属性が「可能」である場合、文節「サッカー 観戦」の文字列は一致しているものの、属性が異なるため、マッチモードの条件を満たさない。つまり、「サッカー観戦できる」の場合、「サッカー(名詞)」+「観戦(名詞)」+「できる(助動詞)」に分解されるが、「できる(助動詞)」の属性が「可能」である。このため、「サッカー 観戦」の述語属性は「可能」となり、マッチモードの条件を満たさない。
ここでいう「属性」とは、助動詞の意味情報のことで、否定、疑問、可能などがある。例えば、「使えない」という語に対しては、「使う(動詞)」+「ない(助動詞)」に分解されるが、「ない(助動詞)」の属性は「否定」である。
なお、属性マッチングにおいては、名詞など「属性なし」同士でマッチしてもマッチモードの条件を満たすと判定する。
For example, in the
On the other hand, if the predicate attribute of the phrase “Soccer watching” included in the search key sentence is “possible”, the character string of the clause “Soccer watching” matches, but the attributes are different, so the match mode condition is met. Absent. That is, in the case of “can watch soccer”, it is decomposed into “soccer (noun)” + “watching (noun)” + “can (auxiliary verb)”, but the attribute of “can (auxiliary verb)” is “possible” . For this reason, the predicate attribute of “watching soccer” is “possible” and does not satisfy the condition of the match mode.
The “attribute” here means semantic information of an auxiliary verb, and there are denial, doubt, possibility, and the like. For example, the word “cannot be used” is decomposed into “use (verb)” + “not (auxiliary verb)”, but the attribute of “not (auxiliary verb)” is “denial”.
In the attribute matching, it is determined that the match mode condition is satisfied even if “no attributes” such as nouns are matched.
次に、図12を用いて、本実施の形態に係る情報検索システム1におけるマッチ辞書データの作成方法の一例について説明する。図12は、本実施の形態に係る情報検索システム1におけるマッチ辞書データの作成方法の一例を示すフローチャートである。
図12に示す通り、マッチ辞書データの作成が、例えば日本語解析サーバ500の操作部(図示せず)から指示された場合、辞書作成部504は、データベースファイルサーバ700のデータソース701から検索対象となる文章を読み出し、文章を句点等ごとに区切って単文の単位として、文書解析部505に出力する。例えば、検索対象となる文章Aのテキストデータが「PC内にある画像を送信したところ受信できませんでした。また、携帯内にある画像を送信したところ受信できました。」である場合、句点「。」で区切られている2つの単文に区切って、単文A1「PC内にある画像を送信したところ受信できませんでした。」と、単文A2「また、携帯内にある画像を送信したところ受信できました。」を文書解析部505に出力する(ステップST1)。
Next, an example of a method for creating match dictionary data in the
As shown in FIG. 12, when the creation of match dictionary data is instructed from an operation unit (not shown) of the
単文A1を受け取った文書解析部505の形態素解析部5511は、単文Aを形態素(例えば単語単位)に分離して、検索対象となる文章を複数の形態素に分解する。例えば、形態素解析部5511は、文章Aが入力されると、文章Aに含まれる単文A1を複数の単語「PC」「内」「に」「ある」「画像」「を」「送信」「した」「ところ」「受信」「できませんでした」に分解する。
そして、形態素解析部5511は、システム辞書5501やユーザ辞書5502を参照して、分解した形態素の品詞や属性、意味等を解析し、解析結果として得る(ステップST2)。
The morpheme analysis unit 5511 of the
The morpheme analysis unit 5511 analyzes the part of speech, attributes, meaning, and the like of the decomposed morpheme with reference to the system dictionary 5501 and the
次いで、構文解析部5512は、少なくとも1つ以上の形態素を組み合わせて、構造木の部分木ノードに対応する文節を作成する。なお、ここでは、部分木ノードに対応する文字列として、文章を構成する構成要素の1つであって、文章を実際の言葉として不自然にならない程度に区切ったときに得られる最小のひとまとまりである文節を1つの単位とした例について説明する。しかし、本発明はこれに限られない。
Next, the
そして、構文解析部5512は、形態素解析部5511によって解析された解析結果に基づき、文章を構成する単語の品詞や意味、属性情報、文章内での位置、並び等を評価し、文章における文節同士の係りうけ関係を解析し、文節どうしの係りうけ関係や、単語の出現位置、文章中での文の成分(主語や述語等)等を解析結果として得る。また、構文解析部5512は、各単文を識別するための単文IDを単文毎に付与する。
次いで、構文解析部5512は、解析結果に基づき、文節を部分木ノードとする構造木を作成し、解析結果を類義語処理部5513に出力する(ステップST3)。
Based on the analysis result analyzed by the morphological analysis unit 5511, the
Next, the
類義語処理部5513は、類義語辞書5503を参照して、分解された単語に対して、統一すべき類義語や同意語があるか否かを検索し、該当する類義語等があれば、該当する単語を、類義語辞書5503から検索によって得られた類義語等に置換える(ステップST4)。そして、類義語処理部5513は、解析部551による解析結果を辞書作成部504に出力する。
The
解析結果を受け取った辞書作成部504は、この解析結果から、文節毎のルールとして、例えば、語情報テキストデータ、各語情報の述語属性、ルール(部分木ノード)間のつながりを表す親ルールIDや子ノード有フラグ、重み値、接続詞種別、カテゴリ、等のマッチ辞書記憶部503の登録に必要な情報を得る。そして、辞書作成部504は、これら文節によって構成される単文毎に、各文節のルールと単文IDとをまとめて、マッチ辞書データの単文情報MD3として登録可能な登録用データを作成する。
The
また、辞書作成部504は、マッチ辞書記憶部503からシンボルマップMD1を読み出して、検索対象である文章に、マッチ辞書記憶部503内で統一的に利用されている語情報があるか否かを確認し、単語情報と同一の単語があった場合は、この単語を、シンボルIDに置き換える。なお、シンボルマップMD1内に置き換えるべき同一の単語情報がない場合、辞書作成部504は、新たなシンボルIDを当該単語情報に与える。
そして、辞書作成部504は、文章IDや、文章テキスト、文章付加情報や用語マップ等を含む文章情報(文章の登録のために必要な情報)、および単文情報に基づくマッチ辞書の登録用データを作成する(ステップST5)。
In addition, the
Then, the
次いで、辞書作成部504は、作成したマッチ辞書の登録用データをマッチ辞書記憶部503に書込み、解析結果をマッチ辞書データとして登録する(ステップST6)。
Next, the
次に、図13を用いて、本実施の形態に係る情報検索システム1におけるマッチ辞書データの基づく検索方法の一例について説明する。図13は、本実施の形態に係る情報検索システム1における検索方法の一例を示すフローチャートである。
図13に示す通り、例えば、ユーザによってクライアント端末装置100の入力部103から検索サービスαが指定された場合、クライアント端末装置100は、指定された検索サービスαによる検索を実行するためのリクエスト制御信号を、WEBサーバ300を介して日本語解析サーバ500に送信する。
Next, an example of a search method based on match dictionary data in the
As illustrated in FIG. 13, for example, when the search service α is designated by the user from the
日本語解析サーバ500は、この検索リクエスト制御信号を受信すると、検索処理部501が検索サービスαのプログラムを起動させ、検索サービスαと関連付けられているマッチプロファイルをマッチプロファイル記憶部502から読み出す。ここでは、マッチプロファイルAのマッチモード定義において、予め検索サービスαとマッチプロファイルAとが関連づけられているため、検索プログラムαが起動されることにより、検索処理部501がマッチプロファイルAを読み出す。また、検索処理部501は、マッチ辞書記憶部503に記憶されているマッチ辞書データを読み出す(ステップST10)。
When the
そして、検索処理部501は、例えば、読み出したマッチプロファイルAおよびマッチ辞書データとを、メモリ領域506に展開して辞書オブジェクトを作成する(ステップST11)。なお、検索処理部501は、マッチプロファイルAから、各文章に付与された用語マップ24を読み出し、単語情報の出現頻度情報を計算し、メモリ領域506に一時的に記憶させておいてもよい。このように、辞書オブジェクトを作成するメモリ展開時に、予め各単語情報の出現頻度情報を得て置くことにより、マッチング処理の際に、単語情報の出現頻度情報を計算する処理負荷が軽減される。
Then, for example, the
ここで、クライアント端末装置100の入力部103から、ユーザによって検索キー文が入力されると、クライアント端末装置100は、検索キー文を、WEBサーバ300を介して日本語解析サーバ500に送信する(ステップST12)。
そして、日本語解析サーバ500は、この検索キー文を受信すると(ステップST13)、以下に示す通り、この検索キー文に基づく検索を行う。
Here, when a search key sentence is input by the user from the
When receiving the search key sentence (step ST13), the
まず、検索処理部501は、検索サービスαに対する検索結果をクライアント端末装置100に返信するため、メモリ領域506に、空のオブジェクトである検索結果オブジェクトを生成し、結果記録用の記憶領域を確保する(ステップST14)。
そして、検索処理部501は、検索サービスαのプログラムに従って、検索キー文の解析を行う。すなわち、形態素解析部5511は、検索処理部501によって分割された単文の形態素解析を行い形態素に分割し、システム辞書5501およびユーザ辞書5502を参照して、品詞や属性等を検索する。そして、形態素解析部5511は、得られた品詞や属性等を表す情報に基づき、文章中の係りうけ関係や形態素の意味に応じた文節を作成する。
First, the
Then, the
次いで、構文解析部5512は、形態素解析部5511による解析結果に基づき、文章を構成する文節の品詞や意味、属性情報、文章内での位置、並び等を評価し、文章における文節同士の係りうけ関係を解析し、解析結果を類義語処理部5513に出力する。
類義語処理部5513は、類義語辞書5503を参照して、分解された単語や文節に対して、統一すべき類義語や同義語があるか否かを検索し、該当する類義語等があれば、該当する単語や文節を、類義語辞書5503から検索によって得られた類義語等に置換える。そして、類義語処理部5513は、解析部551による解析結果を検索処理部501に出力する(ステップST15)。
Next, the
The
そして、検索処理部501は、マッチプロファイルAにおいて予め決められているマッチモードに従って、解析された検索キー文と、メモリ領域506の辞書オプジェクトに展開されているマッチ辞書データとのマッチングを行い、各マッチングのどのタイプに属するかを判定し、マッチモード定義の条件を満たす文章等の検索(マッチング処理)を行う(ステップST16)。なお、詳細については、後述する。
さらに、検索処理部501は、ステップST16において、マッチプロファイルAにおいて予め決められているスコアモードに従って、マッチングによって得られた文章等における、検索キー文とのマッチングの程度を評価するスコアを算出する(スコアリング処理)。
Then, the
Further, in step ST16, the
そして、検索処理部501は、マッチング処理における検索によって得られたマッチモードの条件を満たす文章と、スコアリング処理によって得られたスコアとを、メモリ領域506の検索結果オブジェクトに書き込む(ステップST17)。
そして、検索処理部501は、WEBサーバ300を介してクライアント端末装置100に、検索結果オブジェクトの内容を送信する(ステップST18)。
Then, the
Then, the
次に、図14を用いて、本実施の形態に係る情報検索システム1におけるマッチング処理とスコアリング処理の一例について詳細に説明する。図14は、本実施の形態に係る情報検索システム1におけるマッチング処理とスコアリング処理の一例について詳細に説明するフローチャートである。なお、図14に示す処理は、図13のステップST16に対応する処理を詳細に記載したものである。
図14に示す通り、検索処理部501は、マッチ辞書データのシンボルマップMD1を参照して、図13のステップST15において文書解析部505によって解析された検索キー文の単語情報をシンボルIDに置き換える(ステップST20)。
そして、検索処理部501は、マッチプロファイルAにおいて予め決められているマッチモードに従ってマッチング処理を行う。本実施の形態において、検索処理部501は、
単語要素マッチング、係りうけマッチング、属性マッチングについて、それぞれどのタイプに合致するかを判定し、マッチモード定義PA1によって定義された条件に合致する単文を抽出する(ステップST21)。これにより、検索処理部501は、マッチング処理によって検索キー文とマッチした文章を、マッチ辞書データから検索によって得ることができる。
Next, an example of matching processing and scoring processing in the
As shown in FIG. 14, the
Then, the
For word element matching, dependency matching, and attribute matching, it is determined which type is matched, and a single sentence that matches the condition defined by the match mode definition PA1 is extracted (step ST21). Thereby, the
検索処理部501はマッチング処理によって得られた結果に対し、各マッチングモードで判定されたマッチタイプの情報と、マッチプロファイルAによって定義されているスコアモードを利用してスコアを算出し、これらの和をメモリ領域506に一時的に記憶させる(ステップST22)。ここで、スコアの算出にあたっては、、実際に結果の抽出に用いられたマッチモード定義とは関連なく行われる。これは、マッチモード定義を条件としたマッチングは、検索結果そのものの抽出である一方、スコア算出の処理は、抽出された結果の中で、より検索の意図に適した結果を得やすくするための評価を行う処理であり、抽出した結果に対して、マッチモード定義の条件にかかわらず再度、単語要素、係りうけ、属性の観点で結果を評価することが有用だからである。
The
例えば、係りうけマッチングにおいて、図10(b)のように、ノード単独タイプが行われていた場合、ルールに対応する文節が「(サッカー 観戦)−(行く)」であり、検索キー文に含まれる文節が「(サッカー)−(行く)」、「(サッカー)−(する)」であった場合、いずれもマッチング結果としては、一致すると判断されるが、マッチプロファイルにおける係りうけマッチ係数PA7は、検索キー文の係りうけとして一致する「(サッカー)−(行く)」に対して、係数を適用してスコアが算出される。
つまり、検索処理部501は、このような係りうけマッチングの条件を満たす文章や単文が得られた場合、このマッチした文章や単文と、検索キー文とを比較して、スコアモード情報が示すような関係であった場合、係数を適用してスコアを算出することができる。
For example, in the case of dependency matching, when the node single type is performed as shown in FIG. 10B, the clause corresponding to the rule is “(Watch soccer game) − (go)” and is included in the search key sentence. When the phrases to be played are “(soccer) − (go)” and “(soccer) − (s)”, it is determined that both match as matching results, but the match match coefficient PA7 in the match profile is Then, a score is calculated by applying a coefficient to “(soccer)-(go)” that matches the search key sentence.
That is, when a sentence or a single sentence satisfying such dependency matching conditions is obtained, the
そして、検索処理部501は、マッチした文章と、この文章のスコアに基づき、マッチした文章のマッチ情報(例えば、マッチング処理において利用したマッチモードの種類、マッチした単語やマッチした文節の文章内における出現位置(以下、マッチ位置情報という)、スコア)を生成する(ステップST23)。
次いで、検索処理部501は、例えば、ステップST22によって算出されたスコアの点数が高い順にマッチした文章を並び替える(ステップST24)。そして、検索処理部501は、検索キー文、マッチした文章、マッチした単文およびマッチ情報を関連付けて、メモリ領域506の検索結果オブジェクトに書き込む(ステップST25)。
Then, the
Next, for example, the
そして、検索処理部501は、WEBサーバ300に検索結果オブジェクトの内容を送信する(ステップST26)。WEBサーバ300は、受信した検索結果オブジェクトを記憶部304に一時的に記憶させ、クライアント端末装置100の表示部102によって表示可能な検索結果の表示データ(ウェブページ)を作成しクライアント端末装置100に送信する。クライアント端末装置100は、この表示データに基づき、検索結果の表示データを表示部102に表示する。
なお、マッチ位置情報とは、マッチング条件を満たす単語(マッチした単語)が、このマッチした単語を含むマッチした単文や文章の文中に出現する文字位置を表す情報である。
Then, the
Note that the match position information is information indicating a character position at which a word satisfying the matching condition (matched word) appears in a matched single sentence or sentence including the matched word.
ここで、図15を用いて、検索結果オブジェクトの内容である検索結果データの一例について説明する。図15は、検索結果データの一例について説明する概略図である。
図15に示す通り、検索結果データは、クライアント端末装置100においてユーザによって入力された“検索キー文”と、日本語解析サーバ500によるマッチング処理によって得られた検索キー文とマッチした“マッチした文章”と、検索キー文とマッチした単文であって、マッチした文章に含まれる単文であることを表す“マッチした単文”と、このマッチした単文に含まれる文節毎に生成される“マッチ情報”とが、それぞれ関連付けられている。
Here, an example of search result data, which is the content of the search result object, will be described with reference to FIG. FIG. 15 is a schematic diagram illustrating an example of search result data.
As shown in FIG. 15, the search result data includes a “matched sentence” that matches the “search key sentence” input by the user in the
次に、図16を用いて、検索結果オブジェクトの内容として、クライアント端末装置100に送信される検索結果データの一例について、より詳細に説明する。
図16(a)に示す通り、検索キー文が「インターネットがつながらない」であって、日本語解析サーバ500によって、例えば、検索結果1として、単文ID「001−1」、テキスト「インターネットがつながらない場合でも操作は可能ですか?」と、検索結果2として、単文ID「002−3」、テキスト「突然、インターネットができなくなりました」が得られた場合について以下説明する。
Next, an example of search result data transmitted to the
As shown in FIG. 16A, when the search key sentence is “Internet not connected” and the
図16(b)は、検索キー文や検索結果で得られた文章のマッチ位置情報を表す文字位置について説明する図である。図16(b)に示す通り、例えば、検索キー文は、文章の先頭から順番に、一文字ずつ「1,2,3,・・・,12」という文字位置を表す番号が付与されている。この文字位置を表す番号によって、マッチした単文や文章の文中に出現するマッチした単語の文字位置を表すことができる。 FIG. 16B is a diagram for explaining a character position representing match position information of a sentence obtained from a search key sentence or a search result. As shown in FIG. 16B, for example, the search key sentence is given a number indicating the character position “1, 2, 3,..., 12” one by one from the beginning of the sentence. The number representing the character position can represent the character position of the matched word appearing in the matched single sentence or sentence.
図16(c)は、検索結果の一例を示す。図16(c)に示す通り、検索結果1は、文章IDが「001」、単文IDが「001−1」であって、マッチモードが「係りうけマッチング」の場合では、スコアが「8.9」であって、マッチ位置情報が「key1:7,res1:7」「key9:12,res9:12」であることが示されている。ここで、マッチ位置は、当該マッチモードにおいてマッチングした単語を示しており、マッチ位置情報「key1:7,res1:7」は、検索キー文の「インターネット」を、マッチ位置情報「key9:12,res9:12」は、検索キー文の「つながらない」を、意味している。つまり、この「インターネット」と「つながらない」は、係りうけマッチングにおいて、検索キー文における親子関係と、検索結果1の文章における親子関係のマッチングの程度がスコア「8.9」と評価されていることを意味している。
FIG. 16C shows an example of the search result. As shown in FIG. 16C, the
ここで、マッチ位置情報「key1:7,res1:7」とは、マッチした単語の文中における位置を表す情報であって、「key1:7」は、検索キー文の先頭から数えて、1番目から7番目までの文字列が、マッチした単語に該当することを表している。また、「res1:7」は、マッチした単文(あるいはマッチした文章)の先頭から数えて、1番目から7番目までの文字列が、マッチした単語に該当することを表している。なお、この数字は、文の先頭を基点として数えられる文字の数であって、文中における文字の位置を表す情報である。
このように、検索結果は、マッチング条件を満たす単語を含む文と、当該文に含まれるマッチした単語のマッチ位置情報とが関連付けられている情報を含む。
Here, the match position information “key1: 7, res1: 7” is information indicating the position of the matched word in the sentence, and “key1: 7” is the first counted from the head of the search key sentence. The seventh to seventh character strings correspond to matching words. Further, “res1: 7” indicates that the first to seventh character strings counted from the head of the matched single sentence (or matched sentence) correspond to the matched word. This number is the number of characters counted from the beginning of the sentence and is information indicating the position of the character in the sentence.
As described above, the search result includes information in which a sentence including a word satisfying the matching condition is associated with match position information of a matched word included in the sentence.
次に、図17を用いて、本実施の形態に係る情報検索システム1における検索開始処理の一例について説明する。図17は、本実施の形態に係る情報検索システム1における検索開始処理の一例を示すフローチャートである。
図17に示す通り、例えば、クライアント端末装置100の入力部103が日本語解析サーバ500による検索サービスを利用するリクエストをユーザから受け付けると、クライアント端末装置100は、日本語解析サーバ500による検索用表示データを送信するよう、WEBサーバ300に対してリクエスト制御信号を送信する。
Next, an example of a search start process in the
As shown in FIG. 17, for example, when the
WEBサーバ300は、通信部301を介して、クライアント端末装置100からリクエスト制御信号を受信すると、リクエスト処理部302が、このリクエスト制御信号に基づき、クライアント端末装置100の表示部102によって表示される表示データのウェブページのデータを作成するようデータ変換部303を制御する。次いで、データ変換部303は、記憶部304から必要な設定データ等を読み出し、ユーザによって検索キー文が入力されるテキストボックスを表示する検索用表示データを作成する。そして、通信部301は、この検索用表示データを、クライアント端末装置100に送信する(ステップST30)。
例えば、データ変換部303は、クライアント端末装置100に対して検索用表示データを表示させるためのHTML文章等で構成された表示データを作成する。そして、リクエスト処理部302は、この表示データと、検索結果を表示するためのルールが記載されたルール情報(例えば、CSSファイルで構成されたもの)、あるいは、検索結果をクライアント端末装置100の表示部102に表示されるために利用されるプログラム(例えば、javascript等)であって、ブラウザ101上で動作するプログラムコードを、通信部301を介して、クライアント端末装置100に送信する。
When the
For example, the
クライアント端末装置100は、WEBサーバ300から表示データやプログラム等を受信すると、このプログラムを起動させる。そして、データ処理部112は、このプログラムに従って、WEBサーバ300から受信される検索用表示データを、表示部102によって表示される表示データを生成し、表示処理部113を制御する。そして、表示処理部113は、データ処理112によって生成された表示データを、表示部102に表示させる。
クライアント端末装置100の入力部103を介して、ユーザから特定の検索サービスが指定されると、クライアント端末装置100は、指定された検索サービスによる検索を実行するためのリクエスト制御信号を生成する。
また、ユーザによって検索キー文が入力されると、入力部103はこれを受け付ける(ステップST31)。
When the
When a specific search service is specified by the user via the
Further, when a search key sentence is input by the user, the
次いで、クライアント端末装置100は、ユーザによって指定された検索サービスの種類や、入力された検索キー文を、検索リクエストメッセージとともに、通信部104を介してWEBサーバ300に送信する。
WEBサーバ300は、クライアント端末装置100から検索リクエストメッセージを受信すると、この検索リクエストメッセージから検索キー文を取り出し、日本語解析サーバ500に、例えば、検索サービスαによる検索を要求する(ステップST32)。
Next, the
When receiving the search request message from the
次に、図18を用いて、本実施の形態に係る情報検索システム1における検索結果の表示方法の一例について説明する。図18は、本実施の形態に係る情報検索システム1における検索結果の表示方法の一例を示すフローチャートである。
図18に示す通り、WEBサーバ300は、日本語解析サーバ500から検索結果を受信すると、記憶部304に一時的に記憶させる。そして、データ変換部303が、クライアント端末装置100に表示させるためのルール情報を記憶部304から読み出す。次いで、データ変換部303は、このルール情報に基づき、検索結果をクライアント端末装置100の表示装置102において表示するためのウェブページの表示データを作成し、検索結果のメッセージとして、通信部301を介して、クライアント端末装置100に送信する(ステップST40)。
例えば、データ変換部303は、検索キー文ごとに、マッチした文章へのリンク情報、マッチした単文、適用したマッチモード、マッチ位置情報、スコア等のそれぞれに所定のタグを付与して、クライアント端末装置100側のデータ処理部112によって取り扱い可能なデータ(XMLファイル)を作成し、検索結果として送信する。
Next, an example of a search result display method in the
As shown in FIG. 18, when the
For example, for each search key sentence, the
クライアント端末装置100のデータ処理部112は、この検索結果を受信すると、この検索結果(XMLファイル)を記憶部111に一時的に記憶させる。そして、データ処理部112は、記憶部111に記憶されているルール情報に基づき、このXMLファイルの電文に含まれるマッチ位置に該当する単語に対して、適用したマッチモードに対応した表示用のタグを挿入する(ステップST41)。
例えば、図16(c)に示すような検索結果の場合、データ処理部112は、マッチ位置情報の「key1:7、res1:7」に該当する「インターネット」に対して、適用したマッチモードとして「係りうけマッチング」であることを表す表示用のタグを、検索結果を表示するためのルールが記載されたルール情報(CSSファイル)を参照することで作成する。例えば、データ処理部112は、検索結果を表示するための情報として、特定の単語を強調して表示する強調表示設定情報をルール情報に基づき作成し、タグとしてマッチ位置情報に該当する単語に付与する。この強調表示設定情報としては、例えば、マッチした単語には下線を付加して表示するための設定情報や、あるいは、単語要素マッチングのマッチモードによってマッチした単語等を赤色で表示し、属性マッチングのマッチモードによってマッチした単語等を青色で表示することによって、マッチモードごとにユーザが視覚的に区別して認識することができるように表示するための設定情報が含まれている。
When receiving the search result, the
For example, in the case of a search result as shown in FIG. 16C, the
また、強調表示設定情報としては、マッチしたと判断されるマッチモードが複数ある場合、予めユーザによって設定されている優先順位に従って、優先的に表示させるように設定されているマッチモードとマッチした単語等を強調表示するようなものであってもよく、スコアの高い順に優先的に強調表示するようなものであってもよい。
さらに、検索結果として、上述のように予めユーザによってマッチモードの優先順位が決定されている場合、マッチした単文や文章が複数あれば、この優先順位に従って、マッチした単文等を表示させるものであってもよい。
また、検索キー文の文頭に近いマッチした単語から順番に、検索結果として、優先的に表示させるものであってもよい。
In addition, as highlight setting information, when there are a plurality of match modes that are determined to be matched, a word that matches a match mode that is set to be displayed preferentially according to a priority set in advance by the user Or the like may be highlighted, or may be preferentially highlighted in descending order of score.
Furthermore, as a search result, when the priority order of the match mode is determined in advance by the user as described above, if there are a plurality of matched simple sentences or sentences, the matched simple sentences are displayed according to the priority order. May be.
Moreover, you may display preferentially as a search result in an order from the matched word near the head of the search key sentence.
このような強調表示設定情報に基づき、検索結果をクライアント端末装置100の表示部102に表示させる。このとき、ユーザによって、検索結果として表示されているマッチした単文等の中から、強調して表示されているマッチした単語等が選択されると、入力部102は、これを受け付ける。そして、データ処理部112は、記憶部111に一時的に記憶されている検索結果のマッチ位置情報から、ユーザによって選択されたマッチした単語等の位置を特定し、このユーザによって選択されたマッチした単語等に応じた絞み込み検索をさらに行う(ステップST42)。
Based on such highlight setting information, the search result is displayed on the
ここで、絞り込み検索について、図19、20を用いて、詳細に説明する。図19は、検索結果表示データに基づき、クライアント端末装置100の表示部102に表示される検索結果を表す画像の一例を示す概略図である。
図19に示す通り、クライアント端末装置100の表示部102は、検索結果表示データに基づき画面102Aを表示し、この画面102Aの左側には、検索キー文を表示するテキストボックス102Bが、右側には検索結果を表示するサジェスト画面102Cが表示されている。
テキストボックス102Bには、検索キー文「クレジットカードの支払方法を登録したのですが料金サポート窓口から請求書が届きます。」が表示されている。
Here, the refinement search will be described in detail with reference to FIGS. FIG. 19 is a schematic diagram illustrating an example of an image representing a search result displayed on the
As shown in FIG. 19, the
In the
サジェスト画面102Cには、この検索キー文102C1と、この検索キー文に基づき日本語解析サーバ500による検索が行われた検索結果であるマッチした単文102C2が表示されている。
例えば、サジェスト画面102Cでは、検索キー文102C1のマッチした単語が、それぞれマッチモードに応じた色ごとに強調表示されている。マッチした単文102C2では、複数の単文が表示されている場合、通常の検索結果として、マッチした単文が、スコアが高い順番で表示されている。また、マッチした単文102C2に含まれるマッチした単語(例えば、「クレジットカードで支払方法を登録したのですが、料金サポート窓口から請求書が届きます。」)は、検索キー文102C1に含まれるマッチした単語と同様な強調して表示されており、同じマッチモードによって検索された単語に対しては、同じ色で強調して表示されている。
なお、サジェスト画面102Cの検索キー文102C1において強調して表示されているマッチした単語は、クライアント端末装置100の入力部102からの選択指示を受け付け、ユーザによって選択可能である。
WEBサーバ300は、検索結果が得られた場合、図19に示すような検索結果の表示データを作成し、クライアント端末装置100に送信する。
The
For example, on the
Note that the matched word highlighted and displayed in the search key sentence 102C1 on the
When a search result is obtained, the
次に、図20を用いて、図19に示す画面から絞込み検索を行う方法について説明する。図20は、図19に示す画面から、絞り込み検索を行った後に表示される画面の一例を示す概略図である。なお、クライアント端末装置100は、日本語検索サーバ500から受信した検索結果(例えば、マッチした文章、マッチした単文、マッチした単語、これらのマッチングに用いられたマッチング条件、あるいはマッチ位置情報を含むマッチ情報やスコア等)や、絞り込み検索を実行する際の検索ルール情報(例えば、入力部103を介して指定されたマッチした単語を検索キーとして、検索結果から、絞り込み対象を検索するためのプログラムや設定値等)を記憶部111に記憶しておく。 図20に示す通り、例えば、サジェスト画面102Cの検索キー文102C1のうち、強調して表示されているマッチした単語の「クレジットカード」が、ユーザによって選択された場合(例えば、マウスによって画面上のポインタが「クレジットカード」と表示されている部分を指示した状態で、ダブルクリック等の操作によって絞込み検索の対象として指定された場合)、クライアント端末装置100のデータ処理部112が、入力部103を介して、ユーザからの選択指示を受け付け、「クレジットカード」による絞り込み検索を実行する。
Next, a method for performing a narrow search from the screen shown in FIG. 19 will be described with reference to FIG. FIG. 20 is a schematic diagram illustrating an example of a screen displayed after performing a narrowing search from the screen illustrated in FIG. Note that the
データ処理部112は、記憶部111に記憶されている検索結果や検索ルール情報を参照して、検索キー文の「クレジットカード」のマッチ位置情報を検出する。また、データ処理部112は、「クレジットカード」のマッチ位置情報に基づき、検索キー文の「クレジットカード」とマッチする単語としてマッチ位置情報において関連付けられているマッチした単語を含むマッチした単文や文章を検索する。
例えば、図19に示す場合、検索キー文内の「クレジットカード」は、マッチ位置が「1:8」であるため、検索結果において、マッチ位置情報が「key1:8,res1:8」であって、同じマッチモードによってマッチした単語を含むマッチした文章を検索する。
さらに、データ処理部112は、この検索によって得られたマッチした単文や文章を、検索結果表示データの検索結果の上位に表示する表示データ(画面102A−1、図20の上方に示す図を参照)を作成する。これにより、表示処理部112は、絞り込み検索によって得られたマッチした文章を上位に表示するような表示データを、表示部102に表示させる。
The
For example, in the case shown in FIG. 19, the match position of the “credit card” in the search key sentence is “1: 8”, and therefore the match position information in the search result is “key1: 8, res1: 8”. Search for matching sentences that contain words that match in the same match mode.
Further, the
そして、表示部102は、図20の上部に示す検索結果の画面102A−1の通り、検索結果のマッチした単文102C2の最上位として「クレジットカード支払いへの変更について」(スコア:2.2)を、その次に、「クレジットカードで支払方法を登録したのですが、料金サポート窓口から請求書が届きます。」(スコア:1.4)を表示する。
これにより、クライアント端末装置100は、検索結果のマッチ位置情報を利用して、マッチした単語に基づく再検索を実行することができ、マッチした単語に関してマッチングの程度が高い順に、マッチした単文を表示することができる。
なお、ここでは、絞り込み検索として、検索キー文のマッチした単語が指定された場合、単語要素マッチングにおいてマッチした単語であって、かつ、マッチ位置情報が一致する単語を、データ処理部112が、記憶部111に記憶されている検索結果に基づき、再検索する一例について説明したが、本発明はこれに限られない。
Then, as shown in the
Accordingly, the
Here, when a word that matches the search key sentence is specified as the narrowing search, the
例えば、サジェスト画面102Cの検索キー文102C1のうち、強調して表示されているマッチした単語の「請求書」が、ユーザによって選択された場合、データ処理部112は、入力部103を介して、ユーザからの選択指示を受け付け、「請求書」による絞り込み検索を実行する。
データ処理部112は、記憶部111に記憶されている検索結果や検索ルール情報を参照して、検索キー文の「請求書」のマッチ位置情報を検出する。また、データ処理部112は、「請求書」のマッチ位置情報に基づき、検索キー文の「請求書」とマッチする単語としてマッチ位置情報において関連付けられているマッチした単語を含むマッチした単文や文章を検索する。
例えば、図19に示す場合、検索キー文内の「請求書」は、マッチ位置が「33:35」であるため、検索結果において、マッチ位置情報が「key33:35,res33:35」であって、同じマッチモードによってマッチした単語を含むマッチした文章を検索する。
For example, when the user selects the “invoice” of the matched word displayed highlighted in the search key sentence 102C1 on the
The
For example, in the case shown in FIG. 19, since the invoice in the search key statement has a match position of “33:35”, the match position information in the search result is “key33: 35, res33: 35”. Search for matching sentences that contain words that match in the same match mode.
そして、データ処理部112は、この検索によって得られたマッチした文書を、検索結果表示データの検索結果の上位に表示する表示データ(画面102A−2、図20の下方に示す図を参照)を作成する。表示処理部113は、絞り込み検索によって得られたマッチした文章を上位に表示するような表示データを、表示部102に表示させる。
表示部102は、この表示データを表示し、図20の下部に示す検索結果の画面102A−2の通り、検索結果のマッチした単文102C2の最上位として「料金センタから請求書が届くのですが、請求書明細の内訳について確認したいです。」(スコア:4.0)を、その次に、「解約したにも関わらず、請求書が届いたのですが。」(スコア:2.5)・・・を表示する。
Then, the
The
このように、検索結果をクライアント端末装置100の記憶部111に記憶させておき、マッチング位置情報を利用することで、データ処理部112は、マッチした単語に基づく再検索を行うことができる。これにより、クライアント端末装置100は、絞り込み検索がユーザによって指示(リクエスト)された場合、検索結果に対して、形態素分解や構文解析等の解析を行うことなく、文章内におけるマッチした単語の位置を、マッチ位置情報を利用して得ることができる。また、マッチ位置情報は、マッチモードごとに作成されているため、マッチモードに応じて異なる強調表示をするためのタグをマッチした単語に付与することできる。従って、クライアント端末装置100は、再検索された検索結果を、表示部102に表示することで、絞り込み検索の検索結果を得ることができる。
As described above, the search result is stored in the storage unit 111 of the
このように、マッチ位置や、マッチパターンを含む検索結果をクライアント端末装置100の記憶部111に記憶しておき、かつデータ処理部112による絞り込み検索のキーとなる単語が入力部103を介して指定されると、対応する単語の位置情報とマッチパターンのみから簡単に絞り込みの検索結果を得ることができる。このため、クライアント端末装置100は、絞り込み検索による再検索結果の表示データを再構築できる。
一方、本実施の形態と異なり、マッチ位置情報が検索結果として記憶部111に記憶されていない場合、クライアント端末装置100によって絞り込み検索が指定された単語が、マッチした文章やマッチした単文の何処に含まれているのかを、文章を解析しなければ検出することができない問題があったと考えられる。また、本実施の形態にように、マッチモードごとにマッチした単語のマッチ位置情報が検索結果としてクライアント端末装置100に記憶されていない場合、マッチモードごとに同じ色、あるいは同じフォント等で強調して表示できない問題があったと考えられる。本実施の形態に係る情報検索システム1は、上述のような構成とすることによって、上記問題を解決することができる。
As described above, the search result including the match position and the match pattern is stored in the storage unit 111 of the
On the other hand, unlike the present embodiment, when the match position information is not stored in the storage unit 111 as a search result, the word specified by the refinement search by the
また、本実施の形態に係るクライアント端末装置100は、マッチ位置情報を用いて、マッチした単文や文章の文中におけるマッチした単語の位置が分かるため、マッチした単語を文中から抽出することができる。このため、形態素解析や構文解析等の文書解析を行うことなく、再検索ができる。また、マッチした単語の位置が分かることにより、クライアント端末装置100は、マッチした単語を強調表示する表示データを作成し、表示することができる。
一方、マッチ位置情報がない場合、クライアント端末装置100は、検索結果に対して文書解析を行わない限り、強調表示するための単語が文中のどこにあるのかわからないため、強調表示することができない。また、マッチ条件に応じて異なる色で強調表示することもできない。
なお、上述の処理はクライアント端末装置100側のデータ処理部112で絞り込み検索を実施し、再表示を行ったが、クライアント端末装置100から、ユーザによって選択された単語情報をWEBサーバ300側に送信し、WEBサーバ300側に絞り込みの処理を実施させてもよい。この場合、検索結果や検索ルール情報は、日本語解析サーバからWEBサーバ300に送信され、記憶部304に記憶しておく。
Further, the
On the other hand, if there is no match position information, the
In the above-described processing, the
次に、マッチング処理とスコアリング処理の一例について詳細に説明する。
なお、ここでは、検索サービスαがユーザによって指定されており、検索サービスαのマッチプロファイルとして予め決められているマッチプロファイルAがメモリ領域506の辞書オブジェクトに展開されている例について説明する。
Next, an example of the matching process and the scoring process will be described in detail.
Here, an example will be described in which the search service α is designated by the user, and a match profile A determined in advance as a match profile for the search service α is expanded in the dictionary object in the
図21は、検索キー文の一例を示す図である。
図21に示すように、検索キー文「ETCカードがお店で使えません。」が、日本語解析サーバ500に入力される。これにより、日本語解析サーバ500によって照合が行われると、図22に示すようなマッチした単文が得られる。図22には、マッチした単文が複数示されており、例えば「ETCカードが使えない」「クレジットカードが使えない」「ETCカードを使いたい」「クレジットカードを使いたい」「ETCカードは使いやすい」「ETCカードを無くした。」等のマッチした単文が検索によって得られている。
FIG. 21 is a diagram illustrating an example of a search key sentence.
As shown in FIG. 21, a search key sentence “ETC card cannot be used at a store” is input to the Japanese
図23は、マッチプロファイル記憶部502に記憶されているマッチプロファイルA〜Cの設定を説明するための概略図である。図23に示す通り、マッチプロファイルA〜Cの設定は、図5に示したマッチプロファイル記憶部502に記憶されているマッチモードの組み合わせが決定されているマッチモード定義PA1を含むマッチモード情報と、相対出現頻度フラグPA2から同義語マッチ係数PA10に相当する情報を含むスコアモード情報である。なお、マッチモードは、図27を用いて後述するとおり、(1)〜(4)に示す組み合わせパターンが利用可能である。ここでは、(2)単語要素マッチング+属性マッチングがマッチプロファイルのマッチ情報として予め決められている例について説明する。
FIG. 23 is a schematic diagram for explaining setting of match profiles A to C stored in the match
マッチプロファイルAは、マッチモード情報(マッチモード定義PA1)として、(2)単語要素マッチングと属性マッチングが行われることが予め決められており、マッチング処理の結果に対しての重み付けは実行されないこと(例えば、係数1.0)が予め決められている。また、マッチプロファイルBは、マッチモード情報(マッチモード定義PA1)として、単語要素マッチングと属性マッチングが行われることが予め決められており、マッチング処理の結果に対しての重み付けは、係りつけマッチ係数PA7に基づく係りうけマッチングにおける重み付けを実行すること(例えば、係数2.0)が予め決められている。さらに、マッチプロファイルCは、マッチモード情報(マッチモード定義PA1)として、単語要素マッチングと属性マッチングが行われることが予め決められており、マッチング処理の結果に対しての重み付けは、述語属性マッチ係数PA6に基づき、属性マッチングにおいてマッチした単文には述語属性マッチ係数に従った重み付けを実行すること(例えば、係数2.0)が予め決められている。 The match profile A is determined beforehand as match mode information (match mode definition PA1) (2) word element matching and attribute matching are performed, and weighting is not performed on the result of the matching process ( For example, the coefficient 1.0) is predetermined. The match profile B is preliminarily determined to be subjected to word element matching and attribute matching as match mode information (match mode definition PA1), and the weighting on the result of the matching process is an associated match coefficient. Execution of weighting in dependency matching based on PA7 (for example, coefficient 2.0) is predetermined. Further, the match profile C is preliminarily determined to be subjected to word element matching and attribute matching as match mode information (match mode definition PA1), and the weighting on the result of the matching process is a predicate attribute match coefficient. Based on PA6, it is predetermined to execute weighting according to the predicate attribute match coefficient (for example, coefficient 2.0) for a single sentence matched in attribute matching.
次に、図24を用いて、図21〜23に示した例において、マッチプロファイルAに基づき得られた検索結果について説明する。図24は、マッチプロファイルAに基づき得られた検索結呆をサジェスト画面102Cに表示されている画面の一例を示す概略図である。
ここで、マッチプロファイルAのマッチモード定義PA1は単語要素+属性であるから、図24にはこれらの条件に一致した結果(単文)が抽出されている。
図24に示すスコアリング処理において、スコアモード情報としては、特に重み付け等は設定されていない(例えば、係数0.0もしくは1.0)。また、各ノード(ルール)がマッチした場合は、基準点を付与し、さらに、スコアモード情報による重み付けの計算を行う。なお、本実施例では基準点は、マッチ辞書内に記憶された各ルール(ノード)の重み値が適用されるが、単純に装置全体で所定の値を設定してもよい。今回は基準点を1.2点として、説明する。
例えば、「ETCカードが使えない」は、「ETC」「カード」「使え」という単語がマッチし、さらに、「ETC」、「カード」は名詞なので、「属性なし」で、それぞれ1.2点、「使え」は「使う(否定)」の属性がマッチしているので、1.2点×1.0(述語属性マッチ係数)で、1.2点となり、3.6点である。また「ETC」と「使え」、「カード」と「使え」のそれぞれに係り受けペアが含まれる事から、係り受けマッチ係数なし(1.0)が適用され1.2点×1.0×2で2.4点が加算され、合計で6.0点である。
以上のように、マッチモードでは係りうけマッチングは行われていないが、マッチプロファイルのスコアモードで、係り受けマッチ係数を定義しておけば、得られた結果に対して、スコアの算出において、柔軟に重み付けをする事ができる。
Next, search results obtained based on the match profile A in the examples shown in FIGS. 21 to 23 will be described with reference to FIG. FIG. 24 is a schematic diagram showing an example of a screen on which the search ligation obtained based on the match profile A is displayed on the
Here, since the match mode definition PA1 of the match profile A is a word element + attribute, a result (single sentence) that matches these conditions is extracted in FIG.
In the scoring process shown in FIG. 24, no particular weighting or the like is set as the score mode information (for example, coefficient 0.0 or 1.0). In addition, when each node (rule) matches, a reference point is assigned, and weighting is calculated based on the score mode information. In the present embodiment, the weight value of each rule (node) stored in the match dictionary is applied to the reference point, but a predetermined value may be simply set for the entire apparatus. This time, the reference point will be 1.2 points.
For example, “ETC card cannot be used” matches the words “ETC”, “card” and “useable”, and “ETC” and “card” are nouns, so there are no attributes and 1.2 points each. , “Use” matches the “Use (Negative)” attribute, so 1.2 points × 1.0 (predicate attribute match coefficient), which is 1.2 points, which is 3.6 points. In addition, since there is a dependency pair in each of “ETC” and “usable”, “card” and “usable”, no dependency match coefficient (1.0) is applied and 1.2 points × 1.0 × In 2.4, 2.4 points are added, for a total of 6.0 points.
As described above, dependency matching is not performed in the match mode, but if the dependency match coefficient is defined in the score mode of the match profile, the score can be calculated flexibly for the obtained result. Can be weighted.
一方、「ETCカードを使いたい」は、「ETC」「カード」という単語・属性なしがマッチしている。この場合、1.2点+1.2点により、2.4点である。また、述語属性マッチ係数・係りうけマッチ係数が適用されるものはないため、その分の加点はない。
また、「クレジットカードが使えない」は、「使え」という単語と属性「使う(否定)」がマッチしている。この場合、1.2点×1.0で1.2点である。また、係り受けマッチ係数が適用されるものはないため、その分の加点はない。よって、図24に示す通り、スコア順に並べられた検索締果は、最上位が「ETCカードが使えない」(スコア6.0点)、その次が、「ETCカードを使いたい」(スコア2.4点)となる。
なお、本実施例では、「クレジットカード」と「ETCカード」は、「カード」の部分で共通しているが、「クレジット」単独での形で形態素解析をおこなう際のシステム辞書5501に登録がなければ、単語要マッチングにおいて、全要素のタイプが実行されているため、両者はマッチした文節として得られない。
On the other hand, “I want to use an ETC card” matches the words “ETC” and “card” with no word / attribute. In this case, it is 2.4 points by 1.2 points + 1.2 points. In addition, since there is no predicate attribute match coefficient or dependency match coefficient, there is no additional point.
In addition, the word “use credit” and the attribute “use (deny)” match “cannot use credit card”. In this case, 1.2 points × 1.0 is 1.2 points. In addition, since there is no application of the dependency match coefficient, there is no additional point. Therefore, as shown in FIG. 24, the search results arranged in the order of the score are “the ETC card cannot be used” at the top (score 6.0 points), followed by “I want to use the ETC card” (
In this embodiment, “credit card” and “ETC card” are common in the “card” part, but are registered in the system dictionary 5501 when performing morphological analysis in the form of “credit” alone. Otherwise, since all element types are executed in word matching, both cannot be obtained as matched phrases.
次に、図25を用いて、図21〜23に示した例において、マッチプロファイルBに基づき得られた検索結果について説明する。図25は、マッチプロファイルBに基づき得られた検索結果をサジェスト画面102Cに表示されている画面の一例を示す概略図である。
図25に示すスコアリング処理において、スコアモード情報としては、係り受けマッチ係数が、“あり”(点数に2.0を乗じる)に予め決定している。例えば、「ETCカードが使えない」は、「ETC」「カード」「使え」という単語・属性がマッチし、プロファイルAと同様に3.6点である。また「ETC」と「使え」、「カード」と「使え」のそれぞれに係り受けペアが含まれる事から、係り受けマッチ係数あり(2.0)が適用され1.2点×2.0×2で4.8点が加算され、合計で7.2点である。なお、その他のマッチした単文に対してのスコア処理は図24での説明と同様であるために、詳細な説明は省略する。
Next, search results obtained based on the match profile B in the example shown in FIGS. 21 to 23 will be described with reference to FIG. FIG. 25 is a schematic diagram illustrating an example of a screen in which search results obtained based on the match profile B are displayed on the suggest
In the scoring process shown in FIG. 25, as the score mode information, the dependency match coefficient is determined to be “present” (multiply the score by 2.0). For example, “ETC card cannot be used” matches the words / attributes “ETC”, “card”, and “use” and has 3.6 points as in profile A. In addition, since there is a dependency pair in each of “ETC” and “usable”, “card” and “usable”, there is a dependency match coefficient (2.0) and 1.2 points × 2.0 × 4.8 points are added at 2, which gives a total of 7.2 points. Since the score processing for other matched single sentences is the same as the description in FIG. 24, the detailed description is omitted.
次に、図26を用いて、図21〜23に示した例において、マッチプロファイルCに基づき得られた検索結果について説明する。図26は、マッチプロファイルCに基づき得られた検索結果をサジェスト画面102Cに表示されている画面の一例を示す概略図である。
図26に示すスコアリング処理において、スコアモード情報としては、述語属性マッチ係数があり(点数に2.0を乗じる)に予め決定している。例えば、「ETCカードが使えない」は、「ETC」「カード」という単語・属性なしがマッチし、1.2点+1.2点で2.4点、さらに「使え」が単語、「使う(否定)」の属性でマッチしているので述語属性マッチ係数あり(2.0)が適用され1.2点×2.0で2.4点である。
また、プロファイルAと同様に「ETC」と「使え」、「カード」と「使え」のそれぞれに係り受けペアが含まれる事から、係り受けマッチ係数なし(1.0)が適用され1.2点×1.0×2で2.4点が加算され、合計で7.2点である。一方、「クレジットカードが使えない」は「使え」が単語、「使う(否定)」の属性でマッチしているだけなので、
述語属性マッチ係数あり(2.0)が適用され1.2点×2.0で2.4点である。
Next, search results obtained based on the match profile C in the example illustrated in FIGS. 21 to 23 will be described with reference to FIG. FIG. 26 is a schematic diagram illustrating an example of a screen in which search results obtained based on the match profile C are displayed on the suggest
In the scoring process shown in FIG. 26, as the score mode information, there is a predicate attribute match coefficient (multiply the score by 2.0). For example, “ETC card cannot be used” matches “ETC” and “card” without word / attribute, 1.2 points + 1.2 points, 2.4 points, and “use” is word, “use ( (No) ”, the predicate attribute match coefficient exists (2.0) is applied, and 1.2 points × 2.0 is 2.4 points.
Similarly to profile A, “ETC” and “usable”, “card” and “usable” each include a dependency pair, so no dependency match coefficient (1.0) is applied and 1.2. 2.4 points are added at points × 1.0 × 2, for a total of 7.2 points. On the other hand, “Can't use credit card” matches only “Use” is a word and “Use (Negation)” attribute.
Predicate attribute match coefficient exists (2.0) is applied, which is 1.2 points × 2.0 and 2.4 points.
このように、異なるスコアモード情報が設定されているマッチプロファイルA〜Cを用いて、異なる検索結果を得ることができる。
これにより、利用するマッチモードに応じて、マッチ辞書データを作成したり、マッチ辞書データをマッチモードに応じて作成したりする必要がなく、1つのマッチ辞書データを利用して、複数のマッチモードやその組み合わせによる検索を行うことができる。
In this way, different search results can be obtained using match profiles A to C in which different score mode information is set.
This eliminates the need to create match dictionary data according to the match mode to be used or to create match dictionary data according to the match mode. Or a combination thereof.
次に、マッチモードに応じた検索結果の特徴について、図27〜31を用いて、説明する。
図27は、検索結果を示し、マッチした単文と、このマッチした単文が得られたマッチモードの組み合わせを示す図である。
例えば、「ETCカードが使えない」は、(1)単語要素マッチング、(2)単語要素マッチングと属性マッチングの組み合わせ、(3)係りうけマッチング、(4)係りうけマッチングと属性マッチングの組み合わせの全てにおいて、マッチした単文として得られたものであることを示している。なお、検索キー文は「ETCカードがお店で使えません。」である。
Next, the characteristics of the search result according to the match mode will be described with reference to FIGS.
FIG. 27 shows a search result, and shows a combination of a matched single sentence and a match mode in which the matched single sentence is obtained.
For example, “ETC card cannot be used” means (1) word element matching, (2) combination of word element matching and attribute matching, (3) modification matching, and (4) combination of modification matching and attribute matching. Indicates that it was obtained as a matched single sentence. The search key sentence is “ETC card cannot be used at the store”.
図28は、マッチプロファイルのマッチモード定義PA1において、(1)単語要素マッチングによって得られた検索結果を示す概略図である。図28に示す通り、マッチした単文としては、「ETCカードが使えない」と「ETCカードを使いたい」のように、意味が正反対の文章もマッチしている。一方、「ETCカードを失くした。」等の「ETCカード」という単語だけマッチしている文章や、「クレジットカードが使えない」等の「使え」という単語だけマッチしている文章も、マッチした文章として検索によって得られる。
このように、このマッチプロファイルでは、広い範囲にわたって、類似文章も含めて集めてくる検索ができる。よって、複数のマッチした単文が得られる。ここで、複数のマッチした単文が膨大に得られる場合、却ってユーザの利便性が害される場合がある。しかし、日本語解析サーバ500は、マッチした単語の重み付けを行うことによって、スコアに基づき、評価されたマッチした単文を検索結果として表示することができる。よって、広い範囲にわたって複数の類似文章を検索した場合であっても、これら検索結果に優先順位を与え、スコアに基づき優先順位に応じた順番で表示することができる。
FIG. 28 is a schematic diagram showing search results obtained by (1) word element matching in match mode definition PA1 of the match profile. As shown in FIG. 28, as matched single sentences, sentences having opposite meanings such as “I cannot use an ETC card” and “I want to use an ETC card” are matched. On the other hand, sentences that match only the word “ETC card” such as “I lost my ETC card” or sentences that only match the word “use” such as “I cannot use a credit card” match. Obtained by searching as a sentence.
As described above, in this match profile, it is possible to perform a search including a similar sentence over a wide range. Thus, a plurality of matched simple sentences are obtained. Here, if a large number of matched single sentences are obtained, the user's convenience may be adversely affected. However, the
図29は、マッチプロファイルのマッチモード定義PA1において、(2)単語要素マッチングと属性マッチングの組み合わせによって得られた検索結果を示す概略図である。図29に示す通り、マッチした単文としては、「ETCカードが使えない」と「ETCカードを使いたい」のように、意味が正反対の文章もマッチしている。ただし、ここでは「使え」は「使う(否定)」の属性としてマッチするため、両者のスコアの差分は、図28に示した例に比べて大きくできる。このように、マッチする単文の属性に対してもスコアの重み付けを行うことによって、検索キー文と意味の近いマッチした単文を、上位に表示することができる。 FIG. 29 is a schematic diagram showing search results obtained by (2) a combination of word element matching and attribute matching in match mode definition PA1 of the match profile. As shown in FIG. 29, as matched single sentences, sentences having opposite meanings such as “I cannot use an ETC card” and “I want to use an ETC card” are matched. However, since “use” matches as the “use (deny)” attribute here, the difference between the scores of both can be made larger than in the example shown in FIG. In this way, by assigning scores to matching single sentence attributes, matched single sentences having a meaning similar to that of the search key sentence can be displayed at the top.
図30は、マッチプロファイルのマッチモード定義PA1において、(3)係りうけマッチングによって得られた検索結果を示す概略図である。図30に示す通り、マッチした単文としては、「ETCカードが使えない」、「ETCカードを使いたい」、「ETCカードが使いやすい」といったように、意味は異なるが、“ETCカードを使うこと”に関連する単文がマッチしている。このようなマッチングモードを使用した場合、属性に係らず、係りうけ関係を重視した検索を行うことができる。 FIG. 30 is a schematic diagram showing search results obtained by (3) dependency matching in the match mode definition PA1 of the match profile. As shown in FIG. 30, the matched single sentences have different meanings such as “ETC card cannot be used”, “I want to use an ETC card”, “ETC card is easy to use”, but “Use an ETC card” A single sentence related to "" matches. When such a matching mode is used, it is possible to perform a search with an emphasis on the relationship, regardless of the attribute.
また、図31は、マッチプロファイルのマッチモード定義PA1において、(4)係りうけマッチングと属性マッチングの組み合わせによって得られた検索結果を示す概略図である。図31に示す通り、マッチした単文としては、「ETCカードが使えない」というような、検索キー結果に対してかなり近い意味の単文を検索により得ることができる。これは、係りうけマッチングのノードの親子関係のタイプで、係りうけ関係の親ノードと子ノードがそれぞれマッチし、かつ、係りうけ関係の親ノードあるいは子ノードに対応する単語に属性がマッチする場合にのみ検索結果が得られるものである。 FIG. 31 is a schematic diagram showing search results obtained by the combination of (4) dependency matching and attribute matching in the match profile definition PA1 of the match profile. As shown in FIG. 31, as a matched single sentence, a single sentence having a meaning very close to the search key result such as “ETC card cannot be used” can be obtained by searching. This is the type of parent-child relationship of a node for dependency matching, where the parent node and child node of the dependency relationship match, and the attribute matches the word corresponding to the parent node or child node of the dependency relationship Search results can be obtained only for.
よって、例えば、コールセンターにおけるオペレーターのように、お客様の問い合わせに対して的確な回答を短時間で検索し、回答する必要がある場合複数のマッチモードの組み合わせによって、係りうけ関係や単語に含まれる属性に応じた、より少ない数の検索結果に絞り込むことができ、例えば、どのような商品に対するどのような要望あるいはクレームなのか、どのようなことが分かり難いための問い合わせなのか等の、細かい意味の違いに応じた検索を行うことができる。 Therefore, for example, when an operator needs to search for an accurate answer in a short time, such as an operator in a call center, and answer it, the attribute included in the relationship or word by combining multiple match modes Can be narrowed down to a smaller number of search results, for example, what kind of request or claim for a product, what kind of inquiry is difficult to understand, etc. Search according to the difference.
上述の通り、マッチードは、それぞれ異なる性格を有しているため、検索の目的に応じて使用するマッチモードやその組み合わせを選択することによって、わざわざ辞書データを作りかえることなく、ユーザに応じた検索を実現することができる。
また、従来技術に比べて、一つの辞書データに複数のプロファイルを切替えて使用することで、全体として辞書データのデータ量を大幅に抑制することができる。
本実施の形態に係る日本語解析サーバ500は、上述の通り、マッチプロファイル毎に、利用するマッチモードを登録するマッチモード定義PA1を備え、また、マッチプロファイル毎にスコアモードの条件や係数を調整できるように、相対出現頻度フラグPA2〜同義語マッチ係数PA10を備えるようにした。これにより、本実施の形態に係る日本語解析サーバ500は、マッチプロファイルに応じて決定されているマッチモードを利用することができる。よって、マッチ辞書記憶部503は、マッチモードごとに作成する必要がなく、1つのマッチ辞書データを利用して、異なるマッチモードでのマッチングを行うことができる。従って、マッチモードごとに、マッチ辞書データを作成する必要がなく、複数のマッチ辞書データを記憶するための記憶容量を削減することができる。また、マッチモード毎にマッチ辞書データを作成する労力が削減される。さらに、マッチモードは、ユーザによって検索サービスが選択されると、関連付けられているマッチモードが一義的に決定されるため、ユーザによって検索サービスが変更されることによって、簡単にマッチモードを変更することができる。
As described above, each match has a different personality, so by selecting the match mode or combination to be used according to the purpose of the search, it is possible to search according to the user without having to bother creating dictionary data. Can be realized.
Compared with the prior art, by switching and using a plurality of profiles for one dictionary data, the data amount of the dictionary data as a whole can be greatly suppressed.
As described above, the
また、本実施の形態に係る日本語解析サーバ500の検索処理部501は、マッチングモード情報を利用してマッチング条件を満たす単文や文章を得たうえで、さらに、得られたマッチした文章や単文に対して、スコアを算出するようにした。これにより、マッチした文章や単文の中から、検索キー文との関係において、意味合いがより近いものを、スコアによって表すことができる。
よって、マッチモード情報を利用して、マッチング条件に応じた検索結果に絞り込み、その上で、マッチした検索結果に対して、検索キー文の属性や文の構成(係りうけ関係)に応じたスコアを算出し、得られたスコアに基づいて、マッチした文章や単文の優先順位をつけることができる。これにより、検索キー文に、より近い意味合いのマッチした文章や単文を得ることができる。
さらに、本実施の形態に係る日本語解析サーバ500の検索処理部501は、マッチングモード情報とスコアモード情報とは、関連付けて決められることなく、独立して設定するようにした。これにより、検索キー文の特性や検索の目的や条件に応じた、より多面的な検索を実現することができる。
In addition, the
Therefore, match mode information is used to narrow down the search results according to the matching condition, and then the scores according to the search key sentence attributes and sentence structure (relationship relations) for the matched search results. , And based on the obtained score, it is possible to prioritize matched sentences and single sentences. As a result, it is possible to obtain a sentence or a single sentence that has a closer match with the search key sentence.
Furthermore, the
なお、本実施形態に係るクライアント端末装置100は、例えば、コールセンターなどでの入力業務に用いる入力端末装置であって、ワークステーションやパーソナルコンピュータなどの情報処理装置から構成されるものが好ましい。また、本実施形態に係るクライアント端末装置100にあっては、携帯電話のユーザサポート業務を行うコールセンターにおいて、ユーザに対する電話応答時に頻出する語彙を基に、マッチ辞書データが構成されているものであってもよい。
これにより、電話による応対の内容をリアルタイムに入力する必要のあるコールセンターの作業などにおいて、より効率的な文字入力を実現することができる。
Note that the
As a result, it is possible to realize more efficient character input in a call center operation or the like where it is necessary to input the contents of reception by telephone in real time.
また、上述の情報検索システム1における動作の過程は、コンピュータに実行させるためのプログラムや、このプログラムとしてコンピュータ読み取り可能な記録媒体として利用可能であり、コンピュータシステムが読み出して実行することによって、上記処理が行われる。なお、ここでいう「コンピュータシステム」とは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
The operation process in the
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The “computer-readable recording medium” means a flexible disk, a magneto-optical disk, a ROM, a writable nonvolatile memory such as a flash memory, a portable medium such as a CD-ROM, a hard disk built in a computer system, etc. This is a storage device.
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に記憶したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムに既に記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
Further, the “computer-readable recording medium” means a volatile memory (for example, DRAM (Dynamic DRAM) in a computer system that becomes a server or a client when a program is transmitted through a network such as the Internet or a communication line such as a telephone line. Random Access Memory)), etc., which hold programs for a certain period of time.
The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.
1 情報検索システム
100 クライアント端末装置
300 WEBサーバ
500 日本語解析サーバ
700 データベースファイルサーバ
1
Claims (8)
前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得る解析部と、
少なくとも1つの前記単語によって構成される文節を部分木ノードとして木構造に構成した辞書であって、少なくとも1つの前記文節によって構成される文に関するマッチ辞書情報として、当該文に含まれる前記文節に関する情報を表すルール情報を記憶するマッチ辞書記憶部と、
前記マッチ辞書記憶部に記憶されている前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられており、当該マッチング条件を満たす単語に対して前記検索キー文との照合の度合いを評価するための評価基準を有するマッチプロファイル情報を記憶するマッチプロファイル記憶部と、
前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に従って、前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果、前記マッチング条件を満たす前記文に対して、当該マッチプロファイル情報に関連付けられている前記評価基準に従って、前記検索キー文と前記マッチ辞書情報との照合の度合いを表すスコアを算出する検索処理部と、
を備えることを特徴とする情報検索装置。 An input unit for inputting a search key sentence composed of a plurality of words;
An analysis unit that analyzes the search key sentence and obtains an analysis result related to the word constituting the search key sentence;
Information about the clause included in the sentence as a match dictionary information about a sentence constituted by at least one of the clauses as a subtree node in a tree structure including a clause constituted by at least one of the words A match dictionary storage unit for storing rule information representing
Matching conditions for checking the relationship between the match dictionary information stored in the match dictionary storage unit and the search key sentence are associated with each other, and the search key sentence for words satisfying the matching condition A match profile storage unit that stores match profile information having evaluation criteria for evaluating the degree of matching of
Based on the match profile information, the search key sentence is matched with the match dictionary information according to the associated matching condition. As a result of the matching, for the sentence satisfying the matching condition, the match profile information A search processing unit that calculates a score representing a degree of matching between the search key sentence and the match dictionary information according to the evaluation criterion associated with
An information retrieval apparatus comprising:
前記マッチング条件を満たす単語に対して前記照合の度合いに応じた点数を与えるか否かを表し、
前記検索処理部は、
前記評価基準に従って、前記マッチング条件を満たす単語に対して与えられる前記点数を、前記マッチング条件を満たす文毎に算出して、前記スコアを得ることを特徴とする請求項1に記載の情報検索装置。 The evaluation criteria are:
Represents whether or not to give a score according to the degree of matching for words that meet the matching condition,
The search processing unit
The information search device according to claim 1, wherein the score is obtained by calculating the score given to the word satisfying the matching condition for each sentence satisfying the matching condition according to the evaluation criterion. .
それぞれ異なる特性を有する複数の前記マッチング条件のうち、少なくとも1つのマッチング条件と関連付けられている前記マッチプロファイル情報を、検索の目的に応じて複数備えることを特徴とする請求項1あるいは2に記載の情報検索装置。 The match profile storage unit
The plurality of match profile information associated with at least one matching condition among the plurality of matching conditions having different characteristics, respectively, according to the purpose of the search, according to claim 1 or 2 Information retrieval device.
前記マッチング条件として、単語要素マッチング、属性マッチング、あるいは係りうけマッチングのうち、少なくとも1つが関連づけられていることを特徴とする請求項1から3のうちいずれか一項に記載の情報検索装置。 The match profile storage unit
4. The information search apparatus according to claim 1, wherein at least one of word element matching, attribute matching, and dependency matching is associated as the matching condition. 5.
前記解析部は、前記検索対象文を解析して、前記検索対象文を構成する前記単語に関する解析結果を得て、
前記解析結果に基づき、前記単語の文字列に関する文字情報、および前記単語の属性を表す属性情報を含む前記ルール情報を、少なくとも1つの前記単語によって構成される文節と対応付けて、部分木ノードとして木構造に構成した辞書情報であって、少なくとも1つの前記文節によって構成される文に関する前記マッチ辞書情報を作成して前記マッチ辞書記憶部に記憶させる辞書作成部を、
さらに備えることを特徴とする請求項1から4のうちいずれか一項に記載の情報検索装置。 Wherein the input unit inputs the configured search subject sentence from the plurality of words,
Wherein the analysis unit analyzes the searched text to obtain an analysis result relating to the words constituting said search subject sentence,
Based on the analysis results, the rule information including attribute information indicating character information, and the attribute of the word related to the character string of the word, in association with clause constituted by at least one of said word, a subtree node a dictionary information configured in a tree structure, a dictionary creation unit for creating and storing the matching dictionary storage unit said matching dictionary information about configured sentence by at least one of the clauses,
The information search device according to any one of claims 1 to 4, further comprising:
複数の単語から構成される検索キー文の入力を受け付け、
解析部が、
前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得て、
検索処理部が、
前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられており、当該マッチング条件を満たす単語に対して前記検索キー文との照合の度合いを評価するための評価基準を有するマッチプロファイル情報を記憶するマッチプロファイル記憶部から前記マッチプロファイル情報を読み出し、
少なくとも1つの前記単語によって構成される文節を部分木ノードとして木構造に構成した辞書であって、少なくとも1つの前記文節によって構成される文に関するマッチ辞書情報として、当該文に含まれる前記文節に関する情報を表すルール情報を記憶するマッチ辞書記憶部の前記マッチ辞書情報を利用して、前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、
照合の結果、前記マッチング条件を満たす前記文に対して、当該マッチプロファイル情報に関連付けられている前記評価基準に従って、前記検索キー文と前記マッチ辞書情報との照合の度合いを表すスコアを算出する
ことを特徴とする情報検索方法。 The input section is
Accept input of search key sentence consisting of multiple words,
The analysis department
Analyzing the search key sentence, obtaining an analysis result relating to the word constituting the search key sentence,
The search processor
A matching condition for collating the relationship between the match dictionary information and the search key sentence is associated, and an evaluation for evaluating the degree of matching with the search key sentence for a word that satisfies the matching condition Read the match profile information from a match profile storage unit that stores match profile information having a reference;
Information about the clause included in the sentence as a match dictionary information about a sentence constituted by at least one of the clauses as a subtree node in a tree structure including a clause constituted by at least one of the words Using the match dictionary information in the match dictionary storage unit that stores rule information representing, the matching between the search key sentence and the match dictionary information according to the associated matching condition based on the match profile information And
As a result of collation, for the sentence satisfying the matching condition, a score representing a degree of collation between the search key sentence and the match dictionary information is calculated according to the evaluation criterion associated with the match profile information. Information search method characterized by
複数の単語から構成される検索キー文が入力される入力手段、
前記検索キー文を解析して、前記検索キー文を構成する前記単語に関する解析結果を得る解析手段、
前記マッチ辞書情報と前記検索キー文との関係性を照合するためのマッチング条件が関連付けられており、当該マッチング条件を満たす単語に対して前記検索キー文との照合の度合いを評価するための評価基準を有するマッチプロファイル情報を記憶するマッチプロファイル記憶部から前記マッチプロファイル情報を読み出し、少なくとも1つの前記単語によって構成される文節を部分木ノードとして木構造に構成した辞書であって、少なくとも1つの前記文節によって構成される文に関するマッチ辞書情報として、当該文に含まれる前記文節に関する情報を表すルール情報を記憶するマッチ辞書記憶部の前記マッチ辞書情報を利用して、前記マッチプロファイル情報に基づき、関連付けられている前記マッチング条件に応じた前記検索キー文と前記マッチ辞書情報との照合を行い、照合の結果、前記マッチング条件を満たす前記文に対して、当該マッチプロファイル情報に関連付けられている前記評価基準に従って、前記検索キー文と前記マッチ辞書情報との照合の度合いを表すスコアを算出する検索処理手段
として機能させるためのプログラム。 Computer
An input means for inputting a search key sentence composed of a plurality of words;
Analyzing means for analyzing the search key sentence and obtaining an analysis result relating to the word constituting the search key sentence;
A matching condition for collating the relationship between the match dictionary information and the search key sentence is associated, and an evaluation for evaluating the degree of matching with the search key sentence for a word that satisfies the matching condition A dictionary in which the match profile information is read from a match profile storage unit that stores match profile information having a reference, and a clause composed of at least one of the words is configured as a sub-tree node in a tree structure, Based on the match profile information, using the match dictionary information of the match dictionary storage unit that stores rule information representing information about the clause included in the sentence, as match dictionary information about the sentence constituted by the clause, The search key according to the matching condition And the match dictionary information, and as a result of the collation, for the sentence satisfying the matching condition, according to the evaluation criteria associated with the match profile information, the search key sentence and the match dictionary information A program for functioning as a search processing means for calculating a score representing the degree of collation.
前記解析手段は、前記検索対象文を解析して、前記検索対象文を構成する前記単語に関する解析結果を得て、
前記コンピュータを、さらに
前記解析結果に基づき、前記単語の文字列に関する文字情報、および前記単語の属性を表す属性情報を含む前記ルール情報を、少なくとも1つの前記単語によって構成される文節と対応付けて、部分木ノードとして木構造に構成した辞書情報であって、少なくとも1つの前記文節によって構成される文に関する前記マッチ辞書情報を作成して前記マッチ辞書記憶部に記憶させる辞書作成手段
として機能させるための請求項7に記載のプログラム。 Wherein the input means inputs the configured search subject sentence from the plurality of words,
It said analyzing means analyzes the searched text to obtain an analysis result relating to the words constituting said search subject sentence,
Said computer further based on the analysis result, the rule information including attribute information indicating character information, and the attribute of the word related to the character string of the word, in association with clause constituted by at least one of said word , a dictionary information configured in a tree structure as a sub-tree nodes, to function as a dictionary creation means for storing in said matching dictionary storage unit to create the matching dictionary information about configured sentence by at least one of the clauses The program according to claim 7 .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009116025A JP5439028B2 (en) | 2009-05-12 | 2009-05-12 | Information search apparatus, information search method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009116025A JP5439028B2 (en) | 2009-05-12 | 2009-05-12 | Information search apparatus, information search method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010266970A JP2010266970A (en) | 2010-11-25 |
JP5439028B2 true JP5439028B2 (en) | 2014-03-12 |
Family
ID=43363916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009116025A Active JP5439028B2 (en) | 2009-05-12 | 2009-05-12 | Information search apparatus, information search method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5439028B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5699789B2 (en) * | 2011-05-10 | 2015-04-15 | ソニー株式会社 | Information processing apparatus, information processing method, program, and information processing system |
JP7062766B2 (en) * | 2018-06-25 | 2022-05-06 | 株式会社フォーラムエンジニアリング | Matching score calculator |
CN110532354B (en) * | 2019-08-27 | 2023-01-06 | 腾讯科技(深圳)有限公司 | Content retrieval method and device |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10105555A (en) * | 1996-09-26 | 1998-04-24 | Sharp Corp | Translation-with-original example sentence retrieving device |
JP3879324B2 (en) * | 1999-09-14 | 2007-02-14 | 富士ゼロックス株式会社 | Document summarization apparatus, document summarization method, and recording medium |
JP4005343B2 (en) * | 2001-12-04 | 2007-11-07 | 東京ソフト株式会社 | Information retrieval system |
JP4654776B2 (en) * | 2005-06-03 | 2011-03-23 | 富士ゼロックス株式会社 | Question answering system, data retrieval method, and computer program |
-
2009
- 2009-05-12 JP JP2009116025A patent/JP5439028B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010266970A (en) | 2010-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6662152B2 (en) | Information retrieval apparatus and information retrieval method | |
JP3755134B2 (en) | Computer-based matched text search system and method | |
JP3820242B2 (en) | Question answer type document search system and question answer type document search program | |
JP4967037B2 (en) | Information search device, information search method, terminal device, and program | |
US8983965B2 (en) | Document rating calculation system, document rating calculation method and program | |
JP2001075966A (en) | Data analysis system | |
JPH11161682A (en) | Device and method for retrieving information and recording medium | |
Atwan et al. | Semantically enhanced pseudo relevance feedback for Arabic information retrieval | |
US6985147B2 (en) | Information access method, system and storage medium | |
JP2000200281A (en) | Device and method for information retrieval and recording medium where information retrieval program is recorded | |
JP4499179B1 (en) | Terminal device | |
JP5439028B2 (en) | Information search apparatus, information search method, and program | |
WO2020079752A1 (en) | Document search method and document search system | |
JP2006004399A (en) | Information extraction program, its recording medium, information extraction device and information extraction rule creation method | |
JP3985483B2 (en) | SEARCH DEVICE, SEARCH SYSTEM, SEARCH METHOD, PROGRAM, AND RECORDING MEDIUM USING LANGUAGE SENTENCE | |
JP2005234772A (en) | Documentation management system and method | |
JP4496797B2 (en) | Document management apparatus and method | |
JP2004220226A (en) | Document classification method and device for retrieved document | |
JP2000105769A (en) | Document display method | |
JP4074687B2 (en) | Summary sentence creation support system and computer-readable recording medium recording a program for causing a computer to function as the system | |
JP2020113048A (en) | Information processing apparatus and program | |
JP2001101207A (en) | Document summarizing device | |
JPH1145238A (en) | Document management system and computer readable recording medium for recording program for having computer function as the same system | |
JPH11195041A (en) | Document retrieval device/method and recording medium | |
JP2012243130A (en) | Information retrieval device, method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120425 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20120611 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20120611 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130515 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130625 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20130620 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130823 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130823 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20131008 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20131008 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5439028 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |