JP2012173817A - Retrieval support device, program and method - Google Patents

Retrieval support device, program and method Download PDF

Info

Publication number
JP2012173817A
JP2012173817A JP2011032644A JP2011032644A JP2012173817A JP 2012173817 A JP2012173817 A JP 2012173817A JP 2011032644 A JP2011032644 A JP 2011032644A JP 2011032644 A JP2011032644 A JP 2011032644A JP 2012173817 A JP2012173817 A JP 2012173817A
Authority
JP
Japan
Prior art keywords
search
keyword
expression
retrieval
results
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011032644A
Other languages
Japanese (ja)
Other versions
JP5585489B2 (en
Inventor
Tomoya Ogawa
知也 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2011032644A priority Critical patent/JP5585489B2/en
Publication of JP2012173817A publication Critical patent/JP2012173817A/en
Application granted granted Critical
Publication of JP5585489B2 publication Critical patent/JP5585489B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a retrieval support device for generating an appropriate retrieval expression.SOLUTION: A retrieval support device comprises: a first retrieval unit for performing ambiguous retrieval and generating a retrieval result; a second retrieval unit for performing first retrieval by using a first retrieval expression, performing second retrieval by using a retrieval expression in which a first key word is excluded from the first retrieval expression, for each of the first key words satisfying a predetermined condition out of key words included in the first retrieval expression, and generating retrieval results of the first and second retrieval; and a generation unit, for each of the first key words, for calculating a ratio of the number of retrieval results included in the retrieval results of the ambiguous retrieval out of the second retrieval results which is performed for the first key words with respect to the number of the retrieval results included in the retrieval results of ambiguous retrieval out of the first retrieval results, determining whether a condition in which the ratio is equal to or greater than a predetermined threshold is satisfied, and generating a retrieval expression in which the first key word satisfying the condition is excluded from the first retrieval expression.

Description

本技術は、検索式を生成する技術に関する。   The present technology relates to a technology for generating a search expression.

公知例調査を行う場合、一般の発明者にとってキーワードや分類コードの選定などを行い検索式を作成することは難しいため、過去に行われた公知例調査に関する知識(検索ナレッジとも言われる)を利用することが好ましい。過去に行われた公知例調査の結果は、例えば調査レポート(例えば、検索に利用した検索式や先行技術文献の情報などを含む)として社内に保存してある場合がある。調査レポートの活用方法の一例として、調査レポートに含まれる、出願アイデアに関連する検索式や先行技術文献の情報を利用することが考えられる。   When conducting a survey of known cases, it is difficult for general inventors to select keywords and classification codes and create search formulas, so use knowledge about known cases surveys conducted in the past (also known as search knowledge). It is preferable to do. The result of a known example survey conducted in the past may be stored in-house as, for example, a survey report (for example, including a search formula used for a search or information on prior art documents). As an example of a utilization method of the search report, it is conceivable to use a search expression related to the application idea and information of prior art documents included in the search report.

出願アイデアに関連する先行技術文献が調査レポートに有った場合、更に類似した技術文献を検索する方法として曖昧検索がある。曖昧検索は、例えば先行技術文献のデータを検索キーとして与えることにより、関連度が高い技術文献を検索結果として得ることができる。関連度の高さは、例えば同じ単語がどの程度含まれるかといった点で決定される。しかし、曖昧検索は、類似した技術文献を見つけられることも多いが、エビデンスが残らない(すなわち、検索エンジンのパラメータが異なると結果が異なる)といった欠点がある。   When the search report contains prior art documents related to the application idea, there is an ambiguous search as a method for searching for similar technical documents. In the fuzzy search, for example, by giving data of a prior art document as a search key, a technical document having a high degree of relevance can be obtained as a search result. The degree of relevance is determined, for example, in terms of how much the same word is included. However, the fuzzy search often finds similar technical documents, but has the disadvantage that no evidence remains (that is, the results differ if the search engine parameters are different).

そこで、調査レポートの検索式を用いて検索を行うことが考えられる。検索式を用いて検索を行えば、エビデンスが残る検索結果を得ることが出来る。しかし、調査レポートの検索式には、先行技術文献を見つけるには不要なキーワードが含まれていることがあり、これによりノイズが生じることがある。   Thus, it is conceivable to perform a search using a search report search formula. If a search is performed using a search formula, a search result in which evidence remains can be obtained. However, the search formula of the research report may include keywords that are unnecessary for finding prior art documents, which may cause noise.

従来、検索式を利用した検索方法に関しては、以下のような従来技術が存在する。具体的には、検索式によってヒットした特許資料に含まれるIPC(International Patent Classification)、FI(File Index)、Fターム、出願人などのデータ項目毎に出現回数をカウントする。そして、得られた情報を検索式の作成に利用することにより、精度が高い調査を行えるようにする。しかし、この技術では、どのようにキーワードを組み合わせればよいかは不明であり、適切な検索式を生成することはできない。   Conventionally, the following conventional techniques exist for a search method using a search expression. Specifically, the number of appearances is counted for each data item such as IPC (International Patent Classification), FI (File Index), F-term, and applicant included in patent documents hit by the search formula. The obtained information is used to create a search expression so that a highly accurate investigation can be performed. However, in this technique, it is unclear how to combine keywords, and an appropriate search expression cannot be generated.

また、以下のような技術も存在する。具体的には、検索条件式を分割して得られる検索キーの各々について、元々の検索条件式によってヒットする公報から選択された問題公報のうち何件がヒットするかを特定する。そして、ヒット件数が所定値に満たない検索キーを検索条件式から削除するように、検索条件式を更新する。これにより、有効性が低いと考えられる検索キーを検索条件式から削除できるようにする。しかし、この技術では、問題公報そのものしか利用していないため漏れが生じやすい。また、検索キーの評価を行う際に評価対象の検索キーそのものしか考慮していないために漏れやノイズが生じてしまう可能性がある。   The following technologies also exist. Specifically, for each search key obtained by dividing the search condition formula, the number of problem publications selected from the publications hit by the original search condition formula is specified. Then, the search condition formula is updated so that the search key whose hit count is less than the predetermined value is deleted from the search condition formula. As a result, a search key considered to be less effective can be deleted from the search condition formula. However, in this technique, since only the problem publication itself is used, leakage is likely to occur. In addition, since only the search key to be evaluated is considered when evaluating the search key, there is a possibility that leakage or noise may occur.

特開2007-242004号公報Japanese Patent Laid-Open No. 2007-242004 特開平10-11455号公報Japanese Patent Laid-Open No. 10-11455

従って、本技術の目的は、一側面においては、適切な検索式を生成するための技術を提供することである。   Accordingly, an object of the present technology is, in one aspect, to provide a technology for generating an appropriate search expression.

本実施の形態に係る検索支援装置は、(A)検索対象のデータを格納するデータベースと、(B)検索により得られたデータ及び当該検索で用いられた検索式を格納するデータ格納部から、検索により得られたデータを読み出し、当該データを用いてデータベースに対して曖昧検索を実行し、検索結果を記憶装置に格納する第1検索部と、(C)データ格納部から読み出した第1の検索式を用いて、データベースに対して第1の検索を実行すると共に、第1の検索式に含まれるキーワードのうち所定の条件を満たす第1のキーワードの各々について、当該第1のキーワードを第1の検索式から除いた第2の検索式を用いて第2の検索を実行し、第1及び第2の検索の検索結果を記憶装置に格納する第2検索部と、(D)第1のキーワードの各々について、第1の検索の検索結果のうち曖昧検索の検索結果に含まれる検索結果の件数に対する、当該第1のキーワードについて実行された第2の検索の検索結果のうち曖昧検索の検索結果に含まれる検索結果の件数の割合を算出し、当該割合が所定の閾値以上であるという第1の条件を満たすか判断する判断部と、(E)第1の条件を満たすと判断された第1のキーワードを第1の検索式から除いた検索式を生成し、検索式格納部に登録する登録部とを有する。   The search support apparatus according to this embodiment includes (A) a database that stores data to be searched, and (B) a data storage unit that stores data obtained by the search and a search formula used in the search. A first search unit that reads data obtained by the search, performs an ambiguous search for the database using the data, and stores the search result in the storage device; and (C) a first read from the data storage unit A first search is performed on the database using the search formula, and the first keyword is set for each of the first keywords satisfying a predetermined condition among the keywords included in the first search formula. A second search unit that executes a second search using a second search expression excluded from the search expression of 1, and stores search results of the first and second searches in a storage device; and (D) a first Each of the keywords For the number of search results included in the search result of the fuzzy search among the search results of the first search, the search result of the fuzzy search included in the search result of the second search executed for the first keyword. And (E) a first unit that is determined to satisfy the first condition, calculates a ratio of the number of search results to be calculated, and determines whether or not the first condition that the ratio is equal to or greater than a predetermined threshold is satisfied. And a registration unit that generates a search formula obtained by removing the keyword from the first search formula and registers the generated search formula in the search formula storage unit.

適切な検索式を生成することができるようになる。   An appropriate search expression can be generated.

図1は、本実施の形態に係る検索支援装置の機能ブロック図である。FIG. 1 is a functional block diagram of the search support apparatus according to the present embodiment. 図2は、調査レポート格納部に格納されているデータの一例を示す図である。FIG. 2 is a diagram illustrating an example of data stored in the survey report storage unit. 図3は、メインの処理フローを示す図である。FIG. 3 is a diagram showing a main processing flow. 図4は、第1検索結果格納部に格納されているデータの一例を示す図である。FIG. 4 is a diagram illustrating an example of data stored in the first search result storage unit. 図5は、メインの処理フローを示す図である。FIG. 5 is a diagram showing a main processing flow. 図6は、チェック集合を示す図である。FIG. 6 is a diagram illustrating a check set. 図7は、キーワード1を除いた場合の検索結果の集合のうちチェック集合に含まれる部分を示す図である。FIG. 7 is a diagram illustrating a portion included in a check set in a set of search results when keyword 1 is excluded. 図8は、元の検索式による検索結果の集合のうちチェック集合に含まれる部分を示す図である。FIG. 8 is a diagram showing a portion included in the check set in the set of search results based on the original search formula. 図9は、キーワード2を除いた場合の検索結果の集合を示す図である。FIG. 9 is a diagram showing a set of search results when keyword 2 is excluded. 図10は、元の検索式による検索結果の集合を示す図である。FIG. 10 is a diagram showing a set of search results based on the original search formula. 図11は、キーワード2を除いた場合に除去されるノイズの部分を示す図である。FIG. 11 is a diagram illustrating a portion of noise that is removed when keyword 2 is excluded. 図12は、コンピュータの機能ブロック図である。FIG. 12 is a functional block diagram of a computer.

本実施の形態に係る検索支援装置1の機能ブロック図を図1に示す。検索支援装置1は、入力部101と、関連文献格納部102と、曖昧検索部103と、第1検索結果格納部104と、検索式格納部105と、キーワード検索部106と、第2検索結果格納部107と、チェック集合格納部1081、対象キーワード格納部1082、判定部1083及び登録部1084を含む検索式修正部108と、修正後検索式格納部109と、出力部110と、第3検索結果格納部111とを含む。なお、検索支援装置1には、特許文献データベース(DB)11と、調査レポート格納部12とが接続されている。   FIG. 1 shows a functional block diagram of the search support apparatus 1 according to the present embodiment. The search support apparatus 1 includes an input unit 101, a related document storage unit 102, an ambiguous search unit 103, a first search result storage unit 104, a search expression storage unit 105, a keyword search unit 106, and a second search result. Storage unit 107, check set storage unit 1081, target keyword storage unit 1082, search unit correction unit 108 including determination unit 1083, and registration unit 1084, post-correction search formula storage unit 109, output unit 110, and third search A result storage unit 111. The search support apparatus 1 is connected to a patent document database (DB) 11 and a survey report storage unit 12.

入力部101は、特許文献DB11及び調査レポート格納部12に格納されているデータを用いて処理を行い、処理結果を関連文献格納部102及び検索式格納部105に格納する。曖昧検索部103は、関連文献格納部102に格納されているデータを用いて、特許文献DB11に対して曖昧検索を実行し、検索結果を第1検索結果格納部104に格納する。キーワード検索部106は、検索式格納部105に格納されている検索式及び検索式修正部108から受け取った検索式を用いて、特許文献DB11に格納されているデータに対してキーワード検索を実行し、検索結果を第2検索結果格納部107及び第3検索結果格納部111に格納する。判定部1083は、第1乃至第3検索結果格納部に格納されているデータを用いて処理を行い、処理結果をチェック集合格納部1081及び対象キーワード格納部1082に格納したり、処理結果を登録部1084に通知する。登録部1084は、判定部1083から通知された処理結果に応じて検索式からキーワードを除き、生成されたキーワードを修正後検索式格納部109に格納する。出力部110は、修正後検索式格納部109に格納されているデータを表示部(図示せず)に表示する。   The input unit 101 performs processing using data stored in the patent document DB 11 and the survey report storage unit 12 and stores the processing result in the related document storage unit 102 and the search expression storage unit 105. The ambiguous search unit 103 performs an ambiguous search on the patent document DB 11 using data stored in the related document storage unit 102 and stores the search result in the first search result storage unit 104. The keyword search unit 106 performs a keyword search on the data stored in the patent document DB 11 using the search formula stored in the search formula storage unit 105 and the search formula received from the search formula correction unit 108. The search results are stored in the second search result storage unit 107 and the third search result storage unit 111. The determination unit 1083 performs processing using the data stored in the first to third search result storage units, stores the processing results in the check set storage unit 1081 and the target keyword storage unit 1082, and registers the processing results. Notification to the unit 1084. The registration unit 1084 removes the keyword from the search formula according to the processing result notified from the determination unit 1083, and stores the generated keyword in the corrected search formula storage unit 109. The output unit 110 displays the data stored in the corrected search expression storage unit 109 on a display unit (not shown).

図2に、調査レポート格納部12に格納されているデータの一例を示す。調査レポート格納部12には、過去に行われた先行技術文献の調査に関するデータが格納されている。図2の例では、検索式の識別番号と、検索により得られた特許文献の件数と、検索式と、先行技術文献の識別番号とが格納されている。なお、図2は調査レポート1件分のデータを示しているが、調査レポート格納部12には複数件分のデータが格納されていても良い。   FIG. 2 shows an example of data stored in the survey report storage unit 12. The research report storage unit 12 stores data related to research on prior art documents performed in the past. In the example of FIG. 2, the identification number of the search formula, the number of patent documents obtained by the search, the search formula, and the identification number of the prior art document are stored. Although FIG. 2 shows data for one survey report, the survey report storage unit 12 may store a plurality of data.

次に、図3乃至図5を用いて、検索支援装置1の動作を説明する。まず、入力部101は、調査レポート格納部12から先行技術文献の識別情報を読み出す(図3:ステップS1)。ステップS1においては、先行技術文献の識別情報を1件分読み出すものとする。先行技術文献の識別情報は、ランダムに選択しても良いし、重要度等の情報が付されている場合にはそれに応じて選択を行っても良い。また、ユーザから指定を受け付けるようにしても良い。   Next, the operation of the search support apparatus 1 will be described with reference to FIGS. First, the input unit 101 reads identification information of a prior art document from the survey report storage unit 12 (FIG. 3: step S1). In step S1, one piece of identification information of the prior art document is read. The identification information of the prior art document may be selected at random, or when information such as importance is attached, selection may be performed accordingly. Moreover, you may make it receive designation | designated from a user.

また、入力部101は、ステップS1において読み出された識別情報を含む特許文献のデータを特許文献DB11から抽出し、関連文献格納部102に格納する(ステップS3)。なお、特許文献DB11には、既に公開されている特許文献のデータが格納されている。関連文献格納部102に格納されているデータのフォーマットは特許文献DB11に格納されているデータのフォーマットと同様である。   Further, the input unit 101 extracts the patent document data including the identification information read in step S1 from the patent document DB 11, and stores it in the related document storage unit 102 (step S3). Note that the patent document DB 11 stores data of already published patent documents. The format of the data stored in the related document storage unit 102 is the same as the format of the data stored in the patent document DB 11.

そして、曖昧検索部103は、関連文献格納部102に格納されている特許文献のデータを曖昧検索の入力データとして、特許文献DB11に対して曖昧検索を実行し、検索結果のデータを第1検索結果格納部104に格納する(ステップS5)。なお、ステップS5においては、曖昧検索の入力データとして、例えば出願人の情報や技術的な用語等が用いられる。   Then, the fuzzy search unit 103 performs a fuzzy search on the patent document DB 11 using the patent document data stored in the related document storage unit 102 as input data of the fuzzy search, and first searches the search result data. The result is stored in the result storage unit 104 (step S5). In step S5, for example, applicant's information or technical terms are used as input data for fuzzy search.

図4に、第1検索結果格納部104に格納されているデータの一例を示す。図4の例では、順位と、公報番号と、発明の名称と、出願人の情報とが格納されている。なお、順位は例えば類似度により決定される。   FIG. 4 shows an example of data stored in the first search result storage unit 104. In the example of FIG. 4, the ranking, the gazette number, the name of the invention, and the applicant's information are stored. The rank is determined by, for example, the similarity.

そして、検索式修正部108における判定部1083は、第1検索結果格納部104に格納されている検索結果のうち上位所定件数の検索結果を抽出してチェック集合Cを生成し、チェック集合Cのデータをチェック集合格納部1081に格納する(ステップS7)。チェック集合格納部1081に格納されているデータのフォーマットは、第1検索結果格納部104に格納されているデータのフォーマットと同様である。   Then, the determination unit 1083 in the search formula correction unit 108 generates a check set C by extracting the search results of the upper predetermined number from the search results stored in the first search result storage unit 104, and Data is stored in the check set storage unit 1081 (step S7). The format of the data stored in the check set storage unit 1081 is the same as the format of the data stored in the first search result storage unit 104.

一方、入力部101は、調査レポート格納部12に格納されている検索式を読み出し、検索式格納部105に格納する(ステップS9)。ステップS9においては、検索式を1つ分読み出すものとする。検索式は、ランダムに選択しても良いし、件数が所定の条件を満たしている場合に選択を行うようにしても良い。また、ユーザから指定を受け付けるようにしても良い。   On the other hand, the input unit 101 reads the search formula stored in the survey report storage unit 12 and stores it in the search formula storage unit 105 (step S9). In step S9, one search expression is read out. The search expression may be selected at random, or may be selected when the number of cases satisfies a predetermined condition. Moreover, you may make it receive designation | designated from a user.

そして、キーワード検索部106は、ステップS9において読み出された検索式を用いて、特許文献DB11に格納されているデータに対してキーワード検索を実行し、検索結果の件数R1をメインメモリ等の記憶装置に格納する。また、キーワード検索部106は、検索結果のデータを第2検索結果格納部107に格納する(ステップS11)。第2検索結果格納部107に格納されているデータのフォーマットは、第1検索結果格納部104に格納されているデータのフォーマットと同様である。 The keyword search section 106 uses the read search expression in step S9, and perform a keyword search on the data stored in the patent document DB 11, search result count R 1 a, such as main memory Store in storage. Further, the keyword search unit 106 stores the search result data in the second search result storage unit 107 (step S11). The format of data stored in the second search result storage unit 107 is the same as the format of data stored in the first search result storage unit 104.

また、判定部1083は、ステップS11において得られた検索結果のうちチェック集合Cに含まれる検索結果の件数C1を特定し、メインメモリ等の記憶装置に格納する(ステップS13)。 Further, the determination unit 1083 specifies the number C 1 of search results included in the check set C among the search results obtained in step S11 and stores the number C 1 in a storage device such as a main memory (step S13).

さらに、判定部1083は、ステップS9において読み出された検索式中の論理和で連結されたキーワードを抽出してキーワード集合Kを生成し、対象キーワード格納部1082に格納する(ステップS15)。例えば「(キーワード1 or キーワード2 or キーワード3) and キーワード4」という検索式であった場合には、「キーワード1」、「キーワード2」及び「キーワード3」が抽出される。なお、ここで言う「キーワード」とは、キーワードの組み合わせも含む。処理は端子Aを解して図5のステップS17に移行する。   Further, the determination unit 1083 extracts the keywords connected by the logical sum in the search formula read out in step S9, generates a keyword set K, and stores it in the target keyword storage unit 1082 (step S15). For example, if the search expression is “(keyword 1 or keyword 2 or keyword 3) and keyword 4”, “keyword 1”, “keyword 2”, and “keyword 3” are extracted. The “keyword” mentioned here includes a combination of keywords. Processing proceeds to step S17 in FIG.

図5の説明に移行し、判定部1083は、集合Kに含まれるキーワードのうち未処理のキーワードを1つ特定する(図5:ステップS17)。また、判定部1083は、特定されたキーワードを、修正後検索式格納部109に格納されている検索式から除く(ステップS19)。修正後検索式格納部109に検索式が格納されていない場合(すなわち、初回の処理である場合)には、ステップS9において読み出されたキーワードを用いる。そして、判定部1083は、ステップS19において生成された検索式をキーワード検索部106に出力する。なお、修正後検索式格納部109に格納されている検索式ではなく、ステップS9において読み出された検索式を常に利用するようにしても良い。すなわち、累積的にキーワードを除くのではなく、除くキーワードを1つずつ切り替えていくようにしても良い。   Shifting to the description of FIG. 5, the determination unit 1083 identifies one unprocessed keyword among the keywords included in the set K (FIG. 5: step S <b> 17). Also, the determination unit 1083 removes the identified keyword from the search formula stored in the corrected search formula storage unit 109 (step S19). When the search formula is not stored in the corrected search formula storage unit 109 (that is, in the case of the first process), the keyword read in step S9 is used. Then, the determination unit 1083 outputs the search expression generated in step S19 to the keyword search unit 106. Note that instead of the search formula stored in the corrected search formula storage unit 109, the search formula read in step S9 may always be used. That is, instead of removing keywords cumulatively, the removed keywords may be switched one by one.

そして、キーワード検索部106は、ステップS19において生成された検索式を用いて、特許文献DB11に対してキーワード検索を実行し、検索結果の件数R2をメインメモリ等の記憶装置に格納する。また、キーワード検索部106は、検索結果のデータを第3検索結果格納部111に格納する(ステップS21)。第3検索結果格納部111に格納されているデータのフォーマットは、第2検索結果格納部107に格納されているデータのフォーマットと同様である。 Then, the keyword searching section 106, using the generated search expression in step S19, performs a keyword search on patent document DB 11, and stores the number R 2 search results in a storage device such as a main memory. Further, the keyword search unit 106 stores the search result data in the third search result storage unit 111 (step S21). The format of the data stored in the third search result storage unit 111 is the same as the format of the data stored in the second search result storage unit 107.

また、判定部1083は、ステップS21において得られた検索結果のうちチェック集合Cに含まれる検索結果の件数C2を特定し、メインメモリ等の記憶装置に格納する(ステップS23)。 Further, the determination unit 1083 identifies the number C 2 of search results included in the check set C among the search results obtained in step S21, and stores it in a storage device such as a main memory (step S23).

そして、判定部1083は、C2/C1>α(以下、条件1とする)を満たすか判断する(ステップS25)。すなわち、(Kを除いた後の検索式による検索結果のうちチェック集合Cに含まれる検索結果の件数)/(元の検索式による検索結果のうちチェック集合Cに含まれる検索結果の件数)>αであるか判断する。αは予め設定された閾値であり、例えば0.9程度の値を設定する。ステップS25の処理は、キーワードを検索式から除いた場合に漏れが多いかを判定するための処理である。C2/C1>αを満たさないと判断された場合(ステップS25:Noルート)、キーワードを除くと漏れが多くなるため、ステップS33の処理に移行する。 Then, the determination unit 1083 determines whether C 2 / C 1 > α (hereinafter referred to as condition 1) is satisfied (step S25). That is, (the number of search results included in the check set C among the search results based on the search formula after removing K) / (the number of search results included in the check set C among the search results based on the original search formula)> Judge whether it is α. α is a preset threshold value, for example, a value of about 0.9 is set. The process of step S25 is a process for determining whether there are many omissions when a keyword is removed from the search expression. If it is determined that C 2 / C 1 > α is not satisfied (step S25: No route), since the number of omissions increases when keywords are excluded, the process proceeds to step S33.

一方、C2/C1>αを満たすと判断された場合(ステップS25:Yesルート)、判定部1083は、R2/R1<β(以下、条件2とする)を満たすか判断する(ステップS27)。すなわち、(Kを除いた後の検索式による検索結果の件数)/(Kを除く前の検索式による検索結果の件数)<βであるか判断する。βは予め設定された閾値であり、例えば0.9程度の値を設定する。ステップS27の処理は、キーワードを検索式から除いた場合にノイズが減るかを判定するための処理である。そして、R2/R1<βを満たさないと判断された場合(ステップS27:Noルート)、キーワードを除いてもノイズが減らないため、ステップS33の処理に移行する。なお、条件2の式の左辺において、分母を(元の検索式による検索結果の件数)としても良い。すなわち、キーワードを除く直前の検索式による検索結果ではなく、元の検索式による検索結果であっても良い。その場合には、ステップS31の処理を省略する。 On the other hand, when it is determined that C 2 / C 1 > α is satisfied (step S25: Yes route), the determination unit 1083 determines whether R 2 / R 1 <β (hereinafter referred to as condition 2) is satisfied ( Step S27). That is, it is determined whether (number of search results based on the search formula after removing K) / (number of search results based on the search formula before removing K) <β. β is a preset threshold value, for example, a value of about 0.9 is set. The process of step S27 is a process for determining whether noise is reduced when a keyword is removed from the search expression. If it is determined that R 2 / R 1 <β is not satisfied (step S27: No route), since the noise is not reduced even if the keyword is removed, the process proceeds to step S33. Note that the denominator may be (number of search results based on the original search formula) on the left side of the formula of condition 2. That is, the search result based on the original search formula may be used instead of the search result based on the search formula immediately before the keyword. In that case, the process of step S31 is omitted.

一方、R2/R1<βを満たすと判断された場合(ステップS27:Yesルート)、登録部1084は、修正後検索式格納部109に格納されている検索式を、ステップS19において生成された検索式で更新する(ステップS29)。修正後検索式格納部109に検索式が格納されていない場合には、ステップS19において生成された検索式を修正後検索式格納部109に登録する。 On the other hand, when it is determined that R 2 / R 1 <β is satisfied (step S27: Yes route), the registration unit 1084 generates the search formula stored in the corrected search formula storage unit 109 in step S19. The search formula is updated (step S29). If no search expression is stored in the corrected search expression storage unit 109, the search expression generated in step S 19 is registered in the corrected search expression storage unit 109.

また、判定部1083は、R1にR2を代入する(ステップS31)。そして、判定部1083は、未処理のキーワードが有るか判断する(ステップS33)。未処理のキーワードが有ると判断された場合(ステップS33:Yesルート)、ステップS17の処理に戻る。一方、未処理のキーワードが無いと判断された場合(ステップS33:Noルート)、処理を終了する。 In addition, the determination unit 1083 substitutes R 2 for R 1 (step S31). Then, the determination unit 1083 determines whether there is an unprocessed keyword (step S33). If it is determined that there is an unprocessed keyword (step S33: Yes route), the process returns to step S17. On the other hand, if it is determined that there is no unprocessed keyword (step S33: No route), the process ends.

以上のような処理を実施することにより、曖昧検索の結果を正解と仮定した場合において、元の検索式に比べ漏れを増やすことなくノイズを減らすことができる検索式を生成することができるようになる。   By carrying out the processing as described above, when it is assumed that the result of the ambiguous search is correct, it is possible to generate a search expression that can reduce noise without increasing leakage compared to the original search expression. Become.

ここで、上で述べた本実施の形態の処理について、具体例を用いてさらに詳しく説明する。本具体例では、「(キーワード1 or キーワード2 or キーワード3) and キーワード4」という検索式からキーワードを除いていく場合について説明する。本具体例の場合、論理和「or」で連結されたキーワードはキーワード1乃至3であるので、キーワード集合Kにはキーワード1乃至3が含まれる。以下では、α=β=0.9とする。   Here, the processing of the present embodiment described above will be described in more detail using a specific example. In this specific example, a case will be described in which keywords are removed from the search expression “(keyword 1 or keyword 2 or keyword 3) and keyword 4”. In the case of this specific example, since the keywords connected by the logical sum “or” are keywords 1 to 3, the keyword set K includes keywords 1 to 3. In the following, α = β = 0.9.

本具体例の検索式により得られる検索結果の集合とチェック集合Cとの関係を図6に示す。図6では、枠の面積が検索件数を反映しており、チェック集合Cには網掛けが付されている。図6の場合、検索式による検索結果の集合がチェック集合Cを漏れ無く包含している。   FIG. 6 shows the relationship between the set of search results obtained by the search formula of this specific example and the check set C. In FIG. 6, the area of the frame reflects the number of searches, and the check set C is shaded. In the case of FIG. 6, the set of search results based on the search expression includes the check set C without omission.

まず、キーワード1を検索式から除くか否かについて検討する。キーワード1を除いた後の検索式「(キーワード2 or キーワード3) and キーワード4」による検索結果の集合のうちチェック集合Cに含まれる部分は、図7において網掛けが付されている部分である。一方、元の検索式「(キーワード1 or キーワード2 or キーワード3) and キーワード4」での検索結果の集合のうちチェック集合Cに含まれる部分は、図8において網掛けが付されている部分である。ここで、前者の集合の件数を60件、後者の集合の件数を100件とすると、60/100=0.6となり、αの値よりも小さいので、条件1を満たさない。すなわち、キーワード1を除くと漏れが大きくなってしまうので、キーワード1は除かれない。   First, it is examined whether or not to remove the keyword 1 from the search formula. The portion included in the check set C in the set of search results obtained by the search expression “(keyword 2 or keyword 3) and keyword 4” after removing the keyword 1 is a portion shaded in FIG. . On the other hand, the portion included in the check set C in the set of search results in the original search expression “(keyword 1 or keyword 2 or keyword 3) and keyword 4” is the portion shaded in FIG. is there. Here, assuming that the number of the former set is 60 and the number of the latter set is 100, 60/100 = 0.6, which is smaller than the value of α, so Condition 1 is not satisfied. That is, if the keyword 1 is removed, the leakage increases, so the keyword 1 is not removed.

次に、キーワード2を検索式から除くか否かについて検討する。キーワード2を除いた後の検索式「(キーワード1 or キーワード3) and キーワード4」による検索結果の集合のうちチェック集合Cに含まれる部分は、図8において網掛けが付されている部分である。一方、元の検索式「(キーワード1 or キーワード2 or キーワード3) and キーワード4」での検索結果の集合のうちチェック集合Cに含まれる部分も、図8において網掛けが付されている部分である。ここで、前者及び後者の集合の件数を100件とすると、100/100=1となり、αの値よりも大きくなるので、条件1を満たす。すなわち、キーワード2を除いても漏れが大きくならない。   Next, it is examined whether or not the keyword 2 is excluded from the search formula. The portion included in the check set C in the set of search results obtained by the search expression “(keyword 1 or keyword 3) and keyword 4” after removing the keyword 2 is a portion shaded in FIG. . On the other hand, the portion included in the check set C in the set of search results in the original search expression “(keyword 1 or keyword 2 or keyword 3) and keyword 4” is also a portion shaded in FIG. is there. Here, if the number of sets of the former and the latter is 100, 100/100 = 1, which is larger than the value of α, so Condition 1 is satisfied. That is, even if the keyword 2 is excluded, the leakage does not increase.

さらに、条件2について検討する。キーワード2を除いた後の検索式「(キーワード1 or キーワード3) and キーワード4」による検索結果の部分は、図9において網掛けが付されている部分である。一方、キーワード2を除く前の検索式「(キーワード1 or キーワード2 or キーワード3) and キーワード4」による検索結果の集合は、図10において網掛けが付されている部分である。そこで、前者の集合の件数を110件、後者の集合の件数を130件とすると、110/130≒0.85となり、βの値よりも小さくなるので、条件2を満たす。すなわち、キーワード2を除くとノイズを減らすことができる。以上より、キーワード2は条件1及び2を満たすので、キーワード2は除かれる。   Further, condition 2 will be examined. The part of the search result by the search expression “(keyword 1 or keyword 3) and keyword 4” after excluding keyword 2 is the part shaded in FIG. On the other hand, the set of search results based on the search expression “(keyword 1 or keyword 2 or keyword 3) and keyword 4” before the keyword 2 is a shaded portion in FIG. Therefore, if the number of the former set is 110 and the number of the latter set is 130, 110 / 130≈0.85, which is smaller than the value of β, so Condition 2 is satisfied. That is, if the keyword 2 is excluded, noise can be reduced. As described above, since the keyword 2 satisfies the conditions 1 and 2, the keyword 2 is excluded.

同様の処理をキーワード3についても行うと、キーワード3については除かれないと判定される。従って、最終的に生成される検索式は、キーワード2を除いた「(キーワード1 or キーワード3) and キーワード4」となる。この検索式は、元の検索式と比較すると、図11における網掛け部分を排除することができる。すなわち、チェック集合Cからの漏れを抑えつつ、ノイズを減らすことができる。   If similar processing is performed for keyword 3, it is determined that keyword 3 is not removed. Accordingly, the finally generated search expression is “(keyword 1 or keyword 3) and keyword 4” excluding keyword 2. Compared with the original search formula, this search formula can eliminate the shaded portion in FIG. That is, it is possible to reduce noise while suppressing leakage from the check set C.

以上本技術の一実施の形態を説明したが、本技術はこれに限定されるものではない。例えば、上で説明した検索支援装置1の機能ブロック図は必ずしも実際のプログラムモジュール構成に対応するものではない。   Although one embodiment of the present technology has been described above, the present technology is not limited to this. For example, the functional block diagram of the search support apparatus 1 described above does not necessarily correspond to an actual program module configuration.

また、上で説明した各テーブルの構成は一例であって、必ずしも上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。   Further, the configuration of each table described above is an example, and the configuration as described above is not necessarily required. Further, in the processing flow, the processing order can be changed if the processing result does not change. Further, it may be executed in parallel.

なお、上で述べた例では、キーワード検索に用いる検索式及び曖昧検索に用いる入力データをデータベースから読み出すような例を示したが、ユーザからこれらのデータの入力を受け付けるようにしても良い。   In the example described above, an example is shown in which a search expression used for keyword search and input data used for fuzzy search are read from the database, but input of these data may be received from the user.

また、上では特許文献のデータに対して処理を実施するような例を示したが、データの内容は特許文献のデータに限られるわけではなく、種々のデータに対して本実施の形態の処理を実施することが可能である。   Moreover, although the example which performs a process with respect to the data of a patent document was shown above, the content of data is not necessarily restricted to the data of a patent document, The process of this Embodiment is performed with respect to various data. Can be implemented.

なお、上で述べた検索支援装置1は、コンピュータ装置であって、図12に示すように、メモリ2501とCPU2503とハードディスク・ドライブ(HDD)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本技術の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。   The search support apparatus 1 described above is a computer apparatus, and as shown in FIG. 12, a memory 2501, a CPU 2503, a hard disk drive (HDD) 2505, and a display control unit 2507 connected to the display apparatus 2509. A drive device 2513 for the removable disk 2511, an input device 2515, and a communication control unit 2517 for connecting to a network are connected by a bus 2519. An operating system (OS) and an application program for executing the processing in this embodiment are stored in the HDD 2505, and are read from the HDD 2505 to the memory 2501 when executed by the CPU 2503. The CPU 2503 controls the display control unit 2507, the communication control unit 2517, and the drive device 2513 according to the processing content of the application program, and performs a predetermined operation. Further, data in the middle of processing is mainly stored in the memory 2501, but may be stored in the HDD 2505. In an embodiment of the present technology, an application program for performing the above-described processing is stored in a computer-readable removable disk 2511 and distributed, and installed from the drive device 2513 to the HDD 2505. In some cases, the HDD 2505 may be installed via a network such as the Internet and the communication control unit 2517. Such a computer apparatus realizes various functions as described above by organically cooperating hardware such as the CPU 2503 and the memory 2501 described above and programs such as the OS and application programs. .

なお、図1に示した各処理部は、CPU2503及びプログラムの組み合わせ、すなわち、CPU2503がプログラムを実行することにより実現してもよい。より具体的には、CPU2503は、HDD2505又はメモリ2501に記憶されたプログラムに従った動作を行うことで、上で述べたような処理部として機能してもよい。また、図1に示した各データ格納部は、図12におけるメモリ2501やHDD2505等として実現してもよい。   Note that each processing unit illustrated in FIG. 1 may be realized by a combination of the CPU 2503 and the program, that is, the CPU 2503 executing the program. More specifically, the CPU 2503 may function as a processing unit as described above by performing an operation according to a program stored in the HDD 2505 or the memory 2501. 1 may be implemented as the memory 2501, the HDD 2505, or the like in FIG.

以上述べた本技術の実施の形態をまとめると以下のようになる。   The embodiments of the present technology described above are summarized as follows.

本実施の形態に係る検索支援装置は、(A)検索対象のデータを格納するデータベースと、(B)検索により得られたデータ及び当該検索で用いられた検索式を格納するデータ格納部から、検索により得られたデータを読み出し、当該データを用いてデータベースに対して曖昧検索を実行し、検索結果を記憶装置に格納する第1検索部と、(C)データ格納部から読み出した第1の検索式を用いて、データベースに対して第1の検索を実行すると共に、第1の検索式に含まれるキーワードのうち所定の条件を満たす第1のキーワードの各々について、当該第1のキーワードを第1の検索式から除いた第2の検索式を用いて第2の検索を実行し、第1及び第2の検索の検索結果を記憶装置に格納する第2検索部と、(D)第1のキーワードの各々について、第1の検索の検索結果のうち曖昧検索の検索結果に含まれる検索結果の件数に対する、当該第1のキーワードについて実行された第2の検索の検索結果のうち曖昧検索の検索結果に含まれる検索結果の件数の割合を算出し、当該割合が所定の閾値以上であるという第1の条件を満たすか判断する判断部と、(E)第1の条件を満たすと判断された第1のキーワードを第1の検索式から除いた検索式を生成し、検索式格納部に登録する登録部とを有する。   The search support apparatus according to this embodiment includes (A) a database that stores data to be searched, and (B) a data storage unit that stores data obtained by the search and a search formula used in the search. A first search unit that reads data obtained by the search, performs an ambiguous search for the database using the data, and stores the search result in the storage device; and (C) a first read from the data storage unit A first search is performed on the database using the search formula, and the first keyword is set for each of the first keywords satisfying a predetermined condition among the keywords included in the first search formula. A second search unit that executes a second search using a second search expression excluded from the search expression of 1, and stores search results of the first and second searches in a storage device; and (D) a first Each of the keywords For the number of search results included in the search result of the fuzzy search among the search results of the first search, the search result of the fuzzy search included in the search result of the second search executed for the first keyword. And (E) a first unit that is determined to satisfy the first condition, calculates a ratio of the number of search results to be calculated, and determines whether or not the first condition that the ratio is equal to or greater than a predetermined threshold is satisfied. And a registration unit that generates a search formula obtained by removing the keyword from the first search formula and registers the generated search formula in the search formula storage unit.

このようにすれば、曖昧検索の検索結果を利用して、漏れを増やすことがない簡潔な検索式を生成することが出来るようになる。   In this way, it is possible to generate a simple search expression that does not increase omissions using the search result of the fuzzy search.

また、上で述べた判断部が、第1のキーワードの各々について、第1の検索の検索結果の件数に対する、当該第1のキーワードについて実行された第2の検索の検索結果の件数の割合を算出し、当該割合が所定の閾値以下であるという第2の条件を満たすか判断し、登録部が、第1及び第2の条件を満たすと判断された第1のキーワードを第1の検索式から除いた検索式を生成し、検索式格納部に登録するようにしてもよい。このようにすれば、さらにノイズを減らすことができるようになる。   In addition, for each of the first keywords, the determination unit described above calculates a ratio of the number of search results of the second search executed for the first keyword to the number of search results of the first search. Calculating, determining whether or not the second condition that the ratio is equal to or less than a predetermined threshold is satisfied, and the registration unit selects the first keyword determined to satisfy the first and second conditions as the first search formula A search expression excluded from the above may be generated and registered in the search expression storage unit. In this way, noise can be further reduced.

また、所定の条件が、キーワードが第1の検索式中の論理和で連結されているキーワード又はキーワードの組み合わせのいずれかであるという条件であってもよい。論理積等の場合と比べると、論理和で連結されているキーワード等を検索式から除いても検索結果に大きな影響を与えることが少ない。従って、除くべきキーワード等として適切なものが特定されるようになる。   The predetermined condition may be a condition that the keyword is either a keyword or a combination of keywords connected by a logical sum in the first search expression. Compared to the case of logical product or the like, even if a keyword or the like connected by logical sum is excluded from the search formula, the search result is hardly affected. Accordingly, an appropriate keyword or the like to be excluded is specified.

本実施の形態に係る検索支援方法は、(F)検索により得られたデータ及び当該検索で用いられた検索式を格納するデータ格納部から、検索により得られたデータを読み出し、当該データを用いて検索対象のデータを格納するデータベースに対して曖昧検索を実行し、検索結果を記憶装置に格納するステップと、(G)データ格納部から読み出した第1の検索式を用いて、データベースに対して第1の検索を実行すると共に、第1の検索式に含まれるキーワードのうち所定の条件を満たす第1のキーワードの各々について、当該第1のキーワードを第1の検索式から除いた第2の検索式を用いて第2の検索を実行し、第1及び第2の検索の検索結果を記憶装置に格納するステップと、(H)第1のキーワードの各々について、第1の検索の検索結果のうち曖昧検索の検索結果に含まれる検索結果の件数に対する、当該第1のキーワードについて実行された第2の検索の検索結果のうち曖昧検索の検索結果に含まれる検索結果の件数の割合を算出し、当該割合が所定の閾値以上であるという第1の条件を満たすか判断するステップと、(I)第1の条件を満たすと判断された第1のキーワードを第1の検索式から除いた検索式を生成し、検索式格納部に登録するステップとを含む。   In the search support method according to the present embodiment, (F) the data obtained by the retrieval is read from the data storage unit that stores the data obtained by the retrieval and the retrieval formula used in the retrieval, and uses the data. Executing a fuzzy search on the database storing the search target data and storing the search result in the storage device, and (G) using the first search formula read from the data storage unit, The first search is executed, and for each of the first keywords satisfying a predetermined condition among the keywords included in the first search expression, the first keyword is removed from the first search expression. A second search is performed using the search formula, and the search results of the first and second searches are stored in a storage device, and (H) the first search is detected for each of the first keywords. The ratio of the number of search results included in the search result of the fuzzy search among the search results of the second search executed for the first keyword to the number of search results included in the search result of the fuzzy search among the results. Calculating and determining whether the first condition that the ratio is equal to or greater than a predetermined threshold is satisfied; and (I) removing the first keyword determined to satisfy the first condition from the first search expression. Generating a search expression and registering it in the search expression storage unit.

なお、上記方法による処理をコンピュータに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。   A program for causing a computer to perform the processing according to the above method can be created. The program can be a computer-readable storage medium such as a flexible disk, a CD-ROM, a magneto-optical disk, a semiconductor memory, a hard disk, or the like. It is stored in a storage device. The intermediate processing result is temporarily stored in a storage device such as a main memory.

以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。   The following supplementary notes are further disclosed with respect to the embodiments including the above examples.

(付記1)
検索対象のデータを格納するデータベースと、
検索により得られたデータ及び当該検索で用いられた検索式を格納するデータ格納部から、前記検索により得られたデータを読み出し、当該データを用いて前記データベースに対して曖昧検索を実行し、検索結果を記憶装置に格納する第1検索部と、
前記データ格納部から読み出した第1の検索式を用いて、前記データベースに対して第1の検索を実行すると共に、前記第1の検索式に含まれるキーワードのうち所定の条件を満たす第1のキーワードの各々について、当該第1のキーワードを前記第1の検索式から除いた第2の検索式を用いて第2の検索を実行し、前記第1及び第2の検索の検索結果を前記記憶装置に格納する第2検索部と、
前記第1のキーワードの各々について、前記第1の検索の検索結果のうち前記曖昧検索の検索結果に含まれる検索結果の件数に対する、当該第1のキーワードについて実行された前記第2の検索の検索結果のうち前記曖昧検索の検索結果に含まれる検索結果の件数の割合を算出し、当該割合が所定の閾値以上であるという第1の条件を満たすか判断する判断部と、
前記第1の条件を満たすと判断された前記第1のキーワードを前記第1の検索式から除いた検索式を生成し、検索式格納部に登録する登録部と、
を有する検索支援装置。
(Appendix 1)
A database that stores the data to be searched;
From the data storage unit that stores the data obtained by the search and the search formula used in the search, the data obtained by the search is read out, and the ambiguous search is performed on the database using the data. A first search unit for storing a result in a storage device;
The first search formula read from the data storage unit is used to perform a first search on the database, and a first condition that satisfies a predetermined condition among the keywords included in the first search formula For each keyword, a second search is performed using a second search expression obtained by removing the first keyword from the first search expression, and the search results of the first and second searches are stored in the memory. A second search unit stored in the device;
For each of the first keywords, the search of the second search executed for the first keyword with respect to the number of search results included in the search result of the fuzzy search among the search results of the first search. A determination unit that calculates a ratio of the number of search results included in the search result of the fuzzy search among the results, and determines whether the first condition that the ratio is equal to or greater than a predetermined threshold;
A registration unit that generates a search expression obtained by removing the first keyword determined to satisfy the first condition from the first search expression, and registers the generated search expression in the search expression storage unit;
A search support apparatus.

(付記2)
前記判断部が、
前記第1のキーワードの各々について、前記第1の検索の検索結果の件数に対する、当該第1のキーワードについて実行された前記第2の検索の検索結果の件数の割合を算出し、当該割合が所定の閾値以下であるという第2の条件を満たすか判断し、
前記登録部が、
前記第1及び第2の条件を満たすと判断された前記第1のキーワードを前記第1の検索式から除いた検索式を生成し、前記検索式格納部に登録する
ことを特徴とする付記1記載の検索支援装置。
(Appendix 2)
The determination unit
For each of the first keywords, a ratio of the number of search results of the second search executed for the first keyword to the number of search results of the first search is calculated, and the ratio is predetermined. Whether or not the second condition of being equal to or less than the threshold of
The registration unit
A search expression obtained by removing the first keyword determined to satisfy the first and second conditions from the first search expression is generated and registered in the search expression storage unit. The described search support device.

(付記3)
前記所定の条件が、キーワードが前記第1の検索式中の論理和で連結されているキーワード又はキーワードの組み合わせのいずれかであるという条件である
ことを特徴とする付記1又は2記載の検索支援装置。
(Appendix 3)
The search support according to appendix 1 or 2, wherein the predetermined condition is a condition that a keyword is either a keyword or a combination of keywords connected by a logical sum in the first search expression. apparatus.

(付記4)
検索により得られたデータ及び当該検索で用いられた検索式を格納するデータ格納部から、前記検索により得られたデータを読み出し、当該データを用いて検索対象のデータを格納するデータベースに対して曖昧検索を実行し、検索結果を記憶装置に格納するステップと、
前記データ格納部から読み出した第1の検索式を用いて、前記データベースに対して第1の検索を実行すると共に、前記第1の検索式に含まれるキーワードのうち所定の条件を満たす第1のキーワードの各々について、当該第1のキーワードを前記第1の検索式から除いた第2の検索式を用いて第2の検索を実行し、前記第1及び第2の検索の検索結果を前記記憶装置に格納するステップと、
前記第1のキーワードの各々について、前記第1の検索の検索結果のうち前記曖昧検索の検索結果に含まれる検索結果の件数に対する、当該第1のキーワードについて実行された前記第2の検索の検索結果のうち前記曖昧検索の検索結果に含まれる検索結果の件数の割合を算出し、当該割合が所定の閾値以上であるという第1の条件を満たすか判断するステップと、
前記第1の条件を満たすと判断された前記第1のキーワードを前記第1の検索式から除いた検索式を生成し、検索式格納部に登録するステップと、
を、コンピュータに実行させるための検索支援プログラム。
(Appendix 4)
The data obtained by the retrieval is read from the data storage unit that stores the data obtained by the retrieval and the retrieval formula used in the retrieval, and is ambiguous with respect to the database that stores the data to be retrieved using the data. Performing a search and storing the search results in a storage device;
The first search formula read from the data storage unit is used to perform a first search on the database, and a first condition that satisfies a predetermined condition among the keywords included in the first search formula For each keyword, a second search is performed using a second search expression obtained by removing the first keyword from the first search expression, and the search results of the first and second searches are stored in the memory. Storing in the device;
For each of the first keywords, the search of the second search executed for the first keyword with respect to the number of search results included in the search result of the fuzzy search among the search results of the first search. Calculating a ratio of the number of search results included in the search result of the fuzzy search among the results, and determining whether the first condition that the ratio is equal to or greater than a predetermined threshold is satisfied;
Generating a search expression obtained by removing the first keyword determined to satisfy the first condition from the first search expression and registering the search expression in a search expression storage unit;
Search support program for causing a computer to execute

(付記5)
検索により得られたデータ及び当該検索で用いられた検索式を格納するデータ格納部から、前記検索により得られたデータを読み出し、当該データを用いて検索対象のデータを格納するデータベースに対して曖昧検索を実行し、検索結果を記憶装置に格納するステップと、
前記データ格納部から読み出した第1の検索式を用いて、前記データベースに対して第1の検索を実行すると共に、前記第1の検索式に含まれるキーワードのうち所定の条件を満たす第1のキーワードの各々について、当該第1のキーワードを前記第1の検索式から除いた第2の検索式を用いて第2の検索を実行し、前記第1及び第2の検索の検索結果を前記記憶装置に格納するステップと、
前記第1のキーワードの各々について、前記第1の検索の検索結果のうち前記曖昧検索の検索結果に含まれる検索結果の件数に対する、当該第1のキーワードについて実行された前記第2の検索の検索結果のうち前記曖昧検索の検索結果に含まれる検索結果の件数の割合を算出し、当該割合が所定の閾値以上であるという第1の条件を満たすか判断するステップと、
前記第1の条件を満たすと判断された前記第1のキーワードを前記第1の検索式から除いた検索式を生成し、検索式格納部に登録するステップと、
を含み、コンピュータにより実行される検索支援方法。
(Appendix 5)
The data obtained by the retrieval is read from the data storage unit that stores the data obtained by the retrieval and the retrieval formula used in the retrieval, and is ambiguous with respect to the database that stores the data to be retrieved using the data. Performing a search and storing the search results in a storage device;
The first search formula read from the data storage unit is used to perform a first search on the database, and a first condition that satisfies a predetermined condition among the keywords included in the first search formula For each keyword, a second search is performed using a second search expression obtained by removing the first keyword from the first search expression, and the search results of the first and second searches are stored in the memory. Storing in the device;
For each of the first keywords, the search of the second search executed for the first keyword with respect to the number of search results included in the search result of the fuzzy search among the search results of the first search. Calculating a ratio of the number of search results included in the search result of the fuzzy search among the results, and determining whether the first condition that the ratio is equal to or greater than a predetermined threshold is satisfied;
Generating a search expression obtained by removing the first keyword determined to satisfy the first condition from the first search expression and registering the search expression in a search expression storage unit;
And a search support method executed by a computer.

1 検索支援装置 11 特許文献DB
12 調査レポート格納部 101 入力部
102 関連文献格納部 103 曖昧検索部
104 第1検索結果格納部 105 検索式格納部
106 キーワード検索部 107 第2検索結果格納部
108 検索式修正部 1081 チェック集合格納部
1082 対象キーワード格納部 1083 判定部
1084 登録部 109 修正後検索式格納部
110 出力部 111 第3検索結果格納部
1 Search support device 11 Patent document DB
DESCRIPTION OF SYMBOLS 12 Investigation report storage part 101 Input part 102 Related literature storage part 103 Ambiguous search part 104 1st search result storage part 105 Search expression storage part 106 Keyword search part 107 2nd search result storage part 108 Search expression correction part 1081 Check set storage part 1082 Target keyword storage unit 1083 Judgment unit 1084 Registration unit 109 Modified search expression storage unit 110 Output unit 111 Third search result storage unit

Claims (5)

検索対象のデータを格納するデータベースと、
検索により得られたデータ及び当該検索で用いられた検索式を格納するデータ格納部から、前記検索により得られたデータを読み出し、当該データを用いて前記データベースに対して曖昧検索を実行し、検索結果を記憶装置に格納する第1検索部と、
前記データ格納部から読み出した第1の検索式を用いて、前記データベースに対して第1の検索を実行すると共に、前記第1の検索式に含まれるキーワードのうち所定の条件を満たす第1のキーワードの各々について、当該第1のキーワードを前記第1の検索式から除いた第2の検索式を用いて第2の検索を実行し、前記第1及び第2の検索の検索結果を前記記憶装置に格納する第2検索部と、
前記第1のキーワードの各々について、前記第1の検索の検索結果のうち前記曖昧検索の検索結果に含まれる検索結果の件数に対する、当該第1のキーワードについて実行された前記第2の検索の検索結果のうち前記曖昧検索の検索結果に含まれる検索結果の件数の割合を算出し、当該割合が所定の閾値以上であるという第1の条件を満たすか判断する判断部と、
前記第1の条件を満たすと判断された前記第1のキーワードを前記第1の検索式から除いた検索式を生成し、検索式格納部に登録する登録部と、
を有する検索支援装置。
A database that stores the data to be searched;
From the data storage unit that stores the data obtained by the search and the search formula used in the search, the data obtained by the search is read out, and the ambiguous search is performed on the database using the data. A first search unit for storing a result in a storage device;
The first search formula read from the data storage unit is used to perform a first search on the database, and a first condition that satisfies a predetermined condition among the keywords included in the first search formula For each keyword, a second search is performed using a second search expression obtained by removing the first keyword from the first search expression, and the search results of the first and second searches are stored in the memory. A second search unit stored in the device;
For each of the first keywords, the search of the second search executed for the first keyword with respect to the number of search results included in the search result of the fuzzy search among the search results of the first search. A determination unit that calculates a ratio of the number of search results included in the search result of the fuzzy search among the results, and determines whether the first condition that the ratio is equal to or greater than a predetermined threshold;
A registration unit that generates a search expression obtained by removing the first keyword determined to satisfy the first condition from the first search expression, and registers the generated search expression in the search expression storage unit;
A search support apparatus.
前記判断部が、
前記第1のキーワードの各々について、前記第1の検索の検索結果の件数に対する、当該第1のキーワードについて実行された前記第2の検索の検索結果の件数の割合を算出し、当該割合が所定の閾値以下であるという第2の条件を満たすか判断し、
前記登録部が、
前記第1及び第2の条件を満たすと判断された前記第1のキーワードを前記第1の検索式から除いた検索式を生成し、前記検索式格納部に登録する
ことを特徴とする請求項1記載の検索支援装置。
The determination unit
For each of the first keywords, a ratio of the number of search results of the second search executed for the first keyword to the number of search results of the first search is calculated, and the ratio is predetermined. Whether or not the second condition of being equal to or less than the threshold of
The registration unit
The search expression obtained by removing the first keyword determined to satisfy the first and second conditions from the first search expression is generated and registered in the search expression storage unit. The search support apparatus according to 1.
前記所定の条件が、キーワードが前記第1の検索式中の論理和で連結されているキーワード又はキーワードの組み合わせのいずれかであるという条件である
ことを特徴とする請求項1又は2記載の検索支援装置。
The search according to claim 1 or 2, wherein the predetermined condition is a condition that a keyword is either a keyword or a combination of keywords connected by a logical sum in the first search expression. Support device.
検索により得られたデータ及び当該検索で用いられた検索式を格納するデータ格納部から、前記検索により得られたデータを読み出し、当該データを用いて検索対象のデータを格納するデータベースに対して曖昧検索を実行し、検索結果を記憶装置に格納するステップと、
前記データ格納部から読み出した第1の検索式を用いて、前記データベースに対して第1の検索を実行すると共に、前記第1の検索式に含まれるキーワードのうち所定の条件を満たす第1のキーワードの各々について、当該第1のキーワードを前記第1の検索式から除いた第2の検索式を用いて第2の検索を実行し、前記第1及び第2の検索の検索結果を前記記憶装置に格納するステップと、
前記第1のキーワードの各々について、前記第1の検索の検索結果のうち前記曖昧検索の検索結果に含まれる検索結果の件数に対する、当該第1のキーワードについて実行された前記第2の検索の検索結果のうち前記曖昧検索の検索結果に含まれる検索結果の件数の割合を算出し、当該割合が所定の閾値以上であるという第1の条件を満たすか判断するステップと、
前記第1の条件を満たすと判断された前記第1のキーワードを前記第1の検索式から除いた検索式を生成し、検索式格納部に登録するステップと、
を、コンピュータに実行させるための検索支援プログラム。
The data obtained by the retrieval is read from the data storage unit that stores the data obtained by the retrieval and the retrieval formula used in the retrieval, and is ambiguous with respect to the database that stores the data to be retrieved using the data. Performing a search and storing the search results in a storage device;
The first search formula read from the data storage unit is used to perform a first search on the database, and a first condition that satisfies a predetermined condition among the keywords included in the first search formula For each keyword, a second search is performed using a second search expression obtained by removing the first keyword from the first search expression, and the search results of the first and second searches are stored in the memory. Storing in the device;
For each of the first keywords, the search of the second search executed for the first keyword with respect to the number of search results included in the search result of the fuzzy search among the search results of the first search. Calculating a ratio of the number of search results included in the search result of the fuzzy search among the results, and determining whether the first condition that the ratio is equal to or greater than a predetermined threshold is satisfied;
Generating a search expression obtained by removing the first keyword determined to satisfy the first condition from the first search expression and registering the search expression in a search expression storage unit;
Search support program for causing a computer to execute
検索により得られたデータ及び当該検索で用いられた検索式を格納するデータ格納部から、前記検索により得られたデータを読み出し、当該データを用いて検索対象のデータを格納するデータベースに対して曖昧検索を実行し、検索結果を記憶装置に格納するステップと、
前記データ格納部から読み出した第1の検索式を用いて、前記データベースに対して第1の検索を実行すると共に、前記第1の検索式に含まれるキーワードのうち所定の条件を満たす第1のキーワードの各々について、当該第1のキーワードを前記第1の検索式から除いた第2の検索式を用いて第2の検索を実行し、前記第1及び第2の検索の検索結果を前記記憶装置に格納するステップと、
前記第1のキーワードの各々について、前記第1の検索の検索結果のうち前記曖昧検索の検索結果に含まれる検索結果の件数に対する、当該第1のキーワードについて実行された前記第2の検索の検索結果のうち前記曖昧検索の検索結果に含まれる検索結果の件数の割合を算出し、当該割合が所定の閾値以上であるという第1の条件を満たすか判断するステップと、
前記第1の条件を満たすと判断された前記第1のキーワードを前記第1の検索式から除いた検索式を生成し、検索式格納部に登録するステップと、
を含み、コンピュータにより実行される検索支援方法。
The data obtained by the retrieval is read from the data storage unit that stores the data obtained by the retrieval and the retrieval formula used in the retrieval, and is ambiguous with respect to the database that stores the data to be retrieved using the data. Performing a search and storing the search results in a storage device;
The first search formula read from the data storage unit is used to perform a first search on the database, and a first condition that satisfies a predetermined condition among the keywords included in the first search formula For each keyword, a second search is performed using a second search expression obtained by removing the first keyword from the first search expression, and the search results of the first and second searches are stored in the memory. Storing in the device;
For each of the first keywords, the search of the second search executed for the first keyword with respect to the number of search results included in the search result of the fuzzy search among the search results of the first search. Calculating a ratio of the number of search results included in the search result of the fuzzy search among the results, and determining whether the first condition that the ratio is equal to or greater than a predetermined threshold is satisfied;
Generating a search expression obtained by removing the first keyword determined to satisfy the first condition from the first search expression and registering the search expression in a search expression storage unit;
And a search support method executed by a computer.
JP2011032644A 2011-02-17 2011-02-17 Search support apparatus, program and method Expired - Fee Related JP5585489B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011032644A JP5585489B2 (en) 2011-02-17 2011-02-17 Search support apparatus, program and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011032644A JP5585489B2 (en) 2011-02-17 2011-02-17 Search support apparatus, program and method

Publications (2)

Publication Number Publication Date
JP2012173817A true JP2012173817A (en) 2012-09-10
JP5585489B2 JP5585489B2 (en) 2014-09-10

Family

ID=46976697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011032644A Expired - Fee Related JP5585489B2 (en) 2011-02-17 2011-02-17 Search support apparatus, program and method

Country Status (1)

Country Link
JP (1) JP5585489B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103198160A (en) * 2013-04-28 2013-07-10 南京安讯科技有限责任公司 Keyword combination matching method
WO2016027372A1 (en) * 2014-08-22 2016-02-25 株式会社日立製作所 Autopoietic information processing system and method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07319887A (en) * 1994-05-30 1995-12-08 Nippon Telegr & Teleph Corp <Ntt> Literature retrieval device, literature retrieval support method and literature retrieval method
JPH1011455A (en) * 1996-06-21 1998-01-16 Hitachi Ltd Method for evaluating retrieval conditional expression
JP2008003721A (en) * 2006-06-20 2008-01-10 Canon Software Inc Information retrieval system, information retrieval method, program, and recording medium
JP2009301140A (en) * 2008-06-10 2009-12-24 Nippon Telegr & Teleph Corp <Ntt> Text segmentation device, method, program, and computer-readable recording medium
JP2010003015A (en) * 2008-06-18 2010-01-07 Hitachi Software Eng Co Ltd Document search system
JP2011022624A (en) * 2009-07-13 2011-02-03 Nec Corp System, method, server and program for retrieving web page

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07319887A (en) * 1994-05-30 1995-12-08 Nippon Telegr & Teleph Corp <Ntt> Literature retrieval device, literature retrieval support method and literature retrieval method
JPH1011455A (en) * 1996-06-21 1998-01-16 Hitachi Ltd Method for evaluating retrieval conditional expression
JP2008003721A (en) * 2006-06-20 2008-01-10 Canon Software Inc Information retrieval system, information retrieval method, program, and recording medium
JP2009301140A (en) * 2008-06-10 2009-12-24 Nippon Telegr & Teleph Corp <Ntt> Text segmentation device, method, program, and computer-readable recording medium
JP2010003015A (en) * 2008-06-18 2010-01-07 Hitachi Software Eng Co Ltd Document search system
JP2011022624A (en) * 2009-07-13 2011-02-03 Nec Corp System, method, server and program for retrieving web page

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
寺島 浩太 他: "Web検索のための有用な関連キーワードを評価するシステムの構築", 第70回(平成20年)全国大会講演論文集(1) アーキテクチャ ソフトウェア科学・工学 データベース, JPN6014025806, 13 March 2008 (2008-03-13), pages 491 - 1, ISSN: 0002836853 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103198160A (en) * 2013-04-28 2013-07-10 南京安讯科技有限责任公司 Keyword combination matching method
WO2016027372A1 (en) * 2014-08-22 2016-02-25 株式会社日立製作所 Autopoietic information processing system and method
JPWO2016027372A1 (en) * 2014-08-22 2017-06-01 株式会社日立製作所 Self-produced information processing system and method

Also Published As

Publication number Publication date
JP5585489B2 (en) 2014-09-10

Similar Documents

Publication Publication Date Title
TWI524193B (en) Computer-readable media and computer-implemented method for semantic table of contents for search results
JP5492187B2 (en) Search result ranking using edit distance and document information
JP3225912B2 (en) Information retrieval apparatus, method and recording medium
US20110302156A1 (en) Re-ranking search results based on lexical and ontological concepts
WO2016015431A1 (en) Search method, apparatus and device and non-volatile computer storage medium
US10915533B2 (en) Extreme value computation
JP2012533819A (en) Method and system for document indexing and data querying
KR101651780B1 (en) Method and system for extracting association words exploiting big data processing technologies
CN103324641B (en) Information record recommendation method and device
JP2013041385A (en) Document retrieval method, document retrieval device, and document retrieval program
JP5585489B2 (en) Search support apparatus, program and method
JP5121872B2 (en) Image search device
JP4824070B2 (en) Search processing apparatus, search processing method and program for selecting seed of crawler for specialized search using click log
JPWO2017072890A1 (en) Data management system, data management method and program
JP2013186766A (en) Information retrieval method, program and information retrieval device
JP5869948B2 (en) Passage dividing method, apparatus, and program
JP5757208B2 (en) Keyword extraction system, keyword extraction method and program
JP5179564B2 (en) Query segment position determination device
JP6733481B2 (en) Search means selection program, search means selection method, and search means selection device
JP5408658B2 (en) Information consistency determination device, method and program thereof
JP2013191119A (en) Program for generating retrieval expression, information processing method and information processing apparatus
JP5494066B2 (en) SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM
JP2011100302A (en) Ranking function generating device, ranking function generating method, and ranking function generation program
JP5199968B2 (en) Keyword type determination device, keyword type determination method, and keyword type determination program
JP2009271671A (en) Information processor, information processing method, program, and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140515

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140624

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140707

R150 Certificate of patent or registration of utility model

Ref document number: 5585489

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees