JP5292873B2 - Document search method, document search device, and recording medium recording document search program - Google Patents
Document search method, document search device, and recording medium recording document search program Download PDFInfo
- Publication number
- JP5292873B2 JP5292873B2 JP2008073266A JP2008073266A JP5292873B2 JP 5292873 B2 JP5292873 B2 JP 5292873B2 JP 2008073266 A JP2008073266 A JP 2008073266A JP 2008073266 A JP2008073266 A JP 2008073266A JP 5292873 B2 JP5292873 B2 JP 5292873B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- classification
- patent document
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、分類が付与された文献を検索する文書検索方法、文書検索装置、文書検索プログラムを記録した記録媒体に関するものである。 The present invention relates to a document search method, a document search apparatus, and a recording medium on which a document search program is recorded for searching for documents to which classification is assigned.
特許や論文などの文献は、文献情報を有し、この文献情報には、階層的な分類が付与されている。このような文献をキーワードで検索する場合、次の2つのケースが起こり得る。 Documents such as patents and papers have document information, and hierarchical classification is given to the document information. When searching such a document by a keyword, the following two cases may occur.
(ケース1)同一の単語が複数の意味を持つ。
(ケース2)同一の概念が異なる単語で表される。
(Case 1) The same word has a plurality of meanings.
(Case 2) The same concept is expressed by different words.
ケース1により検索ノイズ(意図しない文献が検索結果の中に含まれること)が、ケース2により検索モレ(目的とする文献が検索結果に含まれないこと)が生じる可能性がある。
このような問題(検索ノイズおよび検索モレ)を解決する技術として、該当するカテゴリーあるいはファセットを利用者に選択させ、選択されたカテゴリーあるいはファセットから、そのカテゴリーあるいはファセット内で体系化されている概念名を表示し、それに基づいて分類項目の絞り込みを行う分類コードを使用する特許分類情報検索処理および特許分類情報検索プログラム記憶媒体(特許文献1)が知られている。 As a technology to solve such problems (search noise and search more), the user selects the appropriate category or facet, and from the selected category or facet, the concept name organized in that category or facet Patent classification information search processing and a patent classification information search program storage medium (Patent Document 1) using a classification code for narrowing down classification items based on this are known.
また、特許文献は、IPC(International Patent Classification)、日本のFI(File Index)やF(File Forming)ターム、米国特許分類(U. S. Patent Classification)といった種類の階層的な分類コードが各特許文献に付与されている。特に、FIやFタームでは、分類コードの値が10万項目以上に細分化されている。従って、ユーザが検索目的や意図に適合した分類コードの値を知ることができた場合には、その分類コードの値をキーとして、特許文献1のような技術を用いて検索することにより、検索ノイズや検索モレの少ない高精度な検索を実現することが可能となる。
ちなみに、上記特許分類とは異なるが、論文や図書などの各種文献についても、たとえば、国際十進分類法(UDC)といった標準の分類コードや、JST分類といった情報提供者が独自に定義・付与している各種分類コードが存在する。
By the way, although different from the above-mentioned patent classification, various types of documents such as papers and books are also defined and assigned by information providers such as standard classification codes such as International Decimal Classification (UDC) and JST classification. There are various classification codes.
しかし、上述したような特許文献に限らず、各種文献の検索においては、日本の文献だけでなく米国文献をも検索対象とした場合に、検索者が米国の分類に詳しくなかったり、適切な英語の技術用語(訳語)を知らなかったりすると検索キーワードから適切な分類を導出することは難しい。 However, not only patent documents such as those described above, but in searching for various documents, if not only Japanese documents but also US documents are searched, the searcher may not be familiar with the classification of the United States, or appropriate English It is difficult to derive an appropriate classification from the search keyword if the technical term (translation) is not known.
さらに、日本語キーワードに基づいて米国分類を調べると、日本語キーワードに対する訳語や米国分類の多義性によって、ノイズとなる文献(関連はあるが主題が異なる文献)が検索結果に混じってしまい、結果として、文献分類コードの候補リストの精度が低下してしまう可能性がある。よって、この検索結果が適切なものかどうかを検証する必要が生じることになる。 In addition, when examining the US classification based on Japanese keywords, the translation results for the Japanese keywords and the ambiguity of the US classification mixed the search results with literature that was noisy (related but different subject matter). As a result, the accuracy of the candidate list for the document classification code may be reduced. Therefore, it is necessary to verify whether or not the search result is appropriate.
本発明は上述した問題点を解決するためになされたものであり、複数の文書で構成される第1の文書群を対象に検索した検索結果を利用して、複数の文書で構成される第2の文書群に含まれる文書を検索することを目的とする。 The present invention has been made to solve the above-described problems, and uses a search result obtained by searching for a first document group composed of a plurality of documents. The purpose is to search for documents included in the second document group.
上述した課題を解決するため、文書検索方法は、複数の文書で構成される第1の文書群を対象に検索した検索結果を利用して、複数の文書で構成される第2の文書群に含まれる文書を検索する方法であって、コンピュータが、特定の語句、または、文書を分類する特定の分類項目を検索条件として受け付ける検索受付ステップと、前記検索条件に基づいて、前記第1の文書群に含まれる所定の文書を検索する第1検索ステップと、前記第1検索ステップにおいて検索された文書に含まれる、前記第1の文書群と前記第2の文書群を関連づける関連情報を特定し、該関連情報を検索条件として前記第2の文書群を検索し、該検索によって抽出された文書に付与された分類項目を特定し、該特定された分類項目に基づいて再び第2の文書群を検索する第2検索ステップと、前記第2検索ステップにおいて検索された文書に含まれる、前記関連情報を特定し、該関連情報を検索条件として、前記第1の文書群を検索する第3検索ステップと、前記第3検索ステップにおいて前記第1の文書群から検索された文書に含まれる語句または分類項目を特定し、前記検索受付ステップにおいて検索条件として受け付けた前記語句または分類項目との一致度を算出し、該一致度を示す検索結果情報を出力する出力ステップ、から構成されることを特徴とする。 In order to solve the above-described problem, a document search method uses a search result obtained by searching for a first document group including a plurality of documents, to obtain a second document group including a plurality of documents. A method for searching for an included document, wherein a computer accepts a specific word or phrase or a specific classification item for classifying a document as a search condition, and the first document based on the search condition A first search step for searching for a predetermined document included in the group, and related information for associating the first document group with the second document group included in the document searched in the first search step. The second document group is searched using the related information as a search condition, the classification item given to the document extracted by the search is specified, and the second document group is again determined based on the specified classification item. search for A second search step, and a third search step of specifying the related information included in the document searched in the second search step, and searching the first document group using the related information as a search condition; The phrase or classification item included in the document searched from the first document group in the third search step is specified, and the degree of coincidence with the word or classification item received as the search condition in the search reception step is calculated And an output step for outputting search result information indicating the degree of coincidence.
また、文書検索装置は、複数の文書で構成される第1の文書群を対象に検索した検索結果を利用して、複数の文書で構成される第2の文書群に含まれる文書を検索する装置であって、特定の語句、または、文書を分類する特定の分類項目を検索条件として受け付ける検索受付手段と、前記検索条件に基づいて、前記第1の文書群に含まれる所定の文書を検索する第1検索手段と、前記第1検索手段により検索された文書に含まれる、前記第1の文書群と前記第2の文書群を関係づける関連情報を特定し、該関連情報を検索条件として前記第2の文書群を検索し、該検索によって抽出された文書に付与された分類項目を特定し、該特定した分類項目に基づいて、再び第2の文書群を検索する第2検索手段と、前記第2検索手段により検索された文書に含まれる、前記関連情報を特定し、該関連情報を検索条件として、前記第1の文書群を検索する第3検索手段と、前記第3検索手段により検索された前記第1文書群内の文書に含まれる語句または分類項目を特定し、前記検索受付手段が受け付けた前記語句または分類項目との一致度を算出し、該一致度を示す検索結果情報を出力する出力手段とを備える。 In addition, the document search apparatus searches for a document included in the second document group including a plurality of documents by using a search result obtained by searching the first document group including a plurality of documents. A device that accepts a specific word or phrase or a specific classification item for classifying a document as a search condition, and searches for a predetermined document included in the first document group based on the search condition First retrieval means, and related information relating to the first document group and the second document group included in the document retrieved by the first retrieval means, and using the relevant information as a search condition Second search means for searching the second document group, specifying a classification item given to the document extracted by the search, and searching the second document group again based on the specified classification item; , Searched by the second search means A third search means for searching for the first document group using the related information as a search condition, and within the first document group searched by the third search means. Output means for specifying a phrase or classification item included in the document, calculating a matching degree with the phrase or classification item received by the search receiving means, and outputting search result information indicating the matching degree.
また、記憶媒体に記憶された文書検索プログラムは、コンピュータを、特定の語句、または、文書を分類する特定の分類項目を検索条件として受け付ける検索受付手段と、前記検索条件に基づいて、前記第1の文書群に含まれる所定の文書を検索する第1検索手段と、前記第1検索手段により検索された文書に含まれる、前記第1の文書群と前記第2の文書群を関係づける関連情報を特定し、該関連情報を検索条件として前記第2の文書群を検索し、該検索によって抽出された文書に付与された分類項目を特定し、再びする第2検索手段と、前記第2検索手段により検索された文書に含まれる、前記関連情報を特定し、該関連情報を検索条件として、前記第1の文書群を検索する第3検索手段と、前記第3検索手段により検索された前記第1文書群内の文書に含まれる語句または分類項目を特定し、前記検索手段が受け付けた前記語句または分類項目との一致度を算出し、該一致度を示す検索結果情報を出力する出力手段として機能させる。 In addition, the document search program stored in the storage medium may be configured such that the computer accepts a specific word / phrase or a specific classification item for classifying the document as a search condition, and the first search based on the search condition. First search means for searching for a predetermined document included in the document group, and related information relating the first document group and the second document group included in the document searched by the first search means A second search means for searching the second document group using the related information as a search condition, specifying a classification item assigned to the document extracted by the search, and the second search Specifying the related information contained in the document searched by the means, and using the related information as a search condition, a third search means for searching the first document group, and the search performed by the third search means First Function as output means for specifying a phrase or classification item included in a document in a book group, calculating a degree of coincidence with the word or classification item received by the search means, and outputting search result information indicating the degree of coincidence Let
本発明によれば、複数の文書で構成される第1の文書群を対象に検索した検索結果を利用して、複数の文書で構成される第2の文書群に含まれる文書を検索することができる。 According to the present invention, a document included in a second document group composed of a plurality of documents is retrieved using a search result obtained by searching the first document group composed of a plurality of documents. Can do.
以下、本発明の実施の形態について図面を参照しつつ説明する。 Embodiments of the present invention will be described below with reference to the drawings.
実施の形態1.
本実施の形態においては、文献を特許公報とし、文献に付与された分類コードの検索を行う特許文献検索装置を例にして説明する。また、この特許文献検索装置は、日本語のキーワード、または日本において有効な特許分類に基づいて、基づくキーワードまたは特許分類に適合するUSCまたはIPC分類を検索するものであるが、あくまで一例であり、国(日本と米国)及び特許分類により限定するものではない。
また、本発明は、特許文献検索装置に限定されるものではなく、文書の分類する分類体系を利用する各種文書検索装置であれば、本実施例同様に実現可能である。
In the present embodiment, a description will be given by taking as an example a patent document search apparatus that searches for a classification code assigned to a document, with the document being a patent publication. In addition, this patent document search device searches a USC or IPC classification that matches a keyword or patent classification based on a Japanese keyword or a patent classification effective in Japan, but is merely an example. It is not limited by country (Japan and US) and patent classification.
Further, the present invention is not limited to the patent document search apparatus, and can be realized in the same manner as the present embodiment as long as it is various document search apparatuses that use a classification system for classifying documents.
まず、本実施の形態に係る文献検索装置の構成について説明する。 First, the configuration of the document search apparatus according to this embodiment will be described.
図1は、実施の形態1に係る特許文献検索装置の構成の一例を示すブロック図である。この特許文献検索装置は、検索の制御を行う制御部1(抽出部、一致度算出部、対応付け部)、特許文献の検索を行う検索部2(第1検索部、第2検索部、第3検索部)、ユーザからの入力キー情報などを受け付ける入力部3(キー情報取得部)、ユーザへの表示を行う表示部4、入力キー情報や検索結果などを記憶する記憶部5、日本(第1国)の特許文献を管理する日本特許文献DB(Database)6、米国(第2国)の特許文献を管理する米国特許文献DB7を備える。
FIG. 1 is a block diagram showing an example of the configuration of the patent document search apparatus according to the first embodiment. This patent document search apparatus includes a control unit 1 (extraction unit, coincidence calculation unit, association unit) that performs search control, and a search unit 2 (first search unit, second search unit, first search unit) that searches patent documents. 3 search unit), an input unit 3 (key information acquisition unit) for receiving input key information from the user, a
次に、本実施の形態に係る特許文献検索装置の動作について説明する。図2は、実施の形態1に係る特許文献検索装置の動作を示すフローチャートである。また、図3は、分類コード抽出の一例を示す図である。また、図4は、分類コード検索の一例を示す図である。また、図5は、キーワードを入力とした場合のキーワード抽出及び集計の一例を示す図である。また、図6は、分類コードを入力とした場合のキーワード抽出及び集計の一例を示す図である。以下、図3〜6を参照しつつ、図2のフローチャートを説明する。なお、以下の説明において、検索部は、日本特許文献(第1国の特許文献)を検索する場合は日本特許文献DB、米国特許文献(第2国の特許文献)を検索する場合は米国特許文献DBに対してそれぞれアクセスしているものとする。 Next, the operation of the patent document search apparatus according to this embodiment will be described. FIG. 2 is a flowchart showing the operation of the patent document search apparatus according to the first embodiment. FIG. 3 is a diagram illustrating an example of classification code extraction. FIG. 4 is a diagram showing an example of classification code search. FIG. 5 is a diagram illustrating an example of keyword extraction and aggregation when keywords are input. FIG. 6 is a diagram illustrating an example of keyword extraction and aggregation when a classification code is input. Hereinafter, the flowchart of FIG. 2 will be described with reference to FIGS. In the following description, the search unit searches for a Japanese patent document DB when searching for a Japanese patent document (first country patent document), and a US patent when searching for a US patent document (second country patent document). Assume that each document DB is accessed.
まず、入力部3は、ユーザからの入力キー情報(キーワード、またはIPC、FI、Fタームなどの分類コード、キー情報)を受け付けて制御部1に渡し、制御部1は、入力キー情報を記憶部5に格納すると共に、検索部2に対して後述する米国特許文献検索処理の実行を指示し、検索部2は米国特許文献検索処理を実行する(S101、第1検索ステップ、第2検索ステップ)。この米国特許文献検索処理は、日本語のキーワード、またはUSC以外の分類コードである入力キー情報から米国特許文献を検索する処理であり、この処理によって、得られた米国特許文献を米国特許文献集合とする。
First, the
米国特許文献集合が得られると、制御部1は、図3に示すように米国特許文献集合の各特許文献に付された分類コードを抽出する(S102、第2検索ステップ)。なお、分類コードの抽出において、制御部1は、分類コードの階層性を考慮して1つの分類コードを複数階層の分類コードとして抽出する。例えば、分類コードがIPCであれば、上位からセクション、クラス、サブクラス、メイングループ、サブグループという階層があり、上位の階層ほど大まかな分類であり、下位の階層ほど細かな分類である。図3を例とすると、米国特許文献に付されたIPCの分類コードであるB25J5/00が抽出された場合、この分類コードはB25J(サブクラス)、B25J5/(メイングループ)、B25J5/00(サブグループ)のそれぞれが分類コードとして抽出される。
When the US patent document set is obtained, the
このように、米国特許文献集合の各特許文献に付された分類コードにより再び米国特許文献DB7を検索することにより、検索モレを防ぐことができる。また、得られた分類コードの上位階層の分類コードにより米国特許文献DB7を検索することにより、さらに広い範囲の特許文献を検索することができる。 In this way, searching the US patent document DB 7 again by using the classification code attached to each patent document in the US patent document set can prevent search leakage. Further, a wider range of patent documents can be retrieved by searching the US patent document DB 7 using the higher-level classification codes of the obtained classification codes.
米国特許文献集合から分類コードが抽出されると、制御部1は、抽出した分類コード候補の集計及びランキングを行い、抽出した分類コードの順位付きのリストである分類コードリストを作成する(S103、第2検索ステップ)。この分類コードリストは、例えば、100件 B25J、35件 B25J5/、10件 A63H…、というように、件数が高い順に分類コードが並べられたものである。
When a classification code is extracted from a set of US patent documents, the
次に制御部1は、分類コードリストのそれぞれの分類コードを順次入力とする。この際、制御部1は、入力とする分類コードがあるかどうかを判断する(S104)。
Next, the
入力とする分類コードがある場合(S104、YES)、制御部1は、検索部2に対して、入力とした分類コードを含んだ米国特許文献の検索を指示し、検索部2は、図4に示すように、米国特許文献DB7のインデックスファイル(索引テーブル)を使用して、入力とした分類コードに基づいて米国特許文献を検索する(S105、第2検索ステップ)。なお、ここで検索された米国特許文献を総称して、第2米国特許文献集合とする。
When there is a classification code to be input (S104, YES), the
次に、制御部1は、検索部2に対して、後述する日本特許文献検索処理の実行を指示し、検索部2は日本特許文献検索処理を実行する(S106)。この日本特許文献検索処理は第2米国特許文献集合に対応する日本特許文献である第2日本特許文献集合を検索する処理である。
Next, the
検索部2により日本特許文献検索処理が実行され、第2米国特許文献集合に対応する第2日本特許文献集合が検索されると、制御部1は、図5(ユーザによる入力がキーワードである場合の例)、または図6(ユーザによる入力が分類コードである場合の例)に示すように、この第2日本特許文献集合のそれぞれの日本特許文献からキー(キーワード、または分類コード)の抽出、集計、ランキングを行い、キーの順位付きのリストであるキー情報リストを作成する(S107、抽出ステップ)。このキー情報リストは、ユーザによる入力がキーワードである場合、100件 ロボット、35件 歩行、10件 玩具…というように、件数が高い順にキーワードが並べられたものとなる。一方、ユーザによる入力が分類コードである場合、キー情報リストは、100件 B25J5/00、35件 A63H11/18、10件 B62D52/02…というように、件数が高い順に分類コードが並べられたものとなる。また、このキー情報リストは第2日本特許文献集合の日本特許文献が対応する米国特許文献のUSC(またはIPC)分類コードと対応付けられているものとする。
When the Japanese patent document search process is executed by the
次に、制御部1は、後述する適合性判定処理を実行する(S108、一致度算出ステップ、対応付けステップ)。この適合性判定処理は、記憶部5に格納された入力キー情報とキー情報リストを比較し、分類コードの適合性を判定する処理である。
Next, the
適合性判定処理により、分類コードリスト内の分類コードの適合性が判定されると、制御部1は、分類コードリストのうち、次に入力とする分類コードがあるかどうかを判断する(S104)。
When the suitability determination process determines the suitability of the classification codes in the classification code list, the
この判断において、次に入力とする分類コードがない場合(S104,NO)
制御部1は、後述する適合性判定結果表示処理を実行する(S109)。この適合性判定結果表示処理は、適合性判定処理により判定された分類コードリスト内のそれぞれの分類コードに対する適合性を表示部4に表示させる処理である。
In this determination, when there is no classification code to be input next (S104, NO)
The
上述の動作によって、ユーザによって入力されたキーワード、または日本特有の分類コードであるFIやFターム、国際特許分類であるIPCの分類コード(これらの分類を第1の分類とする)に基づいて、これらに対応する米国特許分類であるUSCまたはIPCの分類コードを検索することができる。以下、図2のフローチャートにおける米国特許文献検索処理、日本対応特許検索処理、適合性判定処理、適合性判定結果表示処理の動作についてそれぞれ説明する。 Based on the keyword input by the user, FI or F-term that is a classification code unique to Japan, or an IPC classification code that is an international patent classification (these classifications are set as the first classification) by the above-described operation, The USC or IPC classification codes corresponding to these US patent classifications can be searched. Hereinafter, operations of the US patent document search process, the Japanese patent search process, the suitability determination process, and the suitability determination result display process in the flowchart of FIG. 2 will be described.
まず、図2のフローチャートにおけるステップS101の動作である米国特許文献検索処理について説明する。図7は、米国特許文献検索処理の動作を示すフローチャートである。また、図8は、キーワードによる日本特許文献の検索の一例を示す図である。また、図9は、分類コードによる日本特許文献の検索の一例を示す図である。また、図10は、引用情報の抽出の一例を示す図である。以下、図8〜10を参照しつつ、図7のフローチャートを説明する。 First, the US patent document search process that is the operation of step S101 in the flowchart of FIG. 2 will be described. FIG. 7 is a flowchart showing the operation of the US patent document search process. Moreover, FIG. 8 is a figure which shows an example of the search of the Japanese patent document by a keyword. FIG. 9 is a diagram showing an example of a search for Japanese patent documents using classification codes. FIG. 10 is a diagram illustrating an example of extraction of citation information. Hereinafter, the flowchart of FIG. 7 will be described with reference to FIGS.
まず、検索部2は、制御部1より米国特許文献検索処理の指示を受けると、図8(ユーザがキーワードを入力した場合)、または図9(ユーザが分類コードを入力した場合)に示すように、ユーザにより入力部3に入力されたキーである入力キー情報(キーワード、または分類コード)に基づいて、日本特許文献DBを検索する(S201、第1検索ステップ)。この検索において検索された日本特許文献を第1日本特許文献集合とする。
First, when the
検索部2により、日本特許文献が検索されると、制御部1は、第1日本特許文献集合のそれぞれの日本特許文献から、日本特許文献内で引用されている米国特許文献の特許番号である第1引用情報(第1関連情報)を抽出する(S202、第2検索ステップ)。
When the Japanese patent document is searched by the
さらに、検索部2は、抽出した第1引用情報に基づいて、米国特許文献DB7を検索する(S203、第2関連ステップ)。この検索結果である米国特許文献を米国特許文献集合とする。
Further, the
この米国特許文献検索処理によって、日本特許文献に対応する米国特許文献を検索することができる。 By this US patent document search process, a US patent document corresponding to a Japanese patent document can be searched.
次に、図2のフローチャートにおけるステップS106の動作である日本特許文献検索処理について説明する。図11は、日本特許文献検索処理の動作を示すフローチャートである。また、図12は、日本特許文献検索処理の一例を示す図である。 Next, the Japanese Patent Literature search process that is the operation of Step S106 in the flowchart of FIG. 2 will be described. FIG. 11 is a flowchart showing the operation of the Japanese patent document search process. FIG. 12 is a diagram illustrating an example of a Japanese patent document search process.
まず、制御部1は、図12に示すように、第2米国特許文献集合のそれぞれの米国特許文献内で引用されている日本特許文献の特許番号である第2引用情報(第2関連情報)を抽出する(S301、第3検索ステップ)。
First, as shown in FIG. 12, the
さらに、制御部1は、抽出した第2引用情報に基づいて、日本特許文献DB6を検索する(S302、第3検索ステップ)。この検索結果である日本特許文献を第2日本特許集合とする。
Further, the
この日本特許文献検索処理によって、米国特許文献に対応する日本特許文献を検索することができる。 By this Japanese patent document search process, a Japanese patent document corresponding to the US patent document can be searched.
次に、図2のステップS108の動作である適合性判定処理について説明する。図13は、適合性判定処理の動作を示すフローチャートである。また、図14は、入力キー情報と抽出キー情報のマッチングの一例を示す図である。また、図15は、抽出キー情報のスコアリングの一例を示す図である。 Next, the suitability determination process that is the operation of step S108 in FIG. 2 will be described. FIG. 13 is a flowchart showing the operation of the suitability determination process. FIG. 14 is a diagram illustrating an example of matching between input key information and extracted key information. FIG. 15 is a diagram illustrating an example of scoring of extracted key information.
まず、制御部1は、記憶部5に格納した入力キー情報を読み出し、第2日本特許文献集合のそれぞれの日本特許文献において一定数以上頻出する単語、または第2日本特許文献のそれぞれの日本特許文献に付与された分類コードを抽出キー情報として抽出し、入力キー情報と抽出キー情報を完全一致、部分一致の2通りの方法で比較する(S401、一致度算出ステップ)。具体的には、図14に示すように、例えば入力キー情報が“音声認識”というキーワードである場合、制御部1はこの入力キー情報を“音声”と“認識”に分け、抽出キー情報の“音声”、“認識”を部分一致とし、“音声認識”、“音声認識装置”を完全一致とする。また、入力キー情報が“B25J5/00”という分類コードである場合は、この入力キー情報を“B25J”、“B25J5”、…というように階層別に分け、抽出キー情報のB25J、B25J5を部分一致とし、B25J5/00を完全一致とする。なお、この抽出キーは抽出元である日本特許文献と対応する米国特許文献の分類コードと対応付けられているものとする。
First, the
さらに、制御部1は、キー情報リスト内のキーワードまたは分類コードの完全一致及び部分一致の抽出キー情報の有無でスコアを計算する(S402、一致度算出ステップ、対応付けステップ)。例えば、図15に示すように、部分一致の抽出キー情報に対して1ポイント、完全一致の抽出キー情報に対して2ポイント、それ以外の抽出キー情報は0ポイントとし、704/275に対応する抽出キー情報のスコアを全て加算して704/275のスコアとする。また、部分一致、完全一致の数は考慮せずに、抽出キー情報が完全一致を含む場合は2ポイント、部分一致のみを含む場合は1ポイントとしても良い。また、抽出キー情報における順位を加味し、例えば、1位のキーワードが部分一致または完全一致ならばそのキーワードに対するポイントを10倍、2位のキーワードが部分一致または完全一致ならばそのキーワードに対するポイントを9倍というように、順位に応じてポイント数を変えても良い。また、これらのスコア計算方法を組み合わせても良い。
Further, the
この適合性判定処理によって、入力キー情報に対応する分類コードの適合性を判定することができる。 With this suitability determination process, the suitability of the classification code corresponding to the input key information can be determined.
次に、図2のフローチャートにおけるステップS109の動作を示す適合性判定結果表示処理について説明する。図16は、結果表示画面を示す図である。 Next, the suitability determination result display process showing the operation of step S109 in the flowchart of FIG. 2 will be described. FIG. 16 is a diagram illustrating a result display screen.
キー情報リスト内の全ての分類コードに対して適合性判定処理が為されると、制御部1は、図16に示すように、例えば、米国特許文献の分類コードであるUSC毎に適合性判定結果の一致度を示す検索結果画面を表示する。この表示において、各行は分類コードを表し、各列は、順位、ヒット件数、全体件数、関連度、相対スコア、USC、関連キーを表す。
図16の例では、検索条件である入力キー情報に対する関連度の高い順に並べられているが、本発明の実施形態に直接的に関係する適合性判定結果の一致度については、その一致度の高低によって、USCの文字色を変化させることで表示している。
When the suitability determination process is performed for all the classification codes in the key information list, the
In the example of FIG. 16, they are arranged in descending order of the degree of relevance with respect to the input key information that is a search condition. It is displayed by changing the character color of USC depending on the height.
関連度は、全文献における入力キー情報の出現頻度と、キー情報リスト内のそれぞれの分類コードの出現頻度との積であり、最も大きい関連度の値を1.00とする。また、順位は関連度が大きい分類コードから付けられた順位である。また、ヒット件数は、(分類コードが出現する件数)/(入力キー情報がヒットした文献数)の形式で表示される。すなわち、(入力キー情報がヒットした文献数)とは、日本の特許文献が含む関連情報から導き出された米国の特許文献の検索結果件数であり、(分類コードが出現する件数)とは、この米国の特許文献の検索結果件数の内で、各行の分類コードであるUSCが出現する件数である。また、全体件数は、全ての米国特許文献の中で、各行の分類コードを持つ文献の全体数である。また、相対スコアは、関連度を最大値に対する相対値に変換し、棒グラフで表したものである。また、USCは、キー情報リストに含まれる米国特許分類の分類コードである。また、関連キーは、各行の分類コードを含む米国特許文献に対応する日本特許文献において一定数以上頻出する単語であり、各行の分類コードと対応付けられた抽出キー情報である。なお、この関連キーは、入力キー情報がキーワードである場合に表示されるものであり、入力キー情報が分類コードである場合は、分類コードが表示される。 The relevance is the product of the appearance frequency of the input key information in all documents and the appearance frequency of each classification code in the key information list, and the largest relevance value is 1.00. The rank is a rank assigned from a classification code having a high degree of association. The number of hits is displayed in the form of (number of occurrences of classification code) / (number of documents hit by input key information). In other words, (the number of documents in which the input key information is hit) is the number of search results of US patent documents derived from related information included in Japanese patent documents, and (the number of classification codes appears) is This is the number of cases where USC, which is the classification code of each row, appears in the number of search results of US patent documents. The total number of documents is the total number of documents having a classification code in each row among all US patent documents. The relative score is a bar graph obtained by converting the degree of association into a relative value with respect to the maximum value. USC is a classification code of the US patent classification included in the key information list. Further, the related key is a word that appears more than a certain number in Japanese patent documents corresponding to US patent documents including the classification code of each row, and is extracted key information associated with the classification code of each row. This related key is displayed when the input key information is a keyword, and when the input key information is a classification code, a classification code is displayed.
関連キーにおけるそれぞれの抽出キーは、上述した適合性判定処理における判定によって、表示される色が異なる。例えば、入力キー情報に対して、完全一致の抽出キーは赤で表示され、部分一致の抽出キーはオレンジで表示され、不一致の抽出キーは黒で表示される。また、USCも同様に対応する関連キーのスコアに応じて、表示される色が異なる。例えば、関連キーのスコアが3ポイント以上である場合は赤で表示され、関連キーのスコアが2ポイントである場合はオレンジで表示され、関連キーのスコアが1ポイントである場合は黄色で表示され、関連キーのスコアが0ポイントである場合は黒で表示される。 Each extracted key in the related key is displayed in a different color depending on the determination in the suitability determination process described above. For example, with respect to the input key information, an extraction key with a perfect match is displayed in red, an extraction key with a partial match is displayed in orange, and an extraction key with a mismatch is displayed in black. Similarly, USC also displays different colors depending on the score of the corresponding key. For example, if the related key score is 3 points or more, it is displayed in red, if the related key score is 2 points, it is displayed in orange, and if the related key score is 1 point, it is displayed in yellow. When the score of the related key is 0 point, it is displayed in black.
以上の構成及び動作によって、日本語のキーワードまたは日本における特許分類(IPC分類を含む)を入力として、入力に適合する米国特許分類(またはIPC分類)を検索することができる。 With the above configuration and operation, it is possible to search for a US patent classification (or IPC classification) that matches the input, using Japanese keywords or Japanese patent classification (including IPC classification) as input.
実施の形態2.
実施の形態1においては、入力キー情報に基づいて検索された日本特許文献の引用情報を用いて米国特許文献を検索し、また米国特許文献の引用情報を用いて対応する日本特許文献を検索したが、本実施の形態は、引用情報の代わりにPCT出願情報を用いる点が実施の形態1とは異なる。以下、実施の形態1とは異なる動作について説明する。 In the first embodiment, the US patent document is searched using the cited information of the Japanese patent document searched based on the input key information, and the corresponding Japanese patent document is searched using the cited information of the US patent document. However, the present embodiment is different from the first embodiment in that PCT application information is used instead of citation information. Hereinafter, operations different from those of the first embodiment will be described.
本実施の形態に係る特許文献検索装置は、米国特許文献検索処理及び日本特許文献検索処理の動作が実施の形態1に係る特許文献検索装置とは異なる。まず、本実施の形態に係る日本特許文献検索処理の動作について以下の図を用いて説明する。図17は実施の形態2に係る日本特許文献検索処理の動作を示すフローチャートである。また、図18は、PCT出願情報の抽出の一例を示す図である。 The patent document search apparatus according to the present embodiment is different from the patent document search apparatus according to the first embodiment in the operations of the US patent document search process and the Japanese patent document search process. First, the operation of the Japanese patent document search process according to the present embodiment will be described with reference to the following diagram. FIG. 17 is a flowchart showing the operation of the Japanese patent document search process according to the second embodiment. FIG. 18 is a diagram illustrating an example of extraction of PCT application information.
まず、検索部2は、制御部1より米国特許文献検索処理の指示を受けると、図8(ユーザがキーワードを入力した場合)、または図9(ユーザが分類コードを入力した場合)に示すように、ユーザにより入力部3に入力されたキーである入力キー情報(キーワード、または分類コード)に基づいて、日本特許文献DBを検索する(S501、第1検索ステップ)。この検索において検索された日本特許文献を第1日本特許文献集合とする。
First, when the
検索部2により日本特許文献が検索されると、制御部1は、図18に示すように、第1日本特許文献集合におけるPCT出願、または優先権主張としての日本特許文献に対応する米国特許文献を示す情報である第1PCT出願情報(第1関連情報)を抽出する(S502、第2検索ステップ)。
When the Japanese patent document is searched by the
さらに、検索部2は、抽出したPCT出願情報に基づいて、米国特許文献DB7を検索する(S503、第2検索ステップ)。この検索結果である米国特許文献を米国特許文献集合とする。
Further, the
次に、本実施の形態に係る米国特許文献検索処理の動作について以下の図を用いて説明する。図19は実施の形態2に係る日本特許文献検索処理の動作を示すフローチャートである。また、図20は、PCT出願情報の抽出の一例を示す図である。 Next, the operation of the US patent document search process according to the present embodiment will be described with reference to the following diagram. FIG. 19 is a flowchart showing the operation of the Japanese patent document search process according to the second embodiment. FIG. 20 is a diagram illustrating an example of extraction of PCT application information.
まず、制御部1は、図19に示すように、第2米国特許文献集合におけるPCT出願、または優先権主張としての米国特許文献に対応する日本特許文献を示す情報である第2PCT出願情報(第2関連情報)を抽出する(S501、第3検索ステップ)。
First, as shown in FIG. 19, the
さらに、制御部1は、抽出した第2PCT出願情報に基づいて、日本特許文献DB6を検索する(S502、第3検索ステップ)。この検索結果である日本特許文献を第2日本特許集合とする。
Further, the
上述したように、本実施の形態に係る特許文献検索装置は、PCT出願、または優先権主張としての特許文献に対応する特許文献を検索することで、適合する他国の特許文献を検索することができ、引用文献に比べてより適合する特許文献を検索することができる。 As described above, the patent document search apparatus according to the present embodiment can search for a patent document corresponding to a PCT application or a patent document as a priority claim, thereby searching for a patent document in another country that matches. It is possible to search for a patent document that is more suitable than the cited document.
実施の形態3.
実施の形態2においては、引用情報の代わりにPCT出願情報を用いたが、本実施の形態は、引用情報の代わりにIPC分類を用いる点が実施の形態2とは異なる。以下、実施の形態2とは異なる動作について説明する。 In the second embodiment, PCT application information is used instead of the citation information. However, this embodiment is different from the second embodiment in that the IPC classification is used instead of the citation information. Hereinafter, operations different from those of the second embodiment will be described.
本実施の形態に係る特許文献検索装置は、米国特許文献検索処理及び日本特許文献検索処理の動作が実施の形態2に係る特許文献検索装置とは異なる。まず、本実施の形態に係る日本特許文献検索処理の動作について以下の図を用いて説明する。図21は実施の形態3に係る日本特許文献検索処理の動作を示すフローチャートである。また、図22は、IPC分類の抽出の一例を示す図である。 The patent document search apparatus according to the present embodiment is different from the patent document search apparatus according to the second embodiment in the operations of the US patent document search process and the Japanese patent document search process. First, the operation of the Japanese patent document search process according to the present embodiment will be described with reference to the following diagram. FIG. 21 is a flowchart showing the operation of the Japanese patent document search process according to the third embodiment. FIG. 22 is a diagram illustrating an example of IPC classification extraction.
まず、検索部2は、制御部1より米国特許文献検索処理の指示を受けると、図8(ユーザがキーワードを入力した場合)、または図9(ユーザが分類コードを入力した場合)に示すように、ユーザにより入力部3に入力されたキーである入力キー情報(キーワード、または分類コード)に基づいて、日本特許文献DBを検索する(S701、第1検索ステップ)。この検索において検索された日本特許文献を第1日本特許文献集合とする。
First, when the
検索部2により日本特許文献が検索されると、制御部1は、図22に示すように第1日本特許文献集合におけるIPC分類(第1関連情報)を抽出する(S702、第2検索ステップ)。
When the
さらに、検索部2は、抽出したIPC分類に基づいて、米国特許文献DB7を検索する(S703、第2検索ステップ)。この検索結果である米国特許文献を米国特許文献集合とする。
Further, the
次に、本実施の形態に係る米国特許文献検索処理の動作について以下の図を用いて説明する。図23は実施の形態3に係る日本特許文献検索処理の動作を示すフローチャートである。また、図24は、IPC分類の抽出の一例を示す図である。 Next, the operation of the US patent document search process according to the present embodiment will be described with reference to the following diagram. FIG. 23 is a flowchart showing the operation of the Japanese patent document search process according to the third embodiment. FIG. 24 is a diagram illustrating an example of IPC classification extraction.
まず、制御部1は、図24に示すように、第2米国特許文献集合におけるIPC分類(第2関連情報)を抽出する(S801、第3検索ステップ)。
First, as shown in FIG. 24, the
さらに、制御部1は、抽出したIPC分類に基づいて、日本特許文献DB6を検索する(S802、第3検索ステップ)。この検索結果である日本特許文献を第2日本特許集合とする。
Further, the
上述したように、本実施の形態に係る特許文献検索装置は、国際的に規定された分類であるIPC分類を用いることによって、適合する他国の特許文献を検索することができ、少なくともIPC分類においては同様の分類が付された特許文献を検索することができる。また、抽出したIPC分類に対して、例えば、多くの特許に付与されているIPC分類に対しては低い重みを付け、少数の特許に付与されているIPC分類に対しては高い重みを付ける、というように、その頻度に基づいて重み付けを行い、一定以上の重み付けがなされたIPC分類だけを検索に用いても構わない。 As described above, the patent document search apparatus according to the present embodiment can search for patent documents in other countries that are compatible by using the IPC classification that is an internationally defined classification, and at least in the IPC classification. Can search patent documents with the same classification. Further, for the extracted IPC classification, for example, a low weight is given to the IPC classification given to many patents, and a high weight is given to the IPC classification given to a small number of patents. As described above, weighting is performed based on the frequency, and only the IPC classification with a certain weight or more may be used for the search.
実施の形態4.
上述した実施の形態において、日本特許文献から米国特許文献を検索するための情報(第1関連情報、第2関連情報)として、引用情報、PCT出願情報、IPC分類をそれぞれ用いたが、本実施の形態においては、日本特許文献から米国特許文献を検索するための情報(第1関連情報)と、米国特許文献から日本特許文献を検索するための情報(第2関連情報)は、それぞれ異なる情報を選択することができる。図25は、条件設定画面の例を示す図である。
In the above-described embodiment, citation information, PCT application information, and IPC classification are used as information (first related information and second related information) for searching US patent documents from Japanese patent documents. In the embodiment, information (first related information) for searching US patent documents from Japanese patent documents and information (second related information) for searching Japanese patent documents from US patent documents are different information. Can be selected. FIG. 25 is a diagram illustrating an example of a condition setting screen.
検索のためのキー情報の入力において、制御部1が図25に示すような条件設定画面を表示部4に表示させることによって、本実施の形態に係る特許文献検索装置は、日本特許文献から米国特許文献を検索するための情報と、米国特許文献から日本特許文献を検索するための情報をそれぞれユーザに選択させることができる。また、図25において、一次検索は米国特許文献検索処理の条件を示し、二次検索は日本特許文献検索処理の条件を示す。条件が設定されると、本実施の形態に係る特許文献検索装置は、設定に応じて実施の形態1、実施の形態2、実施の形態3において説明した米国特許文献検索処理、日本特許文献検索処理をそれぞれ実行する。
In inputting key information for search, the
上述したように、米国特許文献検索処理、日本特許文献検索処理において、検索のために用いる情報をそれぞれ選択可能にすることで、検索する文献の幅を調節することができる。例えば、米国特許文献検索処理においてIPC分類を用いると、同様のIPC分類の文献を検索するため、入力キー情報に対して確度の高い米国特許文献を検索することができる。また、日本特許文献検索処理において引用情報を用いると、異なる分類であっても内容の近い米国特許文献を検索することができる。 As described above, in the US patent document search process and the Japanese patent document search process, it is possible to adjust the width of documents to be searched by enabling selection of information used for the search. For example, when the IPC classification is used in the US patent document search process, a document having a similar IPC classification is searched, and therefore, a US patent document with high accuracy can be searched for the input key information. Further, when citation information is used in the Japanese patent document search process, it is possible to search for US patent documents having similar contents even in different classifications.
また、本実施の形態に係る文献検索装置は、情報処理装置に容易に適用することができ、情報処理装置の性能をより高めることができる。ここで、情報処理装置には、例えばサーバ、PC(Personal Computer)等が含まれ得る。 Further, the document retrieval apparatus according to the present embodiment can be easily applied to the information processing apparatus, and can further improve the performance of the information processing apparatus. Here, the information processing apparatus may include, for example, a server, a PC (Personal Computer), and the like.
更に、特許文献検索装置を構成するコンピュータにおいて上述した各ステップを実行させるプログラムを、特許文献検索プログラムとして提供することができる。上述したプログラムは、コンピュータにより読取り可能な記録媒体に記憶させることによって、特許文献検索装置を構成するコンピュータに実行させることが可能となる。ここで、上記コンピュータにより読取り可能な記録媒体としては、ROMやRAM等のコンピュータに内部実装される内部記憶装置、CD−ROMやフレキシブルディスク、DVDディスク、光磁気ディスク、ICカード等の可搬型記憶媒体や、コンピュータプログラムを保持するデータベース、或いは、他のコンピュータ並びにそのデータベースや、更に回線上の伝送媒体をも含むものである。 Furthermore, a program for executing the above steps in a computer constituting the patent document search device can be provided as a patent document search program. By storing the above-described program in a computer-readable recording medium, the computer constituting the patent document search apparatus can be executed. Here, examples of the recording medium readable by the computer include an internal storage device such as a ROM and a RAM, a portable storage such as a CD-ROM, a flexible disk, a DVD disk, a magneto-optical disk, and an IC card. It includes a medium, a database holding a computer program, another computer and its database, and a transmission medium on a line.
(付記1) 複数の文書で構成される第1の文書群を対象に検索した検索結果を利用して、複数の文書で構成される第2の文書群に含まれる文書を検索する文書検索方法であって、
コンピュータが、
特定の語句、または、文書を分類する特定の分類項目を検索条件として受け付ける検索受付ステップと、
前記検索条件に基づいて、前記第1の文書群に含まれる所定の文書を検索する第1検索ステップと、
前記第1検索ステップにおいて検索された文書に含まれる、前記第1の文書群と前記第2の文書群を関連づける関連情報を特定し、該関連情報を検索条件として前記第2の文書群を検索し、該検索によって抽出された文書に付与された分類項目を特定し、該特定された分類項目に基づいて再び第2の文書群を検索する第2検索ステップと、
前記第2検索ステップにおいて検索された文書に含まれる、前記関連情報を特定し、該関連情報を検索条件として、前記第1の文書群を検索する第3検索ステップと、
前記第3検索ステップにおいて前記第1の文書群から検索された文書に含まれる語句または分類項目を特定し、前記検索受付ステップにおいて検索条件として受け付けた前記語句または分類項目との一致度を算出し、該一致度を示す検索結果情報を出力する出力ステップ、
から構成されることを特徴とする文書検索方法。
(付記2) 付記1に記載の文書検索方法であって、
前記第2検索ステップ、または、前記第3検索ステップにおいて、関連情報として、前記第1の文書群と前記第2の文書群に共通する文献識別情報を特定する
ことを特徴とする文書検索方法。
(付記3) 付記1に記載の文書検索方法であって、
前記第2検索ステップ、または、前記第3検索ステップにおいて、関連情報として、前記第1の文書群と前記第2の文書群に共通する分類項目を特定することを特徴とする文書検索方法。
(付記4) 付記1に記載の文書検索方法であって、
前記第2検索ステップ、または、前記第3検索ステップにおいて、前記関連情報として、前記第1または前記第2の文書群のうちのいずれか一方の文書群から検索された前記文書において引用される他方の文書群内の文書を特定することを特徴とする文書検索方法。
(付記5) 付記1乃至付記4のいずれかに記載の文書検索方法であって、
前記第2検索ステップにおいて、前記関連情報に基づいて前記第2の文書群を検索し、該検索によって抽出された文書について、該抽出文書に付与された、前記第1の文書群で使用される分類体系とは異なる分類体系の分類項目を特定し、該特定された分類項目に基づいて、再び第2の文書群を検索することを特徴とする文書検索方法。
(付記6) 付記1に記載の文書検索方法であって、
前記第2検索ステップにおいては、前記抽出された文書に付与された前記分類項目を複数特定し、該特定された各々の分類項目を検索条件として再び第2の文書群を検索し、
前記第3検索ステップにおいては、前記特定された分類項目毎に、検索された文書に含まれる前記関連情報を検索条件として、前記第1の文書群を検索し、
前記出力ステップにおいては、前記特定された分類項目毎に、前記第1の文書群から検索された文書に含まれる語句または分類項目を特定し、前記検索受付ステップにおいて検索条件として受け付けた前記語句または分類項目との一致度を算出し、前記第2検索ステップで特定された分類項目毎に該一致度を示す検索結果を出力する
ことを特徴とする文書検索方法。
(付記7) 付記2に記載の文書検索方法であって、
前記第1および第2の文書群に含まれる文書は、特許文献であり、
前記第1の文書群と前記第2の文書群に共通する文献識別情報は、特許文献のPCT出願情報である
ことを特徴とする文書検索方法。
(付記8) 付記3に記載の文書検索方法であって、
前記第1および第2の文書群に含まれる文書は、特許文献であり、
前記第1の文書群と前記第2の文書群に共通する分類項目は、特許文献を分類するIPC分類体系に準拠した分類項目であることを特徴とする文書検索方法。
(付記9) 付記4に記載の文書検索方法であって、
前記第1および第2の文書群に含まれる文書は、特許文献であり、
前記第1または第2の文書群のうちのいずれか一方の文書群から検索された特許文献において引用される、他方の文書群内の特許文献の識別番号を特定することを特徴とする文書検索方法。
(付記10) 複数の文書で構成される第1の文書群を対象に検索した検索結果を利用して、複数の文書で構成される第2の文書群に含まれる文書を検索する文書検索装置であって、
特定の語句、または、文書を分類する特定の分類項目を検索条件として受け付ける検索受付手段と、
前記検索条件に基づいて、前記第1の文書群に含まれる所定の文書を検索する第1検索手段と、
前記第1検索手段により検索された文書に含まれる、前記第1の文書群と前記第2の文書群を関係づける関連情報を特定し、該関連情報を検索条件として前記第2の文書群を検索し、該検索によって抽出された文書に付与された分類項目を特定し、該特定した分類項目に基づいて、再び第2の文書群を検索する第2検索手段と、
前記第2検索手段により検索された文書に含まれる、前記関連情報を特定し、該関連情報を検索条件として、前記第1の文書群を検索する第3検索手段と、
前記第3検索手段により検索された前記第1文書群内の文書に含まれる語句または分類項目を特定し、前記検索受付手段が受け付けた前記語句または分類項目との一致度を算出し、該一致度を示す検索結果情報を出力する出力手段と
を備える文書検索装置。
(付記11) 付記10に記載の文書検索装置であって、
前記第2検索手段、または、前記第3検索手段において、関連情報として、前記第1の文書群と前記第2の文書群に共通する文献識別情報を特定する
ことを特徴とする文書検索装置。
(付記12) 付記10に記載の文書検索装置であって、
前記第2検索手段、または、前記第3検索手段において、関連情報として、前記第1の文書群と前記第2の文書群に共通する分類項目を特定することを特徴とする文書検索装置。
(付記13) 付記10に記載の文書検索装置であって、
前記第2検索手段、または、前記第3検索手段において、前記関連情報として、前記第1または前記第2の文書群のうちのいずれか一方の文書群から検索された前記文書において引用される他方の文書群内の文書を特定することを特徴とする文書検索装置。
(付記14) 付記10乃至付記13のいずれかに記載の文書検索装置であって、
前記第2検索手段において、前記関連情報に基づいて前記第2の文書群を検索し、該検索によって抽出された文書について、該抽出文書に付与された、前記第1の文書群で使用される分類体系とは異なる分類体系の分類項目を特定し、該特定された分類項目に基づいて、再び第2の文書群を検索することを特徴とする文書検索装置。
(付記15) 付記10に記載の文書検索装置であって、
前記第2検索手段においては、前記抽出された文書に付与された前記分類項目を複数特定し、該特定された各々の分類項目を検索条件として再び第2の文書群を検索し、
前記第3検索手段においては、前記特定された分類項目毎に、検索された文書に含まれる前記関連情報を検索条件として、前記第1の文書群を検索し、
前記出力手段においては、前記特定された分類項目毎に、前記第1の文書群から検索された文書に含まれる語句または分類項目を特定し、前記検索受付手段において検索条件として受け付けた前記語句または分類項目との一致度を算出し、前記第2検索手段で特定された分類項目毎に該一致度を示す検索結果を出力することを特徴とする文書検索装置。
(付記16) 付記11に記載の文書検索装置であって、
前記第1および第2の文書群に含まれる文書は、特許文献であり、
前記第1の文書群と前記第2の文書群に共通する文献識別情報は、特許文献のPCT出願情報であることを特徴とする文書検索装置。
(付記17) 付記12に記載の文書検索装置であって、
前記第1および第2の文書群に含まれる文書は、特許文献であり、
前記第1の文書群と前記第2の文書群に共通する分類項目は、特許文献を分類するIPC分類体系に準拠した分類項目であることを特徴とする文書検索装置。
(付記18) 付記13に記載の文書検索装置であって、
前記第1および第2の文書群に含まれる文書は、特許文献であり、
前記第1または第2の文書群のうちのいずれか一方の文書群から検索された特許文献において引用される、他方の文書群内の特許文献の識別番号を特定することを特徴とする文書検索装置。
(付記19) コンピュータを、
特定の語句、または、文書を分類する特定の分類項目を検索条件として受け付ける検索受付手段と、
前記検索条件に基づいて、前記第1の文書群に含まれる所定の文書を検索する第1検索手段と、
前記第1検索手段により検索された文書に含まれる、前記第1の文書群と前記第2の文書群を関係づける関連情報を特定し、該関連情報を検索条件として前記第2の文書群を検索し、該検索によって抽出された文書に付与された分類項目を特定し、再びする第2検索手段と、
前記第2検索手段により検索された文書に含まれる、前記関連情報を特定し、該関連情報を検索条件として、前記第1の文書群を検索する第3検索手段と、
前記第3検索手段により検索された前記第1文書群内の文書に含まれる語句または分類項目を特定し、前記検索手段が受け付けた前記語句または分類項目との一致度を算出し、該一致度を示す検索結果情報を出力する出力手段
として機能させる文書検索プログラムが記録されたコンピュータ読み取り可能な記録媒体。
(付記20) 付記19に記載の文書検索プログラムが記録されたコンピュータ読み取り可能な記録媒体であって、
前記第2検索手段においては、前記抽出された文書に付与された前記分類項目を複数特定し、該特定された各々の分類項目を検索条件として再び第2の文書群を検索し、
前記第3検索手段においては、前記特定された分類項目毎に、検索された文書に含まれる前記関連情報を検索条件として、前記第1の文書群を検索し、
前記出力手段においては、前記特定された分類項目毎に、前記第1の文書群から検索された文書に含まれる語句または分類項目を特定し、前記検索受付手段において検索条件として受け付けた前記語句または分類項目との一致度を算出し、前記第2検索手段で特定された分類項目毎に該一致度を示す検索結果を出力する
ことを特徴とする文書検索プログラムが記録されたコンピュータ読み取り可能な記録媒体。
(Additional remark 1) The document search method which searches the document contained in the 2nd document group comprised from a some document using the search result searched for the 1st document group comprised from the some document as object Because
Computer
A search accepting step for accepting a specific classification item for classifying a specific word or phrase or document as a search condition;
A first search step of searching for a predetermined document included in the first document group based on the search condition;
The related information that associates the first document group with the second document group included in the document searched in the first search step is specified, and the second document group is searched using the related information as a search condition. A second search step of specifying a classification item given to the document extracted by the search, and searching the second document group again based on the specified classification item;
A third search step of identifying the related information included in the document searched in the second search step, and searching the first document group using the related information as a search condition;
The phrase or classification item included in the document searched from the first document group in the third search step is specified, and the degree of coincidence with the phrase or classification item received as the search condition in the search reception step is calculated. An output step for outputting search result information indicating the degree of coincidence;
A document search method characterized by comprising:
(Supplementary note 2) The document retrieval method according to
In the second search step or the third search step, document identification information common to the first document group and the second document group is specified as related information.
(Supplementary note 3) The document retrieval method according to
In the second search step or the third search step, a classification item common to the first document group and the second document group is specified as related information.
(Supplementary note 4) The document retrieval method according to
In the second search step or the third search step, as the related information, the other cited in the document searched from either one of the first document group or the second document group. A document search method characterized by specifying a document in a document group.
(Supplementary note 5) The document search method according to any one of
In the second search step, the second document group is searched based on the related information, and the document extracted by the search is used in the first document group given to the extracted document. A document search method characterized by specifying a classification item of a classification system different from the classification system, and searching the second document group again based on the specified classification item.
(Supplementary note 6) The document search method according to
In the second search step, a plurality of the classification items assigned to the extracted document are specified, and the second document group is searched again using each of the specified classification items as a search condition,
In the third search step, for each of the identified classification items, the first document group is searched using the related information included in the searched document as a search condition,
In the output step, for each identified category item, a phrase or category item included in a document searched from the first document group is specified, and the phrase or phrase received as a search condition in the search reception step A document search method comprising: calculating a degree of coincidence with a classification item and outputting a search result indicating the degree of coincidence for each classification item specified in the second search step.
(Supplementary note 7) The document search method according to
The documents included in the first and second document groups are patent documents,
The document search method, wherein the document identification information common to the first document group and the second document group is PCT application information of patent documents.
(Supplementary note 8) The document retrieval method according to
The documents included in the first and second document groups are patent documents,
The document retrieval method according to
(Supplementary note 9) The document search method according to
The documents included in the first and second document groups are patent documents,
A document search characterized by specifying an identification number of a patent document in the other document group that is cited in the patent document searched from either one of the first or second document group Method.
(Additional remark 10) The document search apparatus which searches the document contained in the 2nd document group comprised from a some document using the search result searched for the 1st document group comprised from the some document as object Because
Search accepting means for accepting a specific term or a specific classification item for classifying a document as a search condition;
First search means for searching for a predetermined document included in the first document group based on the search condition;
The related information relating to the first document group and the second document group included in the document searched by the first search means is specified, and the second document group is selected using the related information as a search condition. A second search means for searching, specifying a classification item given to the document extracted by the search, and searching the second document group again based on the specified classification item;
Third search means for specifying the related information contained in the document searched by the second search means, and searching the first document group using the related information as a search condition;
The phrase or classification item included in the document in the first document group searched by the third search means is specified, the degree of coincidence with the word or classification item received by the search reception means is calculated, and the match A document search apparatus comprising: output means for outputting search result information indicating a degree.
(Supplementary note 11) The document search device according to
In the second search means or the third search means, document identification information common to the first document group and the second document group is specified as related information.
(Supplementary note 12) The document search device according to
In the second search means or the third search means, a classification item common to the first document group and the second document group is specified as related information.
(Supplementary note 13) The document search device according to
In the second search means or the third search means, the other cited in the document searched from either one of the first or second document group as the related information. A document search apparatus characterized by identifying documents in a document group.
(Supplementary note 14) The document search device according to any one of
In the second search means, the second document group is searched based on the related information, and the document extracted by the search is used in the first document group given to the extracted document. A document search apparatus characterized by specifying a classification item of a classification system different from the classification system and searching the second document group again based on the specified classification item.
(Supplementary note 15) The document search device according to
In the second search means, a plurality of the classification items assigned to the extracted document are specified, and the second document group is searched again using each of the specified classification items as a search condition,
In the third search means, for each of the identified classification items, the first document group is searched using the related information included in the searched document as a search condition,
In the output means, for each identified classification item, the phrase or classification item included in the document retrieved from the first document group is identified, and the word or phrase received as a search condition in the search reception means A document search apparatus characterized by calculating a degree of coincidence with a classification item and outputting a search result indicating the degree of coincidence for each classification item specified by the second search means.
(Supplementary note 16) The document search device according to
The documents included in the first and second document groups are patent documents,
The document identification apparatus characterized in that the document identification information common to the first document group and the second document group is PCT application information of patent documents.
(Supplementary note 17) The document search device according to supplementary note 12,
The documents included in the first and second document groups are patent documents,
The document retrieval apparatus according to
(Supplementary note 18) The document search device according to supplementary note 13, wherein
The documents included in the first and second document groups are patent documents,
A document search characterized by specifying an identification number of a patent document in the other document group that is cited in the patent document searched from either one of the first or second document group apparatus.
(Supplementary note 19)
Search accepting means for accepting a specific term or a specific classification item for classifying a document as a search condition;
First search means for searching for a predetermined document included in the first document group based on the search condition;
The related information relating to the first document group and the second document group included in the document searched by the first search means is specified, and the second document group is selected using the related information as a search condition. A second search means for searching, identifying a classification item attached to the document extracted by the search,
Third search means for specifying the related information contained in the document searched by the second search means, and searching the first document group using the related information as a search condition;
Specifying a word or category included in a document in the first document group searched by the third search means, calculating a degree of coincidence with the word or category received by the search means, A computer-readable recording medium on which is recorded a document search program that functions as output means for outputting search result information indicating
(Supplementary note 20) A computer-readable recording medium on which the document search program according to supplementary note 19 is recorded,
In the second search means, a plurality of the classification items assigned to the extracted document are specified, and the second document group is searched again using each of the specified classification items as a search condition,
In the third search means, for each of the identified classification items, the first document group is searched using the related information included in the searched document as a search condition,
In the output means, for each identified classification item, the phrase or classification item included in the document retrieved from the first document group is identified, and the word or phrase received as a search condition in the search reception means A computer-readable record in which a document search program is recorded, wherein the degree of coincidence with a classification item is calculated, and a search result indicating the degree of coincidence is output for each classification item specified by the second retrieval unit Medium.
1 制御部、2 検索部、3 入力部、4 表示部、5 記憶部、6 日本特許文献DB、7 米国特許文献DB。
DESCRIPTION OF
Claims (5)
コンピュータが、
受け付けた検索条件に基づいて前記第1の文書群を検索し、
検索された前記第1の文書群の文書に関連づけられた前記第2の文書群の文書を抽出し、
抽出された前記第2の文書群の文書の属性情報であって、前記検索条件と適合する適合属性情報に基づき、前記第2の文書群を検索する、
ことを特徴とする文書検索方法。 A document search method for searching for a document included in a second document group based on a search condition used when searching for the first document group,
Computer
Search the first document group based on the received search condition,
Extracting the documents of the second document group associated with the retrieved documents of the first document group;
Searching for the second document group based on the attribute information of the extracted document of the second document group, which is compatible attribute information that matches the search condition;
A document search method characterized by the above.
前記抽出は、検索された前記第1の文書群の文書に引用される前記第2の文書群の文書を抽出するものであることを特徴とする文書検索方法。 The document search method according to claim 1,
2. The document search method according to claim 1, wherein the extraction is to extract a document of the second document group cited in a document of the searched first document group.
前記第1の文書群および前記第2の文書群は、それぞれ異なる国の特許出願に関連した文書による文書群であり、
前記抽出は、検索された前記第1の文書群の文書と、PCT出願による関連を持つ、または、優先権による関連を持つ、前記第2の文書群の文書を抽出するものであることを特徴とする文書検索方法。 The document search method according to claim 1,
The first document group and the second document group are document groups according to documents related to patent applications in different countries,
The extraction is to extract a document of the second document group that has a relation by a PCT application with a retrieved document of the first document group or a relation by priority. Document search method.
受け付けた検索条件に基づいて前記第1の文書群を検索する第1検索手段と、 First search means for searching for the first document group based on an accepted search condition;
検索された前記第1の文書群の文書に関連づけられた前記第2の文書群の文書を抽出する抽出手段と、 Extracting means for extracting the document of the second document group associated with the searched document of the first document group;
抽出された前記第2の文書群の文書の属性情報であって、前記検索条件と適合する適合属性情報に基づき、前記第2の文書群を検索する第2検索手段と、 Second search means for searching the second document group based on the attribute information of the extracted document of the second document group and matching attribute information that matches the search condition;
を備える文書検索装置。 A document search apparatus comprising:
受け付けた検索条件に基づいて第1の文書群を検索する第1検索手段と、 First search means for searching for a first document group based on the received search condition;
検索された前記第1の文書群の文書に関連づけられた第2の文書群の文書を抽出する抽出手段と、 Extracting means for extracting a document of the second document group associated with the searched document of the first document group;
抽出された前記第2の文書群の文書の属性情報であって、前記検索条件と適合する適合属性情報に基づき、前記第2の文書群を検索する第2検索手段と、 Second search means for searching the second document group based on the attribute information of the extracted document of the second document group and matching attribute information that matches the search condition;
して機能させる文書検索プログラム。 A document search program that makes it work.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008073266A JP5292873B2 (en) | 2008-03-21 | 2008-03-21 | Document search method, document search device, and recording medium recording document search program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008073266A JP5292873B2 (en) | 2008-03-21 | 2008-03-21 | Document search method, document search device, and recording medium recording document search program |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012243950A Division JP5633552B2 (en) | 2012-11-05 | 2012-11-05 | Document search method, document search device, and recording medium recording document search program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009230327A JP2009230327A (en) | 2009-10-08 |
JP5292873B2 true JP5292873B2 (en) | 2013-09-18 |
Family
ID=41245663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008073266A Active JP5292873B2 (en) | 2008-03-21 | 2008-03-21 | Document search method, document search device, and recording medium recording document search program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5292873B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5602101B2 (en) * | 2011-06-24 | 2014-10-08 | 有限会社アイ・アール・ディー | Patent gazette information output device, patent gazette information output method, and program |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04670A (en) * | 1990-04-18 | 1992-01-06 | Ricoh Co Ltd | Information retrieving device |
JPH05143647A (en) * | 1991-11-22 | 1993-06-11 | Nippon Telegr & Teleph Corp <Ntt> | Data base retrieval processing method |
JPH08272818A (en) * | 1995-04-03 | 1996-10-18 | Nippon Steel Corp | Information retrieval system |
JP2000148789A (en) * | 1998-11-05 | 2000-05-30 | Inpatekku Kk | Method and device for analyzing quoted document of patent information or the like |
JP2003141168A (en) * | 2001-11-05 | 2003-05-16 | Ricoh Co Ltd | Patent information retrieval system and method, program for realizing functions, and recording medium |
JP2003150623A (en) * | 2001-11-09 | 2003-05-23 | Ntt Data Technology Corp | Language crossing type patent document retrieval method |
WO2007105530A1 (en) * | 2006-03-10 | 2007-09-20 | Hiroshima City | Related term acquiring device, related term acquiring method, technology trend information creating device, technology trend information creating method, and program |
-
2008
- 2008-03-21 JP JP2008073266A patent/JP5292873B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009230327A (en) | 2009-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100535898C (en) | System and method for question-reply type document search | |
KR100295354B1 (en) | Document information retrieval system | |
JP4640591B2 (en) | Document search device | |
US7752032B2 (en) | Apparatus and method for translating Japanese into Chinese using a thesaurus and similarity measurements, and computer program therefor | |
US7647303B2 (en) | Document processing apparatus for searching documents, control method therefor, program for implementing the method, and storage medium storing the program | |
US20120323905A1 (en) | Ranking data utilizing attributes associated with semantic sub-keys | |
RU2007114029A (en) | METHOD, SYSTEM AND COMPUTER SOFTWARE PRODUCT FOR SEARCHING, NAVIGATION AND RANKING OF DOCUMENTS IN A PERSONAL NETWORK | |
US20060288038A1 (en) | Generation of a blended classification model | |
CN103430172A (en) | Search apparatus, search method, and program | |
US20120162244A1 (en) | Image search color sketch filtering | |
JP5910134B2 (en) | Text search apparatus and program | |
JP4894510B2 (en) | Literature retrieval program, literature retrieval device, literature retrieval method | |
US20120317141A1 (en) | System and method for ordering of semantic sub-keys | |
JP2000200281A (en) | Device and method for information retrieval and recording medium where information retrieval program is recorded | |
US9875298B2 (en) | Automatic generation of a search query | |
JP2005038395A (en) | Database retrieval device | |
JP2012230544A (en) | Image retrieval device and program | |
JP2001184358A (en) | Device and method for retrieving information with category factor and program recording medium therefor | |
JP2007025939A (en) | Multilingual document retrieval device, multilingual document retrieval method and program for retrieving multilingual document | |
JP5699744B2 (en) | SEARCH METHOD, SEARCH DEVICE, AND COMPUTER PROGRAM | |
JP5633552B2 (en) | Document search method, document search device, and recording medium recording document search program | |
JP5292873B2 (en) | Document search method, document search device, and recording medium recording document search program | |
US20120317103A1 (en) | Ranking data utilizing multiple semantic keys in a search query | |
JP4813312B2 (en) | Electronic document search method, electronic document search apparatus and program | |
JP6181890B2 (en) | Literature analysis apparatus, literature analysis method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120815 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130115 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130318 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130514 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130527 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5292873 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |