JP5292873B2 - Document search method, document search device, and recording medium recording document search program - Google Patents

Document search method, document search device, and recording medium recording document search program Download PDF

Info

Publication number
JP5292873B2
JP5292873B2 JP2008073266A JP2008073266A JP5292873B2 JP 5292873 B2 JP5292873 B2 JP 5292873B2 JP 2008073266 A JP2008073266 A JP 2008073266A JP 2008073266 A JP2008073266 A JP 2008073266A JP 5292873 B2 JP5292873 B2 JP 5292873B2
Authority
JP
Japan
Prior art keywords
document
search
classification
patent document
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008073266A
Other languages
Japanese (ja)
Other versions
JP2009230327A (en
Inventor
勇 渡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008073266A priority Critical patent/JP5292873B2/en
Publication of JP2009230327A publication Critical patent/JP2009230327A/en
Application granted granted Critical
Publication of JP5292873B2 publication Critical patent/JP5292873B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、分類が付与された文献を検索する文書検索方法、文書検索装置、文書検索プログラムを記録した記録媒体に関するものである。   The present invention relates to a document search method, a document search apparatus, and a recording medium on which a document search program is recorded for searching for documents to which classification is assigned.

特許や論文などの文献は、文献情報を有し、この文献情報には、階層的な分類が付与されている。このような文献をキーワードで検索する場合、次の2つのケースが起こり得る。   Documents such as patents and papers have document information, and hierarchical classification is given to the document information. When searching such a document by a keyword, the following two cases may occur.

(ケース1)同一の単語が複数の意味を持つ。
(ケース2)同一の概念が異なる単語で表される。
(Case 1) The same word has a plurality of meanings.
(Case 2) The same concept is expressed by different words.

ケース1により検索ノイズ(意図しない文献が検索結果の中に含まれること)が、ケース2により検索モレ(目的とする文献が検索結果に含まれないこと)が生じる可能性がある。   Case 1 may cause search noise (unintended documents are included in the search results), and case 2 may cause search leakage (target documents are not included in the search results).

このような問題(検索ノイズおよび検索モレ)を解決する技術として、該当するカテゴリーあるいはファセットを利用者に選択させ、選択されたカテゴリーあるいはファセットから、そのカテゴリーあるいはファセット内で体系化されている概念名を表示し、それに基づいて分類項目の絞り込みを行う分類コードを使用する特許分類情報検索処理および特許分類情報検索プログラム記憶媒体(特許文献1)が知られている。   As a technology to solve such problems (search noise and search more), the user selects the appropriate category or facet, and from the selected category or facet, the concept name organized in that category or facet Patent classification information search processing and a patent classification information search program storage medium (Patent Document 1) using a classification code for narrowing down classification items based on this are known.

また、特許文献は、IPC(International Patent Classification)、日本のFI(File Index)やF(File Forming)ターム、米国特許分類(U. S. Patent Classification)といった種類の階層的な分類コードが各特許文献に付与されている。特に、FIやFタームでは、分類コードの値が10万項目以上に細分化されている。従って、ユーザが検索目的や意図に適合した分類コードの値を知ることができた場合には、その分類コードの値をキーとして、特許文献1のような技術を用いて検索することにより、検索ノイズや検索モレの少ない高精度な検索を実現することが可能となる。
ちなみに、上記特許分類とは異なるが、論文や図書などの各種文献についても、たとえば、国際十進分類法(UDC)といった標準の分類コードや、JST分類といった情報提供者が独自に定義・付与している各種分類コードが存在する。
特開平11−328192号公報
Patent documents include IPC (International Patent Classification), Japanese FI (File Index) and F (File Forming) terms, and US patent classification (US patent classification) types of hierarchical classification codes. It is given in the literature. In particular, in FI and F-term, the classification code values are subdivided into 100,000 items or more. Therefore, when the user can know the value of the classification code suitable for the purpose and purpose of the search, the search is performed by using the technique of Patent Document 1 using the value of the classification code as a key. It is possible to realize a highly accurate search with less noise and search leakage.
By the way, although different from the above-mentioned patent classification, various types of documents such as papers and books are also defined and assigned by information providers such as standard classification codes such as International Decimal Classification (UDC) and JST classification. There are various classification codes.
JP 11-328192 A

しかし、上述したような特許文献に限らず、各種文献の検索においては、日本の文献だけでなく米国文献をも検索対象とした場合に、検索者が米国の分類に詳しくなかったり、適切な英語の技術用語(訳語)を知らなかったりすると検索キーワードから適切な分類を導出することは難しい。   However, not only patent documents such as those described above, but in searching for various documents, if not only Japanese documents but also US documents are searched, the searcher may not be familiar with the classification of the United States, or appropriate English It is difficult to derive an appropriate classification from the search keyword if the technical term (translation) is not known.

さらに、日本語キーワードに基づいて米国分類を調べると、日本語キーワードに対する訳語や米国分類の多義性によって、ノイズとなる文献(関連はあるが主題が異なる文献)が検索結果に混じってしまい、結果として、文献分類コードの候補リストの精度が低下してしまう可能性がある。よって、この検索結果が適切なものかどうかを検証する必要が生じることになる。   In addition, when examining the US classification based on Japanese keywords, the translation results for the Japanese keywords and the ambiguity of the US classification mixed the search results with literature that was noisy (related but different subject matter). As a result, the accuracy of the candidate list for the document classification code may be reduced. Therefore, it is necessary to verify whether or not the search result is appropriate.

本発明は上述した問題点を解決するためになされたものであり、複数の文書で構成される第1の文書群を対象に検索した検索結果を利用して、複数の文書で構成される第2の文書群に含まれる文書を検索することを目的とする。   The present invention has been made to solve the above-described problems, and uses a search result obtained by searching for a first document group composed of a plurality of documents. The purpose is to search for documents included in the second document group.

上述した課題を解決するため、文書検索方法は、複数の文書で構成される第1の文書群を対象に検索した検索結果を利用して、複数の文書で構成される第2の文書群に含まれる文書を検索する方法であって、コンピュータが、特定の語句、または、文書を分類する特定の分類項目を検索条件として受け付ける検索受付ステップと、前記検索条件に基づいて、前記第1の文書群に含まれる所定の文書を検索する第1検索ステップと、前記第1検索ステップにおいて検索された文書に含まれる、前記第1の文書群と前記第2の文書群を関連づける関連情報を特定し、該関連情報を検索条件として前記第2の文書群を検索し、該検索によって抽出された文書に付与された分類項目を特定し、該特定された分類項目に基づいて再び第2の文書群を検索する第2検索ステップと、前記第2検索ステップにおいて検索された文書に含まれる、前記関連情報を特定し、該関連情報を検索条件として、前記第1の文書群を検索する第3検索ステップと、前記第3検索ステップにおいて前記第1の文書群から検索された文書に含まれる語句または分類項目を特定し、前記検索受付ステップにおいて検索条件として受け付けた前記語句または分類項目との一致度を算出し、該一致度を示す検索結果情報を出力する出力ステップ、から構成されることを特徴とする。   In order to solve the above-described problem, a document search method uses a search result obtained by searching for a first document group including a plurality of documents, to obtain a second document group including a plurality of documents. A method for searching for an included document, wherein a computer accepts a specific word or phrase or a specific classification item for classifying a document as a search condition, and the first document based on the search condition A first search step for searching for a predetermined document included in the group, and related information for associating the first document group with the second document group included in the document searched in the first search step. The second document group is searched using the related information as a search condition, the classification item given to the document extracted by the search is specified, and the second document group is again determined based on the specified classification item. search for A second search step, and a third search step of specifying the related information included in the document searched in the second search step, and searching the first document group using the related information as a search condition; The phrase or classification item included in the document searched from the first document group in the third search step is specified, and the degree of coincidence with the word or classification item received as the search condition in the search reception step is calculated And an output step for outputting search result information indicating the degree of coincidence.

また、文書検索装置は、複数の文書で構成される第1の文書群を対象に検索した検索結果を利用して、複数の文書で構成される第2の文書群に含まれる文書を検索する装置であって、特定の語句、または、文書を分類する特定の分類項目を検索条件として受け付ける検索受付手段と、前記検索条件に基づいて、前記第1の文書群に含まれる所定の文書を検索する第1検索手段と、前記第1検索手段により検索された文書に含まれる、前記第1の文書群と前記第2の文書群を関係づける関連情報を特定し、該関連情報を検索条件として前記第2の文書群を検索し、該検索によって抽出された文書に付与された分類項目を特定し、該特定した分類項目に基づいて、再び第2の文書群を検索する第2検索手段と、前記第2検索手段により検索された文書に含まれる、前記関連情報を特定し、該関連情報を検索条件として、前記第1の文書群を検索する第3検索手段と、前記第3検索手段により検索された前記第1文書群内の文書に含まれる語句または分類項目を特定し、前記検索受付手段が受け付けた前記語句または分類項目との一致度を算出し、該一致度を示す検索結果情報を出力する出力手段とを備える。   In addition, the document search apparatus searches for a document included in the second document group including a plurality of documents by using a search result obtained by searching the first document group including a plurality of documents. A device that accepts a specific word or phrase or a specific classification item for classifying a document as a search condition, and searches for a predetermined document included in the first document group based on the search condition First retrieval means, and related information relating to the first document group and the second document group included in the document retrieved by the first retrieval means, and using the relevant information as a search condition Second search means for searching the second document group, specifying a classification item given to the document extracted by the search, and searching the second document group again based on the specified classification item; , Searched by the second search means A third search means for searching for the first document group using the related information as a search condition, and within the first document group searched by the third search means. Output means for specifying a phrase or classification item included in the document, calculating a matching degree with the phrase or classification item received by the search receiving means, and outputting search result information indicating the matching degree.

また、記憶媒体に記憶された文書検索プログラムは、コンピュータを、特定の語句、または、文書を分類する特定の分類項目を検索条件として受け付ける検索受付手段と、前記検索条件に基づいて、前記第1の文書群に含まれる所定の文書を検索する第1検索手段と、前記第1検索手段により検索された文書に含まれる、前記第1の文書群と前記第2の文書群を関係づける関連情報を特定し、該関連情報を検索条件として前記第2の文書群を検索し、該検索によって抽出された文書に付与された分類項目を特定し、再びする第2検索手段と、前記第2検索手段により検索された文書に含まれる、前記関連情報を特定し、該関連情報を検索条件として、前記第1の文書群を検索する第3検索手段と、前記第3検索手段により検索された前記第1文書群内の文書に含まれる語句または分類項目を特定し、前記検索手段が受け付けた前記語句または分類項目との一致度を算出し、該一致度を示す検索結果情報を出力する出力手段として機能させる。   In addition, the document search program stored in the storage medium may be configured such that the computer accepts a specific word / phrase or a specific classification item for classifying the document as a search condition, and the first search based on the search condition. First search means for searching for a predetermined document included in the document group, and related information relating the first document group and the second document group included in the document searched by the first search means A second search means for searching the second document group using the related information as a search condition, specifying a classification item assigned to the document extracted by the search, and the second search Specifying the related information contained in the document searched by the means, and using the related information as a search condition, a third search means for searching the first document group, and the search performed by the third search means First Function as output means for specifying a phrase or classification item included in a document in a book group, calculating a degree of coincidence with the word or classification item received by the search means, and outputting search result information indicating the degree of coincidence Let

本発明によれば、複数の文書で構成される第1の文書群を対象に検索した検索結果を利用して、複数の文書で構成される第2の文書群に含まれる文書を検索することができる。   According to the present invention, a document included in a second document group composed of a plurality of documents is retrieved using a search result obtained by searching the first document group composed of a plurality of documents. Can do.

以下、本発明の実施の形態について図面を参照しつつ説明する。   Embodiments of the present invention will be described below with reference to the drawings.

実施の形態1. Embodiment 1 FIG.

本実施の形態においては、文献を特許公報とし、文献に付与された分類コードの検索を行う特許文献検索装置を例にして説明する。また、この特許文献検索装置は、日本語のキーワード、または日本において有効な特許分類に基づいて、基づくキーワードまたは特許分類に適合するUSCまたはIPC分類を検索するものであるが、あくまで一例であり、国(日本と米国)及び特許分類により限定するものではない。
また、本発明は、特許文献検索装置に限定されるものではなく、文書の分類する分類体系を利用する各種文書検索装置であれば、本実施例同様に実現可能である。
In the present embodiment, a description will be given by taking as an example a patent document search apparatus that searches for a classification code assigned to a document, with the document being a patent publication. In addition, this patent document search device searches a USC or IPC classification that matches a keyword or patent classification based on a Japanese keyword or a patent classification effective in Japan, but is merely an example. It is not limited by country (Japan and US) and patent classification.
Further, the present invention is not limited to the patent document search apparatus, and can be realized in the same manner as the present embodiment as long as it is various document search apparatuses that use a classification system for classifying documents.

まず、本実施の形態に係る文献検索装置の構成について説明する。   First, the configuration of the document search apparatus according to this embodiment will be described.

図1は、実施の形態1に係る特許文献検索装置の構成の一例を示すブロック図である。この特許文献検索装置は、検索の制御を行う制御部1(抽出部、一致度算出部、対応付け部)、特許文献の検索を行う検索部2(第1検索部、第2検索部、第3検索部)、ユーザからの入力キー情報などを受け付ける入力部3(キー情報取得部)、ユーザへの表示を行う表示部4、入力キー情報や検索結果などを記憶する記憶部5、日本(第1国)の特許文献を管理する日本特許文献DB(Database)6、米国(第2国)の特許文献を管理する米国特許文献DB7を備える。   FIG. 1 is a block diagram showing an example of the configuration of the patent document search apparatus according to the first embodiment. This patent document search apparatus includes a control unit 1 (extraction unit, coincidence calculation unit, association unit) that performs search control, and a search unit 2 (first search unit, second search unit, first search unit) that searches patent documents. 3 search unit), an input unit 3 (key information acquisition unit) for receiving input key information from the user, a display unit 4 for displaying to the user, a storage unit 5 for storing input key information, search results, and the like, Japan ( A Japanese patent document DB (Database) 6 that manages patent documents in the first country) and a US patent document DB 7 that manages patent documents in the United States (second country) are provided.

次に、本実施の形態に係る特許文献検索装置の動作について説明する。図2は、実施の形態1に係る特許文献検索装置の動作を示すフローチャートである。また、図3は、分類コード抽出の一例を示す図である。また、図4は、分類コード検索の一例を示す図である。また、図5は、キーワードを入力とした場合のキーワード抽出及び集計の一例を示す図である。また、図6は、分類コードを入力とした場合のキーワード抽出及び集計の一例を示す図である。以下、図3〜6を参照しつつ、図2のフローチャートを説明する。なお、以下の説明において、検索部は、日本特許文献(第1国の特許文献)を検索する場合は日本特許文献DB、米国特許文献(第2国の特許文献)を検索する場合は米国特許文献DBに対してそれぞれアクセスしているものとする。   Next, the operation of the patent document search apparatus according to this embodiment will be described. FIG. 2 is a flowchart showing the operation of the patent document search apparatus according to the first embodiment. FIG. 3 is a diagram illustrating an example of classification code extraction. FIG. 4 is a diagram showing an example of classification code search. FIG. 5 is a diagram illustrating an example of keyword extraction and aggregation when keywords are input. FIG. 6 is a diagram illustrating an example of keyword extraction and aggregation when a classification code is input. Hereinafter, the flowchart of FIG. 2 will be described with reference to FIGS. In the following description, the search unit searches for a Japanese patent document DB when searching for a Japanese patent document (first country patent document), and a US patent when searching for a US patent document (second country patent document). Assume that each document DB is accessed.

まず、入力部3は、ユーザからの入力キー情報(キーワード、またはIPC、FI、Fタームなどの分類コード、キー情報)を受け付けて制御部1に渡し、制御部1は、入力キー情報を記憶部5に格納すると共に、検索部2に対して後述する米国特許文献検索処理の実行を指示し、検索部2は米国特許文献検索処理を実行する(S101、第1検索ステップ、第2検索ステップ)。この米国特許文献検索処理は、日本語のキーワード、またはUSC以外の分類コードである入力キー情報から米国特許文献を検索する処理であり、この処理によって、得られた米国特許文献を米国特許文献集合とする。   First, the input unit 3 receives input key information (keywords, classification codes such as IPC, FI, and F terms, key information) from the user and passes it to the control unit 1, and the control unit 1 stores the input key information. The search unit 2 instructs the search unit 2 to execute a US patent document search process, which will be described later, and the search unit 2 executes the US patent document search process (S101, first search step, second search step) ). This US patent document search process is a process of searching for US patent documents from input key information that is a Japanese keyword or a classification code other than USC. And

米国特許文献集合が得られると、制御部1は、図3に示すように米国特許文献集合の各特許文献に付された分類コードを抽出する(S102、第2検索ステップ)。なお、分類コードの抽出において、制御部1は、分類コードの階層性を考慮して1つの分類コードを複数階層の分類コードとして抽出する。例えば、分類コードがIPCであれば、上位からセクション、クラス、サブクラス、メイングループ、サブグループという階層があり、上位の階層ほど大まかな分類であり、下位の階層ほど細かな分類である。図3を例とすると、米国特許文献に付されたIPCの分類コードであるB25J5/00が抽出された場合、この分類コードはB25J(サブクラス)、B25J5/(メイングループ)、B25J5/00(サブグループ)のそれぞれが分類コードとして抽出される。   When the US patent document set is obtained, the control unit 1 extracts the classification code attached to each patent document in the US patent document set as shown in FIG. 3 (S102, second search step). In the extraction of the classification code, the control unit 1 extracts one classification code as a classification code of a plurality of hierarchies in consideration of the hierarchy of the classification code. For example, if the classification code is IPC, there is a hierarchy of sections, classes, subclasses, main groups, and subgroups from the upper level, the higher level is a rough classification, and the lower level is a finer classification. Taking FIG. 3 as an example, when B25J5 / 00, which is an IPC classification code attached to a US patent document, is extracted, this classification code is B25J (subclass), B25J5 / (main group), B25J5 / 00 (sub Each group is extracted as a classification code.

このように、米国特許文献集合の各特許文献に付された分類コードにより再び米国特許文献DB7を検索することにより、検索モレを防ぐことができる。また、得られた分類コードの上位階層の分類コードにより米国特許文献DB7を検索することにより、さらに広い範囲の特許文献を検索することができる。   In this way, searching the US patent document DB 7 again by using the classification code attached to each patent document in the US patent document set can prevent search leakage. Further, a wider range of patent documents can be retrieved by searching the US patent document DB 7 using the higher-level classification codes of the obtained classification codes.

米国特許文献集合から分類コードが抽出されると、制御部1は、抽出した分類コード候補の集計及びランキングを行い、抽出した分類コードの順位付きのリストである分類コードリストを作成する(S103、第2検索ステップ)。この分類コードリストは、例えば、100件 B25J、35件 B25J5/、10件 A63H…、というように、件数が高い順に分類コードが並べられたものである。   When a classification code is extracted from a set of US patent documents, the control unit 1 aggregates and ranks the extracted classification code candidates, and creates a classification code list that is a ranked list of the extracted classification codes (S103, Second search step). In this classification code list, for example, classification codes are arranged in descending order of the number of cases, such as 100 cases B25J, 35 cases B25J5 / 10, A63H.

次に制御部1は、分類コードリストのそれぞれの分類コードを順次入力とする。この際、制御部1は、入力とする分類コードがあるかどうかを判断する(S104)。   Next, the control unit 1 sequentially inputs each classification code in the classification code list. At this time, the control unit 1 determines whether there is a classification code to be input (S104).

入力とする分類コードがある場合(S104、YES)、制御部1は、検索部2に対して、入力とした分類コードを含んだ米国特許文献の検索を指示し、検索部2は、図4に示すように、米国特許文献DB7のインデックスファイル(索引テーブル)を使用して、入力とした分類コードに基づいて米国特許文献を検索する(S105、第2検索ステップ)。なお、ここで検索された米国特許文献を総称して、第2米国特許文献集合とする。   When there is a classification code to be input (S104, YES), the control unit 1 instructs the search unit 2 to search for a US patent document including the input classification code. As shown in FIG. 5, a US patent document is searched based on the input classification code using the index file (index table) of the US patent document DB 7 (S105, second search step). Note that the US patent documents searched here are collectively referred to as a second US patent document set.

次に、制御部1は、検索部2に対して、後述する日本特許文献検索処理の実行を指示し、検索部2は日本特許文献検索処理を実行する(S106)。この日本特許文献検索処理は第2米国特許文献集合に対応する日本特許文献である第2日本特許文献集合を検索する処理である。   Next, the control unit 1 instructs the search unit 2 to execute a Japanese patent document search process to be described later, and the search unit 2 executes the Japanese patent document search process (S106). This Japanese patent document search process is a process of searching for a second Japanese patent document set that is a Japanese patent document corresponding to the second US patent document set.

検索部2により日本特許文献検索処理が実行され、第2米国特許文献集合に対応する第2日本特許文献集合が検索されると、制御部1は、図5(ユーザによる入力がキーワードである場合の例)、または図6(ユーザによる入力が分類コードである場合の例)に示すように、この第2日本特許文献集合のそれぞれの日本特許文献からキー(キーワード、または分類コード)の抽出、集計、ランキングを行い、キーの順位付きのリストであるキー情報リストを作成する(S107、抽出ステップ)。このキー情報リストは、ユーザによる入力がキーワードである場合、100件 ロボット、35件 歩行、10件 玩具…というように、件数が高い順にキーワードが並べられたものとなる。一方、ユーザによる入力が分類コードである場合、キー情報リストは、100件 B25J5/00、35件 A63H11/18、10件 B62D52/02…というように、件数が高い順に分類コードが並べられたものとなる。また、このキー情報リストは第2日本特許文献集合の日本特許文献が対応する米国特許文献のUSC(またはIPC)分類コードと対応付けられているものとする。   When the Japanese patent document search process is executed by the search unit 2 and the second Japanese patent document set corresponding to the second US patent document set is searched, the control unit 1 displays the case shown in FIG. Example), or extraction of keys (keywords or classification codes) from each Japanese patent document of the second Japanese patent document set, as shown in FIG. 6 (example when the user input is a classification code), Aggregation and ranking are performed to create a key information list that is a list with key rankings (S107, extraction step). In the key information list, when the input by the user is a keyword, the keywords are arranged in descending order, such as 100 robots, 35 walking, 10 toys, and so on. On the other hand, when the input by the user is a classification code, the key information list is a list of classification codes arranged in descending order, such as 100 cases B25J5 / 00, 35 cases A63H11 / 18, 10 cases B62D52 / 02. It becomes. Also, this key information list is assumed to be associated with the USC (or IPC) classification code of the US patent document corresponding to the Japanese patent document of the second Japanese patent document set.

次に、制御部1は、後述する適合性判定処理を実行する(S108、一致度算出ステップ、対応付けステップ)。この適合性判定処理は、記憶部5に格納された入力キー情報とキー情報リストを比較し、分類コードの適合性を判定する処理である。   Next, the control part 1 performs the suitability determination process mentioned later (S108, a coincidence degree calculation step, an association step). This suitability determination process is a process for comparing the input key information stored in the storage unit 5 with the key information list to determine the suitability of the classification code.

適合性判定処理により、分類コードリスト内の分類コードの適合性が判定されると、制御部1は、分類コードリストのうち、次に入力とする分類コードがあるかどうかを判断する(S104)。   When the suitability determination process determines the suitability of the classification codes in the classification code list, the control unit 1 determines whether there is a classification code to be input next in the classification code list (S104). .

この判断において、次に入力とする分類コードがない場合(S104,NO)
制御部1は、後述する適合性判定結果表示処理を実行する(S109)。この適合性判定結果表示処理は、適合性判定処理により判定された分類コードリスト内のそれぞれの分類コードに対する適合性を表示部4に表示させる処理である。
In this determination, when there is no classification code to be input next (S104, NO)
The control unit 1 executes suitability determination result display processing described later (S109). This suitability determination result display process is a process for causing the display unit 4 to display suitability for each classification code in the classification code list determined by the suitability determination process.

上述の動作によって、ユーザによって入力されたキーワード、または日本特有の分類コードであるFIやFターム、国際特許分類であるIPCの分類コード(これらの分類を第1の分類とする)に基づいて、これらに対応する米国特許分類であるUSCまたはIPCの分類コードを検索することができる。以下、図2のフローチャートにおける米国特許文献検索処理、日本対応特許検索処理、適合性判定処理、適合性判定結果表示処理の動作についてそれぞれ説明する。   Based on the keyword input by the user, FI or F-term that is a classification code unique to Japan, or an IPC classification code that is an international patent classification (these classifications are set as the first classification) by the above-described operation, The USC or IPC classification codes corresponding to these US patent classifications can be searched. Hereinafter, operations of the US patent document search process, the Japanese patent search process, the suitability determination process, and the suitability determination result display process in the flowchart of FIG. 2 will be described.

まず、図2のフローチャートにおけるステップS101の動作である米国特許文献検索処理について説明する。図7は、米国特許文献検索処理の動作を示すフローチャートである。また、図8は、キーワードによる日本特許文献の検索の一例を示す図である。また、図9は、分類コードによる日本特許文献の検索の一例を示す図である。また、図10は、引用情報の抽出の一例を示す図である。以下、図8〜10を参照しつつ、図7のフローチャートを説明する。   First, the US patent document search process that is the operation of step S101 in the flowchart of FIG. 2 will be described. FIG. 7 is a flowchart showing the operation of the US patent document search process. Moreover, FIG. 8 is a figure which shows an example of the search of the Japanese patent document by a keyword. FIG. 9 is a diagram showing an example of a search for Japanese patent documents using classification codes. FIG. 10 is a diagram illustrating an example of extraction of citation information. Hereinafter, the flowchart of FIG. 7 will be described with reference to FIGS.

まず、検索部2は、制御部1より米国特許文献検索処理の指示を受けると、図8(ユーザがキーワードを入力した場合)、または図9(ユーザが分類コードを入力した場合)に示すように、ユーザにより入力部3に入力されたキーである入力キー情報(キーワード、または分類コード)に基づいて、日本特許文献DBを検索する(S201、第1検索ステップ)。この検索において検索された日本特許文献を第1日本特許文献集合とする。   First, when the search unit 2 receives an instruction for US patent document search processing from the control unit 1, as shown in FIG. 8 (when the user inputs a keyword) or FIG. 9 (when the user inputs a classification code), as shown in FIG. In addition, based on the input key information (keyword or classification code) that is the key input to the input unit 3 by the user, the Japanese Patent Literature DB is searched (S201, first search step). The Japanese patent documents searched in this search are set as the first Japanese patent document set.

検索部2により、日本特許文献が検索されると、制御部1は、第1日本特許文献集合のそれぞれの日本特許文献から、日本特許文献内で引用されている米国特許文献の特許番号である第1引用情報(第1関連情報)を抽出する(S202、第2検索ステップ)。   When the Japanese patent document is searched by the search unit 2, the control unit 1 is the patent number of the US patent document cited in the Japanese patent document from each Japanese patent document in the first Japanese patent document set. First citation information (first related information) is extracted (S202, second search step).

さらに、検索部2は、抽出した第1引用情報に基づいて、米国特許文献DB7を検索する(S203、第2関連ステップ)。この検索結果である米国特許文献を米国特許文献集合とする。   Further, the search unit 2 searches the US patent document DB 7 based on the extracted first citation information (S203, second related step). The US patent document that is the search result is defined as a set of US patent documents.

この米国特許文献検索処理によって、日本特許文献に対応する米国特許文献を検索することができる。   By this US patent document search process, a US patent document corresponding to a Japanese patent document can be searched.

次に、図2のフローチャートにおけるステップS106の動作である日本特許文献検索処理について説明する。図11は、日本特許文献検索処理の動作を示すフローチャートである。また、図12は、日本特許文献検索処理の一例を示す図である。   Next, the Japanese Patent Literature search process that is the operation of Step S106 in the flowchart of FIG. 2 will be described. FIG. 11 is a flowchart showing the operation of the Japanese patent document search process. FIG. 12 is a diagram illustrating an example of a Japanese patent document search process.

まず、制御部1は、図12に示すように、第2米国特許文献集合のそれぞれの米国特許文献内で引用されている日本特許文献の特許番号である第2引用情報(第2関連情報)を抽出する(S301、第3検索ステップ)。   First, as shown in FIG. 12, the control unit 1 uses the second citation information (second related information) that is the patent number of the Japanese patent document cited in each US patent document of the second US patent document set. Is extracted (S301, third search step).

さらに、制御部1は、抽出した第2引用情報に基づいて、日本特許文献DB6を検索する(S302、第3検索ステップ)。この検索結果である日本特許文献を第2日本特許集合とする。   Further, the control unit 1 searches the Japanese patent document DB 6 based on the extracted second citation information (S302, third search step). The Japanese patent document that is the search result is set as the second Japanese patent set.

この日本特許文献検索処理によって、米国特許文献に対応する日本特許文献を検索することができる。   By this Japanese patent document search process, a Japanese patent document corresponding to the US patent document can be searched.

次に、図2のステップS108の動作である適合性判定処理について説明する。図13は、適合性判定処理の動作を示すフローチャートである。また、図14は、入力キー情報と抽出キー情報のマッチングの一例を示す図である。また、図15は、抽出キー情報のスコアリングの一例を示す図である。   Next, the suitability determination process that is the operation of step S108 in FIG. 2 will be described. FIG. 13 is a flowchart showing the operation of the suitability determination process. FIG. 14 is a diagram illustrating an example of matching between input key information and extracted key information. FIG. 15 is a diagram illustrating an example of scoring of extracted key information.

まず、制御部1は、記憶部5に格納した入力キー情報を読み出し、第2日本特許文献集合のそれぞれの日本特許文献において一定数以上頻出する単語、または第2日本特許文献のそれぞれの日本特許文献に付与された分類コードを抽出キー情報として抽出し、入力キー情報と抽出キー情報を完全一致、部分一致の2通りの方法で比較する(S401、一致度算出ステップ)。具体的には、図14に示すように、例えば入力キー情報が“音声認識”というキーワードである場合、制御部1はこの入力キー情報を“音声”と“認識”に分け、抽出キー情報の“音声”、“認識”を部分一致とし、“音声認識”、“音声認識装置”を完全一致とする。また、入力キー情報が“B25J5/00”という分類コードである場合は、この入力キー情報を“B25J”、“B25J5”、…というように階層別に分け、抽出キー情報のB25J、B25J5を部分一致とし、B25J5/00を完全一致とする。なお、この抽出キーは抽出元である日本特許文献と対応する米国特許文献の分類コードと対応付けられているものとする。   First, the control unit 1 reads the input key information stored in the storage unit 5, and a word frequently appearing in a certain number or more in each Japanese patent document in the second Japanese patent document set or each Japanese patent in the second Japanese patent document. The classification code assigned to the document is extracted as extracted key information, and the input key information and the extracted key information are compared by two methods of complete matching and partial matching (S401, matching degree calculation step). Specifically, as shown in FIG. 14, for example, when the input key information is a keyword “speech recognition”, the control unit 1 divides this input key information into “speech” and “recognition”. “Speech” and “recognition” are partially matched, and “speech recognition” and “speech recognition device” are completely matched. If the input key information has a classification code of “B25J5 / 00”, the input key information is divided into hierarchies such as “B25J”, “B25J5”,. And B25J5 / 00 is completely coincident. This extraction key is assumed to be associated with the classification code of the US patent document corresponding to the Japanese patent document as the extraction source.

さらに、制御部1は、キー情報リスト内のキーワードまたは分類コードの完全一致及び部分一致の抽出キー情報の有無でスコアを計算する(S402、一致度算出ステップ、対応付けステップ)。例えば、図15に示すように、部分一致の抽出キー情報に対して1ポイント、完全一致の抽出キー情報に対して2ポイント、それ以外の抽出キー情報は0ポイントとし、704/275に対応する抽出キー情報のスコアを全て加算して704/275のスコアとする。また、部分一致、完全一致の数は考慮せずに、抽出キー情報が完全一致を含む場合は2ポイント、部分一致のみを含む場合は1ポイントとしても良い。また、抽出キー情報における順位を加味し、例えば、1位のキーワードが部分一致または完全一致ならばそのキーワードに対するポイントを10倍、2位のキーワードが部分一致または完全一致ならばそのキーワードに対するポイントを9倍というように、順位に応じてポイント数を変えても良い。また、これらのスコア計算方法を組み合わせても良い。   Further, the control unit 1 calculates a score based on the presence / absence of extracted key information of complete matching and partial matching of keywords or classification codes in the key information list (S402, matching degree calculation step, association step). For example, as shown in FIG. 15, 1 point is obtained for partially matched extracted key information, 2 points are obtained for completely matched extracted key information, and the other extracted key information is 0 points, corresponding to 704/275. All the scores of the extracted key information are added to obtain a score of 704/275. Further, without considering the number of partial matches and complete matches, 2 points may be used when the extracted key information includes a complete match, and 1 point may be used when only the partial match is included. Considering the ranking in the extracted key information, for example, if the first keyword is partially matched or completely matched, the point for that keyword is 10 times. If the second keyword is partially matched or completely matched, the point for that keyword is The number of points may be changed according to the ranking, such as 9 times. These score calculation methods may be combined.

この適合性判定処理によって、入力キー情報に対応する分類コードの適合性を判定することができる。   With this suitability determination process, the suitability of the classification code corresponding to the input key information can be determined.

次に、図2のフローチャートにおけるステップS109の動作を示す適合性判定結果表示処理について説明する。図16は、結果表示画面を示す図である。   Next, the suitability determination result display process showing the operation of step S109 in the flowchart of FIG. 2 will be described. FIG. 16 is a diagram illustrating a result display screen.

キー情報リスト内の全ての分類コードに対して適合性判定処理が為されると、制御部1は、図16に示すように、例えば、米国特許文献の分類コードであるUSC毎に適合性判定結果の一致度を示す検索結果画面を表示する。この表示において、各行は分類コードを表し、各列は、順位、ヒット件数、全体件数、関連度、相対スコア、USC、関連キーを表す。
図16の例では、検索条件である入力キー情報に対する関連度の高い順に並べられているが、本発明の実施形態に直接的に関係する適合性判定結果の一致度については、その一致度の高低によって、USCの文字色を変化させることで表示している。
When the suitability determination process is performed for all the classification codes in the key information list, the controller 1 determines the suitability for each USC that is a classification code of the US patent document, as shown in FIG. A search result screen showing the degree of coincidence of the results is displayed. In this display, each row represents a classification code, and each column represents ranking, hit count, total count, relevance, relative score, USC, and related key.
In the example of FIG. 16, they are arranged in descending order of the degree of relevance with respect to the input key information that is a search condition. It is displayed by changing the character color of USC depending on the height.

関連度は、全文献における入力キー情報の出現頻度と、キー情報リスト内のそれぞれの分類コードの出現頻度との積であり、最も大きい関連度の値を1.00とする。また、順位は関連度が大きい分類コードから付けられた順位である。また、ヒット件数は、(分類コードが出現する件数)/(入力キー情報がヒットした文献数)の形式で表示される。すなわち、(入力キー情報がヒットした文献数)とは、日本の特許文献が含む関連情報から導き出された米国の特許文献の検索結果件数であり、(分類コードが出現する件数)とは、この米国の特許文献の検索結果件数の内で、各行の分類コードであるUSCが出現する件数である。また、全体件数は、全ての米国特許文献の中で、各行の分類コードを持つ文献の全体数である。また、相対スコアは、関連度を最大値に対する相対値に変換し、棒グラフで表したものである。また、USCは、キー情報リストに含まれる米国特許分類の分類コードである。また、関連キーは、各行の分類コードを含む米国特許文献に対応する日本特許文献において一定数以上頻出する単語であり、各行の分類コードと対応付けられた抽出キー情報である。なお、この関連キーは、入力キー情報がキーワードである場合に表示されるものであり、入力キー情報が分類コードである場合は、分類コードが表示される。   The relevance is the product of the appearance frequency of the input key information in all documents and the appearance frequency of each classification code in the key information list, and the largest relevance value is 1.00. The rank is a rank assigned from a classification code having a high degree of association. The number of hits is displayed in the form of (number of occurrences of classification code) / (number of documents hit by input key information). In other words, (the number of documents in which the input key information is hit) is the number of search results of US patent documents derived from related information included in Japanese patent documents, and (the number of classification codes appears) is This is the number of cases where USC, which is the classification code of each row, appears in the number of search results of US patent documents. The total number of documents is the total number of documents having a classification code in each row among all US patent documents. The relative score is a bar graph obtained by converting the degree of association into a relative value with respect to the maximum value. USC is a classification code of the US patent classification included in the key information list. Further, the related key is a word that appears more than a certain number in Japanese patent documents corresponding to US patent documents including the classification code of each row, and is extracted key information associated with the classification code of each row. This related key is displayed when the input key information is a keyword, and when the input key information is a classification code, a classification code is displayed.

関連キーにおけるそれぞれの抽出キーは、上述した適合性判定処理における判定によって、表示される色が異なる。例えば、入力キー情報に対して、完全一致の抽出キーは赤で表示され、部分一致の抽出キーはオレンジで表示され、不一致の抽出キーは黒で表示される。また、USCも同様に対応する関連キーのスコアに応じて、表示される色が異なる。例えば、関連キーのスコアが3ポイント以上である場合は赤で表示され、関連キーのスコアが2ポイントである場合はオレンジで表示され、関連キーのスコアが1ポイントである場合は黄色で表示され、関連キーのスコアが0ポイントである場合は黒で表示される。   Each extracted key in the related key is displayed in a different color depending on the determination in the suitability determination process described above. For example, with respect to the input key information, an extraction key with a perfect match is displayed in red, an extraction key with a partial match is displayed in orange, and an extraction key with a mismatch is displayed in black. Similarly, USC also displays different colors depending on the score of the corresponding key. For example, if the related key score is 3 points or more, it is displayed in red, if the related key score is 2 points, it is displayed in orange, and if the related key score is 1 point, it is displayed in yellow. When the score of the related key is 0 point, it is displayed in black.

以上の構成及び動作によって、日本語のキーワードまたは日本における特許分類(IPC分類を含む)を入力として、入力に適合する米国特許分類(またはIPC分類)を検索することができる。   With the above configuration and operation, it is possible to search for a US patent classification (or IPC classification) that matches the input, using Japanese keywords or Japanese patent classification (including IPC classification) as input.

実施の形態2. Embodiment 2. FIG.

実施の形態1においては、入力キー情報に基づいて検索された日本特許文献の引用情報を用いて米国特許文献を検索し、また米国特許文献の引用情報を用いて対応する日本特許文献を検索したが、本実施の形態は、引用情報の代わりにPCT出願情報を用いる点が実施の形態1とは異なる。以下、実施の形態1とは異なる動作について説明する。   In the first embodiment, the US patent document is searched using the cited information of the Japanese patent document searched based on the input key information, and the corresponding Japanese patent document is searched using the cited information of the US patent document. However, the present embodiment is different from the first embodiment in that PCT application information is used instead of citation information. Hereinafter, operations different from those of the first embodiment will be described.

本実施の形態に係る特許文献検索装置は、米国特許文献検索処理及び日本特許文献検索処理の動作が実施の形態1に係る特許文献検索装置とは異なる。まず、本実施の形態に係る日本特許文献検索処理の動作について以下の図を用いて説明する。図17は実施の形態2に係る日本特許文献検索処理の動作を示すフローチャートである。また、図18は、PCT出願情報の抽出の一例を示す図である。   The patent document search apparatus according to the present embodiment is different from the patent document search apparatus according to the first embodiment in the operations of the US patent document search process and the Japanese patent document search process. First, the operation of the Japanese patent document search process according to the present embodiment will be described with reference to the following diagram. FIG. 17 is a flowchart showing the operation of the Japanese patent document search process according to the second embodiment. FIG. 18 is a diagram illustrating an example of extraction of PCT application information.

まず、検索部2は、制御部1より米国特許文献検索処理の指示を受けると、図8(ユーザがキーワードを入力した場合)、または図9(ユーザが分類コードを入力した場合)に示すように、ユーザにより入力部3に入力されたキーである入力キー情報(キーワード、または分類コード)に基づいて、日本特許文献DBを検索する(S501、第1検索ステップ)。この検索において検索された日本特許文献を第1日本特許文献集合とする。   First, when the search unit 2 receives an instruction for US patent document search processing from the control unit 1, as shown in FIG. 8 (when the user inputs a keyword) or FIG. 9 (when the user inputs a classification code), as shown in FIG. In addition, based on the input key information (keyword or classification code) that is the key input to the input unit 3 by the user, the Japanese Patent Literature DB is searched (S501, first search step). The Japanese patent documents searched in this search are set as the first Japanese patent document set.

検索部2により日本特許文献が検索されると、制御部1は、図18に示すように、第1日本特許文献集合におけるPCT出願、または優先権主張としての日本特許文献に対応する米国特許文献を示す情報である第1PCT出願情報(第1関連情報)を抽出する(S502、第2検索ステップ)。   When the Japanese patent document is searched by the search unit 2, the control unit 1, as shown in FIG. 18, the US patent document corresponding to the PCT application in the first Japanese patent document set or the Japanese patent document as the priority claim. The first PCT application information (first related information), which is information indicating the above, is extracted (S502, second search step).

さらに、検索部2は、抽出したPCT出願情報に基づいて、米国特許文献DB7を検索する(S503、第2検索ステップ)。この検索結果である米国特許文献を米国特許文献集合とする。   Further, the search unit 2 searches the US patent document DB 7 based on the extracted PCT application information (S503, second search step). The US patent document that is the search result is defined as a set of US patent documents.

次に、本実施の形態に係る米国特許文献検索処理の動作について以下の図を用いて説明する。図19は実施の形態2に係る日本特許文献検索処理の動作を示すフローチャートである。また、図20は、PCT出願情報の抽出の一例を示す図である。   Next, the operation of the US patent document search process according to the present embodiment will be described with reference to the following diagram. FIG. 19 is a flowchart showing the operation of the Japanese patent document search process according to the second embodiment. FIG. 20 is a diagram illustrating an example of extraction of PCT application information.

まず、制御部1は、図19に示すように、第2米国特許文献集合におけるPCT出願、または優先権主張としての米国特許文献に対応する日本特許文献を示す情報である第2PCT出願情報(第2関連情報)を抽出する(S501、第3検索ステップ)。   First, as shown in FIG. 19, the control unit 1 includes second PCT application information (first PCT application information (first 2 related information) is extracted (S501, third search step).

さらに、制御部1は、抽出した第2PCT出願情報に基づいて、日本特許文献DB6を検索する(S502、第3検索ステップ)。この検索結果である日本特許文献を第2日本特許集合とする。   Further, the control unit 1 searches the Japanese Patent Literature DB 6 based on the extracted second PCT application information (S502, third search step). The Japanese patent document that is the search result is set as the second Japanese patent set.

上述したように、本実施の形態に係る特許文献検索装置は、PCT出願、または優先権主張としての特許文献に対応する特許文献を検索することで、適合する他国の特許文献を検索することができ、引用文献に比べてより適合する特許文献を検索することができる。   As described above, the patent document search apparatus according to the present embodiment can search for a patent document corresponding to a PCT application or a patent document as a priority claim, thereby searching for a patent document in another country that matches. It is possible to search for a patent document that is more suitable than the cited document.

実施の形態3. Embodiment 3 FIG.

実施の形態2においては、引用情報の代わりにPCT出願情報を用いたが、本実施の形態は、引用情報の代わりにIPC分類を用いる点が実施の形態2とは異なる。以下、実施の形態2とは異なる動作について説明する。   In the second embodiment, PCT application information is used instead of the citation information. However, this embodiment is different from the second embodiment in that the IPC classification is used instead of the citation information. Hereinafter, operations different from those of the second embodiment will be described.

本実施の形態に係る特許文献検索装置は、米国特許文献検索処理及び日本特許文献検索処理の動作が実施の形態2に係る特許文献検索装置とは異なる。まず、本実施の形態に係る日本特許文献検索処理の動作について以下の図を用いて説明する。図21は実施の形態3に係る日本特許文献検索処理の動作を示すフローチャートである。また、図22は、IPC分類の抽出の一例を示す図である。   The patent document search apparatus according to the present embodiment is different from the patent document search apparatus according to the second embodiment in the operations of the US patent document search process and the Japanese patent document search process. First, the operation of the Japanese patent document search process according to the present embodiment will be described with reference to the following diagram. FIG. 21 is a flowchart showing the operation of the Japanese patent document search process according to the third embodiment. FIG. 22 is a diagram illustrating an example of IPC classification extraction.

まず、検索部2は、制御部1より米国特許文献検索処理の指示を受けると、図8(ユーザがキーワードを入力した場合)、または図9(ユーザが分類コードを入力した場合)に示すように、ユーザにより入力部3に入力されたキーである入力キー情報(キーワード、または分類コード)に基づいて、日本特許文献DBを検索する(S701、第1検索ステップ)。この検索において検索された日本特許文献を第1日本特許文献集合とする。   First, when the search unit 2 receives an instruction for US patent document search processing from the control unit 1, as shown in FIG. 8 (when the user inputs a keyword) or FIG. 9 (when the user inputs a classification code), as shown in FIG. In addition, based on input key information (keyword or classification code) that is a key input to the input unit 3 by the user, the Japanese Patent Literature DB is searched (S701, first search step). The Japanese patent documents searched in this search are set as the first Japanese patent document set.

検索部2により日本特許文献が検索されると、制御部1は、図22に示すように第1日本特許文献集合におけるIPC分類(第1関連情報)を抽出する(S702、第2検索ステップ)。   When the search unit 2 searches for Japanese patent documents, the control unit 1 extracts the IPC classification (first related information) in the first Japanese patent document set as shown in FIG. 22 (S702, second search step). .

さらに、検索部2は、抽出したIPC分類に基づいて、米国特許文献DB7を検索する(S703、第2検索ステップ)。この検索結果である米国特許文献を米国特許文献集合とする。   Further, the search unit 2 searches the US patent document DB 7 based on the extracted IPC classification (S703, second search step). The US patent document that is the search result is defined as a set of US patent documents.

次に、本実施の形態に係る米国特許文献検索処理の動作について以下の図を用いて説明する。図23は実施の形態3に係る日本特許文献検索処理の動作を示すフローチャートである。また、図24は、IPC分類の抽出の一例を示す図である。   Next, the operation of the US patent document search process according to the present embodiment will be described with reference to the following diagram. FIG. 23 is a flowchart showing the operation of the Japanese patent document search process according to the third embodiment. FIG. 24 is a diagram illustrating an example of IPC classification extraction.

まず、制御部1は、図24に示すように、第2米国特許文献集合におけるIPC分類(第2関連情報)を抽出する(S801、第3検索ステップ)。   First, as shown in FIG. 24, the control unit 1 extracts the IPC classification (second related information) in the second US patent document set (S801, third search step).

さらに、制御部1は、抽出したIPC分類に基づいて、日本特許文献DB6を検索する(S802、第3検索ステップ)。この検索結果である日本特許文献を第2日本特許集合とする。   Further, the control unit 1 searches the Japanese Patent Literature DB 6 based on the extracted IPC classification (S802, third search step). The Japanese patent document that is the search result is set as the second Japanese patent set.

上述したように、本実施の形態に係る特許文献検索装置は、国際的に規定された分類であるIPC分類を用いることによって、適合する他国の特許文献を検索することができ、少なくともIPC分類においては同様の分類が付された特許文献を検索することができる。また、抽出したIPC分類に対して、例えば、多くの特許に付与されているIPC分類に対しては低い重みを付け、少数の特許に付与されているIPC分類に対しては高い重みを付ける、というように、その頻度に基づいて重み付けを行い、一定以上の重み付けがなされたIPC分類だけを検索に用いても構わない。 As described above, the patent document search apparatus according to the present embodiment can search for patent documents in other countries that are compatible by using the IPC classification that is an internationally defined classification, and at least in the IPC classification. Can search patent documents with the same classification. Further, for the extracted IPC classification, for example, a low weight is given to the IPC classification given to many patents, and a high weight is given to the IPC classification given to a small number of patents. As described above, weighting is performed based on the frequency, and only the IPC classification with a certain weight or more may be used for the search.

実施の形態4.
上述した実施の形態において、日本特許文献から米国特許文献を検索するための情報(第1関連情報、第2関連情報)として、引用情報、PCT出願情報、IPC分類をそれぞれ用いたが、本実施の形態においては、日本特許文献から米国特許文献を検索するための情報(第1関連情報)と、米国特許文献から日本特許文献を検索するための情報(第2関連情報)は、それぞれ異なる情報を選択することができる。図25は、条件設定画面の例を示す図である。
Embodiment 4 FIG.
In the above-described embodiment, citation information, PCT application information, and IPC classification are used as information (first related information and second related information) for searching US patent documents from Japanese patent documents. In the embodiment, information (first related information) for searching US patent documents from Japanese patent documents and information (second related information) for searching Japanese patent documents from US patent documents are different information. Can be selected. FIG. 25 is a diagram illustrating an example of a condition setting screen.

検索のためのキー情報の入力において、制御部1が図25に示すような条件設定画面を表示部4に表示させることによって、本実施の形態に係る特許文献検索装置は、日本特許文献から米国特許文献を検索するための情報と、米国特許文献から日本特許文献を検索するための情報をそれぞれユーザに選択させることができる。また、図25において、一次検索は米国特許文献検索処理の条件を示し、二次検索は日本特許文献検索処理の条件を示す。条件が設定されると、本実施の形態に係る特許文献検索装置は、設定に応じて実施の形態1、実施の形態2、実施の形態3において説明した米国特許文献検索処理、日本特許文献検索処理をそれぞれ実行する。   In inputting key information for search, the control unit 1 causes the display unit 4 to display a condition setting screen as shown in FIG. The user can select information for searching for patent documents and information for searching Japanese patent documents from US patent documents. In FIG. 25, the primary search indicates the conditions for the US patent document search process, and the secondary search indicates the conditions for the Japanese patent document search process. When the conditions are set, the patent document search apparatus according to the present embodiment performs the US patent document search process and the Japanese patent document search described in the first, second, and third embodiments according to the setting. Each process is executed.

上述したように、米国特許文献検索処理、日本特許文献検索処理において、検索のために用いる情報をそれぞれ選択可能にすることで、検索する文献の幅を調節することができる。例えば、米国特許文献検索処理においてIPC分類を用いると、同様のIPC分類の文献を検索するため、入力キー情報に対して確度の高い米国特許文献を検索することができる。また、日本特許文献検索処理において引用情報を用いると、異なる分類であっても内容の近い米国特許文献を検索することができる。 As described above, in the US patent document search process and the Japanese patent document search process, it is possible to adjust the width of documents to be searched by enabling selection of information used for the search. For example, when the IPC classification is used in the US patent document search process, a document having a similar IPC classification is searched, and therefore, a US patent document with high accuracy can be searched for the input key information. Further, when citation information is used in the Japanese patent document search process, it is possible to search for US patent documents having similar contents even in different classifications.

また、本実施の形態に係る文献検索装置は、情報処理装置に容易に適用することができ、情報処理装置の性能をより高めることができる。ここで、情報処理装置には、例えばサーバ、PC(Personal Computer)等が含まれ得る。   Further, the document retrieval apparatus according to the present embodiment can be easily applied to the information processing apparatus, and can further improve the performance of the information processing apparatus. Here, the information processing apparatus may include, for example, a server, a PC (Personal Computer), and the like.

更に、特許文献検索装置を構成するコンピュータにおいて上述した各ステップを実行させるプログラムを、特許文献検索プログラムとして提供することができる。上述したプログラムは、コンピュータにより読取り可能な記録媒体に記憶させることによって、特許文献検索装置を構成するコンピュータに実行させることが可能となる。ここで、上記コンピュータにより読取り可能な記録媒体としては、ROMやRAM等のコンピュータに内部実装される内部記憶装置、CD−ROMやフレキシブルディスク、DVDディスク、光磁気ディスク、ICカード等の可搬型記憶媒体や、コンピュータプログラムを保持するデータベース、或いは、他のコンピュータ並びにそのデータベースや、更に回線上の伝送媒体をも含むものである。   Furthermore, a program for executing the above steps in a computer constituting the patent document search device can be provided as a patent document search program. By storing the above-described program in a computer-readable recording medium, the computer constituting the patent document search apparatus can be executed. Here, examples of the recording medium readable by the computer include an internal storage device such as a ROM and a RAM, a portable storage such as a CD-ROM, a flexible disk, a DVD disk, a magneto-optical disk, and an IC card. It includes a medium, a database holding a computer program, another computer and its database, and a transmission medium on a line.

(付記1) 複数の文書で構成される第1の文書群を対象に検索した検索結果を利用して、複数の文書で構成される第2の文書群に含まれる文書を検索する文書検索方法であって、
コンピュータが、
特定の語句、または、文書を分類する特定の分類項目を検索条件として受け付ける検索受付ステップと、
前記検索条件に基づいて、前記第1の文書群に含まれる所定の文書を検索する第1検索ステップと、
前記第1検索ステップにおいて検索された文書に含まれる、前記第1の文書群と前記第2の文書群を関連づける関連情報を特定し、該関連情報を検索条件として前記第2の文書群を検索し、該検索によって抽出された文書に付与された分類項目を特定し、該特定された分類項目に基づいて再び第2の文書群を検索する第2検索ステップと、
前記第2検索ステップにおいて検索された文書に含まれる、前記関連情報を特定し、該関連情報を検索条件として、前記第1の文書群を検索する第3検索ステップと、
前記第3検索ステップにおいて前記第1の文書群から検索された文書に含まれる語句または分類項目を特定し、前記検索受付ステップにおいて検索条件として受け付けた前記語句または分類項目との一致度を算出し、該一致度を示す検索結果情報を出力する出力ステップ、
から構成されることを特徴とする文書検索方法。
(付記2) 付記1に記載の文書検索方法であって、
前記第2検索ステップ、または、前記第3検索ステップにおいて、関連情報として、前記第1の文書群と前記第2の文書群に共通する文献識別情報を特定する
ことを特徴とする文書検索方法。
(付記3) 付記1に記載の文書検索方法であって、
前記第2検索ステップ、または、前記第3検索ステップにおいて、関連情報として、前記第1の文書群と前記第2の文書群に共通する分類項目を特定することを特徴とする文書検索方法。
(付記4) 付記1に記載の文書検索方法であって、
前記第2検索ステップ、または、前記第3検索ステップにおいて、前記関連情報として、前記第1または前記第2の文書群のうちのいずれか一方の文書群から検索された前記文書において引用される他方の文書群内の文書を特定することを特徴とする文書検索方法。
(付記5) 付記1乃至付記4のいずれかに記載の文書検索方法であって、
前記第2検索ステップにおいて、前記関連情報に基づいて前記第2の文書群を検索し、該検索によって抽出された文書について、該抽出文書に付与された、前記第1の文書群で使用される分類体系とは異なる分類体系の分類項目を特定し、該特定された分類項目に基づいて、再び第2の文書群を検索することを特徴とする文書検索方法。
(付記6) 付記1に記載の文書検索方法であって、
前記第2検索ステップにおいては、前記抽出された文書に付与された前記分類項目を複数特定し、該特定された各々の分類項目を検索条件として再び第2の文書群を検索し、
前記第3検索ステップにおいては、前記特定された分類項目毎に、検索された文書に含まれる前記関連情報を検索条件として、前記第1の文書群を検索し、
前記出力ステップにおいては、前記特定された分類項目毎に、前記第1の文書群から検索された文書に含まれる語句または分類項目を特定し、前記検索受付ステップにおいて検索条件として受け付けた前記語句または分類項目との一致度を算出し、前記第2検索ステップで特定された分類項目毎に該一致度を示す検索結果を出力する
ことを特徴とする文書検索方法。
(付記7) 付記2に記載の文書検索方法であって、
前記第1および第2の文書群に含まれる文書は、特許文献であり、
前記第1の文書群と前記第2の文書群に共通する文献識別情報は、特許文献のPCT出願情報である
ことを特徴とする文書検索方法。
(付記8) 付記3に記載の文書検索方法であって、
前記第1および第2の文書群に含まれる文書は、特許文献であり、
前記第1の文書群と前記第2の文書群に共通する分類項目は、特許文献を分類するIPC分類体系に準拠した分類項目であることを特徴とする文書検索方法。
(付記9) 付記4に記載の文書検索方法であって、
前記第1および第2の文書群に含まれる文書は、特許文献であり、
前記第1または第2の文書群のうちのいずれか一方の文書群から検索された特許文献において引用される、他方の文書群内の特許文献の識別番号を特定することを特徴とする文書検索方法。
(付記10) 複数の文書で構成される第1の文書群を対象に検索した検索結果を利用して、複数の文書で構成される第2の文書群に含まれる文書を検索する文書検索装置であって、
特定の語句、または、文書を分類する特定の分類項目を検索条件として受け付ける検索受付手段と、
前記検索条件に基づいて、前記第1の文書群に含まれる所定の文書を検索する第1検索手段と、
前記第1検索手段により検索された文書に含まれる、前記第1の文書群と前記第2の文書群を関係づける関連情報を特定し、該関連情報を検索条件として前記第2の文書群を検索し、該検索によって抽出された文書に付与された分類項目を特定し、該特定した分類項目に基づいて、再び第2の文書群を検索する第2検索手段と、
前記第2検索手段により検索された文書に含まれる、前記関連情報を特定し、該関連情報を検索条件として、前記第1の文書群を検索する第3検索手段と、
前記第3検索手段により検索された前記第1文書群内の文書に含まれる語句または分類項目を特定し、前記検索受付手段が受け付けた前記語句または分類項目との一致度を算出し、該一致度を示す検索結果情報を出力する出力手段と
を備える文書検索装置。
(付記11) 付記10に記載の文書検索装置であって、
前記第2検索手段、または、前記第3検索手段において、関連情報として、前記第1の文書群と前記第2の文書群に共通する文献識別情報を特定する
ことを特徴とする文書検索装置。
(付記12) 付記10に記載の文書検索装置であって、
前記第2検索手段、または、前記第3検索手段において、関連情報として、前記第1の文書群と前記第2の文書群に共通する分類項目を特定することを特徴とする文書検索装置。
(付記13) 付記10に記載の文書検索装置であって、
前記第2検索手段、または、前記第3検索手段において、前記関連情報として、前記第1または前記第2の文書群のうちのいずれか一方の文書群から検索された前記文書において引用される他方の文書群内の文書を特定することを特徴とする文書検索装置。
(付記14) 付記10乃至付記13のいずれかに記載の文書検索装置であって、
前記第2検索手段において、前記関連情報に基づいて前記第2の文書群を検索し、該検索によって抽出された文書について、該抽出文書に付与された、前記第1の文書群で使用される分類体系とは異なる分類体系の分類項目を特定し、該特定された分類項目に基づいて、再び第2の文書群を検索することを特徴とする文書検索装置。
(付記15) 付記10に記載の文書検索装置であって、
前記第2検索手段においては、前記抽出された文書に付与された前記分類項目を複数特定し、該特定された各々の分類項目を検索条件として再び第2の文書群を検索し、
前記第3検索手段においては、前記特定された分類項目毎に、検索された文書に含まれる前記関連情報を検索条件として、前記第1の文書群を検索し、
前記出力手段においては、前記特定された分類項目毎に、前記第1の文書群から検索された文書に含まれる語句または分類項目を特定し、前記検索受付手段において検索条件として受け付けた前記語句または分類項目との一致度を算出し、前記第2検索手段で特定された分類項目毎に該一致度を示す検索結果を出力することを特徴とする文書検索装置。
(付記16) 付記11に記載の文書検索装置であって、
前記第1および第2の文書群に含まれる文書は、特許文献であり、
前記第1の文書群と前記第2の文書群に共通する文献識別情報は、特許文献のPCT出願情報であることを特徴とする文書検索装置。
(付記17) 付記12に記載の文書検索装置であって、
前記第1および第2の文書群に含まれる文書は、特許文献であり、
前記第1の文書群と前記第2の文書群に共通する分類項目は、特許文献を分類するIPC分類体系に準拠した分類項目であることを特徴とする文書検索装置。
(付記18) 付記13に記載の文書検索装置であって、
前記第1および第2の文書群に含まれる文書は、特許文献であり、
前記第1または第2の文書群のうちのいずれか一方の文書群から検索された特許文献において引用される、他方の文書群内の特許文献の識別番号を特定することを特徴とする文書検索装置。
(付記19) コンピュータを、
特定の語句、または、文書を分類する特定の分類項目を検索条件として受け付ける検索受付手段と、
前記検索条件に基づいて、前記第1の文書群に含まれる所定の文書を検索する第1検索手段と、
前記第1検索手段により検索された文書に含まれる、前記第1の文書群と前記第2の文書群を関係づける関連情報を特定し、該関連情報を検索条件として前記第2の文書群を検索し、該検索によって抽出された文書に付与された分類項目を特定し、再びする第2検索手段と、
前記第2検索手段により検索された文書に含まれる、前記関連情報を特定し、該関連情報を検索条件として、前記第1の文書群を検索する第3検索手段と、
前記第3検索手段により検索された前記第1文書群内の文書に含まれる語句または分類項目を特定し、前記検索手段が受け付けた前記語句または分類項目との一致度を算出し、該一致度を示す検索結果情報を出力する出力手段
として機能させる文書検索プログラムが記録されたコンピュータ読み取り可能な記録媒体。
(付記20) 付記19に記載の文書検索プログラムが記録されたコンピュータ読み取り可能な記録媒体であって、
前記第2検索手段においては、前記抽出された文書に付与された前記分類項目を複数特定し、該特定された各々の分類項目を検索条件として再び第2の文書群を検索し、
前記第3検索手段においては、前記特定された分類項目毎に、検索された文書に含まれる前記関連情報を検索条件として、前記第1の文書群を検索し、
前記出力手段においては、前記特定された分類項目毎に、前記第1の文書群から検索された文書に含まれる語句または分類項目を特定し、前記検索受付手段において検索条件として受け付けた前記語句または分類項目との一致度を算出し、前記第2検索手段で特定された分類項目毎に該一致度を示す検索結果を出力する
ことを特徴とする文書検索プログラムが記録されたコンピュータ読み取り可能な記録媒体。
(Additional remark 1) The document search method which searches the document contained in the 2nd document group comprised from a some document using the search result searched for the 1st document group comprised from the some document as object Because
Computer
A search accepting step for accepting a specific classification item for classifying a specific word or phrase or document as a search condition;
A first search step of searching for a predetermined document included in the first document group based on the search condition;
The related information that associates the first document group with the second document group included in the document searched in the first search step is specified, and the second document group is searched using the related information as a search condition. A second search step of specifying a classification item given to the document extracted by the search, and searching the second document group again based on the specified classification item;
A third search step of identifying the related information included in the document searched in the second search step, and searching the first document group using the related information as a search condition;
The phrase or classification item included in the document searched from the first document group in the third search step is specified, and the degree of coincidence with the phrase or classification item received as the search condition in the search reception step is calculated. An output step for outputting search result information indicating the degree of coincidence;
A document search method characterized by comprising:
(Supplementary note 2) The document retrieval method according to supplementary note 1, wherein
In the second search step or the third search step, document identification information common to the first document group and the second document group is specified as related information.
(Supplementary note 3) The document retrieval method according to supplementary note 1, wherein
In the second search step or the third search step, a classification item common to the first document group and the second document group is specified as related information.
(Supplementary note 4) The document retrieval method according to supplementary note 1, wherein
In the second search step or the third search step, as the related information, the other cited in the document searched from either one of the first document group or the second document group. A document search method characterized by specifying a document in a document group.
(Supplementary note 5) The document search method according to any one of supplementary notes 1 to 4,
In the second search step, the second document group is searched based on the related information, and the document extracted by the search is used in the first document group given to the extracted document. A document search method characterized by specifying a classification item of a classification system different from the classification system, and searching the second document group again based on the specified classification item.
(Supplementary note 6) The document search method according to supplementary note 1, wherein
In the second search step, a plurality of the classification items assigned to the extracted document are specified, and the second document group is searched again using each of the specified classification items as a search condition,
In the third search step, for each of the identified classification items, the first document group is searched using the related information included in the searched document as a search condition,
In the output step, for each identified category item, a phrase or category item included in a document searched from the first document group is specified, and the phrase or phrase received as a search condition in the search reception step A document search method comprising: calculating a degree of coincidence with a classification item and outputting a search result indicating the degree of coincidence for each classification item specified in the second search step.
(Supplementary note 7) The document search method according to supplementary note 2, wherein
The documents included in the first and second document groups are patent documents,
The document search method, wherein the document identification information common to the first document group and the second document group is PCT application information of patent documents.
(Supplementary note 8) The document retrieval method according to supplementary note 3, wherein
The documents included in the first and second document groups are patent documents,
The document retrieval method according to claim 1, wherein the classification items common to the first document group and the second document group are classification items based on an IPC classification system for classifying patent documents.
(Supplementary note 9) The document search method according to supplementary note 4, wherein
The documents included in the first and second document groups are patent documents,
A document search characterized by specifying an identification number of a patent document in the other document group that is cited in the patent document searched from either one of the first or second document group Method.
(Additional remark 10) The document search apparatus which searches the document contained in the 2nd document group comprised from a some document using the search result searched for the 1st document group comprised from the some document as object Because
Search accepting means for accepting a specific term or a specific classification item for classifying a document as a search condition;
First search means for searching for a predetermined document included in the first document group based on the search condition;
The related information relating to the first document group and the second document group included in the document searched by the first search means is specified, and the second document group is selected using the related information as a search condition. A second search means for searching, specifying a classification item given to the document extracted by the search, and searching the second document group again based on the specified classification item;
Third search means for specifying the related information contained in the document searched by the second search means, and searching the first document group using the related information as a search condition;
The phrase or classification item included in the document in the first document group searched by the third search means is specified, the degree of coincidence with the word or classification item received by the search reception means is calculated, and the match A document search apparatus comprising: output means for outputting search result information indicating a degree.
(Supplementary note 11) The document search device according to supplementary note 10, wherein
In the second search means or the third search means, document identification information common to the first document group and the second document group is specified as related information.
(Supplementary note 12) The document search device according to supplementary note 10, wherein
In the second search means or the third search means, a classification item common to the first document group and the second document group is specified as related information.
(Supplementary note 13) The document search device according to supplementary note 10,
In the second search means or the third search means, the other cited in the document searched from either one of the first or second document group as the related information. A document search apparatus characterized by identifying documents in a document group.
(Supplementary note 14) The document search device according to any one of supplementary notes 10 to 13,
In the second search means, the second document group is searched based on the related information, and the document extracted by the search is used in the first document group given to the extracted document. A document search apparatus characterized by specifying a classification item of a classification system different from the classification system and searching the second document group again based on the specified classification item.
(Supplementary note 15) The document search device according to supplementary note 10,
In the second search means, a plurality of the classification items assigned to the extracted document are specified, and the second document group is searched again using each of the specified classification items as a search condition,
In the third search means, for each of the identified classification items, the first document group is searched using the related information included in the searched document as a search condition,
In the output means, for each identified classification item, the phrase or classification item included in the document retrieved from the first document group is identified, and the word or phrase received as a search condition in the search reception means A document search apparatus characterized by calculating a degree of coincidence with a classification item and outputting a search result indicating the degree of coincidence for each classification item specified by the second search means.
(Supplementary note 16) The document search device according to supplementary note 11, wherein
The documents included in the first and second document groups are patent documents,
The document identification apparatus characterized in that the document identification information common to the first document group and the second document group is PCT application information of patent documents.
(Supplementary note 17) The document search device according to supplementary note 12,
The documents included in the first and second document groups are patent documents,
The document retrieval apparatus according to claim 1, wherein the classification items common to the first document group and the second document group are classification items based on an IPC classification system for classifying patent documents.
(Supplementary note 18) The document search device according to supplementary note 13, wherein
The documents included in the first and second document groups are patent documents,
A document search characterized by specifying an identification number of a patent document in the other document group that is cited in the patent document searched from either one of the first or second document group apparatus.
(Supplementary note 19)
Search accepting means for accepting a specific term or a specific classification item for classifying a document as a search condition;
First search means for searching for a predetermined document included in the first document group based on the search condition;
The related information relating to the first document group and the second document group included in the document searched by the first search means is specified, and the second document group is selected using the related information as a search condition. A second search means for searching, identifying a classification item attached to the document extracted by the search,
Third search means for specifying the related information contained in the document searched by the second search means, and searching the first document group using the related information as a search condition;
Specifying a word or category included in a document in the first document group searched by the third search means, calculating a degree of coincidence with the word or category received by the search means, A computer-readable recording medium on which is recorded a document search program that functions as output means for outputting search result information indicating
(Supplementary note 20) A computer-readable recording medium on which the document search program according to supplementary note 19 is recorded,
In the second search means, a plurality of the classification items assigned to the extracted document are specified, and the second document group is searched again using each of the specified classification items as a search condition,
In the third search means, for each of the identified classification items, the first document group is searched using the related information included in the searched document as a search condition,
In the output means, for each identified classification item, the phrase or classification item included in the document retrieved from the first document group is identified, and the word or phrase received as a search condition in the search reception means A computer-readable record in which a document search program is recorded, wherein the degree of coincidence with a classification item is calculated, and a search result indicating the degree of coincidence is output for each classification item specified by the second retrieval unit Medium.

実施の形態1に係る文献検索装置の構成の一例を示すブロック図である。1 is a block diagram illustrating an example of a configuration of a document search device according to Embodiment 1. FIG. 実施の形態1に係る文献検索装置の動作を示すフローチャートである。4 is a flowchart showing an operation of the document search device according to the first embodiment. 分類コード抽出の一例を示す図である。It is a figure which shows an example of classification code extraction. 分類コード検索の一例を示す図である。It is a figure which shows an example of a classification code search. キーワードを入力とした場合のキーワード抽出及び集計の一例を示す図である。It is a figure which shows an example of keyword extraction and totalization at the time of setting a keyword as input. 分類コードを入力とした場合のキーワード抽出及び集計の一例を示す図である。It is a figure which shows an example of keyword extraction and totalization at the time of using a classification code as input. 実施の形態1における米国特許文献検索処理の動作を示すフローチャートである。6 is a flowchart showing an operation of a US patent document search process in the first embodiment. キーワードによる日本特許文献の検索の一例を示す図である。It is a figure which shows an example of the search of the Japanese patent document by a keyword. 分類コードによる日本特許文献の検索の一例を示す図である。It is a figure which shows an example of the search of a Japanese patent document by a classification code. 引用情報の抽出の一例を示す図である。It is a figure which shows an example of extraction of quotation information. 実施の形態1における日本特許文献検索処理の動作を示すフローチャートである。4 is a flowchart showing an operation of a Japanese patent document search process in the first embodiment. 実施の形態1における日本特許文献検索処理の一例を示す図である。FIG. 10 is a diagram illustrating an example of a Japanese patent document search process in the first embodiment. 適合性判定処理の動作を示すフローチャートである。It is a flowchart which shows the operation | movement of a compatibility determination process. 入力キー情報と抽出キー情報のマッチングの一例を示す図である。It is a figure which shows an example of the matching of input key information and extraction key information. 抽出キー情報のスコアリングの一例を示す図である。It is a figure which shows an example of scoring of extraction key information. 結果表示画面を示す図である。It is a figure which shows a result display screen. 実施の形態2に係る日本特許文献検索処理の動作を示すフローチャートである。10 is a flowchart showing an operation of a Japanese patent document search process according to the second embodiment. PCT出願情報の抽出の一例を示す図である。It is a figure which shows an example of extraction of PCT application information. 実施の形態2に係る日本特許文献検索処理の動作を示すフローチャートである。10 is a flowchart showing an operation of a Japanese patent document search process according to the second embodiment. PCT出願情報の抽出の一例を示す図である。It is a figure which shows an example of extraction of PCT application information. 実施の形態3に係る日本特許文献検索処理の動作を示すフローチャートである。10 is a flowchart showing an operation of a Japanese patent document search process according to Embodiment 3. IPC分類の抽出の一例を示す図である。It is a figure which shows an example of extraction of an IPC classification. 実施の形態3に係る日本特許文献検索処理の動作を示すフローチャートである。10 is a flowchart showing an operation of a Japanese patent document search process according to Embodiment 3. IPC分類の抽出の一例を示す図である。It is a figure which shows an example of extraction of an IPC classification. 条件設定画面の例を示す図である。 実施の形態1に係る文献検索装置の構成の一例を示すブロック図である。It is a figure which shows the example of a condition setting screen. 1 is a block diagram illustrating an example of a configuration of a document search device according to Embodiment 1. FIG.

符号の説明Explanation of symbols

1 制御部、2 検索部、3 入力部、4 表示部、5 記憶部、6 日本特許文献DB、7 米国特許文献DB。 DESCRIPTION OF SYMBOLS 1 Control part, 2 Search part, 3 Input part, 4 Display part, 5 Memory | storage part, 6 Japanese patent document DB, 7 US patent document DB.

Claims (5)

第1の文書群を検索する際に用いられる検索条件に基づき、第2の文書群に含まれる文書を検索する文書検索方法であって、
コンピュータが、
受け付けた検索条件に基づいて前記第1の文書群を検索し、
検索された前記第1の文書群の文書に関連づけられた前記第2の文書群の文書を抽出し、
抽出された前記第2の文書群の文書の属性情報であって、前記検索条件と適合する適合属性情報に基づき、前記第2の文書群を検索する、
ことを特徴とする文書検索方法。
A document search method for searching for a document included in a second document group based on a search condition used when searching for the first document group,
Computer
Search the first document group based on the received search condition,
Extracting the documents of the second document group associated with the retrieved documents of the first document group;
Searching for the second document group based on the attribute information of the extracted document of the second document group, which is compatible attribute information that matches the search condition;
A document search method characterized by the above.
請求項1に記載の文書検索方法であって、
前記抽出は、検索された前記第1の文書群の文書に引用される前記第2の文書群の文書を抽出するものであることを特徴とする文書検索方法。
The document search method according to claim 1,
2. The document search method according to claim 1, wherein the extraction is to extract a document of the second document group cited in a document of the searched first document group.
請求項1に記載の文書検索方法であって、
前記第1の文書群および前記第2の文書群は、それぞれ異なる国の特許出願に関連した文書による文書群であり、
前記抽出は、検索された前記第1の文書群の文書と、PCT出願による関連を持つ、または、優先権による関連を持つ、前記第2の文書群の文書を抽出するものであることを特徴とする文書検索方法。
The document search method according to claim 1,
The first document group and the second document group are document groups according to documents related to patent applications in different countries,
The extraction is to extract a document of the second document group that has a relation by a PCT application with a retrieved document of the first document group or a relation by priority. Document search method.
第1の文書群を検索する際に用いられる検索条件に基づき、第2の文書群に含まれる文書を検索する文書検索装置であって、A document search device for searching for a document included in a second document group based on a search condition used when searching for the first document group,
受け付けた検索条件に基づいて前記第1の文書群を検索する第1検索手段と、  First search means for searching for the first document group based on an accepted search condition;
検索された前記第1の文書群の文書に関連づけられた前記第2の文書群の文書を抽出する抽出手段と、  Extracting means for extracting the document of the second document group associated with the searched document of the first document group;
抽出された前記第2の文書群の文書の属性情報であって、前記検索条件と適合する適合属性情報に基づき、前記第2の文書群を検索する第2検索手段と、  Second search means for searching the second document group based on the attribute information of the extracted document of the second document group and matching attribute information that matches the search condition;
を備える文書検索装置。  A document search apparatus comprising:
コンピュータを、Computer
受け付けた検索条件に基づいて第1の文書群を検索する第1検索手段と、  First search means for searching for a first document group based on the received search condition;
検索された前記第1の文書群の文書に関連づけられた第2の文書群の文書を抽出する抽出手段と、  Extracting means for extracting a document of the second document group associated with the searched document of the first document group;
抽出された前記第2の文書群の文書の属性情報であって、前記検索条件と適合する適合属性情報に基づき、前記第2の文書群を検索する第2検索手段と、  Second search means for searching the second document group based on the attribute information of the extracted document of the second document group and matching attribute information that matches the search condition;
して機能させる文書検索プログラム。  A document search program that makes it work.
JP2008073266A 2008-03-21 2008-03-21 Document search method, document search device, and recording medium recording document search program Active JP5292873B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008073266A JP5292873B2 (en) 2008-03-21 2008-03-21 Document search method, document search device, and recording medium recording document search program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008073266A JP5292873B2 (en) 2008-03-21 2008-03-21 Document search method, document search device, and recording medium recording document search program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012243950A Division JP5633552B2 (en) 2012-11-05 2012-11-05 Document search method, document search device, and recording medium recording document search program

Publications (2)

Publication Number Publication Date
JP2009230327A JP2009230327A (en) 2009-10-08
JP5292873B2 true JP5292873B2 (en) 2013-09-18

Family

ID=41245663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008073266A Active JP5292873B2 (en) 2008-03-21 2008-03-21 Document search method, document search device, and recording medium recording document search program

Country Status (1)

Country Link
JP (1) JP5292873B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5602101B2 (en) * 2011-06-24 2014-10-08 有限会社アイ・アール・ディー Patent gazette information output device, patent gazette information output method, and program

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04670A (en) * 1990-04-18 1992-01-06 Ricoh Co Ltd Information retrieving device
JPH05143647A (en) * 1991-11-22 1993-06-11 Nippon Telegr & Teleph Corp <Ntt> Data base retrieval processing method
JPH08272818A (en) * 1995-04-03 1996-10-18 Nippon Steel Corp Information retrieval system
JP2000148789A (en) * 1998-11-05 2000-05-30 Inpatekku Kk Method and device for analyzing quoted document of patent information or the like
JP2003141168A (en) * 2001-11-05 2003-05-16 Ricoh Co Ltd Patent information retrieval system and method, program for realizing functions, and recording medium
JP2003150623A (en) * 2001-11-09 2003-05-23 Ntt Data Technology Corp Language crossing type patent document retrieval method
WO2007105530A1 (en) * 2006-03-10 2007-09-20 Hiroshima City Related term acquiring device, related term acquiring method, technology trend information creating device, technology trend information creating method, and program

Also Published As

Publication number Publication date
JP2009230327A (en) 2009-10-08

Similar Documents

Publication Publication Date Title
CN100535898C (en) System and method for question-reply type document search
KR100295354B1 (en) Document information retrieval system
JP4640591B2 (en) Document search device
US7752032B2 (en) Apparatus and method for translating Japanese into Chinese using a thesaurus and similarity measurements, and computer program therefor
US7647303B2 (en) Document processing apparatus for searching documents, control method therefor, program for implementing the method, and storage medium storing the program
US20120323905A1 (en) Ranking data utilizing attributes associated with semantic sub-keys
RU2007114029A (en) METHOD, SYSTEM AND COMPUTER SOFTWARE PRODUCT FOR SEARCHING, NAVIGATION AND RANKING OF DOCUMENTS IN A PERSONAL NETWORK
US20060288038A1 (en) Generation of a blended classification model
CN103430172A (en) Search apparatus, search method, and program
US20120162244A1 (en) Image search color sketch filtering
JP5910134B2 (en) Text search apparatus and program
JP4894510B2 (en) Literature retrieval program, literature retrieval device, literature retrieval method
US20120317141A1 (en) System and method for ordering of semantic sub-keys
JP2000200281A (en) Device and method for information retrieval and recording medium where information retrieval program is recorded
US9875298B2 (en) Automatic generation of a search query
JP2005038395A (en) Database retrieval device
JP2012230544A (en) Image retrieval device and program
JP2001184358A (en) Device and method for retrieving information with category factor and program recording medium therefor
JP2007025939A (en) Multilingual document retrieval device, multilingual document retrieval method and program for retrieving multilingual document
JP5699744B2 (en) SEARCH METHOD, SEARCH DEVICE, AND COMPUTER PROGRAM
JP5633552B2 (en) Document search method, document search device, and recording medium recording document search program
JP5292873B2 (en) Document search method, document search device, and recording medium recording document search program
US20120317103A1 (en) Ranking data utilizing multiple semantic keys in a search query
JP4813312B2 (en) Electronic document search method, electronic document search apparatus and program
JP6181890B2 (en) Literature analysis apparatus, literature analysis method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120904

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130527

R150 Certificate of patent or registration of utility model

Ref document number: 5292873

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150