JP5347307B2 - Information retrieval apparatus, information retrieval method, and control program - Google Patents

Information retrieval apparatus, information retrieval method, and control program Download PDF

Info

Publication number
JP5347307B2
JP5347307B2 JP2008093635A JP2008093635A JP5347307B2 JP 5347307 B2 JP5347307 B2 JP 5347307B2 JP 2008093635 A JP2008093635 A JP 2008093635A JP 2008093635 A JP2008093635 A JP 2008093635A JP 5347307 B2 JP5347307 B2 JP 5347307B2
Authority
JP
Japan
Prior art keywords
information
unit
condition
display
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008093635A
Other languages
Japanese (ja)
Other versions
JP2009169926A (en
Inventor
秀夫 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008093635A priority Critical patent/JP5347307B2/en
Publication of JP2009169926A publication Critical patent/JP2009169926A/en
Application granted granted Critical
Publication of JP5347307B2 publication Critical patent/JP5347307B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To display a retrieval result of retrieval of information so that a user can understand more easily a state of matching between a retrieval condition and retrieval object information before a degree of matching between the retrieval condition and retrieval object information is calculated. <P>SOLUTION: An information retrieval device 1, which extracts a matching document for meeting the specified condition, includes: a specified condition information acquisition section 101 acquiring information regarding a wording being the document extraction condition; a document information extraction section 103 extracting the matching document on the basis of the acquired specified condition information; and an extraction result processing section 104 generating and outputting matching document display information for displaying information regarding the extracted matching document. The extraction result processing section 104 constitutes a matrix comprising one of a plurality of extracted matching documents and a plurality of wordings in rows and the other in columns, and generates the matching information display information so that each of cells of the matrix can show the frequency of use of a wording that the cell corresponds to in a matching document that the cell corresponds to. <P>COPYRIGHT: (C)2009,JPO&amp;INPIT

Description

本発明は、情報検索装置、情報検索方法、制御プログラムに関し、特に文献情報の検索処理における画面表示に関する。   The present invention relates to an information search apparatus, an information search method, and a control program, and more particularly to screen display in a search process for document information.

電子データに対する検索技術、あるいは検索結果の表示技術は、検索対象の情報量の増大による検索結果数の増大のため、ますます重要な技術となっている。なぜなら、求める情報が大量の検索結果に埋もれてしまい、見つけることが困難になっているからである。このような検索技術として、例えば、入力された検索要求の解析により設定された検索条件に基づいて検索を実行し、その検索結果を所定のスコア算出手段により順序付けする技術が提案されている(例えば、特許文献1参照)。   Search technology for electronic data or search result display technology has become an increasingly important technology because of the increase in the number of search results due to an increase in the amount of information to be searched. This is because the information that is sought is buried in a large amount of search results, making it difficult to find. As such a search technique, for example, a technique is proposed in which a search is executed based on search conditions set by analysis of an input search request, and the search results are ordered by a predetermined score calculation means (for example, , See Patent Document 1).

特許文献1に開示された検索方法による検索結果表示は、設定された検索条件の表示及び検索条件に適合するものとして抽出された情報の表示によって行なわれる。検索条件であれば、“タイトル”や“作成者”、等の検索対象項目と検索キー(検索語)が表示され、検索結果であれば、検索によって抽出された情報が検索条件に対する適合度の高い順に表示される。   The search result display by the search method disclosed in Patent Document 1 is performed by displaying a set search condition and displaying information extracted as being adapted to the search condition. If it is a search condition, search target items such as “title” and “creator” and a search key (search term) are displayed. If it is a search result, the information extracted by the search indicates the degree of suitability for the search condition. Displayed in descending order.

検索要求の解析による検索条件の設定において、入力された検索用文言の類義語を辞書検索して取得し、入力された文言に加えて取得された類義語も検索条件として設定する方法が用いられることがある。この場合、検索結果表示における検索情報の表示では、入力された文言及び取得された類義語が上述した検索語として表示される。   In setting search conditions by analyzing a search request, a method may be used in which a synonym of an input search word is obtained by dictionary search, and the acquired synonym in addition to the input word is also set as a search condition. is there. In this case, in the display of the search information in the search result display, the input word and the acquired synonym are displayed as the above-described search terms.

また、公開特許公報のIPC(International Patent Classification)やFI(File Index)等のように、検索対象の情報を分類する情報(以降、分類情報とする)が付加されている場合がある。このような場合において、検索結果として抽出された情報に付された分類情報の集計結果を表示する場合もある。例えば、抽出された夫々の情報に付されている分類情報を同一の分類情報毎にカウントし、カウント結果を表示する方法がある。
特開2007−233752号公報 特開2003−345811号公報
In addition, information for classifying information to be searched (hereinafter referred to as classification information) may be added, such as IPC (International Patent Classification) and FI (File Index) in published patent publications. In such a case, the total result of the classification information attached to the information extracted as the search result may be displayed. For example, there is a method of counting the classification information attached to each extracted information for each identical classification information and displaying the count result.
JP 2007-233752 A JP 2003-345811 A

しかしながら、検索条件に対する適合度の算出方法は各種提案されているが、その算出方法が必ずしもユーザの意図する情報の適合度を高く算出するとは限らない。従って、適合度を算出する前の、検索条件と検索対象情報との適合状況について、より理解し易いように表示することが求められる。   However, various methods for calculating the degree of fitness for the search condition have been proposed. However, the calculation method does not necessarily calculate the fitness of the information intended by the user high. Therefore, it is required to display the matching status between the search condition and the search target information before calculating the matching level so that the user can easily understand.

本発明は、上記実情を考慮してなされたものであり、情報の検索における検索結果の表示において、検索条件と検索対象情報との適合度を算出する前の、検索条件と検索対象情報との適合状況について、よりユーザに理解し易いように表示することを目的とする。   The present invention has been made in consideration of the above circumstances, and in the display of search results in information search, the search condition and the search target information before calculating the degree of matching between the search condition and the search target information. The purpose is to display the conformity status so that it can be easily understood by the user.

上記課題を解決するために、請求項1に記載の発明は、指定された条件に関する指定条件情報を取得する指定条件情報取得部と、前記指定条件情報に基づいて複数の適合情報を抽出する情報抽出部と、前記複数の適合情報に関する情報を表示させるための適合情報表示情報を生成する適合情報表示情報生成部とを有し、前記指定条件情報は、複数の異なる単位条件を含み、前記適合情報表示情報生成部は、前記複数の適合情報及び前記複数の異なる単位条件のうち一方を行とし、他方を列とするマトリクスを構成し、前記適合情報で、前記指定条件情報に含まれる複数の異なる単位条件が用いられる回数を示す充足度に関する情報を、前記マトリクスのセルに表示させるように前記適合情報表示情報を生成し、前記充足度が大きい前記単位条件を、前記抽出された複数の適合情報を構成する行又は列の近傍に表示させることを特徴とする。 In order to solve the above-mentioned problem, the invention described in claim 1 is a specification condition information acquisition unit that acquires specification condition information related to a specified condition, and information that extracts a plurality of pieces of matching information based on the specification condition information An extraction unit; and a matching information display information generating unit that generates matching information display information for displaying information on the plurality of matching information, wherein the specified condition information includes a plurality of different unit conditions, The information display information generation unit configures a matrix having one of the plurality of conforming information and the plurality of different unit conditions as a row and the other as a column, and the conforming information includes a plurality of items included in the designated condition information. information regarding sufficiency of indicating the number of times different units conditions are used to generate the adapted information display information to be displayed on the cell of the matrix, the unit condition the sufficiency of a large And wherein the display in the vicinity of the row or column constitutes a plurality of adaptation the extracted information.

ここで、上記指定された条件とは、文献を検索する際の条件であり、ユーザによって指定される。この指定された条件の一例としては、本発明の実施形態における検索条件入力部303に入力される情報であり、抽出すべき文献に開示されている発明を特定するための文章やキーワードである。また、上記適合情報とは、上記指定された条件を満たす情報として抽出された情報である。この適合情報の一例としては、本発明の実施形態において抽出された特許公報である。   Here, the specified condition is a condition for searching for a document, and is specified by the user. An example of the specified condition is information input to the search condition input unit 303 in the embodiment of the present invention, which is a sentence or a keyword for specifying the invention disclosed in the document to be extracted. The conforming information is information extracted as information satisfying the specified condition. An example of this conforming information is a patent publication extracted in the embodiment of the present invention.

また、上記指定条件情報とは、上記指定された条件を示す情報であり、具体的には、上記指定された条件を記述するテキスト情報である。この指定条件情報の一例としては、本発明の実施形態における検索条件入力部303に入力される情報であり、抽出すべき文献に開示されている発明を特定するための文章やキーワードである。   The designated condition information is information indicating the designated condition, and specifically, text information describing the designated condition. An example of the designation condition information is information input to the search condition input unit 303 in the embodiment of the present invention, which is a sentence or a keyword for specifying the invention disclosed in the document to be extracted.

また、上記適合情報に関する情報とは、抽出された適合情報を示す情報や、上記指定された条件に対して適合情報がどの程度条件を満たしているかを示す情報である。上記適合情報に関する情報の一例としては、本発明の実施形態において図13に示す抽出結果表示画面500に表示される情報である。また、単位条件とは上記指定条件情報によって定められる条件を構成する最小単位の条件である。上記単位条件の一例としては、本発明の実施形態に係る検索語である。また、上記単位条件の充足度に関する情報とは、夫々の適合文献が夫々の単位条件をどの程度満たしているかを示す度合いである。上記単位条件の充足度の一例としては、本発明の実施形態に係る抽出結果表示画面500の夫々のセルに表示されるヒット数である。   Further, the information related to the matching information is information indicating the extracted matching information and information indicating how much the matching information satisfies the specified condition. An example of the information related to the matching information is information displayed on the extraction result display screen 500 shown in FIG. 13 in the embodiment of the present invention. The unit condition is a minimum unit condition that constitutes a condition defined by the specified condition information. An example of the unit condition is a search term according to an embodiment of the present invention. Further, the information on the degree of satisfaction of the unit condition is a degree indicating how much each relevant document satisfies each unit condition. An example of the degree of satisfaction of the unit condition is the number of hits displayed in each cell of the extraction result display screen 500 according to the embodiment of the present invention.

また、請求項2に記載の発明は、請求項1に記載の情報検索装置において、前記充足度は、前記指定条件情報に含まれる複数の異なる単位条件及び当該単位条件の類義語情報が用いられる回数を示すことを特徴とする。 Further, in the information search device according to claim 1, the invention according to claim 2 is the information search device according to claim 1, wherein the sufficiency is the number of times that a plurality of different unit conditions included in the specified condition information and synonym information of the unit conditions are used. It is characterized by showing .

また、請求項に記載の発明は、請求項1または2に記載の情報検索装置において、前記複数の異なる単位条件のうちいずれか1つ若しくは複数を指定する単位条件指定情報を取得する単位条件指定情報取得部を有し、前記適合情報表示情報生成部は、前記指定条件指定部によって指定されている単位条件の充足度に基づいて前記抽出された複数の適合文献の表示順を決定するように前記適合情報表示情報を生成することを特徴とする。 The invention according to claim 3 is the information retrieval apparatus according to claim 1 or 2 , wherein the unit condition for acquiring unit condition designation information for designating one or more of the plurality of different unit conditions A designated information acquisition unit, wherein the relevant information display information generation unit determines a display order of the plurality of extracted relevant documents based on a degree of satisfaction of the unit condition designated by the designated condition designation unit. The conformity information display information is generated.

また、請求項に記載の発明は、請求項3に記載の情報検索装置において、ユーザによる操作情報を取得する操作情報取得部を有し、前記単位条件指定情報取得部は、前記単位条件が表示された表示領域に対するユーザの操作に基づき、前記表示領域に表示されている単位条件を指定する情報として前記単位条件指定情報を取得することを特徴とする。ここで、上記表示領域とは、上記適合文献表示部が上記適合文献に関する情報を表示する画面において上記単位条件が表示されている領域である。上記表示領域の一例としては、本発明の実施形態に係るソート指示部521である。 According to a fourth aspect of the present invention, in the information search device according to the third aspect of the present invention, the information retrieval device further includes an operation information acquisition unit that acquires operation information by a user, and the unit condition designation information acquisition unit The unit condition designation information is acquired as information for designating a unit condition displayed in the display area based on a user operation on the displayed display area. Here, the display area is an area in which the unit condition is displayed on a screen on which the relevant literature display unit displays information on the relevant literature. An example of the display area is a sort instruction unit 521 according to an embodiment of the present invention.

また、請求項に記載の発明は、請求項またはに記載の情報検索装置において、前記適合情報表示情報生成部は、前記マトリクスにおいて、前記指定された単位条件を他の単位条件とは異なる態様で表示するように前記適合情報表示情報を生成することを特徴とする。 The invention according to claim 5 is the information search device according to claim 3 or 4 , wherein the conformity information display information generation unit uses the specified unit condition as another unit condition in the matrix. The matching information display information is generated so as to be displayed in a different manner.

また、請求項に記載の発明は、請求項1乃至いずれか1項に記載の情報検索装置において、複数の単位条件を単位条件群として指定する単位条件群指定情報を取得する単位条件群指定情報取得部を有し、前記適合情報表示情報生成部は、前記抽出された複数の適合情報及び前記構成された単位条件群のうち一方を行とし、他方を列とするマトリクスを構成し、前記マトリクスにおける各セルに、当該セルが対応する前記適合情報における当該セルが対応する前記単位条件群の充足度に関する情報を表示するように前記適合情報表示情報を生成することを特徴とする。 The invention according to claim 6 is the unit condition group for acquiring unit condition group designation information for designating a plurality of unit conditions as a unit condition group in the information search device according to any one of claims 1 to 5. A designated information acquisition unit, wherein the conformity information display information generation unit constitutes a matrix in which one of the extracted plurality of conformance information and the configured unit condition group is a row and the other is a column; The conformity information display information is generated so that each cell in the matrix displays information on the degree of satisfaction of the unit condition group corresponding to the cell in the conformance information corresponding to the cell.

ここで、上記単位条件群とは複数の単位条件のまとまりである。上記単位条件群の一例としては、本発明の実施形態に係る図19に示すようにグループ化された複数の検索語である。また、上記単位条件群の充足度とは、夫々の適合情報が夫々の単位条件群に含まれる単位条件をどの程度満たしているかを示す度合いである。上記単位条件群の充足度の一例としては、本発明の実施形態に係る図19に示す抽出結果表示画面500の夫々のセルに表示されるヒット数である。   Here, the unit condition group is a group of a plurality of unit conditions. An example of the unit condition group is a plurality of search terms grouped as shown in FIG. 19 according to the embodiment of the present invention. The degree of satisfaction of the unit condition group is a degree indicating how much each piece of matching information satisfies the unit condition included in each unit condition group. An example of the degree of satisfaction of the unit condition group is the number of hits displayed in each cell of the extraction result display screen 500 shown in FIG. 19 according to the embodiment of the present invention.

また、請求項に記載の発明は、請求項に記載の情報検索装置において、前記情報抽出部は、前記指定条件情報に含まれる文言の類義語に関する類義語情報を取得して前記文言及び前記類義語の夫々を前記単位条件として前記適合情報を抽出し、前記単位条件群指定情報は、前記文言及び当該文言の類義語を前記単位条件群として指定する情報を含むことを特徴とする。 The invention described in Claim 7, in the information retrieval apparatus according to claim 6, wherein the information extraction unit, the wording and the synonyms acquired synonyms information regarding synonyms of words included in the designated condition information And the unit condition group designation information includes information for designating the word and a synonym of the word as the unit condition group.

また、請求項に記載の発明は、請求項1乃至いずれか1項に記載の情報検索装置において、前記適合情報表示情報生成部は、前記適合情報を列とし、前記単位条件を行としてマトリクスを構成し、前記適合情報表示情報を生成することを特徴とする。 Further, the invention according to claim 8 is the information search device according to any one of claims 1 to 7 , wherein the conformity information display information generation unit uses the conformity information as a column and the unit condition as a row. A matrix is formed, and the matching information display information is generated.

また、請求項9に記載の発明は、請求項1乃至8いずれか1項に記載の情報検索装置において、ユーザによる操作情報を取得する操作情報取得部を有し、前記適合情報表示情報生成部は、前記適合情報及び前記単位条件のうち前記マトリクスにおいて列とするものを前記取得した操作情報に応じて決定することを特徴とする。 The invention according to claim 9 is the information search device according to any one of claims 1 to 8, further comprising an operation information acquisition unit that acquires operation information by a user, and the conformity information display information generation unit. Is determined according to the acquired operation information, which is a column in the matrix among the matching information and the unit condition.

また、請求項10に記載の発明は、情報検索装置における情報検索方法であって、前記情報検索装置が、指定条件情報取得部と、情報抽出部と、適合情報表示情報生成部とを有し、前記指定条件情報取得部が、指定された条件に関する情報であって複数の異なる単位条件を含む指定条件情報を取得し、前記情報抽出部が、前記指定条件情報に基づいて複数の適合情報を抽出し、適合情報表示情報生成部が、前記複数の適合情報に関する情報を表示させるための適合情報表示情報を生成するものであって、前記複数の適合情報及び前記複数の異なる単位条件のうち一方を行とし、他方を列とするマトリクスを構成し、前記適合情報で、前記指定条件情報に含まれる複数の異なる単位条件が用いられる回数を示す充足度に関する情報を前記マトリクスのセルに表示させるように前記適合情報表示情報を生成し、前記充足度が大きい前記単位条件を、前記抽出された複数の適合情報を構成する行又は列の近傍に表示させることを特徴とする。 The invention according to claim 10 is an information search method in an information search device, wherein the information search device has a specified condition information acquisition unit, an information extraction unit, and a conforming information display information generation unit. The specified condition information acquisition unit acquires specified condition information that is information related to the specified condition and includes a plurality of different unit conditions, and the information extraction unit obtains a plurality of pieces of matching information based on the specified condition information. Extracting the conforming information display information generating unit to generate conforming information display information for displaying information related to the plurality of conforming information , one of the plurality of conforming information and the plurality of different unit conditions. was a row, constitutes a matrix of the other as columns, with the adaptation information, the Matrigel information regarding sufficiency of indicating the number of times different units condition included in the designation condition information is used Wherein generating the adaptation information display information to be displayed on the scan of the cell, and characterized in that for displaying the satisfaction degree is larger the unit conditions, in the vicinity of the row or column constitutes a plurality of adaptation the extracted information To do.

また、請求項11に記載の発明は、制御プログラムであって、請求項10に記載の情報検索方法を情報処理装置に実行させることを特徴とする。 The invention described in claim 11 is a control program, characterized by causing an information processing apparatus to execute the information search method described in claim 10 .

本発明によれば、情報の検索における検索結果の表示において、検索条件と検索対象情報との適合度を算出する前の、検索条件と検索対象情報との適合状況について、よりユーザに理解し易いように表示することが可能となる。   According to the present invention, in displaying a search result in an information search, it is easier for the user to understand the compatibility between the search condition and the search target information before calculating the degree of match between the search condition and the search target information. Can be displayed.

以下、図面を参照して、本発明の実施形態を詳細に説明する。
実施の形態1.
本実施形態においては、特許文献を検索する文献検索装置を含む情報検索システムを例として説明する。
図1は、本実施の形態に係る情報検索システムの運用形態の例を示す図である。図1に示すように、本実施形態に係る情報検索システムは、情報検索装置1、クライアント装置2及び文献情報DB200を含む。クライアント装置2は、PC(Personal Computer)等の一般的な情報処理装置によって構成される。情報検索装置1は、ネットワークを介してクライアント装置2と接続されており、クライアント装置2からの検索要求を受けて文献情報DB200に格納されている文献情報を検索する。文献情報DB200は、検索対象の情報として特許文献の情報を記憶している。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
Embodiment 1.
In the present embodiment, an information search system including a document search device that searches patent documents will be described as an example.
FIG. 1 is a diagram illustrating an example of an operation mode of the information search system according to the present embodiment. As shown in FIG. 1, the information search system according to the present embodiment includes an information search device 1, a client device 2, and a document information DB 200. The client device 2 is configured by a general information processing device such as a PC (Personal Computer). The information search device 1 is connected to the client device 2 via a network, and receives the search request from the client device 2 and searches for the document information stored in the document information DB 200. The document information DB 200 stores patent document information as information to be searched.

次に、本実施形態に係る情報検索装置1のハードウェア構成について説明する。図2は、本実施形態に係る情報検索装置1のハードウェア構成を示すブロック図である。図2に示すように、本実施形態に係る情報検索装置1は、一般的なサーバやPC(Personal Computer)等の情報処理端末と同様の構成を有する。即ち、本実施形態に係る情報検索装置1は、CPU(Central Processing Unit)10、RAM(Random Access Memory)20、ROM(Read Only Memory)30、HDD(Hard Disk Drive)40及びI/F50がバス80を介して接続されている。また、I/F50にはLCD(Liquid
Crystal Display)60及び操作部70が接続されている。
Next, a hardware configuration of the information search apparatus 1 according to the present embodiment will be described. FIG. 2 is a block diagram illustrating a hardware configuration of the information search apparatus 1 according to the present embodiment. As shown in FIG. 2, the information search apparatus 1 according to the present embodiment has the same configuration as an information processing terminal such as a general server or a PC (Personal Computer). That is, the information search apparatus 1 according to the present embodiment includes a CPU (Central Processing Unit) 10, a RAM (Random Access Memory) 20, a ROM (Read Only Memory) 30, an HDD (Hard Disk Drive) 40, and an I / F 50. 80 is connected. The I / F 50 has an LCD (Liquid
A crystal display 60 and an operation unit 70 are connected.

CPU10は演算手段であり、情報検索装置1全体の動作を制御する。RAM20は、情報の高速な読み書きが可能な揮発性の記憶媒体であり、CPU10が情報を処理する際の作業領域として用いられる。ROM30は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムが格納されている。HDD40は、情報の読み書きが可能な不揮発性の記憶媒体であり、OS(Operating System)や各種の制御プログラム、アプリケーション・プログラム等が格納される。I/F50は、バス80と各種のハードウェアやネットワーク等を接続し制御する。LCD60は、ユーザが情報検索装置1の状態を確認するための視覚的ユーザインタフェースである。操作部70は、キーボードやマウス等、ユーザが情報検索装置1に情報を入力するためのユーザインタフェースである。尚、図1において説明したように、本実施形態に係る情報検索装置1は、サーバとして運用される。従って、LCD600及び操作部70等のユーザインタフェースは省略可能である。   The CPU 10 is a calculation means and controls the operation of the entire information retrieval apparatus 1. The RAM 20 is a volatile storage medium capable of reading and writing information at high speed, and is used as a work area when the CPU 10 processes information. The ROM 30 is a read-only nonvolatile storage medium and stores a program such as firmware. The HDD 40 is a non-volatile storage medium that can read and write information, and stores an OS (Operating System), various control programs, application programs, and the like. The I / F 50 connects and controls the bus 80 and various hardware and networks. The LCD 60 is a visual user interface for the user to check the state of the information search device 1. The operation unit 70 is a user interface such as a keyboard and a mouse for the user to input information to the information search apparatus 1. As described with reference to FIG. 1, the information search apparatus 1 according to the present embodiment is operated as a server. Therefore, user interfaces such as the LCD 600 and the operation unit 70 can be omitted.

このようなハードウェア構成において、ROM30やHDD40若しくは図示しない光学ディスク等の記憶媒体に格納されたプログラムがRAM20に読み出され、CPU10の制御に従って動作することにより、ソフトウェア制御部が構成される。このようにして構成されたソフトウェア制御部と、ハードウェアとの組み合わせによって、本実施形態に係る情報検索装置1の機能を実現する機能ブロックが構成される。   In such a hardware configuration, a program stored in a storage medium such as the ROM 30, the HDD 40, or an optical disk (not shown) is read into the RAM 20, and operates according to the control of the CPU 10, thereby configuring a software control unit. A functional block that realizes the function of the information search apparatus 1 according to the present embodiment is configured by a combination of the software control unit configured as described above and hardware.

次に、本実施形態に係る情報検索装置1の機能ブロックについて、図3を参照して説明する。図3は、本実施形態に係る情報検索装置1の機能ブロック及び情報検索装置1が検索する対象の文献情報を格納している文献情報DB200を示すブロック図である。図3に示すように、本実施形態に係る情報検索装置1は、検索制御部100、情報入力部110、ネットワークI/F120、表示部130及び辞書情報DB140を有する。   Next, functional blocks of the information search apparatus 1 according to the present embodiment will be described with reference to FIG. FIG. 3 is a block diagram showing a document information DB 200 that stores functional blocks of the information search device 1 according to the present embodiment and document information to be searched by the information search device 1. As illustrated in FIG. 3, the information search apparatus 1 according to the present embodiment includes a search control unit 100, an information input unit 110, a network I / F 120, a display unit 130, and a dictionary information DB 140.

情報入力部110は、ユーザが情報検索装置1を操作して検索制御部100に情報を入力するための構成であり、図2に示すI/F50及び操作部70によって実現される。ネットワークI/F120は、情報検索装置1がネットワークを介して情報を取得し、若しくはネットワークを介して情報を送信するためのインタフェースであり、図2に示すI/F50によって実現される。具体的には、例えばEthernet(登録商標)接続のインタフェースや、USB(Universal Serial Bus)接続のインタフェースによって実現される。   The information input unit 110 is configured to allow a user to operate the information search apparatus 1 and input information to the search control unit 100, and is realized by the I / F 50 and the operation unit 70 illustrated in FIG. The network I / F 120 is an interface for the information search apparatus 1 to acquire information via the network or transmit information via the network, and is realized by the I / F 50 illustrated in FIG. Specifically, it is realized by, for example, an Ethernet (registered trademark) connection interface or a USB (Universal Serial Bus) connection interface.

表示部130は、情報検索装置1の動作状態や、検索結果等が表示される構成であり、図2に示すI/F50及びLCD60によって実現される。辞書情報DB140は、類義語検索が可能な単語のデータベースであり、図2に示すHDD40及びRAM20において動作するプログラムによって実現される。検索制御部100は、本実施形態に係る情報検索装置1の検索機能を担う構成であり、指定条件情報取得部101、指定条件情報解析部102、文献情報抽出部103及び抽出結果処理部104を有する。   The display unit 130 is configured to display the operation state of the information search apparatus 1, search results, and the like, and is realized by the I / F 50 and the LCD 60 shown in FIG. The dictionary information DB 140 is a database of words that can be searched for synonyms, and is realized by a program that operates in the HDD 40 and the RAM 20 shown in FIG. The search control unit 100 is configured to perform the search function of the information search apparatus 1 according to the present embodiment, and includes a designated condition information acquisition unit 101, a designated condition information analysis unit 102, a document information extraction unit 103, and an extraction result processing unit 104. Have.

指定条件情報取得部101は、ユーザによって情報入力部110を介して入力された情報若しくはネットワークI/F120を介してネットワーク経由で入力された情報を指定条件情報として取得する。指定条件情報取得部101は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。指定条件情報とは、所望の文献を抽出するための条件として、ユーザによって指定される条件である。指定条件情報解析部102は、指定条件情報取得部101が取得した指定条件情報を解析し、文献情報DB200から文献を抽出する際の条件となる抽出条件の情報(以降、抽出条件情報とする)を生成する。   The specified condition information acquisition unit 101 acquires information input by the user via the information input unit 110 or information input via the network via the network I / F 120 as the specified condition information. The specified condition information acquisition unit 101 is configured by a program loaded in the RAM 20 shown in FIG. The designation condition information is a condition designated by the user as a condition for extracting a desired document. The specified condition information analysis unit 102 analyzes the specified condition information acquired by the specified condition information acquisition unit 101, and information on extraction conditions that serve as conditions for extracting documents from the document information DB 200 (hereinafter referred to as extraction condition information). Is generated.

また、指定条件情報解析部102は、生成した抽出条件情報を表示するための抽出条件表示情報を生成し、出力する。即ち、指定条件情報解析部102が、抽出条件表示情報生成部として機能する。抽出条件表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。指定条件情報解析部102の機能が本実施形態の要旨の1つとなる。指定条件情報解析部102が実行する処理については、後に詳述する。   The specified condition information analysis unit 102 generates and outputs extraction condition display information for displaying the generated extraction condition information. That is, the specified condition information analysis unit 102 functions as an extraction condition display information generation unit. The extraction condition display information generation unit is configured by a program loaded in the RAM 20 shown in FIG. The function of the specified condition information analysis unit 102 is one of the gist of the present embodiment. The processing executed by the specified condition information analysis unit 102 will be described in detail later.

文献情報抽出部103は、指定条件情報解析部102によって生成された抽出条件情報に基づき、文献情報DB200に格納されている文献を抽出する。即ち、文献情報抽出部103は、抽出条件情報によって定められている条件に適合する情報を辞書情報DB200から抽出する情報抽出部として機能する。情報抽出部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。また、文献情報抽出部103は、文献情報DB200から抽出した文献を示す情報の一覧(以降、文献表示一覧情報とする)を生成する。   The document information extraction unit 103 extracts documents stored in the document information DB 200 based on the extraction condition information generated by the specified condition information analysis unit 102. That is, the document information extraction unit 103 functions as an information extraction unit that extracts information that meets the conditions defined by the extraction condition information from the dictionary information DB 200. The information extraction unit is configured by a program loaded in the RAM 20 shown in FIG. Further, the document information extraction unit 103 generates a list of information indicating documents extracted from the document information DB 200 (hereinafter referred to as document display list information).

抽出結果処理部104は、文献情報抽出部103によって生成された文献表示一覧情報に基づき、適合文献の抽出結果を表示部130若しくはクライアント装置2の表示部に表示するための適合情報表示情報を生成して、出力する。即ち、抽出結果処理部104は、抽出条件情報によって定められている条件に適合する情報として抽出された適合情報を表示部130若しくはクライアント装置2の表示部に表示するための適合情報表示情報を生成する適合情報表示情報生成部として機能する。適合情報表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。   Based on the document display list information generated by the document information extraction unit 103, the extraction result processing unit 104 generates matching information display information for displaying the extraction result of the matching document on the display unit 130 or the display unit of the client device 2. And output. In other words, the extraction result processing unit 104 generates conforming information display information for displaying the conforming information extracted as information conforming to the conditions determined by the extracting condition information on the display unit 130 or the display unit of the client device 2. It functions as a conforming information display information generating unit. The matching information display information generating unit is configured by a program loaded in the RAM 20 shown in FIG.

このような情報検索装置1において、本実施形態は、指定条件情報解析部102による、抽出条件情報を表示するための抽出条件表示情報の生成及び抽出条件情報の表示に特徴を有する。以下、本実施形態に係る情報検索装置1の動作について図を参照して説明する。図4は、本実施形態に係る情報検索システムにおける情報検索動作を示すシーケンス図である。図4に示すように、文献情報DB200に登録されている文献情報を検索する際、先ず、ユーザはクライアント装置2を操作して検索条件を指定するための検索条件指定画面を表示するための情報を情報検索装置1から取得し、検索条件指定画面を表示する(S401)。以下、本実施形態の説明においては、ユーザがクライアント装置2を操作して情報検索装置1の機能を利用する場合を例として説明する。   In such an information search apparatus 1, the present embodiment is characterized in that the specified condition information analysis unit 102 generates extraction condition display information for displaying the extraction condition information and displays the extraction condition information. Hereinafter, the operation of the information search apparatus 1 according to the present embodiment will be described with reference to the drawings. FIG. 4 is a sequence diagram showing an information search operation in the information search system according to this embodiment. As shown in FIG. 4, when searching for document information registered in the document information DB 200, first, the user operates the client device 2 to display a search condition designation screen for designating a search condition. Is acquired from the information search apparatus 1 and a search condition designation screen is displayed (S401). Hereinafter, in the description of the present embodiment, a case where the user operates the client device 2 to use the function of the information search device 1 will be described as an example.

S401においてクライアント装置2の表示部に表示される検索条件指定画面を、図5(a)に示す。図5(a)は、文献情報DB200に格納されている文献を検索する際に表示される画面であって検索条件を指定する検索条件指定画面300を示す図である。図5(a)に示すように検索条件指定画面300は、検索対象指定部301、検索条件指定部302及び検索条件入力部303を有する。検索対象指定部301は、“国内特許”、“海外特許”、“実用新案”等のように、検索する対象として文献の種類を選択する。検索条件指定部302は、“文章”、“キーワード”、“書誌項目”等のように、文献を検索する条件の種類を選択する。検索条件入力部303は、検索条件指定部302において選択した検索条件の種類に応じた検索条件を入力する。   FIG. 5A shows a search condition designation screen displayed on the display unit of the client apparatus 2 in S401. FIG. 5A shows a search condition designation screen 300 that is displayed when a document stored in the document information DB 200 is searched and that specifies a search condition. As shown in FIG. 5A, the search condition designation screen 300 includes a search target designation unit 301, a search condition designation unit 302, and a search condition input unit 303. The search target designation unit 301 selects the type of document as a search target such as “domestic patent”, “overseas patent”, “utility model”, and the like. The search condition designating unit 302 selects the type of condition for searching for a document such as “text”, “keyword”, “bibliographic item”, and the like. The search condition input unit 303 inputs a search condition corresponding to the type of search condition selected by the search condition specifying unit 302.

図5(a)の例においては、検索条件として“文章”を指定する場合を示している。“文章”を検索条件とした場合、検索条件入力部303には抽出すべき文献(本実施形態においては特許公報)を特定するための文章を入力する。本実施形態においては、特許文献に開示されている技術を特定する文章として、“A**B****C*、A**D**、B*E***、C*F*。”という文章が入力される場合を例として説明する。ユーザは、クライアント装置2の操作部を操作することにより、図5(a)に示すような文章を入力し、情報検索装置1に対して指定条件情報として送信する(S402)。   In the example of FIG. 5A, a case where “text” is designated as a search condition is shown. When “text” is used as a search condition, a text for specifying a document to be extracted (patent gazette in this embodiment) is input to the search condition input unit 303. In the present embodiment, “A *** B *** C *, A ** D ***, B * E ***, C * F *” is used as a sentence specifying the technology disclosed in the patent document. A case where a sentence “.” Is input will be described as an example. The user operates the operation unit of the client device 2 to input a sentence as shown in FIG. 5A and transmit it as specified condition information to the information search device 1 (S402).

情報検索装置1に送信された指定条件情報は、ネットワークI/F120から情報検索装置1に入力され、検索制御部100の指定条件情報取得部101が取得する(S403)。指定条件情報解析部102は、指定条件情報取得部101から指定条件情報としての文章を取得すると、入力された文章を解析する(S404)。S404の処理において、指定条件情報解析部102は、文章として入力された指定条件情報から検索対象を特定する特徴となる文言である単語(以降、抽出単語とする)を抽出する。図7(a)は、本実施形態において入力された指定条件情報の文章から抽出された抽出単語を示す図である。図7(a)に示すように、本実施形態においては、図5(a)に示す検索条件入力部303に入力された文章から、“A”、“B”、“C”、“D”、“E”及び“F”という文言が抽出単語として抽出される。これらの抽出単語は、指定条件情報において定められる条件を構成する最小単位の条件、即ち、単位条件として用いられる。   The specified condition information transmitted to the information search device 1 is input from the network I / F 120 to the information search device 1 and acquired by the specified condition information acquisition unit 101 of the search control unit 100 (S403). When the specified condition information analysis unit 102 acquires the text as the specified condition information from the specified condition information acquisition unit 101, the specified condition information analysis unit 102 analyzes the input text (S404). In the process of S404, the specified condition information analysis unit 102 extracts words (hereinafter referred to as “extracted words”) that are words serving as characteristics for specifying the search target from the specified condition information input as sentences. FIG. 7A is a diagram illustrating extracted words extracted from the sentence of the designation condition information input in the present embodiment. As shown in FIG. 7A, in the present embodiment, “A”, “B”, “C”, “D” are extracted from the text input to the search condition input unit 303 shown in FIG. , “E” and “F” are extracted as extracted words. These extracted words are used as a minimum unit condition constituting a condition defined in the designated condition information, that is, a unit condition.

指定条件情報解析部102は、図7(a)に示すように抽出単語を抽出すると、辞書情報DB140を検索して夫々の抽出単語の類義語(以降、抽出類義語とする)を抽出する(S405)。即ち、指定条件情報解析部102が類義語情報取得部として機能する。類義語情報取得部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。図7(b)は、図7(a)に示す夫々の抽出単語に対して抽出した抽出類義語を示す図である。図7(b)の例においては、“A”の類義語として“A1”、“A2”を、“B”の類義語として“B1”、“B2”、“B3”を、“C”の類義語として“C1”を、“D”の類義語として“D1”、“D2”を、“E”の類義語として“E1”を、“F”の類義語として“F1”、“F2”を、夫々抽出した例を示している。   When the extraction condition is extracted as shown in FIG. 7A, the designated condition information analysis unit 102 searches the dictionary information DB 140 and extracts synonyms (hereinafter referred to as extraction synonyms) of each extraction word (S405). . That is, the specified condition information analysis unit 102 functions as a synonym information acquisition unit. The synonym information acquisition unit is configured by a program loaded in the RAM 20 shown in FIG. FIG.7 (b) is a figure which shows the extraction synonym extracted with respect to each extraction word shown to Fig.7 (a). In the example of FIG. 7B, “A1” and “A2” are synonymous with “A”, “B1”, “B2” and “B3” are synonymous with “C” as synonyms of “C”. Example of extracting “C1”, “D1” and “D2” as synonyms for “D”, “E1” as synonyms for “E”, and “F1” and “F2” as synonyms for “F”. Is shown.

図7(a)、(b)に示すように、抽出単語及び抽出類義語を特定すると、指定条件情報解析部102は、それらの情報に基づき、文献情報DB200から文献情報を抽出する条件となる抽出条件情報を生成する(S406)。本実施形態においては、抽出単語及び抽出類義語を抽出条件情報とする。指定条件情報解析部102は、抽出条件情報を生成すると、その抽出条件情報をクライアント装置2の表示部に表示するための抽出条件表示情報を生成し、出力する(S407)。即ち、指定条件情報解析部102が、抽出条件表示情報生成部として機能する。   As shown in FIGS. 7A and 7B, when the extracted word and the extracted synonym are specified, the specified condition information analysis unit 102 is an extraction that becomes a condition for extracting the document information from the document information DB 200 based on the information. Condition information is generated (S406). In the present embodiment, extracted words and extracted synonyms are used as extraction condition information. When the extraction condition information is generated, the specified condition information analysis unit 102 generates and outputs extraction condition display information for displaying the extraction condition information on the display unit of the client device 2 (S407). That is, the specified condition information analysis unit 102 functions as an extraction condition display information generation unit.

指定条件情報解析部102は、S407において、ネットワークI/F120を介してクライアント装置2に対して抽出条件表示情報を送信する。クライアント装置2は、情報検索装置1から抽出条件表示情報を受信すると、表示部に抽出条件情報を表示する(S408)。S408におけるクライアント装置2の表示部の表示を図8(a)、(b)に示す。図8(a)は、S408において表示される抽出条件情報表示画面400を示す図である。図8(a)に示すように、本実施形態に係る抽出条件情報表示画面400は、検索語表示部401、辞書展開指示部402及び検索実行指示部403を有する。   In S407, the specified condition information analysis unit 102 transmits the extraction condition display information to the client apparatus 2 via the network I / F 120. Upon receiving the extraction condition display information from the information search apparatus 1, the client device 2 displays the extraction condition information on the display unit (S408). 8A and 8B show the display on the display unit of the client apparatus 2 in S408. FIG. 8A shows the extraction condition information display screen 400 displayed in S408. As shown in FIG. 8A, the extraction condition information display screen 400 according to this embodiment includes a search word display unit 401, a dictionary expansion instruction unit 402, and a search execution instruction unit 403.

検索語表示部401は、図8(a)に示すように、S405において抽出された抽出単語を表示している。ここで、ユーザが情報入力部110を操作し、マウス等のポインティングデバイスにより辞書展開指示部402をクリックすると、抽出条件情報表示画面400の表示が図8(b)に示すように切り換わる。即ち、指定条件情報解析部102は、ユーザによって入力された操作情報に基づき、類義語表示の有無を切り換え可能なように抽出条件表示情報を生成する。   The search word display unit 401 displays the extracted words extracted in S405 as shown in FIG. Here, when the user operates the information input unit 110 and clicks the dictionary expansion instruction unit 402 with a pointing device such as a mouse, the display of the extraction condition information display screen 400 is switched as shown in FIG. That is, the specified condition information analysis unit 102 generates extraction condition display information so that the presence / absence of synonym display can be switched based on operation information input by the user.

図8(b)に示す抽出条件情報表示画面400においては、S405において抽出された抽出類義語が、夫々類義語として抽出される元となった抽出単語と関連付けられて表示されている。これにより、ユーザは抽出条件として抽出制御部100により自動的に追加される抽出類義語が、夫々どの単語の類義語として抽出されたのかを容易に認識することが可能となる。尚、以降の説明においては、抽出単語及び抽出類義語を総じて検索語とする。   In the extraction condition information display screen 400 shown in FIG. 8B, the extracted synonyms extracted in S405 are displayed in association with the extracted words that are extracted as synonyms. Thereby, the user can easily recognize the synonym of which word the extracted synonym automatically added by the extraction control unit 100 as the extraction condition is extracted. In the following description, the extracted word and the extracted synonym are collectively referred to as a search word.

尚、図8(a)、(b)に示す抽出条件情報表示画面400においては、検索語表示部401において“選択”と表示されている列の検索語指定部401aを切り換え、“○”若しくは“×”を選択することにより、夫々の抽出単語若しくは抽出類義語を検索語として用いるか否かを選択することが可能である。ユーザが、図8(a)、(b)に示す検索語表示部401の選択項目を切り換えて検索語として用いるか否かを設定し、検索実行指示部403をクリックすることにより、検索実行命令がクライアント装置2から情報検索装置1に送信される(S409)。   Note that, in the extraction condition information display screen 400 shown in FIGS. 8A and 8B, the search term designation unit 401a of the column displayed as “selected” in the search term display unit 401 is switched, and “O” or “ By selecting “x”, it is possible to select whether or not to use each extracted word or extracted synonym as a search word. When the user switches the selection item of the search word display unit 401 shown in FIGS. 8A and 8B and sets whether or not to use it as a search word, and clicks the search execution instruction unit 403, the search execution command Is transmitted from the client apparatus 2 to the information search apparatus 1 (S409).

S409において送信される検索実行命令は、ネットワークI/F120を介して情報検索装置1の検索制御部100に入力される。S409において送信される検索実行命令には、図8(a)、(b)において説明した夫々の抽出単語若しくは抽出類義語を検索語として用いるか否かの情報、即ち、検索語指定情報が含まれる。即ち、検索制御部100が、検索語指定情報取得部として機能する。検索制御部100が取得した検索実行命令は、文献情報抽出部103に入力される。   The search execution command transmitted in S409 is input to the search control unit 100 of the information search apparatus 1 via the network I / F 120. The search execution command transmitted in S409 includes information as to whether or not each extracted word or extracted synonym described in FIGS. 8A and 8B is used as a search word, that is, search word designation information. . That is, the search control unit 100 functions as a search word designation information acquisition unit. The search execution command acquired by the search control unit 100 is input to the document information extraction unit 103.

文献情報抽出部103は、抽出条件情報解析部102から入力された抽出条件情報及びクライアント装置2から取得した検索語指定情報に基づき、文献情報DB200からの文献情報の抽出を実行する(S410)。即ち、文献情報抽出部103が情報抽出部として機能する。情報抽出部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。   The document information extraction unit 103 extracts document information from the document information DB 200 based on the extraction condition information input from the extraction condition information analysis unit 102 and the search term designation information acquired from the client device 2 (S410). That is, the document information extraction unit 103 functions as an information extraction unit. The information extraction unit is configured by a program loaded in the RAM 20 shown in FIG.

S410において、文献情報抽出部103は、文献情報DB200に格納されている夫々の文献において夫々の抽出単語及び抽出類義語が用いられている回数を求め、その回数を所定の計算に基づいて抽出条件に対する適合値として算出する。図9は、S410における文献情報の抽出過程において生成される情報を視覚的に示す図である。図9に示す図においては、ID、ヒット数、検索語及び文献番号の情報を含むテーブルが示されている。   In S410, the document information extraction unit 103 obtains the number of times each extracted word and extracted synonym is used in each document stored in the document information DB 200, and calculates the number of times for the extraction condition based on a predetermined calculation. Calculate as a conforming value. FIG. 9 is a diagram visually showing information generated in the document information extraction process in S410. In the diagram shown in FIG. 9, a table including information on ID, hit count, search word, and document number is shown.

ここで、図9において、例えばID“001”の情報は、文献番号が“****−*****a”である文献における検索語“A”のヒット数が“328”であることを示している。そして、ID“001”、“002”、“003”の情報は、夫々文献番号“****−*****a”、“****−*****b”、“****−*****c”における検索語Aのヒット数を示す情報となっている。また、ID“011”、“012”、“013”の情報は、夫々文献番号“****−*****a”、“****−*****c”、“****−*****f”における検索語A1のヒット数を示す情報となっている。   Here, in FIG. 9, for example, the information of ID “001” has the hit number “328” of the search word “A” in the document whose document number is “***-****”. It is shown that. The information of the IDs “001”, “002”, and “003” includes document numbers “***-****-a”, “***-**** b”, “ This is information indicating the number of hits for the search word A in “***-******* c”. In addition, information of IDs “011”, “012”, and “013” includes document numbers “***-****-a”, “****-*** c”, “ This is information indicating the number of hits of the search word A1 in “***-****-f”.

このように、文献情報抽出部103は、S406において文献情報DB200に格納されているすべての文献について、夫々の検索語が用いられている回数を求め図9に示すようなテーブルを生成する。次に、文献情報抽出部103は、図9に示す情報を所定の処理に従って集計する。この処理について図10を参照して説明する。図10は、図9に示す情報を集計する動作を示すフローチャートである。図9に示す情報を生成すると、文献情報抽出部103は、一の文献について検索結果を参照する(S1001)。例えば図9に示す例においては、文献番号“****−*****a”についての検索結果としてID“001”、“011”、“021”及び“101”の情報を参照する。   As described above, the document information extraction unit 103 obtains the number of times each search word is used for all the documents stored in the document information DB 200 in S406 and generates a table as shown in FIG. Next, the document information extraction unit 103 totals the information shown in FIG. 9 according to a predetermined process. This process will be described with reference to FIG. FIG. 10 is a flowchart showing the operation of collecting the information shown in FIG. When the information shown in FIG. 9 is generated, the document information extraction unit 103 refers to the search result for one document (S1001). For example, in the example shown in FIG. 9, the information of IDs “001”, “011”, “021”, and “101” is referred to as a search result for the document number “***-****”. .

次に、文献情報抽出部103は、公報番号、即ち“****−*****a”を表示するための情報を生成する(S1002)。次に、文献情報抽出部103は、夫々の検索語毎のヒット数を表示するための情報を、公報番号と関連付けて表示するように生成する(S1003)。この場合、公報番号“****−*****a”を参照しているので、検索語“A”、“A1”、“B”、“C1”に関連付けて表示する情報として、夫々“328”、“155”、“78”、“14”を表示するための情報を生成する。S1001〜S1003の処理を、すべての公報について繰り返し(S1004/NO)、すべての公報についてS1001〜S1003の処理が完了したら(S1004/YES)、処理を終了する。   Next, the document information extraction unit 103 generates information for displaying the publication number, that is, “***-****-a” (S1002). Next, the document information extraction unit 103 generates information for displaying the number of hits for each search word so as to be displayed in association with the publication number (S1003). In this case, since the publication number “***-****” is referred to, as information to be displayed in association with the search terms “A”, “A1”, “B”, “C1”, Information for displaying “328”, “155”, “78”, and “14”, respectively, is generated. The processing of S1001 to S1003 is repeated for all publications (S1004 / NO), and when the processing of S1001 to S1003 is completed for all publications (S1004 / YES), the processing is terminated.

図10の処理によって生成される情報を図11に示す。図11に示すように、図10の処理の結果、文献情報抽出部103は、文献情報DB200に格納されている夫々の文献情報と抽出条件情報として指定されている検索語とをマトリクス状に配置して表示するための情報が生成される。そして、夫々の文献において夫々の検索語が用いられている回数を夫々のセルに表示するような情報が生成される。文献情報抽出部103は、図11に示す表を所定の計算式に適用し、夫々の文献について適合値を求める。そして、文献情報抽出部103は、S410の処理において、上記適合値が所定の閾値以上となる文献を適合文献として抽出する。   FIG. 11 shows information generated by the processing of FIG. As shown in FIG. 11, as a result of the processing in FIG. 10, the document information extraction unit 103 arranges each document information stored in the document information DB 200 and search terms specified as extraction condition information in a matrix. Information for display is generated. Then, information that displays the number of times each search word is used in each document in each cell is generated. The document information extraction unit 103 applies the table shown in FIG. 11 to a predetermined calculation formula, and obtains a fitness value for each document. Then, the document information extraction unit 103 extracts a document whose relevant value is equal to or greater than a predetermined threshold as a relevant document in the process of S410.

文献情報抽出部103は、適合文献を抽出すると、その適合文献について文献表示一覧情報を生成し、抽出結果処理部104に入力する。ここで、文献表示一覧情報とは、適合文献として抽出された文献に係る図11に示す情報、即ち、夫々の適合文献において、夫々の検索語が用いられている回数を示す情報である。また、図11に示す情報に加えて、夫々の適合文献の適応度に関する情報が含まれる。換言すると、文献表示一覧情報とは、図11において説明した情報から、適合値が所定の閾値に満たない文献を抜いた情報である。即ち、文献表示一覧情報は、抽出結果情報として用いられる。   When the document information extraction unit 103 extracts the relevant document, the document information extraction unit 103 generates document display list information for the relevant document and inputs the document display list information to the extraction result processing unit 104. Here, the document display list information is the information shown in FIG. 11 relating to the documents extracted as relevant documents, that is, information indicating the number of times each search word is used in each relevant document. In addition to the information shown in FIG. 11, information on the fitness of each relevant document is included. In other words, the document display list information is information obtained by extracting documents whose fitness values are less than the predetermined threshold from the information described in FIG. That is, the document display list information is used as extraction result information.

文献情報抽出部103から抽出結果として文献表示一覧情報を受信した抽出結果処理部104は、抽出結果を表示するための抽出結果表示情報を生成し、クライアント装置2に対して送信する(S411)。抽出結果表示情報を受信したクライアント装置2は、表示部に抽出結果を表示し(S412)、処理を終了する。S412においてクライアント装置2の表示部に表示される画面について、図12を参照して説明する。図8は、標準的な抽出結果の表示態様として、文献情報の抽出結果の適応度による一覧を示す図である。図12に示すように、抽出結果表示画面500は、表示態様選択部501及び抽出結果表示部502を有する。   Upon receiving the document display list information as the extraction result from the document information extraction unit 103, the extraction result processing unit 104 generates extraction result display information for displaying the extraction result, and transmits it to the client device 2 (S411). The client device 2 that has received the extraction result display information displays the extraction result on the display unit (S412), and ends the process. The screen displayed on the display unit of the client apparatus 2 in S412 will be described with reference to FIG. FIG. 8 is a diagram showing a list of document information extraction results according to fitness as a standard extraction result display mode. As illustrated in FIG. 12, the extraction result display screen 500 includes a display mode selection unit 501 and an extraction result display unit 502.

表示態様選択部501は、抽出結果表示画面500の表示態様を選択する選択部であり、表示態様選択部501の選択状態に応じて抽出結果表示部502に表示される内容が変化する。ユーザは、情報検索装置1の情報入力部110を操作し、表示態様選択部501の選択状態を切り換えることができる。表示態様選択部501において“適応度一覧”が選択されている場合、抽出結果表示部502は、図12に示すように、S410において抽出された文献である特許公報の番号、夫々の特許公報のタイトルである発明の名称及び夫々の特許公報の抽出条件に対する適応度を関連付けて表示する。また、図12において、抽出された文献は、適応度が高い順に並べられて表示される。   The display mode selection unit 501 is a selection unit that selects the display mode of the extraction result display screen 500, and the content displayed on the extraction result display unit 502 changes according to the selection state of the display mode selection unit 501. The user can switch the selection state of the display mode selection unit 501 by operating the information input unit 110 of the information search apparatus 1. When “fitness list” is selected in the display mode selection unit 501, the extraction result display unit 502, as shown in FIG. 12, the number of the patent gazette that is the document extracted in S410, The title of the invention that is the title and the fitness for the extraction conditions of each patent publication are displayed in association with each other. In FIG. 12, the extracted documents are arranged and displayed in descending order of fitness.

このような情報検索装置1において、本実施形態に係る要旨は、図4において説明したS404〜S408の類義語情報の取得及び抽出条件情報の取得処理にある。図6を参照して、本実施形態に係る情報検索装置1の類義語情報の取得及び抽出条件情報の取得処理について更に説明する。図6に示すように、S404において説明した指定条件情報の解析の結果、図7(a)に示すように、抽出単語を取得すると、指定条件情報解析部102は、夫々の抽出単語について語意IDを付与する(S602)。   In such an information search device 1, the gist of the present embodiment is the synonym information acquisition and extraction condition information acquisition processing of S404 to S408 described in FIG. With reference to FIG. 6, the acquisition process of synonym information and extraction condition information of the information search device 1 according to the present embodiment will be further described. As shown in FIG. 6, when the extracted word is acquired as shown in FIG. 7A as a result of the analysis of the specified condition information described in S404, the specified condition information analyzing unit 102 determines the word meaning ID for each extracted word. (S602).

そして、指定条件情報解析部102は、図7(a)に示す夫々の抽出単語ごとに辞書検索を実行し(S603)、図7(b)に示すように、抽出類義語を取得する(S604)。抽出類義語を取得すると、指定条件情報解析部102は、取得した抽出類義語に語意IDを付与する(S605)。ここで、S605の処理においては、夫々の抽出類義語に対して、その抽出元となった抽出単語と同一の語意IDを付与する例えば、図7(b)に示す抽出単語“A”と抽出類義語“A1”とは同一の語意IDが付与される。   Then, the designated condition information analysis unit 102 performs a dictionary search for each extracted word shown in FIG. 7A (S603), and acquires an extracted synonym as shown in FIG. 7B (S604). . When the extracted synonym is acquired, the specified condition information analysis unit 102 assigns a meaning ID to the acquired extracted synonym (S605). Here, in the process of S605, each extracted synonym is given the same meaning ID as the extracted word from which it was extracted, for example, the extracted word “A” and the extracted synonym shown in FIG. 7B. “A1” is assigned the same word meaning ID.

語意IDの付与が完了すると、指定条件情報解析部102は、図8(a)に示すように抽出単語を表示するための表示情報を生成する(S606)。次に、指定条件情報解析部102は、図8(b)に示すように抽出類義語を抽出元となる抽出単語と関連付けて表示するように表示情報を生成し(S607)、処理を終了する。S607においては、S605において付与された語意IDに基づき、夫々の抽出類義語を同一の語意IDが付与された抽出単語に関連付けて表示するように表示情報を生成する。   When the provision of the word meaning ID is completed, the designated condition information analysis unit 102 generates display information for displaying the extracted word as shown in FIG. 8A (S606). Next, the specified condition information analysis unit 102 generates display information so that the extracted synonyms are displayed in association with the extracted word as the extraction source as shown in FIG. 8B (S607), and the process ends. In S607, display information is generated based on the meaning ID assigned in S605 so that each extracted synonym is displayed in association with the extracted word assigned the same meaning ID.

以上説明したように、本実施形態に係る情報検索装置により、情報の検索における検索条件の表示において、入力された検索文言と当該検索文言の類義語として取得された文言との対応関係の理解を図8(b)に示すように容易化することができる。   As described above, the information search apparatus according to the present embodiment enables the understanding of the correspondence between the input search word and the word acquired as a synonym of the search word in the display of the search condition in the information search. This can be facilitated as shown in FIG.

尚、上記の説明においては、図8(b)において説明したように、抽出条件情報表示画面400を例として説明したが、抽出結果を表示する抽出結果表示画面500において抽出単語と抽出類義語とを関連付けて表示する態様も可能である。そのような例について図13を参照して説明する。図13は、図12において説明した抽出結果表示画面500の他の態様を示す図である。図13の表示態様においては、抽出結果表示部502に、適合文献である特許公報の番号を列として縦に列挙し、夫々の検索語語を行として横に列挙することによりマトリクス状に配置して表示している。   In the above description, as described in FIG. 8B, the extraction condition information display screen 400 has been described as an example. However, the extracted word and the extracted synonym are displayed on the extraction result display screen 500 that displays the extraction result. A mode of displaying in association with each other is also possible. Such an example will be described with reference to FIG. FIG. 13 is a diagram showing another aspect of the extraction result display screen 500 described in FIG. In the display mode of FIG. 13, the extraction result display unit 502 arranges the numbers of patent gazettes that are relevant documents vertically as columns, and lists each search word as rows in a matrix form. Is displayed.

図13に示すような態様において、例えば、夫々の抽出単語を異なる色で表示し、夫々の抽出単語とその類義語とを同一の色で表示することが考えられる。具体的には、図13の例において、“A”及び“A1”を黒で表示し、“B”、“B1”及び“B2”を赤で表示し、“C”及び“C1”を青で表示する態様等が挙げられる。このように、抽出単語とその類義語とを関連付けて表示することにより、抽出結果表示画面500における抽出単語とその類義語との関連性のユーザによる把握を容易化することが可能となる。この場合は、抽出結果処理部104が抽出条件としての抽出単語及び抽出類義語を関連付けて表示するための抽出条件表示情報を生成する抽出条件表示情報生成部部として機能する。   In an aspect as shown in FIG. 13, for example, each extracted word may be displayed in a different color, and each extracted word and its synonym may be displayed in the same color. Specifically, in the example of FIG. 13, “A” and “A1” are displayed in black, “B”, “B1” and “B2” are displayed in red, and “C” and “C1” are displayed in blue. And the like are displayed. Thus, by displaying the extracted word and its synonyms in association with each other, it becomes possible to facilitate the grasp of the relationship between the extracted word and its synonyms on the extraction result display screen 500 by the user. In this case, the extraction result processing unit 104 functions as an extraction condition display information generation unit that generates extraction condition display information for displaying an extracted word and an extracted synonym as an extraction condition in association with each other.

また、上記の説明においては、抽出単語と抽出類義語とを関連付けて表示する抽出条件情報表示画面の例として、図8(a)、(b)の態様を例として説明した。この他、図14に示すように、抽出単語と抽出類義語とを同一の行に表示しても良い。また、図15に示すように、抽出単語と抽出類義語とを表示する行を別とした上で、抽出類義語はすべて同一の行に表示するようにしても良い。更に、図16示すように、抽出単語とその類義語とを連続して表示させ、抽出単語を強調表示するようにしても良い。図8(b)若しくは図13〜図16のいずれの態様であっても、抽出単語とその類義語とを関連付けて表示し、それらの関連性がユーザに理解可能な表示態様であれば、上記と同様の効果を得ることが可能である。この時、図16に示すように、抽出単語とその類義語とを異なる態様で表示することにより、抽出単語と類義語との区別を明確に表示することが可能となる。   Further, in the above description, as an example of the extraction condition information display screen that displays the extracted word and the extracted synonym in association with each other, the mode of FIGS. 8A and 8B has been described as an example. In addition, as shown in FIG. 14, the extracted word and the extracted synonym may be displayed on the same line. Further, as shown in FIG. 15, the extracted synonyms may be displayed on the same line after separating the lines for displaying the extracted words and the extracted synonyms. Further, as shown in FIG. 16, the extracted word and its synonyms may be displayed continuously, and the extracted word may be highlighted. 8B or 13 to 16, the extracted word and its synonym are displayed in association with each other, and if the relationship is understandable to the user, the above and Similar effects can be obtained. At this time, as shown in FIG. 16, by displaying the extracted word and its synonyms in different modes, the distinction between the extracted word and the synonyms can be clearly displayed.

また、上記の説明においては、ユーザが指定条件情報を入力する態様として、図5(a)のように、文章を入力する例を説明した。この他、検索条件指定画面300の検索条件指定部302において“キーワード”を選択することにより、“A”、“B”、“C”等の検索語を直接指定することも可能である。そのような態様について、図5(b)に示す。図5(b)は、検索条件指定画面300の検索条件指定部302において“キーワード”を選択した場合の例を示す図である。この場合、図5(b)に示すように、検索条件入力部303は、キーワードを入力する画面となる。   In the above description, as an aspect in which the user inputs the designated condition information, an example in which a sentence is input as shown in FIG. 5A has been described. In addition, it is also possible to directly specify search terms such as “A”, “B”, and “C” by selecting “keyword” in the search condition specifying unit 302 of the search condition specifying screen 300. Such an embodiment is shown in FIG. FIG. 5B is a diagram illustrating an example when “keyword” is selected in the search condition designation unit 302 of the search condition designation screen 300. In this case, as shown in FIG. 5B, the search condition input unit 303 is a screen for inputting a keyword.

図5(b)に示す態様の場合、指定条件情報として、ユーザによって入力されたキーワードが指定条件情報解析部102に入力される。ユーザによって指定されたキーワードを指定条件情報として受信した指定条件情報解析部102は、そのキーワードの類義語を辞書情報DB140から取得する。即ち、図5(b)に示す態様の場合、ユーザによって入力されたキーワードが上記実施例の抽出単語に該当し、そのキーワードの類義語が上記実施例の抽出類義語に該当する。以降の処理は、上記実施例と同様に実行される。   In the case shown in FIG. 5B, the keyword input by the user is input to the specified condition information analysis unit 102 as the specified condition information. The specified condition information analysis unit 102 that has received the keyword specified by the user as the specified condition information acquires a synonym of the keyword from the dictionary information DB 140. That is, in the case of the mode shown in FIG. 5B, the keyword input by the user corresponds to the extracted word of the above embodiment, and the synonym of the keyword corresponds to the extracted synonym of the above embodiment. The subsequent processing is executed in the same manner as in the above embodiment.

また、上記の説明においては、図3に示すように、類義語取得結果を表示した後、文献情報の抽出を実行し、その後抽出結果を表示する例を説明した。この他、文献を抽出した後に類義語取得結果と抽出結果とを表示するようにしても良い。この際、文献情報抽出部103は一覧情報に加えて抽出条件情報をも抽出結果処理部104に入力し、抽出結果処理部104が抽出条件情報及び抽出結果情報を表示部130に表示させるようにしても良い。   Further, in the above description, as shown in FIG. 3, the example in which the synonym acquisition result is displayed, the document information is extracted, and then the extraction result is displayed has been described. In addition, the synonym acquisition result and the extraction result may be displayed after the document is extracted. At this time, the document information extraction unit 103 inputs the extraction condition information in addition to the list information to the extraction result processing unit 104 so that the extraction result processing unit 104 causes the display unit 130 to display the extraction condition information and the extraction result information. May be.

実施の形態2.
実施の形態1においては、指定条件として入力された文章に含まれる単語と当該単語の類義語として抽出された類義語との対応関係の把握を容易化する情報検索システムを例として説明した。本実施形態においては、検索結果の表示態様に特徴を有する情報検索装置について説明する。尚、実施の形態1と同様の符号を付す構成については、実施の形態1と同一または相当部を示し、説明を省略する。
Embodiment 2. FIG.
In the first embodiment, the information search system that facilitates the understanding of the correspondence between the words included in the text input as the specified condition and the synonyms extracted as synonyms of the words has been described as an example. In the present embodiment, an information search apparatus having a feature in the display mode of search results will be described. In addition, about the structure which attaches | subjects the code | symbol similar to Embodiment 1, the same or equivalent part as Embodiment 1 is shown, and description is abbreviate | omitted.

図13は、本実施形態に係る抽出結果表示画面500を示す図である。図13に示すように、本実施形態に係る抽出結果表示画面500は、表示態様選択部501の選択状態が“ヒット数一覧”である場合の態様である。表示態様選択部501において“ヒット数一覧”が選択されている場合、抽出結果表示画面500の表示態様は図13に示すようになる。即ち、抽出結果表示部502は、適合文献である特許公報の番号を列として縦に列挙し、夫々の検索語語を行として横に列挙することによりマトリクス状に配置して表示している。そして、夫々の文献において夫々の検索語が用いられている回数(以降、検索語ヒット数若しくはヒット数とする)を夫々のセルに表示している。即ち、図13に示す夫々のセルに表示されているヒット数は、単位条件に対する充足度である。   FIG. 13 is a diagram showing an extraction result display screen 500 according to this embodiment. As illustrated in FIG. 13, the extraction result display screen 500 according to the present embodiment is an aspect when the selection state of the display aspect selection unit 501 is “hit number list”. When “hit number list” is selected in the display mode selection unit 501, the display mode of the extraction result display screen 500 is as shown in FIG. That is, the extraction result display unit 502 arranges and displays the numbers of patent gazettes, which are relevant documents, vertically as a column, and lists each search word as a row, arranged in a matrix. The number of times each search word is used in each document (hereinafter referred to as the search word hit count or hit count) is displayed in each cell. That is, the number of hits displayed in each cell shown in FIG. 13 is a sufficiency with respect to the unit condition.

尚、図13に示す“(ヒット数一覧)”の抽出結果表示画面500は、実施の形態1の図11において説明した情報に基づいて表示される。即ち、文献情報抽出部103及び抽出結果処理部104が連動して適合情報表示情報生成部として機能する。ここで、夫々の検索語を示す領域は、ソート指示部521として機能する。また、夫々のセルに表示されている検索語ヒット数は、検索語ヒット箇所表示指示部522として機能する。検索語ヒット箇所表示指示部522においては、夫々のヒット数に応じた大きさの円の中にそのヒット数を示す数値が表示されている。これにより、ユーザは、夫々の文献が夫々の検索語をどの程度含んでいるのかを容易に把握することが可能となる。   Note that the “(hit count list)” extraction result display screen 500 shown in FIG. 13 is displayed based on the information described in FIG. 11 of the first embodiment. That is, the literature information extraction unit 103 and the extraction result processing unit 104 function as a compatible information display information generation unit in conjunction with each other. Here, the area indicating each search word functions as the sort instruction unit 521. The number of search word hits displayed in each cell functions as a search word hit location display instruction unit 522. In the search word hit location display instruction section 522, a numerical value indicating the number of hits is displayed in a circle having a size corresponding to the number of hits. Thereby, the user can easily grasp how much each document includes each search term.

図13に示す“ヒット数一覧”の抽出結果表示画面500においては、抽出された特許公報は、実施の形態1の図12において説明した適応度の順に並べられている。また、検索語の夫々の列は、図13に示す画面左側、即ち、公報番号の列に近い側から、適合度の高い公報(図13の例においては、適合度が最も高い公報)でのヒット数が大きい順に並べられている。これは、ヒット数が多い検索語ほど、それら公報を特徴づけているという傾向に基づく。即ち、ヒット数の多い単語を公報列の近傍に配置することにより、特徴的な単語のヒット数と公報番号との対比確認を容易化することが可能となる。   In the “hit number list” extraction result display screen 500 shown in FIG. 13, the extracted patent publications are arranged in the order of fitness described in FIG. 12 of the first embodiment. Further, each column of search terms is displayed on the left side of the screen shown in FIG. 13, that is, on the side closer to the column of publication numbers, in the publication with the highest degree of fitness (in the example of FIG. 13, the publication with the highest degree of fitness). The hits are arranged in descending order. This is based on the tendency that search terms with a larger number of hits characterize these publications. That is, by arranging words having a large number of hits in the vicinity of the publication column, it becomes possible to facilitate comparison of the number of characteristic word hits and the publication number.

ここで、図13の例においては、一番上に表示されている公報における各検索語のヒット数を基準として検索語の列が並べ替えられている。この他、夫々の検索語において、抽出された全適合文献、即ち全特許公報におけるヒット数を合計し、その合計ヒット数に基づいて検索語の列を並べ替えても良い。若しくは、適合文献として抽出された文献のうち、さらに所定の閾値以上の適合度を有する文献のヒット数の合計に基づいて並べ替えても良い。また、図13に示す抽出単語及び抽出類義語の列の順番は、ユーザにより任意に変更可能である。これにより、ユーザの利便性を高めることが可能となる。   Here, in the example of FIG. 13, the search word columns are rearranged based on the number of hits of each search word in the publication displayed at the top. In addition, in each search word, the number of hits in all the extracted relevant documents, that is, all patent publications may be summed, and the search word column may be rearranged based on the total number of hits. Or you may rearrange based on the sum total of the number of hits of the literature which has the relevance degree more than a predetermined threshold among the literatures extracted as a relevant literature. Further, the order of the extracted word and extracted synonym columns shown in FIG. 13 can be arbitrarily changed by the user. Thereby, it becomes possible to improve a user's convenience.

また、図13に示す“ヒット数一覧”の抽出結果表示画面500においては、夫々の検索語ヒット箇所表示指示部522をクリックすることにより、夫々の文献において夫々の検索語が用いられている箇所を表示する検索語ヒット箇所表示画面が表示される。図17を参照して、本実施形態に係る検索語ヒット表示画面600について説明する。図17においては、図13に示す検索語ヒット箇所表示指示部522のうち、“C1”の列の“14”と表示されているセルをクリックした場合の例を示す。   In addition, in the “hit number list” extraction result display screen 500 shown in FIG. 13, each search word is used in each document by clicking each search word hit location display instruction unit 522. A search word hit location display screen for displaying locations is displayed. A search word hit display screen 600 according to the present embodiment will be described with reference to FIG. FIG. 17 shows an example of a case where a cell displayed as “14” in the column “C1” in the search word hit location display instruction unit 522 shown in FIG. 13 is clicked.

図17に示すように、本実施形態に係る検索語ヒット箇所表示画面600は、前後文表示部601及びヒット箇所表示部602を有する。前後文表示部601は、指定された文献中において、該当する検索語の直前の文章である“左文脈“及び該当する検索語の直後の文章である”右文脈“を表示する。また、ヒット箇所表示部602は、指定された検索語をハイライト表示した上で、指定された文献中において検索語が用いられている箇所を表示する。ヒット箇所表示部602におけるハイライト表示とは、指定された検索語を太字にて表示すると共に、下線を付す。この他、例えば赤字等、他の文章とは異なる色で検索語を表示しても良い。   As shown in FIG. 17, the search word hit location display screen 600 according to the present embodiment includes a before / after sentence display portion 601 and a hit location display portion 602. The preceding and following sentence display unit 601 displays “left context” that is a sentence immediately before the corresponding search word and “right context” that is a sentence immediately after the corresponding search word in the designated document. In addition, the hit location display unit 602 highlights the designated search term and displays the location where the search term is used in the designated document. In the highlight display in the hit location display portion 602, the designated search word is displayed in bold and underlined. In addition, for example, the search term may be displayed in a color different from other sentences such as red letters.

図17に示す検索語ヒット箇所表示画面600は、抽出結果処理部104によって生成された表示情報に基づき、クライアント装置2の表示部に表示される。図17に示す前後文表示部601及びヒット箇所表示部602に表示される情報は、文献情報抽出部103から抽出結果処理部104に入力される文献表示一覧情報には含まれていない。従って、抽出結果処理部104は、図13に示す抽出結果表示画面500においてクリックされた検索語ヒット箇所表示指示部522に対応する特許公報の公報番号に基づき、文献情報DB200から前後文表示部601及びヒット箇所表示部602に表示すべき情報を取得する。これにより、抽出結果処理部104は、検索語ヒット箇所表示画面600を生成することが可能となる。即ち、抽出結果処理部104が夫々の適合文献において夫々の単位条件の充足態様を表示するための充足態様表示情報生成部として機能する。充足態様表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。   The search word hit location display screen 600 shown in FIG. 17 is displayed on the display unit of the client device 2 based on the display information generated by the extraction result processing unit 104. The information displayed in the pre- and post-sentence display unit 601 and the hit location display unit 602 illustrated in FIG. 17 is not included in the literature display list information input from the literature information extraction unit 103 to the extraction result processing unit 104. Therefore, the extraction result processing unit 104 performs a pre- and post-sentence display unit 601 from the literature information DB 200 based on the gazette number of the patent publication corresponding to the search word hit location display instruction unit 522 clicked on the extraction result display screen 500 shown in FIG. And the information which should be displayed on the hit location display part 602 is acquired. As a result, the extraction result processing unit 104 can generate the search word hit location display screen 600. That is, the extraction result processing unit 104 functions as a satisfaction mode display information generation unit for displaying the satisfaction mode of each unit condition in each relevant document. The satisfaction mode display information generation unit is configured by a program loaded in the RAM 20 shown in FIG.

尚、上述したように、図17に示す検索語ヒット箇所表示画面600を表示するためには、抽出結果表示画面500において検索語ヒット箇所表示指示部522をクリックする。ここで、抽出結果表示画面500はクライアント装置2の表示部に表示される情報であり、検索語ヒット箇所表示指示部522のクリックは、クライアント装置2において実行される処理である。従って、情報検索装置1は、ネットワークI/F120を介して検索語ヒット箇所表示指示部522がクリックされたことを示す情報(以降、検索語ヒット箇所表示指示情報とする)をクライアント装置2から受信する。   As described above, in order to display the search word hit location display screen 600 shown in FIG. 17, the search word hit location display instruction unit 522 is clicked on the extraction result display screen 500. Here, the extraction result display screen 500 is information displayed on the display unit of the client device 2, and clicking on the search word hit location display instruction unit 522 is a process executed on the client device 2. Therefore, the information search device 1 receives information indicating that the search word hit location display instruction unit 522 has been clicked via the network I / F 120 (hereinafter referred to as search word hit location display instruction information) from the client device 2. To do.

ネットワークI/F120を介して情報検索装置1に入力された検索語ヒット箇所表示指示情報は、検索制御部100に入力され、抽出結果処理部104が取得する。ここで、検索語ヒット箇所表示指示情報には、文献及び検索語を特定する情報が含まれる。これは、例えば、実施の形態1の図9において説明したIDである。この他、文献及び検索語を夫々特定しても良い。即ち、検索語ヒット箇所表示指示情報とは、適合文献のいずれか1つにおける検索語のいずれか1つのヒット数、即ち充足度を指定する充足度指定情報として用いられる。従って、抽出結果処理部104が充足度指定情報取得部として機能する。充足度指定情報取得部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。   The search word hit location display instruction information input to the information search apparatus 1 via the network I / F 120 is input to the search control unit 100 and acquired by the extraction result processing unit 104. Here, the search word hit location display instruction information includes information specifying a document and a search word. This is, for example, the ID described in FIG. 9 of the first embodiment. In addition, documents and search terms may be specified. That is, the search word hit location display instruction information is used as fulfillment degree designation information for designating the number of hits of any one of the search words in any one of the relevant documents, that is, the satisfaction degree. Therefore, the extraction result processing unit 104 functions as a satisfaction degree designation information acquisition unit. The satisfaction degree designation information acquisition unit is configured by a program loaded in the RAM 20 shown in FIG.

従来の検索装置においては、本実施形態に係る検索語“A”、“A1”、“B”、“B1”、“B2”・・・等、複数の検索語を用いて検索を実行した場合、それら複数の検索語がすべてハイライト表示されていた。そのため、多くの文字がハイライト表示されることにもなり、ヒット箇所表示部602のような画面において所望の検索語を参照する際に不便であった。これに対して、本実施形態に係るヒット箇所表示画面600のヒット箇所表示部602においては、指定された検索語、即ち、図13に示す抽出結果表示画面500の検索語ヒット箇所表示指示部522をクリックして指定されたセルに対応する検索語(図17の例においては“C1”)のみをハイライト表示する。これにより、ヒット箇所表示部602において所望の検索語を容易に発見し、参照することが可能となる。   In a conventional search device, when a search is executed using a plurality of search terms such as the search terms “A”, “A1”, “B”, “B1”, “B2”. , Those multiple search terms were all highlighted. For this reason, many characters are highlighted, which is inconvenient when referring to a desired search word on a screen such as the hit location display portion 602. In contrast, in the hit location display section 602 of the hit location display screen 600 according to the present embodiment, the designated search word, that is, the search word hit location display instruction section 522 of the extraction result display screen 500 shown in FIG. By clicking, only the search term (“C1” in the example of FIG. 17) corresponding to the designated cell is highlighted. As a result, it is possible to easily find and refer to a desired search word in the hit location display unit 602.

次に、図13に示すソート指示部521の機能について、図18を参照して説明する。図18は、図13に示すソート指示部521のうち、“B1”が表示されている領域をクリックした場合を示している。図18に示すように、“B1”が表示されている領域のソート指示部521をクリックした場合、抽出された特許公報は“B1”のヒット数順に並べ替えられる。また、“B1”のヒット数に基づいてソートされていることの明示のため、“B1”のソート指示部521が反転表示される。このような処理により、抽出された特許公報の並び順をユーザの指定した検索語のヒット数に基づいた順位とすることが可能となり、情報解析の利便性を向上することが可能となる。   Next, the function of the sort instruction unit 521 shown in FIG. 13 will be described with reference to FIG. FIG. 18 shows a case where the area where “B1” is displayed is clicked in the sort instruction section 521 shown in FIG. As shown in FIG. 18, when the sort instruction part 521 in the area where “B1” is displayed is clicked, the extracted patent publications are sorted in the order of the number of hits “B1”. In order to clearly indicate that sorting is performed based on the number of hits “B1”, the sort instruction section 521 “B1” is highlighted. By such processing, the order of the extracted patent publications can be set to the order based on the number of hits of the search term designated by the user, and the convenience of information analysis can be improved.

図17において説明した検索語ヒット箇所表示画面600の表示と同様に、ソート指示部521のクリックもクライアント装置2において実行される処理である。従って、情報検索装置1は、ソート指示部521がクリックされたことを示す情報(以降、ソート指示情報とする)をネットワークI/F120を介してクライアント装置2から受信する。ネットワークI/F120が受信したソート指示情報は、ネットワークI/F120から検索制御部100に入力され、抽出結果処理部104が取得する。即ち、抽出結果処理部104が操作情報取得部及び単位条件指定情報取得部として機能する。操作情報取得部及び単位条件指定情報取得部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。   Similarly to the display of the search word hit location display screen 600 described in FIG. 17, the click of the sort instruction unit 521 is a process executed in the client device 2. Accordingly, the information search apparatus 1 receives information indicating that the sort instruction unit 521 has been clicked (hereinafter referred to as sort instruction information) from the client apparatus 2 via the network I / F 120. The sort instruction information received by the network I / F 120 is input from the network I / F 120 to the search control unit 100 and acquired by the extraction result processing unit 104. That is, the extraction result processing unit 104 functions as an operation information acquisition unit and a unit condition designation information acquisition unit. The operation information acquisition unit and the unit condition designation information acquisition unit are configured by a program loaded in the RAM 20 shown in FIG.

また、図13に示すような“ヒット数一覧”の抽出結果表示画面500においては、夫々の検索語毎のヒット数のみならず、複数の検索語をグループ化し、抽出された特許公報の番号と検索語のグループとをマトリクス状に配置する態様も可能である。そのような態様について、図19を参照して説明する。図19は、“A”及び“A1”を1つのグループとし、“B”、“B1”及び“B2”を1つのグループとし、“C”及び“C1”を1つのグループとした例を示している。図19に示すグループの指定は、図17若しくは図18の画面を表示する処理と同様に、クライアント装置2において実行される。   In addition, in the extraction result display screen 500 of the “hit number list” as shown in FIG. 13, not only the number of hits for each search word but also a plurality of search words are grouped, and the extracted patent publication numbers It is also possible to arrange the search terms and groups of search terms in a matrix. Such an aspect will be described with reference to FIG. FIG. 19 shows an example in which “A” and “A1” are one group, “B”, “B1” and “B2” are one group, and “C” and “C1” are one group. ing. The group designation shown in FIG. 19 is executed in the client device 2 in the same manner as the processing for displaying the screen in FIG. 17 or FIG.

図13に示す態様においては、夫々の検索語が夫々の文献において用いられている数を一覧することが可能であるが、検索語の中には類義語として抽出された抽出類義語も含まれるため、全ての検索語毎の一覧は必ずしも必要ではない。これに対して、図19に示すように、抽出単語及びその単語の類義語として抽出された類義語を1つのグループとすることにより、夫々の検索語が夫々の特許公報において用いられている数を、同義の検索語毎に容易に一覧することが可能となる。   In the aspect shown in FIG. 13, it is possible to list the number of each search word used in each document, but since the search terms include extracted synonyms extracted as synonyms, A list for every search term is not necessarily required. On the other hand, as shown in FIG. 19, by synthesizing extracted words and synonyms extracted as synonyms of the words into one group, the number of each search word used in each patent gazette It is possible to easily list each synonymous search word.

尚、ユーザがクライアント装置2を操作することにより生成される検索語のグループ指定の情報は、ネットワークI/F120が受信して検索制御部100に入力され、抽出結果処理部104が取得する。即ち、抽出結果処理部104が複数の単位条件である検索語を単位条件群として指定する単位条件群指定情報を取得する単位条件郡指定情報取得部として機能する。単位条件群指定情報取得部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。   Note that search term group designation information generated when the user operates the client device 2 is received by the network I / F 120 and input to the search control unit 100, and is acquired by the extraction result processing unit 104. That is, the extraction result processing unit 104 functions as a unit condition group designation information acquisition unit that acquires unit condition group designation information that designates a search term that is a plurality of unit conditions as a unit condition group. The unit condition group designation information acquisition unit is configured by a program loaded in the RAM 20 shown in FIG.

また、図19に示す抽出結果表示画面500においても、検索語ヒット箇所表示部522若しくはソート指示部521をクリックすることにより、図17若しくは図18において説明した機能を実現することが可能である。ここで、図19に示す抽出結果表示画面500において検索語ヒット箇所表示部522をクリックした場合、図17に示す検索語ヒット箇所表示画面600においては、指定した検索語グループに含まれるすべての検索語が前後文表示部601に表示され、ヒット箇所表示部602においては指定した検索語グループに含まれるすべての検索語がハイライト表示される。   Also, in the extraction result display screen 500 shown in FIG. 19, the function described in FIG. 17 or 18 can be realized by clicking the search word hit location display unit 522 or the sort instruction unit 521. Here, when the search word hit location display unit 522 is clicked on the extraction result display screen 500 shown in FIG. 19, all the searches included in the specified search term group are displayed on the search word hit location display screen 600 shown in FIG. The words are displayed on the front and rear sentence display unit 601, and all the search terms included in the designated search term group are highlighted on the hit location display unit 602.

以上説明したように、本実施形態に係る情報検索装置により、情報の検索における検索結果の表示において、検索条件と検索対象情報との適合度を算出する前の、検索条件と検索対象情報との適合状況について、図13に示すようによりユーザに理解し易いように表示することが可能となる。   As described above, the information search apparatus according to the present embodiment uses the search condition and the search target information before calculating the degree of matching between the search condition and the search target information in the display of the search result in the information search. As shown in FIG. 13, the compatibility status can be displayed so as to be easily understood by the user.

また、上記の説明においては、図13に示すように、適合文献である特許公報の番号を列として縦に列挙し、夫々の検索語を行として横に列挙することによりマトリクス状に配置して表示する例を説明した。これに対して、適合文献を行とし、検索語を列としても良い。但し、指定された検索語の数よりも抽出された適合文献の数の方が多くなることが多いと考えられる。この場合、ユーザは適合文献が配列された方向に画面をスクロールさせて全文献を確認することになる。PC等の一般的な情報処理端末においては、マウスのホールを回転させることにより、上下方向の画面スクロールが容易なように構成されているものが多い。従って、適合文献を列として縦に列挙することにより、ユーザの利便性を向上することが可能となる。この他、適合文献数よりも検索語数の方が多い場合も考え、列と行とを入れ替え可能なようにしても良い。これにより、更にユーザの利便性を高めることが可能となる。更には、抽出結果の適合文献の数と検索語の数とを比較し、多い方を列として配置するようにしても良い。   In the above description, as shown in FIG. 13, the numbers of patent gazettes that are relevant documents are listed vertically as columns, and the respective search terms are listed horizontally as rows to arrange them in a matrix. The example to display was demonstrated. On the other hand, relevant documents may be used as rows and search terms may be used as columns. However, it is considered that the number of relevant documents extracted is often larger than the number of designated search terms. In this case, the user scrolls the screen in the direction in which the relevant documents are arranged and confirms all the documents. Many general information processing terminals such as PCs are configured such that screen scrolling in the vertical direction is facilitated by rotating a mouse hole. Therefore, it is possible to improve user convenience by listing the relevant documents vertically as a column. In addition, considering that the number of search words is larger than the number of relevant documents, the columns and rows may be interchangeable. Thereby, it is possible to further improve the convenience for the user. Furthermore, the number of matching documents obtained as a result of extraction may be compared with the number of search terms, and the larger number may be arranged as a column.

また、上記の説明においては、図13において説明したように、抽出結果表示画面500における検索語の夫々の列が、公報番号の列に近い側からヒット数の大きい順に並べられている例を説明した。これは、上述したように、特徴的な言葉をより公報番号の列の近傍に表示させたいという要求に基づく。この他、特徴的な言葉を判断する要因としては、夫々の検索語によって抽出された文献の数(以降、文書頻度とする)がある。例えば、図13の例においては、検索語“C”を含む文献の数は6であり、検索語“A”を含む文献の数は3である。従って、検索語“C”の文書頻度は6であり、検索語“A”の文書頻度は3である。   In the above description, as described with reference to FIG. 13, an example in which each column of search words in the extraction result display screen 500 is arranged in descending order of the number of hits from the side closer to the column of publication numbers. did. As described above, this is based on a request to display more characteristic words in the vicinity of the publication number column. Other factors that determine characteristic words include the number of documents extracted by each search word (hereinafter referred to as document frequency). For example, in the example of FIG. 13, the number of documents including the search word “C” is 6, and the number of documents including the search word “A” is 3. Therefore, the document frequency of the search word “C” is 6, and the document frequency of the search word “A” is 3.

上記文書頻度が大きければ、より多くの文献においてその文言が用いられているということであり、小さければ、その文言を用いている文献が少ないということである。即ち、文書頻度が小さい検索語は、特徴的な文言であり、文書頻度が大きい検索語は一般的な言葉であると言うことができる。従って、図20に示すように、抽出結果表示画面500において、検索語の夫々の列を、公報番号の列に近い側から文書頻度の小さい順に並べるようにしても良い。これによっても、図13の態様と同様の効果を得ることが可能となる。   If the document frequency is large, the wording is used in more documents, and if the document frequency is small, the number of documents using the wording is small. That is, it can be said that a search word with a low document frequency is a characteristic wording and a search word with a high document frequency is a general word. Therefore, as shown in FIG. 20, on the extraction result display screen 500, the respective columns of search terms may be arranged in ascending order of document frequency from the side closer to the column of publication numbers. Also by this, it is possible to obtain the same effect as the embodiment of FIG.

また、上記の説明においては、図13において説明したように、マトリクス表示の各セルにヒット数を表示する例を説明した。この他、マトリクス表示の各セルに、夫々の検索語が夫々の適合文献の適合度にどの程度寄与しているかを示す数値(以降、スコア寄与率)を表示させても良い。このような態様について説明する。   In the above description, as described with reference to FIG. 13, an example in which the hit count is displayed in each cell of the matrix display has been described. In addition, a numerical value (hereinafter, score contribution ratio) indicating how much each search term contributes to the relevance of each relevant document may be displayed in each cell of the matrix display. Such an aspect will be described.

まず、夫々の文献の適合度及び上述したスコア寄与率の求め方について説明する。夫々の文献の適合度は、以下の式(1)によって求められる。

Figure 0005347307
ここで、式(1)に示すScorenは、夫々の文献における検索語nの適合度である。また、式(1)に示すiは、夫々の文献に含まれる検索語の数である。即ち、検索語nとは、一の文献に含まれるi個の検索語のうちの1つ(n番目)である。 First, how to obtain the degree of fitness of each document and the score contribution rate described above will be described. The fitness of each document is obtained by the following equation (1).
Figure 0005347307
Here, Scoren shown in Equation (1) is the degree of matching of the search word n in each document. Moreover, i shown in Formula (1) is the number of search terms included in each document. That is, the search word n is one (nth) of i search words included in one document.

また、Scorenは、以下の式(2)によって求められる。

Figure 0005347307
ここで、式(2)に示すHitnは、夫々の文献における検索語nのヒット数である。また、式(2)に示すWeightnは、検索語nの重み値である。 Moreover, Scoren is calculated | required by the following formula | equation (2).
Figure 0005347307
Here, Hitn shown in Expression (2) is the number of hits of the search word n in each document. Also, Weight n shown in Expression (2) is a weight value of the search word n.

また、Weightnは、以下の式(3)によって求められる。

Figure 0005347307
ここで、式(3)に示す全登録文献とは、文献情報DB200に格納されている全ての文献、即ち、検索対象であるすべての文献数である。また、式(3)に示すDFnとは、検索語nの文書頻度(Document Frequency)である。 Weight n is obtained by the following equation (3).
Figure 0005347307
Here, all the registered documents shown in Expression (3) are all documents stored in the document information DB 200, that is, the number of all documents to be searched. In addition, DFn shown in Expression (3) is the document frequency of the search word n.

文献情報抽出部103は、図11において説明した情報及び文献情報DB200に格納されている全文献数に基づき、上記の式(1)〜(3)を用いて夫々の文献の適合度を算出する。   Based on the information described in FIG. 11 and the total number of documents stored in the document information DB 200, the document information extraction unit 103 calculates the fitness of each document using the above formulas (1) to (3). .

このような計算式に基づき、検索語nのスコア寄与率は、以下の式(4)によって求められる。

Figure 0005347307
抽出結果処理部104は、文献情報抽出部103から受信した文献表示一覧情報に基づき、式(4)に示す計算を実行して夫々の検索語nのスコア寄与率を計算し、マトリクス表示の各セルにスコア寄与率が表示された抽出結果表示画面500を生成する。このような抽出結果表示画面500の例を図21に示す。図21に示すように、マトリクス表示の各セルにスコア寄与率を表示することにより、適合文献として抽出された文献の適合度において、夫々の検索語がどの程度寄与したかを容易に把握することが可能となる。このような情報は、例えば、再検索を実行する際の検索語の修正において有意な情報となる。 Based on such a calculation formula, the score contribution ratio of the search word n is obtained by the following formula (4).
Figure 0005347307
Based on the document display list information received from the document information extraction unit 103, the extraction result processing unit 104 performs the calculation shown in Expression (4) to calculate the score contribution rate of each search word n, and each matrix display An extraction result display screen 500 in which the score contribution ratio is displayed in the cell is generated. An example of such an extraction result display screen 500 is shown in FIG. As shown in FIG. 21, by displaying the score contribution rate in each cell of the matrix display, it is possible to easily grasp how much each search word contributes in the relevance of the document extracted as the relevant document. Is possible. Such information becomes significant information in the correction of the search word when the re-search is executed, for example.

このように、図21に示す例においては、マトリクス表示における各セルに表示する充足度に関する情報として、夫々の検索語が夫々の適合文献の適合度にどの程度寄与しているかを示す数値であるスコア寄与率を表示する。尚、図21の例においては、マトリクス表示の各セルにスコア寄与率を表示する例を説明したが。この他、夫々の文献における夫々の検索語nの適合度であるScorenを表示しても良い。   As described above, in the example shown in FIG. 21, as information on the sufficiency displayed in each cell in the matrix display, it is a numerical value indicating how much each search word contributes to the relevance of each relevant document. Displays the score contribution rate. In the example of FIG. 21, the example in which the score contribution rate is displayed in each cell of the matrix display has been described. In addition, Scoren, which is the fitness of each search word n in each document, may be displayed.

実施の形態3.
本実施形態においては、抽出結果処理部104による抽出結果表示の他の態様について説明する。実施の形態2においては、図4に示すS410の処理の結果抽出された文献情報としての特許公報番号を様々な態様で表示する場合を説明した。この他、本実施形態に係る抽出結果処理部104は、検索対象である文献情報としての特許公報が含む書誌事項に基づいて抽出結果を解析し、その解析の結果生成された情報を表示するための表示情報を生成する機能を有する。即ち、抽出結果処理部104が、解析結果情報を生成する抽出結果解析部及び解析結果表示情報生成部として機能する。抽出結果解析部及び解析結果表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。以下、抽出結果処理部104による抽出結果の解析及びその表示態様の例について説明する。
Embodiment 3 FIG.
In the present embodiment, another aspect of extraction result display by the extraction result processing unit 104 will be described. In the second embodiment, the case where the patent publication number as the document information extracted as a result of the process of S410 shown in FIG. 4 is displayed in various modes has been described. In addition, the extraction result processing unit 104 according to the present embodiment analyzes the extraction result based on the bibliographic items included in the patent gazette as the document information to be searched, and displays information generated as a result of the analysis. The display information is generated. That is, the extraction result processing unit 104 functions as an extraction result analysis unit that generates analysis result information and an analysis result display information generation unit. The extraction result analysis unit and the analysis result display information generation unit are configured by a program loaded in the RAM 20 illustrated in FIG. Hereinafter, analysis of the extraction result by the extraction result processing unit 104 and an example of the display mode will be described.

まず、本実施形態に係る検索対象である文献情報として特許公報が含む書誌情報について説明する。図22は、特許公報が含む書誌情報の例を示す図である。図22に示すように、特許公報は、公開番号、出願番号、IPC(International Patent Classification)、FI(File Index)、Fターム(File Forming Term)、公開年月日、出願年月日、出願人、代理人及び発明者についての情報を含む。即ち、書誌情報とは、検索対象である文献情報に付加されている付加情報である。   First, bibliographic information included in a patent gazette will be described as document information to be searched according to the present embodiment. FIG. 22 is a diagram showing an example of bibliographic information included in the patent publication. As shown in FIG. 22, the patent gazette includes a publication number, an application number, an IPC (International Patent Classification), an FI (File Index), an F term (File Forming Term), a publication date, an application date, an applicant. , Including information about agents and inventors. That is, the bibliographic information is additional information added to the literature information that is the search target.

公開番号及び出願番号は、その特許公報の公開時若しくはその特許公報に係る特許出願がされた際に付された番号である。IPC、FI、Fタームは、その特許公報に開示されている技術の分野を示す記号情報である。即ち、夫々の文献が開示している情報に含まれる要素をその内容に基づいて分類した要素分類情報である。ここで、特許公報においては、必ずしも一の技術分野に属する技術のみが開示されるとは限らず、また、多分野の技術を組み合わせた発明もある。従って、一の特許公報においては、複数のIPC、FI及びFタームが夫々付され得る。特に、Fタームは、夫々の記号が意味する技術が非常に細かく細分化されており、一の特許文献において複数のFターム記号が付されるのが通例である。   The publication number and the application number are numbers given when the patent publication is published or when a patent application relating to the patent publication is filed. IPC, FI, and F-term are symbol information indicating the technical field disclosed in the patent publication. That is, it is element classification information obtained by classifying elements included in information disclosed by each document based on the contents. Here, the patent publications do not necessarily disclose only technologies belonging to one technical field, and there are also inventions that combine technologies from various fields. Accordingly, in one patent publication, a plurality of IPCs, FIs, and F terms can be attached. In particular, the technology of F terms is very finely subdivided, and it is usual that a plurality of F term symbols are attached in one patent document.

公開年月日及び出願年月日は、その特許公報の公開日時若しくはその特許公報に係る特許出願がされた日時である。出願人は、その特許公報に係る特許出願を行なった者である。代理人は、その特許公報に係る特許出願に際して手続きを代理する者である。発明者は、その特許公報にかかる特許出願が開示する発明を完成させた者である。出願人、代理人及び発明者は、夫々複数の者が該当する場合があり得る。   The publication date and the filing date are the publication date and time of the patent gazette or the date and time when the patent application relating to the patent gazette was filed. The applicant is the person who applied for the patent according to the patent publication. An agent is a person who represents a procedure for filing a patent application relating to the patent gazette. The inventor is a person who has completed the invention disclosed by the patent application according to the patent publication. The applicant, agent and inventor may each be a plurality of persons.

検索対象である特許公報の書誌情報は、文献情報抽出部103から抽出結果処理部104に入力される文献表示一覧情報には含まれていない。従って、抽出結果処理部104は、適合文献である特許公報の書誌情報の解析に際して、文献表示一覧に含まれる特許公報の書誌情報を文献情報DB200から取得する。これにより、抽出結果処理部104は、適合文献の書誌情報を解析することが可能となる。尚、本実施形態においては、日本国の公開特許公報を対象とするため、要素分類情報としては、図22に示す通りIPC、FI及びFタームであるが、アメリカ合衆国の特許公報を対象とする場合は、Current
US Classification等を用いることも可能である。
The bibliographic information of patent gazettes to be searched is not included in the document display list information input from the document information extraction unit 103 to the extraction result processing unit 104. Therefore, the extraction result processing unit 104 acquires the bibliographic information of the patent publications included in the literature display list from the literature information DB 200 when analyzing the bibliographic information of the patent publications that are relevant documents. Thereby, the extraction result processing unit 104 can analyze the bibliographic information of the relevant literature. In this embodiment, since it is intended for the Japanese published patent gazette, the element classification information is IPC, FI and F-term as shown in FIG. 22, but in the case of the United States patent gazette. Is the Current
It is also possible to use US Classification or the like.

図23は、特許公報が有する書誌情報のうち、IPCに基づいて抽出結果を解析し、夫々の特許公報に含まれるIPCを集計して件数順に表示した状態を示す図である。尚、このような解析結果を表示する場合、ユーザは表示態様選択部501を“書誌情報解析”に切り換える。表示態様選択部501を“書誌情報解析”に切り換えると、図22に示すように、解析態様選択部503が表示される。解析態様選択部503を切り換えることにより、様々な解析態様を表示させることが可能となる。尚、図23の表示においては、解析態様選択部503の選択を“IPC件数”とする。   FIG. 23 is a diagram illustrating a state in which extraction results are analyzed based on IPC among bibliographic information included in patent gazettes, and IPCs included in the respective patent gazettes are aggregated and displayed in order of number of cases. When displaying such an analysis result, the user switches the display mode selection unit 501 to “bibliographic information analysis”. When the display mode selection unit 501 is switched to “bibliographic information analysis”, an analysis mode selection unit 503 is displayed as shown in FIG. By switching the analysis mode selection unit 503, various analysis modes can be displayed. In the display of FIG. 23, the analysis mode selection unit 503 selects “number of IPCs”.

ここで、ユーザが表示態様選択部501を切り換える処理は、クライアント装置2において実行される処理である。従って、情報検索装置1は、クライアント装置2において表示態様選択部501が切り換えられたことを示す情報(以降、表示態様切換指示情報とする)をネットワークI/F120を介してクライアント装置2から受信する。ネットワークI/F120が受信した表示態様切換指示情報は、ネットワークI/F120から検索制御部100に入力され、抽出結果処理部104が取得する。これにより、抽出結果処理部104が指定された表示態様に従って抽出結果の解析を実行する。即ち、抽出結果処理部104が抽出結果解析部として機能する。抽出結果解析部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。   Here, the process in which the user switches the display mode selection unit 501 is a process executed in the client device 2. Therefore, the information search device 1 receives information indicating that the display mode selection unit 501 has been switched in the client device 2 (hereinafter referred to as display mode switching instruction information) from the client device 2 via the network I / F 120. . The display mode switching instruction information received by the network I / F 120 is input from the network I / F 120 to the search control unit 100 and acquired by the extraction result processing unit 104. Thus, the extraction result processing unit 104 analyzes the extraction result according to the designated display mode. That is, the extraction result processing unit 104 functions as an extraction result analysis unit. The extraction result analysis unit is configured by a program loaded in the RAM 20 shown in FIG.

上記表示態様切換指示情報には、解析態様選択部503の選択状態に関する情報も含まれる。図23の例においては、“IPC件数”が選択されているため、表示態様切換指示情報には、IPC件数に基づいて解析した表示態様に切り換えることを指示する情報が含まれる。   The display mode switching instruction information includes information related to the selection state of the analysis mode selection unit 503. In the example of FIG. 23, since “IPC number” is selected, the display mode switching instruction information includes information instructing switching to the display mode analyzed based on the number of IPC cases.

次に、図23に示す抽出結果表示画面500を生成する処理について、図24を参照して説明する。図24の例においては、図23に示すように、解析態様選択部503の選択状態が“IPC件数”である場合を例として説明する。抽出結果処理部104は、上述した表示態様切換指示情報を受信すると、適合文献として抽出された文献に付された全てのIPCを抽出する(S2401)。図25に、S2401の処理の結果生成される情報を示す。図25に示すように、S2401においては、適合文献に付された全てのIPCが列挙される。   Next, processing for generating the extraction result display screen 500 shown in FIG. 23 will be described with reference to FIG. In the example of FIG. 24, the case where the selection state of the analysis mode selection unit 503 is “number of IPC cases” will be described as an example, as shown in FIG. When the extraction result processing unit 104 receives the display mode switching instruction information described above, the extraction result processing unit 104 extracts all IPCs attached to the documents extracted as relevant documents (S2401). FIG. 25 shows information generated as a result of the processing of S2401. As shown in FIG. 25, in S2401, all IPCs attached to relevant documents are listed.

適合文献に付された全IPCの抽出が完了すると、抽出結果処理部104は、抽出されたIPCのうち、一のIPCを参照する(S2402)。そして、適合文献として抽出された文献のうち、参照中のIPCが付されている適合文献の数をカウントする(S2403)。抽出結果処理部104は、S2402及びS2403の処理を、S2401において抽出された全IPCについて完了するまで繰り返し(S2404/NO)、全IPCについて完了したら(S2404/YES)、夫々のIPC毎のカウント数を表示するための表示情報を生成して(S2405)、処理を終了する。このような処理により、図23に示す画面を表示するための情報が生成される。即ち、抽出結果処理部104が解析結果表示情報生成部として機能する。解析結果表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。   When the extraction of all the IPCs attached to the relevant documents is completed, the extraction result processing unit 104 refers to one IPC among the extracted IPCs (S2402). Then, among the documents extracted as the relevant documents, the number of the relevant documents to which the IPC being referred to is attached is counted (S2403). The extraction result processing unit 104 repeats the processing of S2402 and S2403 until it is completed for all IPCs extracted in S2401 (S2404 / NO), and when it is completed for all IPCs (S2404 / YES), the count number for each IPC. Is generated (S2405), and the process ends. Through such processing, information for displaying the screen shown in FIG. 23 is generated. That is, the extraction result processing unit 104 functions as an analysis result display information generation unit. The analysis result display information generation unit is configured by a program loaded in the RAM 20 shown in FIG.

図23の例においては、図4において説明したS410において抽出された特許公報のうち、IPCとして“G06F17/30”が付されているものが821件あり、“G06F14/40”が付されているものが59件あることを示している。図23に示すように、“(IPC件数解析一覧)”の抽出結果表示画面500においては、夫々のIPC記号が付されている適合文献の件数が、夫々のIPC記号及びそのIPC記号において特徴的な言葉、即ち、夫々の付加情報に関連する関連情報と関連付けて表示されている。このような表示により、ユーザは、抽出結果において含まれるIPC記号の傾向及び夫々のIPC記号において特徴的な言葉を容易に一覧して把握することが可能となる。尚、図23に示すのはIPCに基づいて抽出結果を解析した例であるが、FI若しくはFタームにおいても同様に適用可能である。   In the example of FIG. 23, among the patent publications extracted in S410 described with reference to FIG. 4, there are 821 cases in which “G06F17 / 30” is assigned as the IPC, and “G06F14 / 40” is assigned. It shows that there are 59 things. As shown in FIG. 23, in the extraction result display screen 500 of “(IPC number analysis list)”, the number of relevant documents to which each IPC symbol is attached is characteristic for each IPC symbol and its IPC symbol. In other words, it is displayed in association with related information related to each additional information. With such a display, the user can easily list and understand the tendency of the IPC symbols included in the extraction result and the characteristic words in each IPC symbol. FIG. 23 shows an example in which the extraction result is analyzed based on the IPC, but the present invention can be similarly applied to FI or F-term.

ここで、上述したように、特許公報に付されているIPC記号は1つとは限らない。本実施形態に係る抽出結果処理部104は、一の特許公報に付されているIPCの組み合わせを解析し、夫々の特許公報に含まれるIPCの組み合わせを集計して件数順に表示する機能を有する。図26は、2つのIPCの組み合わせを解析し、件数順に表示した抽出結果表示画面500を示す図である。図26に示すように、2つのIPCの組み合わせを解析する場合は、解析態様選択部503の選択を“IPC×2件数”に切り換える。図26の例においては、図4のS410において抽出された特許公報のうち、IPCとして“G06F17/30”及び“G06F15/40”が付されているものが55件あり、“G0617/30”及び“G06F17/21”が付されているものが34件あることを示している。   Here, as described above, the number of IPC symbols attached to the patent publication is not limited to one. The extraction result processing unit 104 according to the present embodiment has a function of analyzing combinations of IPCs attached to one patent gazette, summing up the combinations of IPCs included in each patent gazette, and displaying them in the number of cases. FIG. 26 is a diagram showing an extraction result display screen 500 in which combinations of two IPCs are analyzed and displayed in order of the number of cases. As shown in FIG. 26, when analyzing a combination of two IPCs, the selection of the analysis mode selection unit 503 is switched to “IPC × 2 cases”. In the example of FIG. 26, there are 55 patent publications extracted in S410 of FIG. 4 with “G06F17 / 30” and “G06F15 / 40” as IPCs. This indicates that there are 34 cases with “G06F17 / 21”.

また、図27は、抽出結果処理部104が3つのIPCの組み合わせを解析し、件数順に表示した抽出結果表示画面500を示す図である。図27に示すように、3つのIPCの組み合わせを解析する場合は、解析態様選択部503の選択を“IPC×3件数”に切り換える。図26の例においては、S306において抽出された特許公報のうち、IPCとして“G06F17/30”、“G06F15/40”及び“G06T1/00”の3つが付されているものが5件あり、“G0617/30”、“G06F17/21”及び“G06F15/20”の3つが付されているものが4件あることを示している。   FIG. 27 is a diagram showing an extraction result display screen 500 in which the extraction result processing unit 104 analyzes combinations of three IPCs and displays them in order of the number of cases. As shown in FIG. 27, when analyzing a combination of three IPCs, the selection of the analysis mode selection unit 503 is switched to “IPC × 3 cases”. In the example of FIG. 26, among the patent publications extracted in S306, there are five cases in which three IPCs “G06F17 / 30”, “G06F15 / 40”, and “G06T1 / 00” are attached. This indicates that there are four cases where three of “G0617 / 30”, “G06F17 / 21” and “G06F15 / 20” are attached.

上述した表示態様選択部501の切り換え処理と同様、解析態様選択部503の切り換え処理も、クライアント装置2において実行される処理である。従って、情報検索装置1は、クライアント装置2において解析態様選択部503が切り換えられたことを示す情報(以降、解析態様切換指示情報とする)をネットワークI/F120を介してクライアント装置2から受信する。   Similar to the switching process of the display mode selection unit 501 described above, the switching process of the analysis mode selection unit 503 is also a process executed in the client device 2. Therefore, the information search device 1 receives information indicating that the analysis mode selection unit 503 has been switched in the client device 2 (hereinafter referred to as analysis mode switching instruction information) from the client device 2 via the network I / F 120. .

ネットワークI/F120が受信した解析態様切換指示情報は、ネットワークI/F120から検索制御部100に入力され、抽出結果処理部104が取得する。これにより、抽出結果処理部104が指定された解析態様に従って抽出結果の解析を実行する。図23、図26及び図27に示す態様においては、解析態様選択部503の切り換えによって切り換えられるのは、抽出結果を解析する際に参照するIPCの数である。例えば、解析態様選択部503において“IPC×2件数”が選択されれば、抽出結果を解析するIPCの組み合わせとして2つのIPCの組み合わせが付与された低号文献をカウントすることが指示される。即ち、図26、図27の態様においては、解析態様切換指示情報は、付加情報の数を指定する付加情報数指定情報として用いられる。即ち、抽出結果処理部104が付加情報数指定情報取得部として機能する。付加情報数指定情報取得部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。   The analysis mode switching instruction information received by the network I / F 120 is input from the network I / F 120 to the search control unit 100 and acquired by the extraction result processing unit 104. As a result, the extraction result processing unit 104 analyzes the extraction result in accordance with the designated analysis mode. In the modes shown in FIGS. 23, 26, and 27, the number of IPCs that are referred to when analyzing the extraction result is switched by switching the analysis mode selection unit 503. For example, if “IPC × 2 cases” is selected in the analysis mode selection unit 503, it is instructed to count low-numbered documents to which a combination of two IPCs is assigned as an IPC combination for analyzing the extraction result. That is, in the modes of FIGS. 26 and 27, the analysis mode switching instruction information is used as additional information number designation information for designating the number of additional information. That is, the extraction result processing unit 104 functions as an additional information number designation information acquisition unit. The additional information number designation information acquisition unit is configured by a program loaded in the RAM 20 shown in FIG.

次に、図26若しくは図27に示す抽出結果表示画面500を生成する処理について説明する。図28は、図26に示すように、解析態様選択部503の選択状態が“IPC×2件数”である場合において、抽出結果表示画面500を生成する処理を示すフローチャートである。抽出結果処理部104は、上述した表示態様切換指示情報を受信すると、適合文献として抽出された文献に付された全てのIPC2つの組み合わせを抽出する(S2801)。図29に、S2801の処理の結果生成される情報を示す。図29に示すように、S2801においては、適合文献に付された全てのIPC2つの組み合わせが列挙される。   Next, processing for generating the extraction result display screen 500 shown in FIG. 26 or 27 will be described. FIG. 28 is a flowchart showing processing for generating the extraction result display screen 500 when the selection state of the analysis mode selection unit 503 is “IPC × 2 cases” as shown in FIG. When the extraction result processing unit 104 receives the display mode switching instruction information described above, the extraction result processing unit 104 extracts all combinations of two IPCs attached to documents extracted as relevant documents (S2801). FIG. 29 shows information generated as a result of the processing of S2801. As shown in FIG. 29, in S2801, a combination of all two IPCs assigned to relevant documents is listed.

適合文献に付されたIPC2つの組み合わせの抽出が完了すると、抽出結果処理部104は、抽出されたIPCの組み合わせうちの1つを参照する(S2802)。そして、適合文献として抽出された文献のうち、参照中のIPCの組み合わせが付されている適合文献の数をカウントする(S2803)。抽出結果処理部104は、S2802及びS2803の処理を、S2801において抽出された全IPCの組み合わせについて完了するまで繰り返し(S2804/NO)、全IPCについて完了したら(S2804/YES)、各IPCの組み合わせ毎のカウント数を表示するための表示情報を生成して(S2805)、処理を終了する。このような処理により、図26に示す画面を表示するための情報が生成される。   When the extraction of the two combinations of IPCs attached to the relevant documents is completed, the extraction result processing unit 104 refers to one of the extracted combinations of IPCs (S2802). Then, among the documents extracted as the relevant documents, the number of the relevant documents to which the combination of the IPC being referred is attached is counted (S2803). The extraction result processing unit 104 repeats the processing of S2802 and S2803 until completion for all combinations of IPCs extracted in S2801 (S2804 / NO), and when all IPCs are completed (S2804 / YES), for each combination of IPCs Display information for displaying the count number is generated (S2805), and the process ends. Through such processing, information for displaying the screen shown in FIG. 26 is generated.

このように、夫々のIPC毎に夫々の特許公報に含まれる数を集計して件数を表示することに加え、複数のIPCの組み合わせ毎に夫々の特許公報に含まれる数を集計して表示することにより、ユーザによる抽出結果解析においてより有効な情報表示を行なうことが可能となる。また、上記の説明においては、2つのIPCの組み合わせ及び3つのIPCの組み合わせについての場合を例として示したが、4つ以上であっても同様に適用可能である。   In this way, in addition to counting the numbers included in each patent gazette for each IPC and displaying the number of cases, the numbers included in each patent gazette are totaled and displayed for each combination of a plurality of IPCs. Thus, more effective information display can be performed in the extraction result analysis by the user. In the above description, the case of a combination of two IPCs and a combination of three IPCs is shown as an example, but the present invention can be similarly applied even when there are four or more.

図23、図26、図27においては、夫々のIPCの表示順として、夫々のIPCを含む特許公報の件数順に表示する例を説明した。このような表示としては、書誌情報の傾向を把握するためには有効である。しかしながら、解析対象の書誌情報によっては、他の並び順が有効である場合もあり得る。以下、抽出結果処理部104による解析結果の表示態様についての他の例を説明する。   In FIG. 23, FIG. 26, and FIG. 27, the example which displayed as the display order of each IPC in order of the number of patent publications containing each IPC was demonstrated. Such a display is effective for grasping the tendency of bibliographic information. However, depending on the bibliographic information to be analyzed, other arrangement orders may be effective. Hereinafter, another example of the display mode of the analysis result by the extraction result processing unit 104 will be described.

図30は、図23に示す解析結果の並び順をIPCの種類順に変更した例を示す抽出結果表示画面500を示す図である。IPC、FI等、文献の内容種別を示す情報は、類似する内容順に構成されている場合がある。そのような場合、抽出結果処理部104による解析結果を、IPCの種類に従って表示することにより、適合文献として抽出された特許公報において、類似する技術が含まれる傾向を容易に把握することが可能となる。   FIG. 30 is a diagram showing an extraction result display screen 500 showing an example in which the arrangement order of the analysis results shown in FIG. 23 is changed to the IPC type order. Information indicating the content type of a document, such as IPC and FI, may be configured in the order of similar content. In such a case, by displaying the analysis result by the extraction result processing unit 104 according to the type of IPC, it is possible to easily grasp the tendency that similar techniques are included in patent gazettes extracted as relevant documents. Become.

図31は、特許公報が有する書誌情報のうち、出願年に基づいて抽出結果を解析し、夫々の特許公報の出願年を集計して表示した状態を示す図である。図31の例においては、夫々の出願年における特許公報の件数ではなく、出願年に従って情報が並べられている。これにより、検索対象の技術に対する出願件数の経年的な傾向を容易に把握することが可能となる。尚、図31に示すのは出願年に基づいて抽出結果を解析した例であるが、出願年月若しくは出願年月日においても同様に適用可能である。また、公開年、公開年月若しくは公開年月日についても同様に適用可能である。   FIG. 31 is a diagram showing a state in which the extraction result is analyzed based on the application year among the bibliographic information included in the patent publication, and the application years of the respective patent publications are tabulated and displayed. In the example of FIG. 31, information is arranged according to the application year, not the number of patent publications in each application year. Thereby, it becomes possible to easily grasp the secular trend of the number of applications for the search target technology. FIG. 31 shows an example in which the extraction result is analyzed based on the application year, but the present invention can be similarly applied to the application date or the application date. The same applies to the release year, release date, or release date.

図23から図30に示す画面への切り換えに際しては、ユーザがクライアント装置2を操作してソートの基準となる項目を示す情報(以降、並べ替え条件情報とする)を指定する。情報検索装置1は、並べ替え条件情報をネットワークI/F120を介してクライアント装置2から受信する。ネットワークI/F120が受信した並べ替え条件情報は、ネットワークI/F120から検索制御部100に入力され、抽出結果処理部104が取得する。抽出結果処理部104は、取得した並べ替え条件情報に基づいて、ソート後の抽出結果表示画面500を表示するための情報を生成する。   When switching from the screen shown in FIG. 23 to the screen shown in FIG. 30, the user operates the client device 2 to specify information (hereinafter referred to as rearrangement condition information) indicating items to be used as sorting criteria. The information search device 1 receives the rearrangement condition information from the client device 2 via the network I / F 120. The rearrangement condition information received by the network I / F 120 is input from the network I / F 120 to the search control unit 100 and acquired by the extraction result processing unit 104. The extraction result processing unit 104 generates information for displaying the sorted extraction result display screen 500 based on the acquired sorting condition information.

次に、図30若しくは図31に示す態様のように、ソートを実行する処理について図32を参照して説明する。図32は、図31に示すように、出願年に基づいてソートを実行する際のソート切換動作を示すフローチャートである。抽出結果処理部104は、先ず並べ替え条件情報を取得する(S3201)。そして、取得した並べ替え条件情報から出願年に基づいてソートを実行することを認識すると、各出願年毎のカウント結果項目のうち、出願年が最も若い項目を取得し(S3202)、取得した項目を表示するための表示情報を生成する(S3203)。S3202及びS3203の処理によって取得された項目は、以降の処理において取得対象には含めない。抽出結果処理部104は、S3402及びS3403の処理を、解析結果として生成された全項目、即ち、全出願年について完了するまで繰り返し(S3204/NO)、全項目について完了したら(S3204/YES)、処理を終了する。このような処理により、図31に示す画面を表示するための情報が生成される。   Next, processing for executing sorting as in the mode shown in FIG. 30 or 31 will be described with reference to FIG. FIG. 32 is a flowchart showing the sort switching operation when sorting is performed based on the application year as shown in FIG. The extraction result processing unit 104 first acquires rearrangement condition information (S3201). And if it recognizes performing sorting based on the application year from the acquired sort condition information, the item with the youngest application year is acquired from the count result items for each application year (S3202), and the acquired item Display information for displaying is generated (S3203). Items acquired by the processing of S3202 and S3203 are not included in the acquisition target in the subsequent processing. The extraction result processing unit 104 repeats the processes of S3402 and S3403 until all items generated as analysis results, that is, all application years are completed (S3204 / NO), and when all items are completed (S3204 / YES), The process ends. By such processing, information for displaying the screen shown in FIG. 31 is generated.

図30、図31に示した例に限らず、解析対象となる書誌情報の性質に基づいて並べ替えることにより、ユーザによる情報解析を容易化する表示を行なうことができる。例えば、図22に示す書誌情報のうち、出願人、代理人若しくは発明者について解析を行なう場合、例えば50音順、イニシャル順等の表示が可能である。また、上述した通り、出願人、代理人若しくは発明者は複数含まれる場合があり得るため、図26及び図27において説明したような組み合わせによる解析が可能である。   In addition to the examples shown in FIGS. 30 and 31, display that facilitates information analysis by the user can be performed by rearranging based on the properties of the bibliographic information to be analyzed. For example, when bibliographic information shown in FIG. 22 is analyzed for the applicant, the agent, or the inventor, for example, the order of the Japanese syllabary or the initial order can be displayed. Further, as described above, since there may be a plurality of applicants, agents, or inventors, it is possible to analyze by a combination as described with reference to FIGS.

以上説明したように、本実施形態に係る情報検索装置により、検索対象の情報にその情報の内容に応じた分類情報が付されている場合において、付されている分類情報に基づいた検索結果表示の態様を、図26、図27に示すようにユーザの理解を助けるより有効な態様とすることが可能となる。   As described above, when the information search device according to the present embodiment has the classification information corresponding to the content of the information to be searched, the search result display based on the attached classification information. As shown in FIGS. 26 and 27, this mode can be a more effective mode that helps the user to understand.

また、本実施形態に係る情報検索装置により、検索条件に適合するものとして抽出された情報の一覧表示において、図30、図31に示すようにユーザの理解を助けるように表示順序の設定が可能となる。   In addition, in the information display apparatus according to the present embodiment, in the list display of information extracted as meeting the search condition, the display order can be set to help the user's understanding as shown in FIGS. It becomes.

尚、上記実施の形態1から3は、文献情報として公開特許公報を検索する場合の例であるが、例えば、図書館等の蔵書を検索する場合にも適用可能である。その場合、上記の説明におけるIPC等の分類情報は日本十進分類法の分類番号等、図書を分類する情報となる。   The first to third embodiments described above are examples of searching for a published patent gazette as document information, but can also be applied to searching for a collection such as a library. In that case, the classification information such as IPC in the above description is information for classifying the book, such as the classification number of the Japanese decimal classification method.

また、上記実施の形態1から3の説明においては、文献情報DB200が情報検索装置1とは別に設けられているが、文献情報DB200を情報検索装置1内部の記憶領域に構成することも可能である。また、上記の説明においては、情報検索装置1と文献情報DB200とが図3に示すように直接接続されている例を説明したが、例えば、ネットワークI/F120を介して、ネットワークにより接続されていても良い。   In the description of the first to third embodiments, the document information DB 200 is provided separately from the information search device 1, but the document information DB 200 can be configured in a storage area inside the information search device 1. is there. In the above description, the example in which the information search apparatus 1 and the document information DB 200 are directly connected as illustrated in FIG. 3 has been described. However, for example, the information search apparatus 1 and the document information DB 200 are connected by a network via the network I / F 120. May be.

同様に、上記の説明においては、辞書情報DB140が情報検索装置1内部に設けられている例を説明した。この他、辞書情報DB140を情報検索装置1とは別の装置、例えば、ネットワークに接続されたサーバとして構成しても良い。この場合、情報検索装置1は、ネットワークI/F120を介して辞書情報DB140にアクセスし、上述した類義語の検索を行なう。   Similarly, in the above description, the example in which the dictionary information DB 140 is provided in the information search apparatus 1 has been described. In addition, the dictionary information DB 140 may be configured as a device different from the information search device 1, for example, a server connected to a network. In this case, the information search device 1 accesses the dictionary information DB 140 via the network I / F 120 and searches for the synonyms described above.

また、上記の説明においては、ユーザがクライアント装置2を操作し、ネットワークを介してサーバとして機能する情報検索装置1の機能を利用する例を説明した。この他、図3に示す情報入力部110及び表示部130を用いて、ユーザが情報検索装置1を直接操作することも可能である。これによっても、上記と同様の効果を得ることが可能である。また、上記説明した各機能の一部をクライアント装置2において実行することも可能である。また、上記の説明においては、検索制御部100の機能を一の情報検索装置1において実現する例を説明したが、複数のサーバが連動して上記情報検索装置1の機能を実現することも可能である。   In the above description, an example in which the user operates the client device 2 and uses the function of the information search device 1 that functions as a server via the network has been described. In addition, it is also possible for the user to directly operate the information search device 1 using the information input unit 110 and the display unit 130 shown in FIG. Also by this, it is possible to obtain the same effect as described above. It is also possible for the client device 2 to execute some of the functions described above. In the above description, the example in which the function of the search control unit 100 is realized in one information search apparatus 1 has been described. However, the function of the information search apparatus 1 can be realized in cooperation with a plurality of servers. It is.

本発明の実施形態に係る情報検索システムの運用形態を示す図である。It is a figure which shows the operation | use form of the information search system which concerns on embodiment of this invention. 本発明の実施形態に係る情報検索装置のハードウェア構成を模式的に示すブロック図である。It is a block diagram which shows typically the hardware constitutions of the information search device which concerns on embodiment of this invention. 本発明の実施形態に係る情報検索装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the information search device which concerns on embodiment of this invention. 本発明の実施形態に係る情報検索装置の動作を示すシーケンス図である。It is a sequence diagram which shows operation | movement of the information search device which concerns on embodiment of this invention. 本発明の実施形態に係る情報検索装置の検索条件指定画面の表示例を示す図である。It is a figure which shows the example of a display of the search condition designation | designated screen of the information search device which concerns on embodiment of this invention. 本発明の実施形態に係る情報検索装置の抽出条件表示情報生成動作を示す図である。It is a figure which shows the extraction condition display information generation operation | movement of the information search device which concerns on embodiment of this invention. 本発明の実施形態に係る情報検索装置の検索語特定態様を示す図である。It is a figure which shows the search term specific aspect of the information search device which concerns on embodiment of this invention. 本発明の実施形態に係る情報検索装置の抽出条件情報表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction condition information display screen of the information search device which concerns on embodiment of this invention. 本発明の実施形態に係る情報検索装置の検索過程において生成される情報を示す図である。It is a figure which shows the information produced | generated in the search process of the information search device which concerns on embodiment of this invention. 本発明の実施形態に係る情報検索装置の検索過程における動作を示すフローチャートである。It is a flowchart which shows the operation | movement in the search process of the information search device which concerns on embodiment of this invention. 本発明の実施形態に係る情報検索装置の検索過程における情報処理態様を示す図である。It is a figure which shows the information processing aspect in the search process of the information search device which concerns on embodiment of this invention. 本発明の実施形態に係る情報検索装置の抽出結果表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction result display screen of the information search device which concerns on embodiment of this invention. 本発明の実施形態に係る情報検索装置の抽出結果表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction result display screen of the information search device which concerns on embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出条件情報表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction condition information display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出条件情報表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction condition information display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出条件情報表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction condition information display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の検索語ヒット箇所表示画面を示す図である。It is a figure which shows the search word hit location display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction result display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction result display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction result display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction result display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の検索対象に含まれる書誌情報の例を示す図である。It is a figure which shows the example of the bibliographic information contained in the search object of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction result display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果解析動作を示すフローチャートである。It is a flowchart which shows the extraction result analysis operation | movement of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果解析動作において生成される情報を示す図である。It is a figure which shows the information produced | generated in the extraction result analysis operation | movement of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction result display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction result display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果解析動作を示すフローチャートである。It is a flowchart which shows the extraction result analysis operation | movement of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果解析動作において生成される情報を示す図である。It is a figure which shows the information produced | generated in the extraction result analysis operation | movement of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction result display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の抽出結果表示画面の表示例を示す図である。It is a figure which shows the example of a display of the extraction result display screen of the information search device which concerns on other embodiment of this invention. 本発明の他の実施形態に係る情報検索装置の情報並べ替え動作を示すフローチャートである。It is a flowchart which shows the information rearrangement operation | movement of the information search device which concerns on other embodiment of this invention.

符号の説明Explanation of symbols

1 情報検索装置
2 クライアント装置
10 CPU
20 RAM
30 ROM
40 HDD
50 I/F
60 LCD
70 操作部
80 バス
100 検索制御部
101 指定条件情報取得部
102 指定条件情報解析部
103 文献情報抽出部
104 抽出結果処理部
110 情報入力部
120 ネットワークI/F
130 表示部
140 辞書情報DB
200 文献情報DB
300 検索条件指定画面
301 検索対象指定部
302 検索条件指定部
303 検索条件入力部
400 抽出条件情報表示画面
401 検索語表示部
402 辞書展開指示部
403 検索実行指示部
500 抽出結果表示画面
501 表示態様選択部
502 抽出結果表示部
521 ソート指示部
522 検索語ヒット箇所表示指示部
600 検索語ヒット箇所表示画面
601 前後文表示部
602 ヒット箇所表示部
1 Information Retrieval Device 2 Client Device 10 CPU
20 RAM
30 ROM
40 HDD
50 I / F
60 LCD
70 Operation Unit 80 Bus 100 Search Control Unit 101 Designated Condition Information Acquisition Unit 102 Designated Condition Information Analysis Unit 103 Reference Information Extraction Unit 104 Extraction Result Processing Unit 110 Information Input Unit 120 Network I / F
130 Display unit 140 Dictionary information DB
200 Literature Information DB
DESCRIPTION OF SYMBOLS 300 Search condition designation | designated screen 301 Search object designation | designated part 302 Search condition designation | designated part 303 Search condition input part 400 Extraction condition information display screen 401 Search term display part 402 Dictionary expansion | deployment instruction | indication part 403 Search execution instruction part 500 Extraction result display screen 501 Display mode selection Section 502 Extraction result display section 521 Sort instruction section 522 Search word hit location display instruction section 600 Search word hit location display screen 601 Pre and post sentence display portion 602 Hit location display section

Claims (11)

指定された条件に関する指定条件情報を取得する指定条件情報取得部と、
前記指定条件情報に基づいて複数の適合情報を抽出する情報抽出部と、
前記複数の適合情報に関する情報を表示させるための適合情報表示情報を生成する適合情報表示情報生成部とを有し、
前記指定条件情報は、複数の異なる単位条件を含み、
前記適合情報表示情報生成部は、
前記複数の適合情報及び前記複数の異なる単位条件のうち一方を行とし、他方を列とするマトリクスを構成し、
前記適合情報で、前記指定条件情報に含まれる複数の異なる単位条件が用いられる回数を示す充足度に関する情報を、前記マトリクスのセルに表示させるように前記適合情報表示情報を生成し、
前記充足度が大きい前記単位条件を、前記抽出された複数の適合情報を構成する行又は列の近傍に表示させる
ことを特徴とする、情報検索装置。
A specified condition information acquisition unit for acquiring specified condition information related to a specified condition;
An information extraction unit that extracts a plurality of pieces of matching information based on the specified condition information;
A fitness information display information generating unit that generates fitness information display information for displaying information on the plurality of fitness information;
The specified condition information includes a plurality of different unit conditions,
The conformity information display information generation unit
A matrix having one of the plurality of conforming information and the plurality of different unit conditions as a row and the other as a column,
In the conformance information, the conformity information display information is generated so as to display information on the sufficiency indicating the number of times a plurality of different unit conditions included in the designated condition information are used, in the matrix cell,
The information search apparatus, wherein the unit condition having a high degree of satisfaction is displayed in the vicinity of a row or a column constituting the extracted plurality of pieces of matching information.
前記充足度は、前記指定条件情報に含まれる複数の異なる単位条件及び当該単位条件の類義語情報が用いられる回数を示すことを特徴とする請求項1に記載の情報検索装置。   The information search device according to claim 1, wherein the sufficiency indicates a number of times a plurality of different unit conditions included in the specified condition information and synonym information of the unit conditions are used. 前記複数の異なる単位条件のうちいずれか1つ若しくは複数を指定する単位条件指定情報を取得する単位条件指定情報取得部を有し、
前記適合情報表示情報生成部は、前記単位条件指定情報において指定されている単位条件の充足度に基づいて前記抽出された複数の適合情報の表示順を決定するように前記適合情報表示情報を生成することを特徴とする、請求項1または2に記載の情報検索装置。
A unit condition specifying information acquisition unit for acquiring unit condition specifying information for specifying any one or a plurality of different unit conditions;
The conformity information display information generating unit generates the conformity information display information so as to determine a display order of the plurality of extracted conformance information based on a degree of satisfaction of the unit condition specified in the unit condition specifying information. The information search device according to claim 1, wherein the information search device is an information search device.
ユーザによる操作情報を取得する操作情報取得部を有し、
前記単位条件指定情報取得部は、前記単位条件が表示された表示領域に対するユーザの操作に基づき、前記表示領域に表示されている単位条件を指定する情報として前記単位条件指定情報を取得することを特徴とする、請求項3に記載の情報検索装置。
It has an operation information acquisition unit that acquires operation information by the user,
The unit condition specifying information acquisition unit acquires the unit condition specifying information as information for specifying the unit condition displayed in the display area based on a user operation on the display area in which the unit condition is displayed. The information search apparatus according to claim 3, wherein the information search apparatus is characterized.
前記適合情報表示情報生成部は、前記マトリクスにおいて、前記指定された単位条件を他の単位条件とは異なる態様で表示するように前記適合情報表示情報を生成することを特徴とする、請求項3または4に記載の情報検索装置。   The compatibility information display information generation unit generates the compatibility information display information so as to display the specified unit condition in a manner different from other unit conditions in the matrix. Or the information search device of 4. 複数の単位条件を単位条件群として指定する単位条件群指定情報を取得する単位条件群指定情報取得部を有し、
前記適合情報表示情報生成部は、前記抽出された複数の適合情報及び前記構成された単位条件群のうち一方を行とし、他方を列とするマトリクスを構成し、前記マトリクスにおける各セルに、当該セルが対応する前記適合情報における当該セルが対応する前記単位条件群の充足度に関する情報を表示するように前記適合情報表示情報を生成することを特徴とする、請求項1乃至5いずれか1項に記載の情報検索装置。
A unit condition group designation information acquisition unit for acquiring unit condition group designation information for designating a plurality of unit conditions as a unit condition group,
The conformity information display information generation unit configures a matrix in which one of the extracted conformance information and the configured unit condition group is a row and the other is a column, and each cell in the matrix 6. The adaptation information display information is generated so as to display information on a degree of satisfaction of the unit condition group to which the cell corresponds in the adaptation information to which the cell corresponds. The information search device described in 1.
前記情報抽出部は、前記指定条件情報に含まれる文言の類義語に関する類義語情報を取得して前記文言及び前記類義語の夫々を前記単位条件として前記適合情報を抽出し、
前記単位条件群指定情報は、前記文言及び当該文言の類義語を前記単位条件群として指定する情報を含むことを特徴とする、請求項6に記載の情報検索装置。
The information extraction unit acquires synonym information related to a synonym of a word included in the specified condition information and extracts the matching information using each of the word and the synonym as the unit condition,
The information search apparatus according to claim 6, wherein the unit condition group designation information includes information for designating the word and a synonym of the word as the unit condition group.
前記適合情報表示情報生成部は、前記適合情報を列とし、前記単位条件を行としてマトリクスを構成し、前記適合情報表示情報を生成することを特徴とする、請求項1乃至7いずれか1項に記載の情報検索装置。   8. The compliance information display information generation unit generates the compliance information display information by forming a matrix with the compliance information as a column and the unit condition as a row, and generating the compliance information display information. The information search device described in 1. ユーザによる操作情報を取得する操作情報取得部を有し、
前記適合情報表示情報生成部は、前記適合情報及び前記単位条件のうち前記マトリクスにおいて列とするものを前記取得した操作情報に応じて決定することを特徴とする、請求項1乃至8いずれか1項に記載の情報検索装置。
It has an operation information acquisition unit that acquires operation information by the user,
The compliance information display information generation unit determines, in accordance with the acquired operation information, a column of the matrix among the compliance information and the unit condition. The information search device according to item.
情報検索装置における情報検索方法であって、
前記情報検索装置が、指定条件情報取得部と、情報抽出部と、適合情報表示情報生成部とを有し、
前記指定条件情報取得部が、指定された条件に関する情報であって複数の異なる単位条件を含む指定条件情報を取得し、
前記情報抽出部が、前記指定条件情報に基づいて複数の適合情報を抽出し、
適合情報表示情報生成部が、前記複数の適合情報に関する情報を表示させるための適合情報表示情報を生成するものであって、前記複数の適合情報及び前記複数の異なる単位条件のうち一方を行とし、他方を列とするマトリクスを構成し、前記適合情報で、前記指定条件情報に含まれる複数の異なる単位条件が用いられる回数を示す充足度に関する情報を前記マトリクスのセルに表示させるように前記適合情報表示情報を生成し、前記充足度が大きい前記単位条件を、前記抽出された複数の適合情報を構成する行又は列の近傍に表示させる
ことを特徴とする、情報検索方法。
An information search method in an information search apparatus,
The information search device includes a specified condition information acquisition unit, an information extraction unit, and a matching information display information generation unit,
The specified condition information acquisition unit acquires specified condition information that is information related to the specified condition and includes a plurality of different unit conditions,
The information extraction unit extracts a plurality of pieces of matching information based on the specified condition information;
The conformity information display information generating unit generates conformity information display information for displaying information on the plurality of conformance information, and one of the plurality of conformance information and the plurality of different unit conditions is set as a row. Forming a matrix with the other as a column, and the conforming information to display information on the degree of satisfaction indicating the number of times a plurality of different unit conditions included in the specified condition information are used in the cells of the matrix An information search method, comprising: generating information display information, and displaying the unit condition having a high degree of sufficiency in the vicinity of a row or a column constituting the plurality of extracted pieces of matching information.
請求項10に記載の情報検索方法を情報処理装置に実行させることを特徴とする制御プログラム。   A control program for causing an information processing apparatus to execute the information search method according to claim 10.
JP2008093635A 2008-03-31 2008-03-31 Information retrieval apparatus, information retrieval method, and control program Expired - Fee Related JP5347307B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008093635A JP5347307B2 (en) 2008-03-31 2008-03-31 Information retrieval apparatus, information retrieval method, and control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008093635A JP5347307B2 (en) 2008-03-31 2008-03-31 Information retrieval apparatus, information retrieval method, and control program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008004864A Division JP5309570B2 (en) 2008-01-11 2008-01-11 Information retrieval apparatus, information retrieval method, and control program

Publications (2)

Publication Number Publication Date
JP2009169926A JP2009169926A (en) 2009-07-30
JP5347307B2 true JP5347307B2 (en) 2013-11-20

Family

ID=40970975

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008093635A Expired - Fee Related JP5347307B2 (en) 2008-03-31 2008-03-31 Information retrieval apparatus, information retrieval method, and control program

Country Status (1)

Country Link
JP (1) JP5347307B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009252185A (en) 2008-04-10 2009-10-29 Ricoh Co Ltd Information searching device, information searching method, control program, and recording medium
JPWO2020079751A1 (en) * 2018-10-16 2021-10-28 株式会社島津製作所 Literature search method and literature search system
US20240004936A1 (en) * 2020-12-10 2024-01-04 Semiconductor Energy Laboratory Co., Ltd. Document search system and method for outputting document search result

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005011301A (en) * 2003-06-20 2005-01-13 Takaaki Yamaoka Document processor and document processing program
JP2006127523A (en) * 2005-10-27 2006-05-18 Hitachi Ltd Document information display system
JP4719921B2 (en) * 2005-11-15 2011-07-06 独立行政法人情報通信研究機構 Data display device and data display program

Also Published As

Publication number Publication date
JP2009169926A (en) 2009-07-30

Similar Documents

Publication Publication Date Title
JP5309570B2 (en) Information retrieval apparatus, information retrieval method, and control program
JP4583003B2 (en) Search processing method and program
US20050154690A1 (en) Document knowledge management apparatus and method
US20120078979A1 (en) Method for advanced patent search and analysis
JPWO2007032095A1 (en) Document data management method, management system, and computer software
Bailey et al. GAIA: framework annotation of genomic sequence
Moreland et al. The Mnemiopsis Genome Project Portal: integrating new gene expression resources and improving data visualization
CN109478191B (en) Text mining method, recording medium, and text mining device
JP5347307B2 (en) Information retrieval apparatus, information retrieval method, and control program
KR100869545B1 (en) Repetition search system with search history
KR101045977B1 (en) Record media storing citation information analysis method and patent program for patent information analysis
CN111859091A (en) Search result aggregation method and device based on artificial intelligence
KR101035037B1 (en) Apparatus and method for clustering documents using dynamic threshold
JP2014102625A (en) Information retrieval system, program, and method
JP4640861B2 (en) Search processing method and program
JP2005128872A (en) Document retrieving system and document retrieving program
JP2009169927A (en) Information retrieval device, information retrieval method, and control program
JP6394213B2 (en) Search program, search method, and information processing apparatus
JP4713098B2 (en) Selection item display device, selection item display method, and selection item display program
Marygold et al. Exploring FlyBase data using QuickSearch
JP2009032180A (en) Text mining apparatus and text mining method
JP2009271671A (en) Information processor, information processing method, program, and recording medium
JP4446715B2 (en) Document search device, document search method, and document search program
JPWO2004104859A1 (en) Theme analysis apparatus, theme analysis method, and theme analysis program for causing computer to execute the method
Miller et al. Cluster-based find and replace

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101126

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20101126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130805

R151 Written notification of patent or utility model registration

Ref document number: 5347307

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees