JPH08272806A - Data base retrieval system - Google Patents

Data base retrieval system

Info

Publication number
JPH08272806A
JPH08272806A JP7077839A JP7783995A JPH08272806A JP H08272806 A JPH08272806 A JP H08272806A JP 7077839 A JP7077839 A JP 7077839A JP 7783995 A JP7783995 A JP 7783995A JP H08272806 A JPH08272806 A JP H08272806A
Authority
JP
Japan
Prior art keywords
search
retrieval
expression
database
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7077839A
Other languages
Japanese (ja)
Inventor
Shinya Nakamoto
伸也 中本
Yuji Enzaki
雄司 圓崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP7077839A priority Critical patent/JPH08272806A/en
Publication of JPH08272806A publication Critical patent/JPH08272806A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE: To automatically judge the conditions of a retrieval formula inputted by a retrieving person, to utilize the merits of various retrieval methods and to perform efficient retrieval in a data base retrieval system capable of executing the plural retrieval methods. CONSTITUTION: As a retrieval means for retrieving a data base inside a data base storage part 11, for instance, an index retrieval means 13 and an entire sentence retrieval means 14 are provided. Then, this system is provided with an input means 15 for inputting the retrieval formula, a division means 21 for dividing the retrieval formula into monomials, an allocation means 32 for allocating the monomials obtained in the division means 21 respectively to the index retrieval means 13 or the entire sentence retrieval means 14 as retrieval keys and an arithmetic means 33 for performing a logic operation based on the retrieval formula for a retrieved result from the index retrieval means 13 and the entire sentence retrieval means 14 and performing output to a display means 16 as the retrieved result corresponding to the retrieval formula.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文献データベースなど
を検索するためのデータベース検索システムに関し、特
に、異なる検索方法による複数の検索エンジンが同一装
置上に実装されたデータベース検索システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a database search system for searching a document database or the like, and more particularly to a database search system in which a plurality of search engines by different search methods are mounted on the same device.

【0002】[0002]

【従来の技術】データベース検索システムは、検索キー
ワードあるいはそれらを組み合せた検索式を用いること
により、大量の情報の中から検索者が必要とする情報を
選択するものである。典型的には、特許公報類や学術論
文、新聞記事などの極めて多数の文献を1次情報として
文献データベースに格納しておき、検索者の入力した検
索式の条件に該当する文献をこの文献データベースの中
から見つけ出すシステムとして構築される。データベー
ス検索システムで検出する情報にはさまざまなものがあ
り、また検索方法にも、ファイル管理方法やアルゴリズ
ムによって、検索速度を重視したものや検索精度を重視
したものなどいくつかのものがあって、それぞれ長所短
所を持っている。
2. Description of the Related Art A database search system selects information required by a searcher from a large amount of information by using a search keyword or a search expression combining them. Typically, an extremely large number of documents such as patent gazettes, academic papers, newspaper articles, etc. are stored as primary information in a document database, and documents corresponding to the search formula conditions entered by the searcher are stored in this document database. It is built as a system to find out from inside. There are various kinds of information detected by the database search system, and there are some search methods, such as those that emphasize search speed and search accuracy, depending on the file management method and algorithm. Each has its strengths and weaknesses.

【0003】このような検索方法として、例えば、イン
デックス検索方法と、全文検索方法とがある。インデッ
クス検索方法は、1次情報からその書誌的情報や付与さ
れた分類等を抽出して2次情報とし、2次情報を再編成
してインデックス(索引)を設け、入力された検索キー
ワードに該当するものがインデックス中にあるかを検出
し、その結果によって元の1次情報にアクセスしようと
する方法である。この方法は、インデックス内のみを検
索すればよいので、多数の文献を対象として高速に検索
を実行するのに適しているが、インデックスにない項目
についての検索を行なうことはできない。一方、全文検
索方法は、1次情報のファイル全体を検索し、検索キー
ワードに該当する文字列を含む文献を見つけ出そうとす
る方法である。全文検索方法は、任意の検索キーワード
を使用することが可能であり、詳細な検索を実行できる
が、1次情報のファイル全体を検索対象とするため、検
索対象範囲が広い場合にコンピュータ資源を多量に消費
するという欠点を有する。
Examples of such a search method include an index search method and a full-text search method. The index search method is to extract the bibliographical information and assigned classifications from the primary information to make it secondary information, and reorganize the secondary information to provide an index, which corresponds to the input search keyword. This is a method of detecting whether or not there is something to do in the index, and trying to access the original primary information according to the result. Since this method only needs to search the index, it is suitable for performing a high-speed search for a large number of documents, but it cannot search for items that are not in the index. On the other hand, the full-text search method is a method in which an entire file of primary information is searched to find a document including a character string corresponding to a search keyword. The full-text search method can use any search keyword and can perform a detailed search. However, since the entire primary information file is the search target, a large amount of computer resources is required when the search target range is wide. It has the drawback of consuming too much.

【0004】また、データベース検索システムには、相
互に検索方法が異なる複数の検索エンジン(検索手段)
を備えたものがある。このようなデータベース検索シス
テムでは、検索条件に応じていずれかの検索方法を選択
して検索を実行する。
Further, the database search system includes a plurality of search engines (search means) which have different search methods.
There are some with. In such a database search system, one of the search methods is selected according to the search condition to execute the search.

【0005】[0005]

【発明が解決しようとする課題】上述した従来のデータ
ベース検索システムでは、複数の検索方法の実行が可能
な場合であっても、個々の検索式に対する検索処理はい
ずれか1つの検索方法を選択して行なわれるので、その
検索方法に特有の欠点の影響を強く受けてしまうという
問題点がある。例えば、インデックス検索と全文検索の
両方が可能なデータベース検索システムを用いる場合で
あれば、これらの方法のうちのいずれか一方で検索を行
なうので、広範囲を詳細に検索しようとすると、詳細さ
を犠牲にするか(インデックス検索の場合)あるいはコ
ンピュータ資源を多量に消費する(全文検索)ことにな
る。
In the above-mentioned conventional database search system, even when a plurality of search methods can be executed, any one search method is selected for the search process for each search expression. However, there is a problem that it is strongly affected by the drawbacks peculiar to the search method. For example, if you use a database search system that can perform both index search and full-text search, one of these methods is used for searching, so if you try to search a wide area in detail, you will sacrifice the detail. Either (in the case of index search) or consume a large amount of computer resources (full-text search).

【0006】本発明の目的は、複数の検索方法の実行が
可能なデータベース検索システムにおいて、検索者が入
力した検索式の条件を自動判断し、各々の検索方法の長
所を利用して効率的な検索を行なうことができるデータ
ベース検索システムを提供することにある。
It is an object of the present invention to automatically determine the conditions of a search expression input by a searcher in a database search system capable of executing a plurality of search methods and utilize the advantages of each search method to achieve efficient It is to provide a database search system capable of performing a search.

【0007】[0007]

【課題を解決するための手段】本発明の第1のデータベ
ース検索システムは、検索式を入力する入力手段と、前
記検索式を単項式に分割する分割手段と、異なる検索方
法によってデータベースを検索する複数の検索手段と、
前記単項式をそれぞれ対応する前記検索手段に割り当て
る割り当て手段と、前記各検索手段が前記データベース
を検索して得た結果を前記検索式に基づいて演算し前記
検索式に対応する検索結果として出力する演算手段とを
有し、前記各検索手段が前記割り当て手段によってその
検索手段に割り当てられた単項式に基づいて前記データ
ベースを検索する。
A first database search system of the present invention comprises an input means for inputting a search expression, a dividing means for dividing the search expression into monomials, and a plurality of databases for searching by different search methods. Search method of
Assigning means for allocating the monomials to the corresponding corresponding search means, and operation for calculating results obtained by searching the database by each search means based on the search expressions and outputting as a search result corresponding to the search expressions Means for searching the database based on the unary expression assigned to the search means by the assigning means.

【0008】本発明の第2のデータベース検索システム
は、検索式を入力する入力手段と、異なる検索方法によ
ってデータベースを検索する複数の検索手段と、前記各
検索方法に適合するように前記検索式を分割して部分検
索式とし前記各部分検索式をそれぞれ対応する検索手段
に割り当てる分割割り当て手段と、前記各検索手段が前
記データベースを検索して得た結果を前記検索式に基づ
いて演算し前記検索式に対応する検索結果として出力す
る演算手段とを有し、前記各検索手段が前記分割割り当
て手段によってその検索手段に割り当てられた部分検索
式に基づいて前記データベースを検索する。
The second database search system of the present invention comprises an input means for inputting a search expression, a plurality of search means for searching a database by different search methods, and the search expression so that the search expression is adapted to each search method. Division and allocation means for allocating each of the partial search expressions to the corresponding search means by dividing the partial search expression, and a result obtained by the search means searching the database based on the search expression to perform the search. Calculating means for outputting a search result corresponding to the expression, and each of the searching means searches the database based on the partial search expression assigned to the searching means by the division assigning means.

【0009】本発明において、検索対象範囲設定手段を
設けて各検索手段に共通の検索対象範囲を設定し、各検
索手段はこの検索対象範囲内で検索を実行するようにし
てもよい。また、複数の検索手段としては、例えば、イ
ンデックス検索を行なう検索手段と全文検索を行なう検
索手段とが挙げられる。
In the present invention, search target range setting means may be provided to set a search target range common to each search means, and each search means may execute a search within this search target range. Further, as the plurality of search means, for example, a search means for performing an index search and a search means for performing a full-text search can be cited.

【0010】[0010]

【作用】入力された検索式を分割して単項式あるいは部
分検索式を生成し、これらの単項式あるいは部分検索式
をそれぞれ対応する検索手段に割り当てるので、各検索
手段においてその検索手段に長所を活かした検索が行な
われる。そして、各検索手段での検索結果に対して検索
式に基づいた論理演算を行なうことによって、入力され
た検索式に対応する検索結果が最終的に得られる。
The input search formula is divided to generate a unary formula or a partial search formula, and these unary formulas or partial search formulas are assigned to the corresponding search means. Therefore, each search means takes advantage of its advantage. The search is done. Then, the search result corresponding to the input search formula is finally obtained by performing a logical operation on the search result by each search means based on the search formula.

【0011】[0011]

【実施例】次に、本発明の実施例について図面を参照し
て説明する。図1は本発明の一実施例のデータベース検
索システムの構成を示すブロック図である。ここでは、
特許情報検索を行なう場合を例に挙げて説明する。
Embodiments of the present invention will now be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of a database search system according to an embodiment of the present invention. here,
The case of performing patent information search will be described as an example.

【0012】1次情報である文献情報はデータベース格
納部11内に記録されている。ここでは、特許、実用新
案などの公開公報や公告公報、実用新案(平成6年1月
以降の出願分)や意匠の登録公報などがデータベース格
納部11内に電子化されて記録されている。これらの公
報類は、公開、公告、登録の3種類のデータベースグル
ープ(以下、DBGと略記する)に分類されて格納され
ている。図1ではこれら3つのDBGは、DBG#1〜
DBG#3で示されている。なお、図示されていない
が、どのようなDBGがあるかを記述したDBGインフ
ォメーションファイルもデータベース格納部11内に格
納されている。
Literature information, which is primary information, is recorded in the database storage unit 11. Here, patents, utility models, and other public and official gazettes, utility models (for applications after January 1994), registered designs, etc. are computerized and recorded in the database storage unit 11. These publications are classified and stored in three types of database groups (hereinafter, abbreviated as DBG): open, public notice, and registration. In FIG. 1, these three DBGs are DBG # 1 to DBG # 1.
This is shown in DBG # 3. Although not shown, a DBG information file that describes what kind of DBG there is is also stored in the database storage unit 11.

【0013】各DBG内では、特許、実用新案、意匠、
PCT(特許協力条約)による国際出願などの分類にし
たがって、データベース(以下、DBと略記する)が設
けられており、図1では、公開公報に対応するDBG#
1に4つのDB(DB#1〜DB#4)が設けられてい
る。本実施例では、特許文献の1つ1つにユニークな番
号(以下、文献ID番号と呼ぶ)が付与されているもの
とする。この文献ID番号は、例えば、特公平4−12
3456号公報に対しては"B404123456"、実開昭63−
112233号公報に対しては"U363112233"といった具
合に付与されている。また、DBG内にどのようなDB
が存在するかを記述したDBインフォメーションファイ
ル(不図示)もデータベース格納部11内に設けられて
いる。
Within each DBG, patents, utility models, designs,
A database (hereinafter abbreviated as DB) is provided according to the classification of international applications etc. according to the PCT (Patent Cooperation Treaty), and in FIG. 1, DBG # corresponding to the publication is disclosed.
1 is provided with four DBs (DB # 1 to DB # 4). In this embodiment, it is assumed that a unique number (hereinafter referred to as a document ID number) is given to each of the patent documents. This document ID number is, for example, Japanese Patent Publication No. 4-12.
For Japanese Patent No. 3456, "B404123456", Shokai 63-
For example, Japanese Patent No. 112233 has a designation such as "U363112233". Also, what DB is in the DBG
A DB information file (not shown) describing whether or not exists is also provided in the database storage unit 11.

【0014】各DBは、インデックス検索を行なうため
に使用されるデータを記録した領域であるインデックス
データ部21と、全文検索を行なうために使用されるデ
ータを記録した領域である全文検索用データ部22によ
って構成されている。公開公報のインデックス検索の場
合、特許と実用新案とを分けずに検索を行なうことも多
いから、本実施例では、1つのDBG内の全件に共通
(この例ではDB#1〜DB#4に共通)にインデック
スデータ部21が設定されている。インデックスデータ
部21には、特許文献を検索する際のキーとなる項目、
例えば、出願日や公開日、出願番号、公開番号、出願人
名、付与された国際特許分類などをそれぞれ索引とする
インデックスファイルが含まれており、インデックスデ
ータ部21を用いてインデックス検索を行なうことによ
って該当する特許文献に対する文献ID番号を取得でき
るようになっている。
Each DB has an index data section 21 which is an area in which data used for performing an index search is recorded, and a full text search data section which is an area in which data is used for performing a full text search. 22. In the case of the index search of the publication, the search is often performed without dividing the patent and the utility model. Therefore, in this embodiment, it is common to all cases in one DBG (DB # 1 to DB # 4 in this example). (Common to all), the index data section 21 is set. The index data section 21 includes items that are key when searching patent documents,
For example, an index file that includes the application date and publication date, the application number, the publication number, the applicant name, the granted international patent classification, etc. as an index is included, and an index search is performed using the index data section 21. The document ID number for the corresponding patent document can be acquired.

【0015】一方、全文検索用データ部22は、さら
に、複数のカテゴリ23に分割されている。カテゴリ2
3は、例えば公開日順に1ヶ月ごとに全文検索を行なう
ために使用されるデータを区分するためのものであっ
て、データはいずれかのカテゴリ23に格納されてい
る。ここでカテゴリ23に分割しているのは、全件検索
用のデータはある程度の単位ごとに区切っておいた方が
扱いが容易になるからであり、また検索範囲を特定のカ
テゴリに限定することによって検索時間の短縮を図れる
からである。本実施例では、全文検索を行なうために使
用されるデータは、各特許文献それぞれの全文データ
(1次情報としてのデータそのもの)であってもよい
し、あるいは、全文検索に使用される検索方法に応じて
全文データから加工されたデータであってもよい。全文
検索は、ある文字列(検索キーワード)が含まれる特許
文献の文献ID番号は何であるかを知るために行なわれ
るのが一般的であり、その特許文献中のどこにその文字
列が存在するかを知る必要はないことが多いから、例え
ば、特開平4−326164号公報にあるように、各特
許文献の全文データから自己相関情報を抽出してそれぞ
れの特許文献に対する全文検索用のデータとすることに
より、全文検索用データ部22に必要な記憶容量を大幅
に小さくすることができる。
On the other hand, the full-text search data section 22 is further divided into a plurality of categories 23. Category 2
Reference numeral 3 is for dividing data used for performing full-text search on a monthly basis, for example, in order of publication date, and the data is stored in any of the categories 23. Here, the reason why the data is divided into categories 23 is that it is easier to handle if the data for all-retrieval search is divided into some units, and the search range is limited to a specific category. This is because the search time can be shortened. In the present embodiment, the data used to perform the full-text search may be the full-text data of each patent document (the data itself as the primary information), or the search method used for the full-text search. It may be data processed from full-text data according to the above. The full-text search is generally performed in order to know what the document ID number of a patent document containing a certain character string (search keyword) is, and where in the patent document the character string exists. Since it is often unnecessary to know the information, for example, as disclosed in Japanese Patent Laid-Open No. 4-326164, autocorrelation information is extracted from the full-text data of each patent document and used as full-text search data for each patent document. As a result, the storage capacity required for the full-text search data section 22 can be greatly reduced.

【0016】さてこのデータベース検索システムには、
インデックスデータ部21にアクセスし1つのDBG内
の全件を対象として指定された項目についてインデック
ス検索を行なうインデックス検索手段13と、DBG内
の指定されたDBやカテゴリ23を対象として全文検索
を行なう全文検索手段14と、これらインデックス検索
手段13や全文検索手段14に対し検索対象や検索キー
を指示し、インデックス検索手段13や全文検索手段1
4からの検索結果を処理する中央処理装置12を備えて
いる。さらにこのデータベース検索システムは、中央処
理装置12に接続されキーボードやマウスなどからなる
入力手段15と、中央処理装置12に接続されCRTな
どからなる表示手段16を有する。インデックス検索手
段13や全文検索手段14は、検索キーに該当する物件
(この場合特許文献)の文献ID番号を返すように構成
されている。
Now, in this database search system,
An index search unit 13 that accesses the index data unit 21 to perform an index search for a specified item in all cases in one DBG, and a full text to perform a full text search in a specified DB or category 23 in the DBG. The search means 14 and the index search means 13 and the full-text search means 14 are instructed about search targets and search keys, and the index search means 13 and the full-text search means 1 are specified.
4 is provided with a central processing unit 12 for processing the search results. Further, this database search system has an input unit 15 connected to the central processing unit 12 and including a keyboard and a mouse, and a display unit 16 connected to the central processing unit 12 such as a CRT. The index search unit 13 and the full-text search unit 14 are configured to return the document ID number of the property (patent document in this case) corresponding to the search key.

【0017】中央処理装置12には、入力手段15から
入力した検索式を単項式に分割する分割手段31と、分
割手段31で得られた単項式をそれぞれインデックス検
索手段13と全文検索手段14のいずれかに検索キーと
して割り当てる割り当て手段32と、インデックス検索
手段13と全文検索手段14からの検索結果について上
述の検索式に基づいて論理演算しこの検索式に対応する
検索結果として表示手段16に出力する演算手段33
と、インデックス検索手段13や全文検索手段14での
検索対象範囲を設定する検索対象範囲設定手段34とが
設けられている。
In the central processing unit 12, the dividing means 31 for dividing the search expression input from the input means 15 into monomials, and the monomials obtained by the dividing means 31 are either index search means 13 or full-text search means 14, respectively. To the search means from the index search means 13 and the full-text search means 14 based on the above-mentioned search formula, and output to the display means 16 as the search result corresponding to this search formula. Means 33
And a search target range setting means 34 for setting a search target range in the index search means 13 and the full text search means 14.

【0018】次に、このデータベース検索システムの動
作について説明する。図2は全体の処理の手順を示すフ
ローチャートである。
Next, the operation of this database search system will be described. FIG. 2 is a flowchart showing the procedure of the entire processing.

【0019】最初に検索対象範囲を設定する(ステップ
51)。特許文献検索の場合、データベース格納部11
に格納された全件を対象としていきなり検索を進めるこ
とはほとんどなく、公開公報か公告公報かの別や一定の
期間内に公開(公告)されたものに範囲を限定して1回
の検索を実行することが一般的である。そこで本実施例
では、実際の検索処理に先立って、検索対象範囲を限定
するための処理を実行している。検索対象範囲設定処理
の詳細な手順は図3に示されている。まず、検索者は入
力手段15を用いてDBGを1つ選択する(ステップ6
1)。例えば公開公報DBG(図1ではDBG#1)を
選択する。その結果、このDBGに対応するDBGイン
フォメーションファイルとDBインフォメーションファ
イルが読み出され、表示手段16の画面上に、選択され
ているDBGに含まれるDBとカテゴリとが一覧表示さ
れる(ステップ62)。
First, a search range is set (step 51). In the case of patent document search, database storage unit 11
The search is rarely carried out suddenly for all the cases stored in, and the search is limited to the publications or publications published within a certain period or limited to the publications within a certain period. It is common to do this. Therefore, in this embodiment, a process for limiting the search target range is executed prior to the actual search process. The detailed procedure of the search target range setting process is shown in FIG. First, the searcher selects one DBG using the input means 15 (step 6).
1). For example, the publication gazette DBG (DBG # 1 in FIG. 1) is selected. As a result, the DBG information file and the DB information file corresponding to this DBG are read, and the list of the DBs and categories included in the selected DBG is displayed on the screen of the display means 16 (step 62).

【0020】次に、検索者は、希望するDBとカテゴリ
とを選択する(ステップ63)。例えば、DBとして特
許DBと実用新案DBを選択し、カテゴリとして199
4年1月公開分を選択する。図1において斜線が付され
たカテゴリ23は、選択されたカテゴリである。そして
他のDBやカテゴリをさらに選択するかを問い合わせ
(ステップ64)、追加選択する場合にはステップ63
に戻り、追加選択しない場合にはインデックス検索手段
13と全文検索手段14のそれぞれについて検索対象範
囲設定手段34により検索対象範囲を設定する。全文検
索手段14については、どのカテゴリ内を検索するかを
指定するすることによって、検索対象範囲が設定され
る。インデックス検索手段13については、選択された
DBやカテゴリに相当する検索キーをインデックス検索
手段13に与えることによって、検索対象範囲が設定さ
れる。この例であれば、特許または実用新案であって、
公開日が1994年1月1日から同年同月31日までの
ものという検索キーが与えられる。
Next, the searcher selects a desired DB and category (step 63). For example, the patent DB and utility model DB are selected as DBs, and the category 199
Select the one released in January, 2014. The shaded category 23 in FIG. 1 is the selected category. Then, an inquiry is made as to whether another DB or category is to be further selected (step 64), and when additional selection is made, step 63 is performed.
Returning to step 2, when no additional selection is made, the search target range setting means 34 sets the search target range for each of the index search means 13 and the full-text search means 14. For the full-text search means 14, the search target range is set by designating which category is searched. Regarding the index search means 13, the search target range is set by giving a search key corresponding to the selected DB or category to the index search means 13. In this example, it is a patent or utility model,
A search key having a release date from January 1, 1994 to January 31, 1994 is given.

【0021】以上のようにしてステップ51の検索対象
範囲設定処理が終了したら、続いて、検索処理を実行す
る(ステップ52)。図4は検索処理の具体的手順を示
すフローチャートである。検索処理では、まず、検索者
が入力手段15によって検索式を入力する(ステップ7
1)。この検索式は、分割手段31に受け付けられて検
索キーごとの単項式に分割される。なお、後述するよう
にこの検索式に基づく論理演算を実行する必要があるの
で、この検索式は演算手段33にも入力する。例えば、
国際特許分類がG06F15/40またはG06F15
/60であって、明細書中に「表示」または「ディスプ
レイ」という文字列を含む文献を検索したいのであれ
ば、以下の式(1)〜式(4)が検索キーとなる。
When the search target range setting process of step 51 is completed as described above, the search process is subsequently executed (step 52). FIG. 4 is a flowchart showing a specific procedure of the search process. In the search process, first, the searcher inputs a search expression using the input means 15 (step 7).
1). This search formula is accepted by the dividing means 31 and divided into monomials for each search key. Since it is necessary to execute a logical operation based on this search formula as described later, this search formula is also input to the calculation means 33. For example,
International patent classification is G06F15 / 40 or G06F15
If the user wants to search for documents that include the character string "display" or "display" in the specification, the search keys are the following formulas (1) to (4).

【0022】 国際分類#1=G06F15/40 …(1) 国際分類#2=G06F15/60 …(2) キーワード#1=”表示” …(3) キーワード#2=”ディスプレイ” …(4) そして、検索式として、式(5)に示す多項式が入力され
る。
International Classification # 1 = G06F15 / 40 (1) International Classification # 2 = G06F15 / 60 (2) Keyword # 1 = "Display" ... (3) Keyword # 2 = "Display" (4) , The polynomial shown in Expression (5) is input as the search expression.

【0023】 {式(1) or 式(2)} and {式(3) or 式(4)} …(5) 分割手段31は式(5)に示すような検索式が入力した場
合に、これを分割して、式(1)〜(4)でそれぞれ表わされ
る単項式を出力する。これらの単項式のうち、式(1),式
(2)はインデックス検索手段13での検索に適した検索
キーであり、式(3),式(4)は全文検索手段14での検索
に適した検索キー(検索キーワード)である。
{Equation (1) or Equation (2)} and {Equation (3) or Equation (4)} (5) The dividing unit 31 inputs a search expression as shown in Equation (5), This is divided and the monomial expressions respectively expressed by equations (1) to (4) are output. Of these monomials, equation (1), equation
(2) is a search key suitable for the search by the index search means 13, and expressions (3) and (4) are search keys (search keywords) suitable for the search by the full-text search means 14.

【0024】分割手段31で得られたこれらの単項式
は、割り当て手段32に入力する。割り当て手段32
は、各単項式をそれぞれインデックス検索手段13と全
文検索手段14のいずれか適した方に割り当て、インデ
ックス検索手段13と全文検索手段14は、それぞれに
割り当てられた単項式に基づいて検索を実行する。上述
の例では、式(1)と式(2)で表わされる各単項式がインデ
ックス検索手段13に割り当てられ、式(3)と式(4)で表
わされる各単項式が全文検索手段14に割り当てられ
る。以下、単項式の割り当てと、インデックス検索手段
13や全文検索手段14による検索とについて、手順を
詳細に説明する。
These monomials obtained by the dividing means 31 are input to the allocating means 32. Assigning means 32
Assigns each monomial expression to the index search means 13 or the full-text search means 14, respectively, whichever is more suitable, and the index search means 13 and the full-text search means 14 execute a search based on the monomial expression assigned to each. In the above example, the monomial expressions represented by formulas (1) and (2) are assigned to the index search means 13, and the monomial expressions represented by formulas (3) and (4) are assigned to the full-text search means 14. . In the following, the procedure for unary expression assignment and the search by the index search means 13 and the full-text search means 14 will be described in detail.

【0025】割り当て手段32は、まず、入力した単項
式から1つを選択してその単項式が全文検索対象の単項
式であるかどうかを判断する(ステップ73)。全文検
索対象でなければステップ76に移行し、全文検索対象
であるときは、その単項式を全文検索手段14に割り当
てる。その結果、全文検索手段14は上述の検索対象範
囲内でその単項式に基づいて全文検索を実行し(ステッ
プ74)、該当する特許文献の文献ID番号を取得し
(ステップ75)、ステップ76に移行する。
The assigning means 32 first selects one from the input monomials and judges whether or not the monomials are the monomials for full-text search (step 73). If it is not a full-text search target, the process proceeds to step 76, and if it is a full-text search target, the monomial expression is assigned to the full-text search means 14. As a result, the full-text search means 14 performs a full-text search within the above-described search target range based on the monomials (step 74), obtains the document ID number of the relevant patent document (step 75), and moves to step 76. To do.

【0026】ステップ76では、選択された単項式がイ
ンデックス検索対象の単項式であるかどうかを判断す
る。インデックス検索対象でなければステップ79に移
行し、インデックス検索対象であるときは、その単項式
をインデックス検索手段13に割り当てる。その結果、
インデックス検索手段13は上述の検索対象範囲内でそ
の単項式に基づいてインデックス検索を実行し(ステッ
プ77)、該当する特許文献の文献ID番号を取得する
(ステップ78)。そして、ステップ79では、未選択
の単項式が残っているかを判断する。残っている場合に
は、次の単項式について同様の処理を行なうためにステ
ップ73に戻り、残っていない場合には、演算手段33
での処理を行なうためにステップ80に移行する。
In step 76, it is judged whether the selected monomial expression is a monomial expression to be index-searched. If it is not the index search target, the process proceeds to step 79. If it is the index search target, the unary expression is assigned to the index search means 13. as a result,
The index search means 13 executes an index search within the above-described search target range based on the unary expression (step 77), and acquires the document ID number of the corresponding patent document (step 78). Then, in step 79, it is determined whether or not there remains unselected monomials. If it remains, the process returns to step 73 to perform the same processing for the next monomial expression, and if it does not remain, the calculation means 33.
Then, the process proceeds to step 80 in order to carry out the processing in.

【0027】ステップ80では、演算手段33によっ
て、上述のステップ75及びステップ77で得られた検
索結果に対し、検索式に基づいた論理演算を実行する。
すなわち、検索式を分割して得た単項式ごとの検索結果
に対し、検索式の分割とは逆の過程をたどってこれらの
検索結果を統合する。そして、論理演算によって得られ
た結果を検索式に対する最終的な検索結果として出力す
る(ステップ81)。上述の例では、式(1)〜(4)で表わ
される4つの単項式に対して、インデックス検索手段1
3あるいは全文検索手段14による4組の検索結果が得
られているおり、各検索結果は、それぞれ対応する単項
式に該当する文献ID番号の集合として表わされてい
る。そして、演算手段33では、検索式すなわち式(5)
で表わされる論理式にしたがって各単項式に対応する検
索結果に対する論理演算が実行され、最終的な検索結果
が検索式に該当する文献の文献ID番号の集合として出
力される。
In step 80, the arithmetic means 33 executes a logical operation based on the retrieval formula for the retrieval results obtained in the above-mentioned steps 75 and 77.
That is, the search results for each unary expression obtained by dividing the search expression are integrated in the search result by following the reverse process of dividing the search expression. Then, the result obtained by the logical operation is output as the final search result for the search expression (step 81). In the above example, the index search means 1 is used for the four monomial expressions represented by the expressions (1) to (4).
3 or 4 sets of search results by the full-text search means 14 are obtained, and each search result is represented as a set of document ID numbers corresponding to the corresponding monomials. Then, in the computing means 33, the retrieval formula, that is, the formula (5)
A logical operation is performed on the search result corresponding to each monomial expression according to the logical expression represented by, and the final search result is output as a set of document ID numbers of documents corresponding to the search expression.

【0028】以上のようにしてステップ52の検索処理
が実行されると、得られた検索結果が表示手段16に表
示される(ステップ53)。上述の例では、1994年
1月中に公開された特許出願または実用新案登録出願で
あって、付与された国際特許分類がG06F15/40
またはG06F15/60であり、かつ、明細書中に
「表示」または「ディスプレイ」という文字列の記載が
ある公開公報の公報番号が表示される。そして、このま
ま処理を終了するかを問い合わせ(ステップ34)、終
了しない場合には次の検索を行なうためにステップ31
に戻り、終了が指示された場合には一連の処理を終了す
る。
When the search process of step 52 is executed as described above, the obtained search result is displayed on the display means 16 (step 53). In the above example, the patent application or utility model registration application published in January 1994, and the granted international patent classification is G06F15 / 40.
Alternatively, the publication number of the publication that is G06F15 / 60 and has the description of the character string "display" or "display" in the description is displayed. Then, an inquiry is made as to whether the processing is to be ended as it is (step 34).
Returning to, when a termination is instructed, a series of processing is terminated.

【0029】以上の実施例では、検索式を単項式に分割
してインデックス検索手段13と全文検索手段14に割
り当てているが、本発明では、必ずしも単項式にまで分
割する必要はない。上述の例で言えば、「式(1) or
式(2)」で表わされる論理式(部分検索式)をインデッ
クス検索手段13に割り当て、インデックス検索手段1
3が「式(1) or 式(2)」に基づいてインデックス検索
を実行して検索結果#1を取得し、「式(3) or 式
(4)」で表わされる論理式を全文検索手段14に割り当
て、全文検索手段14が「式(3) or 式(4)」に基づい
て全文検索を実行して検索結果#2を取得し、演算手段
33において「検索結果#1 and 検索結果#2」と
いう論理演算を行なうようにしてもよい。すなわち、そ
れぞれの検索手段に対しその検索手段に適した部分検索
式を割り当てるようにしてもよい。この場合、分割手段
と割り当て手段とによって分割割り当て手段が構成され
ることになる。
In the above embodiment, the search expression is divided into monomials and assigned to the index search means 13 and the full-text search means 14. However, in the present invention, it is not always necessary to divide them into monomials. In the above example, "equation (1) or
The logical expression (partial search expression) represented by the expression (2) is assigned to the index search means 13, and the index search means 1
3 performs an index search based on "expression (1) or expression (2)" to obtain search result # 1, and "expression (3) or expression"
(4) ”is assigned to the full-text search means 14, and the full-text search means 14 performs a full-text search based on“ expression (3) or expression (4) ”to obtain a search result # 2, The arithmetic means 33 may perform a logical operation of "search result # 1 and search result # 2". That is, a partial search expression suitable for the search means may be assigned to each search means. In this case, the dividing and assigning unit is configured by the dividing unit and the assigning unit.

【0030】以上、本発明の実施例について説明した
が、本発明において複数の検索手段はインデックス検索
手段と全文検索手段の組み合わせに限定されるものでは
なく、これら以外の検索方法による検索手段であっても
よい。
Although the embodiments of the present invention have been described above, the plurality of search means in the present invention are not limited to the combination of the index search means and the full-text search means, and search means other than these search methods may be used. May be.

【0031】[0031]

【発明の効果】以上説明したように本発明は、入力され
た検索式を分割して単項式あるいは部分検索式を生成
し、これらの単項式あるいは部分検索式をそれぞれ対応
する検索手段に割り当てて各検索手段によって検索を実
行し、各検索手段での検索結果に対して検索式に基づい
た演算を行なうことにより、各検索手段においてその検
索手段に長所を活かした効率的な検索が行なわれるよう
になるという効果がある。例えば、複数の検索手段とし
てインデックス検索を行なう検索手段と全文検索を行な
う検索手段を用いることにより、インデックス検索の高
速性と全文検索の詳細性とを両立させた検索を行なうこ
とが可能になる。
As described above, according to the present invention, an input search expression is divided to generate a monomial expression or a partial search expression, and these monomial expression or partial search expression are assigned to the corresponding search means. By executing the search by the search means and performing the calculation based on the search formula on the search result in each search means, an efficient search can be performed in each search means by utilizing the merit of the search means. There is an effect. For example, by using a search unit that performs an index search and a search unit that performs a full-text search as the plurality of search units, it is possible to perform a search that achieves both high-speed index search and full-text search detail.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例のデータベース検索システム
の構成を示すブロック図である。
FIG. 1 is a block diagram showing the configuration of a database search system according to an embodiment of the present invention.

【図2】全体の処理の手順を示すフローチャートであ
る。
FIG. 2 is a flowchart showing a procedure of overall processing.

【図3】検索対象範囲設定処理の手順を示すフローチャ
ートである。
FIG. 3 is a flowchart showing a procedure of search target range setting processing.

【図4】検索処理の手順を示すフローチャートである。FIG. 4 is a flowchart showing a procedure of search processing.

【符号の説明】[Explanation of symbols]

11 データベース格納部 12 中央制御装置 13 インデックス検索手段 14 全文検索手段 15 入力手段 16 表示手段 21 インデックスデータ部 22 全文検索用データ部 23 カテゴリ 31 分割手段 32 割り当て手段 33 演算手段 34 検索対象範囲設定手段 51〜54,61〜65,71〜81 ステップ 11 database storage unit 12 central control unit 13 index search unit 14 full-text search unit 15 input unit 16 display unit 21 index data unit 22 full-text search data unit 23 category 31 dividing unit 32 assigning unit 33 computing unit 34 search range setting unit 51 ~ 54,61-65,71-81 steps

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 検索式に応じてデータベースを検索する
データベース検索システムであって、 検索式を入力する入力手段と、前記検索式を単項式に分
割する分割手段と、異なる検索方法によってデータベー
スを検索する複数の検索手段と、前記単項式をそれぞれ
対応する前記検索手段に割り当てる割り当て手段と、前
記各検索手段が前記データベースを検索して得た結果を
前記検索式に基づいて演算し前記検索式に対応する検索
結果として出力する演算手段とを有し、 前記各検索手段が前記割り当て手段によってその検索手
段に割り当てられた単項式に基づいて前記データベース
を検索するデータベース検索システム。
1. A database search system for searching a database according to a search expression, comprising: input means for inputting the search expression; dividing means for dividing the search expression into monomials; and searching the database by different search methods. A plurality of search means, an assigning means for allocating the monomials to the corresponding search means, and a result obtained by searching the database by each search means, based on the search expression, corresponding to the search expression A database search system comprising: a calculation unit that outputs the search result, and each of the search units searches the database based on a monomial expression assigned to the search unit by the assigning unit.
【請求項2】 検索式に応じてデータベースを検索する
データベース検索システムであって、 検索式を入力する入力手段と、異なる検索方法によって
データベースを検索する複数の検索手段と、前記各検索
方法に適合するように前記検索式を分割して部分検索式
とし前記各部分検索式をそれぞれ対応する検索手段に割
り当てる分割割り当て手段と、前記各検索手段が前記デ
ータベースを検索して得た結果を前記検索式に基づいて
演算し前記検索式に対応する検索結果として出力する演
算手段とを有し、 前記各検索手段が前記分割割り当て手段によってその検
索手段に割り当てられた部分検索式に基づいて前記デー
タベースを検索するデータベース検索システム。
2. A database search system for searching a database according to a search expression, comprising input means for inputting a search expression, a plurality of search means for searching a database by different search methods, and each search method. As described above, the search formula is divided into partial search formulas, and each of the partial search formulas is assigned to a corresponding search unit. And a calculation means for outputting as a search result corresponding to the search expression, each search means searches the database based on a partial search expression assigned to the search means by the division assigning means. Database search system to do.
【請求項3】 前記各検索手段に共通の検索対象範囲を
設定する検索対象範囲設定手段をさらに有し、前記検索
対象範囲が設定された場合には前記各検索手段はその検
索対象範囲内で検索を実行する請求項1または2に記載
のデータベース検索システム。
3. A search target range setting means for setting a search target range common to each of the search means, wherein when the search target range is set, each of the search means is within the search target range. The database search system according to claim 1, which executes a search.
【請求項4】 前記複数の検索手段にはインデックス検
索を行なう検索手段と全文検索を行なう検索手段が少な
くとも含まれる請求項1乃至3いずれか1項に記載のデ
ータベース検索システム。
4. The database search system according to claim 1, wherein the plurality of search means include at least a search means for performing an index search and a search means for performing a full-text search.
JP7077839A 1995-04-03 1995-04-03 Data base retrieval system Withdrawn JPH08272806A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7077839A JPH08272806A (en) 1995-04-03 1995-04-03 Data base retrieval system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7077839A JPH08272806A (en) 1995-04-03 1995-04-03 Data base retrieval system

Publications (1)

Publication Number Publication Date
JPH08272806A true JPH08272806A (en) 1996-10-18

Family

ID=13645223

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7077839A Withdrawn JPH08272806A (en) 1995-04-03 1995-04-03 Data base retrieval system

Country Status (1)

Country Link
JP (1) JPH08272806A (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006040081A (en) * 2004-07-29 2006-02-09 Mitsubishi Electric Corp Information retrieval device, database retrieval preprocessing circuit, and information retrieval method
JP2008176545A (en) * 2007-01-18 2008-07-31 Cosmotec Patent Information Systems Inc Computer system for data retrieval, computer program for realizing data retrieval and method thereof
US7680852B2 (en) 2006-10-19 2010-03-16 Fujitsu Limited Search processing method and search system
WO2011033734A1 (en) * 2009-09-18 2011-03-24 Hitachi Solutions, Ltd. File search system and program
JP2012053903A (en) * 2003-04-25 2012-03-15 Thomson Reuters Global Resources Distributed retrieval method, architecture, system and software
JP2012083929A (en) * 2010-10-12 2012-04-26 Hitachi Solutions Ltd File retrieval device and file retrieval program
JP2012128858A (en) * 2010-12-13 2012-07-05 Fujitsu Ltd Query system and computer program
WO2014174599A1 (en) * 2013-04-24 2014-10-30 株式会社日立製作所 Computing device, storage medium and data search method
JP2016139187A (en) * 2015-01-26 2016-08-04 株式会社日立製作所 Document investigation support device and document investigation support method

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012053903A (en) * 2003-04-25 2012-03-15 Thomson Reuters Global Resources Distributed retrieval method, architecture, system and software
JP2006040081A (en) * 2004-07-29 2006-02-09 Mitsubishi Electric Corp Information retrieval device, database retrieval preprocessing circuit, and information retrieval method
US7680852B2 (en) 2006-10-19 2010-03-16 Fujitsu Limited Search processing method and search system
JP2008176545A (en) * 2007-01-18 2008-07-31 Cosmotec Patent Information Systems Inc Computer system for data retrieval, computer program for realizing data retrieval and method thereof
CN102483765A (en) * 2009-09-18 2012-05-30 株式会社日立解决方案 File search system and program
WO2011033734A1 (en) * 2009-09-18 2011-03-24 Hitachi Solutions, Ltd. File search system and program
JP2011065546A (en) * 2009-09-18 2011-03-31 Hitachi Solutions Ltd File search system and program
JP2012083929A (en) * 2010-10-12 2012-04-26 Hitachi Solutions Ltd File retrieval device and file retrieval program
JP2012128858A (en) * 2010-12-13 2012-07-05 Fujitsu Ltd Query system and computer program
WO2014174599A1 (en) * 2013-04-24 2014-10-30 株式会社日立製作所 Computing device, storage medium and data search method
JP5978393B2 (en) * 2013-04-24 2016-08-24 株式会社日立製作所 Computer, recording medium and data retrieval method
JPWO2014174599A1 (en) * 2013-04-24 2017-02-23 株式会社日立製作所 Computer, recording medium and data retrieval method
JP2016139187A (en) * 2015-01-26 2016-08-04 株式会社日立製作所 Document investigation support device and document investigation support method

Similar Documents

Publication Publication Date Title
US6334131B2 (en) Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures
EP0722145B1 (en) Information retrieval system and method of operation
KR100295354B1 (en) Document information retrieval system
US6772170B2 (en) System and method for interpreting document contents
US7693910B2 (en) Method of searching documents and a service for searching documents
US20020099685A1 (en) Document retrieval system; method of document retrieval; and search server
US5933796A (en) Data extracting system based on characteristic quantities of data distribution
JP2009238241A (en) Method and apparatus for searching data of database
CN110633264B (en) Research and development auxiliary system and method using patent database
KR20000023961A (en) Information modeling method and database search system
JPH08272806A (en) Data base retrieval system
JP2002007433A (en) Information sorter, information sorting method, computer readable recording medium recorded with information sorting program and information sorting program
JP2008243024A (en) Information acquisition device, program therefor and method
KR100341396B1 (en) 3-D clustering representation system and method using hierarchical terms
JPH05101107A (en) Device and method for narrowed-down data retrieval using adaption rate
JP2001188802A (en) Device and method for retrieving information
WO1998049632A1 (en) System and method for entity-based data retrieval
JP2000020538A (en) Method and device for retrieving information, and storage medium for information retrieving program
JPH02245971A (en) Method and device for information retrieve processing
JPH09198396A (en) Document retrieval device
JPH08329101A (en) Data base system
JPH11154164A (en) Adaptability calculating method in whole sentence search processing and storage medium storing program related to the same
JP3222193B2 (en) Information retrieval device
JPH0241564A (en) Document retrieving device
JP2732661B2 (en) Text type database device

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020604