JP2000099514A - Method and device for deciding retrieval range of database, and recording medium - Google Patents

Method and device for deciding retrieval range of database, and recording medium

Info

Publication number
JP2000099514A
JP2000099514A JP10263584A JP26358498A JP2000099514A JP 2000099514 A JP2000099514 A JP 2000099514A JP 10263584 A JP10263584 A JP 10263584A JP 26358498 A JP26358498 A JP 26358498A JP 2000099514 A JP2000099514 A JP 2000099514A
Authority
JP
Japan
Prior art keywords
search
database
information
target database
basic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10263584A
Other languages
Japanese (ja)
Inventor
Nobuyuki Miura
信幸 三浦
Katsumi Takahashi
克巳 高橋
Seiji Yokomichi
誠司 横路
Kenichi Shima
健一 島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10263584A priority Critical patent/JP2000099514A/en
Publication of JP2000099514A publication Critical patent/JP2000099514A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To always obtain the number of retrieval results within the designated range at the time of repeating retrieval to a database that cannot previously and completely grasp a pair of information on the retrieval condition of a database being a retrieval object and the number of retrieval results. SOLUTION: A retrieval range deciding device 12 executes previous sampling investigation based on data specifying a retrieval condition and a database 14 being a retrieval object, which are given from a retrieval repeating device 10, obtains data on the retrieval condition and a retrieval range as the retrieval result and decides the retrieval condition and the retrieval range at the time of retrieving the database 14 being the retrieval object by the retrieval repeating device 10 based on the retrieval result.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明はデータベースの検索
範囲決定方法、装置及びデータベースの検索範囲決定方
法をコンピュータに実行させるためのプログラムを記録
したコンピュータにより読み取り可能な記録媒体に係
り、特に検索対象となるデータベース(以下、検索対象
データベースと記す。)の検索条件と検索結果数の対の
情報が事前に完全に把握できないようなデータベースに
対して検索を中継する際に、検索結果数が指定する範囲
内に収まるように検索実行前に検索範囲を決定しておい
てから検索を実行することにより、より的確な検索中継
を行うデータベースの検索範囲決定方法、装置及びデー
タベースの検索範囲決定方法をコンピュータに実行させ
るためのプログラムを記録したコンピュータにより読み
取り可能な記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and apparatus for determining a search range of a database and a computer-readable recording medium storing a program for causing a computer to execute the method of determining a search range of a database. The range specified by the number of search results when relaying a search to a database where the information of the pair of the search condition and the number of search results for a different database (hereinafter referred to as a search target database) cannot be completely grasped in advance. The search range is determined before executing the search so that the search range is within the range, and the search is executed. Computer-readable recording medium recording a program to be executed About.

【0002】[0002]

【従来の技術】従来のデータベースの情報検索では、検
索条件に対する検索結果数が指定する範囲内に入るよう
にするには、一旦検索を実行してから検索結果数が適切
な数でなかった場合に検索条件を変更して検索を再実行
したり、検索実行前に検索結果数を予想して検索範囲を
決定する場合でも検索対象データベース内の検索条件と
検索結果数が事前に全て判明していることを前提とした
方法や、複数の検索条件に対する各検索結果数との関係
から類推するといった検索結果数の単なる経験則を用い
た方法により検索対象データベースの検索範囲を決定し
ていた。
2. Description of the Related Art In a conventional database information search, in order to make the number of search results for a search condition fall within a specified range, a search is executed once and the number of search results is not an appropriate number. Even if the search conditions are changed and the search is executed again, or the search range is determined by estimating the number of search results before executing the search, the search conditions and the number of search results in the search target database are all known in advance. The search range of the search target database is determined by a method based on the premise that there is a search condition or a method using a simple rule of thumb of the number of search results, such as inferring from the relationship between the number of search results for a plurality of search conditions.

【0003】[0003]

【発明が解決しようとする課題】しかしながら上述した
従来のデータベースの情報検索では、検索対象データベ
ースの検索条件と検索結果数の対の情報が事前に完全に
把握できないようなデータベースに対して検索を中継す
る際に、検索結果数が指定する範囲内になるように検索
結果数を推定して検索実行前に予め検索範囲を決定する
ことはできないという問題が有った。また複数の検索条
件に対する各検索結果数との関係から類推するといった
検索結果数の単なる経験則を用いた方法では、検索対象
データベースの検索条件と検索結果数の対の情報が事前
に完全に把握できないようなデータベースに対して検索
を中継する際に、経験則のない検索条件については検索
結果数を推定し、検索範囲を決定することはできないと
いう問題が有った。
However, in the above-described conventional database information search, the search is relayed to a database in which the information of the pair of the search condition and the number of search results of the search target database cannot be completely grasped in advance. In doing so, there is a problem that it is not possible to estimate the number of search results so that the number of search results falls within a specified range and determine the search range in advance before executing the search. In addition, with a method that uses a simple rule of thumb for the number of search results, such as inferring from the relationship between the number of search results for multiple search conditions, the information on pairs of search conditions and search results in the search target database is completely grasped in advance. When a search is relayed to a database that cannot be used, there is a problem that it is not possible to estimate the number of search results and determine a search range for search conditions having no rule of thumb.

【0004】更に検索対象データベースの検索条件と検
索結果数の対の情報が事前に完全に把握できないような
データベースに対して検索を中継する際に、検索対象デ
ータベースが含有している情報の種類が異なるデータベ
ースに対しても検索結果数の推定及び検索範囲の決定を
行いたいという要求が有る。
Further, when a search is relayed to a database in which the information of the pair of the search condition and the number of search results of the search target database cannot be completely grasped in advance, the type of information contained in the search target database is not changed. There is a demand for estimating the number of search results and determining the search range for different databases.

【0005】本発明はこのような事情に鑑みてなされた
ものであり、検索対象データベースの検索条件と検索結
果数の対の情報が事前に完全に把握できないようなデー
タベースに対して検索を中継する際に、常に指定する範
囲内の検索結果数が得られるような検索中継を行うこと
ができるデータベースの検索範囲決定方法、装置及び記
録媒体を提供することを目的とする。
The present invention has been made in view of such circumstances, and relays a search to a database in which information on a pair of a search condition and the number of search results of a search target database cannot be completely grasped in advance. It is an object of the present invention to provide a database search range determination method, apparatus, and recording medium that can perform search relay so that the number of search results within a designated range can always be obtained.

【0006】[0006]

【課題を解決するための手段】上記目的を達成するため
に請求項1に記載の発明は、検索対象データベースの検
索条件と検索結果数の対の情報が事前に完全に把握でき
ないようなデータベースに対して検索を中継する際に、
検索対象データベースとは別の基本データベースの中か
ら事前に検索条件を標本抽出し、該標本検索条件につい
てのみ検索対象データベースに対して事前に検索を実行
し、それらの標本検索条件について基本データベース及
び検索対象データベースにおける検索結果数を求め、検
索対象データベースと基本データベースの検索結果数の
比を算出しておき、任意の検索条件に対して、基本デー
タベースにおける検索結果数と、事前に算出しておいた
検索対象データベースと基本データベースの検索結果数
の比とを乗じて指定された検索条件の検索対象データベ
ースにおける検索結果数の推定を行うことを特徴とす
る。
In order to achieve the above object, the invention according to claim 1 is directed to a database in which information on a pair of a search condition and the number of search results of a search target database cannot be completely grasped in advance. When relaying a search for
A search condition is sampled in advance from a basic database different from the search target database, a search is performed in advance on the search target database only for the sample search condition, and the basic database and the search are performed on those sample search conditions. The number of search results in the target database was obtained, the ratio of the number of search results in the search target database to the number of search results in the basic database was calculated, and the number of search results in the basic database was calculated in advance for any search condition. The present invention is characterized in that the number of search results in the search target database of the specified search condition is estimated by multiplying the ratio of the number of search results in the search target database and the base database.

【0007】また請求項2に記載の発明は、検索対象デ
ータベースの検索条件と検索結果数の対の情報が事前に
完全に把握できないようなデータベースに対して検索を
中継する際に、検索結果数が指定する範囲内になるよう
に予め検索範囲を決定するため、検索対象データベース
とは別の基本データベースを利用して指定された検索条
件の検索範囲を広げた場合の検索条件と、狭めた場合の
検索条件を複数、決定し、それらの検索条件に関して請
求項1に記載の検索結果数の推定を行い、その推定結果
から検索結果数が所望の範囲内に収まるように検索範囲
の決定を行うことを特徴とする。
According to the second aspect of the present invention, when the search is relayed to a database in which the information of the pair of the search condition and the number of search results of the search target database cannot be completely grasped in advance, the number of search results is reduced. In order to determine the search range in advance so that it is within the specified range, the search condition when the search range of the specified search condition is expanded using the basic database different from the search target database and when the search condition is narrowed Are determined, the number of search results described in claim 1 is estimated with respect to the search conditions, and a search range is determined from the estimated result so that the number of search results falls within a desired range. It is characterized by the following.

【0008】更に請求項3に記載の発明は、請求項1又
は2のいずれかに記載のデータベースの検索範囲決定方
法において、含有する情報の種類の異なる基本データベ
ースを複数、用意し、標本検索条件についての検索対象
データベースにおける検索結果数と、情報の種類毎の基
本データベースにおける検索結果数との統計的な相関を
算出し、相関が高い情報の種類名を検索対象データベー
スが含有する情報の種類と判断し、検索対象データベー
スと、前記相関が高い情報の種類別基本データベースと
について検索結果数の比の統計的演算を行い、該演算さ
れた検索結果数の比に基づいて検索対象データベースの
検索結果数を推定し、該推定結果から検索範囲を決定す
ることを特徴とする。
According to a third aspect of the present invention, in the method for determining a search range of a database according to any one of the first and second aspects, a plurality of basic databases having different types of contained information are prepared, The statistical correlation between the number of search results in the search target database and the number of search results in the basic database for each type of information is calculated, and the type name of the highly correlated information is determined by the type of information contained in the search target database. Judgment, a statistical calculation of the ratio of the number of search results is performed for the search target database and the basic database for each type of the highly correlated information, and the search result of the search target database is calculated based on the calculated ratio of the number of search results. The number is estimated, and a search range is determined from the estimation result.

【0009】請求項1乃至3に記載の発明によれば、検
索対象データベースの検索条件と検索結果数の対の情報
が事前に完全に把握できないようなデータベースに対し
て検索を中継する際に、検索結果数が指定した範囲内に
なるように予め検索範囲を決定しておくようにしたの
で、常に指定する範囲内の検索結果数が得られるような
検索中継を行うことができる。
According to the first to third aspects of the present invention, when a search is relayed to a database in which information on a pair of a search condition and the number of search results of a search target database cannot be completely grasped in advance, Since the search range is determined in advance so that the number of search results falls within the specified range, it is possible to perform search relay so that the number of search results within the specified range is always obtained.

【0010】また請求項4に記載の発明は、検索対象デ
ータベースの検索条件と検索結果数の対の情報が事前に
完全に把握できないようなデータベースに対して検索を
中継する際に、前記検索対象データベースの検索範囲を
決定するデータベースの検索範囲決定装置において、検
索対象データベースとは別の基本データベースの中から
事前に検索条件を標本抽出する検索条件抽出手段と、該
検索条件抽出手段により抽出された標本検索条件につい
てのみ検索対象データベースに対して事前にサンプル検
索を実行するサンプル検索実行手段と、各検索対象デー
タベース毎に任意の検索条件に対する検索結果数を予測
するための係数データが格納される係数データベース
と、前記標本検索条件について基本データベース及び検
索対象データベースにおける検索結果数を求め、検索対
象データベースと基本データベースの検索結果数との比
となる係数を算出し、前記係数データベースに格納する
係数決定手段と、任意の検索条件に対して、基本データ
ベースにおける検索結果数に前記係数データベースより
読み出した、前記任意の検索条件に対する事前に算出し
ておいた検索対象データベースと基本データベースの検
索結果数の比となる係数を乗じて、指定された検索条件
の検索対象データベースにおける検索結果数の推定を行
う検索結果数推定手段とを有することを特徴とする。
According to a fourth aspect of the present invention, when the search is relayed to a database in which the information of the pair of the search condition and the number of search results of the search target database cannot be completely grasped in advance, the search target In a database search range determining apparatus for determining a search range of a database, a search condition extracting unit that samples a search condition in advance from a basic database different from the search target database, and a search condition extracted by the search condition extracting unit. Sample search execution means for executing a sample search on a search target database in advance only for a sample search condition, and a coefficient storing coefficient data for predicting the number of search results for an arbitrary search condition for each search target database Database, and basic database and database to be searched for the sample search condition The number of search results in the base database is calculated, a coefficient which is the ratio of the number of search results in the search target database and the number of search results in the base database is calculated, and coefficient determination means to be stored in the coefficient database. The number of results is multiplied by a coefficient read from the coefficient database, which is the ratio of the number of search results of the search target database and the base database calculated in advance for the arbitrary search condition, and the search target of the specified search condition is Means for estimating the number of search results in the database.

【0011】更に請求項5に記載の発明は、請求項4に
記載のデータベースの検索範囲決定装置において、前記
検索対象データベースとは別の使用すべき基本データベ
ースを決定する使用基本データベース決定手段と、使用
すべき基本データベースから、指定された検索条件の検
索範囲を広げた場合の検索条件と、狭めた場合の検索条
件を複数、決定し、該決定した検索条件について前記使
用すべき基本データベースにおける検索結果数を取得
し、かつ前記係数データベースより使用すべき基本デー
タベースと検索対象データベースに関する係数を取得す
ると共に、前記使用すべき基本データベースにおける検
索結果数と前記係数を乗じて検索対象データベースの検
索結果数を推定する検索結果数推定手段と、該検索結果
数推定手段による推定結果から検索結果数が所望の範囲
内に収まるように検索範囲の決定を行う検索範囲決定手
段とを有することを特徴とする。
According to a fifth aspect of the present invention, in the apparatus for determining a search range of a database according to the fourth aspect, use basic database determining means for determining a basic database to be used which is different from the search target database; From the basic database to be used, a plurality of search conditions when the search range of the specified search condition is expanded and a plurality of search conditions when the search range is narrowed are determined, and the determined search condition is searched in the basic database to be used. Acquiring the number of results, and acquiring the coefficients relating to the basic database and the search target database to be used from the coefficient database, and multiplying the coefficient by the number of search results in the basic database to be used and the number of search results of the search target database Means for estimating the number of search results for estimating Results Results number and having a search range determining means for the determination of the search range so as to fall within a desired range.

【0012】また請求項6に記載の発明は、請求項4又
は5のいずれかに記載のデータベースの検索範囲決定装
置において、含有する情報の種類の異なる複数の情報種
類別基本データベースと、検索対象データベース毎に該
検索対象データベースが含有する情報種類名が格納され
る情報種類データベースと、前記相関が高い情報の種類
名を検索対象データベースが含有する情報の種類と判定
し該情報種類名を前記情報種類データベースに格納する
情報種類決定手段とを有し、前記係数決定手段は、前記
標本検索条件についての検索対象データベースにおける
検索結果数と、情報の種類毎の基本データベースにおけ
る検索結果数との統計的な相関を算出すると共に、前記
検索結果推定手段は、検索対象データベースと、前記相
関が高い情報を含有する情報種類別基本データベースと
について検索結果数の比の統計的演算を行い、該演算さ
れた検索結果数の比に基づいて検索対象データベースの
検索結果数を推定し、前記検索範囲決定手段は、前記推
定結果から検索範囲を決定することを特徴とする。
According to a sixth aspect of the present invention, there is provided the apparatus for determining a search range of a database according to any one of the fourth and fifth aspects, further comprising: a plurality of information-type basic databases having different types of contained information; An information type database in which an information type name contained in the search target database is stored for each database; and a type name of the highly correlated information is determined as the type of information contained in the search target database, and the information type name is determined as the information. Information type determining means for storing in a type database, wherein the coefficient determining means statistically calculates the number of search results in the search target database for the sample search condition and the number of search results in the basic database for each type of information. And the search result estimating means includes a search target database and information having the high correlation. Statistical calculation of the ratio of the number of search results is performed on the basic database for each type of information to be performed, and the number of search results of the search target database is estimated based on the calculated ratio of the number of search results. A search range is determined from the estimation result.

【0013】請求項4乃至6に記載の発明によれば、検
索対象データベースの検索条件と検索結果数の対の情報
が事前に完全に把握できないようなデータベースに対し
て検索を中継する際に、検索結果数が指定した範囲内に
なるように予め検索範囲を決定しておくようにしたの
で、常に指定する範囲内の検索結果数が得られるような
検索中継を行うことができるデータベースの検索範囲決
定装置を実現することができる。
According to the present invention, when a search is relayed to a database in which the information of the pair of the search condition and the number of search results of the search target database cannot be completely grasped in advance, Since the search range is determined in advance so that the number of search results is within the specified range, the search range of the database can be used to perform search relay so that the number of search results within the specified range is always obtained. A decision device can be realized.

【0014】更に請求項7に記載の発明は、検索対象デ
ータベースの検索条件と検索結果数の対の情報が事前に
完全に把握できないようなデータベースに対して検索を
中継する際に、検索対象データベースとは別の基本デー
タベースの中から事前に検索条件を標本抽出し、該標本
検索条件についてのみ検索対象データベースに対して事
前に検索を実行し、それらの標本検索条件について基本
データベース及び検索対象データベースにおける検索結
果数を求め、検索対象データベースと基本データベース
の検索結果数の比を算出しておき、任意の検索条件に対
して、基本データベースにおける検索結果数と、事前に
算出しておいた検索対象データベースと基本データベー
スの検索結果数の比とを乗じて指定された検索条件の検
索対象データベースにおける検索結果数の推定を行うこ
とを特徴とするデータベースの検索範囲決定方法をコン
ピュータにより実行させるためのプログラムを記録した
コンピュータにより読み取り可能な記録媒体を要旨とす
る。
According to a seventh aspect of the present invention, when a search is relayed to a database in which information on a pair of a search condition and the number of search results of the search target database cannot be completely grasped in advance, the search target database A search condition is sampled in advance from another basic database, and a search is performed in advance on the search target database only for the sample search condition, and the sample search conditions are compared in the basic database and the search target database. Find the number of search results, calculate the ratio of the number of search results between the search target database and the base database, and calculate the number of search results in the base database and the search target database calculated in advance for any search conditions. Multiplied by the ratio of the number of search results in the basic database to the search target database of the specified search condition. It is summarized as a computer-readable recording medium having recorded thereon a program for causing a computer to execute the search range determining method of the database, characterized in that to search results number of estimation in.

【0015】また請求項8に記載の発明は、検索対象デ
ータベースの検索条件と検索結果数の対の情報が事前に
完全に把握できないようなデータベースに対して検索を
中継する際に、 検索結果数が指定する範囲内になるよ
うに予め検索範囲を決定するため、検索対象データベー
とは別の基本データベースを利用して指定された検索条
件の検索範囲を広げた場合の検索条件と、狭めた場合の
検索条件を複数、決定し、それらの検索条件に関して請
求項1に記載の検索結果数の推定を行い、その推定結果
から検索結果数が所望の範囲内に収まるように検索範囲
の決定を行うことを特徴とするデータベースの検索範囲
決定方法をコンピュータにより実行させるためのプログ
ラムを記録したコンピュータにより読み取り可能な記録
媒体を要旨とする。
According to the invention described in claim 8, when the search is relayed to a database in which the information of the pair of the search condition and the number of search results of the search target database cannot be completely grasped in advance, the number of search results is reduced. In order to determine the search range in advance so that it is within the specified range, the search condition when the search range of the specified search condition is expanded using a basic database different from the search target database, In this case, a plurality of search conditions are determined, and the number of search results according to claim 1 is estimated with respect to the search conditions, and a search range is determined from the estimated results so that the number of search results falls within a desired range. A gist of the present invention is a computer-readable recording medium that stores a program for causing a computer to execute a method of determining a search range of a database.

【0016】更に請求項9に記載の発明は、含有する情
報の種類の異なる基本データベースを複数 、用意し、
標本検索条件についての検索対象データベースにおける
検索結果数と、情報の種類毎の基本データベースにおけ
る検索結果数との統計的な相関を算出し、相関が高い情
報の種類名を検索対象データベースが含有する情報の種
類と判断し、検索対象データベースと、前記相関が高い
情報の種類別基本データベースとについて検索結果数の
比の統計的演算を行い、該演算された検索結果数の比に
基づいて検索対象データベースの検索結果数を推定し、
該推定結果から検索範囲を決定することを特徴とする請
求項1又は2のいずれかに記載のデータベースの検索範
囲決定方法をコンピュータにより実行させるためのプロ
グラムを記録したコンピュータにより読み取り可能な記
録媒体を要旨とする。
Further, according to the ninth aspect of the present invention, a plurality of basic databases having different types of contained information are prepared,
Calculates the statistical correlation between the number of search results in the search target database for the sample search condition and the number of search results in the basic database for each type of information, and the information that the search target database contains the type name of the highly correlated information And performing a statistical operation on the ratio of the number of search results for the search target database and the basic database for each type of the highly correlated information, and based on the calculated ratio of the number of search results, the search target database. Estimate the number of search results for,
A computer-readable recording medium storing a program for causing a computer to execute the database search range determination method according to claim 1, wherein a search range is determined from the estimation result. Make a summary.

【0017】請求項7乃至9に記載の発明によれば、検
索対象データベースの検索条件と検索結果数の対の情報
が事前に完全に把握できないようなデータベースに対し
て検索を中継する際に、検索結果数が指定した範囲内に
なるように予め検索範囲を決定しておくようにしたの
で、常に指定する範囲内の検索結果数が得られるような
検索中継を行うことが可能なデータベースの検索範囲決
定方法を実施することができる。
According to the seventh to ninth aspects of the present invention, when a search is relayed to a database in which the information of the pair of the search condition and the number of search results of the search target database cannot be completely grasped in advance, Since the search range is determined in advance so that the number of search results is within the specified range, a database search that can perform search relay so that the number of search results within the specified range is always obtained A range determination method can be implemented.

【0018】[0018]

【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して詳細に説明する。図1に本発明が適用
される検索中継システムの構成の概要を示す。同図にお
いて検索中継システムは検索者1からの要求に応じて検
索対象データベースに対して情報検索を行い、その検索
結果を検索者1に知らせるように中継する検索中継装置
10と、検索実行前に検索対象データベース14に対し
て事前サンプリング調査を行い、この事前サンプリング
調査により得られた検索結果を参照して検索中継装置よ
り与えられた検索条件、検索対象データベース識別子及
び所望検索結果数の各データに基づいて検索実行時にお
ける検索条件及び検索範囲を決定する検索範囲決定装置
12とから構成されている。
Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 shows an outline of a configuration of a search relay system to which the present invention is applied. In FIG. 1, a search relay system performs an information search on a search target database in response to a request from a searcher 1 and relays the search result to inform the searcher 1 of a search result. A pre-sampling survey is performed on the search target database 14, and the search conditions, the search target database identifier, and the desired number of search results given by the search relay device are referred to by referring to the search results obtained by the pre-sampling survey. And a search range determining device 12 for determining a search condition and a search range at the time of execution of the search.

【0019】尚、検索対象データベース14は、検索条
件と検索結果数の対の情報が事前に完全に把握できない
ものとする。
It is assumed that the search target database 14 cannot completely grasp in advance the information of the pair of the search condition and the number of search results.

【0020】上記構成において検索者1が検索中継装置
10に対して検索要求を行うと、検索中継装置10は検
索者1の検索要求に応じて検索条件、検索対象データベ
ース14を特定するデータ(例えば、検索対象データベ
ース識別子)及び所望検索結果数の各データを検索範囲
決定装置12に送出する。
When the searcher 1 makes a search request to the search relay device 10 in the above configuration, the search relay device 10 responds to the search request of the searcher 1 by specifying search conditions and data (for example, data specifying the search target database 14). , The search target database identifier) and the desired number of search results are sent to the search range determination device 12.

【0021】一方、検索範囲決定装置12は、検索実行
前に検索対象データベース14に対して事前サンプリン
グ調査を行う。すなわち、検索対象データベース14と
は別の基本データベースの中から事前に検索条件を標本
抽出し、該標本検索条件についてのみ検索対象データベ
ース14に対して事前に検索を実行し、与えられた検索
条件及び検索範囲についての検索結果数を推定するため
の基礎となるデータを検索結果として取得する。この事
前サンプリング調査は検索中継システム全体で1度、行
われるのみであり、検索中継が行われる度に行われるも
のでもなく、また検索中継の際に検索中継装置10より
与えられる検索条件に従って実行されるものでもない。
検索範囲決定装置12は、上記事前サンプリング調査の
検索結果を参照し、検索中継装置10より与えられた検
索条件、検索対象データベース14を特定するデータ
(例えば、検索対象データベース識別子)及び所望検索
結果数の各データに基づいて検索中継装置10による検
索対象データベース14への検索実行時における検索条
件及び検索範囲を決定し、そのデータを検索中継装置1
0に送出する。
On the other hand, the search range determination device 12 performs a pre-sampling survey on the search target database 14 before executing the search. That is, a search condition is sampled in advance from a basic database different from the search target database 14, a search is performed in advance on the search target database 14 only for the sample search condition, and the given search condition and Data as a basis for estimating the number of search results for the search range is obtained as search results. This pre-sampling survey is performed only once in the entire search relay system, not every time the search relay is performed, and is performed according to the search condition given by the search relay device 10 at the time of the search relay. Not something.
The search range determination device 12 refers to the search result of the pre-sampling survey, and searches for the search condition provided by the search relay device 10, data for specifying the search target database 14 (for example, a search target database identifier), and the number of desired search results. The search condition and the search range at the time of executing the search to the search target database 14 by the search relay device 10 are determined based on each data of
Send to 0.

【0022】検索中継装置10は、検索範囲決定装置1
2より検索条件及び検索範囲のデータを受け取り、検索
対象データベース14に送出する。検索対象データベー
ス14は与えられた検索条件及び検索範囲に基づいて情
報検索し、その検索結果を検索中継装置10を介して検
索者1に出力する。
The search relay device 10 is a search range determining device 1
2, the data of the search condition and the search range are received and sent to the search target database 14. The search target database 14 searches for information based on the given search conditions and search range, and outputs the search results to the searcher 1 via the search relay device 10.

【0023】次に本発明の実施の形態に係るデータベー
スの検索範囲決定装置の構成を図2に示す。同図におい
てデータベースの検索範囲決定装置は、常時動作部分1
00と、事前動作部分120とから構成されている。
Next, FIG. 2 shows the configuration of the database search range determining apparatus according to the embodiment of the present invention. In the figure, the apparatus for determining the search range of the database includes
00 and a pre-operation part 120.

【0024】常時動作部分100は、検索対象データベ
ース14の検索実行時における検索範囲を決定する処理
をする際に動作する部分であり、図1における検索中継
装置10より検索条件、検索対象データベース識別子及
び所望検索結果数を示すデータ300を受け取り、決定
した検索条件及び検索範囲を示すデータ301を検索中
継装置10に出力する。
The constantly operating portion 100 is a portion that operates when a process of determining a search range at the time of executing a search of the search target database 14 is performed. The search relay device 10 in FIG. Data 300 indicating the desired number of search results is received, and data 301 indicating the determined search condition and search range is output to search relay device 10.

【0025】事前動作部分120は、検索対象データベ
ース14の検索実行時における検索範囲を決定する処理
よりも事前に実行される部分であり、検索対象データベ
ース14の検索実行時における検索範囲を決定するため
のデータベースである、情報種類データベース130と
係数データベース132とを構築する。ここで情報種類
データベース130は、複数の各検索対象データベース
14毎にその検索対象データベースが含有する情報の種
類を示すデータが格納されるデータベースであり、係数
データベース132は、検索対象データベース14の検
索結果数と後述する基本データベース140または基本
データベース142の検索結果数との比を統計的に処理
して得られた検索結果数の係数を示すデータが格納され
るデータベースである。
The pre-operation portion 120 is a portion which is executed in advance of the process of determining the search range when executing the search of the search target database 14, and is used for determining the search range when the search of the search target database 14 is executed. , An information type database 130 and a coefficient database 132 are constructed. Here, the information type database 130 is a database in which data indicating the type of information contained in the search target database is stored for each of the plurality of search target databases 14, and the coefficient database 132 is a search result of the search target database 14. This is a database that stores data indicating the coefficient of the number of search results obtained by statistically processing the ratio between the number and the number of search results in the basic database 140 or the basic database 142 described below.

【0026】また基本データベース140は、一般的な
情報数を保持しているデータベースであり、基本データ
ベース142は情報の種類別に基本データベース140
と同様のデータを保持している複数の基本データベース
からなるデータベースである。
The basic database 140 is a database holding a general number of information, and the basic database 142 is a basic database 140 for each type of information.
This is a database consisting of a plurality of basic databases holding the same data.

【0027】事前動作部分120は、検索条件をサンプ
リングする検索条件抽出部122と、検索条件抽出部1
22によりサンプリングされた検索条件に基づいて事前
サンプル調査(サンプル検索)を実行するサンプル検索
実行部124と、サンプル検索実行部124より受け取
った検索対象データベース14及び基本データベース1
40、142の検索結果数について統計的処理を行い検
索対象データベース14の4検索結果数を推定するため
の係数を決定する係数決定部126と、サンプル検索実
行部124より受け取った検索対象データベース14及
び基本データベース140、142の検索結果数につい
て統計的処理を行い、検索対象毎の情報の種類を決定す
る情報種類決定部128とを有している。ここで検索条
件抽出部122は本発明の検索条件抽出手段に、サンプ
ル検索実行部124は本発明のサンプル検索実行手段
に、係数決定部126は本発明の係数決定手段に、情報
種類決定部128は本発明の情報種類決定手段に、それ
ぞれ相当する。
The pre-operation section 120 includes a search condition extracting section 122 for sampling a search condition and a search condition extracting section 1.
A sample search execution unit 124 that executes a preliminary sample investigation (sample search) based on the search conditions sampled by the sample search unit 22, the search target database 14 and the basic database 1 received from the sample search execution unit 124
A coefficient determination unit 126 that performs statistical processing on the number of search results of the search target databases 40 and 142 to determine a coefficient for estimating the number of four search results of the search target database 14, a search target database 14 received from the sample search execution unit 124, An information type determination unit 128 that performs statistical processing on the number of search results of the basic databases 140 and 142 and determines the type of information for each search target. Here, the search condition extraction unit 122 is a search condition extraction unit of the present invention, the sample search execution unit 124 is a sample search execution unit of the present invention, the coefficient determination unit 126 is a coefficient determination unit of the present invention, and the information type determination unit 128 Respectively correspond to information type determination means of the present invention.

【0028】次に事前動作部分120の具体的処理内容
(前処理)を図3を参照して説明する。まず検索条件抽
出部122は基本データベース140より検索条件リス
トを受け取り、かつ含有する情報の種類別に同様のデー
タを保持している基本データベース142より検索条件
リストを受け取り、検索条件をいくつかサンプリングす
る(ステップ200)。次いでサンプル検索実行部12
4は、検索条件抽出部122より受け取った検索条件に
基づいて検索対象データベース14にサンプル検索を実
行する。すなわち、検索条件抽出部122より受け取っ
た検索条件とサンプル検索実行部124自身で判断した
検索範囲を検索対象データベース14に送出し、検索対
象データベース14より検索結果を受け取る(ステップ
202)。
Next, the specific processing contents (pre-processing) of the pre-operation section 120 will be described with reference to FIG. First, the search condition extracting unit 122 receives the search condition list from the basic database 140, and also receives the search condition list from the basic database 142 that holds similar data for each type of contained information, and samples some search conditions ( Step 200). Next, the sample search execution unit 12
4 executes a sample search in the search target database 14 based on the search condition received from the search condition extraction unit 122. That is, the search condition received from the search condition extraction unit 122 and the search range determined by the sample search execution unit 124 itself are sent to the search target database 14, and the search result is received from the search target database 14 (step 202).

【0029】次に係数決定部126は、サンプル検索実
行部124より複数の各検索対象データベース14毎の
検索条件と検索結果数の対の情報を受け取り、かつ基本
データベース140、142よりそれぞれ、検索条件と
検索結果数の対の情報を受け取り、各検索対象データベ
ース14毎に、検索対象データベースにおける検索結果
数と、基本データベース140または基本データベース
142における検索結果数との比を統計的に演算処理し
て(ステップ204)検索対象データベース14の検索
結果数を推定するための検索結果数の係数を決定する
(ステップ206)。次いで係数決定部126は、検索
対象データベース識別子、基本データベース識別子、検
索結果数の係数の組のデータを係数データベース132
に格納する(ステップ208)。この検索結果数の係数
を後述する常時動作部分の実行時処理で基本データベー
スでの検索結果数に乗じることにより検索対象データベ
ース14の検索結果数の推定を行う。
Next, the coefficient determination unit 126 receives information on pairs of search conditions and the number of search results for each of the plurality of search target databases 14 from the sample search execution unit 124, and retrieves the search conditions from the basic databases 140 and 142, respectively. And a pair of information of the number of search results and the ratio of the number of search results in the search target database to the number of search results in the base database 140 or the base database 142 are statistically calculated for each search target database 14. (Step 204) A coefficient of the number of search results for estimating the number of search results of the search target database 14 is determined (Step 206). Next, the coefficient determining unit 126 converts the data of the set of the search target database identifier, the basic database identifier, and the number of search result coefficients into the coefficient database 132.
(Step 208). The number of search results in the search target database 14 is estimated by multiplying the coefficient of the number of search results by the number of search results in the basic database in the execution process of the constant operation part described later.

【0030】他方、情報種類決定部128は、サンプル
検索実行部124より複数の各検索対象データベース1
4毎の検索条件と検索結果数の対の情報を受け取り、か
つ基本データベース140、142よりそれぞれ、検索
条件と検索結果数の対の情報を受け取り、これらのデー
タを統計的に演算処理し、検索対象データベース14か
ら得られた検索条件と検索結果数の対のデータが、基本
データベース140、情報種類別に設けられた基本デー
タベース142のいずれと相関が高いかを調べる(ステ
ップ210)。ステップ210で検索結果数の相関を調
べた結果、相関が高かった基本データベース140、ま
たは情報の種類別基本データベース142の情報の種類
を検索対象データベース14毎の情報の種類と判断し
(ステップ212)、検索対象データベース識別子と、
相関が高かった情報の種類別基本データベース142
(または基本データベース140)の識別子の組のデー
タを情報種類データベース130に格納する(ステップ
214)。検索対象データベース識別子と、相関が高か
った情報の種類別基本データベース142(または基本
データベース140)の識別子の組のデータを後述する
常時動作部分で行われる実行時処理で参照し、検索対象
データベース14での検索結果数の推定には相関の高か
った情報の種類別基本データベース142(または基本
データベース140)を使用するようにする。
On the other hand, the information type determination unit 128 sends a plurality of search target databases 1 from the sample search execution unit 124.
The information of the pair of the search condition and the number of search results is received for each of the four, and the information of the pair of the search condition and the number of search results is received from the basic databases 140 and 142, respectively, and these data are statistically operated. It is checked whether the data of the pair of the search condition and the number of search results obtained from the target database 14 has a higher correlation with the basic database 140 or the basic database 142 provided for each information type (step 210). As a result of examining the correlation of the number of search results in step 210, it is determined that the type of information in the basic database 140 or the type-specific basic database 142 having a high correlation is the type of information for each search target database 14 (step 212). , Search target database identifier,
Basic database 142 by type of information with high correlation
The data of the set of identifiers (or the basic database 140) is stored in the information type database 130 (step 214). The data of a set of the search target database identifier and the identifier of the basic database 142 (or the basic database 140) for each type of information having a high correlation is referred to in a later-described runtime process performed in a constantly operating part, and is referred to by the search target database 14. In order to estimate the number of search results, the basic database 142 (or the basic database 140) for each type of information having a high correlation is used.

【0031】一方、常時動作部分100は、使用すべき
基本データベースを決定する使用基本データベース決定
部102と、使用基本データベース決定部102により
決定された基本データベースと、係数データベース13
2の内容とを参照して検索対象データベース14の検索
結果数を推定する検索結果数推定部104と、検索結果
数推定部104による推定結果に基づいて検索範囲を決
定する係数決定部106とを有している。ここで使用基
本データベース決定部102は本発明の使用基本データ
ベース決定手段に、検索結果数推定部104は本発明の
検索結果数推定手段に、検索範囲決定部106は本発明
の検索範囲決定手段に、それぞれ相当する。
On the other hand, the constantly operating part 100 includes a used basic database determining unit 102 for determining a basic database to be used, a basic database determined by the used basic database determining unit 102, and a coefficient database 13
2, a search result number estimating unit 104 for estimating the number of search results of the search target database 14 with reference to the content of the search target database 14, and a coefficient determining unit 106 for determining a search range based on the estimation result by the search result number estimating unit 104. Have. Here, the used basic database determining unit 102 is used as the used basic database determining unit of the present invention, the search result number estimating unit 104 is used as the search result number estimating unit of the present invention, and the search range determining unit 106 is used as the search range determining unit of the present invention. , Respectively.

【0032】次に常時動作部分100の具体的処理内容
(実行時処理)を図4を参照して説明する。まず使用基
本データベース決定部102は、図1に示す検索中継装
置10より検索条件、検索対象データベース識別子及び
所望検索数を示すデータ300を受け取ると共に、情報
種類データベース130より複数の各検索対象データベ
ース14の情報種類を示す、検索対象データベース識別
子及び相関が高かった情報の種類別基本データベース1
42(または基本データベース140)の識別子の組の
データ群を読み出し、検索対象データベース識別子で一
致を取り、検索対象データベース14の情報種類を決定
する。すなわち、検索対象データベース14の検索範囲
を決定するのに使用すべき基本データベースの識別子を
取得する(ステップ400)。
Next, the specific processing content (execution processing) of the constantly operating part 100 will be described with reference to FIG. First, the use basic database determination unit 102 receives the search condition, the search target database identifier, and the data 300 indicating the desired number of searches from the search relay device 10 shown in FIG. Basic database 1 for each type of information indicating the type of information and the identifier of the search target database and the information having a high correlation
The data group of the identifier set 42 (or the basic database 140) is read out, a match is made with the search target database identifier, and the information type of the search target database 14 is determined. That is, the identifier of the basic database to be used for determining the search range of the search target database 14 is obtained (step 400).

【0033】次。検索結果数推定部104は、使用基本
データベース決定部102より使用すべき基本データベ
ース(140または142)の識別子を受け取り、この
基本データベース識別子により特定される基本データベ
ースを参照して指定された検索条件の検索範囲を広げた
場合の検索条件や、検索条件の検索範囲を狭めた場合の
検索条件を決定する(ステップ402)。
Next. The search result number estimating unit 104 receives the identifier of the basic database (140 or 142) to be used from the use basic database determining unit 102, and refers to the basic database specified by the basic database identifier to specify the search condition. A search condition when the search range is expanded or a search condition when the search range of the search condition is narrowed is determined (step 402).

【0034】次いで検索結果数推定部104は、ステッ
プ402で決定した検索条件について使用すべき基本デ
ータベースより該基本データベースにおける検索結果数
を取得し(ステップ404)、かつ係数データベース1
32より検索対象データベースと使用すべき基本データ
ベースとの検索結果数の比を統計的に演算処理して得ら
れた係数を取得すると共に(ステップ406)、ステッ
プ404で所得した基本データベースにおける検索結果
数にステップ406で取得した係数を乗じて検索対象デ
ータベース14における検索結果数を推定する(ステッ
プ408)。
Next, the search result number estimating unit 104 acquires the number of search results in the basic database from the basic database to be used for the search condition determined in step 402 (step 404), and obtains the coefficient database 1
32, a coefficient obtained by statistically calculating the ratio of the number of search results between the search target database and the basic database to be used is obtained (step 406), and the number of search results in the basic database obtained in step 404 is obtained. Is multiplied by the coefficient obtained in step 406 to estimate the number of search results in the search target database 14 (step 408).

【0035】検索範囲決定部106は、検索結果数推定
部104により推定された検索対象データベース14に
おける検索結果数を受け取り、所望の検索範囲に収まる
ように検索条件を決定する(ステップ410)。
The search range determining unit 106 receives the number of search results in the search target database 14 estimated by the search result number estimating unit 104, and determines search conditions so as to fall within a desired search range (step 410).

【0036】事前動作部分120及び常時動作部分10
0の具体的処理内容(図3、図4)は本発明の実施の形
態に係るデータベースの検索範囲決定方法に相当する。
The pre-operation part 120 and the always-operation part 10
0 (FIGS. 3 and 4) corresponds to the database search range determination method according to the embodiment of the present invention.

【0037】また本発明の実施の形態に係るデータベー
スの検索範囲決定方法をコンピュータにより実行させる
ためのプログラムを記録したコンピュータにより読み取
り可能な記録媒体も本発明の技術的範囲に属するもので
ある。
A computer-readable recording medium that records a program for causing a computer to execute the database search range determining method according to the embodiment of the present invention also belongs to the technical scope of the present invention.

【0038】次にデータベースの検索範囲決定装置12
の実施例について図5乃至図9を参照して説明する。こ
の実施例は、検索条件として検索者よりある場所の「住
所」が与えられた場合に、データベースの検索範囲決定
装置12が、検索対象データベースに合わせて、検索結
果数が所望の範囲に収まるように受け取った検索条件と
しての「住所」の検索範囲を調節、変更して出力するも
のである。
Next, the database search range determining device 12
Will be described with reference to FIGS. 5 to 9. FIG. In this embodiment, when an "address" of a certain place is given by a searcher as a search condition, the search range determination device 12 of the database sets the number of search results in a desired range according to the search target database. The search range of the “address” as the search condition received in the above is adjusted, changed, and output.

【0039】まず図2における事前動作部分120の処
理内容について説明する。基本データベース140は及
び情報種類別基本データベース142は、例えば、図5
に示すようなものである。情報種類別基本データベース
142は複数の基本データベースを有し、ホテルの情報
に関する基本データベース142−1を含んでいる。こ
こで検索対象データベース14は検索対象データベース
A,Bの2種類があるものとし、以下の処理を1回、行
っておく。
First, the processing contents of the pre-operation section 120 in FIG. 2 will be described. The basic database 140 and the information-specific basic database 142 are, for example, as shown in FIG.
It is as shown in. The information type-specific basic database 142 has a plurality of basic databases, and includes a basic database 142-1 relating to hotel information. Here, it is assumed that the search target database 14 has two types of search target databases A and B, and the following processing is performed once.

【0040】まず検索条件抽出部122は、図5に示す
基本データベース140、142より「東京都中央
区」、「埼玉県入間郡」、「大阪府大阪市北区」の3箇
所の住所を検索条件としてサンプリングする。サンプル
検索実行部124は、この3箇所の住所について検索対
象データベースA,Bのそれぞれについてサンプル検索
を実行し、図6に示すような実行結果を得る。
First, the retrieval condition extraction unit 122 retrieves three addresses of "Chuo-ku, Tokyo", "Iruma-gun, Saitama" and "Kita-ku, Osaka-shi" from the basic databases 140 and 142 shown in FIG. Sampling is performed as a condition. The sample search execution unit 124 executes a sample search for each of the search target databases A and B for these three addresses, and obtains an execution result as shown in FIG.

【0041】係数決定部126は「東京都中央区」、
「埼玉県入間郡」、「大阪府大阪市北区」の検索条件に
ついてサンプル検索実行部124によるサンプル検索結
果と基本データベース140、142との内容を比較
し、統計的な演算処理を行い、図7に示すように検索対
象データベースA,B毎に基本データベース140、1
42との係数を求め、係数データベース132に格納す
る。図7に示す係数データベース132に格納される係
数は、検索対象データベースA,Bでの検索結果数と基
本データベース140、142での検索結果数との比の
統計的な演算処理結果であり、その統計処理の一つとし
て、例えば単純平均をとることが考えられ、図7は単純
平均を取った例を示している。すなわち、図5に示すよ
うに基本データベース140の「東京都中央区」、「埼
玉県入間郡」、「大阪府大阪市北区」の検索条件につい
て情報数は、それぞれ、74,000件、7,000
件、50,000件であり、検索対象データベースAの
サンプル検索実行結果は、「東京都中央区」、「埼玉県
入間郡」、「大阪府大阪市北区」の検索条件について情
報数は、それぞれ、7,000件、500件、3,40
0件であるから、検索対象データベースAについて、基
本データベース140との間の係数は、 (7000/7400+500/7000+3400/
50000)/3≒0.078 また基本データベース(ホテル)142−1の「東京都
中央区」、「埼玉県入間郡」、「大阪府大阪市北区」の
検索条件について情報数は、それぞれ、1000件、1
0件、800件であるから、検索対象データベースAに
ついて、基本データベース142−1との間の係数は、 (7000/1000+500/10+3400/80
0)/3≒20.42 となる。
The coefficient determining unit 126 determines “Chuo-ku, Tokyo”,
For the search conditions of “Iruma-gun, Saitama” and “Kita-ku, Osaka, Osaka”, the result of the sample search by the sample search execution unit 124 is compared with the contents of the basic databases 140 and 142, and statistical calculation processing is performed. As shown in FIG. 7, the basic databases 140, 1
42 and is stored in the coefficient database 132. The coefficients stored in the coefficient database 132 shown in FIG. 7 are the results of statistical calculation of the ratio between the number of search results in the search target databases A and B and the number of search results in the basic databases 140 and 142. As one of the statistical processes, for example, taking a simple average is conceivable, and FIG. 7 shows an example in which a simple average is taken. That is, as shown in FIG. 5, the number of information items for the search conditions of “Chuo-ku, Tokyo”, “Iruma-gun, Saitama”, and “Kita-ku, Osaka-shi” in the basic database 140 are 74,000 and 7,000 respectively. 000
And 50,000, and the results of the sample search of the search target database A are as follows: The number of information items for the search conditions of "Chuo-ku, Tokyo", "Iruma-gun, Saitama", and "Kita-ku, Osaka-shi" 7,000,500,3,40 respectively
Since there are no records, the coefficient between the search target database A and the basic database 140 is (7000/7400 + 500/7000 + 3400 /
50,000) /3@0.078 Also, the number of information for the search conditions of “Chuo-ku, Tokyo”, “Iruma-gun, Saitama”, and “Kita-ku, Osaka-shi” in the basic database (hotel) 142-1 is as follows. 1000 cases, 1
Since there are 0 and 800 cases, the coefficient between the search target database A and the basic database 142-1 is (7000/1000 + 500/10 + 3400/80)
0) /3≒20.42.

【0042】また検索対象データベースBのサンプル検
索実行結果は、「東京都中央区」、「埼玉県入間郡」、
「大阪府大阪市北区」の検索条件について情報数は、そ
れぞれ、900件、9件、720件であるから、検索対
象データベースBについて、基本データベース140と
の間の係数は、 (900/74000+9/7000+720/500
00)/3≒0.0092、 更に検索対象データベースBについて、基本データベー
ス(ホテル)142−1との間の係数は、 (900/1000+9/10+720/800)/3
≒0.90 となる。したがって、係数データベース132に格納さ
れる検索対象データベースA,Bの基本データベース1
40、142−1に対する係数は図7に示すようにな
る。一方、情報種類決定部128は、サンプル検索実行
部12によるサンプル検索結果と基本データベース14
0、142−1との内容を比較し、統計的な演算処理を
行い、個々の検索対象データベースA,Bと、個々の基
本データベース140、142−1との相関を調べ、情
報種類の決定を行い、図8に示す処理結果を得る。
The sample search execution results of the search target database B are “Chuo-ku, Tokyo”, “Iruma-gun, Saitama”,
The number of information items for the search condition of “Kita Ward, Osaka City, Osaka Prefecture” is 900, 9, and 720, respectively. Therefore, the coefficient between the search target database B and the basic database 140 is (900/74000 + 9). / 7000 + 720/500
00) /3≒0.0092, and the coefficient between the search target database B and the basic database (hotel) 142-1 is (900/1000 + 9/10 + 720/800) / 3
≒ 0.90. Therefore, the basic database 1 of the search target databases A and B stored in the coefficient database 132
The coefficients for 40 and 142-1 are as shown in FIG. On the other hand, the information type determination unit 128 compares the sample search result by the sample search execution unit 12 with the basic database 14.
0, 142-1 are compared, statistical calculation is performed, the correlation between each of the search target databases A, B and each of the basic databases 140, 142-1 is checked, and the information type is determined. Then, the processing result shown in FIG. 8 is obtained.

【0043】情報種類決定部128による情報種類の決
定は、本実施例ではデータベース間の相関係数rの高低
により決定する。一般に相関係数rは以下に示す演算に
より求められる。検索対象データベースA,Bの変数を
x,基本データベース140,142−1の変数をy,
変数x,yの平均値をx,yとすると、平均値x,y
は、
In this embodiment, the information type is determined by the information type determining unit 128 based on the level of the correlation coefficient r between the databases. Generally, the correlation coefficient r is obtained by the following calculation. The variables of the search target databases A and B are x, the variables of the basic databases 140 and 142-1 are y,
Assuming that the average values of the variables x and y are x and y, the average values x and y
Is

【数1】 となる。また変数x,yの標準偏差の2乗をSx,Syと
すると、
(Equation 1) Becomes If the square of the standard deviation of the variables x and y is Sx and Sy,

【数2】 (Equation 2)

【数3】 となる。(Equation 3) Becomes

【0044】またSxyを、Also, Sxy is

【数4】 とすると、Sx,Sy,Sxyから相関係数rは、(Equation 4) Then, the correlation coefficient r from Sx, Sy, and Sxy is

【数5】 となる。式(1)〜(5)によりデータベース間の相関
係数rについて以下に具体的に算出する。{x}={7
000,500,3400},{y}={74000,
7000,50000}とすれば、式(1)〜(4)に
より、 x≒3633,y≒43667 Sx≒21206667,Sy≒2304666667 Sxy≒215533333 となる。したがって、式(5)より、検索対象データベ
ースAについて基本データベース140との相関係数r
1は、 r1=0.97 となる。
(Equation 5) Becomes The correlation coefficient r between the databases is specifically calculated by the equations (1) to (5) below. {X} = {7
000,500,3400}, {y} = {74000,
If it is set to 7000, 50000, then, according to the equations (1) to (4), x becomes 3633, y is 43667 Sx is 21206667, Sy is 2304666667 Sxy is 215333333. Therefore, from the equation (5), the correlation coefficient r between the search target database A and the basic database 140 is obtained.
1 becomes r1 = 0.97.

【0045】同様にして検索対象データベースAについ
て基本データベース(ホテル)142−1との相関係数
r2について求める。{x}={7000,500,3
400},{y}={1000,10,800}とすれ
ば、式(1)〜(4)により、 x≒3633,y≒603 Sx≒21206667,Sy≒548067 Sxy≒3148667 となる。したがって、式(5)より、検索対象データベ
ースAについて基本データベース142−1との相関係
数r2は、 r2=0.92 となる。
Similarly, the correlation coefficient r2 of the search target database A with the basic database (hotel) 142-1 is obtained. {X} = {7000,500,3}
Assuming that 400}, {y} = {1000, 10, 800}, x {3633, y} 603 Sx {21206667, Sy ≒ 548067 Sxy ≒ 3148667 from equations (1) to (4). Therefore, from Equation (5), the correlation coefficient r2 of the search target database A with the basic database 142-1 is r2 = 0.92.

【0046】更に検索対象データベースBについて基本
データベース140との相関係数r3は、{x}={9
00,9,720},{y}={74000,700
0,50000}とすれば、式(1)〜(4)により、 x≒543,y≒43667 Sx≒443934,Sy≒2304666667 Sxy≒31530000 となる。したがって、式(5)より、検索対象データベ
ースBについて基本データベース140との相関係数r
3は、 r3=0.98 となる。また検索対象データベースBについて基本デー
タベース(ホテル)142−1との相関係数r4は、
{x}={900,9,720},{y}={100
0,10,800}とすれば、式(1)〜(4)によ
り、 x≒543,y≒603 Sx≒443934,Sy≒548067 Sxy≒493260 となる。したがって、式(5)より、検索対象データベ
ースBについて基本データベース142−1との相関係
数r4は、 r4=1.00 となる。
Further, the correlation coefficient r3 between the search target database B and the basic database 140 is {x} = {9
00,9,720}, {y} = {74000,700
If it is 0.50000, x {543, y} 43667 Sx {443934, Sy} 230466667 Sxy @ 31530000 is obtained from the equations (1) to (4). Therefore, from the equation (5), the correlation coefficient r between the search target database B and the basic database 140 is obtained.
3 becomes r3 = 0.98. The correlation coefficient r4 between the search target database B and the basic database (hotel) 142-1 is
{X} = {900,9,720}, {y} = {100
If 0, 10, 800}, x {543, y} 603 Sx {443934, Sy} 548067 Sxy @ 493260 from equations (1) to (4). Therefore, from equation (5), the correlation coefficient r4 between the search target database B and the basic database 142-1 is r4 = 1.00.

【0047】上述した演算により図8に示すデータベー
ス間の相関係数が得られる。したがって、図8から明ら
かなように情報種類決定部128は、検索対象データベ
ースAは一般的な情報を含有している基本データベース
140と相関が高く、基本データベース140を用いる
のが妥当であると判断する。また検索対象データベース
Bについては、基本データベース(情報種類別)142
のうち情報種類がホテルの基本データベース142−1
との相関が高いと判断し、含有する情報種類はホテルで
あり、基本データベース(情報種類別)142のうちホ
テルの基本データベースを用いるのが妥当であると判断
する。情報種類決定部128は、図8において丸印のつ
いた判断結果、すなわち検索対象データベースAについ
ては検索対象データベースAの識別子と基本データベー
ス140の識別子の組のデータを、また検索対象データ
ベースBについては検索対象データベースBの識別子と
基本データベース(情報種類別)142のうちホテルの
基本データベース142−1の識別子との組のデータを
情報種類別データベース130に格納する。
The correlation coefficient between the databases shown in FIG. 8 is obtained by the above-described calculation. Therefore, as is clear from FIG. 8, the information type determination unit 128 determines that the search target database A has a high correlation with the basic database 140 containing general information, and that it is appropriate to use the basic database 140. I do. For the search target database B, a basic database (by information type) 142
Of which information type is the basic database 142-1 of the hotel
Is determined to be highly correlated, and the type of information contained is a hotel, and it is determined that it is appropriate to use the basic database of the hotel among the basic databases (by information type) 142. The information type determination unit 128 determines the result of the determination marked with a circle in FIG. 8, that is, the data of the set of the identifier of the search target database A and the identifier of the basic database 140 for the search target database A, and the search result for the search target database B. The data of the set of the identifier of the search target database B and the identifier of the basic database 142-1 of the hotel among the basic databases (by information type) 142 is stored in the database 130 by information type.

【0048】次に図2における常時動作部分100の処
理内容について説明する。検索条件として検索条件とし
て「東京都新宿区西新宿1丁目付近」、検索対象データ
ベース識別子として「B」が検索中継装置10より指定
されたものとする。使用基本データベース決定部102
は、情報種類データベース130を参照して検索対象デ
ータベース識別子Bの一致をとり、検索対象データベー
スBについては基本データベース(情報種類別)142
のうちホテルの基本データベース142−1を用いると
判断する。次いで検索結果数推定部104は、基本デー
タベース(ホテル)142−1と、係数データベース1
32を参照し、検索対象データベースBに関して、基本
データベース(ホテル)142−1に対する検索結果数
についての係数は「0.9」であると判断し、また基本
データベース(ホテル)142−1における「東京
都」、「東京都新宿区」、「東京都新宿区西新宿」、
「東京都新宿区西新宿1丁目」の各々の検索条件に対す
る情報数は、それぞれ30,000件、3,000件、
200件、20件であるから、これらの検索条件に対す
る検索対象データベースBにおける検索結果数は係数
「0.9」を上記各情報数に乗ずることにより図9に示
すように「東京都」、「東京都新宿区」、「東京都新宿
区西新宿」、「東京都新宿区西新宿1丁目」の各々の検
索条件について27,000件、2,700件、180
件、18件と推定する。
Next, the processing content of the constantly operating portion 100 in FIG. 2 will be described. It is assumed that “1” near Nishi-Shinjuku, Shinjuku-ku, Tokyo is specified as a search condition and “B” is specified as a search target database identifier by the search relay device 10. Use basic database determination unit 102
Matches the search target database identifier B with reference to the information type database 130, and finds the basic database (by information type) 142 for the search target database B.
It is determined that the basic database 142-1 of the hotel is used. Next, the number-of-retrieval-result estimating unit 104 includes the basic database (hotel) 142-1 and the coefficient database 1
32, the coefficient of the number of search results for the basic database (hotel) 142-1 is determined to be “0.9” with respect to the search target database B, and “Tokyo” in the basic database (hotel) 142-1 is determined. Tokyo "," Shinjuku-ku, Tokyo "," Nishi-Shinjuku, Shinjuku-ku, Tokyo ",
The number of information for each search condition of "Nishi-Shinjuku 1-chome, Shinjuku-ku, Tokyo" is 30,000, 3,000, respectively.
Since there are 200 and 20 search results, the number of search results in the search target database B for these search conditions is calculated by multiplying the above information count by the coefficient “0.9” as shown in FIG. 27,000, 2,700, 180 for each search condition of "Shinjuku-ku, Tokyo", "Nishi-Shinjuku, Shinjuku-ku, Tokyo" and "1-Chome Nishi-Shinjuku", Shinjuku-ku, Tokyo
And 18 cases.

【0049】次いで検索範囲決定部106は、所望の情
報数の範囲が例えば、100件〜200件に設定されて
いるとすると、図9に示した推定結果から検索結果数が
上記範囲内に属する検索条件は「東京都新宿区西新宿」
であると判定し、検索条件及び検索範囲を示すデータ3
01として「東京都新宿区西新宿」を検索中継装置10
に出力する。本発明の実施の形態によれば、検索条件と
検索結果数の対の情報が事前に完全に把握できないよう
なデータベースに対して検索を中継する際に、検索結果
数が指定する範囲内になるように検索対象データベース
の検索結果を推定して検索実行全に予め検索範囲を決定
するようにしたので、常に指定する範囲内の検索結果数
が得られるような検索中継を実施することができる。
Next, assuming that the range of the desired number of information is set to, for example, 100 to 200, the search range determining unit 106 determines that the number of search results belongs to the above range from the estimation result shown in FIG. Search condition is "Nishi-Shinjuku, Shinjuku-ku, Tokyo"
Is determined, and data 3 indicating a search condition and a search range
01 and search for “Nishi-Shinjuku, Shinjuku-ku, Tokyo”
Output to According to the embodiment of the present invention, when a search is relayed to a database in which the information of the pair of the search condition and the number of search results cannot be completely grasped in advance, the number of search results falls within a specified range. As described above, since the search result of the search target database is estimated and the search range is determined in advance for all the search executions, it is possible to carry out the search relay so that the number of search results within the designated range is always obtained.

【0050】また本実施の形態によれば、従来技術のよ
うに単なる検索結果数の経験則に頼るのではなく、基本
データベース中の検索条件と検索結果数の対の情報に基
づいて検索対象データベースにおける検索結果数の推定
を行うようにしたので、経験則のない検索条件について
も検索結果数の推定及び検索範囲の決定を行うことがで
きる。更に本実施の形態によれば、検索対象データベー
スが含有している情報の種類を考慮して検索結果数の推
定並びに検索範囲の決定を行うようにしたので、含有し
ている情報の種類が異なるデータベースに対しても検索
結果数の推定並びに検索範囲の決定を行うことができ
る。
Further, according to the present embodiment, the search target database is not based on the empirical rule of the number of search results as in the prior art, but based on the information of the pair of the search condition and the number of search results in the basic database. Since the number of search results is estimated in, the number of search results can be estimated and the search range can be determined even for search conditions having no rule of thumb. Furthermore, according to the present embodiment, the number of search results is estimated and the search range is determined in consideration of the type of information contained in the search target database. The number of search results can be estimated and the search range can be determined for the database.

【0051】[0051]

【発明の効果】以上に説明したように請求項1乃至3に
記載の発明によれば、検索対象データベースの検索条件
と検索結果数の対の情報が事前に完全に把握できないよ
うなデータベースに対して検索を中継する際に、検索結
果数が指定した範囲内になるように予め検索範囲を決定
しておくようにしたので、常に指定する範囲内の検索結
果数が得られるような検索中継を行うことができる。請
求項4乃至6に記載の発明によれば、検索対象データベ
ースの検索条件と検索結果数の対の情報が事前に完全に
把握できないようなデータベースに対して検索を中継す
る際に、検索結果数が指定した範囲内になるように予め
検索範囲を決定しておくようにしたので、常に指定する
範囲内の検索結果数が得られるような検索中継を行うこ
とができるデータベースの検索範囲決定装置を実現する
ことができる。請求項7乃至9に記載の発明によれば、
検索対象データベースの検索条件と検索結果数の対の情
報が事前に完全に把握できないようなデータベースに対
して検索を中継する際に、検索結果数が指定した範囲内
になるように予め検索範囲を決定しておくようにしたの
で、常に指定する範囲内の検索結果数が得られるような
検索中継を行うことが可能なデータベースの検索範囲決
定方法を実施することができる。
As described above, according to the first to third aspects of the present invention, a database in which the information of the pair of the search condition and the number of search results of the search target database cannot be completely grasped in advance. When the search is relayed, the search range is determined in advance so that the number of search results is within the specified range. It can be carried out. According to the invention as set forth in claims 4 to 6, when the search is relayed to a database in which the information of the pair of the search condition and the number of search results of the search target database cannot be completely grasped in advance, the number of search results is reduced. The search range is determined in advance so that the search range is within the specified range. Therefore, a database search range determination device that can perform a search relay so that the number of search results within the specified range is always obtained is provided. Can be realized. According to the invention described in claims 7 to 9,
When relaying a search to a database in which the information of the pair of the search condition and the number of search results of the search target database cannot be completely grasped in advance, set the search range in advance so that the number of search results falls within the specified range. Since the determination is made in advance, it is possible to implement a database search range determination method capable of performing a search relay so that the number of search results within a designated range is always obtained.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明が適用されるデータベースの検索中継シ
ステムの構成を示すブロック図。
FIG. 1 is a block diagram showing a configuration of a database search and relay system to which the present invention is applied.

【図2】本発明の実施の形態に係るデータベースの検索
範囲決定装置の構成を示すブロック図。
FIG. 2 is a block diagram showing a configuration of a database search range determining device according to the embodiment of the present invention.

【図3】図2に示したデータベースの検索範囲決定装置
における事前動作部分により実行される処理内容を示す
フローチャート。
FIG. 3 is a flowchart showing processing contents executed by a preliminary operation part in the database search range determination device shown in FIG. 2;

【図4】図2に示したデータベースの検索範囲決定装置
における常時動作部分により実行される処理内容を示す
フローチャート。
FIG. 4 is a flowchart showing processing contents executed by a constantly operating part in the database search range determining device shown in FIG. 2;

【図5】基本データベース及び基本データベース(情報
種類別)の各々に格納されているデータの内容を示す説
明図。
FIG. 5 is an explanatory diagram showing the contents of data stored in each of a basic database and a basic database (by information type).

【図6】図2におけるデータベースの検索範囲決定装置
におけるサンプル検索実行部による検索対象データベー
スに対するサンプル検索の実行結果を示す説明図。
6 is an explanatory diagram showing an execution result of a sample search on a search target database by a sample search execution unit in the database search range determination device in FIG. 2;

【図7】図2におけるデータベースの検索範囲決定装置
における係数データベースに格納されるデータの内容を
示す説明図。
FIG. 7 is an explanatory diagram showing the contents of data stored in a coefficient database in the database search range determining device in FIG. 2;

【図8】図2におけるデータベースの検索範囲決定装置
における情報種類決定部の処理結果を示す説明図。
FIG. 8 is an explanatory diagram showing a processing result of an information type determination unit in the database search range determination device in FIG. 2;

【図9】図2におけるデータベースの検索範囲決定装置
における検索結果数推定部による検索対象データベース
についての検索結果数の推定結果を示す説明図。
9 is an explanatory diagram showing an estimation result of the number of search results for a search target database by a search result number estimation unit in the database search range determination device in FIG. 2;

【符号の説明】[Explanation of symbols]

10 検索中継装置 12 データベースの検索範囲決定装置 14 検索対象データベース 100 常時動作部分 102 使用基本データベース決定部 104 検索結果数推定部 106 検索範囲決定部 120 事前動作部分 122 検索条件抽出部 124 サンプル検索実行部 126 係数決定部 128 情報種類決定部 130 情報種類データベース 132 係数データベース 140 基本データベース 142 基本データベース(情報種類別) REFERENCE SIGNS LIST 10 search relay device 12 database search range determination device 14 search target database 100 constantly operating portion 102 basic database used determining portion 104 search result number estimating portion 106 search range determining portion 120 pre-operation portion 122 search condition extracting portion 124 sample search executing portion 126 coefficient determination unit 128 information type determination unit 130 information type database 132 coefficient database 140 basic database 142 basic database (by information type)

───────────────────────────────────────────────────── フロントページの続き (72)発明者 横路 誠司 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 (72)発明者 島 健一 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 Fターム(参考) 5B075 NK10 NK31 NK37 NR03 NR05 NR12 PP23 PQ05 PR03 PR10 QP05 QP10 UU40  ──────────────────────────────────────────────────続 き Continued on the front page (72) Inventor Seiji Yokoji 3-19-2 Nishi-Shinjuku, Shinjuku-ku, Tokyo Japan Telegraph and Telephone Corporation (72) Inventor Kenichi Shima 3-9-1-2, Nishi-Shinjuku, Shinjuku-ku, Tokyo No. F-term in Nippon Telegraph and Telephone Corporation (reference) 5B075 NK10 NK31 NK37 NR03 NR05 NR12 PP23 PQ05 PR03 PR10 QP05 QP10 UU40

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 検索対象データベースの検索条件と検索
結果数の対の情報が事前に完全に把握できないようなデ
ータベースに対して検索を中継する際に、 検索対象データベースとは別の基本データベースの中か
ら事前に検索条件を標本抽出し、該標本検索条件につい
てのみ検索対象データベースに対して事前に検索を実行
し、それらの標本検索条件について基本データベース及
び検索対象データベースにおける検索結果数を求め、 検索対象データベースと基本データベースの検索結果数
の比を算出しておき、 任意の検索条件に対して、基本データベースにおける検
索結果数と、事前に算出しておいた検索対象データベー
スと基本データベースの検索結果数の比とを乗じて指定
された検索条件の検索対象データベースにおける検索結
果数の推定を行うことを特徴とするデータベースの検索
範囲決定方法。
When a search is relayed to a database in which information on a pair of a search condition and the number of search results of a search target database cannot be completely grasped in advance, a search is performed in a basic database different from the search target database. , Sample the search conditions in advance, perform a search in advance on the search target database only for the sample search conditions, obtain the number of search results in the basic database and the search target database for those sample search conditions, The ratio of the number of search results between the database and the basic database is calculated in advance, and the number of search results in the basic database and the number of search results between the search target database and the basic database calculated in advance for arbitrary search conditions are calculated. Estimation of the number of search results in the search target database of the specified search condition multiplied by the ratio And determining the search range of the database.
【請求項2】 検索対象データベースの検索条件と検索
結果数の対の情報が事前に完全に把握できないようなデ
ータベースに対して検索を中継する際に、検索結果数が
指定する範囲内になるように予め検索範囲を決定するた
め、 検索対象データベースとは別の基本データベースを利用
して指定された検索条件の検索範囲を広げた場合の検索
条件と、狭めた場合の検索条件を複数、決定し、それら
の検索条件に関して請求項1に記載の検索結果数の推定
を行い、その推定結果から検索結果数が所望の範囲内に
収まるように検索範囲の決定を行うことを特徴とするデ
ータベースの検索範囲決定方法。
2. When a search is relayed to a database in which information on a pair of a search condition and a number of search results of a search target database cannot be completely grasped in advance, the number of search results is within a specified range. In order to determine the search range in advance, a plurality of search conditions are determined when the search range of the specified search condition is expanded and narrowed using a basic database different from the search target database. A database search method comprising: estimating the number of search results according to claim 1 with respect to the search conditions; and determining a search range from the estimated result so that the number of search results falls within a desired range. Range determination method.
【請求項3】 含有する情報の種類の異なる基本データ
ベースを複数、用意し、標本検索条件についての検索対
象データベースにおける検索結果数と、情報の種類毎の
基本データベースにおける検索結果数との統計的な相関
を算出し、相関が高い情報の種類名を検索対象データベ
ースが含有する情報の種類と判断し、検索対象データベ
ースと、前記相関が高い情報の種類別基本データベース
とについて検索結果数の比の統計的演算を行い、該演算
された検索結果数の比に基づいて検索対象データベース
の検索結果数を推定し、該推定結果から検索範囲を決定
することを特徴とする請求項1又は2のいずれかに記載
のデータベースの検索範囲決定方法。
3. A plurality of basic databases having different types of contained information are prepared, and the number of search results in a database to be searched for sample search conditions and the number of search results in the basic database for each type of information are statistically calculated. Calculate the correlation, determine the type name of the highly correlated information as the type of information contained in the search target database, and calculate the statistics of the ratio of the number of search results between the search target database and the basic database for each type of the highly correlated information. 3. The method according to claim 1, further comprising: performing a logical operation, estimating the number of search results of the search target database based on a ratio of the calculated number of search results, and determining a search range from the estimated result. Method for determining search range of database described in 1.
【請求項4】 検索対象データベースの検索条件と検索
結果数の対の情報が事前に完全に把握できないようなデ
ータベースに対して検索を中継する際に、前記検索対象
データベースの検索範囲を決定するデータベースの検索
範囲決定装置において、 検索対象データベースとは別の基本データベースの中か
ら事前に検索条件を標本抽出する検索条件抽出手段と、 該検索条件抽出手段により抽出された標本検索条件につ
いてのみ検索対象データベースに対して事前にサンプル
検索を実行するサンプル検索実行手段と、 各検索対象データベース毎に任意の検索条件に対する検
索結果数を予測するための係数データが格納される係数
データベースと、 前記標本検索条件について基本データベース及び検索対
象データベースにおける検索結果数を求め、検索対象デ
ータベースと基本データベースの検索結果数との比とな
る係数を算出し、前記係数データベースに格納する係数
決定手段と、 任意の検索条件に対して、基本データベースにおける検
索結果数に前記係数データベースより読み出した、前記
任意の検索条件に対する事前に算出しておいた検索対象
データベースと基本データベースの検索結果数の比とな
る係数を乗じて、指定された検索条件の検索対象データ
ベースにおける検索結果数の推定を行う検索結果数推定
手段と、 を有することを特徴とするデータベースの検索範囲決定
装置。
4. A database for determining a search range of the search target database when a search is relayed to a database in which information on a pair of a search condition and the number of search results of the search target database cannot be completely grasped in advance. A search condition extracting device for sampling a search condition in advance from a basic database different from the search target database; and a search target database for only the sample search conditions extracted by the search condition extracting device. Sample search execution means for executing a sample search in advance, a coefficient database storing coefficient data for estimating the number of search results for an arbitrary search condition for each search target database, and the sample search condition Find the number of search results in the basic database and the search target database A coefficient determining means for calculating a coefficient which is a ratio between the search target database and the number of search results of the basic database, and storing the coefficient in the coefficient database; Estimating the number of search results in the search target database of the designated search condition by multiplying the read coefficient of the number of search results of the search target database and the basic database calculated in advance for the arbitrary search condition Means for estimating the number of search results, and a search range determining apparatus for a database.
【請求項5】 前記検索対象データベースとは別の使用
すべき基本データベースを決定する使用基本データベー
ス決定手段と、 使用すべき基本データベースから、指定された検索条件
の検索範囲を広げた場合の検索条件と、狭めた場合の検
索条件を複数、決定し、該決定した検索条件について前
記使用すべき基本データベースにおける検索結果数を取
得し、かつ前記係数データベースより使用すべき基本デ
ータベースと検索対象データベースに関する係数を取得
すると共に、前記使用すべき基本データベースにおける
検索結果数と前記係数を乗じて検索対象データベースの
検索結果数を推定する検索結果数推定手段と、 該検索結果数推定手段による推定結果から検索結果数が
所望の範囲内に収まるように検索範囲の決定を行う検索
範囲決定手段と、 を有することを特徴とする請求項4に記載のデータベー
スの検索範囲決定装置。
5. A used basic database determining means for determining a basic database to be used which is different from the search target database, and a search condition when a search range of a specified search condition is expanded from the basic database to be used. And determining a plurality of search conditions in the case of narrowing, obtaining the number of search results in the basic database to be used for the determined search conditions, and obtaining coefficients relating to the basic database and the search target database to be used from the coefficient database. Means for estimating the number of search results of the search target database by multiplying the number of search results in the basic database to be used by the coefficient, and a search result from the estimation result by the search result number estimator. Search range determinator that determines the search range so that the number falls within the desired range When the search range determination apparatus of the database according to claim 4, characterized in that it comprises a.
【請求項6】 含有する情報の種類の異なる複数の情報
種類別基本データベースと、 検索対象データベース毎に該検索対象データベースが含
有する情報種類名が格納される情報種類データベース
と、 前記相関が高い情報の種類名を検索対象データベースが
含有する情報の種類と判定し該情報種類名を前記情報種
類データベースに格納する情報種類決定手段とを有し、 前記係数決定手段は、前記標本検索条件についての検索
対象データベースにおける検索結果数と、情報の種類毎
の基本データベースにおける検索結果数との統計的な相
関を算出すると共に、 前記検索結果推定手段は、検索対象データベースと、前
記相関が高い情報を含有する情報種類別基本データベー
スとについて検索結果数の比の統計的演算を行い、該演
算された検索結果数の比に基づいて検索対象データベー
スの検索結果数を推定し、 前記検索範囲決定手段は、前記推定結果から検索範囲を
決定することを特徴とする請求項4又は5のいずれかに
記載のデータベースの検索範囲決定装置。
6. A plurality of information type basic databases having different types of information to be contained, an information type database storing information type names contained in the search target database for each search target database, and the information having a high correlation. Information type determining means for determining the type name of the information as the type of information contained in the search target database, and storing the information type name in the information type database, wherein the coefficient determining means searches for the sample search condition. A statistical correlation between the number of search results in the target database and the number of search results in the basic database for each type of information is calculated, and the search result estimating means includes the search target database and information having a high correlation. Statistical calculation of the ratio of the number of search results is performed for the basic database for each information type, and the calculated search results are calculated. The number of search results of the search target database is estimated based on the ratio of the search target, and the search range determination unit determines a search range from the estimated result. Search range determination device.
【請求項7】 検索対象データベースの検索条件と検索
結果数の対の情報が事前に完全に把握できないようなデ
ータベースに対して検索を中継する際に、 検索対象データベースとは別の基本データベースの中か
ら事前に検索条件を標本抽出し、該標本検索条件につい
てのみ検索対象データベースに対して事前に検索を実行
し、それらの標本検索条件について基本データベース及
び検索対象データベースにおける検索結果数を求め、 検索対象データベースと基本データベースの検索結果数
の比を算出しておき、 任意の検索条件に対して、基本データベースにおける検
索結果数と、事前に算出しておいた検索対象データベー
スと基本データベースの検索結果数の比とを乗じて指定
された検索条件の検索対象データベースにおける検索結
果数の推定を行うことを特徴とするデータベースの検索
範囲決定方法をコンピュータにより実行させるためのプ
ログラムを記録したコンピュータにより読み取り可能な
記録媒体。
7. When a search is relayed to a database in which the information of the pair of the search condition and the number of search results of the search target database cannot be completely grasped in advance, a search is performed in a basic database different from the search target database. , Sample the search conditions in advance, perform a search in advance on the search target database only for the sample search conditions, obtain the number of search results in the basic database and the search target database for those sample search conditions, The ratio of the number of search results between the database and the basic database is calculated in advance, and the number of search results in the basic database and the number of search results between the search target database and the basic database calculated in advance for arbitrary search conditions are calculated. Estimation of the number of search results in the search target database of the specified search condition multiplied by the ratio A computer-readable recording medium storing a program for causing a computer to execute a method for determining a search range of a database, the method comprising:
【請求項8】 検索対象データベースの検索条件と検索
結果数の対の情報が事前に完全に把握できないようなデ
ータベースに対して検索を中継する際に、検索結果数が
指定する範囲内になるように予め検索範囲を決定するた
め、 検索対象データベーとは別の基本データベースを利用し
て指定された検索条件の検索範囲を広げた場合の検索条
件と、狭めた場合の検索条件を複数、決定し、それらの
検索条件に関して請求項1に記載の検索結果数の推定を
行い、その推定結果から検索結果数が所望の範囲内に収
まるように検索範囲の決定を行うことを特徴とするデー
タベースの検索範囲決定方法をコンピュータにより実行
させるためのプログラムを記録したコンピュータにより
読み取り可能な記録媒体。
8. When a search is relayed to a database in which information on a pair of a search condition and the number of search results of a search target database cannot be completely grasped in advance, the number of search results is within a specified range. In order to determine the search range in advance, a plurality of search conditions are determined when the search range of the specified search condition is expanded and narrowed using a basic database different from the search target database. And a search range is determined so that the number of search results falls within a desired range based on the estimated result. A computer-readable recording medium that records a program for causing a computer to execute the search range determining method.
【請求項9】 含有する情報の種類の異なる基本データ
ベースを複数、用意し、標本検索条件についての検索対
象データベースにおける検索結果数と、情報の種類毎の
基本データベースにおける検索結果数との統計的な相関
を算出し、相関が高い情報の種類名を検索対象データベ
ースが含有する情報の種類と判断し、検索対象データベ
ースと、前記相関が高い情報の種類別基本データベース
とについて検索結果数の比の統計的演算を行い、該演算
された検索結果数の比に基づいて検索対象データベース
の検索結果数を推定し、該推定結果から検索範囲を決定
することを特徴とする請求項1又は2のいずれかに記載
のデータベースの検索範囲決定方法をコンピュータによ
り実行させるためのプログラムを記録したコンピュータ
により読み取り可能な記録媒体。
9. A plurality of basic databases having different types of contained information are prepared, and the number of search results in the search target database for the sample search condition and the number of search results in the basic database for each type of information are statistically calculated. Calculate the correlation, determine the type name of the highly correlated information as the type of information contained in the search target database, and calculate the statistics of the ratio of the number of search results between the search target database and the basic database for each type of the highly correlated information. 3. The method according to claim 1, further comprising: performing a logical operation, estimating the number of search results of the search target database based on a ratio of the calculated number of search results, and determining a search range from the estimated result. Computer-readable recording of a program for causing a computer to execute the method for determining the search range of the database described in 1. Recording medium.
JP10263584A 1998-09-17 1998-09-17 Method and device for deciding retrieval range of database, and recording medium Pending JP2000099514A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10263584A JP2000099514A (en) 1998-09-17 1998-09-17 Method and device for deciding retrieval range of database, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10263584A JP2000099514A (en) 1998-09-17 1998-09-17 Method and device for deciding retrieval range of database, and recording medium

Publications (1)

Publication Number Publication Date
JP2000099514A true JP2000099514A (en) 2000-04-07

Family

ID=17391594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10263584A Pending JP2000099514A (en) 1998-09-17 1998-09-17 Method and device for deciding retrieval range of database, and recording medium

Country Status (1)

Country Link
JP (1) JP2000099514A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003900A (en) * 2006-06-23 2008-01-10 Canon Inc Document retrieval system and its control method, program, and storage medium
WO2010138112A1 (en) 2009-05-27 2010-12-02 Hitachi Software Engineering Co., Ltd. Retrieval system, retrieval space map server apparatus and program
CN105912553A (en) * 2015-02-25 2016-08-31 富士通株式会社 Document search apparatus and document search method
JP2016194865A (en) * 2015-04-01 2016-11-17 富士通株式会社 Search result prediction program, search result prediction method, and search result prediction apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003900A (en) * 2006-06-23 2008-01-10 Canon Inc Document retrieval system and its control method, program, and storage medium
WO2010138112A1 (en) 2009-05-27 2010-12-02 Hitachi Software Engineering Co., Ltd. Retrieval system, retrieval space map server apparatus and program
CN105912553A (en) * 2015-02-25 2016-08-31 富士通株式会社 Document search apparatus and document search method
JP2016194865A (en) * 2015-04-01 2016-11-17 富士通株式会社 Search result prediction program, search result prediction method, and search result prediction apparatus

Similar Documents

Publication Publication Date Title
CN111078488B (en) Data acquisition method, device, storage medium and system
CN111221743A (en) Automatic testing method and system
JP2000011005A (en) Data analyzing method and its device and computer- readable recording medium recorded with data analytical program
CN112528279B (en) Method and device for establishing intrusion detection model
CN106941493A (en) A kind of network security situation awareness result output intent and device
CN110191109B (en) Message sampling method and device
CN112579603A (en) CDC-based data model dynamic information perception monitoring method and device
CN114647853B (en) Method and system for improving vulnerability detection accuracy of distributed application program
CN111797104A (en) Method and device for acquiring data change condition and electronic equipment
CN113923003A (en) Attacker portrait generation method, system, equipment and medium
JP3937341B2 (en) Transaction profile generation system for computer system performance measurement analysis, its generation method and program
JP2000099514A (en) Method and device for deciding retrieval range of database, and recording medium
CN113596019A (en) High-performance network traffic data representation and extraction method and system
CN106874332A (en) Data bank access method and device
CN111064827B (en) Agent detection method, device, equipment and medium based on domain name generic resolution
CN111414528B (en) Method and device for determining equipment identification, storage medium and electronic equipment
CN111211939A (en) Device and method for realizing efficient flow table counting based on network processor
KR100978927B1 (en) Apparatus and method of customer information managing for high-speed internet service
CN113364780B (en) Network attack victim determination method, equipment, storage medium and device
CN115357899A (en) Method and system for detecting storage type loophole based on IAST technology
CN114510486A (en) Dimension table data processing method and device, electronic equipment and storage medium
CN110928954A (en) HBase index synchronization method, HBase index synchronization device, computer equipment and storage medium
KR101871600B1 (en) Method and system for detecting high performance signature by quality evaluation of payload signature
CN116010467B (en) Risk discovery method, device, equipment and storage medium based on communication map
CN114841685B (en) Tracing method and device for bitcoin transaction