JP2007219627A - Retrieval method and device for large-scale information - Google Patents

Retrieval method and device for large-scale information Download PDF

Info

Publication number
JP2007219627A
JP2007219627A JP2006036666A JP2006036666A JP2007219627A JP 2007219627 A JP2007219627 A JP 2007219627A JP 2006036666 A JP2006036666 A JP 2006036666A JP 2006036666 A JP2006036666 A JP 2006036666A JP 2007219627 A JP2007219627 A JP 2007219627A
Authority
JP
Japan
Prior art keywords
search
data
deletion
record
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006036666A
Other languages
Japanese (ja)
Inventor
Akifumi Tanase
章文 棚瀬
Osamu Yamaguchi
治 山口
Hirotomo Sakaguchi
広知 坂口
Yoichi Yamashita
陽一 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Nippon Telegraph and Telephone West Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Nippon Telegraph and Telephone West Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Nippon Telegraph and Telephone West Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006036666A priority Critical patent/JP2007219627A/en
Publication of JP2007219627A publication Critical patent/JP2007219627A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a retrieval method and a retrieval device for large-scale information shortening a retrieval time. <P>SOLUTION: The retrieval method and retrieval device for large-scale information shortening the retrieval time can be provided by providing an indexed retrieval object database 7 in which retrieval objects are registered; a partial data storage part 3 for deletion which stores data for deletion; an indexed corresponding database 8 storing column data after deleting data for deletion from column data belonging to a retrieval object column of a record, and the identification number of the record correspondingly; an input means 1 inputting a retrieval key; a partial data deleting means 2 for deleting data for deletion from the retrieval key to create a retrieval key after deletion; a retrieval means 4 for retrieving and acquiring identification information from the indexed corresponding database 8 based on the retrieval key after deletion; and a retrieval means 4 for retrieving and acquiring the record coinciding with the acquired identification number acquired by the retrieval means 4, from the indexed retrieval object database 7. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、任意の検索キーに合致する情報を、大量のデータを保持するデータベースから抽出する、大規模情報の検索方法および検索装置に関する。   The present invention relates to a large-scale information search method and search apparatus that extracts information that matches an arbitrary search key from a database that holds a large amount of data.

従来技術において、データを保持するテーブルには、検索を短時間に行うために索引(インデックス)が作成されている。索引を用いて検索をすることにより、短時間による検索が可能である。   In the prior art, an index is created in a table holding data in order to perform a search in a short time. By searching using the index, it is possible to search in a short time.

例えば、索引が無いカラムを対象に検索キーを用いて検索を行うと、全レコードを走査し検索キーに合致するレコードを抽出するので、検索時間が長時間化する。これに対して、索引があるカラムを対象に検索する場合において、検索時に指定する検索キーが前方一致もしくは後方一致する場合においては、索引が有効に機能し、短時間による検索が可能である。
しかし、索引があるカラムを対象に検索する場合においてでも、検索時に指定する検索キーが前方一致もしくは後方一致しない場合、つまり、中間一致する場合などには、索引が有効に機能せず、全レコードを走査する必要があり、検索時間が長時間化する。
For example, if a search is performed on a column without an index using a search key, all records are scanned and records that match the search key are extracted, which increases the search time. On the other hand, when searching for a column with an index, if the search key specified at the time of the search matches the forward match or the backward match, the index functions effectively and the search can be performed in a short time.
However, even when searching for a column with an index, if the search key specified at the time of the search does not match the front or the back, that is, if there is an intermediate match, the index does not function effectively and all records Need to be scanned, and the search time becomes longer.

以上のように、従来の検索方法を用いてデータを保持したテーブルから、索引のないカラムを対象にした検索をする場合、索引があるカラムと比較して検索に時間を要し、迅速に検索キーに合致するレコードを抽出できない欠点がある。
また、索引があるカラムに対しても、前方一致もしくは後方一致もしない、中間一致するデータを検索キーに指定した場合、索引が有効にならず全レコードを走査する必要があり、迅速に検索キーと合致するレコードを抽出できない欠点がある。
特に、蓄積されたレコード数が多くなると検索にかかる時間が蓄積量に比例して増加し、情報を取得する業務の効率低下等の不都合が発生する。
As described above, when searching for a column without an index from a table holding data using the conventional search method, the search takes time compared to a column with an index, and the search is quickly performed. There is a disadvantage that records that match the key cannot be extracted.
In addition, when data with an intermediate match that does not match forward or backward is specified as a search key for a column with an index, the index is not valid and all records need to be scanned. There is a drawback that records that match can not be extracted.
In particular, when the number of stored records increases, the time required for the search increases in proportion to the amount of storage, and inconveniences such as a decrease in efficiency of work for acquiring information occur.

検索時間の向上を目指し、検索対象の文字列を操作する各種提案がされている。例えば、特開文献1や特開文献2では、検索対象の文字コードを指定し文字列を抽出し、重複文字列および同一文字列と包含関係のある文字列を削除する等の手段を提案している。しかし、検索キーに対する操作を講じていないため、前記手段を講じた検索対象の文字列から作成した索引と検索キーが一致していない場合、迅速に検索できない。   Various proposals for manipulating search target character strings have been made with the aim of improving search time. For example, Japanese Patent Application Laid-Open Nos. H11-228688 and H02-209 propose a means for designating a character code to be searched, extracting a character string, and deleting a duplicate character string and a character string inclusive relation with the same character string. ing. However, since no operation is performed on the search key, if the search key does not match the index created from the character string to be searched for using the above means, the search cannot be performed quickly.

また、データベースの検索時間は、データのレコード数だけでなく、カラム数にも依存する。一般に、データベースにおける検索は、1レコードに対する情報が増大し、つまりカラムの数が増加し、データベースが大容量化することによっても、その検索は遅くなる。
特開平9−54777号公報 特開平11−39346号公報
The database search time depends not only on the number of data records but also on the number of columns. In general, a search in a database is slowed by an increase in information for one record, that is, an increase in the number of columns and an increase in the capacity of the database.
Japanese Patent Laid-Open No. 9-54777 JP 11-39346 A

本発明は、このような事情に鑑みてなされたもので、その目的は、検索対象のカラムに索引が無いため、もしくは索引があっても検索キーと中間一致するため、全レコードの走査が必要になり、検索時間が遅くなる検索の割合を削減し、検索キーに合致したレコードの抽出時間を短縮する方法を提供することにある。   The present invention has been made in view of such circumstances, and its purpose is that there is no index in the column to be searched, or even if there is an index, an intermediate match with the search key is required, so all records must be scanned. Therefore, it is an object of the present invention to provide a method for reducing the rate of search that slows down the search time and reducing the time for extracting records that match the search key.

この発明は上述した課題を解決するためになされたもので、請求項1に記載の発明は、検索対象記憶手段内のレコードを検索キーに基づいて検索する大規模情報の検索方法において、予め前記レコードの検索対象カラムに属するカラムデータから削除用データを削除した削除後カラムデータと、前記レコードの識別情報とを対応させて記憶させた対応データ記憶手段を形成しておき、検索時において、前記検索キーから前記削除用データを削除した削除後検索キーを生成し、前記削除後検索キーに基づいて識別情報を前記対応データ記憶手段より検索して取得し、前記取得した識別情報に合致するレコードを前記検索対象記憶手段より検索して取得することを特徴とする。   The present invention has been made to solve the above-described problems. The invention according to claim 1 is a large-scale information search method for searching a record in a search target storage unit based on a search key. Corresponding data storage means for storing post-deletion column data obtained by deleting deletion data from column data belonging to a search target column of the record and the identification information of the record is formed, and at the time of search, A search key after deleting the deletion data from the search key is generated, and identification information is searched and acquired from the corresponding data storage means based on the search key after deletion, and a record that matches the acquired identification information Is obtained by searching from the search target storage means.

請求項2に記載の発明は、請求項1に記載の大規模情報の検索方法において、前記検索対象記憶手段を検索して取得したレコードが複数である場合に、該複数のレコードから前記検索キーに対応するレコードを取得する過程を更に有することを特徴とする請求項1に記載の大規模情報の検索方法。   According to a second aspect of the present invention, in the large-scale information search method according to the first aspect, when there are a plurality of records obtained by searching the search target storage unit, the search key is extracted from the plurality of records. The large-scale information search method according to claim 1, further comprising a step of acquiring a record corresponding to.

請求項3に記載の発明は、検索対象記憶手段内のレコードを検索キーに基づいて検索する大規模情報の検索装置において、前記レコードの検索対象カラムに属するカラムデータから削除用データを削除した削除後カラムデータと、前記レコードの識別情報とを対応させて記憶させた対応データ記憶手段と、前記検索キーから前記削除用データを削除した削除後検索キーを生成する削除後検索キー生成手段と、前記削除後検索キーに基づいて識別情報を前記対応データ記憶手段より検索して取得する第一の検索手段と、前記第一の検索手段が取得した識別番号に合致するレコードを前記検索対象記憶手段より検索して取得する第二の検索手段と、を具備することを特徴とする。   The invention according to claim 3 is a large-scale information retrieval device that retrieves a record in a retrieval target storage unit based on a retrieval key, and deletes deletion data from column data belonging to a retrieval target column of the record Corresponding data storage means for storing post-column data and identification information of the record in association with each other, post-deletion search key generation means for generating a post-deletion search key for deleting the deletion data from the search key, First search means for searching and acquiring identification information from the corresponding data storage means based on the search key after deletion, and a record that matches the identification number acquired by the first search means as the search target storage means And a second search means for searching and acquiring.

請求項4に記載の発明は、請求項3に記載の大規模情報の検索装置において、少なくとも、前記検索対象記憶手段に記憶されている識別情報と、前記対応データ記憶手段に記憶されている削除後カラムデータに対して、索引が作成されていることを特徴とする。   According to a fourth aspect of the present invention, in the large-scale information search apparatus according to the third aspect, at least the identification information stored in the search target storage unit and the deletion stored in the corresponding data storage unit An index is created for the post-column data.

請求項5に記載の発明は、請求項3または請求項4に記載の大規模情報の検索装置において、前記第一の検索手段および第二の検索手段にて行われる検索が、索引を用いた前方一致および後方一致による検索であることを特徴とする。   According to a fifth aspect of the present invention, in the large-scale information search device according to the third or fourth aspect, the search performed by the first search means and the second search means uses an index. The search is based on a forward match and a backward match.

請求項6に記載の発明は、請求項3から請求項5のいずれかに記載の大規模情報の検索装置において、前記検索対象記憶手段に記憶されている識別情報がユニークであることを特徴とする。   The invention described in claim 6 is the large-scale information search apparatus according to any one of claims 3 to 5, wherein the identification information stored in the search target storage means is unique. To do.

請求項7に記載の発明は、請求項3から請求項6のいずれかに記載の大規模情報の検索装置において、前記大規模情報の検索装置が、更に、前記第二の検索手段により検索され取得されたレコードが複数である場合、該複数のレコードから前記検索キーに対応するレコードを取得する絞込み手段、を有することを特徴とするとする。   According to a seventh aspect of the present invention, in the large-scale information search apparatus according to any one of the third to sixth aspects, the large-scale information search apparatus is further searched by the second search means. In the case where there are a plurality of acquired records, a narrowing means for acquiring a record corresponding to the search key from the plurality of records is provided.

請求項8に記載の発明は、請求項3から請求項7のいずれかに記載の大規模情報の検索装置において、前記大規模情報の検索装置が、更に、前記検索対象記憶手段内のレコードを前記検索キーに基づいて検索する通常検索手段、を有することを特徴とするとする。   The invention according to claim 8 is the large-scale information search device according to any one of claims 3 to 7, wherein the large-scale information search device further stores the record in the search target storage unit. Normal search means for searching based on the search key.

請求項9に記載の発明は、請求項3から請求項8のいずれかに記載の大規模情報の検索装置において、前記対応データ記憶手段が、更に、前記レコードの検索対象カラムに属するカラムデータに関連する情報と、前記レコードの識別情報とを対応させて記憶すること、を特徴とするとする。   According to a ninth aspect of the present invention, in the large-scale information search apparatus according to any one of the third to eighth aspects, the correspondence data storage means further includes column data belonging to a search target column of the record. The related information and the identification information of the record are stored in association with each other.

請求項10に記載の発明は、請求項3から請求項9のいずれかに記載の大規模情報の検索装置において、前記大規模情報の検索装置が、更に、登録するためのレコードを入力する入力手段と、前記入力されたレコードと、前記入力されたレコードを前記検索対象記憶手段内において一意に識別する識別情報とを1つのレコードにして、前記検索対象記憶手段に登録する第一の登録手段と、前記入力されたレコードより、検索対象カラムに属するカラムデータを取り出し、前記取り出したカラムデータより、前記削除用データを削除した削除後登録データを作成する削除後登録データ作成手段と、前記作成した削除後登録データと前記識別情報とを対応させて前記対応データ記憶手段に登録する第二の登録手段と、を有することを特徴とする。   According to a tenth aspect of the present invention, in the large-scale information search device according to any one of the third to ninth aspects, the large-scale information search device further inputs an input for registering a record for registration. First registration means for registering the input record and the input record and identification information for uniquely identifying the input record in the search target storage means into one record A post-deletion registration data creation means for fetching column data belonging to a search target column from the input record, and creating post-deletion registration data by deleting the deletion data from the fetched column data; and the creation And second registration means for registering the post-deletion registration data and the identification information in correspondence with the corresponding data storage means.

請求項1および3の発明によれば、検索において、従来であれば検索対象のカラムに索引が無いため、もしくは索引があっても検索キーと中間一致するため、全レコードの走査が必要になるような場合においても、全レコードの走査を行う必要がなく、全レコードの捜査を行う検索の割合を削減した、レコードの抽出を短時間で行うことができるという効果を奏する。   According to the inventions of claims 1 and 3, in the search, since there is conventionally no index in the column to be searched, or even if there is an index, an intermediate match with the search key is required, so that it is necessary to scan all records. Even in such a case, it is not necessary to scan all the records, and it is possible to extract the records in a short time with a reduced ratio of searches for searching all the records.

また、請求項2および7の発明によれば、検索結果に対して更に絞込みが行われることにより、検索の精度が向上できる効果を奏する。   In addition, according to the inventions of claims 2 and 7, the search result is further narrowed down, so that it is possible to improve the search accuracy.

また、請求項4の発明によれば、索引が作成されているために、検索が高速にできる効果を奏する。
また、請求項5の発明によれば、検索が索引を用いる前方一致または後方一致による検索で行われるために、検索が高速にできる効果を奏する。
また、請求項6の発明によれば、識別番号がユニークにされているので、検索が高速にできる効果を奏する。
また、請求項8の発明によれば、従来においてなされていた通常の検索もでき、従来の検索方法との互換性を維持できる効果を奏する。
また、請求項9の発明によれば、検索対象とする情報に関する略称や俗称などによる検索もできる効果を奏する。
また、請求項10の発明によれば、本発明によるデータベースにデータを追加することができる効果を奏する。
According to the invention of claim 4, since the index is created, there is an effect that the search can be performed at high speed.
Further, according to the invention of claim 5, since the search is performed by the search by the forward match or the backward match using the index, there is an effect that the search can be performed at high speed.
Further, according to the invention of claim 6, since the identification number is made unique, there is an effect that the search can be performed at high speed.
Further, according to the invention of claim 8, the normal search that has been conventionally performed can be performed, and the compatibility with the conventional search method can be maintained.
According to the ninth aspect of the invention, there is an effect that a search can be performed using an abbreviation or a common name relating to information to be searched.
Further, according to the invention of claim 10, there is an effect that data can be added to the database according to the present invention.

まず、本発明の実施の形態のポイントを説明する。
実施の形態においては、一部データを削除したカラムとレコードを特定する識別番号の対応データベースを、既存のデータベースとは別に形成する。当該対応データベースを用いて、前記一部デー夕を削除したカラムに索引を作成し、検索の際に指定される検索キーから前記一部データを削除した検索キーと対応データベースを用いて、識別番号を検索することを最も主要な特徴とする。
既存データベースでは索引が有効でない検索条件にて検索する際、本手段にて構築した対応データベースと一部データを削除した検索キーに合致する識別番号を抽出し、次に抽出した識別番号に合致するレコードを既存データベースより抽出することにより、検索条件に合致するレコードの候補を抽出する。
First, points of the embodiment of the present invention will be described.
In the embodiment, a correspondence database of identification numbers for identifying columns and records from which some data has been deleted is formed separately from the existing database. Using the corresponding database, create an index on the column from which the partial data has been deleted, and use the search key and the corresponding database from which the partial data has been deleted from the search key specified at the time of the search. The most important feature is to search for.
When searching with the search condition where the index is not valid in the existing database, extract the identification number that matches the corresponding database constructed by this means and the search key with some data deleted, and then match the extracted identification number By extracting records from an existing database, candidate records that meet the search conditions are extracted.

従って、データベースの検索は、既存データベースのみの検索と異なり、対応データベースを検索する処理が追加になる。しかしながら、レコード数が多い場合は、対応データベースによる検索を用いることにより、検索に該当するレコードの識別番号を迅速に特定でき、全体の検索時間の短縮が可能になる。   Therefore, the database search is different from the search of the existing database only, and processing for searching the corresponding database is added. However, when the number of records is large, by using the search by the correspondence database, the identification number of the record corresponding to the search can be quickly specified, and the entire search time can be shortened.

本手段では、検索キーの一部を削除して検索を行うため、削除する前の最初の検索キーと合致しないレコードを抽出する場合がある。そこで、本手段を用いて抽出したレコードを対象に、最初の検索キーにて再検索する手段を設ける。これにより、検索時間の短縮と検索精度の向上の両立を図ることが可能になる。   Since this means performs a search by deleting a part of the search key, a record that does not match the first search key before the deletion may be extracted. Therefore, means for re-searching with the first search key is provided for the record extracted using this means. This makes it possible to achieve both reduction in search time and improvement in search accuracy.

以上の本発明の実施の形態のポイントに説明したように、本発明においては、「索引(インデックス)」を用いた索引というものが重要となる。以下、索引について簡単に説明する。
索引とは、データの検索速度を向上させるために、どの行(レコード)がどこにあるかを示すものである。データを検索するときに、目的のデータが見つかるまですべての行を一行ずつ調べていくよりも、索引を利用して目的の行の場所を見つけてからその行のデータを読み取る方が効率的であり、データベースにおいてよく用いられる方法である。特に大きなテーブルでは、索引を用いることにより、検索が高速に行われる。
As described above in the embodiment of the present invention, in the present invention, an index using an “index” is important. The index will be briefly described below.
An index indicates which row (record) is located in order to improve the search speed of data. When searching for data, it is more efficient to use the index to find the location of the desired row and then read the data in that row, rather than going through every row until the desired data is found. Yes, it is a method often used in databases. In particular, a large table can be searched at high speed by using an index.

以下、索引の簡単な例を示す。
例えば、登録されているデータが、「さとう」、「すずき」、「たかはし」、「わたなべ」の4データであったとする。それぞれの名前には、電話番号や住所が関連して登録されているとする。ここで、「わたなべ」を検索するとする。
順に検索を行っていくと、登録されているデータが4つであるので、最大4回で検索が完了する。
ここで、索引を用いた検索を考える。索引として、例えば、「さとう」または「すずき」が該当する「さす」と、「たかはし」または「わたなべ」が該当する「たわ」の、2個の索引があるとする。すると検索時においては、「わたなべ」が「わ」で始まることより、「たわ」の索引を用いて検索する。次に、「たわ」の中で、「わたなべ」が該当することにより、「わたなべ」に関する電話番号や住所が検索される。
ここで、索引を用いた検索を行うと、必ず2回の検索で終了する点に注意する。
The following is a simple example of an index.
For example, it is assumed that the registered data includes four data of “Sato”, “Suzuki”, “Takahashi”, and “Watanabe”. It is assumed that a telephone number and an address are associated with each name. Here, it is assumed that “Watanabe” is searched.
If the search is performed in order, since there are four registered data, the search is completed up to four times.
Here, a search using an index is considered. Assume that there are two indexes, for example, “Sasu” corresponding to “Sato” or “Suzuki” and “Tawa” corresponding to “Takahashi” or “Watanabe”. Then, at the time of search, since “Watanabe” starts with “Wa”, the search is performed using the index “Tawa”. Next, in “Tawa”, when “Watanabe” corresponds, a telephone number or an address relating to “Watanabe” is searched.
Here, it should be noted that a search using an index always ends with two searches.

以上は、少数のデータであったため、索引を用いない場合でも1から4回の検索で検索が完了するし、索引を用いても2回の検索で完了した。しかし、データが多くなってくると、索引を用いる効果が顕著になる。
n個のデータがある場合の検索は、順に検索を行うとnのオーダーの検索が必要となる。索引を用いる場合、データが多くなると、索引も複数段用いることになる。例えば、例示したように、分岐が2つである索引を複数段(階層的に)使用した場合、その検索回数はLog2(n)回となる。例えば、先に例示したものであれば、データ数n=4であるので、Log2(4)=2となる。
Since the above is a small number of data, even when the index is not used, the search is completed by 1 to 4 searches, and even when the index is used, the search is completed by 2 searches. However, as data increases, the effect of using an index becomes more prominent.
When there are n pieces of data, if the search is performed in order, it is necessary to search for n orders. In the case of using an index, when the amount of data increases, the index is also used in a plurality of stages. For example, as illustrated, when an index having two branches is used in multiple stages (hierarchically), the number of searches is Log2 (n). For example, in the case illustrated above, since the number of data n = 4, Log2 (4) = 2.

より一般的な索引の作成においては、分岐の数や、分岐のバランスを考慮した様々な手法により索引が作成されている。従って、一般的には、データ数nの検索において、順次検索においてはオーダーnであり、索引を用いた検索はオーダーLog(n)となる。このように、索引を用いた検索は、順次検索に比較して非常に高速になされる。また、その効果はデータ数nが大きくなるに従い顕著となる。
本発明においては、このように高速な検索に有効な索引の作成を、いかにして既存のデータに用いるか、という点がポイントとなっている。
In creating a more general index, the index is created by various methods in consideration of the number of branches and the balance of branches. Therefore, in general, in the search of the number of data n, the order n is in the sequential search, and the search using the index is the order Log (n). Thus, the search using the index is very fast compared to the sequential search. The effect becomes more prominent as the number of data n increases.
In the present invention, the point is how to create an index effective for high-speed search in this way for existing data.

以下、本発明の第一の実施の形態を、図面を参照して詳細に説明する。
図1は、本発明による検索装置の第一の実施の形態を示すブロック図である。この第一の実施の形態の検索装置は、入力手段1、一部データ削除手段2、削除用一部データ記憶部3、検索手段4、登録手段5、検索用情報データベース6、出力手段9から構成されている。また、検索用情報データベース6には、索引付き検索対象データベース7と索引付き対応データベース8が含まれる。索引付き検索対象データベース7と索引付き対応データベース8は、識別番号により関連付けられている。好ましくは、索引付き検索対象データベース7の識別番号はユニークであり、索引付き対応データベース8の識別番号から索引付き検索対象データベース7の識別番号がユニークに特定される。
Hereinafter, a first embodiment of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a block diagram showing a first embodiment of a search device according to the present invention. The search apparatus according to the first embodiment includes an input unit 1, a partial data deletion unit 2, a deletion partial data storage unit 3, a search unit 4, a registration unit 5, a search information database 6, and an output unit 9. It is configured. The search information database 6 includes an indexed search target database 7 and an indexed correspondence database 8. The indexed search target database 7 and the indexed correspondence database 8 are associated by an identification number. Preferably, the identification number of the indexed search target database 7 is unique, and the identification number of the indexed search target database 7 is uniquely specified from the identification number of the indexed correspondence database 8.

次に、第一の実施の形態として、顧客情報の管理を行うデータベースにおいて、法人名についての検索を速くする場合を想定し、その詳細を以下に説明する。   Next, as a first embodiment, a case where a search for a corporate name is accelerated in a database that manages customer information will be described in detail below.

削除用一部データ記憶部3には、入力手段1より入力された検索キーより削除するための、削除用一部データが登録されている。例えば、法人格を表す、「株式会社」、「(株)」、「有限会社」、「(有)」、「財団法人」、「(財)」などが登録されている。   In the deletion partial data storage unit 3, deletion partial data to be deleted from the search key input from the input unit 1 is registered. For example, “corporation”, “(stock)”, “limited company”, “(existing)”, “foundation”, “(goods)”, etc., representing the legal entity are registered.

入力手段1は、検索時においては、オペレータによって入力された検索キーの入力処理を行い、入力された検索キーを一部データ削除手段2および検索手段4に送る。また、データの登録時においては、オペレータによって入力された登録データの入力処理を行い、入力された登録データを一部データ削除手段2および登録手段5に送る。   At the time of search, the input unit 1 performs a process of inputting a search key input by the operator, and sends the input search key to the partial data deletion unit 2 and the search unit 4. Further, at the time of data registration, the registration data input by the operator is input, and the input registration data is sent to the partial data deletion means 2 and the registration means 5.

一部データ削除手段2は、検索時においては、入力手段1から送られてきた検索キーから、削除用一部データ記憶部3に登録されている削除用一部データ、例えば法人格を表す「株式会社」や「(株)」など、を削除する。このように、検索キーより削除用一部データを削除することにより、新しい検索キーを作成する。以下、この新しい検索キーを一部削除検索キーと呼ぶことにする。次に、一部データ削除手段2は、一部削除検索キーを、登録手段5に送る。
また、一部データ削除手段2は、登録時においては、入力手段1から送られてきた登録データのうち、検索対象となるカラム(フィールド)に相当する部分だけを抜き出し、抜き出した登録データから、削除用一部データ記憶部3に登録されている削除用一部データ、例えば法人格を表す「株式会社」や「(株)」など、を削除する。このように、登録データより削除用一部データを削除することにより、新しい登録データを作成する。以下、この新しい登録データを一部削除登録データと呼ぶことにする。次に、一部データ削除手段2は、一部削除登録データを、登録手段5に送る。
The partial data deleting means 2 uses the search key sent from the input means 1 at the time of searching, and uses partial data for deletion registered in the partial data storage section 3 for deletion, for example, “stock” Delete "Company", "Corporation", etc. In this way, a new search key is created by deleting the deletion partial data from the search key. Hereinafter, this new search key will be referred to as a partial deletion search key. Next, the partial data deletion unit 2 sends a partial deletion search key to the registration unit 5.
Further, the partial data deletion means 2 extracts only the part corresponding to the column (field) to be searched from the registration data sent from the input means 1 at the time of registration, and from the extracted registration data, The deletion partial data registered in the deletion partial data storage unit 3, such as “corporation” or “(share)” representing a legal entity, is deleted. In this way, new registration data is created by deleting the deletion partial data from the registration data. Hereinafter, this new registration data will be referred to as “partially deleted registration data”. Next, the partial data deletion unit 2 sends the partial deletion registration data to the registration unit 5.

検索手段4は、入力手段1より送られてきた検索キーと、一部データ削除手段2により送られてきた一部削除検索キーにより、検索用情報データベース6から検索を行う。   The search means 4 searches the search information database 6 using the search key sent from the input means 1 and the partial deletion search key sent from the partial data deletion means 2.

登録手段5は、入力手段1より送られてきた登録データと、一部データ削除手段2により送られてきた一部削除登録データを、検索用情報データベース6に登録する。   The registration unit 5 registers the registration data sent from the input unit 1 and the partial deletion registration data sent from the partial data deletion unit 2 in the search information database 6.

検索用情報データベース6は、検索手段4より入力された、検索キーと一部削除検索キーを用いて検索を行い、検索結果を出力手段9に出力する。また登録手段5より入力された、登録データと一部削除登録データを登録する。検索用情報データベース6の詳細については、図2、図3および図4を用いて、後で詳細に説明される。   The search information database 6 performs a search using the search key and the partial deletion search key input from the search unit 4 and outputs the search result to the output unit 9. Also, registration data and partial deletion registration data input from the registration means 5 are registered. Details of the search information database 6 will be described later in detail with reference to FIGS. 2, 3, and 4.

出力手段9は、検索用情報データベース6からの検索結果をオペレータに表示する。または、登録結果をオペレータに表示する。   The output means 9 displays the search result from the search information database 6 to the operator. Alternatively, the registration result is displayed to the operator.

次に、図2を用いて、検索用情報データベース6の詳細を説明する。先の図1においても説明したように、検索用情報データベース6には、索引付き検索対象データベース7と索引付き対応データベース8が含まれる。図2では、顧客情報データを管理する場合を想定した検索用情報データベース6の構成が一例として例示してある。   Next, details of the search information database 6 will be described with reference to FIG. As described above with reference to FIG. 1, the search information database 6 includes an indexed search target database 7 and an indexed correspondence database 8. In FIG. 2, the configuration of the search information database 6 that is assumed to manage customer information data is illustrated as an example.

索引付き検索対象データベース7には、顧客情報テーブル21と、その索引22がある。
顧客情報テーブル21には、顧客に関する法人名、住所、電話番号などの顧客情報と、識別番号が、1つのレコードとして登録されている。また、顧客情報テーブル21の識別番号カラムに対しては索引22が作成されている。識別番号カラムに索引22が作成されているため、顧客情報テーブル21の識別番号カラムにおいて、特定の識別番号に対する検索を行うと、特定の識別番号に該当するレコードが短時間に検索される。
また、この識別番号は、例えばユニークキーであり、識別番号を指定することにより顧客情報レコードを一意に指定することが出来る。
The indexed search target database 7 includes a customer information table 21 and its index 22.
In the customer information table 21, customer information such as a corporate name, an address, a telephone number, and the like related to a customer and an identification number are registered as one record. An index 22 is created for the identification number column of the customer information table 21. Since the index 22 is created in the identification number column, when a search for a specific identification number is performed in the identification number column of the customer information table 21, a record corresponding to the specific identification number is searched in a short time.
The identification number is a unique key, for example, and the customer information record can be uniquely specified by specifying the identification number.

図2の顧客情報テーブル21には、顧客レコードの1例として、識別番号「50001」、法人名「西日本電信電話株式会社」、住所「大阪・・・」、電話番号「06−・・・」などが登録されている。また、識別番号「50001」に対する索引22として、この場合「50000番台」が作成され登録されている。
このような索引付き検索対象データベース7は、従来利用されてきた既存の顧客情報データベースと同じような構成である。
In the customer information table 21 of FIG. 2, as an example of a customer record, an identification number “50001”, a corporate name “Nippon Nippon Telegraph and Telephone Corporation”, an address “Osaka ...”, and a phone number “06 ...” Etc. are registered. In this case, “50000 series” is created and registered as the index 22 for the identification number “50001”.
Such an indexed search target database 7 has the same configuration as an existing customer information database that has been conventionally used.

次に、索引付き検索対象データベース7に対応した索引付き対応データベース8がある。索引付き対応データベース8には、対応テーブル23と、その索引24がある。
例えば、削除する一部データ(以下、削除用一部データ)として法人格が指定してあるとする。法人格とは、例えば、「株式会社」、「(株)」、「有限会社」、「(有)」、「財団法人」、「(財)」などである。削除用一部データの指定は、削除用一部データ記憶部3に、例えば、「株式会社」、「(株)」、「有限会社」、「(有)」、「財団法人」、「(財)」などが登録されることにより行わる。
Next, there is an indexed correspondence database 8 corresponding to the indexed search target database 7. The indexed correspondence database 8 includes a correspondence table 23 and its index 24.
For example, it is assumed that a legal personality is designated as partial data to be deleted (hereinafter, partial data for deletion). The legal entity is, for example, “corporation”, “(stock)”, “limited company”, “(present)”, “foundation”, “(goods)”, or the like. The partial data for deletion is designated in the partial deletion data storage unit 3 by, for example, “corporation”, “(share)”, “limited company”, “(present)”, “foundation”, “( Etc.) ”is registered.

削除用一部データが指定してあることにより、対応テーブル23には、顧客情報テーブル21に登録されている検索対象となるデータである法人名から、削除用一部データを削除したデータが法人名抜粋として登録されている。例えば、顧客情報テーブル21における法人名「西日本電信電話株式会社」から、削除用一部データとして登録されている法人格「株式会社」が削除され、対応テーブル23の法人名抜粋に「西日本電信電話」が登録されている。また、法人名抜粋「西日本電信電話」と、顧客情報テーブル21においてレコードを識別する識別番号「50001」が、対として、対応テーブル23に登録されている。   Since the partial data for deletion is designated, the correspondence table 23 includes data obtained by deleting the partial data for deletion from the corporate name that is the search target data registered in the customer information table 21. It is registered as a name excerpt. For example, the corporate name “corporation” registered as partial data for deletion is deleted from the corporate name “Nippon Telegraph and Telephone Corporation” in the customer information table 21, and “Nishi Nippon Telegraph and Telephone” is extracted from the corporate name in the correspondence table 23. Is registered. In addition, the corporate name excerpt “Nippon Nippon Telegraph and Telephone” and the identification number “50001” for identifying the record in the customer information table 21 are registered in the correspondence table 23 as a pair.

つまり、対応テーブル23には、顧客情報テーブル21の検索対象カラムのデータより、削除用一部削除データ記憶部3に登録されている「株式会社」や「(株)」等の削除用一部データを削除したデータ(以下、一部削除データ)と、顧客情報テーブル21のレコードを一意に特定できる識別番号、が対として登録されている。
更に、索引付き対応データベース8においては、対応テーブル23の法人名抜粋(一部削除データ)に対する索引24が作成されている。
That is, in the correspondence table 23, a deletion part such as “stock” or “stock” registered in the deletion part deletion data storage unit 3 from the data in the search target column of the customer information table 21. Data from which data has been deleted (hereinafter, “partially deleted data”) and an identification number that can uniquely identify a record in the customer information table 21 are registered as a pair.
Further, in the indexed correspondence database 8, an index 24 is created for the corporate name excerpt (partially deleted data) in the correspondence table 23.

以上の、索引付き検索対象データベース7と索引付き対応データベース8における、特定のカラムに対する索引の作成は、データベースの機能によりなされる。このような特定のデータベースの特定のカラムに対する、索引の作成および索引の自動的な更新は、通常のデータベースの機能により提供されるものである。   In the indexed search target database 7 and the indexed correspondence database 8, the creation of an index for a specific column is performed by the function of the database. The creation of an index and the automatic update of the index for a specific column of such a specific database are provided by normal database functions.

次に、オペレータが入力手段1より検索を行う(A1)。例えば、検索キーとして「(株)西日本電信電話」を入力する(A2)。次に入力された検索キーより、索引付き対応データベース8と索引付き検索対象データベース7を用いて法人名の検索を開始する(A3)。この検索の時になされる処理の詳細を、以下図3を用いて詳述する。   Next, the operator searches using the input means 1 (A1). For example, "Nippon Nippon Telegraph and Telephone Corporation" is entered as a search key (A2). Next, from the input search key, the search for the corporate name is started using the indexed correspondence database 8 and the indexed search target database 7 (A3). Details of processing performed at the time of this search will be described in detail with reference to FIG.

第一の実施の形態における、検索においてなされる処理を、図3のフローチャートを用いて説明する。まず、オペレータは入力手段1を用いて、検索キーを入力し、検索を開始する(ステップS31)。例えば、検索キーとして「(株)西日本電信電話」を入力し、検索を開始する。次に、一部データ削除手段2が、入力された検索キーから、削除用一部データ記憶部3に登録してある一部削除用データを削除し(ステップS32)、これにより一部削除検索キーを取得する。例えば、検索キー「(株)西日本電信電話」より、法人格をあらわす一部削除用データ「(株)」を削除し、一部削除検索キーとして「西日本電信電話」を取得する。次に、取得した一部削除検索キー「西日本電信電話」を用いて、検索手段4が、索引付き対応データベース8より、索引24を用いて、条件に合致する識別番号を取得する(ステップS33)。例えば、索引24の索引「西」を用いて、索引付き対応データベース8より、「西日本電信電話」に対応する識別番号「50001」を取得する。次に、取得した識別番号を用いて(検索キーとして)、索引付き検索対象データベース7より、索引22を用いて、識別番号に一致するレコードを取得する(ステップS34)。例えば、索引22の「50000番台」を用いて、索引付き検索対象データベース7より、識別番号が「50001」に一致するレコードとして、法人名「西日本電信電話株式会社」、住所「大阪・・・」、電話番号「06−・・・」などを取得する。次に取得したレコードのリストを、出力手段9を用いて、オペレータに表示する(ステップS35)。例えば、出力手段9に、法人名「西日本電信電話株式会社」、住所「大阪・・・」、電話番号「06−・・・」などが表示される。   Processing performed in the search in the first embodiment will be described with reference to the flowchart of FIG. First, the operator uses the input unit 1 to input a search key and starts a search (step S31). For example, “Nippon Nippon Telegraph and Telephone Corporation” is input as a search key, and the search is started. Next, the partial data deletion means 2 deletes the partial deletion data registered in the deletion partial data storage unit 3 from the input search key (step S32), whereby the partial deletion search is performed. Get the key. For example, from the search key “Nippon Nippon Telegraph and Telephone”, the data for partial deletion “Corporation” representing the legal entity is deleted, and “Nippon Telegraph and Telephone” is acquired as the partial deletion search key. Next, using the acquired partial deletion search key “Nippon Nippon Telegraph and Telephone”, the search means 4 acquires an identification number that matches the condition from the indexed correspondence database 8 using the index 24 (step S33). . For example, the identification number “50001” corresponding to “Nippon Nippon Telegraph and Telephone” is acquired from the indexed correspondence database 8 using the index “west” of the index 24. Next, using the acquired identification number (as a search key), a record that matches the identification number is acquired from the indexed search target database 7 using the index 22 (step S34). For example, by using “50000 series” of the index 22, as the record whose identification number matches “50001” from the indexed search target database 7, the corporate name “Nippon Nippon Telegraph and Telephone Corporation”, the address “Osaka ...” The telephone number “06-...” Is acquired. Next, the obtained list of records is displayed to the operator using the output means 9 (step S35). For example, the corporate name “Nippon Nippon Telegraph and Telephone Corporation”, the address “Osaka ...”, the telephone number “06-...”, Etc. are displayed on the output means 9.

上記のステップS33の索引を用いた検索と、ステップS34の索引を用いた検索は、前方一致および・または後方一致を用いることが可能である。   The search using the index in step S33 and the search using the index in step S34 can use forward matching and / or backward matching.

第一の実施の形態においては、検索に該当したレコードが1件しかない場合には、1レコードのみが出力される。複数のレコードが該当した場合には、該当する複数のレコードがリストとして表示される。複数のレコードが該当する場合の、更なる処理については、第二の実施の形態において説明する。   In the first embodiment, when there is only one record corresponding to the search, only one record is output. When a plurality of records correspond, the corresponding records are displayed as a list. Further processing when a plurality of records are applicable will be described in the second embodiment.

以上のように、第一の実施の形態においては、索引付き対応データベース8には、索引付き検索対象データベース7の法人名より法人格などの一部削除用データを削除した法人名抜粋が登録されており、また、この法人名抜粋に対して索引が作成されている。更に、検索する場合において、入力された検索キーより、法人格などの一部削除用データを削除し、一部削除検索キーを取得し、この一部削除検索キーを用いて索引付き対応データベース8に対して検索を行い、検索結果として、まず、索引付き検索対象データベース7において特定の顧客のレコードを特定する識別番号を取得することが特徴となる。以下、この検索を一次検索と呼ぶことにする。このような一次検索を行うこと、および、一次検索のための構成には、以下のような利点がある。   As described above, in the first embodiment, the indexed correspondence database 8 is registered with the corporate name excerpt obtained by deleting the data for partial deletion such as the corporate case from the corporate name of the indexed search target database 7. In addition, an index is created for this corporate name excerpt. Furthermore, in the case of a search, the partial deletion data such as a legal case is deleted from the input search key, a partial deletion search key is obtained, and the index-corresponding database 8 is stored using this partial deletion search key. A search is performed, and as a search result, first, an identification number for specifying a record of a specific customer in the indexed search target database 7 is obtained. Hereinafter, this search is referred to as a primary search. Such a primary search and the configuration for the primary search have the following advantages.

従来技術においては、索引付き検索対象データベース7における顧客情報テーブル21の法人名カラムに対して、索引が作成されることがあった。しかし、法人名に対して索引を作成しても、索引が有効に働かないことがあった。その理由の1つは、法人名に法人格があることにある。一般に、有効な索引を作成するには、索引の対象となるデータ量が少なく、重複が少ないことが重要になる。しかしながら、法人名のように、株式会社などの法人格が大量にデータ中に含まれており、重複がある場合には、索引が有効に作成されないことがある。その結果、法人名の検索において、法人名の索引を用いて検索を行っても、検索が速くならないことがあった。   In the prior art, an index may be created for the corporate name column of the customer information table 21 in the indexed search target database 7. However, even if an index is created for a corporate name, the index may not work effectively. One of the reasons is that the corporate name has a legal character. In general, in order to create an effective index, it is important that the amount of data to be indexed is small and there is little duplication. However, if the corporate name such as a corporation is included in the data in a large amount like the corporate name and there are duplicates, the index may not be created effectively. As a result, when searching for a corporate name using the corporate name index, the search may not be fast.

このような従来の索引付き検索対象データベース7の法人名カラムに索引を作成するのに比較して、第一の実施の形態の索引付き対応データベース8の法人名抜粋に対して索引を作成することには以下のような利点がある。まず、一部削除用データを削除しているため索引を作成する対象となるデータのデータ量が小さくなる利点。次に、株式会社などの重複しているデータが少なくなる利点。これらの利点により、索引付き対応データベース8の法人名抜粋カラムに対して、高速な検索に用いるのに有効な索引が作成される。その結果、索引付き対応データベース8における法人名抜粋カラムに対する検索が速くなるという利点がある。   Compared to creating an index on the corporate name column of the conventional indexed search target database 7, an index is created for the corporate name excerpt of the indexed correspondence database 8 of the first embodiment. Has the following advantages. First, since the data for partial deletion is deleted, there is an advantage that the amount of data to be indexed is reduced. Next, there is an advantage of reducing duplicate data such as corporations. With these advantages, an index effective for high-speed search is created for the corporate name excerpt column of the indexed correspondence database 8. As a result, there is an advantage that the search for the corporate name excerpt column in the indexed correspondence database 8 becomes faster.

また、一般に、検索対象とするデータベースにおいて、レコード数が同じであるとすると、カラム数が少ないデータベースを検索する方が速いことが知られている。この点においても、法人名抜粋と識別番号の2つのカラムしかない索引付き対応データベース8における検索の方が、多数のカラムを有する従来の索引付き検索対象データベース7における検索より高速になるという利点がある。   In general, it is known that in a database to be searched, it is faster to search a database having a small number of columns if the number of records is the same. Also in this respect, there is an advantage that the search in the indexed correspondence database 8 having only two columns of the corporate name excerpt and the identification number is faster than the search in the conventional indexed search target database 7 having a large number of columns. is there.

また、例えば、オペレータが法人名を入力して検索する際、同一法人であっても法人格を先頭に付ける場合や末尾につけて入力する場合や、略式の法人格を付けて入力する場合や、法人格を省力して入力する場合などがある。例えば、「株式会社いろは」、「いろは株式会社」、「(株)いろは」、「いろは」などを入力して検索することが考えられる。   Also, for example, when an operator enters a corporate name and searches, even if it is the same legal entity, when entering a corporate case at the beginning or at the end, when entering an abbreviated corporate case, There are cases where input is made with labor saving. For example, “Iroha Co., Ltd.”, “Iroha Co., Ltd.”, “(Iroha Co., Ltd.)”, “Iroha”, etc. may be entered and searched.

上記のようなオペレータによる検索キーの入力を考慮すると、従来の索引付き検索対象データベース7の法人名に索引を作成した場合の検索には、以下のような問題がある。顧客情報テーブル21に登録されている法人名が、先頭に法人格をつけて登録されている場合、法人格を末尾につけた検索キーを用いて検索を行うと、検索条件と合致しないため、検索されない。例えば、登録されている法人名が「株式会社いろは」であり、検索に用いる検索キーが「いろは株式会社」である場合、一致しないため、検索されない。
また、この場合、オペレータが手動により「いろは」と検索キーを入力して、前方一致で検索したとしても、登録されている法人名は「株式会社」から始まっているので、前方一致しない。この場合、部分一致しているため、全レコードの検索が必要になる。結局、索引が有効にならず、検索は遅いものとなる。
逆に、検索において前方一致ではなく、後方一致を行うと、索引が有効に働き、高速な検索が可能なこともある。先の例で、登録されているデータ「株式会社いろは」に対して、検索キー「いろは」で後方一致検索を行うと、索引が有効に働き、高速な検索が可能である。しかし、データベースに登録されているデータが「株式会社いろは」でなく、「いろは株式会社」である場合には、逆に、前方一致のみでしか索引を用いた検索が有効とならない。いずれにせよ、従来の検索においては、法人名の法人格の登録のされ方と検索の仕方により、索引が必ずしも有効とならない問題があった。
Considering the input of the search key by the operator as described above, the search in the case where an index is created for the corporation name of the conventional indexed search target database 7 has the following problems. When the corporate name registered in the customer information table 21 is registered with a corporate case at the beginning, if a search is performed using a search key with the corporate case at the end, the search is not matched because the search condition is not met. For example, if the registered corporate name is “Iroha Corporation” and the search key used for the search is “Iroha Corporation”, they are not matched and are not searched.
Further, in this case, even if the operator manually inputs the search key “Iroha” and performs a search with a forward match, the registered corporation name does not start with a forward match because it starts with “corporation”. In this case, since partial matches are made, it is necessary to search all records. Eventually, the index will not be valid and the search will be slow.
On the other hand, if a backward match is performed instead of a forward match in the search, the index works effectively and a high-speed search may be possible. In the above example, if a backward match search is performed on the registered data “Iroha Co., Ltd.” with the search key “Iroha”, the index works effectively and a high-speed search is possible. However, when the data registered in the database is not “Iroha Co., Ltd.” but “Iroha Co., Ltd.”, conversely, the search using the index is effective only by the forward matching. In any case, the conventional search has a problem that the index is not always effective depending on how the corporate name of the corporate name is registered and how to search.

一方、第一の実施の形態による一次検索では、検索キーではなく、一部削除検索キーに合致するデータを索引付き対応データベース8の法人名抜粋により検索を行うので、前方一致もしくは後方一致の検索条件どちらでも索引が有効に働く。または、索引が有効に働く確立が上がる。そのため一次検索において、一部削除検索キーに合致する識別番号を迅速に抽出できる。
例えば、索引付き検索対象データベース7には、「株式会社いろは」または「いろは株式会社」などと登録されていたとしても、索引付き対応データベース8には法人名抜粋「いろは」が登録されている。また、オペレータが「株式会社いろは」または「いろは株式会社」などの検索キーで検索を行ったとしても、一部削除検索キーは「いろは」である。そのため、索引付き対応データベース8において一部削除検索キーを用いて検索を行うと、前方一致もしくは後方一致の検索条件どちらでも索引が有効に機能し、高速な検索が可能である。
On the other hand, in the primary search according to the first embodiment, the search matches not the search key but the data that matches the partial deletion search key by searching for the corporate name in the indexed correspondence database 8, so that the search matches forward or backward The index works effectively in both conditions. Or, the probability that the index works effectively increases. Therefore, in the primary search, an identification number that matches the partial deletion search key can be quickly extracted.
For example, even if “Iroha Co., Ltd.” or “Iroha Co., Ltd.” is registered in the indexed search target database 7, the corporate name excerpt “Iroha” is registered in the indexed correspondence database 8. Even if the operator performs a search using a search key such as “Iroha Co., Ltd.” or “Iroha Co., Ltd.”, the partial deletion search key is “Iroha”. Therefore, when a search is performed using the partial deletion search key in the indexed correspondence database 8, the index functions effectively under either the forward match or backward match search condition, and high-speed search is possible.

また、索引付き対応データベース8を用いることにより、前方一致も後方一致もせず、中間一致し、全レコードの検索が必要になる場合でも、カラムが多数ある索引付き検索対象データベース7において検索するよりも、カラムが法人名抜粋と識別番号の2つしかない索引付き対応データベース8において検索する方が、検索が速くなされる。また、検索対象となるデータ量についても、索引付き対応データベース8に登録されている法人名抜粋のデータ量の方が、索引付き検索対象データベース7の法人名のデータ量より、データ量が少ないことより、検索が速くなされる。   Further, by using the indexed correspondence database 8, even if there is no forward match or backward match, an intermediate match, and a search of all records is required, it is more preferable than a search in the indexed search target database 7 having a large number of columns. If the search is performed in the indexed correspondence database 8 that has only two columns of the corporate name excerpt and the identification number, the search is performed faster. In addition, regarding the amount of data to be searched, the data amount of the corporate name excerpt registered in the indexed correspondence database 8 is smaller than the data amount of the corporate name in the indexed search target database 7. The search is made faster.

次に、一次検索により取得した識別番号を用いて、索引付き検索対象データベース7より、検索を行うことにより、識別番号に合致するレコードを取得する。このような検索を、以下、二次検索と呼ぶことにする。
索引付き検索対象データベース7においては、顧客情報テーブル21の識別番号に対して、索引22が作成されている。識別番号は、例えばユニークな自然数であり、重複がなくデータ量は少ない。そのため、識別番号に対する索引22は、高速な検索の点において、有効に作成されている。そのため、索引付き検索対象データベース7における、識別番号に対する検索は、索引22が有効に機能するために、高速に行われる。従って、この二次検索は高速に行われる。
Next, using the identification number acquired by the primary search, a search is performed from the indexed search target database 7 to acquire a record that matches the identification number. Such a search is hereinafter referred to as a secondary search.
In the indexed search target database 7, an index 22 is created for the identification number of the customer information table 21. The identification number is, for example, a unique natural number, has no duplication, and has a small amount of data. Therefore, the index 22 for the identification number is effectively created in terms of high-speed search. Therefore, the search for the identification number in the indexed search target database 7 is performed at high speed because the index 22 functions effectively. Therefore, this secondary search is performed at high speed.

以上のように、一次検索においては、検索対象となるカラムデータにおいて一部削除用データが削除されることにより索引が有効に作成され、入力された検索キーより一部削除用データを削除した一部削除検索キーにより検索を行い、また、小さいデータベースを用いるため、高速な検索が可能となる。また、二次検索においては、索引がある識別番号による検索であるので、一般に索引を用いた高速な検索が可能である。以上のように、一次検索も二次検索も高速に行われる。そのため、一次検索と二次検索の2回の検索が必要になるが、全体の検索は高速に行うことが可能である。
また、第一の実施の形態による、このような高速な検索ができるという効果は、検索対象となるデータ量が増加するとともに顕著になる。以上のような効果が得られる理由は、検索対象となるデータより、一部削除用データを削除して、索引が有効に作成され、索引を活用できる検索が行われることが一番の理由である。
As described above, in the primary search, the index is effectively created by deleting the partial deletion data in the column data to be searched, and the partial deletion data is deleted from the input search key. The search is performed by the copy deletion search key, and since a small database is used, a high-speed search is possible. Further, since the secondary search is a search based on an identification number with an index, generally a high-speed search using the index is possible. As described above, both the primary search and the secondary search are performed at high speed. For this reason, two searches of the primary search and the secondary search are required, but the entire search can be performed at high speed.
In addition, the effect that the high-speed search can be performed according to the first embodiment becomes remarkable as the amount of data to be searched increases. The reason why the above effects can be obtained is because the index is effectively created by deleting some data for deletion from the data to be searched, and the search that can utilize the index is performed. is there.

以上のように、第一の実施の形態によれば、例えば、法人格を前後入れ替えて検索した場合において、従来技術では、前方一致も後方一致もせず全レコードの走査が必要になるが、法人名に含まれる法人格を索引付き検索対象データベース7とは別に、法人格を削除したデータにて索引付き対応データベース8を作成し、索引付き対応データベース8を用いて検索するため、前方一致もしくは後方一致にて検索することができる。このため、全レコードを走査することなく、迅速に検索キーに合致するレコードを抽出する利点がある。   As described above, according to the first embodiment, for example, in a case where a search is performed by switching the legal case before and after, the conventional technique requires scanning of all records without a front match or a back match. In addition to the indexed search target database 7, the indexed correspondence database 8 is created with the data from which the legal case has been deleted, and the indexed correspondence database 8 is used to search. You can search. For this reason, there is an advantage of quickly extracting records that match the search key without scanning all records.

次に、データを登録する手順を説明する。従来の顧客情報管理を行う場合、データの登録については、顧客情報テーブル21への登録だけであった。これに対して、第一の実施の形態においては、データが登録される時、顧客情報テーブル21への登録と同時に、対応テーブル23にも登録がされる。この登録の手順を、図4のフローチャートを用いて詳述する。   Next, a procedure for registering data will be described. In the case of performing conventional customer information management, data registration is only registration in the customer information table 21. On the other hand, in the first embodiment, when data is registered, it is registered in the correspondence table 23 simultaneously with the registration in the customer information table 21. The registration procedure will be described in detail with reference to the flowchart of FIG.

まず、入力手段1より、オペレータにより登録する検索対象データが入力される(ステップS41)。次に、登録手段5が、入力されたデータをレコードとして、検索対象テーブルである顧客情報テーブル21に登録する(ステップS42)。この時同時に、例えば、登録手段5が、入力されたデータに対して識別番号を作成し、検索対象テーブルに入力するデータと識別番号を、1つのレコードとして登録する。または、例えば、索引付き検索対象データベース7の機能により、入力されたデータに対する識別番号が作成され、入力されたデータと作成された識別番号が、1つのレコードとして登録されてもよい。ここで作成され登録される識別番号は、一例としては、レコードを一意に識別できるユニークキーとなるように作成され登録される。
この後、索引付き検索対象データベース7では、識別番号に対しての索引が自動的に作成される。これは、一般的なデータベースの機能により、識別番号に対して索引を作成するように指定してあるため、自動的になされる。以上の顧客情報のデータの登録は、従来の顧客情報のデータの登録と同じである。
First, search target data to be registered by an operator is input from the input means 1 (step S41). Next, the registration means 5 registers the input data as a record in the customer information table 21 that is a search target table (step S42). At the same time, for example, the registration unit 5 creates an identification number for the input data, and registers the data and the identification number to be input to the search target table as one record. Alternatively, for example, an identification number for the input data may be created by the function of the indexed search target database 7, and the input data and the created identification number may be registered as one record. For example, the identification number created and registered here is created and registered so as to be a unique key that can uniquely identify the record.
Thereafter, in the indexed search target database 7, an index for the identification number is automatically created. This is automatically done because it is specified by the general database function that an index is created for the identification number. The above registration of customer information data is the same as conventional registration of customer information data.

次に、一部データ削除手段2により、入力されたデータの検索対象カラムとなる部分(フィールド)が、削除用一部データ記憶部3に登録されている一部削除用データと、合致する部分を含むかどうかが判定される(ステップS43)。含まない場合には、入力されたデータの検索対象カラムとなる部分(これを一部削除データとする)と、先に作成された識別番号を1つのレコードとして、対応テーブル23に登録する(ステップS45)。一方、含む場合には、入力されたデータの検索対象カラムとなる部分から、合致する一部削除用データを削除する(ステップS44)。次に、入力されたデータの検索対象カラムとなる部分から合致する一部削除用データを削除したデータ(これを一部削除データとする)と、先に作成された識別番号を1つのレコードとして、対応テーブル23に登録する(ステップS45)。
この後、索引付き対応データベース8では、検索対象となるカラムである法人名抜粋に対しての索引が、自動的に作成される。これは、一般的なデータベースの機能により、法人名抜粋に対して索引を作成するように指定してあるため、自動的になされる。
Next, the part (field) which becomes the search target column of the input data by the partial data deleting means 2 matches the partial deletion data registered in the partial deletion data storage unit 3. Is determined (step S43). If not included, the part that is the search target column of the input data (this is partly deleted data) and the previously created identification number are registered as one record in the correspondence table 23 (step S45). On the other hand, if it is included, the matching partial deletion data is deleted from the portion that becomes the search target column of the input data (step S44). Next, the data obtained by deleting the data for partial deletion that matches from the part that becomes the search target column of the input data (this is referred to as partial deletion data) and the previously created identification number as one record And registered in the correspondence table 23 (step S45).
Thereafter, in the indexed correspondence database 8, an index is automatically created for the corporate name excerpt that is a column to be searched. This is automatically done because it is specified by the general database function that an index is created for the corporate name excerpt.

以上のようにして、入力されたデータと識別番号が1つのレコードとして、顧客情報テーブル21(索引付き検索対象データベース7)に登録され、一部削除データと識別番号が1つのレコードとして、対応テーブル23(索引付き対応データベース8)に登録される。またその後、データベース機能により、それぞれの索引が作成される。   As described above, the input data and the identification number are registered as one record in the customer information table 21 (indexed search target database 7), and the partially deleted data and the identification number are recorded as one record in the correspondence table. 23 (indexed correspondence database 8). After that, each index is created by the database function.

上記の登録についての説明では、2つのデータベースにデータの登録を行い、それぞれの登録後に索引が作成された。しかし、2つのデータベースへのデータの登録における整合性を確保するために、2つのデータベースへのデータの登録においてトランザクション処理を行い、2つの登録が正常に行われた後(コミットした後)、索引が更新されるようにしてもよい。以上のように、データベースにおける通常の任意の処理を、更に用いてもよい。   In the above description of registration, data was registered in two databases, and an index was created after each registration. However, in order to ensure consistency in registering data in the two databases, transaction processing is performed in registering data in the two databases, and after the two registrations are successfully performed (after committing), the index May be updated. As described above, normal arbitrary processing in the database may be further used.

次に、検索されたレコードが複数ある場合に、更にレコードの絞り込みを行なう第二の実施の形態を説明する。第二の実施の形態においては、一部削除検索キーによる検索を行ったレコードを対象に、一部削除データを削除していない元の検索キーにて再度検索または抽出を行うことにより、検索結果を絞り込む事ができる。その構成と動作を、以下に詳述する。   Next, a second embodiment for further narrowing down records when there are a plurality of retrieved records will be described. In the second embodiment, a search result is obtained by performing a search or extraction again with the original search key that has not deleted the partially deleted data for the record that has been searched with the partially deleted search key. Can be narrowed down. The configuration and operation will be described in detail below.

図5は、第二の実施の形態における検索装置の構成を示す図である。この構成には、第一の実施の形態における構成に、更に絞込み手段10が追加されている。
絞込み手段10は、一部削除キーにより検索情報記憶部6から検索された結果に対して、入力手段1より入力された検索キーを用いて、絞込み処理を行う。次に、絞込みを行った検索結果を出力手段9に出力する。
他の構成は、第一の実施の形態と同様である。
FIG. 5 is a diagram illustrating the configuration of the search device according to the second embodiment. In this configuration, the narrowing means 10 is further added to the configuration in the first embodiment.
The narrowing means 10 performs a narrowing process on the search result from the search information storage unit 6 using the partial deletion key, using the search key input from the input means 1. Next, the narrowed search result is output to the output means 9.
Other configurations are the same as those of the first embodiment.

まず、第一の実施の形態のように、一部削除検索キーを用いた検索を行うと、複数のレコードが検索されることがあることを、図6を用いて説明する。図6には、第一の実施の形態における顧客情報管理と同じように、索引付き検索対象データベース7とその索引付き対応データベース8に対して、顧客情報テーブル61と対応テーブル62がある。
顧客情報テーブル61には、一例としての識別番号と法人名として、「1001、株式会社ABC」、「1002、ABC(株)」、「60001、有限会社ABC」、「60002、財団法人ABCD」などが登録されている。また、各法人名に対する住所や電話番号などが登録されている。削除用一部データ記憶部3には、「株式会社」、「(株)」、「有限会社」、「(有)」、「財団法人」、「(財)」などが登録されているとする。この場合、対応テーブル62には、顧客情報テーブル61と削除用一部データ記憶部3より法人名抜粋が作成されており、法人名抜粋と識別番号が対として「ABC、1001」、「ABC、10002」、「ABC、60001」、「ABCD、60002」として登録されている。
以上の説明において、説明の簡略のため、データベースにおける索引やテーブルなどは省略している。データベースにおける索引やテーブルなどについての詳細な構成については、第一の実施の形態と同様である。
First, a case where a search using a partial deletion search key is performed as in the first embodiment, a plurality of records may be searched, will be described with reference to FIG. In FIG. 6, as in the customer information management in the first embodiment, there are a customer information table 61 and a correspondence table 62 for the indexed search target database 7 and its indexed correspondence database 8.
In the customer information table 61, as an identification number and a corporate name as an example, “1001, ABC Corporation”, “1002, ABC Corporation”, “60001, Limited Company ABC”, “60002, Foundation ABCD”, etc. Is registered. In addition, an address and a telephone number for each corporate name are registered. In the deletion partial data storage unit 3, “Co., Ltd.”, “(share)”, “limited company”, “(present)”, “foundation”, “(goods)”, etc. are registered. To do. In this case, in the correspondence table 62, a corporate name excerpt is created from the customer information table 61 and the partial data storage unit 3 for deletion, and the corporate name excerpt and the identification number are “ABC, 1001”, “ABC, 10002 "," ABC, 60001 "," ABCD, 60002 ".
In the above description, indexes and tables in the database are omitted for the sake of simplicity. The detailed configuration of the indexes and tables in the database is the same as in the first embodiment.

ここで、検索キーとして「株式会社ABC」が入力され、検索キー「株式会社ABC」による検索を行う(B1)。削除用一部データ記憶部3においては、「株式会社」が一部削除用データとして登録されていることより、検索キー「株式会社ABC」(B1)より「株式会社」が削除され、一部削除検索キーとして「ABC」が取得される(B2)。次に、一部削除検索キー「ABC」(B2)により、索引付き対応データベース8から一次検索が行われる。
一部削除検索キー「ABC」(B2)による、索引付き対応データベース8からの一次検索の結果は、識別番号「1001」、「1002」、「60001」、「60002」となる(B3)。ここでの検索は前方一致であるとした。次に、一次検索結果の識別番号(B3)による、索引付き検索対象データベース7からの、二次検索の結果は、「1001、株式会社ABC、住所・・・、電話番号・・・」、「1002、ABC(株)、住所・・・、電話番号・・・」、「60001、有限会社ABC、住所・・・、電話番号・・・」、「60002、財団法人ABCD、住所・・・、電話番号・・・」となる(B4)。
Here, “ABC Inc.” is input as a search key, and a search is performed using the search key “ABC Inc.” (B1). In the partial data storage unit 3 for deletion, since “corporation” is registered as partial deletion data, “corporation” is deleted from the search key “ABC” (B1). “ABC” is acquired as a deletion search key (B2). Next, a primary search is performed from the indexed correspondence database 8 using the partial deletion search key “ABC” (B2).
The results of the primary search from the indexed correspondence database 8 using the partial deletion search key “ABC” (B2) are the identification numbers “1001”, “1002”, “60001”, and “60002” (B3). The search here is assumed to be a forward match. Next, the result of the secondary search from the indexed search target database 7 by the identification number (B3) of the primary search result is “1001, ABC Corporation, address,..., Telephone number. 1002, ABC Co., Ltd., Address ..., Phone Number ... "," 60001, ABC Company, Address ... Phone Number ... "," 60002, ABCD, Address ... " Phone number ... "(B4).

以上のように、一部削除検索キーを用いて検索を行うために、複数の検索対象が検索されてしまう場合がある。また、最初に検索対象の目的として入力された検索キーは「株式会社ABC」であったため、検索キーとは必ずしも一致しないものを検索してしまう場合もある。   As described above, since a search is performed using the partial deletion search key, a plurality of search targets may be searched. In addition, since the search key first input as the object of the search target is “ABC Inc.”, a search key that does not necessarily match the search key may be searched.

このように複数のレコードが検索されてしまった場合、この検索結果から、更に絞込み処理を行うことにより、検索の目的としたレコードを抽出することが可能である。これは、検索結果に対して、更に、絞り込み手段10により、検索キーを用いて検索対象となったカラムに対して、検索または抽出する絞り込み処理を行うことによりなされる。   When a plurality of records have been searched in this way, it is possible to extract a record intended for search by further narrowing down the search results. This is performed by further performing a narrowing process for searching or extracting a column as a search target by using the search key by the narrowing means 10 on the search result.

例えば、上記の二次検索の結果である、検索結果の法人名「株式会社ABC」、「ABC(株)」、「有限会社ABC」、「財団法人ABCD」に対して、絞込み手段10により、検索キー「株式会社ABC」と一致するものを検索または抽出することにより、「1001、株式会社ABC、住所・・・、電話番号・・・」のみが検索結果とされる。次に、この検索結果が出力手段9に出力される。   For example, the narrowing means 10 for the corporation name “ABC Co., Ltd.”, “ABC Co., Ltd.”, “ABC Ltd.”, and “ABC ABC Corporation” of the search results, which are the results of the above secondary search, By searching or extracting a search key that matches the search key “ABC”, only “1001, ABC, Inc., address,..., Telephone number. Next, this search result is output to the output means 9.

次に、図7のフローチャートを用いて、第二の実施の形態においてなされる絞込み処理の動作を説明する。
図7のフローチャートは、図3の第一の実施の形態においてなされる検索処理のフローチャートにおいて、抽出されたレコード候補が多数あった場合の処理を追加したものである。図7のフローチャートにおけるステップS71からステップS74までは、第一の実施の形態の検索においてなされる処理と同一であり、図3のフローチャートにおけるステップS31からステップS34までと同一である。以下に、第一の実施の形態における検索処理と異なる部分について説明する。
Next, the operation of the narrowing-down process performed in the second embodiment will be described using the flowchart of FIG.
The flowchart of FIG. 7 is obtained by adding a process when there are a large number of extracted record candidates in the flowchart of the search process performed in the first embodiment of FIG. Steps S71 to S74 in the flowchart of FIG. 7 are the same as the processes performed in the search of the first embodiment, and are the same as steps S31 to S34 in the flowchart of FIG. Below, a different part from the search process in 1st embodiment is demonstrated.

まず、ステップS74までの処理により、一部削除データに合致するレコードが取得されている。つまり、二次検索の結果が取得されている。次に、取得したレコードが2つ以上であるかどうかの判定が行われる(ステップS75)。取得したレコードが2より少ない場合、つまり1つか0である場合には、取得したレコードを表示する(ステップS76)。これは第一の実施の形態においてなされる処理と同じである。一方、取得したレコードが2つ以上である場合には、更に取得したレコードのリストに対して、検索キーを用いた絞込み処理が行われる(ステップS77)。次に、取得して絞り込んだレコードのリストが表示される(ステップS78)。   First, a record that matches the partially deleted data is acquired by the processing up to step S74. That is, the result of the secondary search is acquired. Next, it is determined whether there are two or more acquired records (step S75). If the acquired record is less than 2, that is, 1 or 0, the acquired record is displayed (step S76). This is the same as the processing performed in the first embodiment. On the other hand, when there are two or more acquired records, a narrowing process using a search key is further performed on the list of acquired records (step S77). Next, a list of records obtained and narrowed down is displayed (step S78).

上述のステップS77においてなされる、絞込みについての処理は、先に例示したように、二次検索の結果の検索対象となる部分で、最初に入力された検索キーと一致したもののみを抽出することによりなされる。または、二次検索の結果を、別のテーブルに一時的に保存し、そこから検索キーにより検索を行ってもよい。具体的な、抽出または検索については任意であり、最初に入力された検索キーにより再度抽出または検索を行うことが重要な点である。   As described above, the narrowing-down process performed in step S77 described above is to extract only the part that is the search target of the secondary search result that matches the first input search key. Is made by Alternatively, the result of the secondary search may be temporarily stored in another table, and the search may be performed from there using a search key. The specific extraction or search is arbitrary, and it is important to perform the extraction or search again with the search key input first.

以上のように、ステップS77で絞り込み処理を行うことにより、一部削除検索キーによる検索では複数のレコードが該当した場合においても、オペレータが最初に入力した検索キーと合致するもののみが取得され表示される。   As described above, by performing the narrowing-down process in step S77, even when a plurality of records correspond to the search using the partial deletion search key, only the search key that matches the search key first input by the operator is acquired and displayed. Is done.

また、追加の処理として、ステップS77において絞り込んだ結果の数により、更なる処理を行ってもよい。例えば、ステップS74による検索結果が複数あり、ステップS77において絞り込んだ結果の数が0であった場合には、絞り込む前のステップS74の検索結果のレコードをリストとして表示することも可能である。
また、第二の実施の形態において、登録などの他の処理は、第一の実施の形態と同様に行われる。
As additional processing, further processing may be performed depending on the number of results narrowed down in step S77. For example, if there are a plurality of search results in step S74 and the number of results narrowed down in step S77 is 0, it is also possible to display the search result records in step S74 before narrowing down as a list.
In the second embodiment, other processes such as registration are performed in the same manner as in the first embodiment.

次に、多数の製菓を索引付き検索対象データベース7で管理するシステムを対象にした、第一または第二の実施の形態の別例について、図8を参照して説明する。
削除する一部削除用データとして地名を指定し、商品名より一部削除用データを削除した商品名地域削除と、商品管理テーブルのレコードを特定する識別番号を対として、索引付き対応データベース8を作成する。
商品名の先頭に地名がついた製菓の検索時に、オペレータが商品名を手投入にて検索キーに指定する際、異なる地名にて前方一致の条件にて検索する場合がある。その場合、索引付き検索対象データベース7に登録されているデータは、前方一致の条件に合致せずレコードを抽出できない。しかし、地名を削除した検索キー(一部削除検索キー)と索引付き対応データベース8を用いて検索することで、地名を削除した検索キーに前方一致したレコードを抽出できる。次に、抽出したレコードに含まれている識別番号を検索キーとして、索引付き検索対象データベース7を検索することで、索引を有効に利用した迅速なレコード候補の抽出が可能になる。
Next, another example of the first or second embodiment for a system that manages a large number of confectionery in the indexed search target database 7 will be described with reference to FIG.
A place name is specified as the data for partial deletion to be deleted, the product name region deletion in which the data for partial deletion is deleted from the product name, and the identification number identifying the record in the product management table as a pair, the indexed correspondence database 8 create.
When searching for confectionery with a place name at the beginning of a product name, when the operator manually designates the product name as a search key, a search may be performed using different place names under a forward matching condition. In this case, the data registered in the indexed search target database 7 does not match the forward matching condition, and a record cannot be extracted. However, by performing a search using the search key from which the place name has been deleted (partially deleted search key) and the indexed correspondence database 8, it is possible to extract a record that matches the search key from which the place name has been deleted. Next, by searching the indexed search target database 7 using the identification number included in the extracted record as a search key, it is possible to quickly extract record candidates using the index effectively.

以上のように、本発明による実施の形態においては、対象とするデータベースは法人名に限定されるものではなく、製菓の商品管理や、その他様々なデータベースに適応可能である。   As described above, in the embodiment according to the present invention, the target database is not limited to the corporate name, and can be applied to confectionery product management and other various databases.

次に、索引付き検索対象データベース7にある1レコードに対して、索引付き対応データベース8の複数のレコードが該当する第三の実施の形態を説明する。
例えば、第一の実施の形態のように、顧客情報を管理する索引付き検索対象データベース7(図2)を想定する。第一の実施の形態においては、顧客情報データベースにある「50001、西日本電信電話株式会社」に対して、索引付き対応データベース8には「西日本電信電話、50001」のみが登録されていた。しかし、索引付き対応データベース8には、顧客情報データベースにある「50001、西日本電信電話株式会社」に対して、複数の対応するレコードを登録することが可能である。
Next, a third embodiment in which a plurality of records in the indexed correspondence database 8 correspond to one record in the indexed search target database 7 will be described.
For example, an indexed search target database 7 (FIG. 2) that manages customer information is assumed as in the first embodiment. In the first embodiment, only “Nippon Nippon Telegraph and Telephone, 50001” is registered in the indexed correspondence database 8 with respect to “50001, West Nippon Telegraph and Telephone Corporation” in the customer information database. However, in the indexed correspondence database 8, it is possible to register a plurality of corresponding records for “50001, Nippon Telegraph and Telephone Corporation” in the customer information database.

例えば、索引付き対応データベース8には「西日本電信電話、50001」以外に、「西日本NTT、50001」、「西NTT、50001」と、識別番号50001に対して、複数のレコードを有することが可能である。このように索引付き対応データベース8には、一部削除データだけではなく、略称や俗称などの別名を登録することも可能である。   For example, in addition to “Nippon Telegraph and Telephone, 50001”, the indexed correspondence database 8 can have a plurality of records for “West Japan NTT, 50001”, “West NTT, 50001”, and the identification number 50001. is there. In this way, in the indexed correspondence database 8, not only partially deleted data but also alias names such as abbreviations and common names can be registered.

第三の実施の形態における検索は、第一の実施の形態においてなされる検索と同様である。例えば、略称である「西日本NTT」という検索キーに対して、法人格の一部削除データが削除される。この場合には、一致する法人格がないため、検索キーから何も削除されず、「西日本NTT」が一部削除検索キーとして取得される。この一部削除検索キーにより、索引付き対応データベース8により検索が行われ、識別番号50001を取得する。その後、識別番号50001を検索キーとして、索引付き検索対象データベース7により検索が行われる。以上のように、索引付き検索対象データベース7の1レコードに該当する複数のレコードが索引付き対応データベース8に登録されている場合においても、その構成と処理は、第一の実施の形態と同様である。また、第二の実施の形態のように、絞込み処理を行うことも可能である。   The search in the third embodiment is the same as the search performed in the first embodiment. For example, the partial deletion data of the legal personality is deleted for the search key “West Japan NTT” which is an abbreviation. In this case, since there is no matching corporate case, nothing is deleted from the search key, and “West Japan NTT” is acquired as the partial delete search key. With this partial deletion search key, a search is performed in the indexed correspondence database 8 to obtain an identification number 50001. After that, the indexed search target database 7 is searched using the identification number 50001 as a search key. As described above, even when a plurality of records corresponding to one record of the indexed search target database 7 are registered in the indexed correspondence database 8, the configuration and processing are the same as in the first embodiment. is there. Further, as in the second embodiment, it is possible to perform a narrowing process.

上記のように、索引付き対応データベース8には、同じ識別番号を有するレコードが登録可能である。一方、索引付き検索対象データベース7においては、識別番号はユニークであり、識別番号により一意にレコードを識別できることが重要な点である。
このように識別番号が構成されているため、索引付き対応データベース8の識別番号から、索引付き検索対象データベース7への検索は、一意になされる。
As described above, records having the same identification number can be registered in the indexed correspondence database 8. On the other hand, in the indexed search target database 7, the identification number is unique, and it is important that the record can be uniquely identified by the identification number.
Since the identification number is configured in this way, the search from the identification number of the indexed correspondence database 8 to the indexed search target database 7 is uniquely performed.

第三の実施の形態において、索引付き対応データベース8への登録の方法については、任意の設計である。例えば、索引付き検索対象データベース7より、オペレータが任意の顧客レコードを選択し、オペレータがその顧客についての略称や俗称を入力し、それを登録することを選択すると、入力された略称や俗称と索引付き検索対象データベース7におけるその顧客の識別番号を、索引付き対応データベース8に1つのレコードとして登録する。   In the third embodiment, the registration method in the indexed correspondence database 8 is an arbitrary design. For example, when the operator selects an arbitrary customer record from the indexed search target database 7 and the operator inputs an abbreviation or common name for the customer and selects to register it, the input abbreviation or common name and index are entered. The identification number of the customer in the indexed search target database 7 is registered as one record in the indexed correspondence database 8.

なお、例えば、上述の第一の実施の形態においては、検索を行うカラムとして法人名のみに対して、対応データベースを用いた検索を行う説明を行った。しかし、検索は、他のカラムでも行うことが可能であり、住所カラム、電話番号カラムなどに対しても、法人名カラムと同様に、カラム毎に対応データベースを作成し、カラム毎の対応データベースを用いて一次検索を行うことにより識別番号を取得し、次に識別番号により二次検索を行うように構成することが可能である。   For example, in the above-described first embodiment, the search using the correspondence database is performed only for the corporate name as the column for performing the search. However, the search can also be performed in other columns. For the address column, telephone number column, etc., as with the corporate name column, a corresponding database is created for each column, and the corresponding database for each column is created. It is possible to obtain an identification number by performing a primary search, and then perform a secondary search by the identification number.

このような構成の場合には、削除用一部データ3に、検索対象となるカラム毎に、削除するデータである「株式会社」などの法人格や、「03−」などの地域電話番号などを登録する。また、索引付き対応データベース8にも、カラム毎の対応データベースが作成される。また、対応データベースには、検索対象となるカラムのデータより、カラム毎の削除データが削除されて、登録されている。
また、検索時や登録時においては、検索キーに対しても、検索対象となるカラム毎に指定された一部削除用データの削除を行い、一部削除検索キーを作成し、一部削除検索キーにより検索または登録する。
以上ように、複数のカラムに対しても、検索や登録ができるように構成することも可能である。
In the case of such a configuration, in the deletion partial data 3, for each column to be searched, a corporate case such as “corporation”, which is data to be deleted, a local telephone number such as “03-”, etc. sign up. A correspondence database for each column is also created in the indexed correspondence database 8. In the correspondence database, deletion data for each column is deleted from the column data to be searched and registered.
Also, at the time of search or registration, the part deletion data specified for each column to be searched is deleted for the search key, a part deletion search key is created, and part deletion search is performed. Search or register by key.
As described above, it is also possible to configure such that a plurality of columns can be searched and registered.

また、本発明における第一から第三の実施の形態は、既存の情報管理システムに追加することができる。
例えば、従来の顧客情報管理システムにおいては、第一の実施の形態における、入力手段1、検索手段4、登録手段5、索引付き検索対象データベース7、出力手段9の構成により、その構成は完結していた。つまり、索引付き検索対象データベース7つまり索引付き検索対象データベース7のみに対して、顧客情報の検索および登録がなされていた。従来の構成に、一部データ削除手段2、削除用一部データ記憶部3、索引付き対応データベース8を追加し、検索手段4と登録手段5においてなされる処理を変更することにより、第一の実施の形態となる。そのため、既に運用されている既存の顧客情報管理システムに、少数の構成の追加をすることにより、第一の実施の形態のような構成とし、これを運用することは容易である。また、既存のデータベースを用いたシステムに対して、構成の追加を行うことにより、第一から第三のように構成することも容易である。
The first to third embodiments of the present invention can be added to an existing information management system.
For example, in the conventional customer information management system, the configuration is completed by the configuration of the input unit 1, the search unit 4, the registration unit 5, the indexed search target database 7, and the output unit 9 in the first embodiment. It was. That is, the customer information is searched and registered only in the indexed search target database 7, that is, the indexed search target database 7. By adding the partial data deletion means 2, the deletion partial data storage section 3, and the indexed correspondence database 8 to the conventional configuration and changing the processing performed in the search means 4 and the registration means 5, the first This is an embodiment. Therefore, by adding a small number of configurations to an existing customer information management system that is already in operation, it is easy to operate the configuration as in the first embodiment. In addition, it is easy to configure from the first to the third by adding a configuration to a system using an existing database.

また、第一から第三の実施の形態における検索について、検索手段4は、一部削除検索キーより索引付き対応データベース8より検索を行い、識別番号を取得し、識別番号により索引検索対象データ記憶部7の検索を行った。しかし、検索手段4は、検索キーから直接に、索引付き検索対象データベース7の検索を行うことも可能である。これは、従来からなされている検索方法である。このように、本発明による実施の形態における検索方法は、従来の検索方法と共存できるものである。
また、従来の検索方法のために、索引付き検索対象データベース7の、検索対象となる任意のカラムに、索引を付けることも可能である。
以上のように、第一から第三の実施の形態は、従来からある既存のデータベースとその検索方法を残しつつ、容易に拡張することが可能である。
For the search in the first to third embodiments, the search means 4 searches the indexed correspondence database 8 using the partial deletion search key, obtains the identification number, and stores the index search target data by the identification number. A search for part 7 was performed. However, the search means 4 can also search the indexed search target database 7 directly from the search key. This is a conventional search method. As described above, the search method according to the embodiment of the present invention can coexist with the conventional search method.
Moreover, it is also possible to attach an index to an arbitrary column to be searched in the indexed search target database 7 for the conventional search method.
As described above, the first to third embodiments can be easily expanded while leaving the existing existing database and the search method thereof.

また、実施の形態として、例えば索引付き検索対象データベース7の識別番号をユニークキーとしたが、ユニークキーに限定されるのではなく、プライマリキーでもよい。また、識別番号としては、複数のカラムを利用するユニークキーやプライマリキーでもよい。この場合、対応データベースにおける識別情報にも複数のカラムが利用される。本発明における実施の形態として重要な点は、識別番号により該当するレコードが一意に識別できることにある。
また、識別番号はユニークな自然数として説明してきたが、識別番号は自然数のみに限られるものではなく、数字以外の文字でもよい。この場合においても、各レコードをユニークに識別できる文字であることが需要である。
In the embodiment, for example, the identification number of the indexed search target database 7 is a unique key. However, the identification number is not limited to a unique key, and may be a primary key. Further, the identification number may be a unique key or a primary key using a plurality of columns. In this case, a plurality of columns are also used for identification information in the correspondence database. An important point as an embodiment in the present invention is that a corresponding record can be uniquely identified by an identification number.
Although the identification number has been described as a unique natural number, the identification number is not limited to a natural number, and may be a character other than a number. Even in this case, there is a demand for characters that can uniquely identify each record.

また、例えば索引付き検索対象データベース7と索引付き対応データベース8は、1つのデータベースとして構成してもよいし、別々のデータベースとして構成としてもよい。または、2つのデータベースはネットワークを介す別々のデータベースであってもよい。   Further, for example, the indexed search target database 7 and the indexed correspondence database 8 may be configured as one database or may be configured as separate databases. Alternatively, the two databases may be separate databases via a network.

また、検索手段4と登録手段5は、データベースの機能として、索引付き検索対象データベース7および索引付き対応データベース8の機能の一部とすることもできる。   Moreover, the search means 4 and the registration means 5 can also be made into a part of function of the indexed search object database 7 and the indexed correspondence database 8 as the function of the database.

また、第一から第三の実施の形態における各機能は、それぞれ独立に用いることもできるし、それぞれを任意に組み合わせて用いてもよい。   Moreover, each function in the first to third embodiments can be used independently, or can be used in any combination.

以上、この発明の実施形態を、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。   The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes a design and the like within the scope not departing from the gist of the present invention.

本発明は、大量のデータを保持するデータベースの検索方法に用いて最適である。   The present invention is most suitable for use in a database search method that holds a large amount of data.

この発明の第一の実施形態による大規模情報の検索装置を適応した検索装置の構成を示すブロック図である。It is a block diagram which shows the structure of the search device which adapted the search device of the large-scale information by 1st Embodiment of this invention. 同検索装置における索引付き検索対象データベース7および索引付き対応データベース8の記憶内容の一例を示す図である。It is a figure which shows an example of the memory content of the indexed search object database 7 and the indexed correspondence database 8 in the search device. 同検索装置における、データの検索の手順を示すフローチャートである。It is a flowchart which shows the procedure of the search of data in the search device. 同検索装置における、データの登録の手順を示すフローチャートである。It is a flowchart which shows the procedure of registration of data in the search device. この発明の第二の実施形態による大規模情報の検索装置を適応した検索装置の構成を示すブロック図である。It is a block diagram which shows the structure of the search device which adapted the search device of the large-scale information by 2nd embodiment of this invention. 同検索装置において、複数の検索結果が生じる例を示すブロック図である。It is a block diagram which shows the example which a some search result produces in the same search device. 同検索装置における、データの検索の手順を示すフローチャートである。It is a flowchart which shows the procedure of the search of data in the search device. この発明の第一または第二の実施形態による大規模情報の検索装置を適応した検索装置における索引付き検索対象データベース7および索引付き対応データベース8の記憶内容の別の一例を示す図である。It is a figure which shows another example of the memory content of the indexed search object database 7 and the indexed corresponding | compatible database 8 in the search device which applied the large-scale information search device by 1st or 2nd embodiment of this invention.

符号の説明Explanation of symbols

1・・・入力手段
2・・・一部データ削除手段
3・・・削除用一部データ記憶部
4・・・検索手段
5・・・登録手段
6・・・検索用情報データベース
7・・・索引付き検索対象データベース
8・・・索引付き対応データベース
9・・・出力手段
10・・・絞込み手段

DESCRIPTION OF SYMBOLS 1 ... Input means 2 ... Partial data deletion means 3 ... Deletion partial data storage part 4 ... Search means 5 ... Registration means 6 ... Search information database 7 ... Retrieval database with index 8 ... Corresponding database with index 9 ... Output means 10 ... Narrowing means

Claims (10)

検索対象記憶手段内のレコードを検索キーに基づいて検索する大規模情報の検索方法において、
予め前記レコードの検索対象カラムに属するカラムデータから削除用データを削除した削除後カラムデータと、前記レコードの識別情報とを対応させて記憶させた対応データ記憶手段を形成しておき、
検索時において、
前記検索キーから前記削除用データを削除した削除後検索キーを生成し、
前記削除後検索キーに基づいて識別情報を前記対応データ記憶手段より検索して取得し、
前記取得した識別情報に合致するレコードを前記検索対象記憶手段より検索して取得する
ことを特徴とする大規模情報の検索方法。
In a large-scale information search method for searching records in a search target storage unit based on a search key,
Forming correspondence data storage means for storing the post-deletion column data obtained by deleting the deletion data from the column data belonging to the search target column of the record and the identification information of the record in association with each other;
When searching,
Generate a post-deletion search key that deletes the deletion data from the search key,
Based on the search key after deletion, the identification information is retrieved from the corresponding data storage means and acquired,
A search method for large-scale information, wherein a record that matches the acquired identification information is searched and acquired from the search target storage means.
前記検索対象記憶手段を検索して取得したレコードが複数である場合に、該複数のレコードから前記検索キーに対応するレコードを取得する過程を更に有することを特徴とする請求項1に記載の大規模情報の検索方法。   2. The method according to claim 1, further comprising a step of acquiring a record corresponding to the search key from the plurality of records when there are a plurality of records acquired by searching the search target storage unit. How to search for scale information. 検索対象記憶手段内のレコードを検索キーに基づいて検索する大規模情報の検索装置において、
前記レコードの検索対象カラムに属するカラムデータから削除用データを削除した削除後カラムデータと、前記レコードの識別情報とを対応させて記憶させた対応データ記憶手段と、
前記検索キーから前記削除用データを削除した削除後検索キーを生成する削除後検索キー生成手段と、
前記削除後検索キーに基づいて識別情報を前記対応データ記憶手段より検索して取得する第一の検索手段と、
前記第一の検索手段が取得した識別番号に合致するレコードを前記検索対象記憶手段より検索して取得する第二の検索手段と、
を具備することを特徴とする大規模情報の検索装置。
In a large-scale information retrieval apparatus that retrieves a record in a retrieval target storage unit based on a retrieval key,
Corresponding data storage means that stores post-deletion column data in which deletion data is deleted from column data belonging to the search target column of the record, and identification information of the record in association with each other,
A post-deletion search key generation means for generating a post-deletion search key by deleting the deletion data from the search key;
First search means for searching and acquiring identification information from the corresponding data storage means based on the post-delete search key;
A second search means for searching and acquiring a record that matches the identification number acquired by the first search means from the search target storage means;
An apparatus for retrieving large-scale information, comprising:
少なくとも、前記検索対象記憶手段に記憶されている識別情報と、前記対応データ記憶手段に記憶されている削除後カラムデータに対して、索引が作成されていることを特徴とする請求項3に記載の大規模情報の検索装置。   The index is created for at least the identification information stored in the search target storage unit and the post-deletion column data stored in the corresponding data storage unit. Large-scale information retrieval device. 前記第一の検索手段および第二の検索手段にて行われる検索が、索引を用いた前方一致および後方一致による検索であることを特徴とする請求項3または請求項4に記載の大規模情報の検索装置。   5. The large-scale information according to claim 3, wherein the search performed by the first search means and the second search means is a search based on a forward match and a backward match using an index. Search device. 前記検索対象記憶手段に記憶されている識別情報がユニークであること
を特徴とする請求項3から請求項5のいずれかに記載の大規模情報の検索装置。
6. The large-scale information search apparatus according to claim 3, wherein the identification information stored in the search target storage means is unique.
前記大規模情報の検索装置が、更に、
前記第二の検索手段により検索され取得されたレコードが複数である場合、該複数のレコードから前記検索キーに対応するレコードを取得する絞込み手段、
を有することを特徴とするとする請求項3から請求項6のいずれかに記載の大規模情報の検索装置。
The large-scale information search device further comprises:
When there are a plurality of records searched and acquired by the second search means, a narrowing means for acquiring a record corresponding to the search key from the plurality of records,
The large-scale information search apparatus according to claim 3, wherein the large-scale information search apparatus includes:
前記大規模情報の検索装置が、更に、
前記検索対象記憶手段内のレコードを前記検索キーに基づいて検索する通常検索手段、
を有することを特徴とするとする請求項3から請求項7のいずれかに記載の大規模情報の検索装置。
The large-scale information search device further comprises:
Normal search means for searching records in the search target storage means based on the search key;
The large-scale information search device according to claim 3, wherein the large-scale information search device is provided.
前記対応データ記憶手段が、更に、
前記レコードの検索対象カラムに属するカラムデータに関連する情報と、前記レコードの識別情報とを対応させて記憶すること、
を特徴とするとする請求項3から請求項8のいずれかに記載の大規模情報の検索装置。
The corresponding data storage means further comprises:
Storing information related to column data belonging to the search target column of the record in association with identification information of the record;
The large-scale information search device according to claim 3, wherein
前記大規模情報の検索装置が、更に、
登録するためのレコードを入力する入力手段と、
前記入力されたレコードと、前記入力されたレコードを前記検索対象記憶手段内において一意に識別する識別情報とを1つのレコードにして、前記検索対象記憶手段に登録する第一の登録手段と、
前記入力されたレコードより、検索対象カラムに属するカラムデータを取り出し、前記取り出したカラムデータより、前記削除用データを削除した削除後登録データを作成する削除後登録データ作成手段と、
前記作成した削除後登録データと前記識別情報とを対応させて前記対応データ記憶手段に登録する第二の登録手段と、
を有することを特徴とする請求項3から請求項9のいずれかに記載の大規模情報の検索装置。

The large-scale information search device further comprises:
An input means for inputting a record for registration;
A first registration means for registering the input record and identification information for uniquely identifying the input record in the search target storage means into one record, and registering the search record in the search target storage means;
Post-deletion registration data creation means for retrieving column data belonging to a search target column from the input record, and creating post-deletion registration data by deleting the deletion data from the extracted column data;
Second registration means for registering the created post-deletion registration data and the identification information in correspondence with the corresponding data storage means;
The large-scale information search apparatus according to claim 3, wherein the large-scale information search apparatus includes:

JP2006036666A 2006-02-14 2006-02-14 Retrieval method and device for large-scale information Pending JP2007219627A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006036666A JP2007219627A (en) 2006-02-14 2006-02-14 Retrieval method and device for large-scale information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006036666A JP2007219627A (en) 2006-02-14 2006-02-14 Retrieval method and device for large-scale information

Publications (1)

Publication Number Publication Date
JP2007219627A true JP2007219627A (en) 2007-08-30

Family

ID=38496892

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006036666A Pending JP2007219627A (en) 2006-02-14 2006-02-14 Retrieval method and device for large-scale information

Country Status (1)

Country Link
JP (1) JP2007219627A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020027452A (en) * 2018-08-11 2020-02-20 株式会社トヨタマップマスター Creation device of facility index, creation method of facility index and program

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CSND200401545003, 今津 英世, "Perl活用のヒント 7", UNIX MAGAZINE, 20040401, 第19巻 第4号, 63−79ページ, JP, 株式会社アスキー *
JPN6010040635, Databases From scratch III:The Design Process, 19991104 *
JPN6010040642, 今津 英世, "Perl活用のヒント 7", UNIX MAGAZINE, 20040401, 第19巻 第4号, 63−79ページ, JP, 株式会社アスキー *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020027452A (en) * 2018-08-11 2020-02-20 株式会社トヨタマップマスター Creation device of facility index, creation method of facility index and program

Similar Documents

Publication Publication Date Title
CN111143368A (en) Relational database data comparison method and system
JP2007219627A (en) Retrieval method and device for large-scale information
JP2005107931A (en) Image search apparatus
CN111737267B (en) HBase-based index system and query acceleration method
JPH1166095A (en) Data managing device
JPH1091766A (en) Electronic filing method and device and storage medium
JP4256399B2 (en) Information list presentation method and information sharing system
JP2008059136A (en) Leaking personal information retrieval system, leaking personal information retrieval method, leaking personal information retrieval device and program
JPH1173392A (en) Method and system for determining user id
JP2002140218A (en) Data processing method, computer-readable recording medium and data processing device
JP3824468B2 (en) Data management system
CN116166720A (en) Data sorting method and device and electronic equipment
CN104765829A (en) Information retrieval method and device
JP2888458B2 (en) File storage device
JP3972309B2 (en) Information conversion apparatus and program
JPH11143749A (en) Relational database management system and data management method
JPH05324610A (en) Address notation chinese character inputting device
JP2009129213A (en) Data structure output system
JP2005018504A (en) Proceedings publishing system
JPH03252866A (en) Data retrieving method for computer
CN116304156A (en) Picture retrieval method, device, electronic equipment and storage medium
JP2003141136A (en) Method of updating index for document search
JP2003248694A (en) Search program and system, and recording medium recorded with search program
JP2000315133A (en) Character string input device, its input method and recording medium recording program for inputting character string
JP2008015981A (en) Device and method for analyzing location, its program, and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110301