JP2007206954A - Database search method - Google Patents

Database search method Download PDF

Info

Publication number
JP2007206954A
JP2007206954A JP2006024633A JP2006024633A JP2007206954A JP 2007206954 A JP2007206954 A JP 2007206954A JP 2006024633 A JP2006024633 A JP 2006024633A JP 2006024633 A JP2006024633 A JP 2006024633A JP 2007206954 A JP2007206954 A JP 2007206954A
Authority
JP
Japan
Prior art keywords
data
item
customer
items
digit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006024633A
Other languages
Japanese (ja)
Inventor
Koji Ogata
孝司 尾形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Priority to JP2006024633A priority Critical patent/JP2007206954A/en
Publication of JP2007206954A publication Critical patent/JP2007206954A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To automatically and quickly retrieve common items of retrieved data and surely acquire them without being restricted by time. <P>SOLUTION: The customer code of each customer data is added with a link attribute value such as a 25-digit binary link attribute value corresponding to its attributes, and stored into a database. The customer data is composed of, for example, attributes, each of which has five items, and each attribute consists of five-digit (five-bit) numerical data. In the numerical data, a different digit has a bit "1" corresponding to types of attributes. The numerical data of the five items are combined to become a link attribute value shown in the figure. In five customer data retrieved according to specified retrieval conditions, for example, the link attribute values are subjected to logical conjunction for every digit, and then an item to which five-digit numerical data included with "1" bit corresponds becomes the common item that is the same attribute in all retrieved data. In the figure, the item "occupation" is the common item. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、顧客データなどの複数の項目からなるデータを検索するデータベース検索システムに係り、特に、設定されて検索条件で検索されたデータの属性に関する項目のうち、かかる検索データの全てに共通する項目(即ち、全ての検索データで属性が一致する項目)を検索するデータベース検索システムに関する。   The present invention relates to a database search system for searching for data consisting of a plurality of items such as customer data, and in particular, among items related to attribute of data set and searched by a search condition, it is common to all such search data. The present invention relates to a database search system for searching for items (that is, items whose attributes match in all search data).

データベースに格納されているデータの中から所望のデータを取得するためには、データヘースでかかるデータの検索を可能とする検索条件を設定し、この検索条件を用いてデータベースでのデータ検索を行なわせる。このようにして、所望とするデータをデータベースから取得することができるが、さらに、このようにして取得したデータに共通する属性などの項目を知りたい場合もある。   In order to obtain the desired data from the data stored in the database, a search condition that enables the search of such data is set in the data hose, and the data search in the database is performed using this search condition. . In this way, desired data can be obtained from the database, but there are also cases where it is desired to know items such as attributes common to the data thus obtained.

検索の対象データとして、証券取引業務などで用いられる顧客データを例にすると、かかる顧客データはデータベース(顧客データベース)に蓄積されており、所定の検索条件をもとにこの顧客データベースの検索を行なうと、所望の顧客データを取得することができる。図7は、例えば、100人の顧客データが蓄積されている顧客データベースからの検索結果のテーブルを示すものであり、ここでは、検索によって5人の顧客データが得られたものとしている。   As an example of customer data used in securities trading business, etc., the customer data is stored in a database (customer database), and this customer database is searched based on predetermined search conditions. Desired customer data can be acquired. FIG. 7 shows, for example, a table of search results from a customer database in which customer data for 100 people is stored. Here, it is assumed that customer data for 5 people is obtained by the search.

ここで、顧客データのデータベースは、顧客の属性に応じた各顧客に付与された顧客コードや顧客名,性別,職業,趣味,取引動機,投資目的などといった項目(フィールド)からなるRDB(Relational DataBase:関係データベース)の構成をなしており、顧客の各属性は、かかる項目のいずれかに該当する。例えば、項目「性別」には、顧客の属性である「男」や「女」が該当し、項目「趣味」には、顧客の属性である「スポーツ」や「読書」,「音楽鑑賞」などが該当する。顧客データベースを検索することにより、希望する顧客の属性を知ることができる。   Here, the database of customer data is an RDB (Relational DataBase) consisting of items (fields) such as customer codes, customer names, sex, occupations, hobbies, transaction motivations, investment purposes, etc. given to each customer according to customer attributes. : Relational database), and each attribute of the customer corresponds to one of such items. For example, the item “gender” corresponds to customer attributes “male” and “woman”, and the item “hobby” includes customer attributes “sports”, “reading”, “music appreciation”, etc. Is applicable. By searching the customer database, it is possible to know the desired customer attributes.

このようなデータ検索に際し、データを2進数の数字コードで表わしてデータベースに格納し、数字コードで表わされる検索条件を用いてデータベースから所望のデータを検索する技術が提案されている(例えば、特許文献1参照)。   In such a data search, a technique has been proposed in which data is represented by a binary numeric code and stored in a database, and desired data is retrieved from the database using a search condition represented by the numeric code (for example, patents). Reference 1).

かかる特許文献1に記載の発明は、検索対象となるデータ量が多くなっても、また、検索条件としての項目内容となるキャラクタ数が大きくなっても、検索に要する時間を大幅に短縮することができるようにしたものであって、データを表わす数字コードを演算して付加情報を作成し、これを数字コードと関連付けてデータベースに格納し、このデータベースから所望のデータを検索する場合には、数字コードで表わされる検索条件から同様の付加情報を作成し、かかる検索条件の付加情報とデータベースでの各データの付加情報とを照合してデータ検索を行なうものであり、これによって曖昧な検索条件による大まかな検索が行なわれて限られた数のデータが得られることになり、数が制限されたかかるデータの中から、この検索条件による手間のかかるデータ検索をこの数が限られてデータに対して行なわれるようにしたものである。
特開平8ー235208号公報
The invention described in Patent Document 1 significantly reduces the time required for searching even if the amount of data to be searched increases or the number of characters that are item contents as search conditions increases. When a numerical code representing data is calculated to create additional information, this is associated with the numerical code and stored in a database, and desired data is retrieved from this database, The same additional information is created from the search condition represented by the numeric code, and the data search is performed by comparing the additional information of the search condition with the additional information of each data in the database, whereby the ambiguous search condition As a result of a rough search, a limited number of data is obtained. From this limited number of data, this search condition Data retrieval time-consuming is obtained as this number is performed for a limited by data.
JP-A-8-235208

ところで、以上のようにして得られた顧客データの検索結果から、属性がこれら検索顧客全てに等しい項目(以下、共通事項という)が何であるかを知る必要がある場合がある。このためには、例えば、図7に示すような検索結果のテーブルをディスプレイに表示し、オペレータが目視でこの共通項目を見つけ出すようにすることもできるが、特に、対象とする(即ち、検索された)顧客データの数が多い場合には、手間と時間が掛かる作業となり、このため、自動的に共通項目を探索できるようにすることが望まれている。   By the way, there are cases where it is necessary to know what items (hereinafter referred to as “common items”) whose attributes are equal to all of these search customers from the search results of the customer data obtained as described above. For this purpose, for example, a table of search results as shown in FIG. 7 can be displayed on the display so that the operator can visually find this common item. When the number of customer data is large, it takes time and labor, and therefore it is desired to automatically search for common items.

かかる共通項目を自動探索するための手順としては、図7に示す検索結果を例に採ると、
(1)顧客コードを探索キーとして、まず、項目「性別」について、5人全ての顧客の性別が一致するか否かの判定処理を行なう。この場合、1人が女性でほか4人が男性であるから、一致せず、項目「性別」は共通項目ではないと判定する。
As a procedure for automatically searching for such common items, taking the search result shown in FIG. 7 as an example,
(1) Using the customer code as a search key, first, for the item “sex”, a determination process is performed to determine whether the sexes of all five customers are the same. In this case, since one is a woman and the other four are men, they do not match and the item “gender” is determined not to be a common item.

(2)次に、次の項目「職業」について、5人全ての顧客の性別が一致するか否かの判定処理を行なう。この場合、全ての顧客が公務員であるので、項目「公務員」は共通項目であると判定する。   (2) Next, for the next item “occupation”, a determination process is performed to determine whether or not the sexes of all five customers match. In this case, since all the customers are public servants, it is determined that the item “public servant” is a common item.

(3)以下同様にして、他の項目「趣味」,「取引動機」,「投資目的」についても、同様の判定を行ない、共通項目の探索を行なう。この場合には、いずれの項目も共通項目ではない。   (3) Similarly, for other items “hobby”, “transaction motivation”, and “investment purpose”, the same determination is performed to search for common items. In this case, none of the items is a common item.

このようにして、検索された顧客データに関し、顧客情報の項目1つ1つについて、これら全ての顧客データの属性が一致するか否かを判定する処理が行なわれるものであり、検索される顧客データ数が少ない場合や顧客データの属性の項目数が少ない場合には、特に問題とはならないが、検索される顧客データ数が何十万件といったような非常に多い場合には、共通項目の探索に時間が掛かり、迅速な探索ができないという問題があるし、また、RDBサーバから応答が返ってこない場合も、考えられる。   In this way, with respect to the searched customer data, for each item of customer information, a process for determining whether or not the attributes of all the customer data match is performed. This is not a problem when the number of data is small or the number of customer data attribute items is small. However, if the number of customer data to be searched is very large, such as hundreds of thousands, There is a problem that it takes a long time to search, and a quick search cannot be performed, and there is a case where a response is not returned from the RDB server.

さらには、探索時間が長くなることを考慮して、共通項目の探索を夜間バッチ処理などで行なうようにすることも考えられるが、上記のように、所望の検索条件でデータベースから検索された顧客データについて共通項目を探索する場合には、かかる顧客データの検索処理も同時に行なうことが必要なことから、データベースから所望の顧客データの検索処理を行なう時間も制約されることになる。   Furthermore, considering that the search time will be longer, it may be possible to search for common items by night batch processing, etc., but as described above, customers searched from the database under the desired search conditions When searching for common items for data, it is necessary to simultaneously perform such customer data search processing, and therefore, the time for performing desired customer data search processing from the database is also limited.

なお、上記の特許文献1に記載の技術では、検索された情報に共通する項目を探索するについては全く配慮されていない。   Note that the technique described in Patent Document 1 does not give any consideration to searching for items common to searched information.

本発明は、かかる点に鑑みてなされたものであって、その目的は、検索されたデータの共通項目を自動的に、かつ迅速に探索することができ、時間に制約されることなく、共通項目を確実に取得できるようにしたデータベース検索システムを提供することにある。   The present invention has been made in view of such a point, and the object of the present invention is to automatically and quickly search for common items of searched data, and without being limited by time. An object of the present invention is to provide a database search system that can reliably acquire items.

上記目的を達成するために、本発明は、複数の属性毎の項目で表わされるデータを格納したデータベースから所望とする検索条件の該データを検索するデータベース検索方法であって、項目のm(但し、mは2以上の整数)個の属性が夫々、n(但し、nは2以上の整数)桁の2進数からなる数字データで表わされており、データ夫々には、全ての項目の属性の2進数からなるm×n桁の数値データが設定されており、データベースから検索されたデータのm×n桁の数値データを各桁毎に論理積演算し、この演算結果に基づいて、検索されたデータの全てにわたって同じ属性の項目と判明した項目を、共通項目とすることを特徴とするものである。   In order to achieve the above object, the present invention provides a database search method for searching for data having a desired search condition from a database storing data represented by items for a plurality of attributes. , M is an integer of 2 or more) each attribute is represented by numeric data consisting of binary digits of n (where n is an integer of 2 or more) digits. M × n digit numerical data consisting of binary numbers is set, and m × n digit numerical data of the data retrieved from the database is ANDed for each digit, and the search is performed based on the calculation result. The items that have been found to have the same attribute over all of the recorded data are set as common items.

また、本発明は、2進数からなるm×n桁の数値データを上記の項目毎のn桁の数値データに変換するテーブルを用い、上記の演算結果得られるm×n桁の数値データを、このテーブルに従って、項目毎のn桁の数値データに区分し、区分されたn桁の数値データの各桁の値から項目が共通項目であるか否か、さらに、共通項目であるときの属性の種類を判定することを特徴とする。   Further, the present invention uses a table that converts m × n digits of numeric data consisting of binary numbers into n digits of numeric data for each item, and the m × n digits of numeric data obtained as a result of the above calculation are According to this table, it is divided into n-digit numerical data for each item, and whether or not the item is a common item from the value of each digit of the divided n-digit numerical data, and further the attribute of the common item The type is determined.

本発明によると、簡単な演算処理により、検索されたデータでの共通項目を探索できるので、共通項目の探索スピードを高めることができるし、また、探索スピートを速くすることができるので、探索スピードを抑えることにより、ハードウェア性能を低くできて、システム構築の費用を低減できて安価なシステムを構築できるし、さらに、集計スペースを作成する必要がないため、記憶エリアのスペースを有効に利用することができる。   According to the present invention, the common item in the retrieved data can be searched by simple arithmetic processing, so that the search speed of the common item can be increased and the search speed can be increased. By limiting the hardware performance, the hardware performance can be lowered, the system construction cost can be reduced, and an inexpensive system can be constructed. In addition, since there is no need to create a total space, the space in the storage area can be used effectively. be able to.

以下、本発明の実施形態を図面を用いて説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は本発明によるデータベース検索方法を用いたデータベース検索装置の一構成例を示すブロック図であって、1はCPU(中央処理装置)2はROM(リードオンリメモリ)、3はRAM(ランダムアクセスメモリ)、4は操作部、5はデータ入力手段、6は表示処理手段、7はデータベース制御手段、8は条件情報データベース、9は表示部である。   FIG. 1 is a block diagram showing an example of the configuration of a database search apparatus using a database search method according to the present invention. 1 is a CPU (Central Processing Unit), 2 is a ROM (Read Only Memory), and 3 is a RAM (Random Access). (Memory) 4 is an operation unit, 5 is a data input unit, 6 is a display processing unit, 7 is a database control unit, 8 is a condition information database, and 9 is a display unit.

同図において、このデータベース検索装置は、装置各部の動作を制御するCPU1と、CPU1が実行するプログラムや表示部9で表示される操作画面,各種の定数などの情報を格納した読み出し専用のROM2と、CPU1の処理の際のワークエリアなどとして機能するRAM3と、キーボードやマウスなどからなり、表示部9での画面操作や各種の指示を与えるための操作部4と、インターネットや他のネットワークからの証券情報を入力するためのデータ入力手段5と、操作画面や証券情報データヘース8からの証券情報などを表示部9に表示するための表示処理を行なう表示処理手段6と、証券情報データベース8での証券情報の読み書きを制御するデータベース制御手段7と、証券情報データベース8,表示部9などを備えている。   In this figure, this database retrieval apparatus includes a CPU 1 that controls the operation of each part of the apparatus, a read-only ROM 2 that stores information such as a program executed by the CPU 1, an operation screen displayed on the display unit 9, and various constants. The RAM 3 functions as a work area for the processing of the CPU 1, a keyboard, a mouse, and the like. The operation unit 4 for giving screen operations and various instructions on the display unit 9, the Internet and other networks. Data input means 5 for inputting securities information, display processing means 6 for performing display processing for displaying securities information from the operation screen or securities information data heart 8 on the display unit 9, and the securities information database 8 A database control means 7 for controlling reading and writing of securities information, a securities information database 8, a display unit 9 and the like are provided.

証券情報データベース8には、顧客情報などの各種証券情報が格納されており、表示部9に表示される、例えば、顧客情報に関する検索画面を基にオペレータが操作部4から検索条件を入力すると、CPU1がデータベース制御手段7を制御動作させることにより、この証券情報データベース8でこの入力された検索条件に基づいて顧客情報の検索が行なわれ、その検索結果(所望とする顧客の顧客情報)が、表示処理手段6の処理により、表示部9に表示される。   In the securities information database 8, various securities information such as customer information is stored and displayed on the display unit 9. For example, when an operator inputs a search condition from the operation unit 4 based on a search screen related to customer information, When the CPU 1 controls the database control means 7, customer information is searched in the securities information database 8 based on the input search conditions, and the search result (customer customer information of a desired customer) is obtained. It is displayed on the display unit 9 by the processing of the display processing means 6.

図2は証券情報データベース8に格納されている顧客情報10のテーブルの一具体例を模式的に示す図であって、11a〜11gは項目である。   FIG. 2 is a diagram schematically showing a specific example of a table of customer information 10 stored in the securities information database 8, and 11a to 11g are items.

顧客情報は、顧客の属性を分類した項目で表わされており、かかる項目で顧客情報を表わしたものが図2に示す顧客情報10のテーブルである。   The customer information is represented by items in which customer attributes are classified, and the customer information 10 shown in FIG.

図2において、顧客情報は、図示するように、各顧客毎に割り当てられたコードを表わす項目「顧客コード」11aと、顧客名を表わす項目「顧客名」11bと、顧客の性別を表わす項目「性別」11cと、顧客の職業を表わす項目「職業」11dと、顧客の趣味を表わす項目「趣味」11eと、顧客が証券取引を始めた動機を表わす項目「取引動機」11fと、投資目的を表わす項目「投資目的」11gなどからなっている。顧客の各属性は夫々、これら項目11b〜11gのうちの該当する項目に登録される。例えば、顧客「AA・AA」については、その顧客名「AA・AA」という属性が項目「顧客名」11bに登録され、性別が「男」という属性が項目「性別」11cに登録され、職業が「公務員」という属性が項目「職業」11dに登録され、趣味が「スポーツ」という属性が項目「趣味」11eに登録され、証券取引の動機が「来店・来電」という属性が項目「取引動機」11fに登録され、投資の目的が「短期的視野に立ったキャピタルゲイン重視」という属性が項目「投資目的」11gに登録される。   In FIG. 2, the customer information includes an item “customer code” 11a representing a code assigned to each customer, an item “customer name” 11b representing a customer name, and an item “customer gender” as shown in FIG. "Gender" 11c, item "Occupation" 11d representing the customer's occupation, item "Hobby" 11e representing the customer's hobby, item "Transaction motivation" 11f representing the customer's motivation for starting a securities transaction, and investment purpose The item “investment purpose” 11g is represented. Each attribute of the customer is registered in a corresponding item among these items 11b to 11g. For example, for the customer “AA / AA”, the attribute of the customer name “AA / AA” is registered in the item “customer name” 11b, and the attribute of “male” is registered in the item “sex” 11c. The attribute “public servant” is registered in the item “occupation” 11d, the attribute “hobby” is registered in the item “hobby” 11e, and the motivation for securities trading is the attribute “visitor / call”. Registered in the item “Motivation” 11 f and an attribute of “capital gain emphasis on short-term perspective” as an investment objective is registered in the item “investment objective” 11 g

以下、本発明のデータベース検索方法の一実施形態について説明するが、この実施形態では、以上のように各項目11c〜11gに分類される顧客の属性を所定桁数のビットによる数値データで表わすようにする。ここで、その桁数は、これら項目11c〜11gでの属性の種類によって決まるものとし、例えば、5種類の属性が存在する項目では、その数値データの桁数(即ち、ビット数)は5であり、その属性の種類に応じてこの数値データを異ならせる。以下では、説明を簡略化するために、これら項目11c〜11gでの属性は全て5種類であり、それらの数値データは5ビットからなるものてする。   Hereinafter, an embodiment of the database search method of the present invention will be described. In this embodiment, as described above, customer attributes classified into the items 11c to 11g are represented by numerical data by bits of a predetermined number of digits. To. Here, the number of digits is determined by the type of attribute in these items 11c to 11g. For example, in the item having five types of attributes, the number of digits (that is, the number of bits) of the numerical data is 5. Yes, this numerical data is made different depending on the type of the attribute. In the following, in order to simplify the description, the attributes in these items 11c to 11g are all five types, and the numerical data thereof is composed of 5 bits.

各項目11c〜11gでは、数値データをなす5ビットのうちの1ビットのみを“1”とし、他の4ビットを全て“0”とする。そして、“1”とするビットは属性の種類に応じて異ならせる。一例として、項目「職業」11dについて見ると、いま、顧客の属性が医師,自営業,公務員,税理士,教職員の5種類である場合(なお、ここでは、職業としては、この5種類しかないものとする)、例えば、5ビットの数値データを、これら職業に応じて、次のように設定する。

Figure 2007206954
In each item 11c to 11g, only 1 bit out of 5 bits constituting the numerical data is set to “1”, and all other 4 bits are set to “0”. The bit set to “1” is varied depending on the type of attribute. As an example, when looking at the item “Occupation” 11d, there are five types of customer attributes: doctors, self-employed, public servants, tax accountants, and faculty members. For example, 5-bit numerical data is set as follows according to these occupations.
Figure 2007206954

図3は項目11c〜11gを5桁(5ビット)の数値データで表わした顧客情報10のテーブルを示すものである。項目「職業」11dの各属性は、図2での項目「職業」11dに対し、上記数1に示す数値データで表わしたものである。その他の項目については、例えば、項目「性別」11cでは、属性「男」を数値データ「00001」、属性「女」を数値データ「00010」で夫々表わすものであり、また、例えば、項目「趣味」11eでは、属性「スポーツ」を数値データ「00001」で、属性「読書」を数値データ「00010」で、属性「音楽鑑賞」を数値データ「10000」で夫々表わすものである。他の項目についても同様であり、属性毎に異なる桁を“1”とする数値データを割り当てている。   FIG. 3 shows a table of customer information 10 in which items 11c to 11g are represented by numerical data of 5 digits (5 bits). Each attribute of the item “occupation” 11d is represented by the numerical data shown in the above equation 1 with respect to the item “occupation” 11d in FIG. Regarding the other items, for example, in the item “gender” 11c, the attribute “male” is represented by numerical data “00001” and the attribute “female” is represented by numerical data “00010”. "11e" represents the attribute "sports" by numerical data "00001", the attribute "reading" by numerical data "00010", and the attribute "music appreciation" by numerical data "10000". The same applies to the other items, and numerical data having a different digit “1” for each attribute is assigned.

なお、このように属性情報を数値データに変換するテーブルをROM2(図1)に格納されており、CPU1(図1)がこれを用いて変換処理を行なう。   A table for converting attribute information into numerical data is stored in the ROM 2 (FIG. 1) as described above, and the CPU 1 (FIG. 1) uses this to perform conversion processing.

また、図3の顧客情報10のテーブルにおいて、項目「10進数」11hの値は、項目11c〜11gの5ビットずつの数値データをその順に連ねて1つの25桁(ビット)の2進数の値(以下、これを2進数の連結属性値という)としたときの、この2進数の連結属性値に対する10進数の値(以下、これを10進数の連結属性値という)を示すものである。例えば、顧客コード「000001」の顧客「AA・AA」についてみると、このときの2進数の連結属性値は、
00001 00100 00001 00001 00001
となるが、これに対する10進数の連結属性値は、
20+217+210+25+20=1180705
となる。他の顧客の顧客データについても、同様にして、項目「10進数」11hに示す10進数の連結属性値が得られる。かかる演算処理も、CPU1(図1)で行なわれる。
Further, in the table of customer information 10 in FIG. 3, the value of the item “decimal number” 11h is a 25-digit (bit) binary value obtained by connecting the numerical data of 5 bits of items 11c to 11g in that order. This indicates a decimal value (hereinafter referred to as a decimal concatenated attribute value) for the binary concatenated attribute value when this is referred to as a binary concatenated attribute value. For example, regarding the customer “AA / AA” of the customer code “000001”, the binary linked attribute value at this time is
00001 00100 00001 00001 00001
However, the decimal concatenated attribute value for this is
2 20 +2 17 +2 10 +2 5 +2 0 = 1180705
It becomes. Similarly, for the customer data of other customers, the decimal linked attribute value shown in the item “decimal number” 11h is obtained. Such arithmetic processing is also performed by the CPU 1 (FIG. 1).

証券情報データベース8では、顧客データを、図3に示すように、各項目11a〜11gからなるRDBとして格納するが、項目11c〜11gの5ビットの属性値が順に連なる25桁(ビット)の2進数の連結属性値として格納されるが、各項目11c〜11gの属性を判定する場合には、この25桁の2進数を5ビット毎に区分し、夫々の5ビットがいずれの項目に対応するのか識別することが必要となる。このため、例えば、図4に示すような変換テーブルがROM2(図1)に設けられており、CPU1(図1)は、これに基づいて、25桁の2進数を先頭から5桁(ビット)ずつ区分して先頭から区分1,2,3,4,5とし、区分1を項目「性別」11cの属性、区分2を「職業」11dの属性、……、区分5を項目「投資目的」11gの属性として処理するようにする。   In the securities information database 8, as shown in FIG. 3, customer data is stored as an RDB including items 11 a to 11 g, but 25-digit (bit) 2 in which 5-bit attribute values of the items 11 c to 11 g are sequentially connected. Although it is stored as a concatenated attribute value of a decimal number, when determining the attribute of each item 11c to 11g, this 25-digit binary number is divided into 5 bits, and each 5 bits corresponds to any item. It is necessary to identify whether For this reason, for example, a conversion table as shown in FIG. 4 is provided in the ROM 2 (FIG. 1), and based on this, the CPU 1 (FIG. 1) converts a 25-digit binary number from the beginning to five digits (bits). Each category is divided into categories 1, 2, 3, 4 and 5 from the top, category 1 is the attribute of the item “gender” 11c, category 2 is the attribute of “occupation” 11d,..., Category 5 is the item “investment purpose” It is processed as an attribute of 11g.

また、証券情報データベース8(図1)に格納する顧客データの項目11c〜11gに対する属性の数値データの桁数を低減するために、図3に示す項目11c〜11gの代わりに、項目「10進数」11hの10進数の連結属性値を格納するようにしてもよい。但し、この場合、証券情報データベース8(図1)から顧客データの10進数の連結属性値が読み出されたときには、この10進数の連結属性値は、CPU1(図1)の処理により、25桁の2進数の連結属性値に変換された後、上記のように、図4に示す変換テーブルを用いて、各項目11c〜11g毎に区分される。   Further, in order to reduce the number of digits of the numerical data of the attribute for the customer data items 11c to 11g stored in the securities information database 8 (FIG. 1), the item “decimal number” is used instead of the items 11c to 11g shown in FIG. ”11h decimal attribute value may be stored. However, in this case, when the decimal concatenated attribute value of the customer data is read from the securities information database 8 (FIG. 1), the decimal concatenated attribute value is 25 digits by the processing of the CPU 1 (FIG. 1). After being converted to the binary connection attribute value, as described above, each item 11c to 11g is divided using the conversion table shown in FIG.

さて、図1において、以上のようにして顧客データが証券情報データベース8に蓄積されているが、表示部9で操作される検索画面で、操作部4を操作することにより、所望の検索条件(なお、上記の顧客データの各項目11a〜11hは、検索条件となるものではない)を入力して証券情報データベース8の顧客データの検索を行なったところ、図5に示す項目「顧客コード」11aの顧客コードが「000001」〜「000005」の5個の顧客データが、検索結果として、得られたものとする。なお、上記のように、項目11c〜11gの数値データによる2進数の連結属性値の代わりに、項目11hの10進数の連結属性値が証券情報データベース8に格納されているときには、図5はこれを2進数の連結属性値に変換したものを示している。   In FIG. 1, customer data is stored in the securities information database 8 as described above. By operating the operation unit 4 on the search screen operated by the display unit 9, desired search conditions ( When the customer data of the securities information database 8 is searched by inputting the items 11a to 11h of the customer data (which are not search conditions), the item “customer code” 11a shown in FIG. It is assumed that five customer data with customer codes of “000001” to “000005” are obtained as search results. As described above, when the decimal linked attribute value of the item 11h is stored in the securities information database 8 instead of the binary linked attribute value by the numerical data of the items 11c to 11g, FIG. Is converted into a binary concatenated attribute value.

この実施形態は、かかる検索結果から、簡単な演算処理により、検索された全ての顧客データの属性が一致する項目、即ち、共通項目を取得することができるようにするものである。   In this embodiment, an item having the same attribute of all searched customer data, that is, a common item can be acquired from the search result by a simple arithmetic process.

この共通項目の取得方法としては、検索された上記顧客データ毎に、その項目11c〜11gの属性の数値データから上記の25桁の2進数の連結属性値を作成し、各顧客データの2進数の連結属性値の同じ桁同士で論理積(AND)の演算処理を行ない、その演算結果で“1”のビットを含む項目を共通項目とするものである。   As a method for acquiring the common item, for each of the searched customer data, the 25-digit binary concatenated attribute value is created from the numerical data of the attributes of the items 11c to 11g, and the binary number of each customer data is created. The logical product (AND) calculation processing is performed between the same digits of the concatenated attribute values of the two, and the item including the bit “1” in the calculation result is used as a common item.

図6は図5に示す検索結果に対する共通項目の探索処理を示す図である。   FIG. 6 is a diagram showing a common item search process for the search result shown in FIG.

同図において、図5に示す顧客データの2進数の連結属性値の夫々の桁のビットに対し、夫々の顧客データの同じ桁のビット同士を論理積演算をすると、その論理積の結果は、図示するように、
0000000100000000000000000
となる。この結果によると、最も左側の桁(ビット)を先頭の桁として、先頭から8桁目が“1”のビットとなっており、これ以外の桁では、全て“0”のビットである。そして、この“1”のビットを含む項目を共通項目とするものであるが、この論理積の結果も、図4に示す変換テーブルを適用して5桁ずつ区分することにより、項目「職業」11dの数値データの論理積結果が「00100」となっており、この項目「職業」11dが共通項目とするものである。
In the figure, when the same digit bit of each customer data is subjected to the logical product operation with respect to each digit bit of the binary concatenated attribute value of the customer data shown in FIG. As shown,
0000000100000000000000000000
It becomes. According to this result, the leftmost digit (bit) is the first digit, the eighth digit from the top is a “1” bit, and the other digits are all “0” bits. The item including the bit “1” is used as a common item. The result of the logical product is also divided into five digits by applying the conversion table shown in FIG. The logical product result of the numerical data of 11d is “00100”, and this item “occupation” 11d is a common item.

また、この項目「職業」11dの数値データの論理積結果「00100」により、上記表1から、属性「公務員」が図5に示す検索された顧客データでの顧客が、職業「公務員」であることで、共通することがわかる。   Further, according to the logical product result “00100” of the numerical data of this item “occupation” 11d, the customer in the retrieved customer data having the attribute “public employee” shown in FIG. This shows that they are common.

かかる論理積で全ての桁が“0”のビットであるときには、検索された顧客データについて、属性が全て同じとなる共通項目はない、ということになる。   When all the digits are “0” bits in the logical product, it means that there is no common item having the same attribute for the retrieved customer data.

CPU1(図1)は、検索された顧客データについて、その共通項目を探索する場合には、例えば、検索された顧客データの項目「顧客コード」11aに登録されている顧客コードを基に、データベース制御手段7(図1)を介して、証券情報データベース8に格納されている顧客データのうち、この顧客コードの顧客データでの項目11c〜11gの数字データを読み取り、これを25桁の2進数の連結属性値としてRAM3に記憶する。このようにして、検索された顧客データ毎にかかる25桁の2進数の連結属性値を証券情報データベース8から順次読み取り、これを読み取る毎に前に読み取った他の顧客データの25桁の2進数の連結属性値と各桁毎に論理積演算する。   When the CPU 1 (FIG. 1) searches for the common items of the searched customer data, for example, based on the customer code registered in the item “customer code” 11a of the searched customer data, Of the customer data stored in the securities information database 8 via the control means 7 (FIG. 1), the numeric data of the items 11c to 11g in the customer data of this customer code is read and this is converted into a 25-digit binary number. Is stored in the RAM 3 as a connection attribute value of In this way, the 25-digit binary concatenated attribute value for each retrieved customer data is sequentially read from the securities information database 8 and every time this is read, the 25-digit binary number of other customer data read before is read. AND operation is performed on each concatenated attribute value and each digit.

即ち、例えば、まず、顧客コード「000001」の顧客データの25桁の2進数の連結属性値が証券情報データベース8から読み取られると、この25桁の2進数の連結属性値はRAM3に記憶され、次に、顧客コード「000002」の顧客データの25桁の2進数の連結属性値が証券情報データベース8から読み取られると、これがRAM3に記憶されるとともに、CPU1は、これら顧客コード「000001」,「000002」の25桁の2進数の連結属性値を桁毎に論理積演算し、その演算結果をRAM3に記憶する。そして、CPU1により、次の顧客コード「000003」の顧客データの25桁の2進数の連結属性値が証券情報データベース8から読み取られ、これがRAM3に記憶されるとともに、CPU1は、顧客コード「000001」,「000002」の顧客データの25桁の2進数の連結属性値の論理積の演算結果とこの顧客コード「000003」の顧客データの25桁の2進数の連結属性値との論理積演算を行ない、その演算結果をRAM3に記憶する。そして、さらに次の顧客コード「000004」の顧客データの25桁の2進数の連結属性値が証券情報データベース8から読み取られるが、このようにして、新たに顧客データの2進数の連結属性値が証券情報データベース8から読み出されると、これと既に得られている演算結果との桁後との論理積演算が行なわれ、検索された最後の25桁の2進数の連結属性値について同様の演算処理が行なわれると、検索された顧客データ全てについての演算処理が終了し、演算結果での“1”のビットから上記の共通項目の決定処理に移る。   That is, for example, when the 25-digit binary concatenated attribute value of the customer data of the customer code “000001” is read from the securities information database 8, the 25-digit binary concatenated attribute value is stored in the RAM 3. Next, when the 25-digit binary concatenated attribute value of the customer data of the customer code “000002” is read from the securities information database 8, it is stored in the RAM 3, and the CPU 1 also stores these customer codes “000001”, “ The 25-digit binary concatenated attribute value “000002” is logically calculated for each digit, and the calculation result is stored in the RAM 3. The CPU 1 reads the 25-digit binary concatenated attribute value of the customer data of the next customer code “000003” from the securities information database 8 and stores it in the RAM 3. The CPU 1 also reads the customer code “000001”. , AND operation of 25-digit binary concatenated attribute value of customer data “000002” and 25-digit binary concatenated attribute value of customer data “000003” is performed. The calculation result is stored in the RAM 3. Then, the 25-digit binary concatenated attribute value of the customer data of the next customer code “000004” is read from the securities information database 8. In this way, the binary concatenated attribute value of the customer data is newly obtained. When read out from the securities information database 8, a logical product operation of this and the already obtained operation result is performed and the same operation processing is performed on the last 25-digit binary concatenated attribute value retrieved. Is completed, the calculation process for all the searched customer data ends, and the process proceeds to the above-mentioned common item determination process from the bit “1” in the calculation result.

このようにして、探索された共通項目は、検索結果の顧客情報とともに、表示部9に表示されるが、一例として、図5に示すように、この場合項目「職業」11dである共通項目全体を枠12で囲むことにより、共通項目が、認識できるように、明確に表示されるようにする。勿論、項目名の表示エリアだけをかかる枠12で囲むようにしてもよい。   Thus, the searched common item is displayed on the display unit 9 together with the customer information of the search result. As an example, as shown in FIG. 5, in this case, the entire common item which is the item “occupation” 11d. Is surrounded by a frame 12 so that common items are clearly displayed so that they can be recognized. Of course, only the display area of the item name may be surrounded by the frame 12.

以上のように、この実施形態によると、簡単な演算処理により、検索されたデータでの共通項目を探索できるので、共通項目の探索スピードを高めることができるし、また、探索スピートを速くすることができるので、探索スピードを抑えることにより、ハードウェア性能を低くできて、システム構築の費用を低減できて安価なシステムを構築できるし、さらに、集計スペースを作成する必要がないため、記憶エリアのスペースを有効に利用することができる。   As described above, according to this embodiment, common items in searched data can be searched by simple arithmetic processing, so that the search speed of common items can be increased and the search speed can be increased. Therefore, by reducing the search speed, hardware performance can be reduced, the cost of system construction can be reduced, and an inexpensive system can be constructed. Space can be used effectively.

なお、上記実施形態は、証券情報の顧客情報を例に説明したものであるが、本発明は、これに限らず、複数の属性を有し、その属性に応じて区分される複数の項目からなる任意のデータに適用可能であることはいうまでもない。   The above embodiment has been described by taking customer information of securities information as an example. However, the present invention is not limited to this, and has a plurality of attributes, and a plurality of items classified according to the attributes. Needless to say, the present invention can be applied to arbitrary data.

一般に、かかる任意のデータに対しては、検索対象のデータがm(但し、mは2以上の整数)個の属性からなり、かかる属性を項目(フィールド)で区分したとき、これら項目によって該当する属性の種類の数はまちまちであるが、1項目に該当する属性の種類の最大数をn糊塗すると、かかる属性をn(但し、nは2以上の整数)桁の2進数からなる数字データで表わされており、これらデータ夫々には、かかる項目の属性の2進数を統合(連結)したm×n桁の数値データ(あるいは、その10進数の数字データ)が設定されてデータベースに蓄積されており、このデータベースから検索されたデータのm×n桁の数値データを各桁毎に論理積演算し、該演算結果に基づいて、検索された該データの全てにわたって同じ属性の項目と判明した項目(上記の例では、“1”のビットを含む数値データの項目)を、共通項目とするものである。   In general, for such arbitrary data, the search target data consists of m attributes (where m is an integer equal to or greater than 2), and when such attributes are divided into items (fields), they correspond to these items. The number of attribute types varies, but when the maximum number of attribute types corresponding to one item is glued, the attribute is represented by numeric data consisting of binary digits of n (where n is an integer of 2 or more) digits. For each of these data, m × n-digit numerical data (or its decimal numerical data) obtained by integrating (concatenating) the binary numbers of the attributes of such items is set and stored in the database. The data obtained from this database is subjected to a logical AND operation for each digit of the m × n digit numerical data, and based on the result of the operation, all of the retrieved data are found to have the same attribute item. The item (in the above example, the item of numerical data including the bit “1”) is the common item.

図1は本発明によるデータベース検索方法を用いたデータベース検索装置の一構成例を示すブロック図である。FIG. 1 is a block diagram showing a configuration example of a database search apparatus using a database search method according to the present invention. 図1における証券情報データベース8に格納されている顧客情報10の一具体例のテーブルを模式的に示す図である。It is a figure which shows typically the table of the example of the customer information 10 stored in the securities information database 8 in FIG. 図2に示す顧客情報の属性を数値データで表わしたときの顧客情報の一具体例のテーブルを示す図である。It is a figure which shows the table of a specific example of customer information when the attribute of customer information shown in FIG. 2 is represented by numerical data. 2進数の連結属性値を図3に示す各項目の数値データに区分するための変換テーブルの一具体例を示す図である。It is a figure which shows one specific example of the conversion table for classifying the connection attribute value of a binary number into the numerical data of each item shown in FIG. 図1における証券情報データベースでの顧客データの検索結果の一具体例を示す図である。It is a figure which shows one specific example of the search result of the customer data in the securities information database in FIG. 図5に示す検索結果に対する共通項目の探索処理を示す図である。It is a figure which shows the search process of the common item with respect to the search result shown in FIG. 証券情報での顧客データの一従来例を示す図である。It is a figure which shows one example of conventional customer data in securities information.

符号の説明Explanation of symbols

1 CPU
2 ROM
3 RAM
4 操作部
5 データ入力手段
6 表示処理手段
7 データベース制御手段
8 条件情報データベース
9 表示部
10 顧客情報テーブル
11a〜11h 項目
12 枠
1 CPU
2 ROM
3 RAM
4 Operation section 5 Data input means 6 Display processing means 7 Database control means 8 Condition information database 9 Display section 10 Customer information tables 11a to 11h Item 12 Frame

Claims (2)

複数の属性毎の項目で表わされるデータを格納したデータベースから所望とする検索条件の該データを検索するデータベース検索方法であって、
該項目のm(但し、mは2以上の整数)個の属性が夫々、n(但し、nは2以上の整数)桁の2進数からなる数字データで表わされており、
該データ夫々には、全ての項目の属性の2進数からなるm×n桁の数値データが設定されており、
該データベースから検索された該データの該m×n桁の数値データを各桁毎に論理積演算し、該演算結果に基づいて、検索された該データの全てにわたって同じ属性の該項目と判明した項目を、共通項目とすることを特徴とするデータベース検索方法。
A database search method for searching the data of a desired search condition from a database storing data represented by items for a plurality of attributes,
M (where m is an integer greater than or equal to 2) attributes of the item are represented by numerical data consisting of binary digits of n (where n is an integer greater than or equal to 2) digits,
In each of these data, numerical data of m × n digits consisting of binary numbers of attributes of all items is set.
The numeric data of the m × n digits of the data retrieved from the database is subjected to a logical AND operation for each digit, and based on the operation result, the items having the same attribute are found throughout the retrieved data. A database search method characterized in that items are common items.
請求項1において、
前記2進数からなるm×n桁の数値データを前記項目毎のn桁の数値データに変換するテーブルを用い、
前記演算結果得られるm×n桁の数値データを、該テーブルに従って、前記項目毎のn桁の数値データに区分し、該区分された該n桁の数値データの各桁の値から前記項目が共通項目であるか否か、さらに、共通項目であるときの属性の種類を判定することを特徴とするデータベース検索方法。
In claim 1,
Using a table for converting m × n digit numerical data consisting of binary numbers into n digit numerical data for each item,
The m × n-digit numerical data obtained as a result of the calculation is divided into n-digit numerical data for each item according to the table, and the item is determined from the value of each digit of the divided n-digit numerical data. A database search method characterized by determining whether or not a common item is present and, further, a type of attribute when the item is a common item.
JP2006024633A 2006-02-01 2006-02-01 Database search method Pending JP2007206954A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006024633A JP2007206954A (en) 2006-02-01 2006-02-01 Database search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006024633A JP2007206954A (en) 2006-02-01 2006-02-01 Database search method

Publications (1)

Publication Number Publication Date
JP2007206954A true JP2007206954A (en) 2007-08-16

Family

ID=38486374

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006024633A Pending JP2007206954A (en) 2006-02-01 2006-02-01 Database search method

Country Status (1)

Country Link
JP (1) JP2007206954A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017041247A (en) * 2015-08-18 2017-02-23 Line株式会社 System and method for retrieving document according to authority and type of access to document utilizing bit

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017041247A (en) * 2015-08-18 2017-02-23 Line株式会社 System and method for retrieving document according to authority and type of access to document utilizing bit

Similar Documents

Publication Publication Date Title
US8370328B2 (en) System and method for creating and maintaining a database of disambiguated entity mentions and relations from a corpus of electronic documents
US7698283B2 (en) System and method for organizing data
CN111414375A (en) Input recommendation method based on database query, electronic device and storage medium
US7373021B2 (en) Image search program, information storage medium, image search apparatus and image search method
JP4687089B2 (en) Duplicate record detection system and duplicate record detection program
CN112231452A (en) Question-answering method, device, equipment and storage medium based on natural language processing
WO2017065891A1 (en) Automated join detection
JP2005149414A (en) Retrieval method for project risk, evaluation system and common database utilization method
CN116992011B (en) Method, system and device for service data matching query
JP2023139067A (en) Document processing program and information processing apparatus
JP2007206954A (en) Database search method
JPH1153381A (en) Device and method for retrieving similar document
US8200523B2 (en) Procedure generation apparatus and method
JPH09259141A (en) Map data linkage system
KR20220034907A (en) information retrieval system
JP2009271772A (en) Text mining method, text mining apparatus and text mining program
JP2008287397A (en) Personnel information processor, personnel information processing method and personnel information processing program
JP2020181332A (en) High-precision similar image search method, program and high-precision similar image search device
KR102708772B1 (en) Method for extracting patient cohort, apparatus and program implementing the method
WO2018016001A1 (en) Data modeling system and data modeling method
US20060074982A1 (en) Method for comparing tabular data
JPH03116318A (en) Slip input device
JP3972309B2 (en) Information conversion apparatus and program
JP2003030385A (en) Personnel information management system and program
JP5324018B1 (en) Corpus generation device, corpus generation method, and corpus generation program