JPS62154139A - Data selecting device - Google Patents

Data selecting device

Info

Publication number
JPS62154139A
JPS62154139A JP60294874A JP29487485A JPS62154139A JP S62154139 A JPS62154139 A JP S62154139A JP 60294874 A JP60294874 A JP 60294874A JP 29487485 A JP29487485 A JP 29487485A JP S62154139 A JPS62154139 A JP S62154139A
Authority
JP
Japan
Prior art keywords
data
key
hashing
length
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60294874A
Other languages
Japanese (ja)
Other versions
JPH0731686B2 (en
Inventor
Toshio Nakamura
敏夫 中村
Tadashi Kitamura
正 北村
Hideaki Takeda
武田 英昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP60294874A priority Critical patent/JPH0731686B2/en
Publication of JPS62154139A publication Critical patent/JPS62154139A/en
Publication of JPH0731686B2 publication Critical patent/JPH0731686B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE:To shorten the data selecting time by selecting two data that have possibility for coincidence between the attribute contents designated as keys in terms for two data groups having the variable length data consisting of variable length attributes. CONSTITUTION:One of independent buffers 11-14 of a fixed capacity stores the length (l) of one or plural attributes designated as keys in a single tuple, a pair of values (v) and the address of the corresponding tuple. A key extracting device 17 extracts the contents of the attribute of the variable length designated as a key out of the tuple of the variable length. The variable length tuple is given from a data input terminal. A hashing device 18 contains a pair of a bit array 7 and a hashing circuit 5 which has a hashing action with an appropriate hash function. A key transmitting device 19 outputs the keys to a data output terminal 25 after selection.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はデータ選別装置に係り、詳しくは、2つの可変
長データ群相互にキーとして指定された可変長のアトリ
ビュート(属性)内容の一致している可能性のあるデー
タを選別するデータ選別装置に関する。
[Detailed Description of the Invention] [Industrial Field of Application] The present invention relates to a data sorting device, and more specifically, the present invention relates to a data sorting device, and more specifically, the present invention relates to a data sorting device, and more specifically, the present invention relates to a data sorting device that matches two variable-length data groups in the content of a variable-length attribute designated as a key. The present invention relates to a data sorting device that sorts out data that may be corrupted.

〔従来の技術〕[Conventional technology]

情報処理システムによるデータ管理の分野において、2
つのデータ群(データは可変長)の中から相互にキーと
して指定されたアトリビュート内容の一致するデータを
取り出して結合する場合、結合処理に要する処理時間が
太きいため、あらかじめ各々のデータ群から結合可能性
の無いデータを除去し、結合処理時間を短縮させるデー
タ選別操作がしばしば行われる。この種のデータ選別装
置には、ハツシング回路とピントアレイの組を使用する
のが一般的である。なお、従来のこの種の装置は、例え
ばLEBCH(D、R,McGregor。
In the field of data management using information processing systems, 2
When extracting and combining data with matching attribute contents specified as keys from two data groups (the data is variable length), the processing time required for the combination process is long, so it is necessary to combine each data group in advance. Data screening operations are often performed to remove irrelevant data and reduce join processing time. This type of data sorting device generally uses a combination of a hashing circuit and a focusing array. Note that a conventional device of this type is, for example, LEBCH (D, R, McGregor.

R,H,Thomson、 W、N、 Dawson:
 High Per−formance Hardwa
re for Database Systems。
R, H, Thomson, W, N, Dawson:
High Performance Hardware
re for Database Systems.

in Systemz for Large Data
 Ba5es、 pp、 103−116 、 Nor
th−Holland、 1976)などのシステムで
用いられている。
in Systems for Large Data
Ba5es, pp, 103-116, Nor
th-Holland, 1976).

こ\で、第2図により、従来のハツシング回路とビット
アレイの組を使用したデータ選別装置の基本的な操;Y
手順を説明する。第2図中、1,2はデータ群、5は適
切に定められたハツシュ関数をもつハツシング回路、7
はビットアレイ、10は選別されたデータ群、301は
データ群1のキー内容をハツシング回路5に入力してハ
ツシングを行い、ビットアレイ7のハツシング値を番地
とするビット位置を′1″にする操作(セット処理を呼
ぶことにする)、302はデータ群2のキー内容をハツ
シング回路5に入力してハツシングを行い、ビットアレ
イ7のハツシング値を番地とするビット位置がII I
 IIである(これをHITとしたと表現する)データ
のみを選別する操作(リファ処理と呼ぶことにする)を
示す。
Now, according to Figure 2, the basic operation of a data sorting device using a conventional hashing circuit and bit array combination;
Explain the steps. In Figure 2, 1 and 2 are data groups, 5 is a hashing circuit with an appropriately defined hash function, and 7
is a bit array, 10 is a selected data group, and 301 is a key content of data group 1 which is input to the hashing circuit 5 to perform hashing, and the bit position whose address is the hashing value of bit array 7 is set to '1'. In the operation (which will be called set processing), 302 inputs the key contents of data group 2 to the hashing circuit 5 and performs hashing, and the bit position corresponding to the hashing value of the bit array 7 is set to II I.
This shows an operation (referred to as refer processing) of selecting only data that is II (this is expressed as HIT).

まず、ピントアレイ7の全てのビットを“OIIに初期
設定する。次に、例えばデータ群2を選別する場合、操
作301によりビットアレイ7に“1″を設定して後に
、操作302によりデータ群2のキー内容をハツシング
して、ビットアレイ7のハツシング値を番地とするビッ
ト位置が1101+であるデータについては不必要なデ
ータとして除去し、“1″であるデータは必要なデータ
として選び出す(これを選別処理と称する)。
First, all bits of the focus array 7 are initialized to "OII".Next, when selecting data group 2, for example, the bit array 7 is set to "1" in operation 301, and then the data group is set in operation 302. By hashing the key contents of 2, the data whose bit position is 1101+ whose address is the hashing value of bit array 7 is removed as unnecessary data, and the data whose address is "1" is selected as necessary data (this (referred to as sorting process).

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

第2図に示すような従来のデータ選別装置においては、
固定長のアトリビュートを扱っており。
In the conventional data sorting device as shown in Fig. 2,
We are dealing with fixed length attributes.

可変長のアトリビュートを扱うものはなかった。There was nothing that handled variable length attributes.

このため、ソフトウェアにより、可変長データからキー
として指定された可変長のアトリビュートをデータ中か
ら抽出して固定長化する処理、即ち、キー抽出処理を行
う必要があった。このため、キー抽出処理時間が大きく
、全体としてデータ選別処理時間が大きくなるという問
題があった。
Therefore, it was necessary to use software to extract a variable-length attribute designated as a key from the variable-length data and convert it to a fixed length, that is, a key extraction process. Therefore, there is a problem that the key extraction processing time is long and the data sorting processing time is long as a whole.

本発明の目的は、従来機われていなかった可変長のアト
リビュートから構成される可変長データをもつ2つの;
−夕群について、キーとして指定されたアトリビュート
内容が相互に一致する可能性があるデータを選別できる
ようにして1選別処理時間を短縮することにある。
The purpose of the present invention is to create two sets of variable-length data consisting of variable-length attributes, which have not been achieved in the past;
- To shorten the processing time for one sorting process by making it possible to sort out data whose attribute contents designated as keys are likely to match each other for evening groups.

〔問題点を解決するための手段及び作用〕本発明は、各
々独立した一定容量のバッファ4面と、可変長データか
らキーとして指定された可変長アトリビュートの内容を
抽出するキー抽出装置、アトリビュート内容を適当なハ
ツシュ関数によりハツシングするハツシング回路とビッ
トアレイとの組からなるハツシング装置、選別後のアト
リビュート内容を出力するキー送出装置、バッファの1
01″クリア処理を行うバッファクリア装置、及び制御
装置?備え、制御装置の指示により、キー抽出、ハツシ
ング、キー送出、バッファクリアの4つの処理を順次パ
イプライン的に動作させながら、可変長アトリビュート
から構成される可変長データをもつ2つのデータ群相互
に、キーとして指定された可変長のアトリビュート内容
が一致する可能性のあるデータを選別するものである。
[Means and effects for solving the problem] The present invention provides four independent buffers each having a constant capacity, a key extraction device for extracting the contents of a variable length attribute designated as a key from variable length data, and attribute contents. a hashing device consisting of a set of a hashing circuit and a bit array for hashing by an appropriate hash function, a key sending device for outputting the attribute contents after selection, and a buffer.
Equipped with a buffer clear device and a control device that perform 01'' clear processing, and according to the instructions of the control device, the four processes of key extraction, hashing, key sending, and buffer clear are performed sequentially in a pipeline manner. This method selects data that may have the same variable-length attribute content designated as a key between two data groups having variable-length data.

〔実施例〕〔Example〕

第1図に本発明によるデータ選別装置の一実施例を示す
。第3図は本実施例で用いる入力データ(以下、このデ
ータのことをタプルと呼ぶ)の形式で、可変長型式をサ
ポートするため、タプルのレングス(QQ)、タプルI
D(TID)、アトリビュートlのレングス(Q、)と
バリュー(■1)のペア(Qvペアと呼ぶ)、アトリビ
ュート1のタプル内相対アドレス(oI:オフセット)
の構成をとる。
FIG. 1 shows an embodiment of a data sorting device according to the present invention. Figure 3 shows the format of the input data (hereinafter referred to as a tuple) used in this embodiment.
D (TID), a pair of length (Q, ) and value (■1) of attribute l (referred to as Qv pair), relative address in the tuple of attribute 1 (oI: offset)
The configuration is as follows.

第1図の構成は以下の通りである。11,12゜13.
14は各々独立した一定容量(例えば、128バイト程
度)のバッファである。1バツフアには1タプル中のキ
ーとして指定された1つあるいは複数の71−リビュー
トのレングス(Q)およびバリュー(V)のペア(Qv
ペア)および該タプルのアドレス(TAD:データ入力
端子の先に接続されているのがメモリとすれば、メモリ
内の格納アドレス)を格納する。17は可変長タプルか
らキーとして指定された可変長のアトリビュートの内容
を抽出するキー抽出装置であり、可変長タプルはデータ
入力端子から与えられる。18はビットアレイ7と適当
なハツシュ関数によりハツシングするハツシング回路5
の組からなるハツシング装置である。19は選別後のキ
ーのデータ出力端子25に出力するキー送出装置である
。20はバッファクリア装置で、電源投入時にはバッフ
ァ11,12,13.14の全てを初期11011クリ
アするが、通常は接続されているバッファ1面の全ての
バイトを゛′0′″クリアする。バッファ11.12,
13.14とキー抽出装置17、ハツシング装[118
、キー送出装置19、バッフアク;jア装[20との1
mの接続は、接続切替回路15により相互に切替えられ
る。
The configuration of FIG. 1 is as follows. 11,12゜13.
14 are independent buffers each having a constant capacity (for example, about 128 bytes). One buffer contains one or more 71-rebut length (Q) and value (V) pairs (Qv) specified as keys in one tuple.
pair) and the address of the tuple (TAD: if the memory is connected to the end of the data input terminal, the storage address in the memory) is stored. Reference numeral 17 denotes a key extraction device that extracts the contents of a variable-length attribute designated as a key from a variable-length tuple, and the variable-length tuple is supplied from a data input terminal. 18 is a hashing circuit 5 that performs hashing with the bit array 7 using an appropriate hash function.
This is a hashing device consisting of a set of 19 is a key sending device that outputs data to the data output terminal 25 of the selected key. 20 is a buffer clearing device, which initially clears all buffers 11, 12, 13, and 14 to 11011 when the power is turned on, but normally it clears all bytes in the first side of the connected buffer ``0''.Buffer 11.12,
13.14 and key extraction device 17, hashing device [118
, key sending device 19, buffer access [1 with 20]
The connections of m are mutually switched by a connection switching circuit 15.

21は装置全体を制御する制御装置である。キー抽出装
置17、ハツシング装置18、キー送出装置19にはそ
れぞれセット処理あるいはクリア処理を行うための制御
レジスタ22,23.24があり、セット処理あるいは
クリア処理に先立ち制御装置21により値が設定される
21 is a control device that controls the entire device. The key extraction device 17, hashing device 18, and key sending device 19 each have control registers 22, 23, and 24 for performing set processing or clear processing, and values are set by the control device 21 prior to the set processing or clear processing. Ru.

制御装置21とキー抽出装置17の間の接続線は制御信
号線101、アドレスバス線102.データバス線10
3、リード/ライト制御線104からなる。制御信号線
101には1タプル分の処理開始信号(START)1
01−01、lタプル分の処理正常終了信号(END)
101−02゜データ群の全タプル終了信号(ENPT
Y)101−03等がある。アドレスバス線102は制
御レジスタ等を指示するために十分なアドレスビット幅
を有する。データバス線103は制御レジスタ等を指示
するために十分なデータビット幅を有する。リード/ラ
イト制御、1104は制御レジスタ等へのデータのリー
ド/ライトを行うために必要である。なお、5TART
信号とEND信号のような対になっている信号はハンド
シェイクで行う。
Connection lines between the control device 21 and the key extraction device 17 include a control signal line 101, an address bus line 102. data bus line 10
3. It consists of a read/write control line 104. The control signal line 101 has a processing start signal (START) 1 for 1 tuple.
01-01, normal processing completion signal for l tuples (END)
101-02゜ Data group all tuple end signal (ENPT
Y) 101-03 etc. Address bus line 102 has a sufficient address bit width to indicate control registers and the like. Data bus line 103 has a data bit width sufficient to indicate control registers and the like. Read/write control 1104 is necessary to read/write data to a control register or the like. In addition, 5TART
Paired signals such as the signal and the END signal are handled by handshaking.

制御装置21とハツシング装置118の間の接続線は制
御信号線111、アドレスバス線112、データバス線
113、す、−ド/ライト制御線114よりなる。制御
信号線111−12には、5TART信号111−o1
: END信号111−02、及びハツシングを行い、
ビットアレイ7のハツシング値を番地とするビット位置
が′1″であることを示すHIT信号111−03等が
ある。
Connection lines between the control device 21 and the hashing device 118 include a control signal line 111, an address bus line 112, a data bus line 113, and a read/write control line 114. The control signal line 111-12 has a 5TART signal 111-o1.
: Performs END signal 111-02 and hashing,
There is a HIT signal 111-03 indicating that the bit position corresponding to the hashing value of the bit array 7 is '1'.

制御装置21とキー送出装置19との間の接続線は制御
信号線121、アドレスバス線122、データバス線1
23、リード/ライト制御線124からなる。制御信号
線121には5TART信号121−01とEND信号
121−02がある。
Connection lines between the control device 21 and the key sending device 19 include a control signal line 121, an address bus line 122, and a data bus line 1.
23 and a read/write control line 124. The control signal line 121 has a 5TART signal 121-01 and an END signal 121-02.

制御装置21とバッファクリア装置20との間の接続線
131は5TART信号とEND信号であり、制御装置
1i21と接続切替回路15との間の接続線135はバ
ッファの接続関係を1シフトするための指示信号である
The connection line 131 between the control device 21 and the buffer clearing device 20 is for the 5TART signal and the END signal, and the connection line 135 between the control device 1i21 and the connection switching circuit 15 is for shifting the connection relationship of the buffer by one. It is an instruction signal.

キー抽出装置17、ハツシング装置18、キー送出装置
19、バッファクリア装W20と接続切替装置17との
間の接続線は、アドレスバス線142.152,162
,172、データバス線143.153,163,17
3. リード/ライト制御線144,154..164
.174等である。
Connection lines between the key extraction device 17, hashing device 18, key sending device 19, buffer clearing device W20 and connection switching device 17 are address bus lines 142, 152, 162.
, 172, data bus lines 143.153, 163, 17
3. Read/write control lines 144, 154. .. 164
.. 174 mag.

接続切替線17と各バッファ11,12,13゜14と
の間の接続線も同じであり、アドレスバス8182.1
92,202,212.データバス41183.193
,203,213、リード/ライト制御線184,19
4,204,214等である。
The connection lines between the connection switching line 17 and each buffer 11, 12, 13°14 are also the same, and the address bus 8182.1
92,202,212. Data bus 41183.193
, 203, 213, read/write control lines 184, 19
4,204,214, etc.

まず、全体の制御手順についてデータ群2の選別の場合
で説明する。装置全体を制御する制御装置21により1
次の手順を行う。
First, the overall control procedure will be explained using the case of sorting data group 2. 1 by a control device 21 that controls the entire device.
Perform the following steps.

(1)ビットアレイ7およびバッファ11,12゜13
.14の初期設定 (2)データ群1のセット処理のための制御レジスタの
設定 (3)セット処理 (4)データ群2のリファ処理のための制御レジスタの
設定 (5)リファ処理 次に順を追って、これらの処理について詳細に説明する
(1) Bit array 7 and buffers 11, 12゜13
.. 14 initial settings (2) Setting of control registers for set processing of data group 1 (3) Setting of control registers for set processing of data group 2 (4) Setting of control registers for refer processing of data group 2 (5) Refer processing These processes will be explained in detail later.

(1)ビットプレイおよびバッファのクリア制御装置2
1の指示により、ハツシング装置18にあるピッ゛アレ
イ7およびバッファ11,12.13.14を1101
1クリアする。
(1) Bit play and buffer clear control device 2
1, the pitch array 7 and buffers 11, 12, 13, and 14 in the hashing device 18 are transferred to 1101.
Clear 1.

(2)セット処理のための制御レジスタの設定データ群
1の情報として、 ■ データ群1の先頭アドレス(MEMADR)■ デ
ータ群1の有効データ長(MEMLNG)■ キーとし
て指定されたアトリビュート数(ATTNO)■ オフ
セットトータル長(OFSTOTAL)■ キーに対す
るオフセット列先頭からのオフセット値(OFSLOC
i) (Cハツシングのために必要となるキーについてキャラ
クタ/バイナリ等の属性 ■ TAD (ArTSPECi)(7)ライト・アド
レス、ライトレングス(TADWADR,TADWLN
G)等を制御装置21の指示により各制御レジスタ22
.23.24に設定する。設定の方法は、一般的なメモ
リ・アクセスの方法と同じで、アドレスバス線102,
112,122、データバス線103.113,123
、リード/ライト制御線104.114,124を用い
て制御レジスタ22゜23.24にライトすればよい。
(2) Control register settings for set processing Information on data group 1 includes: ■ Start address of data group 1 (MEMADR) ■ Effective data length of data group 1 (MEMLNG) ■ Number of attributes specified as keys (ATTNO ) ■ Offset total length (OFSTOTAL) ■ Offset value from the beginning of the offset column for the key (OFSLOC
i) (Attributes such as character/binary for keys required for C-hashing ■ TAD (ArTSPECi) (7) Write address, write length (TADWADR, TADWLN)
G) etc. in each control register 22 according to instructions from the control device 21.
.. Set to 23.24. The setting method is the same as the general memory access method, and the address bus line 102,
112, 122, data bus line 103.113, 123
, the read/write control lines 104, 114, and 124 may be used to write to the control registers 22, 23, and 24.

なお、セット処理ではキー送出装置19を起動しないの
で、制御レジスタ24には設定しなくてもよい。
Note that since the key sending device 19 is not activated in the setting process, it is not necessary to set it in the control register 24.

(3)セット処理 第4図にセット処理におけるタイムチャートの例を示す
。toの時刻では、最初に入力するデータ群1の最初の
タプル(タプル1)に対し、キー抽出袋!i!17のみ
を起動する(START信号10f−01をアサートす
る)0次に、キー抽出装置117の処理が終了すれば(
END信号101−02をアサートする)、接続切替回
路15を起動しく5HIFT信号135をアサートする
)、接続切替を行う。
(3) Set processing FIG. 4 shows an example of a time chart in the set process. At time to, for the first tuple (tuple 1) of data group 1 to be input first, key extraction bag! i! 17 (assert START signal 10f-01). Next, when the processing of the key extraction device 117 is completed (
END signal 101-02 is asserted), connection switching circuit 15 is activated and 5HIFT signal 135 is asserted), and connection switching is performed.

tlの時刻では、タプル1に対してはハツシング装置1
8を、次のタプル(タプル2)に対してはキー抽出装置
17を起動する(START信号101−01および1
11−01をアサートする)。
At time tl, hashing device 1 is used for tuple 1.
8, and starts the key extraction device 17 for the next tuple (tuple 2) (START signals 101-01 and 1
11-01).

次に、キー抽出装置i17およびハツシング装置18の
処理が終了すれば(END信号101−02および11
1−02をアサートする)、接続切替回路15を起動し
く5HIFT信号135をアサートする)、接続切替を
行う。
Next, when the processing of the key extraction device i17 and the hashing device 18 is completed (END signals 101-02 and 11
1-02), activates the connection switching circuit 15 and asserts the 5HIFT signal 135), and switches the connection.

L2の時p1では、タプル1に対してはセット処理であ
るので、キー送出装置19を起動せず(セット処理でに
、全てのタプルについてキー送出装置19は起動しない
)、タプル2に対してはハツシング装置18を、タプル
3に対してはキー抽出装置17を起動する(START
信号101−01および111−01をアサートする)
。次に、キー抽出袋Fi17およびハツシング装置18
の処理が終了すれば(END信号101−02および1
11−01をアサートする)、接続切替回路15を起動
し′SI■■FT信号135をアサートする)、接続切
替を行う。
At the time of L2, p1 is a set process for tuple 1, so the key sending device 19 is not activated (the key sending device 19 is not activated for all tuples in the set process), and for tuple 2. starts the hashing device 18 and the key extraction device 17 for tuple 3 (START
assert signals 101-01 and 111-01)
. Next, the key extraction bag Fi17 and the hashing device 18
When the processing is completed (END signals 101-02 and 1
11-01), activates the connection switching circuit 15, and asserts the 'SI■■FT signal 135) to switch the connection.

t3の時刻では、タプル1に対してはバッファクリア装
置20を起動しく5TART信号131−01をアサー
トする)、タプル2に対してはキー送出装置19を起動
せず、タプル3に対してはハツシング装置18を(ST
ART信号111−01をアサートする)、タプル4に
対してはキー抽出装置17を(START信号101−
01をアサートする)各々起動する。次に、キー抽出装
置17、ハツシング装置18およびバッファクリア装置
20の処理が終了すれば(END信号101−02,1
11−02および131−02をアサートする)、接続
切替回路15を起動しく5HIFT信号135をアサー
トする)、接続切替を行う。
At time t3, the buffer clearing device 20 is activated for tuple 1 and the 5TART signal 131-01 is asserted), the key sending device 19 is not activated for tuple 2, and hashing is performed for tuple 3. The device 18 (ST
ART signal 111-01), and key extractor 17 for tuple 4 (START signal 101-01).
01) respectively. Next, when the processing of the key extracting device 17, hashing device 18, and buffer clearing device 20 is completed (END signals 101-02, 1
11-02 and 131-02), activates the connection switching circuit 15 and asserts the 5HIFT signal 135), and switches the connection.

以上の処理を繰り返すべく、バッファのある1面に対し
、キー抽出処理、ハツシング処理、バッファクリア処理
(但し、セット処理では、キー送出処理を行わない)を
順次行うように接続切替を行う。データ群1の全てのタ
プルについてセット処理が終了すれば、ENPTY信号
101−03をアサートする。
In order to repeat the above process, the connection is switched so that key extraction processing, hashing processing, and buffer clearing processing (however, key sending processing is not performed in set processing) are performed sequentially on one side of the buffer. When the set processing for all tuples of data group 1 is completed, the ENPTY signal 101-03 is asserted.

(4)リファ処理のための制御レジスタの設定(2)の
FJ合と同様に、データ群2の情報を各制御レジスタ2
2,23.24に設定する。
(4) Setting the control registers for refer processing Similarly to the FJ combination in (2), the information of data group 2 is stored in each control register.
Set to 2, 23, 24.

(5)リファ処理 リファ処理はセット処理と同様に行う。リファ処理がセ
ット処理と異なる点は、ハツシング装置18によりHI
 T信号111−03がアサートされている場合(HI
 T した場合)は、キー送出装置17を起動して、該
タプルをデータ出力端子25から出力するが、HIT信
号111−03がネゲートされている場合(HI T 
Lない場合)は、キー送出族″i19を起動しないとい
う点である。
(5) Refer processing Refer processing is performed in the same way as set processing. The difference between refer processing and set processing is that the hashing device 18
When T signal 111-03 is asserted (HI
If the HIT signal 111-03 is negated, the key sending device 17 is activated and the tuple is output from the data output terminal 25.
If there is no key sending group "i19", the key sending group "i19" is not activated.

データ群2の全てのタプルについてリファ処理が終了す
れば、ENPTY信号101−03をアサートし、デー
タ群2の選別処理が終了する。第5図にリファ処理にお
けるタイムチャートの例を示す。
When the refer processing is completed for all tuples of data group 2, the ENPTY signal 101-03 is asserted, and the selection processing of data group 2 is completed. FIG. 5 shows an example of a time chart in refer processing.

以上述べた制御手順により、キーとして指定された可変
長のアトリビュート内容の一致する可能性のあるデータ
(タプル)を選別することが可能となる。
The control procedure described above makes it possible to select data (tuples) that have a possibility of matching the contents of the variable-length attribute specified as the key.

こぎでは、データ群2のみの選別処理について説明した
が、データ群1、データ群2を同時に選別したい場合に
は1本装置を2台備えることにより、一方の装置にはデ
ータ群1のセット処理、続いてデータ群2のリファ処理
を、もう一方の装置にはデータ群2のセット処理、続い
てデータ群1のリファ処理を行うように制御すれば可能
となる。
In this section, we have explained the sorting process for only data group 2, but if you want to sort data group 1 and data group 2 at the same time, you can install two devices, one of which can handle the set processing of data group 1. This becomes possible by controlling the other device to perform set processing for data group 2 and then refer processing for data group 1 to the other device.

次に、キー抽出装置17.ハツシング装置18゜キー送
出装置19、接続切替回路15の各動作について説明す
る。
Next, the key extraction device 17. Each operation of the hashing device 18, the key sending device 19, and the connection switching circuit 15 will be explained.

第6図はキー抽出装置17の処理を説明する図である。FIG. 6 is a diagram illustrating the processing of the key extraction device 17.

本例は、入力データ(タプル)はアトリビュートが4つ
(A+ 、A2 、A3 、As )ある場合で、オフ
セットはそのうちA、およびA2に付けられている。ま
た、キーとして、アトリビュートA + 、 A 2が
A 1. A xの順で指定された場合である。キー抽
出装置17では、各アトリビュートの最大炎をあらかじ
め渡されているものとし、アトリビュートは固定長化し
ている。なお、A1とA2を固定長化しないで、A1と
A2を連続してバッファの中に格納するようにしてもよ
い。
In this example, the input data (tuple) has four attributes (A+, A2, A3, As), of which offsets are attached to A and A2. Also, as keys, attributes A + , A 2 are A 1 . This is a case where they are specified in the order of A x. In the key extraction device 17, it is assumed that the maximum flame of each attribute is given in advance, and the attributes have a fixed length. Note that A1 and A2 may be stored consecutively in the buffer without making them a fixed length.

キー抽出装置17の処理の結果として、A+。As a result of the processing of the key extraction device 17, A+.

A2のQvペアと計算したTADをバッファにライトす
る。
Write the Qv pair of A2 and the calculated TAD to the buffer.

キー抽出処理の詳細なアルゴリズムを第7図に示す。デ
ータ入力端子16の先に接続されているのがメモリとす
ると、メモリ内のデータ群の先頭アドレスMEMADR
からタプルが格納しているものとし、最終アドレスはM
EMADR+MEMLNGとなっている。途中のアドレ
スでタプルが無くなっている場合の終了判定(データ群
の終りの判定)はQQ=Oで行うものとしているが、こ
れに限定されることなく、■データ群の格納領域(例え
ば、先頭アドレスと最終アドレス)、■データ群の終り
の指定があればよい。
A detailed algorithm for key extraction processing is shown in FIG. If it is a memory that is connected to the end of the data input terminal 16, then the start address of the data group in the memory MEMADR
Assume that a tuple is stored from , and the final address is M
It is EMADR + MEMLNG. When there are no tuples at an intermediate address, the end determination (determination of the end of the data group) is performed using QQ=O. address and final address), ■It is sufficient to specify the end of the data group.

次に、ハツシング装置18の処理を説明する。Next, the processing of the hashing device 18 will be explained.

ハツシング装置18は、キーとして指定されたアトリビ
ュートのバリューを1バイトずつ内蔵しているハツシン
グ関数によりハツシング処理を行う。
The hashing device 18 performs hashing processing using a hashing function that contains the value of an attribute designated as a key, one byte at a time.

セット処理では、ハツシングして、該ハツシングを番地
とするビット位置を“1″にセットする。
In the set processing, the data is hashed and the bit position corresponding to the hashed address is set to "1".

一方、リファ処理では、ハツシングして、該ハツシング
値を番地とするビット位置がII I ITであれば、
HIT信号111−03をアサートするが、0”であれ
ば、HIT信号111−03はネゲートされたまへであ
る。
On the other hand, in the refer processing, if the bit position whose address is the hashing value after hashing is II I IT,
The HIT signal 111-03 is asserted, but if it is 0'', the HIT signal 111-03 remains negated.

次に、キー送出装置19の処理を説明する。これはHI
T信号111−03をアサートした該タプルのキーとし
て指定されたアトリビュートA1゜A2のQvペアおよ
びTADをデータ出力端子25に出力するものである。
Next, the processing of the key sending device 19 will be explained. This is HI
The Qv pair and TAD of attributes A1 and A2 designated as the key of the tuple for which the T signal 111-03 has been asserted are output to the data output terminal 25.

第8図は接続切替回路15による接続切替の様子を示す
図である。接続切替回路15は、4面のバッファ11,
12,13.14とキー抽出装置17、ハツシング装置
18、キー送出装置19、バッファクリア装置20の4
つの装置との接続を切替えるものであり、バッファの各
々は、4つの装置のうちCどれか1つと接続されている
。これらの接続切替は5HIFT信号135のアサート
により行い、第4図あるいは第5図に示すように、順次
キー抽出装置17、ハツシング装置18、キー送出装置
19、バッファクリア装置20を起動する。
FIG. 8 is a diagram showing how connection switching is performed by the connection switching circuit 15. The connection switching circuit 15 has four buffers 11,
12, 13, and 14, key extraction device 17, hashing device 18, key sending device 19, and buffer clearing device 20.
Each buffer is connected to one of the four devices. These connections are switched by asserting the 5HIFT signal 135, and the key extraction device 17, hashing device 18, key sending device 19, and buffer clearing device 20 are sequentially activated as shown in FIG. 4 or 5.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明は各々独立した一定容量の
バッファ4面と、制御装置、キー抽出装置、ハツシング
装置、キー送出装置、バッファクリア装置、接続切替回
路を備え、キー抽出装置。
As described above, the present invention provides a key extraction device including four independent buffers each having a constant capacity, a control device, a key extraction device, a hashing device, a key sending device, a buffer clearing device, and a connection switching circuit.

ハツシング装置、キー送出装置、バッファクリア装置を
順次パイプライン的に動作させながら、可変長アトリビ
ュートから構成される可変長データをもつ2つのデータ
群相互にキーとして指定された可変長アトリビュートの
内容が一致する可能性のあるデータを選別するものであ
るため、従来装置に比へて、可変長のアトリビュートを
扱えると同時に、ソフトウェアにより可変長のキーを抽
出しなければならないような従来装置に比べて1選別処
理に要する時間を短縮できるという利点がある。
While operating the hashing device, key sending device, and buffer clearing device sequentially in a pipeline manner, the contents of the variable-length attributes specified as keys match between two data groups each having variable-length data composed of variable-length attributes. Since this system selects data that may be used for data processing, it is able to handle variable-length attributes compared to conventional devices, and at the same time, it is 1. This has the advantage that the time required for sorting processing can be shortened.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明によるデータ選別装置の一実施例を示す
図、第2図は従来のデータ選別装置の操作手順の説明図
、第3図は本実施例で用いる入力データ形式を示す図、
第4図は本実施例におけるセット処理のタイムチャート
、第5図は本実施例におけるリファ処理のタイムチャー
ト、第6図は本実施例におけるキー抽出装置の処理の説
明図、第7図は本実施例におけるキー抽出処理の詳細な
アルゴリズムを示す図、第8図は本実施例における接続
切替回路による接続切替の様子を示す図である。 5・・・ハツシング回路、  7・・・ビットアレイ、
11.12,13.14・・・バッファ、15・・・接
続切替回路、  16・・・データ入力端子。 17・・・キー抽出装置、 18・・・ハツシング装置
、19・・・キー送出装置、  20・・・バッファク
リア装置、 21・・・制御装置、 22,23.24
・・・制御レジスタ、  25・・・データ出力端子。 代理人弁理士  鈴 木   誠 一゛1ン゛ 第  2  図 [
FIG. 1 is a diagram showing an embodiment of a data sorting device according to the present invention, FIG. 2 is an explanatory diagram of the operating procedure of a conventional data sorting device, and FIG. 3 is a diagram showing an input data format used in this embodiment.
Fig. 4 is a time chart of the set processing in this embodiment, Fig. 5 is a time chart of refer processing in this embodiment, Fig. 6 is an explanatory diagram of the processing of the key extraction device in this embodiment, and Fig. 7 is the main FIG. 8 is a diagram showing a detailed algorithm of the key extraction process in this embodiment, and is a diagram showing the state of connection switching by the connection switching circuit in this embodiment. 5... Hashing circuit, 7... Bit array,
11.12, 13.14... Buffer, 15... Connection switching circuit, 16... Data input terminal. 17... Key extraction device, 18... Hashing device, 19... Key sending device, 20... Buffer clearing device, 21... Control device, 22, 23.24
...Control register, 25...Data output terminal. Representative Patent Attorney Seiichi Suzuki 1st Figure 2 [

Claims (1)

【特許請求の範囲】[Claims] 可変長のアトリビュートから構成される可変長データを
もつ2つのデータ群相互のキーとして指定された可変長
のアトリビュートの内容の一致する可能性のあるデータ
を選別する装置において、各々独立した一定容量の4面
のバッファと、可変長データからキーとして指定された
可変長アトリビュートの内容を抽出するキー抽出装置と
、アトリビュート内容を適当なハッシュ関数によりハッ
シングするハッシング回路とビットアレイとの組からな
るハッシング装置と、選別後のアトリビュート内容を出
力するキー送出装置と、バッファのクリア処理を行うバ
ッファクリア装置と、前記4面のバッファとキー抽出装
置、ハッシング装置、キー送出装置、バッファクリア装
置との間の接続を切換える接続切替回路と、前記各装置
及び接続切替回路の制御を行う制御装置とを備え、制御
装置の指示により、キー抽出、ハッシング、キー送出、
バッファクリアの4つの処理を順次パイプライン的に動
作させながら、前記2つのデータ群相互にキーとして指
定された可変長のアトリビュート内容が一致する可能性
のあるデータを選別することを特徴とするデータ選別装
置。
In a device that selects data that has a possibility of matching the contents of variable-length attributes specified as mutual keys between two data groups having variable-length data composed of variable-length attributes, each has an independent fixed capacity. A hashing device consisting of a four-sided buffer, a key extraction device that extracts the contents of a variable-length attribute specified as a key from variable-length data, a hashing circuit and a bit array that hash the attribute contents using an appropriate hash function. , a key sending device that outputs the attribute contents after sorting, a buffer clearing device that clears the buffer, and a link between the four buffers, the key extracting device, the hashing device, the key sending device, and the buffer clearing device. It is equipped with a connection switching circuit that switches connections, and a control device that controls each of the devices and the connection switching circuit, and performs key extraction, hashing, key sending,
Data characterized in that four processes of buffer clearing are sequentially operated in a pipeline manner, and data in which variable length attribute contents designated as keys are likely to match each other in the two data groups is selected. Sorting equipment.
JP60294874A 1985-12-27 1985-12-27 Data sorter Expired - Fee Related JPH0731686B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60294874A JPH0731686B2 (en) 1985-12-27 1985-12-27 Data sorter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60294874A JPH0731686B2 (en) 1985-12-27 1985-12-27 Data sorter

Publications (2)

Publication Number Publication Date
JPS62154139A true JPS62154139A (en) 1987-07-09
JPH0731686B2 JPH0731686B2 (en) 1995-04-10

Family

ID=17813364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60294874A Expired - Fee Related JPH0731686B2 (en) 1985-12-27 1985-12-27 Data sorter

Country Status (1)

Country Link
JP (1) JPH0731686B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1069488A (en) * 1996-08-28 1998-03-10 Hitachi Ltd Parallel data base system retrieval method
CN109766479A (en) * 2019-01-24 2019-05-17 北京三快在线科技有限公司 Data processing method, device, electronic equipment and storage medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1069488A (en) * 1996-08-28 1998-03-10 Hitachi Ltd Parallel data base system retrieval method
CN109766479A (en) * 2019-01-24 2019-05-17 北京三快在线科技有限公司 Data processing method, device, electronic equipment and storage medium
CN109766479B (en) * 2019-01-24 2020-06-09 北京三快在线科技有限公司 Data processing method and device, electronic equipment and storage medium

Also Published As

Publication number Publication date
JPH0731686B2 (en) 1995-04-10

Similar Documents

Publication Publication Date Title
JPH0795093A (en) Equipment and method for executing progressive data compresion algorithm
JPH08235130A (en) Parallel processor
JPS62154139A (en) Data selecting device
JPH0650478B2 (en) Data compression storage system
JPS6362064A (en) Bus converter
JP2005301665A (en) Data processor and data processing method
JP3547625B2 (en) Data search device and data search method
JP2959497B2 (en) Data processing device and data processing method
JPH023225B2 (en)
JP2939584B1 (en) Search circuit
JP2589884B2 (en) Bit search circuit
JPS58129650A (en) Data processor
JPH0535468A (en) Arithmetic unit
JP2518387B2 (en) Serial data transmission circuit
JPS62284432A (en) Data coupling circuit
JPS6354826A (en) Compressed data expanding device
JPS6234231A (en) File data processor
JPH0512011A (en) Pipeline circuit
JPH1063483A (en) Data arithmetic circuit
JPS61110233A (en) Data processor
JPH04129429A (en) Dictionary retrieval system for data compressor
JPH06204884A (en) Data restoration circuit
JPH04332035A (en) Data compressing device
JPS63231526A (en) Sort processor
JPH0833812B2 (en) Sorting device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees