JP3344755B2 - Ascending integer sequence data compression and decoding system - Google Patents

Ascending integer sequence data compression and decoding system

Info

Publication number
JP3344755B2
JP3344755B2 JP07093793A JP7093793A JP3344755B2 JP 3344755 B2 JP3344755 B2 JP 3344755B2 JP 07093793 A JP07093793 A JP 07093793A JP 7093793 A JP7093793 A JP 7093793A JP 3344755 B2 JP3344755 B2 JP 3344755B2
Authority
JP
Japan
Prior art keywords
data
quotient
decoding
remainder
division
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07093793A
Other languages
Japanese (ja)
Other versions
JPH06259222A (en
Inventor
克信 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NS Solutions Corp
Original Assignee
NS Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NS Solutions Corp filed Critical NS Solutions Corp
Priority to JP07093793A priority Critical patent/JP3344755B2/en
Publication of JPH06259222A publication Critical patent/JPH06259222A/en
Application granted granted Critical
Publication of JP3344755B2 publication Critical patent/JP3344755B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、単調増加的に配列され
た昇順整数列データの圧縮および復号システムに関し、
特にデータベースから必要な情報を取り出すためのデー
タベース検索システムにおいて検索されるデータが単調
増加的に配列された整数列データである場合のそのデー
タの圧縮および復号システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system for compressing and decoding monotonically increasing ascending integer sequence data.
In particular, the present invention relates to a system for compressing and decoding data obtained when data searched in a database search system for extracting necessary information from a database is integer string data arranged monotonically.

【0002】[0002]

【従来の技術】従来、データを圧縮および復号する方法
の代表的なものとしては、ハフマン法、シャノン・ファ
ノ法、ギルバート・ムーア法、ランレングス符号化法な
どが知られている。たとえばハフマン法を用いたものと
しては特開平2−78323号などが挙げられる。
2. Description of the Related Art Conventionally, Huffman method, Shannon Fano method, Gilbert Moore method, run-length encoding method and the like are known as typical methods for compressing and decoding data. For example, Japanese Patent Application Laid-Open No. 2-78323 is an example using the Huffman method.

【0003】[0003]

【発明が解決しようとする課題】これらの方法は主とし
て、データの文字ごとの出現頻度を測定し、頻度の高い
ものから優先的にデータのサイズを圧縮するものであ
る。これらの方法は、任意の形態のデータに適用できる
利点がある反面、圧縮、復号に数段階の処理を必要とす
るため、特に速度が要求される際には不向きである。
These methods mainly measure the appearance frequency of each character of data, and compress the data size preferentially from those having higher frequency. Although these methods have an advantage that they can be applied to data of any form, they require several stages of processing for compression and decoding, and are therefore unsuitable especially when high speed is required.

【0004】本発明は、上記のような問題に鑑み、単調
増加的(昇順)に配列された整数列データを高速で圧縮
するとともに、圧縮されたデータを記憶する記憶手段の
容量を小さくすることのできる圧縮および復号システム
を提供することを目的とする。
SUMMARY OF THE INVENTION In view of the above problems, the present invention provides a method for compressing integer sequence data arranged monotonically (in ascending order) at a high speed, and reducing the capacity of a storage means for storing the compressed data. It is an object of the present invention to provide a compression and decoding system capable of performing the following.

【0005】[0005]

【課題を解決するための手段】本発明の圧縮および復号
システムは、昇順に配列された整数列データの圧縮およ
び復号において、昇順に配列された整数列データのn番
目のデータから、第1の記憶手段に記憶されたn−1番
目のデータの減算を行うとともに、n番目のデータを第
1の記憶手段に送る減算手段と、減算手段により得られ
た差分値を被除数として除算を行い、商および余りを出
力する第1の除算手段と、第1の除算手段により得られ
た商を0と比較する商比較手段と、商比較手段による比
較の結果0でない商を被除数として除算を行い、商およ
び桁上がりマークとともに余りを出力する第2の除算手
段と、第2の除算手段から出力される桁上がりマークお
よび余りを記憶するとともに、第1の除算手段から出力
される余りを記憶する第2の記憶手段と、第2の記憶手
段に記憶された桁上がりマークおよび2つの余りのデー
タから元の整数列データを復号する復号手段とを具備す
る。
According to the compression and decoding system of the present invention, in the compression and decoding of integer sequence data arranged in ascending order, the n-th integer sequence data arranged in ascending order is used.
From the data of the eye, the (n-1) th stored in the first storage means
Of the nth data,
Subtraction means for sending to the first storage means, division by using the difference value obtained by the subtraction means as a dividend, quotient and remainder to be output, and quotient obtained by the first division means to be 0. Quotient comparison means for comparing with the quotient non-zero result of the comparison by the quotient comparison means, as a dividend, outputting the remainder together with the quotient and the carry mark, and the second division means. that stores the carry marks and the remainder from the first and second storage means for storing the remainder output from the division means, second storage means to the stored carry marks and two much data Decoding means for decoding the original integer sequence data.

【0006】[0006]

【作用】本発明によれば、圧縮時に昇順データを、すで
に記憶された古い整数データと減算を行い、減算により
得られた差分を被除数として除算を行いその余りを出力
するとともに、その商を0と比較し、0でない商につい
てはこれを被除数として除算を行い、桁上がりマークと
ともに余りを出力し、商が0になるまでこの除算を繰り
返し、後者の除算により得られる桁上がりマーク、余
り、前者の除算により得られる余りを保存するようにし
ている。したがって、差分値を除算し、得られたデータ
を保存するようにしているから、従来の一般的な圧縮符
号化方法に比べて計算量を大幅に節約でき、高速で圧縮
および復号を行うことができる。また、統計量のような
データ全体にわたるパラメータを必要としないため、デ
ータの追加や削除を容易に実施することができる。
According to the present invention, at the time of compression, the ascending data is subtracted from the already stored old integer data, the difference obtained by the subtraction is divided as the dividend, the remainder is output, and the quotient is set to 0. The quotient other than 0 is divided as the dividend, and the remainder is output together with the carry mark. This division is repeated until the quotient becomes 0. The carry mark obtained by the latter division, the remainder, the former The remainder obtained by dividing by is saved. Therefore, since the difference value is divided and the obtained data is stored, the amount of calculation can be greatly reduced as compared with the conventional general compression encoding method, and compression and decoding can be performed at high speed. it can. In addition, since parameters for the entire data such as statistics are not required, addition or deletion of data can be easily performed.

【0007】[0007]

【実施例】図1には、本発明によるシステムの一実施例
が示されている。同図に示すように、昇順整数列データ
D1は320、333、401...と、単調増加的
(昇順)に配列されている。これらのデータはたとえば
32ビットで表される。整数列データD1は圧縮装置に
おいて、減算部22に送られる。減算部22はそのデー
タの前に送られているデータの整数値によって減算を行
うとともに、今回送られた整数値を記憶部11に送る。
すなわち、記憶部11には、今回送られてきたデータの
直前に送られているデータが記憶されているから、これ
が減算部22に読み出され、減算部22は今回送られて
きたデータから直前に送られているデータを減算し、そ
の減算結果を除算部12に送る。
FIG. 1 shows an embodiment of the system according to the present invention. As shown in the drawing, ascending integer sequence data D1 includes 320, 333, 401. . . And are arranged in a monotonically increasing manner (ascending order). These data are represented by, for example, 32 bits. The integer sequence data D1 is sent to the subtraction unit 22 in the compression device. The subtraction unit 22 performs subtraction using the integer value of the data sent before the data, and sends the currently sent integer value to the storage unit 11.
That is, since the data transmitted immediately before the data transmitted this time is stored in the storage unit 11, the data is read out by the subtraction unit 22, and the subtraction unit 22 reads the data transmitted immediately before the data transmitted this time. Is subtracted, and the result of the subtraction is sent to the division unit 12.

【0008】減算部22はこの減算を行うとともに、今
回送られてきたデータを記憶部11に送る。記憶部11
には、減算部22から送られた最新のデータが記憶され
る。なお、記憶部11の初期値は0とする。
The subtraction unit 22 performs this subtraction and sends the data sent this time to the storage unit 11. Storage unit 11
Stores the latest data sent from the subtraction unit 22. Note that the initial value of the storage unit 11 is 0.

【0009】除算部12は減算部22から送られた減算
データを所定の値で除算する。本実施例では入力された
減算データを255で割る。得られた商は商比較部13
に送られ、余りは圧縮数列D2処理部16に送られる。
The division unit 12 divides the subtraction data sent from the subtraction unit 22 by a predetermined value. In this embodiment, the input subtraction data is divided by 255. The obtained quotient is the quotient comparison unit 13
The remainder is sent to the compressed sequence D2 processing unit 16.

【0010】商比較部13は入力された商を0と比較
し、商が0でない場合にはこれを除算部14へ送る。商
が0である場合には除算部14へ何らデータを送らず、
昇順整数列データD1の次のデータを減算部22へ入力
するよう指示を与える。除算部14は、商比較部13か
ら入力された商を所定の値、本実施例では256で除算
し、得られた商は再び商比較部13に送られ、余りは桁
上がりを示すマーク文字Cとともに圧縮数列D2処理部
16へ送られる。商比較部13に送られた商が0と判定
されるまで除算部14での除算が繰り返される。
The quotient comparing section 13 compares the input quotient with 0, and sends the quotient to the dividing section 14 if the quotient is not 0. If the quotient is 0, no data is sent to the division unit 14,
An instruction is given to input the next data of the ascending integer sequence data D1 to the subtraction unit 22. The division unit 14 divides the quotient input from the quotient comparison unit 13 by a predetermined value, in this embodiment, 256, and sends the obtained quotient to the quotient comparison unit 13 again. The remainder is a mark character indicating a carry. It is sent to the compression sequence D2 processing unit 16 together with C. The division by the division unit 14 is repeated until the quotient sent to the quotient comparison unit 13 is determined to be 0.

【0011】以上のようにして昇順整数列データの圧縮
処理が行われ、圧縮されたデータ列が圧縮数列処理部1
6に記憶される。
The compression processing of the ascending integer sequence data is performed as described above, and the compressed data sequence is processed by the compression sequence processing unit 1.
6 is stored.

【0012】次に具体的な例により説明する。最初のデ
ータ320が減算部22に送られると、記憶部11に記
憶された初期値が0であるから、320から0が減算さ
れ、差分値は320となり、除算部12に送られる。除
算部12では差分値320を255で除算し、商1、余
り65が得られる。商比較部13は入力された商を0と
比較し、商が0でないため、除算部14に商1が送られ
る。除算部14で商1が256によって除算され、商
0、余り1となるから、除算部14は桁上がりマークC
とともに余り1を圧縮数列処理部16に送り、次の整数
値を読むように通知する。
Next, a specific example will be described. When the first data 320 is sent to the subtraction unit 22, the initial value stored in the storage unit 11 is 0, so 0 is subtracted from 320, the difference value becomes 320 and sent to the division unit 12. The division unit 12 divides the difference value 320 by 255 to obtain a quotient 1 and a remainder 65. The quotient comparison unit 13 compares the input quotient with 0, and since the quotient is not 0, the quotient 1 is sent to the division unit 14. The division unit 14 divides the quotient 1 by 256 to obtain the quotient 0 and the remainder 1, so that the division unit 14
At the same time, the remainder 1 is sent to the compressed sequence processing unit 16 to notify the next integer value to be read.

【0013】圧縮数列処理部16は、除算部14から送
られた桁上がりマーク文字Cと余り1および除算部12
から送られた余り65を記憶する。
The compression number sequence processing section 16 carries the carry mark character C sent from the division section 14 with the remainder 1 and the division section 12
The remaining 65 sent from is stored.

【0014】次に整数列データD1からデータ333が
送られると、減算部22は333を記憶部11に記憶さ
れていた320で減算し、差分13を得る。差分13は
除算部12に送られ、除算部12は255で除算し、商
0、余り13を得る。商0は商比較部13に送られ、商
比較部13は商0が判定され、整数列D1から次の整数
値を読み込むように指示が出される。この場合には商比
較部13で商0が判定されているから、圧縮数列処理部
16には除算部12から送られた余り13のみが送ら
れ、記憶される。
Next, when the data 333 is sent from the integer sequence data D 1, the subtraction unit 22 subtracts 333 by 320 stored in the storage unit 11 to obtain a difference 13. The difference 13 is sent to the division unit 12, which divides by 255 to obtain a quotient 0 and a remainder 13. The quotient 0 is sent to the quotient comparing unit 13, and the quotient comparing unit 13 determines the quotient 0 and issues an instruction to read the next integer value from the integer sequence D1. In this case, since the quotient 0 is determined by the quotient comparing unit 13, only the remainder 13 sent from the dividing unit 12 is sent to the compressed sequence processing unit 16 and stored.

【0015】同様の動作が繰り返されることにより、圧
縮されたデータが圧縮数列D2処理部16に順次送られ
る。これらの圧縮データは保存部15に記憶される。
By repeating the same operation, the compressed data is sequentially sent to the compressed sequence D2 processing unit 16. These compressed data are stored in the storage unit 15.

【0016】このように圧縮処理は、昇順整数列の先頭
から順に数列の差分Dを算出し、これを定数L(0)で割
った商P(0)、剰余Q(0)を求め、商P(0)が0である場
合には、剰余Q(0)のみを記憶手段に格納し、0でない
場合には、商P(0)をさらに定数L(1)で割り、商P
(1)、剰余Q(1)を算出する。その後、この商P(i)(i=1,
2,...)が0になるまで、直前に算出された商P(i-1)を
被除数として除算を繰り返す。
As described above, in the compression processing, a difference D of a sequence is calculated in order from the head of an ascending integer sequence, a quotient P (0) obtained by dividing the difference D by a constant L (0), and a remainder Q (0) are obtained. If P (0) is 0, only the remainder Q (0) is stored in the storage means. If P (0) is not 0, the quotient P (0) is further divided by a constant L (1).
(1) The remainder Q (1) is calculated. Then, this quotient P (i) (i = 1,
The division is repeated with the quotient P (i-1) calculated immediately before until (2,...) Becomes 0.

【0017】漸化式で表すと D=L(0)×P(0)+Q(0) P(i-1)=L(i)×P(i)+Q(i)(i=1,2,...) この時、1つの差分値Dに対して以下のように数値が格
納される。 P(0)=0の場合、 Q(0)のみ P(n)=0(n>1)の場合、 C、Q(1)、C、Q(2)、...C、Q(n)、Q(0) ただし、CはQ(0)と区別可能なマーク文字である。ま
た、上記整数列の先頭の値については、その値自身を差
分値とする。除数L(i)は予め定義しておく。
When expressed by a recurrence formula, D = L (0) × P (0) + Q (0) P (i−1) = L (i) × P (i) + Q (i) (i = 1,2 , ...) At this time, a numerical value is stored for one difference value D as follows. When P (0) = 0, only Q (0) When P (n) = 0 (n> 1), C, Q (1), C, Q (2),. . . C, Q (n), Q (0) where C is a mark character distinguishable from Q (0). As for the leading value of the integer sequence, the value itself is used as the difference value. The divisor L (i) is defined in advance.

【0018】L(i)を大きく設定すれば、除算の結果、
商が0になる場合が増加し、演算コストを下げることが
できる。逆にL(i)を小さく設定すれば、除算の回数が
増加し、演算コストが上がるが余りを小さくおさえるこ
とができ、記憶領域を小さくすることができる。
If L (i) is set large, the result of division is
The case where the quotient becomes 0 increases, and the calculation cost can be reduced. Conversely, if L (i) is set to be small, the number of divisions increases and the calculation cost increases, but the remainder can be kept small, and the storage area can be reduced.

【0019】次に復号においては、直前に復号された数
値を保存しておき、これを利用する。最初の整数値に対
してはあらかじめ保持された値として0を用いる。
Next, in decoding, the numerical value decoded immediately before is stored and used. For the first integer value, 0 is used as a value held in advance.

【0020】まず保存部15に記憶された圧縮データが
圧縮数列D2処理部16に取り出され、読み取り部17
により読み取られる。読み取り部17は、圧縮データに
桁上がりを示すマーク文字Cが出現した場合には、その
直後のデータをバイアス処理部18に送る。また、マー
ク文字Cの出現の有無にかかわらず、余りのデータを加
算部19に送り、バイアス処理部18に通知する。
First, the compressed data stored in the storage unit 15 is taken out by the compressed sequence D2 processing unit 16 and read by the reading unit 17.
Is read by When the mark character C indicating a carry appears in the compressed data, the reading unit 17 sends the data immediately after that to the bias processing unit 18. Further, regardless of the presence or absence of the mark character C, the remaining data is sent to the adding unit 19 and notified to the bias processing unit 18.

【0021】たとえば本実施例における最初の圧縮デー
タは、桁上がりを示すマーク文字Cであるから、読み取
り部17はその直後のデータ1を読み取り、バイアス処
理部18に送る。次に、読み取り部17は余りのデータ
65を読み取り、加算部19に送る。
For example, since the first compressed data in the present embodiment is the mark character C indicating a carry, the reading unit 17 reads the immediately following data 1 and sends it to the bias processing unit 18. Next, the reading unit 17 reads the remaining data 65 and sends it to the adding unit 19.

【0022】バイアス処理部18は、読み取り部17か
ら送られてきたデータが何番目のマーク文字の後のデー
タであるかをカウントする。カウント数に応じて、バイ
アスが算出され、加算部に送られる。カウント数は読み
取り部17から余り読み取りの通知がくると0に初期化
される。
The bias processing section 18 counts the number of mark characters after the data sent from the reading section 17. The bias is calculated according to the count number and sent to the adding unit. The count number is initialized to 0 when the reading unit 17 receives a notice of the remaining reading.

【0023】本実施例では、バイアス処理部18に1番
目に送られてきたデータに対しては255を乗算し、2
番目以降のn(n=2,3,...)番目のデータに対
しては255×256(n-1)を乗算して加算部19に送
る。したがって、本実施例では1番目に送られてきたデ
ータ1に255を掛けて得られた255が加算部19に
送られる。
In the present embodiment, the first data sent to the bias processing unit 18 is multiplied by 255,
The nth (n = 2, 3,...) -Th data is multiplied by 255 × 256 (n−1) and sent to the adder 19. Therefore, in the present embodiment, 255 obtained by multiplying the first sent data 1 by 255 is sent to the adder 19.

【0024】加算部19では、バイアス処理部18から
送られてきたバイアス値を順次加算するとともに、読み
取り部17から送られてくる余りを加算し、さらにその
前に復号され記憶部23に記憶されている整数を読み出
して加算する。記憶部23の初期値は0にされている。
The adding section 19 sequentially adds the bias values sent from the bias processing section 18, adds the remainder sent from the reading section 17, and decodes and adds the remainder to the storage section 23. The integers are read and added. The initial value of the storage unit 23 is set to 0.

【0025】本実施例ではバイアス処理部18から送ら
れてきた255と読み取り部17から送られてきた65
とを加算し、さらに記憶部23の初期値0を加算して、
復号データ320を得る。得られた復号データは復元整
数列D3保持部21に送られ、必要に応じて出力され
る。
In this embodiment, 255 sent from the bias processing unit 18 and 65 sent from the reading unit 17 are used.
Is added, and the initial value 0 of the storage unit 23 is further added.
The decrypted data 320 is obtained. The obtained decoded data is sent to the restored integer sequence D3 holding unit 21 and output as needed.

【0026】このように、Thus,

【数1】 (Equation 1)

【0027】を定義すれば、n個のマーク文字および剰
余が読み込まれた時、差分Dは、D=Q(0)または
When the n mark characters and the remainder are read, the difference D becomes D = Q (0) or

【0028】[0028]

【数2】 (Equation 2)

【0029】として差分Dが復号でき、この差分Dを、
保持していた直前の復号された整数値に加えてもとの整
数値が復号できる。
The difference D can be decoded as
The original integer value can be decoded in addition to the held immediately previous decoded integer value.

【0030】本実施例によれば、上記のように圧縮時に
昇順データを、すでに記憶された古い整数データと減算
を行い、減算により得られた差分を被除数として除算を
行いその余りを出力するとともに、その商を0と比較
し、0でない商についてはこれを被除数として除算を行
い、桁上がりマークとともに余りを出力し、商が0にな
るまでこの除算を繰り返し、後者の除算により得られる
桁上がりマーク、余り、前者の除算により得られる余り
を保存するようにしている。したがって、差分値を除算
し、得られたデータを保存するようにしているから、従
来の一般的な圧縮符号化方法に比べて計算量を大幅に節
約できるから、高速で圧縮および復号を行うことができ
る。また、統計量のようなデータ全体にわたるパラメー
タを必要としないため、データの追加や削除を容易に実
施することができる。
According to the present embodiment, the ascending data is subtracted from the already stored old integer data at the time of compression as described above, the difference obtained by the subtraction is used as a dividend, the remainder is output, and the remainder is output. , The quotient is compared with 0, the non-zero quotient is divided as a dividend, the remainder is output together with the carry mark, and this division is repeated until the quotient becomes 0, and the carry obtained by the latter division is obtained. The mark, the remainder, and the remainder obtained by the former division are preserved. Therefore, since the difference value is divided and the obtained data is stored, the amount of calculation can be significantly reduced as compared with the conventional general compression encoding method, so that high-speed compression and decoding are performed. Can be. In addition, since parameters for the entire data such as statistics are not required, addition or deletion of data can be easily performed.

【0031】本発明による圧縮および復号システムは、
各種の昇順に配列された整数列データの圧縮および復号
に適用できる。たとえば次のようなデータ検索システム
におけるデータの処理に適用できる。
A compression and decoding system according to the present invention comprises:
The present invention can be applied to compression and decoding of various types of integer sequence data arranged in ascending order. For example, the present invention can be applied to data processing in the following data search system.

【0032】図2は、本発明が適用される一実施例を示
す近傍特徴量の抽出によるパターン検索システムのデー
タフロー図である。この検索システムでは、予め全対象
物件から事象(情報)の位相情報を全て捨象した近傍特
徴量データを作成し、そのデータ群に対して全物件検索
を行なう。検索のアルゴリズムは、学習ステップと検索
ステップとからなる。学習ステップでは、物件毎に近傍
特徴量行列が位相情報として作成される。図2では、検
索対象10から近傍特徴量行列30を作成し、それを構
造ファイル40に保存するまでのステップに該当する。
また、検索ステップでは、検索キーに対して学習ステッ
プと同様の処理を行って検索キーの近傍特徴量が求めら
れ、物件の近傍特徴量行列とのマッチング演算が行なわ
れ、物件ごとにマッチング度(類似度)を示す評価結果
を得る。図2では、検索キー50をもとに検索S4にて
構造ファイル40の物件データとのマッチング演算を行
い、評価結果リスト70あるいはソート済みリスト80
のように結果を出力するまでのステップに該当する。以
下、各ステップについて説明する。
FIG. 2 is a data flow diagram of a pattern search system by extracting a nearby feature quantity showing an embodiment to which the present invention is applied. In this search system, neighboring feature data is created from all target properties in advance by omitting all phase information of events (information), and a search for all properties is performed for the data group. The search algorithm includes a learning step and a search step. In the learning step, a neighborhood feature amount matrix is created as phase information for each property. In FIG. 2, this corresponds to a step of creating a neighborhood feature amount matrix 30 from the search target 10 and storing it in the structure file 40.
Also, in the search step, the same processing as in the learning step is performed on the search key to obtain the neighboring feature amount of the search key, and a matching operation is performed with the neighboring feature amount matrix of the property, and the matching degree ( (Similarity) is obtained. In FIG. 2, a matching operation with the property data of the structure file 40 is performed in search S4 based on the search key 50, and the evaluation result list 70 or the sorted list 80 is displayed.
Corresponds to the steps until the result is output. Hereinafter, each step will be described.

【0033】(1)、学習ステップ 図2に於いて、検索対象10は、例えば日本語、英語、
ドイツ語、フランス語、ヘブライ語、ロシア語などの文
書データ、或いは量子化された波形数値データ、化学構
造式、遺伝子情報などである。このような検索対象に対
して、まず正規化手段S1により正規化の処理を行な
う。一般に検索対象は、情報の最小単位(文書であれば
アルファベットなどの文字、数値チャートであれば、あ
る時刻における実数値など)の列で表現されている。そ
れをなんらかの方法でn階調の整数列に変換する。これ
をデータの正規化と呼ぶ。
(1) Learning step In FIG. 2, the search target 10 is, for example, Japanese, English,
Document data in German, French, Hebrew, Russian, etc., or quantized waveform numerical data, chemical structural formulas, genetic information, etc. For such a search target, first, normalization processing is performed by the normalization means S1. Generally, a search target is represented by a sequence of the minimum unit of information (a character such as an alphabet in a document, a real number at a certain time in a numerical chart, and the like). It is converted into an integer sequence of n gradations by some method. This is called data normalization.

【0034】例えば、英文書データの場合、ASCII
コード表をそのまま用いることにより、次のような25
6階調の数値表現として実現される。 …… This is a pen. …… 84|104|105|115|32|105|115|32|97|32|112|101|110|46|
For example, in the case of English document data, ASCII
By using the code table as it is, the following 25
It is realized as a numerical representation of six gradations. …… This is a pen. …… 84 | 104 | 105 | 115 | 32 | 105 | 115 | 32 | 97 | 32 | 112 | 101 | 110 | 46 |

【0035】上記のコードにおいては、Tが84、hが10
4..と対応している。
In the above code, T is 84 and h is 10
Four. . It corresponds to.

【0036】次に、正規化されたデータ20から、学習
手段S2により近傍特徴量が算出され、以下に説明する
手順で近傍特徴量行列30の形式に畳込まれる。ここで
近傍特徴量をとる演算式は種々考えられる。この演算式
は検索の鋭さ(過検出の少なさ)にも影響を与える。
Next, from the normalized data 20, a neighboring feature value is calculated by the learning means S2, and is convolved into a format of a nearby feature value matrix 30 by the procedure described below. Here, various arithmetic expressions for calculating the neighborhood feature amount can be considered. This arithmetic expression also affects the sharpness of the search (less overdetection).

【0037】学習手段S2の一例として、正規化された
データ20から量子化量を求め、この量子化量を用いて
近傍特徴量行列30を得る手順を説明する。例えば図4
に示すように、検索される対象物件(文書)が複数ある
とし、そのうちのi番目の物件の量子化について考え
る。ここで、i番目の物件(文書)のj番目のデータ
(文字)をCi,jとし、Ci,jのk近傍に関するデータを
i,j+1,Ci,j+2,....,Ci,j+kとする。i番目の物件に
おいて、図3に示すように正規化された数値列135,64,3
7,71,101,...が並んでいるとすると、Ci,jに関する量
子化量xおよびCi,jの前方k近傍に関する量子化量y
は、 x=f(Ci,j) y=g(Ci,j,Ci,j+1,Ci,j+2,....,Ci,j+k) …式(1) で求められる。
As an example of the learning means S2, a procedure for obtaining a quantization amount from the normalized data 20 and obtaining a neighboring feature amount matrix 30 using the quantization amount will be described. For example, FIG.
Suppose that there are a plurality of target properties (documents) to be searched, and the quantization of the i-th property is considered. Here, j-th data (characters) to C i of the i-th property (document), and j, C i, the data for the k-neighborhood of j C i, j + 1, C i, j + 2,. ..., Ci , j + k . In the i-th property, a normalized numeric string 135, 64, 3 as shown in FIG.
7,71,101 and ... is that alongside, C i, the quantization amount regarding j x and C i, the quantization weight for Upcoming k near the j y
X = f (C i, j ) y = g (C i, j , C i, j + 1 , C i, j + 2 , ..., C i, j + k ) ... ).

【0038】ここで、f(Ci,j)はCi,jに関するn段階
量子化関数である。すなわち、i番目の物件のj番目の
データCi,jについて所定の演算を行って得られる値で
あり、1〜nのいずれかの整数で表される。したがっ
て、このn段階量子化関数fの演算により得られた量子
化量xの値によって、図4に示す行列(座標)において
x軸方向の位置が1〜nの範囲で定まる。
Here, f (C i, j ) is an n-stage quantization function for C i, j . That is, it is a value obtained by performing a predetermined operation on the j-th data C i, j of the i-th property, and is represented by any integer from 1 to n. Therefore, the position in the x-axis direction in the matrix (coordinates) shown in FIG. 4 is determined in the range of 1 to n by the value of the quantization amount x obtained by the calculation of the n-stage quantization function f.

【0039】また、g(Ci,j,Ci,j+1,Ci,j+2,....,C
i,j+k)は、Ci,jの前方k近傍に関するm段階量子化関
数である。すなわち、i番目の物件のj番目のデータC
i,jと、そのデータCi,jの近傍の所定の数のデータC
i,j+1,Ci,j+2,....,Ci,j+kとについて所定の演算を行
って得られる値であり、1〜mのいずれかの整数で表さ
れる。たとえば図3に示すようにj番目のデータCi,j
が135であり、kが3の場合には、Ci,j+1,Ci,j+2,
i,j+3としてデータ135に続くデータ64、37、
71を抽出し、これらのデータとデータ135との相関
について所定の演算を行う。j番目のデータCi,jが次
の64の場合には、Ci,j+1,Ci,j+2,Ci,j+3としてデ
ータ64に続くデータ37、71、101を抽出し、こ
れらのデータとデータ64との相関について所定の演算
を行う。このようにしてm段階量子化関数gの演算によ
り得られた量子化量yの値によって、図4に示す行列
(座標)におけるy軸方向の位置が1〜mの範囲で定ま
る。
G (C i, j , C i, j + 1 , C i, j + 2 ,..., C
i, j + k ) is an m-step quantization function for the neighborhood of k in front of C i, j . That is, the j-th data C of the i-th property
i, j and a predetermined number of data C near the data C i, j
i, j + 1 , C i, j + 2 ,..., C i, j + k are values obtained by performing a predetermined operation, and are represented by any integer from 1 to m . For example, as shown in FIG. 3, the j-th data C i, j
Is 135 and k is 3, C i, j + 1 , C i, j + 2 ,
Data 64, 37 following data 135 as C i, j + 3 ,
71, and a predetermined calculation is performed on the correlation between these data and the data 135. If the j-th data Ci , j is the next 64, the data 37, 71, 101 following the data 64 are extracted as Ci , j + 1 , Ci , j + 2 , Ci , j + 3. Then, a predetermined operation is performed on the correlation between the data and the data 64. The position of the matrix (coordinates) shown in FIG. 4 in the y-axis direction in the range of 1 to m is determined by the value of the quantization amount y obtained by the calculation of the m-stage quantization function g.

【0040】したがって、上記のように正規化されたデ
ータ20から量子化量x、yを求めることによって図4
に示す行列(座標)における位置が定まる。量子化量を
求める演算式f()、g()としては種々あるが、例えば、 f: x→x g: (x,y)→x-y(または|x-y|) …式(2) のように、演算式f()は入力された値をそのまま量子化
量とし、演算式g()は入力された2つの値の差、或いは
差の絶対値を量子化量とする例が考えられる。この場
合、正規化されたデータ20が先の例84|104|105|11
5.....では、データCi,jを84とすると、Ci,jとCi,j
の前方k近傍に関する量子化量x,yの座標位置は、(8
4,20)、(84,21)、(84,31)、.....となる。また、この式
(2)以外にも、幾つかの文字列の個々の文字整数値に
対し四則演算を施すことにより近傍特徴量を取り出して
もよい。図3中に示した量子化量x,yの座標位置(51,
71)、(32,103)、.....は、上記式(2)とは異なる手法
によって求めたものである。
Therefore, by obtaining the quantization amounts x and y from the data 20 normalized as described above, FIG.
Is determined in the matrix (coordinates) shown in FIG. There are various arithmetic expressions f () and g () for obtaining the quantization amount. For example, f: x → xg: (x, y) → xy (or | xy |) The operation expression f () may use the input value as the quantization amount as it is, and the operation expression g () may use the difference between the two input values or the absolute value of the difference as the quantization amount. In this case, the normalized data 20 corresponds to the previous example 84 | 104 | 105 | 11.
5 ....., assuming that data C i, j is 84, C i, j and C i, j
The coordinate positions of the quantization amounts x and y with respect to the neighborhood of k in front of
4,20), (84,21), (84,31), ..... In addition to the equation (2), the neighborhood feature may be extracted by performing four arithmetic operations on individual character integer values of some character strings. The coordinate positions (51, 51) of the quantization amounts x and y shown in FIG.
71), (32, 103),... Are obtained by a method different from the above equation (2).

【0041】本システムでは、各物件情報は、上記のよ
うにして求めた量子化量x、yに対して物件の通番iと
重みw(x,y,i)の組として記憶される。重みw(x,y,
i)は、データx、y、iから所定の演算によって求め
られるが、通常は重みw(x,y,i)の値は1に固定して
もよい。
In the present system, each piece of property information is stored as a set of a property serial number i and a weight w (x, y, i) with respect to the quantization amounts x and y obtained as described above. Weight w (x, y,
i) is obtained by a predetermined calculation from the data x, y, and i, but usually the value of the weight w (x, y, i) may be fixed to 1.

【0042】上記のようにして各物件についてデータC
i,jごとに求められた量子化量x、yの値に基づき図4
に棒によって示されるように、データを記憶する。すな
わち、データCi,jの量子化量x、yの値によって定め
られる座標の位置に、その物件の通番iとその重みw
(x,y,i)を組みとしたデータを記憶する。同図ではこ
のようなデータが記憶されるごとに棒の長さが延びるよ
うに表されている。もし重みw(x,y,i)を1とした場
合には、物件の通番iのデータのみがx、yの値によっ
て定められる座標の位置に記憶されてゆく。物件の通番
iのデータが図1に示す整数列データD1のように昇順
に配列された整数データであれば、前述の方法による圧
縮および復号に適している。したがって、前述の圧縮を
行うことにより、高速でデータを圧縮し、データの記憶
容量を小さくすることができる。
As described above, data C for each property
4 based on the values of the quantization amounts x and y obtained for each of i and j .
Store the data as indicated by the bar at That is, data C i, the quantization amount x of j, the position of coordinates defined by the value of y, the weight w and the serial number i of that property
Data containing (x, y, i) is stored. In the figure, the length of the bar is shown to be extended each time such data is stored. If the weight w (x, y, i) is 1, only the data of the serial number i of the property is stored at the position of the coordinates determined by the values of x and y. If the data of the serial number i of the property is integer data arranged in ascending order like the integer sequence data D1 shown in FIG. 1, it is suitable for compression and decoding by the above-described method. Therefore, by performing the above-described compression, data can be compressed at a high speed, and the storage capacity of the data can be reduced.

【0043】この様にして作成された近傍特徴量行列に
物件の識別番号を付加して構造ファイル40として保存
する。
The property identification number is added to the neighborhood feature amount matrix created in this way, and is stored as the structure file 40.

【0044】(2)、検索ステップ まず検索キー50を入力する。例えば、"This is a pe
n."を検索キーとする。この検索キー50に対して学習
ステップでの正規化手段S1と同一の正規化方法に基づ
く正規化手段S3によりキー情報を以下の整数列に正規
化する。 84|104|105|115|32|105|115|32|97|32|112|101|110|46|
(2) Search Step First, a search key 50 is input. For example, "This is a pe
n. "is used as a search key. The key information is normalized to the following integer sequence with respect to this search key 50 by the normalization means S3 based on the same normalization method as the normalization means S1 in the learning step. | 104 | 105 | 115 | 32 | 105 | 115 | 32 | 97 | 32 | 112 | 101 | 110 | 46 |

【0045】次に、検索手段S4において、学習ステッ
プでの学習手段S2と同一の自己相関計算式f()、g()を
用いて正規化された検索キー50の数値列の先頭から量
子化量x、yの組の系列を作成する。次に、この検索キ
ー50の量子化量x、yの組の系列に基づいて、構造フ
ァイル40内から取り出した物件kに対する検索キー5
0の含有度数ωkとして、V(xj,yj,k)をj=1〜
mについて合計することにより算出する。
Next, in the search means S4, quantization is performed from the head of the numerical sequence of the search key 50 normalized using the same autocorrelation calculation formulas f () and g () as in the learning means S2 in the learning step. Create a series of pairs of quantities x, y. Next, based on the series of pairs of quantization amounts x and y of the search key 50, the search key
0 as containing the frequency omega k of, V (x j, y j , k) and j =. 1 to
It is calculated by summing m.

【0046】ただし、V(xj,yj,k)は、構造ファイ
ル40に記憶された物件iの重みに等しく、重みを持た
ない場合には0と定める。
However, V (x j , y j , k) is equal to the weight of the property i stored in the structure file 40, and is set to 0 when it has no weight.

【0047】したがって、検索すべきキー50の数値列
から求めた量子化量x、yの組に対応する図4の量子化
量のx、yの位置にデータがある場合(棒がある場合)
には、別に設けられた記憶手段のそのデータに示される
物件の通番iの格納箇所にその重みの値を構造評価値sc
ore(合致度)として記憶させる。
Therefore, when there is data (when there is a bar) at the positions of x and y of the quantization amount in FIG. 4 corresponding to the combination of the quantization amounts x and y obtained from the numerical sequence of the key 50 to be searched.
In the storage section provided separately, the value of the weight is stored in the storage location of the serial number i of the property indicated by the data, the structure evaluation value sc
It is stored as ore (degree of match).

【0048】次に、評価結果出力手段S5において、構
造ファイル40内の各物件毎に得られた構造評価値scor
e(合致度)を完全一致の場合の評価値(この場合は、
文字数−k、)で割って、検索キー50の含有確率を求
め、評価結果のリスト70を得る。更にソート手段S6
において、このリスト70を含有確率の降順にソートし
ソート済みリスト80を得る。
Next, in the evaluation result output means S5, the structure evaluation value scor obtained for each property in the structure file 40 is obtained.
e (matching degree) is the evaluation value for an exact match (in this case,
By dividing by the number of characters -k,), the content probability of the search key 50 is obtained, and a list 70 of evaluation results is obtained. Further, sorting means S6
, The list 70 is sorted in descending order of the content probability to obtain a sorted list 80.

【0049】このソート済みリスト80が検索結果であ
り、その上位物件を参照することにより、検索キーが物
件中に含まれている確率が高い物件名を知ることができ
る。含有確率は、完全一致及び不完全一致の全てについ
て求まるから、あいまい一致検索を行なうことができ
る。
The sorted list 80 is a search result, and by referring to a higher order property, it is possible to know a property name having a high probability that the search key is included in the property. Since the content probabilities are obtained for all of the perfect match and the incomplete match, a fuzzy match search can be performed.

【0050】また、検索キーの全情報についての全物件
探索であるから、検索もれが発生する確率は、本質的に
零であると言う特徴がある。
Further, since all the properties are searched for all the information of the search key, the probability of occurrence of a search omission is essentially zero.

【0051】また、1つの物件に対する検索キーの評価
時間は、キーの文字数のみに依存し、物件の大きさには
依存しない。従って、非常に高速に検索を行なうことが
できる。
The evaluation time of the search key for one property depends only on the number of characters of the key and does not depend on the size of the property. Therefore, the search can be performed at a very high speed.

【0052】また検索結果のリストどうしの論理演算を
行うことにより、検索条件に対するAND、ORなどの
検索演算処理も高速に実行できる。
By performing a logical operation between the search result lists, search operation processing such as AND, OR, and the like for the search condition can be executed at high speed.

【0053】近傍特徴量は、各物件の全データを対象と
し取り出さなくてもよい。例えば、物件データ中の特定
の一つまたは一つ以上の整数値、特定の範囲の整数値、
或いはデータ列を構成する各バイト中の特定の1つまた
は一つ以上のビットを除外して近傍特徴量を捨象しても
よい。また日本語文書のように2バイト文字で構成され
ている場合には、例えば上位バイトを除外して下位バイ
トを対象として近傍特徴量を取り出してもよい。
The neighboring feature amounts need not be extracted for all data of each property. For example, one or more specific integer values in property data, a specific range of integer values,
Alternatively, one or more specific bits in each byte constituting the data string may be excluded and the neighboring feature amounts may be omitted. Further, in the case of a two-byte character as in a Japanese document, for example, the upper-order byte may be excluded and the neighboring feature amount may be extracted from the lower-order byte.

【0054】上述の例では、近傍特徴量によって生成さ
れる行列は、256次のビット行列であり、これは8K
バイトに相当する。従って、1物件のデータが1Kバイ
ト程度であるデータベースでは、効率のよいシステムで
あるとは言えない。そこで上記のようなデータ圧縮手段
S7を設けてデータ圧縮を行なって構造ファイル40の
容量を減らすのがよい。
In the above example, the matrix generated by the neighborhood feature is a 256-order bit matrix, which is 8K
Equivalent to bytes. Therefore, a database in which the data of one property is about 1 Kbyte cannot be said to be an efficient system. Therefore, it is preferable to provide the data compression means S7 as described above and perform data compression to reduce the capacity of the structure file 40.

【0055】上述の実施例において,正規化手段S1、
学習手段S2、正規化手段S3、検索手段S4、評価結
果出力手段S5、ソート手段S6、データ圧縮手段S7
は、コンピュータプログラムによって構成することがで
きるが、論理回路素子を用いて専用のハードウエアを構
成してもよい。
In the above embodiment, the normalizing means S1,
Learning means S2, normalization means S3, search means S4, evaluation result output means S5, sort means S6, data compression means S7
Can be configured by a computer program, but dedicated hardware may be configured using logic circuit elements.

【0056】[0056]

【発明の効果】このように本発明によれば、差分を計算
しこれを基にして圧縮することにより格納される最大数
を抑えるから、圧縮率の向上を図ることができるととも
に、従来の一般的な圧縮符号化方法に比べて計算量を大
幅に節約できる。従って、高速で圧縮および復号を行う
ことができる。また、統計量のようなデータ全体にわた
るパラメータを必要としないため、データの追加や削除
を容易に実施することができる。
As described above, according to the present invention, the maximum number to be stored is suppressed by calculating the difference and compressing it based on the difference, so that the compression ratio can be improved and the conventional general method can be achieved. The amount of calculation can be greatly reduced as compared with a typical compression encoding method. Therefore, compression and decoding can be performed at high speed. In addition, since parameters for the entire data such as statistics are not required, addition or deletion of data can be easily performed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明による圧縮復号システムの一実施例のデ
ータフロー図である。
FIG. 1 is a data flow diagram of one embodiment of a compression / decoding system according to the present invention.

【図2】本発明による圧縮復号システムを適用するデー
タベース検索システムのデータフロー図である。
FIG. 2 is a data flow diagram of a database search system to which the compression / decoding system according to the present invention is applied.

【図3】近傍情報の量子化を示す図である。FIG. 3 is a diagram illustrating quantization of neighborhood information.

【図4】記憶される情報構造を示す図である。FIG. 4 is a diagram showing an information structure to be stored.

【符号の説明】[Explanation of symbols]

10 検索対象 11 記憶部 12 除算部 13 商比較部 14 除算部 15 保存部 16 圧縮数列D2処理部 17 読み取り部 18 バイアス処理部 19 加算部 20 正規化データ 21 復元数列D3保持部 22 減算部 23 記憶部 30 近傍特徴量行列 40 構造ファイル 50 検索キー 60 正規化キー 70 評価結果リスト 80 ソート済みリスト S1 正規化手段 S2 学習手段 S3 正規化手段 S4 検索手段 S5 評価結果出力手段 S6 ソート手段 S7 データ圧縮手段 Reference Signs List 10 search target 11 storage unit 12 division unit 13 quotient comparison unit 14 division unit 15 storage unit 16 compression sequence D2 processing unit 17 reading unit 18 bias processing unit 19 addition unit 20 normalized data 21 restoration sequence D3 holding unit 22 subtraction unit 23 storage Part 30 Neighborhood feature matrix 40 Structure file 50 Search key 60 Normalization key 70 Evaluation result list 80 Sorted list S1 Normalization means S2 Learning means S3 Normalization means S4 Search means S5 Evaluation result output means S6 Sorting means S7 Data compression means

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭64−23623(JP,A) 特開 平4−326164(JP,A) 特開 平5−174067(JP,A) 特開 平5−181719(JP,A) 特開 平5−225238(JP,A) 特開 平5−225248(JP,A) 特開 平6−274193(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 5/00 G06F 17/30 H03M 7/18 G06F 12/00 511 ──────────────────────────────────────────────────続 き Continuation of the front page (56) References JP-A-64-23623 (JP, A) JP-A-4-326164 (JP, A) JP-A-5-174067 (JP, A) JP-A-5- 181719 (JP, A) JP-A-5-225238 (JP, A) JP-A-5-225248 (JP, A) JP-A-6-274193 (JP, A) (58) Fields investigated (Int. 7 , DB name) G06F 5/00 G06F 17/30 H03M 7/18 G06F 12/00 511

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 昇順に配列された整数列データの圧縮お
よび復号システムにおいて、 昇順に配列された整数列データのn番目のデータから、
第1の記憶手段に記憶されたn−1番目のデータの減算
を行うとともに、前記n番目のデータを前記第1の記憶
手段に送る減算手段と、 前記減算手段により得られた差分値を被除数として除算
を行い、商および余りを出力する第1の除算手段と、 前記第1の除算手段により得られた商を0と比較する商
比較手段と、 前記商比較手段による比較の結果0でない商を被除数と
して除算を行い、商および桁上がりマークとともに余り
を出力する第2の除算手段と、 前記第2の除算手段から出力される桁上がりマークおよ
び余りを記憶するとともに、前記第1の除算手段から出
力される余りを記憶する第2の記憶手段と、 前記第2の記憶手段に記憶された前記桁上がりマークお
よび2つの余りのデータから元の整数列データを復号す
る復号手段とを具備することを特徴とする昇順整数列デ
ータの圧縮および復号システム。
1. A system for compressing and decoding integer sequence data arranged in ascending order, comprising :
Subtraction of the (n-1) th data stored in the first storage means
And stores the n-th data in the first storage
Subtraction means for sending to the means; first division means for performing division with the difference value obtained by the subtraction means as a dividend, and outputting a quotient and a remainder; and quotient obtained by the first division means to be 0. Quotient comparing means for comparison; second dividing means for performing division as a dividend with a quotient other than 0 as a result of the comparison by the quotient comparing means, and outputting a remainder together with the quotient and the carry mark; output from the second dividing means Second storage means for storing the carry mark and the remainder to be output, and the remainder output from the first division means; and the carry mark and the two carry means stored in the second storage means. Decoding means for decoding the original integer sequence data from the remaining data. A system for compressing and decoding ascending integer sequence data.
【請求項2】 前記第2の除算手段は、前記商比較手段
から送られた0でない商を除算した場合に前記桁上がり
マークを出力することを特徴とする請求項1の昇順整数
列データの圧縮および復号システム。
2. The ascending integer sequence data according to claim 1, wherein said second dividing means outputs said carry mark when dividing a non-zero quotient sent from said quotient comparing means. Compression and decoding system.
【請求項3】 検索対象の物件毎にその近傍特徴量を記
憶した第3の記憶手段と、 検索キーの近傍特徴量と検索対象の上記近傍特徴量との
合致度からあいまい検索する検索手段とを具備し、 前記第3の記憶手段に記憶されたデータに対して、前記
減算手段、第1及び第2の除算手段、商比較手段、並び
第2の記憶手段を用いてデータ圧縮することを特徴と
する請求項1の昇順整数列データの圧縮および復号シス
テム。
3. A third storage means for storing, for each property to be searched, its neighboring feature quantity, and a search means for performing an ambiguous search based on the degree of matching between the neighborhood feature quantity of the search key and the neighborhood feature quantity of the search subject. comprising a, on the data stored in said third memory means, said subtracting means, first and second dividing means, the quotient comparison means, and that the data compressed using the second storage means 2. The system for compressing and decoding ascending integer sequence data according to claim 1, wherein:
【請求項4】 検索対象のi番目の物件のj番目のデー
タ列Ci,jに関する量子化量xとその近傍のk個のデー
タ列Ci,j+1,Ci,j+2,....,Ci,j+kに関する量子化量y
とを x=f(Ci,j) y=g(Ci,j,Ci,j+1,Ci,j+2,....,Ci,j+k) によって求め、得られたx、yの値に基づいて定められ
前記第3の記憶手段の位置にその物件の通番iを記憶
するデータベース検索に用いられることを特徴とする請
求項3の昇順整数列データの圧縮および復号システム。
4. A quantization amount x for a j-th data string C i, j of an i-th property to be searched and k data strings C i, j + 1 , C i, j + 2 , ...., Quantization amount y for C i, j + k
And x = f (C i, j ) y = g (C i, j , C i, j + 1 , C i, j + 2 , ..., C i, j + k ) 4. The compression and compression of ascending integer sequence data according to claim 3, wherein the data is used for searching a database that stores the serial number i of the property at the position of the third storage means determined based on the values of x and y obtained. Decryption system.
JP07093793A 1993-03-05 1993-03-05 Ascending integer sequence data compression and decoding system Expired - Fee Related JP3344755B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07093793A JP3344755B2 (en) 1993-03-05 1993-03-05 Ascending integer sequence data compression and decoding system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07093793A JP3344755B2 (en) 1993-03-05 1993-03-05 Ascending integer sequence data compression and decoding system

Publications (2)

Publication Number Publication Date
JPH06259222A JPH06259222A (en) 1994-09-16
JP3344755B2 true JP3344755B2 (en) 2002-11-18

Family

ID=13445922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07093793A Expired - Fee Related JP3344755B2 (en) 1993-03-05 1993-03-05 Ascending integer sequence data compression and decoding system

Country Status (1)

Country Link
JP (1) JP3344755B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4987912B2 (en) * 2009-06-02 2012-08-01 株式会社東芝 Data compression device, data decompression device, data compression method, and data decompression method

Also Published As

Publication number Publication date
JPH06259222A (en) 1994-09-16

Similar Documents

Publication Publication Date Title
EP0510634B1 (en) Data base retrieval system
EP0293161B1 (en) Character processing system with spelling check function
US8712977B2 (en) Computer product, information retrieval method, and information retrieval apparatus
US20160321282A1 (en) Extracting method, information processing method, computer product, extracting apparatus, and information processing apparatus
US20080319987A1 (en) System, method and program for creating index for database
JPH07244671A (en) Document retrieval device
JP2833580B2 (en) Full-text index creation device and full-text database search device
US5347652A (en) Method and apparatus for saving and retrieving functional results
JP3258063B2 (en) Database search system and method
JP3333549B2 (en) Document search method
JPH09245043A (en) Information retrieval device
JP3545007B2 (en) Database search system
JP3151730B2 (en) Database search system
JP3344755B2 (en) Ascending integer sequence data compression and decoding system
JP2993540B2 (en) Ascending integer sequence data compression and decoding system
JP4208326B2 (en) Information indexing device
JP3288063B2 (en) Variable length data storage and reference system
JP3259781B2 (en) Database search system and database search method
JP3081093B2 (en) Index creation method and apparatus and document search apparatus
JP2993539B2 (en) Database search system and method
US6526401B1 (en) Device for processing strings
JPH0554077A (en) Word dictionary retriever
JPH06162096A (en) Record retrieval method
JP3019286B2 (en) Document search device
JP3585944B2 (en) Data processing method and apparatus

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020723

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100830

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120830

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees