JPH06337762A - Compressing method and restoring method for data base record - Google Patents

Compressing method and restoring method for data base record

Info

Publication number
JPH06337762A
JPH06337762A JP5126734A JP12673493A JPH06337762A JP H06337762 A JPH06337762 A JP H06337762A JP 5126734 A JP5126734 A JP 5126734A JP 12673493 A JP12673493 A JP 12673493A JP H06337762 A JPH06337762 A JP H06337762A
Authority
JP
Japan
Prior art keywords
record
data
database
database record
compressing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5126734A
Other languages
Japanese (ja)
Other versions
JP2790594B2 (en
Inventor
Fumio Gomi
文男 五味
Yoshifumi Kawasaki
良文 川崎
Masahisa Horie
正久 堀江
Yuji Toyama
雄司 外山
Takenori Iwato
丈典 岩戸
Yoshifumi Nogami
敬文 野上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd, Hitachi Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP5126734A priority Critical patent/JP2790594B2/en
Publication of JPH06337762A publication Critical patent/JPH06337762A/en
Application granted granted Critical
Publication of JP2790594B2 publication Critical patent/JP2790594B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To shorten the length of data base records and reduce the capacity by compressing data of all initial value data item parts when there are many initial value data items in the data base records. CONSTITUTION:When record data set in a record receiving and passing area 16 secured in an application program 11 are exclusively 0Red by using a mask table, all data item parts having the same values between the record data and mask table are subtracted to become zero and then the contents of masked record data in the record receiving and passing area 16 are left. On the basis of the masked record data, compression control information is substituted for parts of successive identical characters, noncompression control information is set even at the head of discontinuous parts, and compressed record data are set in a record input/output area 17 and stored in a data base file 19.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、主にデータベースマネ
ージメントシステムにおけるデータベースレコードの圧
縮方法および復元方法に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention mainly relates to a method of compressing and restoring a database record in a database management system.

【0002】[0002]

【従来の技術】従来のデータ圧縮方法では、データベー
スレコード内に同一文字が3バイト以上連続している場
合には、繰返文字数をカウントし、文字種別と繰返回数
をそれぞれ各1バイトずつ合計2バイトの圧縮情報とし
てレコード内の同一文字があった位置に置換し、データ
ベースレコードを圧縮している。
2. Description of the Related Art In the conventional data compression method, when the same character is consecutive for 3 bytes or more in a database record, the number of repeated characters is counted and the character type and the number of repetitions are summed up by 1 byte each. The 2-byte compression information is replaced with the position where the same character is present in the record, and the database record is compressed.

【0003】この種に関連するものには例えば特開平4
−348617号公報等が挙げられる。
For example, Japanese Unexamined Patent Publication No. Hei.
-348617 publication etc. are mentioned.

【0004】[0004]

【発明が解決しようとする課題】しかし、上記従来技術
では、データベースレコード内に同一文字が3バイト以
上連続している場合のみデータ圧縮の対象となっている
ため、データベースレコード内の初期値データ項目内に
4ビットの符号コードが付くことにより同一文字の連続
性がとぎれるような場合には、圧縮効率が上がらないと
いう問題があった。
However, in the above-mentioned prior art, since the data compression is performed only when the same character is consecutive for 3 bytes or more in the database record, the initial value data item in the database record. When the continuity of the same character is interrupted by adding a 4-bit code to the inside, there is a problem that the compression efficiency cannot be improved.

【0005】本発明の目的は、データベースレコードの
データにおいて、同一文字の連続性がとぎれる場合でも
データベースレコードの圧縮効率を上げ、データベース
ファイルへの格納するデータベースレコード長を短くす
ることである。
An object of the present invention is to improve the compression efficiency of a database record and shorten the database record length stored in a database file even when the continuity of the same characters is interrupted in the data of the database record.

【0006】[0006]

【課題を解決するための手段】上記目的を達成するため
に、本発明の第1の手段は、データベースレコード内の
データ形式に応じた初期値で設定されたマスクテーブル
を作成して、1データベースレコード単位に格納される
データベースレコードのデータと前記マスクテーブルと
の排他的論理和をとり、前記データベースレコード内の
初期値項目部分に対応するビットをオフにして連続同一
文字列を作り、前記データベースレコードのデータにお
ける連続同一文字列がある位置に連続同一文字列に関す
る情報をもつ圧縮情報を置換し、前記レコードデータを
ビットオフにならなかった残りのデータベースレコード
のデータと圧縮情報とからなるデータベースレコードの
データに圧縮することを特徴とする。
In order to achieve the above object, the first means of the present invention is to create a mask table set with an initial value according to the data format in a database record to create one database. The exclusive OR of the data of the database record stored in record units and the mask table is taken, and the bit corresponding to the initial value item part in the database record is turned off to make a continuous identical character string, and the database record Of the database record consisting of the data and the compression information of the remaining database records that did not bit-off the record data by replacing the compression information having the information about the continuous identical character string at the position where the continuous identical character string exists in the data of It is characterized by being compressed into data.

【0007】本発明の第2の手段は、外部記憶装置上の
データベースファイルに一旦格納されている圧縮された
データベースレコードを読み出し、このデータベースフ
ァイルから読み出したデータベースレコード内の圧縮情
報に置換された部分を連続同一文字の長さ分に拡張し、
データベースレコードのデータ圧縮時と同一のマスクテ
ーブルとの排他的論理和をとり対応するビットをオンに
し、データベースレコードのデータ圧縮前のデータベー
スレコードに復元することを特徴とする。
A second means of the present invention reads a compressed database record once stored in a database file on an external storage device and replaces it with the compressed information in the database record read from this database file. To the length of consecutive same characters,
It is characterized by performing exclusive OR with the same mask table as when the data of the database record is compressed and turning on the corresponding bit to restore the database record to the database record before data compression.

【0008】前記マスクテーブルの作成は、データベー
スレコードを処理するアプリケーションプログラムの作
成で使用するレコードフォーマット規定部分のソースプ
ログラムをそのまま使用し、言語に応じた初期値データ
をもとに行うことを特徴とする。
The mask table is created by using the source program of the record format defining part used in creating the application program for processing the database record as it is, based on the initial value data according to the language. To do.

【0009】[0009]

【作用】前述の手段によれば、データベースレコード内
のデータ形式に応じた初期値、または発生頻度の高い任
意の文字列で設定されたマスクテーブルを作成して、1
データベースレコード単位に格納されるデータベースレ
コードのデータと前記マスクテーブルとの排他的論理和
をとり、前記データベースレコード内の初期値項目部分
に対応するビットをオフにして連続同一文字列を作り、
前記データベースレコードのデータにおける連続同一文
字列がある位置に連続同一文字列に関する情報をもつ圧
縮情報を置換し、前記レコードデータをビットオフにな
らなかった残りのデータベースレコードのデータと圧縮
情報とからなるデータベースレコードのデータに圧縮す
るので、圧縮可能な範囲が従来より広くとれ、レコード
データの圧縮効率が向上し、データベースファイルへの
格納データベースレコード長を短くすることが可能とな
る。
According to the above-mentioned means, the mask table set with the initial value according to the data format in the database record or an arbitrary character string with high occurrence frequency is created, and 1
The exclusive OR of the data of the database record stored in database record units and the mask table is taken, and the bit corresponding to the initial value item part in the database record is turned off to form a continuous identical character string,
The compressed information having the information about the continuous identical character string is replaced at a position where the continuous identical character string is present in the data of the database record, and the record data is composed of the data of the remaining database record and the compressed information which are not bit-off. Since the data is compressed into the data of the database record, the compressible range can be made wider than before, the compression efficiency of the record data can be improved, and the length of the database record stored in the database file can be shortened.

【0010】そして、圧縮前のデータベースレコードに
復元する時は、外部記憶装置上のデータベースファイル
に一旦格納されている圧縮されたデータベースレコード
を読み出し、データベースファイルから読み出したデー
タベースレコード内の圧縮情報に置換された部分を連続
同一文字の長さ分に拡張し、データベースレコードのデ
ータ圧縮時と同一のマスクテーブルとの排他的論理和を
とり対応するビットをオンにし、データベースレコード
のデータ圧縮前のデータベースレコードに簡単に復元す
ることが可能である。
When restoring the database record before compression, the compressed database record once stored in the database file on the external storage device is read and replaced with the compression information in the database record read from the database file. The extended part of the specified part is extended to the length of the continuous same character, and the corresponding bit is turned on by exclusive-oring with the same mask table as when the database record data was compressed, and the database record before data compression of the database record is turned on. It is possible to easily restore to.

【0011】更に、マスクテーブルの作成は、データベ
ースレコードを処理するアプリケーションプログラムの
作成で使用するレコードフォーマット規定部分のソース
プログラムをそのまま使用し、言語に応じた初期値デー
タをもとに行われるため、データベースレコードを処理
するアプリケーションプログラムとデータベースファイ
ルのズレを防止できる。
Further, since the mask table is created by using the source program of the record format defining part used in creating the application program for processing the database record as it is, based on the initial value data according to the language, The gap between the application program that processes the database record and the database file can be prevented.

【0012】[0012]

【実施例】以下、図面を使用して本発明の一実施例につ
いて詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described in detail below with reference to the drawings.

【0013】図1は、本発明を実現するデータベースマ
ネジメントシステムの全体構成を示すブロック図であ
り、図2は、図1のデータベースマネジメントシステム
を実施するための装置のハードウエア構成を示すブロッ
ク図である。
FIG. 1 is a block diagram showing the overall configuration of a database management system for implementing the present invention, and FIG. 2 is a block diagram showing the hardware configuration of an apparatus for implementing the database management system of FIG. is there.

【0014】図1および図2において、10はデータベ
ースマネジメントシステム、11はアプリケーションプ
ログラム、19はデータベースファイル、20はレコー
ド規定管理ファイル、21はコンパイラ、22はマスク
テーブルファイル、31は入出力装置、32は中央処理
装置(CPU)、33は主記憶装置、34は外部記憶装
置である。
In FIGS. 1 and 2, 10 is a database management system, 11 is an application program, 19 is a database file, 20 is a record definition management file, 21 is a compiler, 22 is a mask table file, 31 is an input / output device, and 32 is a 32. Is a central processing unit (CPU), 33 is a main memory, and 34 is an external memory.

【0015】図1に示すように、本発明の実施例のデー
タ圧縮方法を実行するデータベースマネジメントシステ
ム10は、アプリケーションプログラム11が使用する
データベースファイル19のデータベースレコードの入
出力要求により動作し、データベースマネジメントシス
テム内を制御するコントローラ12、データベースレコ
ードの圧縮処理を行うデータ圧縮部13、データベース
レコードの復元処理を行うデータ復元部14、マスクテ
ーブルファイル22の入力を行うマスクテーブルロード
部15から構成される。
As shown in FIG. 1, the database management system 10 for executing the data compression method according to the embodiment of the present invention operates according to the input / output request of the database record of the database file 19 used by the application program 11 to perform the database management. A controller 12 for controlling the inside of the system, a data compressing unit 13 for compressing database records, a data restoring unit 14 for restoring database records, and a mask table loading unit 15 for inputting a mask table file 22.

【0016】また、使用するマスクテーブルファイル2
2は、レコード規定管理ファイル20をもとにコンパイ
ラ21により作成され、ファイル内容はデータベースマ
ネジメントシステム10の開始時に、マスクテーブルロ
ード部15によってマスクテーブル常駐エリア18に常
駐化される。
The mask table file 2 to be used
2 is created by the compiler 21 based on the record regulation management file 20, and the file contents are made resident in the mask table resident area 18 by the mask table loading unit 15 at the start of the database management system 10.

【0017】図3は、データベースレコードのレコード
フォーマット、およびデータ形式を規定するレコード規
定管理ファイル20に設定されているレコード形式の一
例をもとに、コンパイラ21に入力し、オブジェクト形
式データに変換後、マスクテーブル23がマスクテーブ
ルファイル22に作成される手順を示したものである。
FIG. 3 shows an example of the record format of the database record and the record format set in the record regulation management file 20 that regulates the data format, which is input to the compiler 21 and converted into object format data. , The mask table 23 is shown in the mask table file 22.

【0018】この図3の例では、コンパイラにより内部
10進形式(パック形式10進データ)20aに対して
は00…0Cの形式で、外部10進形式(ゾーン形式1
0進データ)20bに対しては、F0F0…の形式で、
文字形式(文字列データ)20cに対しては、4040
…の形式で、漢字形式(日本語列データ)20dに対し
ては、A1A1…の形式でマスクテーブルは設定され
る。
In the example of FIG. 3, the compiler uses the format 00 ... 0C for the internal decimal format (pack format decimal data) 20a and the external decimal format (zone format 1).
For 0b data) 20b, in the format of F0F0 ...
4040 for the character format (character string data) 20c
The mask table is set in the format A1A1 ... For the kanji format (Japanese string data) 20d in the format.

【0019】このようにして、データベースレコードの
レコードフォーマット、およびデータ形式を規定するレ
コード規定管理ファイル20に設定されているレコード
形式をコンパイラに入力することにより簡単にマスクテ
ーブルを作成できる。
In this way, the mask table can be easily created by inputting the record format of the database record and the record format set in the record regulation management file 20 that regulates the data format to the compiler.

【0020】また、データベースレコードを処理するア
プリケーションプログラムの作成で使用するレコードフ
ォーマット規定部分のソースプログラムをそのまま使用
し、言語に応じた初期値を設定することにより、データ
ベースレコードを処理するアプリケーションプログラム
とデータベースファイルのズレを防止できる。
Further, by using the source program of the record format defining part used for creating the application program for processing the database record as it is, and setting the initial value according to the language, the application program and the database for processing the database record are set. You can prevent the files from shifting.

【0021】図4は、アプリケーションプログラム11
から格納要求されたデータベースレコード(以下、レコ
ードと略す)の一例を用いて、データ圧縮する処理過程
を説明するためのものである。
FIG. 4 shows an application program 11
This is for explaining the process of data compression by using an example of a database record (hereinafter abbreviated as a record) requested to be stored by the.

【0022】アプリケーションプログラム11内に確保
されたレコード受け渡しエリア16内にセットされたレ
コードデータ16aに対して、マスクテーブル23で排
他的論理和をとると、レコードデータ16aとマスクテ
ーブル23間で同一の値をもつ全てのデータ項目部分が
減算されゼロの値となり、結果はレコード受渡しエリア
16のマスク済みレコードデータ16bの内容となる。
The exclusive OR of the record data 16a set in the record passing area 16 secured in the application program 11 by the mask table 23 is the same between the record data 16a and the mask table 23. All data item parts having a value are subtracted to give a value of zero, and the result becomes the contents of the masked record data 16b in the record passing area 16.

【0023】そして、そのマスク済みレコードデータ1
6bをもとに、連続した同一文字の部分を圧縮制御情報
(文字と長さ)に置換し、また不連続部分の先頭にも非
圧縮制御情報(長さ)を設定し、レコード入出力エリア
17に圧縮レコードデータ17aをセットし、その圧縮
レコードデータ17aをデータベースファイル19へ格
納する。
Then, the masked record data 1
Based on 6b, the consecutive same character parts are replaced with compression control information (character and length), and non-compression control information (length) is set at the beginning of the discontinuous part. The compressed record data 17a is set in 17, and the compressed record data 17a is stored in the database file 19.

【0024】次に、図5は、図4の説明で使用したレコ
ードの一例を用いて、データベースファイル19に格納
された圧縮レコードデータ17aを読み出し、データ圧
縮部分を元のレコードデータ16aの内容に復元し、ア
プリケーションプログラム11に渡す処理過程を説明す
るためのものである。
Next, FIG. 5 reads the compressed record data 17a stored in the database file 19 by using the example of the record used in the description of FIG. 4, and replaces the data compression portion with the contents of the original record data 16a. This is for explaining the process of restoring and passing it to the application program 11.

【0025】データベースファイル19から読み出され
たレコード入出力エリア17内の圧縮レコードデータ1
7aの圧縮制御情報と非圧縮制御情報をもとに、連続同
一文字圧縮の場合は、圧縮制御情報内の文字をその長さ
分に拡張し、それ以外の場合は非圧縮制御情報内の長さ
分の非圧縮データ部分そのままを、レコード受け渡しエ
リア16にセットする。
Compressed record data 1 in the record input / output area 17 read from the database file 19
Based on the compression control information and the non-compression control information of 7a, in the case of continuous identical character compression, the characters in the compression control information are expanded to that length, and in other cases, the length in the non-compression control information is expanded. The uncompressed data portion corresponding to the size is set in the record passing area 16 as it is.

【0026】すなわち、レコード受渡しエリア16に圧
縮レコードデータ17aを圧縮制御情報および非圧縮情
報より変換した変換レコードデータ16cとしてセット
する。なお、このときの変換レコードデータ16cはマ
スク済みレコードデータ16bと同一のデータ内容とな
る。
That is, the compressed record data 17a is set in the record delivery area 16 as the converted record data 16c converted from the compression control information and the non-compression information. The converted record data 16c at this time has the same data content as the masked record data 16b.

【0027】そして、その変換レコードデータ16cに
対して、格納時に使用したマスクテーブル23で排他的
論理和をとると、変換レコードデータ16cのゼロの値
の全ての部分にマスクテーブルの値が加算され、結果は
レコード受渡しエリア16の復元レコードデータ16d
に示すように圧縮前のレコードデータ16aの内容に復
元され、その復元レコードデータ16dをアプリケーシ
ョンプログラム11へ渡す。
When the conversion table data 16c is subjected to exclusive OR with the mask table 23 used at the time of storage, the values of the mask table are added to all the zero values of the conversion record data 16c. , The result is the restored record data 16d in the record passing area 16
As shown in (4), the contents of the record data 16a before compression are restored, and the restored record data 16d is passed to the application program 11.

【0028】図6は、本実施例のデータ圧縮の処理手順
のを示したフローチャートであり、図4をもとにして説
明する。
FIG. 6 is a flow chart showing a processing procedure of data compression of this embodiment, which will be described with reference to FIG.

【0029】アプリケーションプログラム11から格納
要求されたレコード受渡しエリア16のレコードデータ
16aの内容をもとに対応するマスクテーブル23を決
定する(ステップ100)。ここで決定したマスクテー
ブル23を用いてレコード受け渡しエリア16のレコー
ドデータ16aの内容に対し、1命令で256バイトづ
つの排他的論理和を実行する(ステップ110)。
The corresponding mask table 23 is determined based on the contents of the record data 16a in the record delivery area 16 requested to be stored by the application program 11 (step 100). Using the mask table 23 determined here, the exclusive OR of 256 bytes is executed by one instruction for the contents of the record data 16a in the record passing area 16 (step 110).

【0030】この実行結果のレコード受け渡しエリア1
6のレコードデータ16bをもとに、1命令で256バ
イトづつ連続同一文字を検索(ステップ120)、2バ
イト以上の連続同一文字を検出した場合は(ステップ1
30)、同一文字の連続する部分の長さを求め(ステッ
プ140)この文字と長さをもとに圧縮制御情報を作成
し、レコード入出力エリア17にセット(ステップ15
0)する。
Record passing area 1 of this execution result
Based on the record data 16b of No. 6, the continuous identical character is searched for 256 bytes each by one command (step 120). When the continuous identical character of 2 bytes or more is detected (step 1
30), the length of the continuous portion of the same character is obtained (step 140), compression control information is created based on this character and the length, and set in the record input / output area 17 (step 15).
0)

【0031】連続同一文字がない場合は(ステップ13
0)、不連続文字部分の長さをもとに非圧縮制御情報を
作成し、非圧縮データ部分をレコード入出力エリア17
にセットする(ステップ160)。
If there is no continuous identical character (step 13
0), non-compression control information is created based on the length of the discontinuous character portion, and the non-compressed data portion is recorded in the record input / output area 17
(Step 160).

【0032】次に、ステップ120からステップ160
までをマスク済みレコードデータ16bの検索が終了す
るまで繰返し、検索終了時には、レコード入出力エリア
の圧縮レコードデータ17aをセットし、その内容をデ
ータベースファイル19へ格納(ステップ170)し要
求元へリターンする。
Next, steps 120 to 160
The above steps are repeated until the search for the masked record data 16b is completed. At the end of the search, the compressed record data 17a in the record input / output area is set, the contents are stored in the database file 19 (step 170), and the process is returned to the request source. .

【0033】図7は、本実施例のデータ復元の処理手順
を示したフローチャートであり、図5をもとにして説明
する。
FIG. 7 is a flow chart showing a processing procedure of data restoration of the present embodiment, which will be described with reference to FIG.

【0034】アプリケーションプログラム11からのデ
ータベースレコード読み出し要求をもとに、データベー
スファイル19から圧縮レコードデータ17aをレコー
ド入出力エリア17へ読み出す(ステップ200)、こ
の内容をもとに対応するマスクテーブルを決定する(ス
テップ210)、レコード入出力エリア17内の圧縮レ
コードデータ17aの先頭から圧縮制御情報、または非
圧縮制御情報を検索し(ステップ220)、圧縮制御情
報の場合は(ステップ230)、圧縮制御情報内の文字
をその長さ分に拡張し、レコード受渡しエリア16ヘセ
ットする(ステップ240)。
Based on a database record read request from the application program 11, the compressed record data 17a is read from the database file 19 to the record input / output area 17 (step 200), and the corresponding mask table is determined based on this content. (Step 210), the compression control information or the non-compression control information is searched from the beginning of the compressed record data 17a in the record input / output area 17 (step 220). In the case of compression control information (step 230), the compression control is performed. The characters in the information are expanded to that length and set in the record passing area 16 (step 240).

【0035】非圧縮制御情報の場合は(ステップ23
0)、非圧縮制御情報内の長さ分の非圧縮データ部分を
そのままレコード受渡しエリア16へセットする。
In the case of non-compression control information (step 23
0), the uncompressed data portion of the length in the uncompressed control information is set as it is in the record passing area 16.

【0036】ステップ220からステップ250までを
レコード入出力エリア17の圧縮レコードデータ17a
が終了まで繰返し、検索終了時には、レコード受渡しエ
リア16の変換レコードデータ16cに対して先に決定
したマスクテーブル23を用いて、1命令で256バイ
トづつの排他的論理和を実行する(ステップ260)。
この実行結果は、レコード受渡しエリア16の復元レコ
ードデータ16dとなる。
The compressed record data 17a in the record input / output area 17 is executed from step 220 to step 250.
Is repeated until the end, and at the end of the search, an exclusive OR of 256 bytes is executed by one instruction using the mask table 23 previously determined for the converted record data 16c in the record passing area 16 (step 260). .
The result of this execution is the restored record data 16d in the record passing area 16.

【0037】そして、この復元レコードデータ16d
は、元のレコードデータ16aと同一のものであり、要
求元へリターン時、この復元レコードデータ16dが要
求元へ渡される。
Then, the restored record data 16d
Is the same as the original record data 16a, and when returning to the request source, the restored record data 16d is passed to the request source.

【0038】以上説明したように、本発明によれば、レ
コード件数が多く、レコード内のデータ項目数が多い大
規模データベースシステムにおいて、データベースレコ
ード内に内部10進形式等の初期値データ項目が多数存
在している場合は、これら全てのデータ項目部分をデー
タ圧縮するため、データベースレコード長が大幅に短縮
され、データベースファイルを格納する外部記憶装置容
量の大幅な削減となる。
As described above, according to the present invention, in a large-scale database system in which the number of records is large and the number of data items in a record is large, a large number of initial value data items such as internal decimal format are included in a database record. If it exists, data compression is performed on all of these data item portions, so the database record length is greatly reduced, and the external storage device capacity for storing the database file is significantly reduced.

【0039】このため、データベースレコード格納時と
読み出し時のデータ転送時間も大幅な削減となる。
Therefore, the data transfer time at the time of storing and reading the database record can be greatly reduced.

【0040】そして、圧縮されたデータベースレコード
から圧縮される前のデータベースレコードに復元する場
合も、レコード圧縮で行った処理手順を逆にすることで
簡単に復元できる。
When the compressed database record is restored to the database record before being compressed, it can be easily restored by reversing the processing procedure performed in the record compression.

【0041】また、データベースレコードを処理するア
プリケーションプログラムの作成で使用するレコードフ
ォーマット規定部分のソースプログラムをそのまま使用
し、言語に応じた初期値を設定することにより、データ
ベースレコードを処理するアプリケーションプログラム
とデータベースファイルのズレを防止できる。
Further, by using the source program of the record format defining part used for creating the application program for processing the database record as it is and setting the initial value according to the language, the application program and the database for processing the database record are set. You can prevent the files from shifting.

【0042】[0042]

【発明の効果】以上説明したように、本発明によれば、
レコード件数が多く、レコード内のデータ項目数が多い
大規模データベースシステムにおいて、データベースレ
コード内に内部10進形式等の初期値データ項目が多数
存在している場合は、これら全てのデータ項目部分をデ
ータ圧縮するため、データベースレコード長が大幅に短
縮され、データベースファイルを格納する外部記憶装置
容量の大幅な削減となる。
As described above, according to the present invention,
In a large-scale database system with a large number of records and a large number of data items in a record, if there are many initial value data items such as internal decimal format in the database record, all of these data item parts are Because of the compression, the database record length is greatly reduced, and the external storage capacity for storing the database file is also significantly reduced.

【0043】さらにデータベースレコード格納時と読み
出し時のデータ転送時間も大幅な削減となる。
Further, the data transfer time at the time of storing and reading the database record is also greatly reduced.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明を実現するデータベースマネジメントシ
ステムの全体構成を示すブロック図である。
FIG. 1 is a block diagram showing the overall configuration of a database management system that realizes the present invention.

【図2】本発明を実現するハードウエアの構成を示すブ
ロック図である。
FIG. 2 is a block diagram showing a hardware configuration for implementing the present invention.

【図3】本実施例のマスクテーブル作成手順を説明する
ための図である。
FIG. 3 is a diagram for explaining a mask table creation procedure of the present embodiment.

【図4】本実施例のデータ圧縮する処理過程を説明する
ための図である。
FIG. 4 is a diagram for explaining a process of compressing data according to the present embodiment.

【図5】本実施例のデータ復元する処理過程を説明する
ための図である。
FIG. 5 is a diagram for explaining a process of restoring data according to the present embodiment.

【図6】本実施例のデータ圧縮の処理手順を示すフロー
チャートである。
FIG. 6 is a flowchart showing a processing procedure of data compression of the present embodiment.

【図7】本実施例のデータ復元の処理手順を示すフロー
チャートである。
FIG. 7 is a flowchart showing a processing procedure of data restoration of the present embodiment.

【符号の説明】[Explanation of symbols]

10 …データベースマネジメントシステム、 11 …アプリケーションプログラム、 12 …コントローラ、 13 …データ圧縮部、 14 …データ復元部、 15 …マスクテーブルロード部、 16 …レコード受け渡しエリア、 16a…レコードデータ、 16b…マスク済みレコードデータ、 16c…変換レコードデータ、 16d…復元レコードデータ、 17 …レコード入出力エリア、 17a…圧縮レコードデータ、 18 …マスクテーブル常駐エリア、 19 …データベースファイル、 20 …レコード規定管理ファイル、 21 …コンパイラ、 22 …マスクテーブルファイル、 23 …マスクテーブル。 31 …入出力装置 32 …中央処理装置 33 …主記憶装置 34 …外部記憶装置 10 ... Database management system, 11 ... Application program, 12 ... Controller, 13 ... Data compression section, 14 ... Data decompression section, 15 ... Mask table loading section, 16 ... Record passing area, 16a ... Record data, 16b ... Masked record Data, 16c ... Converted record data, 16d ... Decompressed record data, 17 ... Record input / output area, 17a ... Compressed record data, 18 ... Mask table resident area, 19 ... Database file, 20 ... Record regulation management file, 21 ... Compiler, 22 ... Mask table file, 23 ... Mask table. 31 ... Input / output device 32 ... Central processing unit 33 ... Main storage device 34 ... External storage device

フロントページの続き (72)発明者 川崎 良文 神奈川県横浜市中区尾上町6丁目81番地 日立ソフトウェアエンジニアリング株式会 社内 (72)発明者 堀江 正久 神奈川県横浜市中区尾上町6丁目81番地 日立ソフトウェアエンジニアリング株式会 社内 (72)発明者 外山 雄司 神奈川県横浜市中区尾上町6丁目81番地 日立ソフトウェアエンジニアリング株式会 社内 (72)発明者 岩戸 丈典 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア開発本部内 (72)発明者 野上 敬文 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア開発本部内(72) Inventor Yoshifumi Kawasaki 6-81 Onoe-cho, Naka-ku, Yokohama-shi, Kanagawa Hitachi Software Engineering Co., Ltd. (72) Masahisa Horie 6-81 Onoe-cho, Naka-ku, Yokohama, Hitachi Hitachi Software Engineering Stock Company In-house (72) Inventor Yuji Toyama 6-81 Onoue-cho, Naka-ku, Yokohama-shi, Kanagawa Hitachi Software Engineering Stock Company In-house (72) Inori Takenori Iwato 5030 Totsuka-cho, Totsuka-ku Yokohama-shi Hitachi, Ltd. (72) Inventor Takafumi Nogami 5030 Totsuka-cho, Totsuka-ku, Yokohama-shi, Kanagawa Incorporated company Hitachi Ltd. Software Development Headquarters

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 データベースマネージメントシステムに
おけるデータベースレコードの圧縮方法であって、レコ
ードフォーマットが固定のデータベースレコードに対し
て、前記データベースレコード内のデータ形式に応じた
初期値で設定されたマスクテーブルを作成して、1デー
タベースレコード単位に格納されるデータベースレコー
ドのデータと前記マスクテーブルとの排他的論理和をと
り、前記データベースレコード内の初期値項目部分に対
応するビットをオフにして連続同一文字列を作り、前記
データベースレコードのデータにおける連続同一文字列
がある位置に連続同一文字列に関する情報をもつ圧縮情
報を置換し、前記データベースレコードのデータをビッ
トオフにならなかった残りのデータベースレコードのデ
ータと圧縮情報とからなるデータベースレコードのデー
タに圧縮することを特徴としたデータベースレコードの
圧縮方法。
1. A method of compressing a database record in a database management system, wherein a mask table is created for a database record having a fixed record format with an initial value according to a data format in the database record. Then, the exclusive OR of the data of the database record stored in the unit of one database record and the mask table is taken, and the bit corresponding to the initial value item part in the database record is turned off to make a continuous identical character string. , Replacing the compression information having the information on the continuous identical character string at the position where the continuous identical character string is present in the data of the database record, and compressing the data of the remaining database record that did not bit off the data of the database record And A method of compressing a database record, characterized by compressing the data of a database record consisting of
【請求項2】 請求項1に記載のデータベースレコード
の圧縮方法によって、圧縮されたデータベースレコード
が格納されている外部記憶装置上のデータベースファイ
ルから圧縮されたデータベースレコードを読み出し、こ
のデータベースファイルから読み出したデータベースレ
コード内の圧縮情報に置換された位置に圧縮情報をもと
に連続同一文字を置換し、データベースレコードのデー
タ圧縮時と同一のマスクテーブルとの排他的論理和をと
り対応するビットをオンにし、データ圧縮前のデータベ
ースレコードに復元することを特徴としたデータベース
レコードの復元方法。
2. The method for compressing a database record according to claim 1, wherein a compressed database record is read from a database file on an external storage device in which the compressed database record is stored and read from this database file. The same character is continuously replaced based on the compression information at the position where it was replaced with the compression information in the database record, and the corresponding bit is turned on by performing an exclusive OR with the same mask table as when compressing the data in the database record. , A method for restoring a database record, characterized by restoring the database record before data compression.
【請求項3】 請求項1、または請求項2に記載のデー
タベースレコードの圧縮方法または復元方法において、
前記マスクテーブルの作成は、データベースレコードを
処理するアプリケーションプログラムの作成で使用する
レコードフォーマット規定部分のソースプログラムをそ
のまま使用し、言語に応じた初期値データをもとに行わ
れることを特徴としたデータベースレコードの圧縮方法
または復元方法。
3. The method of compressing or decompressing a database record according to claim 1 or 2,
The database is characterized in that the mask table is created based on the initial value data according to the language by using the source program of the record format defining part used in creating the application program for processing the database record as it is. How to compress or decompress records.
JP5126734A 1993-05-28 1993-05-28 How to compress and decompress database records Expired - Fee Related JP2790594B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5126734A JP2790594B2 (en) 1993-05-28 1993-05-28 How to compress and decompress database records

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5126734A JP2790594B2 (en) 1993-05-28 1993-05-28 How to compress and decompress database records

Publications (2)

Publication Number Publication Date
JPH06337762A true JPH06337762A (en) 1994-12-06
JP2790594B2 JP2790594B2 (en) 1998-08-27

Family

ID=14942573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5126734A Expired - Fee Related JP2790594B2 (en) 1993-05-28 1993-05-28 How to compress and decompress database records

Country Status (1)

Country Link
JP (1) JP2790594B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226411B1 (en) 1997-01-31 2001-05-01 Fujitsu Limited Method for data compression and restoration
US6947944B1 (en) 1999-04-26 2005-09-20 Denso Corporation Database managing apparatus and database record retrieving apparatus
JP2013519141A (en) * 2010-02-04 2013-05-23 パーストリーム ゲーエムベーハー Method and system for compressing data records and processing compressed data records

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62186619A (en) * 1986-02-12 1987-08-15 Nec Corp Data compression system
JPH056260A (en) * 1991-06-27 1993-01-14 Nec Corp Japanese data compressing system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62186619A (en) * 1986-02-12 1987-08-15 Nec Corp Data compression system
JPH056260A (en) * 1991-06-27 1993-01-14 Nec Corp Japanese data compressing system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226411B1 (en) 1997-01-31 2001-05-01 Fujitsu Limited Method for data compression and restoration
US6947944B1 (en) 1999-04-26 2005-09-20 Denso Corporation Database managing apparatus and database record retrieving apparatus
JP2013519141A (en) * 2010-02-04 2013-05-23 パーストリーム ゲーエムベーハー Method and system for compressing data records and processing compressed data records
US9805045B2 (en) 2010-02-04 2017-10-31 Parstream Gmbh Method and system for compressing data records and for processing compressed data records

Also Published As

Publication number Publication date
JP2790594B2 (en) 1998-08-27

Similar Documents

Publication Publication Date Title
EP0293161B1 (en) Character processing system with spelling check function
JPH07200247A (en) Equipment and method for data compression
JPS62212849A (en) Data file system
KR20000069633A (en) File processing method, data processing device, and storage medium
US6112208A (en) Data compressing method and apparatus to generate bit maps in accordance with extracted data symbols
JPH06337762A (en) Compressing method and restoring method for data base record
JP5709903B2 (en) METHOD, SYSTEM, COMPUTER PROGRAM, RECORDING MEDIUM, DATA STORAGE MEDIUM STORING DATA COLLECTION, AND CALL DATA RECORDING SYSTEM FOR COMPRESSING DATA RECORD AND PROCESSING COMPRESSED DATA RECORD
JPH04360246A (en) Device for compressing file
JP2863370B2 (en) File compression encryption processor
JPH03247167A (en) Data compression system
JP3104302B2 (en) Data compression device
JPH06290021A (en) Method for compressing source program
JP3186530B2 (en) How to compress and expand computer data
JPH0628150A (en) Method for compressing program capacity
JP2943900B2 (en) Data compression processing device, data decompression processing device, data compression processing method, and data decompression processing method for data file
JP3708318B2 (en) Data compression / decompression apparatus and data compression / decompression method
JP2000105717A (en) Device and method for file storage control
JP3442105B2 (en) Data compression and decompression methods
JPH0844551A (en) Information processor
JP3152772B2 (en) Image data restoration device
JP2639776B2 (en) File compression method
JPH0264770A (en) Data compression-restoring system with dictionary
JPH0563583A (en) Data compression and decoding method and backup method in electronic exchange using said method
JPH05265416A (en) Image information transmission system
JPH08147139A (en) Data processor

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080612

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080612

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090612

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100612

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100612

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110612

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees