JPS607557A - 文字型デ−タの区分化圧縮法 - Google Patents
文字型デ−タの区分化圧縮法Info
- Publication number
- JPS607557A JPS607557A JP58115613A JP11561383A JPS607557A JP S607557 A JPS607557 A JP S607557A JP 58115613 A JP58115613 A JP 58115613A JP 11561383 A JP11561383 A JP 11561383A JP S607557 A JPS607557 A JP S607557A
- Authority
- JP
- Japan
- Prior art keywords
- data item
- separator
- key
- data
- compression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分野〕
本発明は、文字型データの区分化圧縮法、特にデータベ
ースのインデックスを作成する際に用いられる文字型デ
ータの区分化圧縮法に関するものである。
ースのインデックスを作成する際に用いられる文字型デ
ータの区分化圧縮法に関するものである。
区分化圧縮法は、可変長文字テキスト・キー又はこれが
複合キーを構成するときのインデックス作成において、
データ圧縮を能率よく行うものである。データベース管
理システムのインデックス部に用いられる区分化圧縮さ
れたキーは、単一の文字キーと形式上同じに扱えうるの
で、前・方圧縮を施した後、インデックス部に格納され
る。
複合キーを構成するときのインデックス作成において、
データ圧縮を能率よく行うものである。データベース管
理システムのインデックス部に用いられる区分化圧縮さ
れたキーは、単一の文字キーと形式上同じに扱えうるの
で、前・方圧縮を施した後、インデックス部に格納され
る。
従来の文字型データの区分化圧縮法では、最小値となる
コードの圧縮にしか適用することができず、このため文
字型データならブランクよりも小さいコードの存在が許
されなかった。また、nullのデータ項目を取扱うこ
とが出来なかった。
コードの圧縮にしか適用することができず、このため文
字型データならブランクよりも小さいコードの存在が許
されなかった。また、nullのデータ項目を取扱うこ
とが出来なかった。
本発明は、上記の考察に基づくものであって、null
のデータ項目を扱い得ると共に、圧縮対象をレコードの
最小値のものと仮定する必要のない文字型データの区分
化圧縮法を提供することを目的としている。
のデータ項目を扱い得ると共に、圧縮対象をレコードの
最小値のものと仮定する必要のない文字型データの区分
化圧縮法を提供することを目的としている。
そしてそのため、本発明の文字型データの区分化圧縮法
は、複数の文字型データのデータ項目をキーとして有す
る複合キーをデータ項目毎に指定された長さの区間に区
分し、区分点にセパレータを挿入し、セパレータに前後
の状況によって定まる値を与える文字型データの区分化
圧縮法であって、データ項目を区分するに際してデータ
項目表が指定区間長の整数倍でない場合には埋込み文字
で埋めると共に、データ項目がnullである場合には
これを指定区間長の所定コードで表現すると共K(−の
後にセパレータを配置し、セパレータがデータ項目の途
中に存在し且つ次の最初のブランク以外の文字がブラン
クよジ小であるか、セパレータがデータ項目の途中に存
在し且つ次の最初のブランク以外の文字がブランクよυ
大であるか、セパレータがデータ項目の最後に存在し且
つ仄のデータ項目がnullでないか、セパレータがデ
ータ項目の最終区間に存在し且つ次のデータ項目がnu
llであるか、対応するデータ項目がnullであるか
を判断し、判断結果に応じた特有値をセパレータに与え
ることを特徴とするものである。
は、複数の文字型データのデータ項目をキーとして有す
る複合キーをデータ項目毎に指定された長さの区間に区
分し、区分点にセパレータを挿入し、セパレータに前後
の状況によって定まる値を与える文字型データの区分化
圧縮法であって、データ項目を区分するに際してデータ
項目表が指定区間長の整数倍でない場合には埋込み文字
で埋めると共に、データ項目がnullである場合には
これを指定区間長の所定コードで表現すると共K(−の
後にセパレータを配置し、セパレータがデータ項目の途
中に存在し且つ次の最初のブランク以外の文字がブラン
クよジ小であるか、セパレータがデータ項目の途中に存
在し且つ次の最初のブランク以外の文字がブランクよυ
大であるか、セパレータがデータ項目の最後に存在し且
つ仄のデータ項目がnullでないか、セパレータがデ
ータ項目の最終区間に存在し且つ次のデータ項目がnu
llであるか、対応するデータ項目がnullであるか
を判断し、判断結果に応じた特有値をセパレータに与え
ることを特徴とするものである。
以下、本発明を図面を参照しつつ説明する。
第1図はキーの圧縮を説明する図、第2図は本発明が適
用されるデータベース管理システムの1例を示すもので
ある。
用されるデータベース管理システムの1例を示すもので
ある。
第1図(イ)は完全キーを示すものである。完全キーは
、キーA1キーB及びキーPより構成されている。キー
AおよびキーBはレコードのデータ項目であり、キーP
はアドレスである。キーAのキー長は50字としている
。nullとは、そのデータ項目の値が未決定であるこ
とを示している。
、キーA1キーB及びキーPより構成されている。キー
AおよびキーBはレコードのデータ項目であり、キーP
はアドレスである。キーAのキー長は50字としている
。nullとは、そのデータ項目の値が未決定であるこ
とを示している。
第1図(ロ)は、区分化圧縮を説明するものである。
キーAは区間4で圧縮され、キーBは区間3であり圧縮
しないものとしている。ψは−(ブランク)より小さい
コードとしている。ブランクはEBCDICコードでは
16進数で40”なる値を有している。第1図(ロ)に
おいて、四角枠口は、区分化のセパレータを示している
。区分化セパレータの、制御ビットは、下記のような値
を持つ。
しないものとしている。ψは−(ブランク)より小さい
コードとしている。ブランクはEBCDICコードでは
16進数で40”なる値を有している。第1図(ロ)に
おいて、四角枠口は、区分化のセパレータを示している
。区分化セパレータの、制御ビットは、下記のような値
を持つ。
■ 途中区間;次の最初のブランク以外の文字がブラン
クより小の場合はOF。
クより小の場合はOF。
■ 最終区間;次の項目がnullでない場合はBt。
■ 最終区間;次の項目がnullである場合はCt。
■ 途中区間;次のブランク以外の文字がブランクより
大きい場合はCF。
大きい場合はCF。
■対応するキーがnullのときはFF。
なお、tは有効な文字数を示している。
第1図の(ロ)の(1)は、第1図(イ)の(1)のキ
ーに対して区分化圧縮を施したものである。キーAを区
間4で圧縮すると、rLIONJと「Lψ」との間に最
初のセパレータが入る。次の最初のブランク以外の文字
はψであり、ψはブランクより小さい値をもつので、最
初のセパレータは「OF」なる値をもつ。次の区間はU
ψであり、2文字しかないので口で埋め「口ψw LJ
Jとする。この区間はキーAの最終区間であジ、有効
な文字は最初の2文字であるので、第2番目のセパレー
タは「B2」なる値をもつ。キーBは桁数3であり、区
分化圧縮を行わないので、第3番目のセパレータは「B
3」なる値をもつ。第1図(イ)の(2)、 (3)、
(4)も同様に区分化圧縮される。
ーに対して区分化圧縮を施したものである。キーAを区
間4で圧縮すると、rLIONJと「Lψ」との間に最
初のセパレータが入る。次の最初のブランク以外の文字
はψであり、ψはブランクより小さい値をもつので、最
初のセパレータは「OF」なる値をもつ。次の区間はU
ψであり、2文字しかないので口で埋め「口ψw LJ
Jとする。この区間はキーAの最終区間であジ、有効
な文字は最初の2文字であるので、第2番目のセパレー
タは「B2」なる値をもつ。キーBは桁数3であり、区
分化圧縮を行わないので、第3番目のセパレータは「B
3」なる値をもつ。第1図(イ)の(2)、 (3)、
(4)も同様に区分化圧縮される。
第1図の完全キーの大きさの順序は次のようにして定め
られる。まずキーAで大きさの順序を定め、キーAで大
きさの順序が決まらなかった場合にはキーBで大きさの
順序を定め、キーBで定葦らなかった場合にはキーPで
大きさの順序を定める。なお、長さの異なるキーは後ろ
にUをPaddingにして同じ長さとし、比較するも
のとする。第1図(0)において、(4〕の区分化圧縮
キーの第1区間は、FFFFFFFFなる値をもつので
(1)ないし■の中で最も大きいものとされる。(1)
、(2)、(3)の区分化圧縮キーの第1区間は共にr
LIONJであるので、第1査目のセパレータの値をみ
て大小関係を決めることを試みる。(1)の区分化圧縮
キーの第1@目のセパレータroFJ、(2)の区分化
圧縮キーの第1番目のセパレータは「C4」、(3)の
区分化圧縮キーの第1番目のセパレータはrCFJであ
るので、(11,(2]、 (310区分化圧縮キーの
大きさの順序は(3ン、 (2)、 (11となる。
られる。まずキーAで大きさの順序を定め、キーAで大
きさの順序が決まらなかった場合にはキーBで大きさの
順序を定め、キーBで定葦らなかった場合にはキーPで
大きさの順序を定める。なお、長さの異なるキーは後ろ
にUをPaddingにして同じ長さとし、比較するも
のとする。第1図(0)において、(4〕の区分化圧縮
キーの第1区間は、FFFFFFFFなる値をもつので
(1)ないし■の中で最も大きいものとされる。(1)
、(2)、(3)の区分化圧縮キーの第1区間は共にr
LIONJであるので、第1査目のセパレータの値をみ
て大小関係を決めることを試みる。(1)の区分化圧縮
キーの第1@目のセパレータroFJ、(2)の区分化
圧縮キーの第1番目のセパレータは「C4」、(3)の
区分化圧縮キーの第1番目のセパレータはrCFJであ
るので、(11,(2]、 (310区分化圧縮キーの
大きさの順序は(3ン、 (2)、 (11となる。
第1図(ハ)は前方圧縮を説明するものである。第1図
(ハ)において、第1桁目は残9文字数を示し、第2桁
目は第何番目の文字から省略されていないかを示してい
る。第1図(ロ)の(1)の区分化圧縮キーの前方圧縮
の結果は、その前との区分化圧縮キーとの比較で定まる
ので、図には示されていない。
(ハ)において、第1桁目は残9文字数を示し、第2桁
目は第何番目の文字から省略されていないかを示してい
る。第1図(ロ)の(1)の区分化圧縮キーの前方圧縮
の結果は、その前との区分化圧縮キーとの比較で定まる
ので、図には示されていない。
第2図は本発明が適用されるデータベース管理システム
の構成を示す図である。
の構成を示す図である。
第2図において、1はコントローラ、2はデータベース
、3はインテックス部、4はエンコーダ、5もエンニー
1−16nテコーダ、74)デコーダ、8はアクセッサ
、9は制御線、10はノくス、11はデータ線、12は
入出力インタフェースをそれぞれ示している。エンコー
ダ4は第1図(ロ)で説明したような区分化圧縮を行う
ものであり、エンコーダ5は第1図(ハ)で説明したよ
うな前方圧縮を行うものである。デコーダ6はエンコー
ダ4の逆の処理を行うものであり、デコーダ7はエンコ
ーダ5の逆の処理を行うものである。
、3はインテックス部、4はエンコーダ、5もエンニー
1−16nテコーダ、74)デコーダ、8はアクセッサ
、9は制御線、10はノくス、11はデータ線、12は
入出力インタフェースをそれぞれ示している。エンコー
ダ4は第1図(ロ)で説明したような区分化圧縮を行う
ものであり、エンコーダ5は第1図(ハ)で説明したよ
うな前方圧縮を行うものである。デコーダ6はエンコー
ダ4の逆の処理を行うものであり、デコーダ7はエンコ
ーダ5の逆の処理を行うものである。
入出力インタフェース12を介してコントローラ1に送
られて来たデータは、コントローラ1の制御の下でエン
コーダ4によって区分化圧縮され、更にエンコーダ5を
介して前方圧縮のためのマツチングを介しながらインデ
ックス部3上のデータを探す。インデックス部3には、
区分化圧縮された後に前方圧縮された形でキーと当該キ
ーを有するデータベース2上のレコードのアドレスとの
組が入っている。これによって得られたレコードのアド
レスがバス10を介してアクセッサ8に送られ、データ
ベース2からの目的レコードがデータ線11、バス10
およびコントローラ1を介して入出力インタフェース1
2に送られる。レコードな力fだにデータベース2に格
納する際には、アクセッサ8によってアドレスを決め、
入出力インフッニー7.12、コントローラ1、ノ(ス
10およびデータ庫]1経由でデータベース2にレコー
ドを格納すると共に、このアドレスとキーとをノくス1
0、エンコーダ4およびエンコーダ5を介して区分化圧
縮、前方圧縮を行い、インデックス部3へ格納する。ま
た、一定キー範囲に属するレコードを順次取9出すとき
には、デコーダ7、デコーダ6、バスlOおよびコント
ローラ1の経路か利用される。
られて来たデータは、コントローラ1の制御の下でエン
コーダ4によって区分化圧縮され、更にエンコーダ5を
介して前方圧縮のためのマツチングを介しながらインデ
ックス部3上のデータを探す。インデックス部3には、
区分化圧縮された後に前方圧縮された形でキーと当該キ
ーを有するデータベース2上のレコードのアドレスとの
組が入っている。これによって得られたレコードのアド
レスがバス10を介してアクセッサ8に送られ、データ
ベース2からの目的レコードがデータ線11、バス10
およびコントローラ1を介して入出力インタフェース1
2に送られる。レコードな力fだにデータベース2に格
納する際には、アクセッサ8によってアドレスを決め、
入出力インフッニー7.12、コントローラ1、ノ(ス
10およびデータ庫]1経由でデータベース2にレコー
ドを格納すると共に、このアドレスとキーとをノくス1
0、エンコーダ4およびエンコーダ5を介して区分化圧
縮、前方圧縮を行い、インデックス部3へ格納する。ま
た、一定キー範囲に属するレコードを順次取9出すとき
には、デコーダ7、デコーダ6、バスlOおよびコント
ローラ1の経路か利用される。
以上の説明から明らかなように、本発明によれば、nu
llデータ項目を扱い得ること及び圧縮対象をコードの
最小値のものと仮足する8吸がないこと等の効果を奏す
ることが出来る。
llデータ項目を扱い得ること及び圧縮対象をコードの
最小値のものと仮足する8吸がないこと等の効果を奏す
ることが出来る。
第1図はキーの圧縮を説明する図、第2図れY本発明が
適用されるデータベース管理システムσ)1例を示すも
のである。 1・・・コントローラ、2・・・データベー ス、3・
・・インデックス部、4・・・エンコーダ、5・・・エ
ンコータ“、6・・・デコーダ、7・・・デコーダ、8
・・・アクセッサ、9・・・制御線、10・・・ノくス
、11・・・データ線、12・・・入出力インタフェー
スO 特許出願人 富士通株式会社 代理人弁理士 京 谷 四 部 才 1 図 (イ) △ B P (1) L T−01,j L−φ −JA−100(
2) LION null ’15 (3) l l ON −IL−X−1,−1210(
4) 礼μI21 ヒND 3o。 (ロ) (l> LION口7.−φ−−区旦、バー1m、6Q
I 0 0(2ン LT−ON[口]4 FFFFF
F口、、o 、o 95(3)LION口 メー日−−
、=口OZ t 。 tに”−rb /6 (2)ロロロFF FF FF口o o q !(3)
四国「レー×1日−一−1330Z 10(4)ロ田丁
FFF’FF汗ロ丘−D口oao。 欠2図
適用されるデータベース管理システムσ)1例を示すも
のである。 1・・・コントローラ、2・・・データベー ス、3・
・・インデックス部、4・・・エンコーダ、5・・・エ
ンコータ“、6・・・デコーダ、7・・・デコーダ、8
・・・アクセッサ、9・・・制御線、10・・・ノくス
、11・・・データ線、12・・・入出力インタフェー
スO 特許出願人 富士通株式会社 代理人弁理士 京 谷 四 部 才 1 図 (イ) △ B P (1) L T−01,j L−φ −JA−100(
2) LION null ’15 (3) l l ON −IL−X−1,−1210(
4) 礼μI21 ヒND 3o。 (ロ) (l> LION口7.−φ−−区旦、バー1m、6Q
I 0 0(2ン LT−ON[口]4 FFFFF
F口、、o 、o 95(3)LION口 メー日−−
、=口OZ t 。 tに”−rb /6 (2)ロロロFF FF FF口o o q !(3)
四国「レー×1日−一−1330Z 10(4)ロ田丁
FFF’FF汗ロ丘−D口oao。 欠2図
Claims (1)
- 複数の文字型データのデータ項目をキーとして有する複
合キーをデータ項目毎に指定された長さの区間に区分し
、区分点にセパレータを挿入し、セパレータに前後の状
況によって定まる値を与える文字型データの区分化圧縮
法であって、データ項目を区分する際に際してデータ項
目長が指定区間長の整数倍でない場合には埋込み文字で
埋めると共IC、データ項目がnullである場合には
これを指定区間長の所定コードで表現すると共にその後
にセパレータを配置し、セパレータがデータ項目の途中
に存在し且つ次の最初のブランク以外の文字がブランク
より小であるか、セパレータがデータ項目の途中に存在
し且つ次の最初のブランク以外の文字がブランクより大
であるか、セパレータがデータ項目の最後に存在し且つ
次のデータ項目がnullでないか、ぜパレータがデー
′夕項目の最終区間に存在し且つ次のデータ項目がnu
llであるか、対応するデータ項目がnullであるか
を判断し、判断結果に応じた特有値をセパレータに与え
ることを特徴とする文字型データの区分化圧縮法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58115613A JPS607557A (ja) | 1983-06-27 | 1983-06-27 | 文字型デ−タの区分化圧縮法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58115613A JPS607557A (ja) | 1983-06-27 | 1983-06-27 | 文字型デ−タの区分化圧縮法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS607557A true JPS607557A (ja) | 1985-01-16 |
JPH0335697B2 JPH0335697B2 (ja) | 1991-05-29 |
Family
ID=14666981
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58115613A Granted JPS607557A (ja) | 1983-06-27 | 1983-06-27 | 文字型デ−タの区分化圧縮法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS607557A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62131348A (ja) * | 1985-12-04 | 1987-06-13 | Panafacom Ltd | マルチインデツクスフアイルアクセス方式 |
JPH06243009A (ja) * | 1992-12-08 | 1994-09-02 | Microsoft Corp | 全テキストインデックスを圧縮する方法 |
JP2009080833A (ja) * | 2000-11-30 | 2009-04-16 | Coppereye Ltd | データベース |
-
1983
- 1983-06-27 JP JP58115613A patent/JPS607557A/ja active Granted
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62131348A (ja) * | 1985-12-04 | 1987-06-13 | Panafacom Ltd | マルチインデツクスフアイルアクセス方式 |
JPH06243009A (ja) * | 1992-12-08 | 1994-09-02 | Microsoft Corp | 全テキストインデックスを圧縮する方法 |
JP2009080833A (ja) * | 2000-11-30 | 2009-04-16 | Coppereye Ltd | データベース |
Also Published As
Publication number | Publication date |
---|---|
JPH0335697B2 (ja) | 1991-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5864860A (en) | Compression of structured data | |
CN109359276A (zh) | 一种防伪码生成方法、装置、设备及存储介质 | |
JPS607557A (ja) | 文字型デ−タの区分化圧縮法 | |
US6173281B1 (en) | Method and computer program product for processing and combining data sets including bitmaps | |
JP2636806B2 (ja) | インデックス更新方式 | |
JP2753228B2 (ja) | データ処理装置 | |
JPH03206533A (ja) | データ圧縮方式 | |
JPS63305439A (ja) | 類似デ−タファイルの圧縮格納方法および復元方法 | |
JPH05216799A (ja) | 名前管理方式 | |
JP2738287B2 (ja) | 分散型データベースのファイル抽出システム | |
JP3186530B2 (ja) | コンピュータデータの圧縮・伸長方法 | |
JP2596332B2 (ja) | データ組合せ抽出方法およびその装置 | |
JP2658097B2 (ja) | 二次ファイル作成方式 | |
JP2734826B2 (ja) | 自然言語解釈方法 | |
JP2005157718A (ja) | データ管理システム、データ管理システム用プログラム、及びデータ管理システム用プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH06162096A (ja) | レコード検索方法 | |
JPH0497451A (ja) | データの関連付けによるファイルデータ処理方式 | |
JPS63149728A (ja) | 索引生成方式 | |
JPH03288967A (ja) | データベース処理システム | |
JPH01258122A (ja) | データ形式変換方式 | |
JPH01246643A (ja) | エラーメッセージ出力方式 | |
JPS63296147A (ja) | デ−タ圧縮処理方式 | |
JPS63225824A (ja) | 集合演算方式 | |
JPH05165604A (ja) | ソートワークファイルスペース管理方式 | |
JPS60104373A (ja) | 文字処理装置 |