JPS607557A - 文字型デ−タの区分化圧縮法 - Google Patents

文字型デ−タの区分化圧縮法

Info

Publication number
JPS607557A
JPS607557A JP58115613A JP11561383A JPS607557A JP S607557 A JPS607557 A JP S607557A JP 58115613 A JP58115613 A JP 58115613A JP 11561383 A JP11561383 A JP 11561383A JP S607557 A JPS607557 A JP S607557A
Authority
JP
Japan
Prior art keywords
data item
separator
key
data
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58115613A
Other languages
English (en)
Other versions
JPH0335697B2 (ja
Inventor
Katsumi Hayashi
克己 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58115613A priority Critical patent/JPS607557A/ja
Publication of JPS607557A publication Critical patent/JPS607557A/ja
Publication of JPH0335697B2 publication Critical patent/JPH0335697B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、文字型データの区分化圧縮法、特にデータベ
ースのインデックスを作成する際に用いられる文字型デ
ータの区分化圧縮法に関するものである。
〔従来技術と問題点〕
区分化圧縮法は、可変長文字テキスト・キー又はこれが
複合キーを構成するときのインデックス作成において、
データ圧縮を能率よく行うものである。データベース管
理システムのインデックス部に用いられる区分化圧縮さ
れたキーは、単一の文字キーと形式上同じに扱えうるの
で、前・方圧縮を施した後、インデックス部に格納され
る。
従来の文字型データの区分化圧縮法では、最小値となる
コードの圧縮にしか適用することができず、このため文
字型データならブランクよりも小さいコードの存在が許
されなかった。また、nullのデータ項目を取扱うこ
とが出来なかった。
〔発明の目的〕
本発明は、上記の考察に基づくものであって、null
のデータ項目を扱い得ると共に、圧縮対象をレコードの
最小値のものと仮定する必要のない文字型データの区分
化圧縮法を提供することを目的としている。
〔発明の構成〕
そしてそのため、本発明の文字型データの区分化圧縮法
は、複数の文字型データのデータ項目をキーとして有す
る複合キーをデータ項目毎に指定された長さの区間に区
分し、区分点にセパレータを挿入し、セパレータに前後
の状況によって定まる値を与える文字型データの区分化
圧縮法であって、データ項目を区分するに際してデータ
項目表が指定区間長の整数倍でない場合には埋込み文字
で埋めると共に、データ項目がnullである場合には
これを指定区間長の所定コードで表現すると共K(−の
後にセパレータを配置し、セパレータがデータ項目の途
中に存在し且つ次の最初のブランク以外の文字がブラン
クよジ小であるか、セパレータがデータ項目の途中に存
在し且つ次の最初のブランク以外の文字がブランクよυ
大であるか、セパレータがデータ項目の最後に存在し且
つ仄のデータ項目がnullでないか、セパレータがデ
ータ項目の最終区間に存在し且つ次のデータ項目がnu
llであるか、対応するデータ項目がnullであるか
を判断し、判断結果に応じた特有値をセパレータに与え
ることを特徴とするものである。
〔発明の実施例〕
以下、本発明を図面を参照しつつ説明する。
第1図はキーの圧縮を説明する図、第2図は本発明が適
用されるデータベース管理システムの1例を示すもので
ある。
第1図(イ)は完全キーを示すものである。完全キーは
、キーA1キーB及びキーPより構成されている。キー
AおよびキーBはレコードのデータ項目であり、キーP
はアドレスである。キーAのキー長は50字としている
。nullとは、そのデータ項目の値が未決定であるこ
とを示している。
第1図(ロ)は、区分化圧縮を説明するものである。
キーAは区間4で圧縮され、キーBは区間3であり圧縮
しないものとしている。ψは−(ブランク)より小さい
コードとしている。ブランクはEBCDICコードでは
16進数で40”なる値を有している。第1図(ロ)に
おいて、四角枠口は、区分化のセパレータを示している
。区分化セパレータの、制御ビットは、下記のような値
を持つ。
■ 途中区間;次の最初のブランク以外の文字がブラン
クより小の場合はOF。
■ 最終区間;次の項目がnullでない場合はBt。
■ 最終区間;次の項目がnullである場合はCt。
■ 途中区間;次のブランク以外の文字がブランクより
大きい場合はCF。
■対応するキーがnullのときはFF。
なお、tは有効な文字数を示している。
第1図の(ロ)の(1)は、第1図(イ)の(1)のキ
ーに対して区分化圧縮を施したものである。キーAを区
間4で圧縮すると、rLIONJと「Lψ」との間に最
初のセパレータが入る。次の最初のブランク以外の文字
はψであり、ψはブランクより小さい値をもつので、最
初のセパレータは「OF」なる値をもつ。次の区間はU
ψであり、2文字しかないので口で埋め「口ψw LJ
 Jとする。この区間はキーAの最終区間であジ、有効
な文字は最初の2文字であるので、第2番目のセパレー
タは「B2」なる値をもつ。キーBは桁数3であり、区
分化圧縮を行わないので、第3番目のセパレータは「B
3」なる値をもつ。第1図(イ)の(2)、 (3)、
 (4)も同様に区分化圧縮される。
第1図の完全キーの大きさの順序は次のようにして定め
られる。まずキーAで大きさの順序を定め、キーAで大
きさの順序が決まらなかった場合にはキーBで大きさの
順序を定め、キーBで定葦らなかった場合にはキーPで
大きさの順序を定める。なお、長さの異なるキーは後ろ
にUをPaddingにして同じ長さとし、比較するも
のとする。第1図(0)において、(4〕の区分化圧縮
キーの第1区間は、FFFFFFFFなる値をもつので
(1)ないし■の中で最も大きいものとされる。(1)
、(2)、(3)の区分化圧縮キーの第1区間は共にr
LIONJであるので、第1査目のセパレータの値をみ
て大小関係を決めることを試みる。(1)の区分化圧縮
キーの第1@目のセパレータroFJ、(2)の区分化
圧縮キーの第1番目のセパレータは「C4」、(3)の
区分化圧縮キーの第1番目のセパレータはrCFJであ
るので、(11,(2]、 (310区分化圧縮キーの
大きさの順序は(3ン、 (2)、 (11となる。
第1図(ハ)は前方圧縮を説明するものである。第1図
(ハ)において、第1桁目は残9文字数を示し、第2桁
目は第何番目の文字から省略されていないかを示してい
る。第1図(ロ)の(1)の区分化圧縮キーの前方圧縮
の結果は、その前との区分化圧縮キーとの比較で定まる
ので、図には示されていない。
第2図は本発明が適用されるデータベース管理システム
の構成を示す図である。
第2図において、1はコントローラ、2はデータベース
、3はインテックス部、4はエンコーダ、5もエンニー
1−16nテコーダ、74)デコーダ、8はアクセッサ
、9は制御線、10はノくス、11はデータ線、12は
入出力インタフェースをそれぞれ示している。エンコー
ダ4は第1図(ロ)で説明したような区分化圧縮を行う
ものであり、エンコーダ5は第1図(ハ)で説明したよ
うな前方圧縮を行うものである。デコーダ6はエンコー
ダ4の逆の処理を行うものであり、デコーダ7はエンコ
ーダ5の逆の処理を行うものである。
入出力インタフェース12を介してコントローラ1に送
られて来たデータは、コントローラ1の制御の下でエン
コーダ4によって区分化圧縮され、更にエンコーダ5を
介して前方圧縮のためのマツチングを介しながらインデ
ックス部3上のデータを探す。インデックス部3には、
区分化圧縮された後に前方圧縮された形でキーと当該キ
ーを有するデータベース2上のレコードのアドレスとの
組が入っている。これによって得られたレコードのアド
レスがバス10を介してアクセッサ8に送られ、データ
ベース2からの目的レコードがデータ線11、バス10
およびコントローラ1を介して入出力インタフェース1
2に送られる。レコードな力fだにデータベース2に格
納する際には、アクセッサ8によってアドレスを決め、
入出力インフッニー7.12、コントローラ1、ノ(ス
10およびデータ庫]1経由でデータベース2にレコー
ドを格納すると共に、このアドレスとキーとをノくス1
0、エンコーダ4およびエンコーダ5を介して区分化圧
縮、前方圧縮を行い、インデックス部3へ格納する。ま
た、一定キー範囲に属するレコードを順次取9出すとき
には、デコーダ7、デコーダ6、バスlOおよびコント
ローラ1の経路か利用される。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、nu
llデータ項目を扱い得ること及び圧縮対象をコードの
最小値のものと仮足する8吸がないこと等の効果を奏す
ることが出来る。
【図面の簡単な説明】
第1図はキーの圧縮を説明する図、第2図れY本発明が
適用されるデータベース管理システムσ)1例を示すも
のである。 1・・・コントローラ、2・・・データベー ス、3・
・・インデックス部、4・・・エンコーダ、5・・・エ
ンコータ“、6・・・デコーダ、7・・・デコーダ、8
・・・アクセッサ、9・・・制御線、10・・・ノくス
、11・・・データ線、12・・・入出力インタフェー
スO 特許出願人 富士通株式会社 代理人弁理士 京 谷 四 部 才 1 図 (イ) △ B P (1) L T−01,j L−φ −JA−100(
2) LION null ’15 (3) l l ON −IL−X−1,−1210(
4) 礼μI21 ヒND 3o。 (ロ) (l> LION口7.−φ−−区旦、バー1m、6Q
 I 0 0(2ン LT−ON[口]4 FFFFF
F口、、o 、o 95(3)LION口 メー日−−
、=口OZ t 。 tに”−rb /6 (2)ロロロFF FF FF口o o q !(3)
四国「レー×1日−一−1330Z 10(4)ロ田丁
FFF’FF汗ロ丘−D口oao。 欠2図

Claims (1)

    【特許請求の範囲】
  1. 複数の文字型データのデータ項目をキーとして有する複
    合キーをデータ項目毎に指定された長さの区間に区分し
    、区分点にセパレータを挿入し、セパレータに前後の状
    況によって定まる値を与える文字型データの区分化圧縮
    法であって、データ項目を区分する際に際してデータ項
    目長が指定区間長の整数倍でない場合には埋込み文字で
    埋めると共IC、データ項目がnullである場合には
    これを指定区間長の所定コードで表現すると共にその後
    にセパレータを配置し、セパレータがデータ項目の途中
    に存在し且つ次の最初のブランク以外の文字がブランク
    より小であるか、セパレータがデータ項目の途中に存在
    し且つ次の最初のブランク以外の文字がブランクより大
    であるか、セパレータがデータ項目の最後に存在し且つ
    次のデータ項目がnullでないか、ぜパレータがデー
    ′夕項目の最終区間に存在し且つ次のデータ項目がnu
    llであるか、対応するデータ項目がnullであるか
    を判断し、判断結果に応じた特有値をセパレータに与え
    ることを特徴とする文字型データの区分化圧縮法。
JP58115613A 1983-06-27 1983-06-27 文字型デ−タの区分化圧縮法 Granted JPS607557A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58115613A JPS607557A (ja) 1983-06-27 1983-06-27 文字型デ−タの区分化圧縮法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58115613A JPS607557A (ja) 1983-06-27 1983-06-27 文字型デ−タの区分化圧縮法

Publications (2)

Publication Number Publication Date
JPS607557A true JPS607557A (ja) 1985-01-16
JPH0335697B2 JPH0335697B2 (ja) 1991-05-29

Family

ID=14666981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58115613A Granted JPS607557A (ja) 1983-06-27 1983-06-27 文字型デ−タの区分化圧縮法

Country Status (1)

Country Link
JP (1) JPS607557A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62131348A (ja) * 1985-12-04 1987-06-13 Panafacom Ltd マルチインデツクスフアイルアクセス方式
JPH06243009A (ja) * 1992-12-08 1994-09-02 Microsoft Corp 全テキストインデックスを圧縮する方法
JP2009080833A (ja) * 2000-11-30 2009-04-16 Coppereye Ltd データベース

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62131348A (ja) * 1985-12-04 1987-06-13 Panafacom Ltd マルチインデツクスフアイルアクセス方式
JPH06243009A (ja) * 1992-12-08 1994-09-02 Microsoft Corp 全テキストインデックスを圧縮する方法
JP2009080833A (ja) * 2000-11-30 2009-04-16 Coppereye Ltd データベース

Also Published As

Publication number Publication date
JPH0335697B2 (ja) 1991-05-29

Similar Documents

Publication Publication Date Title
US5864860A (en) Compression of structured data
CN109359276A (zh) 一种防伪码生成方法、装置、设备及存储介质
JPS607557A (ja) 文字型デ−タの区分化圧縮法
US6173281B1 (en) Method and computer program product for processing and combining data sets including bitmaps
JP2636806B2 (ja) インデックス更新方式
JP2753228B2 (ja) データ処理装置
JPH03206533A (ja) データ圧縮方式
JPS63305439A (ja) 類似デ−タファイルの圧縮格納方法および復元方法
JPH05216799A (ja) 名前管理方式
JP2738287B2 (ja) 分散型データベースのファイル抽出システム
JP3186530B2 (ja) コンピュータデータの圧縮・伸長方法
JP2596332B2 (ja) データ組合せ抽出方法およびその装置
JP2658097B2 (ja) 二次ファイル作成方式
JP2734826B2 (ja) 自然言語解釈方法
JP2005157718A (ja) データ管理システム、データ管理システム用プログラム、及びデータ管理システム用プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH06162096A (ja) レコード検索方法
JPH0497451A (ja) データの関連付けによるファイルデータ処理方式
JPS63149728A (ja) 索引生成方式
JPH03288967A (ja) データベース処理システム
JPH01258122A (ja) データ形式変換方式
JPH01246643A (ja) エラーメッセージ出力方式
JPS63296147A (ja) デ−タ圧縮処理方式
JPS63225824A (ja) 集合演算方式
JPH05165604A (ja) ソートワークファイルスペース管理方式
JPS60104373A (ja) 文字処理装置