JPH02130630A - 符号化方法、符号化装置、及び復号化装置 - Google Patents

符号化方法、符号化装置、及び復号化装置

Info

Publication number
JPH02130630A
JPH02130630A JP1212135A JP21213589A JPH02130630A JP H02130630 A JPH02130630 A JP H02130630A JP 1212135 A JP1212135 A JP 1212135A JP 21213589 A JP21213589 A JP 21213589A JP H02130630 A JPH02130630 A JP H02130630A
Authority
JP
Japan
Prior art keywords
field
string
data
empty
bytes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1212135A
Other languages
English (en)
Other versions
JPH087669B2 (ja
Inventor
Daniel Rodman Hicks
ダニエル・ロツドマン・ヒツクス
Gary R Ricard
ガリイ・ロズ・リカード
John J Vriezen
ジヨン・ジヨセフ・ブリーゼン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH02130630A publication Critical patent/JPH02130630A/ja
Publication of JPH087669B2 publication Critical patent/JPH087669B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/22Arrangements for sorting or merging computer data on continuous record carriers, e.g. tape, drum, disc
    • G06F7/24Sorting, i.e. extracting data from one or more carriers, rearranging the data in numerical or other ordered sequence, and rerecording the sorted data on the original carrier or on a different carrier or set of carriers sorting methods in general

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 本発明はレコードをソート可能にするデータ・レコード
の符号化に関する。
B、従来技術 データベースの英数字レコードは、可変長及び空のフィ
ールドで構成することができる。照合前に可変長フィー
ルドを簡単に連結することができないのは、長いフィー
ルドの文字が、すぐ後の短いフィールドと干渉し、これ
によって正しいソート順序を破壊することがあるからで
ある。たとえば、rFranzlFredJ及びrFr
anzensFredJという名前を考えてみる。単純
な連結を使用した場合、rFRANZFRED」及びr
FRANZENFREDJというストリングが生じるが
、ラスト・ネームが長いrFRANZENFREDJが
rFRANZFRED」よりも前に照合される。これが
正しくないことは、明らかである。また、データベース
操作言語、構造化照会言語(SQL)は空フィールドの
概念を定義している。空フィールドは、ソートされたと
き、実際の値を有している他のフィールドよりも前に配
置されなければならない。また、空フィールドは、ソー
トされたとき、すべてゼロからなるフィールドよりも前
に配置されなければならない。すべてゼロよりも低い順
序のバイト列は存在しないから、空を表わす符号化方法
を提供しなければならない。さらに、この符号化手法は
、rFt’anZiFredJ −rFranzens
 FreaJの名前を正しく照合する方法を提供しなけ
ればならない。複数のレコード間での正しいソート順序
を保ちながら、データベース・レコード内で可変長及び
空のデータ・フィールドを表わす単一のストリングを提
供する方法が望ましい。この符号化アルゴリズムは可逆
であって、当初のフィールドを符号化したストリングか
ら回復できるようなものでもなければならない。
C1発明が解決しようとする問題点 IBMテクニカル・ディスク−ジャ・プルテンVo 1
.19、No、9.1977年2月、3582−358
3ページ「無制限ストリングのマルチフィールドの符号
化J  (Multifield EncodfngF
or Unrestricted Strings)に
示されているような現在の事前ソート符号化手法に関連
した問題の1つは、結果として得られる符号化されたス
トリングがきわめて長くなるというものである。この方
法では、整数値パラメータNが選択される。符号化の対
照となるフィールドには、2進ゼロが埋め込まれるので
、その長さはNの倍数となる。2つのフィールドのスト
リングを符号化するには、ストリングの各Nバイトを単
一の「トリガ」文字(この場合は“FF’Xである)に
よって分離する。次いで、フィールドの最後のNバイト
のサブストリング(すなわち、何らかの埋込みが行なわ
れるサブストリング)を処理する場合には、1FF’X
の代わりに、このサブストリングの非理込み文字の数を
示すバイトが付加される。これはフィールドの終りを示
す。上記したところ、及び以下の例かられかるように、
符号化されたストリングには、余分なバゲージが充填さ
れる。データが主記憶に対してページ・イン、ページ・
アウトされる環境において、ソート操作には長い時間が
かかるが、これはページが比較的遅い記憶装置から検索
しなければならない多くのページに分散しているからで
ある。2つのフィールドrABCDEFJとrXYZJ
を符号化すルノニ、N=4と仮定し、連結を示すために
r//J  Cr//Jは実際のデータには現われない
)を使用すると、英数字データを表現するEBCDIC
18進すなわち16を底とする表記で、r’c1c2c
3c4°//“FF”//’C5C6“//”0000
”//” 02 ”//’ E6E7E8 ’//” 
00°//“03′」となる。この符号化手法は空フィ
ールドを処理しない。
D3問題点を解決するための手段 単純なバイトの比較によって結果として得られるデータ
のストリングのソートを可能とする、データ・バイトの
複数の空または可変長のフィールドからなるデータ・レ
コードの符号化方法が提供される。最初のフィールドを
検証し、これが空フィールドであるかどうかを判断する
。空フィールドとはデータを含んでいないフィールドで
ある。このフィールドは、すべてゼロであっても何らか
のデータを含んでいるフィールドの前にソートされなけ
ればならない。空フィールドが検出された場合には、こ
れは空フィールド標識によって、符号化されたデータの
ストリング中に表示される。フィールドが空フィールド
でない場合には、フィールド内のバイトが調べられる。
ゼロ値のバイトは連続するゼロ値のバイトの数に基づい
て符号化され、非ゼロ・バイトは符号化されたストリン
グに直接入れられる。フィールドの終りの標識は、符号
化されたデータの結果として得られるストリング内の各
フィールドの終りを示す。
好ましい実施例の1つにおいて、非ゼロのバイトはその
正しいコードによって表わされる。空位は°oooo’
xcte進値)によって表わされる。単一の’oo’x
または連続したこのようなバイトは、フィールドの符号
化された表示において、遭遇した゛oo′xバイトの数
を表わすバイトが後に続<’oo’xバイトによって置
換される。フィールドの最後のバイトが処理されたのち
、フィールドの終りw識’oooi“Xがフィールドの
符号化された表示に付加される。
空位を含めることは、空位をサポートするデータベース
に関して符号化されたストリングで、正しいソート順序
を維持するという利点を提供する。
空及びフィールドの終り標識の16進値がそれぞれ、?
0000°X及び°ooo ioXであるから、ゼロを
“0Oaa’Xと表示する必要がある。
raaJは連続したゼロ・バイトの数を表わすものであ
るoraaJは’02’Xと’FF’Xの間の値を取る
。ゼロのストリングが2つの16進バイトに圧縮される
という、他の利点がある。
レコードは最初のレコードとしてrABCDEF」、「
WXY 」、第2のレコードとして「ABCDEF’ 
 J、rMNOP」などの1つまたは複数のフィールド
からなることが好ましい。ソートを行なう場合、これら
が上記と同じ順序でソートされるのが好ましいが、レコ
ードのフィールドを単純に連結した場合、これらは逆の
順序でソートされる。というのは、レコード2のフィー
ルド1の末尾に由来するブランクは、レコード1のフィ
ールド2のrWJ前に来るからである。本発明の手法を
使用すると、rABCDEFJ、rWXY  JはrC
IC2C3C4C5C60001E6E7E84000
01Jと符号化される。
rABCDEF、J、rMNOPJはrc1c2C3C
4C5C6400001D4D5D6D70001Jと
符号化される。2つのEBCDICの符号をソートする
と、これらは望ましい順序を維持する。通常、符号化さ
れたストリングを記憶するのに必要なスペースが、周知
の方法で得られる符号化されたストリングよりも少なく
なることも、明らかである。これは従来の方法が埋込み
ゼロを付加し、非理込みバイト標識のフィールドまたは
長さ内で分離符号を使用していることの結果である。
E、実施例 本発明のブロック図を第1図に示す。12にあるデータ
はソート操作16以前に、14で符号化される。データ
は通常、データベース20に関連したデータであり、デ
ータベースの照会であっても、データベース20に追加
されるデータであってもかまわない。データベース2o
は複数の可変長フィールドを有するレコードからなって
いる。
データは16で適切にソートされるように14で符号化
される。符号化されたデータは次いで、データベース2
0を対象とするインデックスに挿入されるか、あるいは
照会の場合であれば、インデックスを探索するために使
用される。インデックス及びデータベースに対するこれ
らの関係は、本明細書に参照文献として組み込まれる米
国特許第4774657号明細書「インデックス・キー
範囲推定装置」に詳細に記載されている。基本的に、デ
ータベースに対するインデックスは、各レコードの選択
されたフィールドに基づいてソートされる、データベー
スのレコードに対するポインタの集合体である。1つの
フィールドが動物の名前である動物のデータベースが、
−例である。インデックスは名前のフィールドに基づく
アルファベット順のリストである。鳥(Bird)は牛
(Cow )の前に来る。他のフィールドは重さ、種な
どを含むことができる。
符号化したデータを18で復号し、22の入出力装置に
表示することができる。入出力装置22を使用して、照
会及びデータを入力し、復号部18からの復号されたデ
ータを表示できる。符号化された形にインデックスを維
持することによって、符号化された形の照会のための探
索ストリングが、インデックスを探索するために使用さ
れる。フィールドの境界を取り扱うのに、インデックス
管理プログラムに特別なプログラミングが必要ないのは
、これらの境界がソートを可能にするように符号化され
ているからである。したがって、可変長多重フィールド
・レコードを、従来のレコードを取り扱うのとまったく
同じに扱うことができる。
レコードについて、以下に詳細に説明する。各レコード
は、最初のレコードとしてrABCDEF」、「WXY
 」1、第2のレコードとして「ABCDEF  J、
rMNOPJなどの1つまたは複数の可変長フィールド
からなることが好ましい。
ソートを行なう場合、これらが上記と同じ順序でソート
されるのが好ましいが、レコードのフィールドを単純に
連結した(端と端をつないだ)場合、これらは逆の順序
でソートされる。レコード2のフィールド1のブランク
はレコード1のフィールド2のrWJよりも前に照合さ
れるが、これはブランクのEBCDIC表現の16進数
がより小さいからである。ソート前に本発明の手法を使
用すると、rABCDEFJ 、rWXY  JはrC
IC2C3C4C5C60001E13E7E8400
001」と符号化され、rABCDEF  J、rMN
OPJはrc1c2c3c4c5c6400001D4
D5D6D70001Jと符号化される。2つのEBC
DIC符号をソートした場合、これらは希望する順序を
維持する。
好マしい実施例の1つにおいて、非ゼロのバイトはその
通常のコードで表わされる。空位は“0000’X(1
6進値)で表わされる。単一の” oo ’ xまたは
このようなバイトの列は、フィールドの符号化された表
記では、遭遇した“00“Xバイトの数を表わすバイト
が後ろについた100°Xバイトで置換される。フィー
ルドの最後のバイトが処理された後、フィールドの終り
の標識“0001vXがフィールドの符号化された表記
に付け加えられる。
空位を含めることは、空位をサポートするデータベース
に対する符号化されたストリングにおいて、正しいソー
ト順序を維持することを可能とする。空位及びフィール
ドの終りの標識に使用される16進値がそれぞれ、’o
ooo°X及び1O001’Xであるから、ゼロを0O
aa’Xで表わすことが望ましい。但しraaJは連続
したゼロ・バイトの数を表わし、°02°Xと“FF’
Xの間の値を取る。ゼロのストリングが127バイトの
ゼロごとに2バイトに圧縮されるという利点ももたらさ
れる。
符号化したレコードは、第2図に示すように、すべての
符号化されたフィールドを連結したものである。単一の
フィールドは次のように符号化される。フィールドが空
位を含んでいる場合には、空フィールド標識“oooo
”xがフィールドの符号化された表記となる。これで空
フィールドの符号化は終わる。フィールドが非空の場合
、フィールドの各バイトが調べられる。現在のバイトが
’oo’xでない場合には、それがフィールドの符号化
された表記に付け加えられる。この場合、符号化はフィ
ールドの次のバイトで継続して行なわれる。現在のバイ
トが”oo’xの場合には、現在のバイトから始まる連
続した00“Xバイトの数が決定される。128以上の
連続した°00°Xバイトが存在している場合には、’
0080′Xというバイト列が、127個の連続した’
oo’xバイトのグループごとに、フィールドの符号化
された表記に付け加えられる。これは、残る゛00°X
バイトの数が128未満になるまで行なわれる。残され
た’oo’xバイトの数は、次のステップにおける’o
o’xバイトのカウントとして使用される。
127個以下の連続した′00″Xバイトが存在する場
合、あるいは前のステップでバイトが残っている場合に
は、’oo’xバイトは次のように符号化される。一連
の連続した°00′Xバイトがフィールドの終りにない
場合には、’ 0Onn ’又という列がフィールドの
符号化された表記に付け加えられる。nnの16進値は
、255から連続した100°Xバイトの数を引いたも
ので与えられる。次いで、符号化は連続した°00′X
バイトの直後のバイトを用いて続行される。一連の連続
した゛00゛Xバイトがフィールドの終りにある場合に
は、’ OOmm ’ Xという列がフィールドの符号
化された表記に付け加えられる。mmの16進値は、連
続した°00°Xバイトの数に1を加えたものによって
与えられる。各フィールドの最後のバイトが処理された
後、フィールドの終りの標m’ooo1“Xがフィール
ドの符号化された表記に付け加えられる。これで非空の
フィールドの符号化は完了する。
この符号化によって、空位及びフィールド長の可変性に
かかわりなく、正しく照合される単一のストリングがも
たらされる。次いで、符号化されたデータを容易に記憶
し、インデックスに収めることができる。符号化された
データがインデックスの照会である場合には、インデッ
クスの符号化値を比較するだけですむ。空または可変長
のフィールドを取り扱うのに、特別なプログラミングは
必要ない。ソートまたは照会後、データを復号しなけれ
ばならないが、これには符号化の工程を逆にし、個々の
フィールドを単一の符号化されたストリングから復元す
るだけでよい。
符号化されたストリングを復号する場合、第3図に詳細
に示すように、レコードのストリングの各バイトが調べ
られる。レコードの現在のバイトが°00°Xでない場
合には、それが現在のフィールドの復号された表記に付
け加えられる。現在のバイトが°00゛Xである場合に
は、レコードの次のバイトが調べられる。このバイトが
100“Xである場合には、それが現在のフィールドは
空位を含んでいる。現在のフィールドの復号は、完了す
る。次いで、この°00″Xバイトの次のバイトの復号
が行なわれる。これは次のフィールドの最初のバイトで
ある。最初の’oo’xバイトの次のバイトが’01’
Xであれば、フィールドの終りの標識が発見され、現在
のフィールドは完了する。次いで、復号はこの01“X
バイトの次のバイトに進む。これは次のフィールドの最
初のバイトである。最初の’oo’xバイトの次のバイ
トが’oo”xでも、’01’Xバイトでもなければ、
これはyylすなわち復号されたフィールドに付け加え
なければならない゛oo’xバイトの数の符号化された
カウントを表わす。yyが’80°Xよりも大きければ
、付加される°00゛Xバイトの数は255−Yyとな
る。復号はyyの次のバイトに進む。これは現在のフィ
ールドの次のバイトである。yyが ’80°X以下の場合には、付加される°00゜Xバイ
トの数はyy−1となる。次いで、復号はyyの後のバ
イトへ進む。これは現在のフィールドの次のバイトであ
る。
次の表1は若干のレコードのサンプル、及び本発明によ
るその符号化を示す。レコード内のフィールドはコンマ
によって分離される。
表ル コード 空 “X ’oo’x ’oooo°X ’oooooo’x ’00000001°X ’000001 ’X 符号化 ’oooo°X ’0001°X ’00020001°X ’0O030001’X ’00040001°X ’0OFCO100OI ’X ’0OFDO10001’X ’0001 ’X              ’0O
FEO100OI°X’0002°y、       
       ’0OFEO20001’X’01 ’
X               ’010001°X
” X、 ’0001“x、 ’oo°X      
 ’0OO100FEO1000100020001°
X’00 ’X、 ’0001 ’X        
 ’0002000100FEO]0001°X”AB
CEDF”、  ”WXY ”        ’CI
C2C3C4C5C60001E6E7E840000
1°X “ABCEDF” 、 ”HNOP″        
’CIC2C3C4C5C6400001D4D5D6
D70001’X ”ABCDEFGH”、”IJKL”        
’CIC2C3C4C5C6C7C80001C9DI
D2030001 ’X 第4図及び第5図の流れ図に示すような他の実施例にお
いては、ハードウェアの援助機構を使用して、レコード
の符号化及び復号を行なう。援助機構は指定されたバイ
トに関して、バイトのストリングを走査する。この援助
機構を使用して、’oo’xというストリングをはるか
に高速に処理する。援助機構を使用することによって、
いくつかのプログラムのループが回避される。この上う
な援助機構は通常、識別された文字を迅速に走査するた
めの処理装置で実現されるものであり、照会されたデー
タを探索するのに有用なものである。
本発明を好ましい実施例に関して説明したが、当分野の
技術者には、他の実施例が本発明の範囲に属するもので
あることが認識されよう。たとえば、異なるデータベー
スでは、この空フィールドを異なる順序でソートする必
要があることもある。
空フィールド及び反復するバイト・ストリングの16進
コードの表記を変更することによって、これは簡単に達
成できる。符号化及び復号のほとんどまたはすべてをハ
ードウェアに移し、これを行なう速度を上げることがで
きる。
F4発明の効果 本発明を用いれば、空フィールドまたは可変長フィール
ドを含む複数のフィールドより成るレコードを符号化し
且つ、その符号化したストリングをそのままソートする
ことによりレコードをソートすることができる。
【図面の簡単な説明】
第1図は、符号化の発明の実施形態のブロック図である
。 円で囲まれた文字で示されるように結合される第2a図
ないし第2C図は、第1図の符号化の発明の流れ図であ
る。 円で囲まれた文字で示されるように結合される第3a図
ないし第3b図は、符号化されたレコードの復号の流れ
図である。 円で囲まれた文字で示されるように結合した場合、第4
a図ないし第4b図は、ハードウェアの助けを借りたレ
コードの符号化の流れ図である。 円で囲まれた文字で示されるように結合した場合、第5
a図ないし第5b図は、ハードウェアの助けを借りた符
号化されたレコードの復号の流れ図である。 12・・・・データ、14・・・・符号化部、16・・
・・ソート操作、18・・・・復号部、20・・・・デ
ータベース、22・・・・入出力装置。 @2a図 第1図 gsb図

Claims (5)

    【特許請求の範囲】
  1. (1)フィールドが空フィールドの場合に、空フィール
    ド標識を符号化し、 非空フィールド中の連続したゼロ・バイトの数に基づい
    てゼロ・バイトを符号化し、 非空フィールド中の他のすべてのバイトを直接符号化し
    、 前記フィールドが非空フィールドであることを条件とし
    て、フィールドの終りの標識をデータのストリングに付
    け加える工程からなる、 空フィールドまたはデータ・バイトのフィールドを有し
    うるデータ・レコードを、結果として生じるデータのス
    トリングが単純なバイトの比較によってソート可能とな
    るように符号化する方法。
  2. (2)データ・バイトのフィールドまたは空フィールド
    を有しうるデータ・レコードを、符号化した結果のデー
    タのストリングが単純なバイト比較によりソート可能に
    なるように符号化する装置であって、 上記フィールドが空フィールドの場合、空フィールド標
    識を符号化する手段と、 非空フィールド中の連続したゼロ・バイトの数に基づき
    ゼロ・バイトを符号化する手段と、非空フィールド中の
    他のすべてのバイトを直接符号化する手段と、 上記フィールドが非空フィールドの場合に、データのス
    トリングにフィールド終了標識を付加する手段とを有す
    る 符号化装置。
  3. (3)空フィールドもしくは可変長データ・バイトのフ
    ィールドの表現、またはフィールド終了標識よりなるス
    トリングを復号する装置であって、上記ストリング中の
    表現を識別する手段と、上記ストリング中の表現が空フ
    ィールドを表わす場合、空フィールドを生成する手段と
    、 上記ストリング中に表現された連続したゼロ・バイトの
    数に基づきゼロ・バイトを生成する手段と、 非ゼロ文字に対応する上記ストリング中の表現を直接復
    号する手段と、 上記ストリング中の表現がフィールド終了標識として識
    別されたときは、新しいフィールドを開始する手段とを
    有する 復号装置。
  4. (4)複数の可変長フィールドよりなるデータ・レコー
    ドを、符号化した結果のデータのストリングが単純なバ
    イト比較によりソート可能になるように符号化する装置
    であって、 上記フィールド内の文字を調べる手段と、 各フィールドの終りを検出する手段と、 各フィールド中のすべての文字を符号化して、各フィー
    ルドに関する、符号化された文字の連続したストリング
    を形成する手段と、 符号化されたフィールド内に余分の文字が符号化されな
    いように、符号化されたデータのストリング中の各フィ
    ールドの間にフィールド終了標識を挿入する手段とを有
    する 符号化装置。
  5. (5)データベースに関するデータ・レコードであって
    、空フィールド及び可変長データ・バイトのフィールド
    よりなるレコードを、符号化した結果のデータの、スト
    リングが単純なバイト比較によりソート可能になるよう
    に符号化する装置を含むデータベース・システムであっ
    て、 フィールドが空フィールドかどうかを判定するためにフ
    ィールドを調べる手段と、 上記フィールドが空フィールドの場合に、空フィールド
    標識を符号化する手段と、 フィールドが空フィールドでない場合に、フィールドの
    バイトを調べる手段と、 非空フィールド中の連続したゼロ・バイトの数に基づき
    ゼロ・バイトを符号化する手段と、非空フィールド中の
    他のすべてのバイトを直接符号化する手段と、 上記フィールドが非空フィールドの場合に、データのス
    トリングにフィールド終了標識を付加する手段と、 上記データベースに関するインデックスに、上記符号化
    されたデータ・レコードを提供する手段と、 上記データ・レコードと同じ方式で符号化するために探
    索ストリングを提供する手段と、 符号化された探索ストリングを用いてインデックスを探
    索する手段とを有する データベース・システム。
JP1212135A 1988-11-03 1989-08-19 符号化方法、符号化装置、及び復号化装置 Expired - Lifetime JPH087669B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/266,751 US5001477A (en) 1988-11-03 1988-11-03 Encoding variable length and null data while preserving sort sequence
US266751 1994-06-28

Publications (2)

Publication Number Publication Date
JPH02130630A true JPH02130630A (ja) 1990-05-18
JPH087669B2 JPH087669B2 (ja) 1996-01-29

Family

ID=23015851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1212135A Expired - Lifetime JPH087669B2 (ja) 1988-11-03 1989-08-19 符号化方法、符号化装置、及び復号化装置

Country Status (4)

Country Link
US (1) US5001477A (ja)
EP (1) EP0367704A3 (ja)
JP (1) JPH087669B2 (ja)
BR (1) BR8905590A (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5270712A (en) * 1992-04-02 1993-12-14 International Business Machines Corporation Sort order preserving method for data storage compression
US5394143A (en) * 1993-06-30 1995-02-28 Digital Equipment Corporation Run-length compression of index keys
US5502439A (en) * 1994-05-16 1996-03-26 The United States Of America As Represented By The United States Department Of Energy Method for compression of binary data
US5701125A (en) * 1994-06-15 1997-12-23 The United States Of America As Represented By The United States Department Of Energy Method for compression of data using single pass LZSS and run-length encoding
US5724572A (en) * 1994-11-18 1998-03-03 International Business Machines Corporation Method and apparatus for processing null terminated character strings
US5590324A (en) * 1995-02-07 1996-12-31 International Business Machines Corporation Optimization of SQL queries using universal quantifiers, set intersection, and max/min aggregation in the presence of nullable columns
US5659737A (en) * 1995-08-01 1997-08-19 Oracle Corporation Methods and apparatus for data compression that preserves order by using failure greater than and failure less than tokens
KR100652625B1 (ko) * 2004-03-03 2006-12-06 엘지전자 주식회사 이동통신단말기의 레코드 저장방법
US7587396B2 (en) * 2004-11-24 2009-09-08 Oracle International Corporation Encoding data to be sorted
US7680791B2 (en) * 2005-01-18 2010-03-16 Oracle International Corporation Method for sorting data using common prefix bytes
EP1701502A1 (en) * 2005-03-09 2006-09-13 Research In Motion Limited System, method and apparatus for compressed wireless signalling
US10528557B1 (en) * 2017-12-31 2020-01-07 Allscripts Software, Llc Database methodology for searching encrypted data records
US10528556B1 (en) 2017-12-31 2020-01-07 Allscripts Software, Llc Database methodology for searching encrypted data records

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5696327A (en) * 1979-12-28 1981-08-04 Fujitsu Ltd Record data ordering processing system
JPS58102314A (ja) * 1981-12-15 1983-06-17 Fujitsu Ltd デ−タ圧縮回路

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4645916A (en) * 1983-09-09 1987-02-24 Eltrax Systems, Inc. Encoding method and related system and product
JPS6385823A (ja) * 1986-09-29 1988-04-16 Toshiba Corp マルチキ−・ソ−タ

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5696327A (en) * 1979-12-28 1981-08-04 Fujitsu Ltd Record data ordering processing system
JPS58102314A (ja) * 1981-12-15 1983-06-17 Fujitsu Ltd デ−タ圧縮回路

Also Published As

Publication number Publication date
EP0367704A3 (en) 1992-09-16
BR8905590A (pt) 1990-05-29
JPH087669B2 (ja) 1996-01-29
US5001477A (en) 1991-03-19
EP0367704A2 (en) 1990-05-09

Similar Documents

Publication Publication Date Title
Navarro Wavelet trees for all
Silva de Moura et al. Fast and flexible word searching on compressed text
Brisaboa et al. DACs: Bringing direct access to variable-length codes
US6119120A (en) Computer implemented methods for constructing a compressed data structure from a data string and for using the data structure to find data patterns in the data string
CN102142038B (zh) 用于记号空间资料库的多级查询处理系统与方法
US5450580A (en) Data base retrieval system utilizing stored vicinity feature valves
EP0380240A2 (en) Coded signature indexed databases
EP3336723B1 (en) Multi-level directory tree with fixed superblock and block sizes for select operations on bit vectors
US10417208B2 (en) Constant range minimum query
JPH02130630A (ja) 符号化方法、符号化装置、及び復号化装置
EP0251594A3 (en) Database system for parallel processor
EP0160672A1 (en) Method and apparatus for data compression
US20190171634A1 (en) Accelerated filtering, grouping and aggregation in a database system
US6388585B1 (en) Method for data compression and decompression using decompression instructions
JPH05225238A (ja) データベース検索システム
JPH04326164A (ja) データベース検索システム
Brisaboa et al. Self-indexing natural language
US20060059181A1 (en) Method and system for high speed encoding, processing and decoding of data
US6731229B2 (en) Method to reduce storage requirements when storing semi-redundant information in a database
Petri et al. Efficient indexing algorithms for approximate pattern matching in text
Orlandi et al. Space-efficient substring occurrence estimation
Bell et al. Compressing the digital library
Parker-Rhodes et al. A reduction method for non-arithmetic data, and its application to thesauric translation.
Radhakrishnan Selection of prefix and postfix word fragments for data compression
Böttcher et al. A column-oriented text database api implemented on top of wavelet tries