JP7426907B2 - 高度なデータベース圧縮解除 - Google Patents
高度なデータベース圧縮解除 Download PDFInfo
- Publication number
- JP7426907B2 JP7426907B2 JP2020106075A JP2020106075A JP7426907B2 JP 7426907 B2 JP7426907 B2 JP 7426907B2 JP 2020106075 A JP2020106075 A JP 2020106075A JP 2020106075 A JP2020106075 A JP 2020106075A JP 7426907 B2 JP7426907 B2 JP 7426907B2
- Authority
- JP
- Japan
- Prior art keywords
- compressed
- symbol
- string
- compression
- pair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006837 decompression Effects 0.000 title claims description 49
- 238000007906 compression Methods 0.000 claims description 104
- 230000006835 compression Effects 0.000 claims description 99
- 238000000034 method Methods 0.000 claims description 89
- 230000006870 function Effects 0.000 claims description 50
- 238000003860 storage Methods 0.000 claims description 40
- 239000000872 buffer Substances 0.000 claims description 30
- 239000000284 extract Substances 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 description 38
- 238000013500 data storage Methods 0.000 description 24
- 238000004422 calculation algorithm Methods 0.000 description 22
- 230000002688 persistence Effects 0.000 description 19
- 238000007726 management method Methods 0.000 description 8
- 238000013507 mapping Methods 0.000 description 7
- 230000002085 persistent effect Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000013144 data compression Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000013068 supply chain management Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- WVCHIGAIXREVNS-UHFFFAOYSA-N 2-hydroxy-1,4-naphthoquinone Chemical compound C1=CC=C2C(O)=CC(=O)C(=O)C2=C1 WVCHIGAIXREVNS-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
- H03M13/37—Decoding methods or techniques, not specific to the particular type of coding provided for in groups H03M13/03 - H03M13/35
- H03M13/3761—Decoding methods or techniques, not specific to the particular type of coding provided for in groups H03M13/03 - H03M13/35 using code combining, i.e. using combining of codeword portions which may have been transmitted separately, e.g. Digital Fountain codes, Raptor codes or Luby Transform [LT] codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/221—Column-oriented storage; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/157—Transformation using dictionaries or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9027—Trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0638—Organizing or formatting or addressing of data
- G06F3/064—Management of blocks
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3084—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
- H03M7/3091—Data deduplication
- H03M7/3095—Data deduplication using variable length segments
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3084—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
- H03M7/3097—Grammar codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
- G06F3/0679—Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mathematical Physics (AREA)
Description
本出願は、2019年6月21日に出願したLaschらの米国仮特許出願第62/864,782号、名称「Advanced Database Compression On Modern Hardware」の優先権を主張するものであり、その開示全体を参照により本明細書に組み込む。
いくつかの実装形態において、本発明の主題は、データベース圧縮に関する。データベース圧縮は、データセット内で、ブロックサイズおよびフロントコーディングバケットサイズを有する圧縮文字列辞書を生成することによって遂行され得る。フロントコーディングがブロックサイズとフロントコーディングバケットサイズの組合せを有する辞書内の各文字列に適用され、文字列の複数のフロントコーディングされたバケットを生成し得る。文字列のこれら複数のフロントコーディングされたバケットは、連結され得る。終端文字が文字列の複数のフロントコーディングされたバケット内の文字列のバケットの間に挿入され得る。文字列のこれら複数のフロントコーディングされたバケットは、圧縮され得る。圧縮されたフロントコーディングされたバケットに基づき、辞書内の各文字列に対応する圧縮ブロックの集合が生成され、格納され得る。いくつかの実装形態において、圧縮ブロックの集合内の各ブロックは、バケットヘッダおよび圧縮バケットのシーケンスを含み得る。終端文字は、圧縮されない場合もある。いくつかの実装形態において、各文字列は、文字列終端文字を含むものとしてよく、各文字列終端文字は圧縮される。
いくつかの実装形態において、本発明の主題は、圧縮解除および/または圧縮データへのアクセスを実行するように構成され得る。特に、本発明の主題は、RPFC、BRPFC、およびサンプリングされたBRPFCの圧縮文字列辞書に対する圧縮データアクセス時間、特にextractおよびlocate関数の時間を加速するように構成され得る。アクセス時間を改善するために、extract操作およびlocate操作の異なる部分が実装され得る。
204 データストレージアプリケーション
206 永続層
214~220 コンピューティングコンポーネント
216 フロントコーディング
218 コンピューティングコンポーネント
230 非圧縮状態
232 フロントコーディングされたバケット
234 ブロック
236 圧縮ブロック
240 圧縮状態
300 実験データセット
500 プロセス
600 辞書/文字列圧縮プロセス
604 スーパーブロック
606 再圧縮
608 Re-Pairアルゴリズム
610 単一のRe-Pair文法
612 圧縮ブロック
700 extract関数
710 locate関数
800 プロセス
900 システム
902 クエリ(呼び出し、要求など)
914 論理ブロック決定コンポーネント
916 コンポーネント
922 コンポーネント
1000 ExpandSymbol関数
1100 ベクトル化されたRe-Pair展開アルゴリズム
1102 初期化
1104 branch1およびbranch2
1104a branch1
1104b branch2
1106 条件/述語評価
1108 結果出力
1200 システム
1202 コンピューティングシステム
1204 データストレージアプリケーション
1206 クライアントマシン
1210 ネットワーク接続
1212 永続層
1214 ストレージ
1216 入力/出力コンポーネント
1300 ソフトウェアアーキテクチャ
1302 永続インターフェース
1304 ページバッファ
1306 論理ページ
1314 ページマネージャ
1316 セーブポイントマネージャ
1320 ページ管理モジュール
1322 フリーブロックマネージャ
1324 ページステータス情報
1326 セーブポイントコーディネータ
1340 コンバータコンポーネント
1342 コンバータテーブル
1344 ロガーコンポーネント
1400 システム
1410 プロセッサ
1420 メモリ
1430 ストレージデバイス
1440 入力/出力デバイス
1450 システムバス
1500 プロセス
1600 プロセス
Claims (9)
- コンピュータ実装方法であって、
格納されている圧縮ブロックの集合内の1つまたは複数の圧縮ブロックを、格納されている圧縮ブロックの前記集合内のデータにアクセスする要求に応答して識別するステップと、
フロントコーディングを使用して前記識別された圧縮ブロック内の文字列プレフィックスを圧縮解除するステップと、
Re-Pair圧縮解除を使用して前記識別された圧縮ブロック内の文字列サフィックスを圧縮解除するステップと、
非圧縮データを生成するステップとを含み、
前記Re-Pair圧縮解除は、前記識別された圧縮ブロック内に格納されている前記データに対応する記号ツリー内の各記号を繰り返し展開するステップを含み、
前記1つまたは複数の圧縮ブロックは、辞書内の文字列の1つまたは複数のフロントコーディングされたバケットから生成され、前記1つまたは複数のフロントコーディングされたバケットは、サンプリングされて1つまたは複数のスーパーブロックを形成するように構成され、各1つまたは複数のスーパーブロックは、前記1つまたは複数の圧縮ブロックの圧縮のための共有文法を生成するために圧縮されるように構成され、
前記記号ツリーは、複数のノードを備え、前記複数のノードは、終端文字、非終端文字、およびこれらの任意の組合せを含み、
前記コンピュータ実装方法は、
複数のRe-Pair圧縮解除を並列に実行するステップをさらに含み、
終端文字の数は、所定の数に制限され、各記号の繰り返し展開の回数は、前記所定の数に基づき決定され、
前記Re-Pair圧縮解除は、少なくともextract関数と、locate関数とを用いるもので、
前記extract 関数が、DecodeString関数を呼び出すもので、前記DecodeString関数が、前に復号された文字列をすでに格納している出力バッファ、およびヘッダの後に圧縮バケットを格納している、バケットバッファで呼び出され、前記圧縮バケットのビットがいくつすでに復号されているかを記録し、
前記locate関数が、指定された文字列について圧縮辞書を検索するために、前記圧縮辞書内のバケットのヘッダに対して二分探索を実行し、
前記Re-Pair圧縮解除は、
前記記号ツリー内の各記号に対応するメモリ内のスタック位置を初期化するステップと、
ベクトル命令を使用して、前記記号ツリー内の各記号をストレージから前記メモリ内に同時にロードするステップと、
前記同時にロードされた記号と関連付けられている1つまたは複数の述語を評価することによって、前記記号を前記非圧縮データへと組み合わせるステップと、
前記所定の数を使用して、前記同時にロードするステップと前記組み合わせるステップとを繰り返すステップとを含む、コンピュータ実装方法。 - 圧縮ブロックの前記集合内の各ブロックは、バケットヘッダおよび圧縮バケットのシーケンスを含む請求項1に記載の方法。
- 圧縮ブロックの前記集合内の各ブロックのブロックサイズは、固定サイズおよび可変サイズの少なくとも一方である請求項1に記載の方法。
- 前記1つまたは複数の圧縮ブロックは、Re-Pair圧縮を使用して圧縮される請求項1に記載の方法。
- 少なくとも1つのプログラム可能プロセッサと、
命令を格納する非一時的な機械可読媒体であって、前記命令は、前記少なくとも1つのプログラム可能プロセッサによって実行されたときに、前記少なくとも1つのプログラム可能プロセッサに
格納されている圧縮ブロックの集合内の1つまたは複数の圧縮ブロックを、格納されている圧縮ブロックの前記集合内のデータにアクセスする要求に応答して識別することと、
フロントコーディングを使用して前記識別された圧縮ブロック内の文字列プレフィックスを圧縮解除することと、
Re-Pair圧縮解除を使用して前記識別された圧縮ブロック内の文字列サフィックスを圧縮解除することと、
非圧縮データを生成することと
を含む動作を実行させる、非一時的な機械可読媒体とを備え、
前記Re-Pair圧縮解除は、少なくともextract関数と、locate関数とを用いるもので、
前記extract 関数が、DecodeString関数を呼び出すもので、前記DecodeString関数が、前に復号された文字列をすでに格納している出力バッファ、およびヘッダの後に圧縮バケットを格納している、バケットバッファで呼び出され、前記圧縮バケットのビットがいくつすでに復号されているかを記録し、
前記locate関数が、指定された文字列について圧縮辞書を検索するために、前記圧縮辞書内のバケットのヘッダに対して二分探索を実行し、
前記Re-Pair圧縮解除は、前記識別された圧縮ブロック内に格納されている前記データに対応する記号ツリー内の各記号を繰り返し展開することを含み、
前記1つまたは複数の圧縮ブロックは、辞書内の文字列の1つまたは複数のフロントコーディングされたバケットから生成され、
前記1つまたは複数のフロントコーディングされたバケットは、サンプリングされて1つまたは複数のスーパーブロックを形成するように構成され、
各1つまたは複数のスーパーブロックは、前記1つまたは複数の圧縮ブロックの圧縮のための共有文法を生成するために圧縮されるように構成され、
前記記号ツリーは、複数のノードを備え、前記複数のノードは、終端文字、非終端文字、およびこれらの任意の組合せを含み、
前記動作は、複数のRe-Pair圧縮解除を並列に実行することをさらに含み、
終端文字の数は、所定の数に制限され、各記号の繰り返し展開の回数は、前記所定の数に基づき決定され、
前記Re-Pair圧縮解除は、
前記記号ツリー内の各記号に対応するメモリ内のスタック位置を初期化することと、
ベクトル命令を使用して、前記記号ツリー内の各記号をストレージから前記メモリ内に同時にロードすることと、
前記同時にロードされた記号と関連付けられている1つまたは複数の述語を評価することによって、前記記号を前記非圧縮データへと組み合わせることと、
前記所定の数を使用して、前記同時にロードすることと前記組み合わせることとを繰り返すことと
を含むシステム。 - 圧縮ブロックの前記集合内の各ブロックは、バケットヘッダおよび圧縮バケットのシーケンスを含む請求項5に記載のシステム。
- 圧縮ブロックの前記集合内の各ブロックのブロックサイズは、固定サイズおよび可変サイズの少なくとも一方である請求項5に記載のシステム。
- 前記1つまたは複数の圧縮ブロックは、Re-Pair圧縮を使用して圧縮される請求項5に記載のシステム。
- 命令を格納するコンピュータプログラムであって、前記命令は、少なくとも1つのプログラム可能プロセッサによって実行されたときに、前記少なくとも1つのプログラム可能プロセッサに
格納されている圧縮ブロックの集合内の1つまたは複数の圧縮ブロックを、格納されている圧縮ブロックの前記集合内のデータにアクセスする要求に応答して識別することと、
フロントコーディングを使用して前記識別された圧縮ブロック内の文字列プレフィックスを圧縮解除することと、
Re-Pair圧縮解除を使用して前記識別された圧縮ブロック内の文字列サフィックスを圧縮解除することと、
非圧縮データを生成することとを含む動作を実行させるコンピュータプログラムであって、
前記Re-Pair圧縮解除は、前記識別された圧縮ブロック内に格納されている前記データに対応する記号ツリー内の各記号を繰り返し展開することを含み、
前記1つまたは複数の圧縮ブロックは、辞書内の文字列の1つまたは複数のフロントコーディングされたバケットから生成され、前記1つまたは複数のフロントコーディングされたバケットは、サンプリングされて1つまたは複数のスーパーブロックを形成するように構成され、各1つまたは複数のスーパーブロックは、前記1つまたは複数の圧縮ブロックの圧縮のための共有文法を生成するために圧縮されるように構成され、
前記記号ツリーは、複数のノードを備え、前記複数のノードは、終端文字、非終端文字、およびこれらの任意の組合せを含み、
前記動作は更に、
複数のRe-Pair圧縮解除を並列に実行し、
終端文字の数は、所定の数に制限され、各記号の繰り返し展開の回数は、前記所定の数に基づき決定することを含み、
前記Re-Pair圧縮解除は、少なくともextract関数と、locate関数とを用いるもので、
前記extract 関数が、DecodeString関数を呼び出すもので、前記DecodeString関数が、前に復号された文字列をすでに格納している出力バッファ、およびヘッダの後に圧縮バケットを格納している、バケットバッファで呼び出され、前記圧縮バケットのビットがいくつすでに復号されているかを記録し、
前記locate関数が、指定された文字列について圧縮辞書を検索するために、前記圧縮辞書内のバケットのヘッダに対して二分探索を実行し、
前記Re-Pair圧縮解除は、
前記記号ツリー内の各記号に対応するメモリ内のスタック位置を初期化し、
ベクトル命令を使用して、前記記号ツリー内の各記号をストレージから前記メモリ内に同時にロードし、
前記同時にロードされた記号と関連付けられている1つまたは複数の述語を評価することによって、前記記号を前記非圧縮データへと組み合わせ、
前記所定の数を使用して、前記同時にロードすることと前記組み合わせることとを繰り返す、
コンピュータプログラム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962864782P | 2019-06-21 | 2019-06-21 | |
US62/864,782 | 2019-06-21 | ||
US16/834,839 US11502705B2 (en) | 2019-06-21 | 2020-03-30 | Advanced database decompression |
US16/834,839 | 2020-03-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021002830A JP2021002830A (ja) | 2021-01-07 |
JP7426907B2 true JP7426907B2 (ja) | 2024-02-02 |
Family
ID=71108359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020106075A Active JP7426907B2 (ja) | 2019-06-21 | 2020-06-19 | 高度なデータベース圧縮解除 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11502705B2 (ja) |
EP (1) | EP3754516A1 (ja) |
JP (1) | JP7426907B2 (ja) |
CN (1) | CN112115684A (ja) |
AU (1) | AU2020204057A1 (ja) |
CA (1) | CA3084406A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11514027B2 (en) * | 2019-06-07 | 2022-11-29 | Sap Se | Paged hybrid LOBs |
US11502705B2 (en) * | 2019-06-21 | 2022-11-15 | Sap Se | Advanced database decompression |
US11507274B2 (en) * | 2020-10-22 | 2022-11-22 | Dell Products L.P. | System and method to use dictionaries in LZ4 block format compression |
US11550762B2 (en) | 2021-02-24 | 2023-01-10 | Sap Se | Implementation of data access metrics for automated physical database design |
CN114172521B (zh) * | 2022-02-08 | 2022-05-10 | 苏州浪潮智能科技有限公司 | 一种解压缩芯片验证方法、装置、设备及可读存储介质 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3061278B2 (ja) * | 1988-04-29 | 2000-07-10 | ゼロックスコーポレーション | 可変ビット長コード語のビット長通信方法 |
US5870036A (en) * | 1995-02-24 | 1999-02-09 | International Business Machines Corporation | Adaptive multiple dictionary data compression |
US5729228A (en) * | 1995-07-06 | 1998-03-17 | International Business Machines Corp. | Parallel compression and decompression using a cooperative dictionary |
GB2381358A (en) * | 2000-08-15 | 2003-04-30 | Seagate Technology Llc | Dual mode data compression for operating code |
US7868789B1 (en) * | 2009-06-28 | 2011-01-11 | Sap Ag | Dictionary-based order-preserving string compression for main memory column stores |
US20110249743A1 (en) * | 2010-04-09 | 2011-10-13 | Jie Zhao | Super-block for high performance video coding |
US9792405B2 (en) * | 2013-01-17 | 2017-10-17 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
US10235377B2 (en) | 2013-12-23 | 2019-03-19 | Sap Se | Adaptive dictionary compression/decompression for column-store databases |
JP6531398B2 (ja) * | 2015-01-19 | 2019-06-19 | 富士通株式会社 | プログラム |
US10027984B2 (en) * | 2016-11-30 | 2018-07-17 | Hewlett Packard Enterprise Development Lp | Methods and systems for efficiently reading a data block from a data seglet with compressed data blocks |
US11050436B2 (en) * | 2019-06-21 | 2021-06-29 | Sap Se | Advanced database compression |
US11502705B2 (en) * | 2019-06-21 | 2022-11-15 | Sap Se | Advanced database decompression |
-
2020
- 2020-03-30 US US16/834,839 patent/US11502705B2/en active Active
- 2020-06-17 EP EP20180485.3A patent/EP3754516A1/en active Pending
- 2020-06-18 AU AU2020204057A patent/AU2020204057A1/en active Pending
- 2020-06-19 CA CA3084406A patent/CA3084406A1/en active Pending
- 2020-06-19 JP JP2020106075A patent/JP7426907B2/ja active Active
- 2020-06-22 CN CN202010576927.5A patent/CN112115684A/zh active Pending
-
2022
- 2022-10-14 US US18/046,782 patent/US11962330B2/en active Active
Non-Patent Citations (3)
Title |
---|
Ingo Muller et al.,Adaptive String Dictionary Compression in In-Memory Column-Store Database Systems,Proceedings of the 17th International Conference on Extending Database Technology (EDBT),2014年,p.283-294,http://openproceedings.org/EDBT/2014/paper_25.pdf |
Robert Lasch et al.,Fast & Strong: The Case of Compressed String Dictionaries on Modern CPUs,DaMoN'19: Proceedings of the 15th International Workshop on Data Management on New Hardware July 2019,2019年07月01日,No. 4,https://dl.acm.org/doi/10.1145/3329785.3329924 |
関根 渓 他,大規模テキストに対する共有辞書を用いたRe-Pair圧縮法,第5回データ工学と情報マネジメントに関するフォーラム (第11回日本データベース学会年次大会),日本,2013年,p.1-8,DEIM Forum 2013 C10-2 |
Also Published As
Publication number | Publication date |
---|---|
US20230085457A1 (en) | 2023-03-16 |
CN112115684A (zh) | 2020-12-22 |
JP2021002830A (ja) | 2021-01-07 |
EP3754516A1 (en) | 2020-12-23 |
US20200401405A1 (en) | 2020-12-24 |
CA3084406A1 (en) | 2020-12-21 |
US11962330B2 (en) | 2024-04-16 |
US11502705B2 (en) | 2022-11-15 |
AU2020204057A1 (en) | 2021-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7426907B2 (ja) | 高度なデータベース圧縮解除 | |
US11050436B2 (en) | Advanced database compression | |
US7454403B2 (en) | Method and mechanism of improving performance of database query language statements using data duplication information | |
US9558251B2 (en) | Transformation functions for compression and decompression of data in computing environments and systems | |
Müller et al. | Adaptive String Dictionary Compression in In-Memory Column-Store Database Systems. | |
CA2485423C (en) | Storing and querying relational data in compressed storage format | |
JP3914662B2 (ja) | データベース処理方法及び実施装置並びにその処理プログラムを記憶した媒体 | |
EP3435256B1 (en) | Optimal sort key compression and index rebuilding | |
Gog et al. | Compressed suffix trees: Efficient computation and storage of LCP-values | |
Gog et al. | Large-scale pattern search using reduced-space on-disk suffix arrays | |
US8140546B2 (en) | Computer system for performing aggregation of tree-structured data, and method and computer program product therefor | |
CN111104377A (zh) | 文件管理的方法、电子设备和计算机可读存储介质 | |
US8812523B2 (en) | Predicate result cache | |
US20180275961A1 (en) | Method and system for fast data comparison using accelerated and incrementally synchronized cyclic data traversal algorithm | |
US20210303533A1 (en) | Automated optimization for in-memory data structures of column store databases | |
US10366067B2 (en) | Adaptive index leaf block compression | |
Wang et al. | Rencoder: A space-time efficient range filter with local encoder | |
CN107066573B (zh) | 一种基于三维表结构的数据关联存取方法及应用 | |
US11914589B2 (en) | Efficient computation of order by, order by with limit, min, and max in column-oriented databases | |
WO2023216575A1 (zh) | 数据页处理的方法及其装置 | |
Tenhunen | Scientific Methods in Relational Database Compression Research | |
Fraser | String Searching using External Memory | |
Theodorakis et al. | An Empirical Evaluation of Variable-length Record B+ Trees on a Modern Graph Database System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210709 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220725 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230328 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230710 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231019 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20231031 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240123 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7426907 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |