JP4907600B2 - 繰り返し値を有するテーブルのブロック圧縮 - Google Patents
繰り返し値を有するテーブルのブロック圧縮 Download PDFInfo
- Publication number
- JP4907600B2 JP4907600B2 JP2008132427A JP2008132427A JP4907600B2 JP 4907600 B2 JP4907600 B2 JP 4907600B2 JP 2008132427 A JP2008132427 A JP 2008132427A JP 2008132427 A JP2008132427 A JP 2008132427A JP 4907600 B2 JP4907600 B2 JP 4907600B2
- Authority
- JP
- Japan
- Prior art keywords
- block
- value
- column
- identifier
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007906 compression Methods 0.000 title claims description 145
- 230000006835 compression Effects 0.000 title claims description 145
- 238000000034 method Methods 0.000 claims description 73
- 230000008569 process Effects 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 25
- 239000000872 buffer Substances 0.000 claims description 19
- 230000008859 change Effects 0.000 claims description 7
- 239000013598 vector Substances 0.000 description 159
- 238000010586 diagram Methods 0.000 description 28
- 238000003860 storage Methods 0.000 description 10
- 238000007726 management method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013144 data compression Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 241000545442 Radix Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1744—Redundancy elimination performed by the file system using compression, e.g. sparse files
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3084—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/221—Column-oriented storage; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3084—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
- H03M7/3088—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing the use of a dictionary, e.g. LZ78
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
値識別子は、テーブルの同一の行にわたってデータの依存関係を有する構造化ビジネスデータを表わす値としうる。ビジネスデータは、結合されたテーブルの集合としてモデル化されたビジネスオブジェクトを含みうる。
ブロック辞書、ブロックベクトル等は、複数のハードウェアサーバ上で並列に生成されうる。
データの列への変更は、データの列から分離された差分バッファ内に記憶され、変更は非同期に統合されうる。
ブロック辞書、(例えば、ブロックベクトルまたはブロックベクトルの列内の)ブロック識別子、ブロックのオフセット値は記憶され、ブロック辞書における検索が可能とされうる。
値識別子の各ブロックのサイズは固定された行の数でありうる。
データの列は、構造化データのテーブル内の他の列とともに整列されうる。整列は、値識別子のグループを生成するようにデータの列を整列する処理と、前の列に基づいて続く列のブロックを選択的に整列する処理とを含みうる。前の列のブロックが1つの同一の値識別子を有するならば、続く列のブロックが整列される。
ブロック識別子は、値識別子の各々について割り当てられうる。ブロック識別子の順序付けは、値識別子の順序付けに合致しうる。ブロック識別子は、各ブロックについて開始する番号付けされた系列を含みうる。各ブロック辞書についてブロック識別子を表わすために最小のビット長が使用されるように、各ブロック辞書が2進数符号化により圧縮されうる。各ブロック辞書について、ブロック識別子の各々のユニークな値についてブロック識別子が1回のみ存在しうる。
各図面における同様な参照符号および記号は同様の構成要素を示す。
ブロックベクトル内の各々の行についてどの値が出現するかを指定するために1ビット(例えば、ブロックベクトル内のエントリのリストについて0または1)が必要とされる。もう1つの例として、ブロックが3つまたは4つの異なる値を含み、ブロック辞書内にリストされるならば、ブロックベクトル内の各々の行についてどの値が出現するかを指定するために2ビット(例えば、00, 01, 10または11)が必要とされる。従って、概して、ブロックが、Nより大きいか等しい最小の2の整数乗が2のP乗であるようなN個の異なる値を含むならば、ブロックベクトル内の各々の行についてブロック辞書内のどの値をとるかを指定するためにPビットが必要とされる。最悪の場合のシナリオにおいて、ブロックが1,024個の異なる値を含むならば、(1,024は2の10乗に等しいので)各々の行についてどの値をとるかを指定するために10ビットが必要とされる。
110、172 辞書
115、174 属性テーブル
120 メインインデックス
125 列
130、135、150 値識別子
140 文書識別子
145 文書識別子リスト
176 差分インデックス
500 システム
502 検索エンジン管理ツール
504、508、510 ホスト
506 記憶装置
512 インデックス
514、518 論理インデックス
516 圧縮された列の集合
520 列
522 差分バッファ
802、806 列
810 ブロック識別子のベクトル
814 ブロック辞書の列
816、822 ブロック識別子の列
818 値識別子の列
820 オフセット値の列
Claims (17)
- データ処理装置に動作を実行させるコンピュータプログラムであって、
前記動作は、
辞書を基にした圧縮によりデータの列を圧縮する処理を含み、前記圧縮する処理は値識別子の列を生成する処理を含み、前記値識別子の各々は前記データの列内のユニークな値を表わし、
前記値識別子を整列する処理と、
少なくとも1つのブロックが複数の同一の値識別子を含むように前記整列された値識別子をブロックに分割し、各ブロックについて各々の値識別子にブロック識別子を割り当てることによって第1リストを生成する処理とをさらに含み、前記第1リストを生成する処理は、ブロック内の各々のユニークな値識別子についてユニークなブロック識別子を取得する処理と、同一の値識別子について同一のブロック識別子を取得する処理とを含み、前記ブロック識別子は各ブロックのブロック識別子の数に基づく最小のビット数を使用して表わされ、
前記動作は、
ブロック辞書の列を生成する処理をさらに含み、前記ブロック辞書の列を生成する処理は、各ブロックについてブロック辞書を生成する処理を含み、
前記ブロック辞書は、
各ブロックのユニークなブロック識別子を含むブロック識別子の第2リストを含み、各ブロック識別子は値識別子と対応付けされ、
前記動作は、
ブロックのオフセットの列を生成する処理をさらに含み、前記ブロックのオフセットの列の各値は前記ブロック辞書の列内でブロックが開始するオフセットを示すコンピュータプログラム。 - 前記値識別子は、テーブルの同一の行にわたってデータの依存関係を有する構造化ビジネスデータを表わす値である請求項1に記載のコンピュータプログラム。
- 前記ビジネスデータは、結合されたテーブルの集合としてモデル化されたビジネスオブジェクトを含む請求項2に記載のコンピュータプログラム。
- 前記動作は複数のハードウェアサーバ上で並列に実行される請求項1に記載のコンピュータプログラム。
- 前記データの列への変更は、前記データの列から分離された差分バッファ内に記憶され、前記変更は非同期に統合される請求項1に記載のコンピュータプログラム。
- 前記動作は、前記ブロック辞書における検索を可能とするために、前記ブロック辞書の列および前記ブロックのオフセットの列を記憶する処理をさらに含む請求項1に記載のコンピュータプログラム。
- 前記値識別子の各ブロックのサイズは固定された行の数である請求項1に記載のコンピュータプログラム。
- 前記動作は、構造化データのテーブル内の他の列とともに前記データの列を整列する処理をさらに含み、
前記データの列を整列する処理は、
値識別子のグループを生成するように前記データの列を整列する処理と、
前の列に基づいて続く列のブロックを選択的に整列する処理とを含み、前の列のブロックが1つの同一の値識別子を有するならば、続く列のブロックが整列される請求項1に記載のコンピュータプログラム。 - ブロック識別子は、前記第1リスト内の前記値識別子の各々について割り当てられ、前記第1リスト内の前記ブロック識別子の順序付けは、前記値識別子の順序付けに合致し、前記第1リスト内の前記ブロック識別子は、各ブロックについて開始する番号付けされた系列を含み、各ブロック辞書は、各ブロック辞書についてブロック識別子を表わすために最小のビット長が使用されるように2進数符号化により圧縮され、各ブロック辞書について、ブロック識別子の各々のユニークな値についてブロック識別子が1回のみ存在する請求項1に記載のコンピュータプログラム。
- コンピュータ実装される方法であって、
辞書を基にした圧縮によりデータの列を圧縮する過程を有し、前記圧縮する過程は値識別子の列を生成する過程を有し、前記値識別子の各々は前記データの列内のユニークな値を表わし、
前記方法は、
前記値識別子を整列する過程と、
少なくとも1つのブロックが複数の同一の値識別子を含むように前記整列された値識別子をブロックに分割し、各ブロックについて各々の値識別子にブロック識別子を割り当てることによって第1リストを生成する過程とをさらに有し、前記第1リストを生成する過程は、ブロック内の各々のユニークな値識別子についてユニークなブロック識別子を取得する過程と、同一の値識別子について同一のブロック識別子を取得する過程とを含み、前記ブロック識別子は各ブロックのブロック識別子の数に基づく最小のビット数を使用して表わされ、
前記方法は、
ブロック辞書の列を生成する過程をさらに有し、前記ブロック辞書の列を生成する過程は、各ブロックについてブロック辞書を生成する過程をさらに有し、
前記ブロック辞書は、
各ブロックのユニークなブロック識別子を含むブロック識別子の第2リストを含み、各ブロック識別子は値識別子と対応付けされ、
前記方法は、
ブロックのオフセットの列を生成する過程をさらに有し、前記ブロックのオフセットの列の各値は前記ブロック辞書の列内でブロックが開始するオフセットを示す方法。 - 前記値識別子は、テーブルの同一の行にわたってデータの依存関係を有する構造化ビジネスデータを表わす値である請求項10に記載の方法。
- 前記データの列への変更は、前記データの列から分離された差分バッファ内に記憶され、前記変更は非同期に統合される請求項10に記載の方法。
- 前記ブロック辞書における検索を可能とするために、前記ブロック辞書の列および前記ブロックのオフセットの列を記憶する過程をさらに有する請求項10に記載の方法。
- 前記方法は、構造化データのテーブル内の他の列とともに前記データの列を整列する過程をさらに含み、
前記データの列を整列する過程は、
値識別子のグループを生成するために前記データの列を整列する過程と、
前の列に基づいて続く列のブロックを選択的に整列する過程とを含み、前の列のブロックが1つの同一の値識別子を有するならば、続く列のブロックが整列される請求項10に記載の方法。 - データ処理装置に動作を実行させるコンピュータプログラムであって、
前記動作は、
データの圧縮された列を表わす値識別子を整列する処理と、
少なくとも1つのブロックが複数の同一の値識別子を含むように前記整列された値識別子をブロックに分割し、各ブロックについて各々の値識別子にブロック識別子を割り当てることによって第1リストを生成する処理とを含み、前記第1リストを生成する処理は、ブロック内の各々のユニークな値識別子についてユニークなブロック識別子を取得する処理と、同一の値識別子について同一のブロック識別子を取得する処理とを含み、前記ブロック識別子は各ブロックのブロック識別子の数に基づく最小のビット数を使用して表わされ、
前記動作は、
複数のブロック辞書を生成する処理をさらに含み、前記ブロック辞書は、前記値識別子の複数のブロックの各々について存在し、
前記ブロック辞書の各々は、各ブロックのユニークなブロック識別子を含むブロック識別子のリストを含み、各ブロック識別子は値識別子と対応付けされたコンピュータプログラム。 - 前記動作は、辞書を基にした圧縮により前記データの列を圧縮する処理をさらに含み、前記圧縮する処理は前記値識別子の列を生成する処理を含み、前記値識別子の各々は前記データの列内のユニークな値を表わす請求項15に記載のコンピュータプログラム。
- 前記動作は、前記ブロック辞書における検索を可能とするために、前記ブロック辞書を記憶する処理をさらに含む請求項15に記載のコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/805,186 | 2007-05-21 | ||
US11/805,186 US7769729B2 (en) | 2007-05-21 | 2007-05-21 | Block compression of tables with repeated values |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008287723A JP2008287723A (ja) | 2008-11-27 |
JP4907600B2 true JP4907600B2 (ja) | 2012-03-28 |
Family
ID=39777031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008132427A Active JP4907600B2 (ja) | 2007-05-21 | 2008-05-20 | 繰り返し値を有するテーブルのブロック圧縮 |
Country Status (4)
Country | Link |
---|---|
US (4) | US7769729B2 (ja) |
EP (1) | EP1995878B1 (ja) |
JP (1) | JP4907600B2 (ja) |
CN (1) | CN101311930B (ja) |
Families Citing this family (132)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9460064B2 (en) * | 2006-05-18 | 2016-10-04 | Oracle International Corporation | Efficient piece-wise updates of binary encoded XML data |
US20090006399A1 (en) * | 2007-06-29 | 2009-01-01 | International Business Machines Corporation | Compression method for relational tables based on combined column and row coding |
US7836037B2 (en) * | 2007-10-04 | 2010-11-16 | Sap Ag | Selection of rows and values from indexes with updates |
KR101443221B1 (ko) * | 2008-01-18 | 2014-09-24 | 삼성전자주식회사 | 렌더링 장치 및 방법 |
US8108401B2 (en) * | 2008-03-28 | 2012-01-31 | International Business Machines Corporation | Applying various hash methods used in conjunction with a query with a group by clause |
US7885967B2 (en) * | 2008-05-30 | 2011-02-08 | Red Hat, Inc. | Management of large dynamic tables |
US8498824B2 (en) * | 2008-06-02 | 2013-07-30 | Intel Corporation | Nucleic acid sequencing using a compacted coding technique |
US8099440B2 (en) * | 2008-08-15 | 2012-01-17 | International Business Machines Corporation | Method for laying out fields in a database in a hybrid of row-wise and column-wise ordering |
US8135738B2 (en) * | 2008-08-20 | 2012-03-13 | International Business Machines Corporation | Efficient predicate evaluation via in-list |
US8370326B2 (en) * | 2009-03-24 | 2013-02-05 | International Business Machines Corporation | System and method for parallel computation of frequency histograms on joined tables |
US8583692B2 (en) * | 2009-04-30 | 2013-11-12 | Oracle International Corporation | DDL and DML support for hybrid columnar compressed tables |
US8935223B2 (en) * | 2009-04-30 | 2015-01-13 | Oracle International Corporation | Structure of hierarchical compressed data structure for tabular data |
US8356060B2 (en) | 2009-04-30 | 2013-01-15 | Oracle International Corporation | Compression analyzer |
US9667269B2 (en) | 2009-04-30 | 2017-05-30 | Oracle International Corporation | Technique for compressing XML indexes |
US8645337B2 (en) * | 2009-04-30 | 2014-02-04 | Oracle International Corporation | Storing compression units in relational tables |
US8321390B2 (en) * | 2009-06-11 | 2012-11-27 | Vivek Swarnakar | Methods and apparatus for organizing data in a database |
US8296517B2 (en) | 2009-08-19 | 2012-10-23 | Oracle International Corporation | Database operation-aware striping technique |
US8832142B2 (en) | 2010-08-30 | 2014-09-09 | Oracle International Corporation | Query and exadata support for hybrid columnar compressed data |
JP5487985B2 (ja) * | 2010-01-14 | 2014-05-14 | 富士通株式会社 | 圧縮装置、方法及びプログラム、並びに展開装置、方法及びプログラム |
DE102010006931A1 (de) * | 2010-02-04 | 2011-08-04 | Bienert, Jörg, 50354 | Verfahren zur Verarbeitung von Datensammlungen, insbesondere in Datenbanksystemen |
US20110219037A1 (en) * | 2010-03-04 | 2011-09-08 | Src, Inc. | High-Performance Persistence Framework |
US20110264667A1 (en) * | 2010-04-27 | 2011-10-27 | Stavros Harizopoulos | Column-oriented storage in a row-oriented database management system |
AU2010201705A1 (en) * | 2010-04-29 | 2011-11-17 | IFRS System Pty Limited | Automatic Report Generation System And Method Therefor |
US8239421B1 (en) | 2010-08-30 | 2012-08-07 | Oracle International Corporation | Techniques for compression and processing optimizations by using data transformations |
US9009182B2 (en) * | 2010-10-05 | 2015-04-14 | Sap Se | Distributed transaction management with tokens |
US8442988B2 (en) | 2010-11-04 | 2013-05-14 | International Business Machines Corporation | Adaptive cell-specific dictionaries for frequency-partitioned multi-dimensional data |
US9325344B2 (en) | 2010-12-03 | 2016-04-26 | International Business Machines Corporation | Encoding data stored in a column-oriented manner |
US10089592B2 (en) | 2010-12-29 | 2018-10-02 | Comcast Cable Communications, Llc | Measuring video asset viewing |
US8365212B1 (en) | 2010-12-29 | 2013-01-29 | Robert Alan Orlowski | System and method for analyzing human interaction with electronic devices that access a computer system through a network |
US10945011B2 (en) | 2010-12-29 | 2021-03-09 | Comcast Cable Communications, Llc | Measuring video viewing |
US8898351B2 (en) * | 2010-12-30 | 2014-11-25 | Emc Corporation | Dynamic compression of an I/O data block |
US8423522B2 (en) | 2011-01-04 | 2013-04-16 | International Business Machines Corporation | Query-aware compression of join results |
US8868512B2 (en) * | 2011-01-14 | 2014-10-21 | Sap Se | Logging scheme for column-oriented in-memory databases |
US20120197925A1 (en) * | 2011-01-28 | 2012-08-02 | International Business Machines Corporation | Optimization of Database Driver Performance |
CN102651007A (zh) * | 2011-02-28 | 2012-08-29 | 国际商业机器公司 | 一种管理数据库索引的方法和装置 |
JP5699715B2 (ja) * | 2011-03-18 | 2015-04-15 | 日本電気株式会社 | データ保存装置、データ保存方法 |
EP2581704A1 (en) * | 2011-10-14 | 2013-04-17 | Harman Becker Automotive Systems GmbH | Method for compressing navigation map data |
US8838551B2 (en) * | 2011-10-21 | 2014-09-16 | International Business Machines Corporation | Multi-level database compression |
US9697174B2 (en) | 2011-12-08 | 2017-07-04 | Oracle International Corporation | Efficient hardware instructions for processing bit vectors for single instruction multiple data processors |
CN104040542B (zh) | 2011-12-08 | 2017-10-10 | 甲骨文国际公司 | 用于在易失性存储器内保持关系型数据的列向量的技术 |
US9342314B2 (en) | 2011-12-08 | 2016-05-17 | Oracle International Corporation | Efficient hardware instructions for single instruction multiple data processors |
US10534606B2 (en) | 2011-12-08 | 2020-01-14 | Oracle International Corporation | Run-length encoding decompression |
US9792117B2 (en) | 2011-12-08 | 2017-10-17 | Oracle International Corporation | Loading values from a value vector into subregisters of a single instruction multiple data register |
US8892586B2 (en) * | 2011-12-23 | 2014-11-18 | Sap Ag | Accelerated query operators for high-speed, in-memory online analytical processing queries and operations |
US10645433B1 (en) | 2013-08-29 | 2020-05-05 | Comcast Cable Communications, Llc | Measuring video-content viewing |
US10440428B2 (en) | 2013-01-13 | 2019-10-08 | Comcast Cable Communications, Llc | Measuring video-program-viewing activity |
US11627356B2 (en) * | 2012-01-28 | 2023-04-11 | Comcast Cable Communications, Llc | Data translation for video-viewing activity |
JPWO2013137070A1 (ja) * | 2012-03-13 | 2015-08-03 | 日本電気株式会社 | ログ圧縮システム、ログ圧縮方法、及びプログラム |
CN102646136B (zh) * | 2012-04-06 | 2014-04-02 | 北京西塔网络科技股份有限公司 | 一种高效数据存储查询的方法及系统 |
US9009155B2 (en) * | 2012-04-27 | 2015-04-14 | Sap Se | Parallel set aggregation |
US9171020B2 (en) | 2012-04-30 | 2015-10-27 | Sap Se | Deleting records in a multi-level storage architecture |
US9465844B2 (en) | 2012-04-30 | 2016-10-11 | Sap Se | Unified table query processing |
US10162766B2 (en) | 2012-04-30 | 2018-12-25 | Sap Se | Deleting records in a multi-level storage architecture without record locks |
US9165010B2 (en) | 2012-04-30 | 2015-10-20 | Sap Se | Logless atomic data movement |
US9465829B2 (en) | 2012-04-30 | 2016-10-11 | Sap Se | Partial merge |
US11010415B2 (en) * | 2012-04-30 | 2021-05-18 | Sap Se | Fixed string dictionary |
JP5826114B2 (ja) | 2012-05-25 | 2015-12-02 | クラリオン株式会社 | データ解凍装置、データ圧縮装置、データの解凍プログラム、データの圧縮プログラム、及び、圧縮データ配信システム |
US8756208B2 (en) * | 2012-07-10 | 2014-06-17 | International Business Machines Corporation | Encoded data processing |
US8838577B2 (en) | 2012-07-24 | 2014-09-16 | International Business Machines Corporation | Accelerated row decompression |
GB2505898B (en) * | 2012-09-13 | 2014-11-19 | 1E Ltd | Data reduction |
US9154157B2 (en) * | 2012-09-27 | 2015-10-06 | Intel Corporation | Search unit to accelerate variable length compression/decompression |
US9292569B2 (en) | 2012-10-02 | 2016-03-22 | Oracle International Corporation | Semi-join acceleration |
EP2720376A1 (en) * | 2012-10-09 | 2014-04-16 | Alcatel Lucent | Secure and lossless data compression |
US9646053B2 (en) * | 2013-03-12 | 2017-05-09 | Oracle International Corporation | OLTP compression of wide tables |
CN103347047B (zh) * | 2013-06-07 | 2017-02-08 | 南京交通职业技术学院 | 一种基于网络字典的无损数据压缩方法 |
US9165050B2 (en) * | 2013-07-19 | 2015-10-20 | Sap Se | Data availability during columnar table merges |
US8762387B1 (en) * | 2013-07-31 | 2014-06-24 | Linkedin Corporation | Inverted indexes for accelerating analytics queries |
US10133800B2 (en) * | 2013-09-11 | 2018-11-20 | Microsoft Technology Licensing, Llc | Processing datasets with a DBMS engine |
US9606921B2 (en) | 2013-09-21 | 2017-03-28 | Oracle International Corporation | Granular creation and refresh of columnar data |
US9977802B2 (en) | 2013-11-21 | 2018-05-22 | Sap Se | Large string access and storage |
US9977801B2 (en) | 2013-11-21 | 2018-05-22 | Sap Se | Paged column dictionary |
US9495466B2 (en) | 2013-11-27 | 2016-11-15 | Oracle International Corporation | LIDAR model with hybrid-columnar format and no indexes for spatial searches |
EP3074882A4 (en) * | 2013-11-28 | 2017-07-05 | Intel Corporation | Techniques for block-based indexing |
US9336196B2 (en) | 2013-12-06 | 2016-05-10 | Sap Se | Methods, systems, and apparatus for optimization using statistical estimation |
US10235377B2 (en) | 2013-12-23 | 2019-03-19 | Sap Se | Adaptive dictionary compression/decompression for column-store databases |
CN103761316B (zh) * | 2014-01-26 | 2018-02-06 | 北京中电普华信息技术有限公司 | 一种基于稀疏矩阵的数据压缩存储方法及装置 |
US10042902B2 (en) * | 2014-01-29 | 2018-08-07 | International Business Machines Corporation | Business rules influenced quasi-cubes with higher diligence of data optimization |
JP6336302B2 (ja) * | 2014-03-11 | 2018-06-06 | 株式会社電通国際情報サービス | 情報処理装置、情報処理方法及びプログラム |
US9697221B2 (en) * | 2014-03-19 | 2017-07-04 | Oracle International Corporation | OZIP compression and decompression |
US9870382B2 (en) * | 2014-03-25 | 2018-01-16 | Sap Se | Data encoding and corresponding data structure |
CN105022739B (zh) * | 2014-04-21 | 2019-05-21 | 腾讯科技(北京)有限公司 | 数据的存储方法及装置 |
US10726005B2 (en) * | 2014-06-25 | 2020-07-28 | Sap Se | Virtual split dictionary for search optimization |
US10210280B2 (en) | 2014-10-23 | 2019-02-19 | Sap Se | In-memory database search optimization using graph community structure |
US10042552B2 (en) * | 2014-11-25 | 2018-08-07 | Sap Se | N-bit compressed versioned column data array for in-memory columnar stores |
US10725987B2 (en) * | 2014-11-25 | 2020-07-28 | Sap Se | Forced ordering of a dictionary storing row identifier values |
CN104731729B (zh) * | 2015-03-23 | 2018-07-13 | 华为技术有限公司 | 一种基于异构系统的表连接优化方法、cpu和加速器 |
US10248622B2 (en) * | 2015-03-30 | 2019-04-02 | Sap Se | Variable virtual split dictionary for search optimization |
US10073885B2 (en) | 2015-05-29 | 2018-09-11 | Oracle International Corporation | Optimizer statistics and cost model for in-memory tables |
US11281639B2 (en) | 2015-06-23 | 2022-03-22 | Microsoft Technology Licensing, Llc | Match fix-up to remove matching documents |
US10733164B2 (en) | 2015-06-23 | 2020-08-04 | Microsoft Technology Licensing, Llc | Updating a bit vector search index |
US11392568B2 (en) | 2015-06-23 | 2022-07-19 | Microsoft Technology Licensing, Llc | Reducing matching documents for a search query |
US10242071B2 (en) | 2015-06-23 | 2019-03-26 | Microsoft Technology Licensing, Llc | Preliminary ranker for scoring matching documents |
US20160378803A1 (en) * | 2015-06-23 | 2016-12-29 | Microsoft Technology Licensing, Llc | Bit vector search index |
US10339121B2 (en) * | 2015-08-06 | 2019-07-02 | Sap Se | Data compression |
US9990308B2 (en) | 2015-08-31 | 2018-06-05 | Oracle International Corporation | Selective data compression for in-memory databases |
US10409799B2 (en) * | 2015-10-19 | 2019-09-10 | International Business Machines Corporation | Supporting updatable repeated values over variable schema |
US10169361B2 (en) | 2015-11-16 | 2019-01-01 | International Business Machines Corporation | Columnar database compression |
CN105335531B (zh) * | 2015-12-14 | 2019-06-04 | 北京奇虎科技有限公司 | 一种文档的压缩、解压方法和装置 |
CN105512305B (zh) * | 2015-12-14 | 2019-04-26 | 北京奇虎科技有限公司 | 一种基于序列化的文档压缩、文档解压方法和装置 |
US10019375B2 (en) | 2016-03-02 | 2018-07-10 | Toshiba Memory Corporation | Cache device and semiconductor device including a tag memory storing absence, compression and write state information |
US10061832B2 (en) * | 2016-11-28 | 2018-08-28 | Oracle International Corporation | Database tuple-encoding-aware data partitioning in a direct memory access engine |
US10055358B2 (en) | 2016-03-18 | 2018-08-21 | Oracle International Corporation | Run length encoding aware direct memory access filtering engine for scratchpad enabled multicore processors |
US10061714B2 (en) | 2016-03-18 | 2018-08-28 | Oracle International Corporation | Tuple encoding aware direct memory access engine for scratchpad enabled multicore processors |
US9930146B2 (en) * | 2016-04-04 | 2018-03-27 | Cisco Technology, Inc. | System and method for compressing content centric networking messages |
US11743332B2 (en) * | 2016-04-26 | 2023-08-29 | Umbra Technologies Ltd. | Systems and methods for routing data to a parallel file system |
US10432217B2 (en) * | 2016-06-28 | 2019-10-01 | International Business Machines Corporation | Page filtering via compression dictionary filtering |
US10599488B2 (en) | 2016-06-29 | 2020-03-24 | Oracle International Corporation | Multi-purpose events for notification and sequence control in multi-core processor systems |
CN107643906B (zh) * | 2016-07-22 | 2021-01-05 | 华为技术有限公司 | 数据处理方法及装置 |
US10235100B2 (en) | 2016-08-23 | 2019-03-19 | Sap Se | Optimizing column based database table compression |
US10380058B2 (en) | 2016-09-06 | 2019-08-13 | Oracle International Corporation | Processor core to coprocessor interface with FIFO semantics |
US10783102B2 (en) | 2016-10-11 | 2020-09-22 | Oracle International Corporation | Dynamically configurable high performance database-aware hash engine |
US10459859B2 (en) | 2016-11-28 | 2019-10-29 | Oracle International Corporation | Multicast copy ring for database direct memory access filtering engine |
US10176114B2 (en) | 2016-11-28 | 2019-01-08 | Oracle International Corporation | Row identification number generation in database direct memory access engine |
US10725947B2 (en) | 2016-11-29 | 2020-07-28 | Oracle International Corporation | Bit vector gather row count calculation and handling in direct memory access engine |
CN108513146A (zh) * | 2017-02-27 | 2018-09-07 | 晨星半导体股份有限公司 | 收视记录处理电路与相关方法 |
JP7210130B2 (ja) * | 2017-04-07 | 2023-01-23 | 富士通株式会社 | 符号化プログラム、符号化方法および符号化装置 |
JP7003443B2 (ja) * | 2017-05-16 | 2022-01-20 | 富士通株式会社 | 符号化プログラム、符号化装置および符号化方法 |
CN107423111B (zh) * | 2017-06-23 | 2020-06-26 | 浪潮云信息技术有限公司 | 一种Openstack环境计算节点后端存储管理方法 |
US11200296B2 (en) | 2017-10-20 | 2021-12-14 | Red Hat, Inc. | Limited duration supply for heuristic algorithms |
US11468024B2 (en) * | 2018-03-27 | 2022-10-11 | Sap Se | Structural data matching using neural network encoders |
US10965315B2 (en) * | 2018-08-09 | 2021-03-30 | Andrew Kamal | Data compression method |
US11030149B2 (en) * | 2018-09-06 | 2021-06-08 | Sap Se | File format for accessing data quickly and efficiently |
US11500842B2 (en) * | 2018-12-14 | 2022-11-15 | Sap Se | Adaptive compression optimization for effective pruning |
US10606775B1 (en) * | 2018-12-28 | 2020-03-31 | Micron Technology, Inc. | Computing tile |
US20200356563A1 (en) * | 2019-05-08 | 2020-11-12 | Datameer, Inc. | Query performance model generation and use in a hybrid multi-cloud database environment |
CN111697973B (zh) * | 2019-05-16 | 2021-02-02 | 时擎智能科技(上海)有限公司 | 压缩方法及压缩系统 |
US11403367B2 (en) | 2019-09-12 | 2022-08-02 | Oracle International Corporation | Techniques for solving the spherical point-in-polygon problem |
US11423000B2 (en) * | 2020-04-02 | 2022-08-23 | Sap Se | Data transfer and management system for in-memory database |
US11558067B2 (en) * | 2020-05-19 | 2023-01-17 | Sap Se | Data compression techniques |
KR102598292B1 (ko) * | 2021-07-23 | 2023-11-06 | 주식회사 중앙첨단소재 | Json 포맷 압축 및 복원방법 |
US11463559B1 (en) * | 2021-08-24 | 2022-10-04 | Lyft, Inc. | Compressing digital metrics for transmission across a network utilizing a graph-based compression dictionary and time slice delta compression |
DE102021123997A1 (de) | 2021-09-16 | 2023-03-16 | Swedex Holding GmbH | Computerimplementiertes Datenbankverfahren, System zur Datenverarbeitung, Computerprogrammprodukt und computerlesbares Speichermedium |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5592667A (en) * | 1991-05-29 | 1997-01-07 | Triada, Ltd. | Method of storing compressed data for accelerated interrogation |
US5523946A (en) * | 1992-02-11 | 1996-06-04 | Xerox Corporation | Compact encoding of multi-lingual translation dictionaries |
JPH06348569A (ja) * | 1993-06-14 | 1994-12-22 | Nec Corp | データベースシステム |
US5574906A (en) * | 1994-10-24 | 1996-11-12 | International Business Machines Corporation | System and method for reducing storage requirement in backup subsystems utilizing segmented compression and differencing |
JPH08180067A (ja) * | 1994-12-26 | 1996-07-12 | Nec Corp | データベースレコード圧縮システム |
US5870036A (en) * | 1995-02-24 | 1999-02-09 | International Business Machines Corporation | Adaptive multiple dictionary data compression |
KR19990040843A (ko) * | 1997-11-20 | 1999-06-15 | 윤종용 | 코드분할 다중접속 디지털 이동통신 시스템의 기지국 송신출력측정 및 기지국 호 시험을 위한 전력 검출 및 시험 단말장치 |
JP3337633B2 (ja) * | 1997-12-03 | 2002-10-21 | 富士通株式会社 | データ圧縮方法及びデータ復元方法並びにデータ圧縮プログラム又はデータ復元プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP3651550B2 (ja) * | 1998-02-23 | 2005-05-25 | 三菱電機株式会社 | 属性圧縮装置および方法 |
US6397308B1 (en) * | 1998-12-31 | 2002-05-28 | Emc Corporation | Apparatus and method for differential backup and restoration of data in a computer storage system |
US6519685B1 (en) * | 1999-12-22 | 2003-02-11 | Intel Corporation | Cache states for multiprocessor cache coherency protocols |
JP2002063202A (ja) * | 2000-08-22 | 2002-02-28 | Nec Corp | 情報検索システムおよび方法 |
US6801208B2 (en) * | 2000-12-27 | 2004-10-05 | Intel Corporation | System and method for cache sharing |
US7024414B2 (en) * | 2001-08-06 | 2006-04-04 | Sensage, Inc. | Storage of row-column data |
US6687794B2 (en) * | 2001-10-18 | 2004-02-03 | International Business Machines Corporation | Prefetching mechanism for data caches |
US6976181B2 (en) * | 2001-12-20 | 2005-12-13 | Intel Corporation | Method and apparatus for enabling a low power mode for a processor |
US8868544B2 (en) * | 2002-04-26 | 2014-10-21 | Oracle International Corporation | Using relational structures to create and support a cube within a relational database system |
CN100390790C (zh) * | 2002-05-10 | 2008-05-28 | 甲骨文国际公司 | 存储和访问数据,以及提高数据库查询语言语句性能的方法和机制 |
US6667700B1 (en) * | 2002-10-30 | 2003-12-23 | Nbt Technology, Inc. | Content-based segmentation scheme for data compression in storage and transmission including hierarchical segment representation |
US7290093B2 (en) * | 2003-01-07 | 2007-10-30 | Intel Corporation | Cache memory to support a processor's power mode of operation |
US7636720B2 (en) * | 2003-05-08 | 2009-12-22 | Microsoft Corporation | Associating and using information in a metadirectory |
CN101271471B (zh) * | 2003-09-15 | 2011-08-17 | 起元科技有限公司 | 数据处理方法、软件和数据处理系统 |
US7383270B1 (en) * | 2004-02-03 | 2008-06-03 | Teradata Us, Inc. | Compressing data stored in an intermediate or result table of a database |
US7269606B2 (en) * | 2004-02-26 | 2007-09-11 | Sap Ag | Automatic reduction of table memory footprint using column cardinality information |
US7536506B2 (en) * | 2004-06-21 | 2009-05-19 | Dot Hill Systems Corporation | RAID controller using capacitor energy source to flush volatile cache data to non-volatile memory during main power outage |
US7774298B2 (en) * | 2004-06-30 | 2010-08-10 | Sap Ag | Method and system for data extraction from a transaction system to an analytics system |
US7533215B2 (en) * | 2005-09-15 | 2009-05-12 | Intel Corporation | Distributed and packed metadata structure for disk cache |
US7984241B2 (en) * | 2005-09-16 | 2011-07-19 | Hewlett-Packard Development Company, L.P. | Controlling processor access to cache memory |
CA2652115C (en) * | 2006-05-12 | 2015-11-17 | Goldengate Software, Inc. | Apparatus and method for read consistency in a log mining system |
US7707176B2 (en) * | 2006-12-22 | 2010-04-27 | Sap Ag | Content management system with improved performance |
US8626702B2 (en) * | 2006-12-27 | 2014-01-07 | Sap Ag | Method and system for validation of data extraction |
-
2007
- 2007-05-21 US US11/805,186 patent/US7769729B2/en active Active
-
2008
- 2008-05-05 EP EP08008447.8A patent/EP1995878B1/en active Active
- 2008-05-20 JP JP2008132427A patent/JP4907600B2/ja active Active
- 2008-05-21 CN CN2008101079373A patent/CN101311930B/zh active Active
-
2010
- 2010-08-02 US US12/848,862 patent/US8326810B2/en active Active
-
2012
- 2012-11-12 US US13/674,477 patent/US9450605B2/en active Active
-
2016
- 2016-08-08 US US15/231,621 patent/US10884987B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9450605B2 (en) | 2016-09-20 |
US20100299316A1 (en) | 2010-11-25 |
US10884987B2 (en) | 2021-01-05 |
US20080294863A1 (en) | 2008-11-27 |
EP1995878A2 (en) | 2008-11-26 |
EP1995878B1 (en) | 2017-03-29 |
US20170031944A1 (en) | 2017-02-02 |
US20130073530A1 (en) | 2013-03-21 |
EP1995878A3 (en) | 2009-07-08 |
US8326810B2 (en) | 2012-12-04 |
US7769729B2 (en) | 2010-08-03 |
CN101311930B (zh) | 2012-07-04 |
CN101311930A (zh) | 2008-11-26 |
JP2008287723A (ja) | 2008-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4907600B2 (ja) | 繰り返し値を有するテーブルのブロック圧縮 | |
US9852169B2 (en) | Compression of tables based on occurrence of values | |
Bassiouni | Data compression in scientific and statistical databases | |
Wu et al. | Optimizing bitmap indices with efficient compression | |
US8838593B2 (en) | Method and system for storing, organizing and processing data in a relational database | |
Sinha et al. | Multi-resolution bitmap indexes for scientific data | |
Wu | Notes on design and implementation of compressed bit vectors | |
US20130103655A1 (en) | Multi-level database compression | |
US20130013606A1 (en) | Managing Storage of Data for Range-Based Searching | |
CN107852173B (zh) | 对无损简化的数据执行搜索和取回的方法以及装置 | |
TW202147787A (zh) | 利用主要資料的局部性來有效率檢索已使用主要資料篩而被無損地縮減的資料 | |
CN108475508B (zh) | 音频数据和保存在块处理存储系统中的数据的简化 | |
Liu et al. | Mostly order preserving dictionaries | |
Dehne et al. | Compressing data cube in parallel OLAP systems | |
Tenhunen | Scientific Methods in Relational Database Compression Research | |
Bhuiyan et al. | High Performance SQL Queries on Compressed Relational Database. | |
Matacic | A novel index method for write optimization on out-of-core column-store databases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111213 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150120 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4907600 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |