JP6530553B2 - 計算機及びデータベース管理方法 - Google Patents
計算機及びデータベース管理方法 Download PDFInfo
- Publication number
- JP6530553B2 JP6530553B2 JP2018503859A JP2018503859A JP6530553B2 JP 6530553 B2 JP6530553 B2 JP 6530553B2 JP 2018503859 A JP2018503859 A JP 2018503859A JP 2018503859 A JP2018503859 A JP 2018503859A JP 6530553 B2 JP6530553 B2 JP 6530553B2
- Authority
- JP
- Japan
- Prior art keywords
- size
- memory
- column
- records
- store database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 title claims description 22
- 238000007906 compression Methods 0.000 claims description 75
- 230000006835 compression Effects 0.000 claims description 74
- 230000015654 memory Effects 0.000 claims description 62
- 238000004590 computer program Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 2
- 238000003860 storage Methods 0.000 description 19
- 238000000034 method Methods 0.000 description 13
- 238000013403 standard screening design Methods 0.000 description 9
- 230000006837 decompression Effects 0.000 description 5
- 230000004931 aggregating effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/221—Column-oriented storage; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2272—Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Claims (12)
- それぞれが第1メモリを有する1以上のハードウェア回路に接続された1以上のインターフェースであるインターフェース部と、
前記インターフェース部に接続された1以上のプロセッサであるプロセッサ部と
を有し、
前記プロセッサ部は、複数のレコード及び複数のカラムで構成されたカラムストアデータベースを複数のデータセグメントに分割し、
前記1以上のハードウェア回路の各々は、前記プロセッサ部からのコマンドに応じたデータベース処理を実行する回路であり、
前記複数のカラムのうちの1以上のカラムが、それぞれ、1以上の圧縮対象カラムであり、
前記複数のデータセグメントの各々は、
前記複数のレコードのうちの1以上のレコードで構成されたカラムストアデータベース部分と、
そのカラムストアデータベース部分のうちの1以上の圧縮対象カラム部分を伸長するため辞書である圧縮辞書と
を含み、
前記複数のデータセグメントの各々において、前記圧縮辞書のサイズは、前記第1メモリのサイズ以下である、
計算機。 - 前記プロセッサ部は、前記複数のデータセグメントの各々を、下記(A)及び(B)の繰り返しにより作成する、
(A)前記カラムストアデータベースのうちのm個のレコード(mは自然数)を構成するカラムストアデータベース部分の1以上の圧縮対象カラム部分の各々においてのユニークカラム値の数に基づき、前記m個のレコードで構成されたカラムストアデータベース部分に対応した圧縮辞書のサイズを算出する、
(B)前記算出されたサイズと前記第1メモリのサイズとの比較の結果に基づいて、データセグメントを作成するか否かを決定する、
請求項1記載の計算機。 - 前記プロセッサ部は、(B)において、
(b1)前記m個のレコードについて前記算出されたサイズが、前記第1メモリのサイズを超えたか否かを判断し、
(b2)(b1)の判断結果が真の場合、(m−x)個のレコード(xは自然数且つm未満)で構成されたカラムストアデータベース部分とそれに対応した圧縮辞書とを含んだデータセグメントを作成する、
請求項2記載の計算機。 - 前記プロセッサ部は、
(b3)(b1)の判断結果が偽の場合、前記m個のレコードで構成されたカラムストアデータベース部分とそれに対応した圧縮辞書とを含んだデータセグメントのサイズが所定のセグメントサイズを超えたか否かを判断し、
(b4)(b3)の判断結果が真の場合、前記m個のレコードで構成されたカラムストアデータベース部分とそれに対応した圧縮辞書とを含んだデータセグメントを作成する、
請求項3記載の計算機。 - 前記1以上のハードウェア回路の各々が、更に、前記第1メモリより低速の第2メモリを有し、
前記所定のセグメントサイズは、前記複数のデータセグメントの各々において、前記カラムストアデータベース部分のサイズが、所定サイズ以下となるためのサイズであり、
前記所定サイズは、
前記第1メモリのサイズと前記圧縮辞書のサイズとの差分と、前記第2メモリのサイズとの合計値以下、又は、
前記第2メモリのサイズ以下、
である、
請求項4記載の計算機。 - 前記1以上のハードウェア回路の各々は、内部メモリを含んだFPGA(Field-Programmable Gate Array)と、外部メモリとを含んだ回路であり、
前記内部メモリが、前記第1メモリであり、
前記外部メモリが、前記第2メモリである、
請求項5記載の計算機。 - 前記プロセッサ部は、
クエリソースからクエリに対応した1以上のデータセグメントの各々について前記クエリを基にコマンドを作成し、
前記1以上のデータセグメントにそれぞれ対応した1以上のコマンドを前記1以上のハードウェア回路に送信し、
前記1以上のコマンドにそれぞれ対応した1以上のデータベース処理結果を前記1以上のハードウェア回路から受信し、
前記受信した1以上のデータベース処理結果に基づく結果を前記クエリに対する応答として前記クエリソースに返す、
請求項1記載の計算機。 - 前記クエリは、検索クエリであり、
前記1以上のコマンドは、前記複数のデータセグメントにそれぞれ対応した複数のコマンドであり、
前記1以上のハードウェア回路は、複数のハードウェア回路であり、
請求項7記載の計算機。 - 前記1以上のハードウェア回路の各々が、更に、前記第1メモリより低速の第2メモリを有し、
前記複数のデータセグメントの少なくとも1つにおいて、前記カラムストアデータベース部分のサイズは、所定サイズ以下であり、
前記所定サイズは、
前記第1メモリのサイズと前記圧縮辞書のサイズとの差分と、前記第2メモリのサイズとの合計値、又は、
前記第2メモリのサイズ、
である、
請求項1記載の計算機。 - 前記1以上のハードウェア回路の各々は、内部メモリを含んだFPGA(Field-Programmable Gate Array)と、外部メモリとを含んだ回路であり、
前記内部メモリが、前記第1メモリである、
請求項1記載の計算機。 - それぞれが第1メモリを有する1以上のハードウェア回路に計算機の処理のうちのデータベース処理がオフロードされるシステムにおける前記計算機によるデータベース管理方法であって、
前記計算機が複数のレコード及び複数のカラムで構成されたカラムストアデータベースを入力し、
前記計算機が前記入力されたカラムストアデータベースを複数のデータセグメントに分割し、
前記複数のカラムのうちの1以上のカラムが、それぞれ、1以上の圧縮対象カラムであり、
前記複数のデータセグメントの各々は、
前記複数のレコードのうちの1以上のレコードで構成されたカラムストアデータベース部分と、
そのカラムストアデータベース部分のうちの1以上の圧縮対象カラム部分を伸長するため辞書である圧縮辞書と
を含み、
前記複数のデータセグメントの各々において、前記圧縮辞書のサイズは、前記第1メモリのサイズ以下である、
データベース管理方法。 - それぞれが第1メモリを有する1以上のハードウェア回路に計算機の処理のうちのデータベース処理がオフロードされるシステムにおける前記計算機に、
複数のレコード及び複数のカラムで構成されたカラムストアデータベースを入力し、
前記入力されたカラムストアデータベースを複数のデータセグメントに分割する
ことを実行させるコンピュータプログラムを記録した計算機読取り可能な非一時的な記録媒体であって、
前記複数のカラムのうちの1以上のカラムが、それぞれ、1以上の圧縮対象カラムであり、
前記複数のデータセグメントの各々は、
前記複数のレコードのうちの1以上のレコードで構成されたカラムストアデータベース部分と、
そのカラムストアデータベース部分のうちの1以上の圧縮対象カラム部分を伸長するため辞書である圧縮辞書と
を含み、
前記複数のデータセグメントの各々において、前記圧縮辞書のサイズは、前記第1メモリのサイズ以下である、
記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/056934 WO2017154065A1 (ja) | 2016-03-07 | 2016-03-07 | 計算機及びデータベース管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017154065A1 JPWO2017154065A1 (ja) | 2018-11-22 |
JP6530553B2 true JP6530553B2 (ja) | 2019-06-12 |
Family
ID=59790180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018503859A Active JP6530553B2 (ja) | 2016-03-07 | 2016-03-07 | 計算機及びデータベース管理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10866941B2 (ja) |
JP (1) | JP6530553B2 (ja) |
WO (1) | WO2017154065A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11093493B1 (en) * | 2018-09-28 | 2021-08-17 | Amazon Technologies, Inc. | Dynamically switching between query and scan for optimizing table reads |
US11360669B2 (en) | 2020-04-01 | 2022-06-14 | Hitachi, Ltd. | Storage device accelerator providing aggregation of divided plaintext data |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000305822A (ja) | 1999-04-26 | 2000-11-02 | Denso Corp | データベース管理装置,データベースレコード抽出装置,データベース管理方法及びデータベースレコード抽出方法 |
AU2004290281A1 (en) | 2003-05-23 | 2005-05-26 | Washington University | Intelligent data storage and processing using FPGA devices |
JP4451722B2 (ja) | 2004-06-08 | 2010-04-14 | 三菱電機株式会社 | データベースサーバ及びデータベースシステム |
JP5303213B2 (ja) | 2008-07-23 | 2013-10-02 | 株式会社日立製作所 | データ圧縮処理を伴うデータ管理方法 |
US8279096B2 (en) * | 2010-05-19 | 2012-10-02 | Red Hat, Inc. | Parallel compression for dictionary-based sequential coders |
US8631000B2 (en) | 2010-09-30 | 2014-01-14 | International Business Machines Corporation | Scan sharing for query predicate evaluations in column-based in-memory database systems |
US10235377B2 (en) * | 2013-12-23 | 2019-03-19 | Sap Se | Adaptive dictionary compression/decompression for column-store databases |
US10552044B2 (en) | 2014-03-27 | 2020-02-04 | Hitachi, Ltd. | Storage apparatus, data processing method and storage system wherein compressed data is read in parallel, said data stored in buffer by size and read from said buffer, in order of when said data is stored in said buffer |
-
2016
- 2016-03-07 WO PCT/JP2016/056934 patent/WO2017154065A1/ja active Application Filing
- 2016-03-07 US US15/552,820 patent/US10866941B2/en active Active
- 2016-03-07 JP JP2018503859A patent/JP6530553B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JPWO2017154065A1 (ja) | 2018-11-22 |
US20180173736A1 (en) | 2018-06-21 |
WO2017154065A1 (ja) | 2017-09-14 |
US10866941B2 (en) | 2020-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10374792B1 (en) | Layout-independent cryptographic stamp of a distributed dataset | |
US10346076B1 (en) | Method and system for data deduplication based on load information associated with different phases in a data deduplication pipeline | |
US10824599B2 (en) | Information processing apparatus, information processing method, and recording medium | |
US10585856B1 (en) | Utilizing data access patterns to determine compression block size in data storage systems | |
US9973210B1 (en) | Reduction of execution stalls of LZ4 decompression via parallelization | |
WO2015145647A1 (ja) | ストレージ装置とデータ処理方法及びストレージシステム | |
JP2008217209A (ja) | 差分スナップショット管理方法、計算機システム及びnas計算機 | |
KR102535666B1 (ko) | 대형 그래프 처리를 위한 그래프 데이터 분할 | |
US20150227540A1 (en) | System and method for content-aware data compression | |
US11314432B2 (en) | Managing data reduction in storage systems using machine learning | |
CN107423425B (zh) | 一种对k/v格式的数据快速存储和查询方法 | |
CN104035822A (zh) | 一种低开销的高效内存去冗余方法及系统 | |
JP6530553B2 (ja) | 計算機及びデータベース管理方法 | |
US11226769B2 (en) | Large-scale storage system and data placement method in large-scale storage system | |
US10083121B2 (en) | Storage system and storage method | |
CN114930725A (zh) | 存储系统中的容量缩减 | |
JP6262878B2 (ja) | ストレージ装置 | |
US10803035B2 (en) | Storage device, computer system, and control method for storage device | |
JP2022516502A (ja) | コンピュータメモリにおける重複および値冗長性を排除するためのシステム、方法、および装置 | |
US11615063B2 (en) | Similarity deduplication | |
US10664442B1 (en) | Method and system for data consistency verification in a storage system | |
JP6695973B2 (ja) | 計算機システム及びデータベース管理方法 | |
US20180364943A1 (en) | Memory management architecture and system therefor | |
US11150827B2 (en) | Storage system and duplicate data management method | |
US20220236870A1 (en) | Method and system for compression in block-based storage systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180614 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190319 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190514 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190516 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6530553 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |