JP6638821B2 - データベースのアーカイビング方法及び装置、アーカイビングされたデータベースの検索方法及び装置 - Google Patents
データベースのアーカイビング方法及び装置、アーカイビングされたデータベースの検索方法及び装置 Download PDFInfo
- Publication number
- JP6638821B2 JP6638821B2 JP2018543247A JP2018543247A JP6638821B2 JP 6638821 B2 JP6638821 B2 JP 6638821B2 JP 2018543247 A JP2018543247 A JP 2018543247A JP 2018543247 A JP2018543247 A JP 2018543247A JP 6638821 B2 JP6638821 B2 JP 6638821B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- group
- records
- record
- compressed data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 126
- 238000007906 compression Methods 0.000 claims description 91
- 230000006835 compression Effects 0.000 claims description 91
- 238000003860 storage Methods 0.000 claims description 12
- 238000007726 management method Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 238000013144 data compression Methods 0.000 claims description 9
- 238000002360 preparation method Methods 0.000 claims description 7
- 230000006837 decompression Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 101100328886 Caenorhabditis elegans col-2 gene Proteins 0.000 description 4
- 101100328884 Caenorhabditis elegans sqt-3 gene Proteins 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
- G06F11/1451—Management of the data involved in backup or backup restore by selection of backup contents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/113—Details of archiving
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Claims (12)
- データベースのアーカイビング装置によってデータのアーカイビングをする原本テーブルにおいて、時間及びフィールド(field)値のうち少なくともいずれか一つに対する選別情報に基づいて複数のレコード(record)を含む少なくとも一つのレコードグループを選別する段階と、
データベースのアーカイビング装置によって選別された少なくとも一つの前記レコードグループのそれぞれについて、前記レコードグループ別に圧縮して生成されたグループ圧縮データ及び前記グループ圧縮データに対応する前記選別情報を圧縮テーブルに格納する段階と、
データベースのアーカイビング装置によって選別された少なくとも一つの前記レコードグループに含まれた複数のレコードを前記原本テーブルから削除する段階と、
選別された少なくとも一つの前記レコードグループの中でレコードの個数が閾値を超える超過レコードグループが存在すると、前記超過レコードグループをレコードの個数が前記閾値以下である複数の前記レコードグループに分離する段階と、
を含み、
前記選別情報を圧縮テーブルに格納する段階は、
分離された複数の前記レコードグループのそれぞれに付与された一連番号を前記圧縮テーブルにさらに格納することを特徴とするデータベースのアーカイビング方法。 - 前記選別情報を圧縮テーブルに格納する段階は、
選別された少なくとも一つの前記レコードグループのそれぞれについて、
前記レコードグループに含まれた複数のレコードのデータをバッファに格納する段階と、
前記バッファに格納されたデータを圧縮して前記グループ圧縮データを生成する段階と、
生成された前記グループ圧縮データに対応する前記選別情報を取得する段階と、
前記グループ圧縮データを前記選別情報と前記圧縮テーブル上の同一のレコードに格納する段階と、
を含むことを特徴とする請求項1に記載のデータベースのアーカイビング方法。 - データのアーカイビングをする原本テーブルにおいて、時間及びフィールド値のうち少なくともいずれか一つに対する選別情報に基づいて複数のレコードを含む少なくとも一つのレコードグループを選別するデータ選別部と、
選別された少なくとも一つの前記レコードグループのそれぞれについて、前記レコードグループ別に圧縮してグループ圧縮データを生成するデータ圧縮部と、
前記グループ圧縮データ及び前記グループ圧縮データに対応する前記選別情報を圧縮テーブルに格納し、選別された少なくとも一つの前記レコードグループに含まれた複数のレコードを前記原本テーブルから削除するDB管理部と、
を含み、
前記データ選別部は、
選別された少なくとも一つの前記レコードグループの中でレコードの個数が閾値を超える超過レコードグループが存在すると、前記超過レコードグループをレコードの個数が前記閾値以下である複数の前記レコードグループにさらに分離し、
前記DB管理部は、
分離された複数の前記レコードグループのそれぞれに付与された一連番号を前記圧縮テーブルにさらに格納すること
を特徴とするデータベースのアーカイビング装置。 - 前記データ圧縮部は、
選別された少なくとも一つの前記レコードグループのそれぞれについて、
前記レコードグループに含まれた複数のレコードのデータをバッファに格納し、前記バッファに格納されたデータを圧縮して前記グループ圧縮データを生成し、
前記DB管理部は、
生成された前記グループ圧縮データに対応する前記選別情報を取得し、前記グループ圧縮データを前記選別情報と前記圧縮テーブル上の同一のレコードに格納することを特徴とする請求項3に記載のデータベースのアーカイビング装置。 - 時間及びフィールド値のうち少なくともいずれか一つに対する選別情報及び前記選別情報に対応する複数のレコードを圧縮して生成されたグループ圧縮データを含む圧縮テーブルで使用者が所望のレコードを検索するための検索条件を受信する段階と、
検索が行われるコンピュータの性能及び前記検索条件を満たす前記選別情報に対応する前記グループ圧縮データの個数のうち少なくともいずれか一つに基づいて前記レコードの検索を並列に処理するためのDB検索過程の個数を決定する段階と、
決定された前記DB検索過程の個数に基づいて前記検索条件を満たすレコードの検索を並列に行う段階と、
を含み、
前記並列に処理するためのDB検索過程の個数を決定する段階は、
前記コンピュータに含まれたCPUの個数、メモリーの容量及び格納装置の入出力速度のうち少なくともいずれか一つに対するコンピュータ性能情報を収集する段階と、
前記圧縮テーブルに格納された前記グループ圧縮データの中で前記受信された検索条件を満たす前記選別情報に対応する前記グループ圧縮データの個数を決定する段階と、
収集された前記コンピュータ性能情報及び前記決定されたグループ圧縮データの個数のうち少なくともいずれか一つに基づいて前記レコードの検索を並列に処理するためのDB検索過程の個数を決定する段階と、
を含むことを特徴とするアーカイビングされたデータベースの検索方法。 - 時間及びフィールド値のうち少なくともいずれか一つに対する選別情報及び前記選別情報に対応する複数のレコードを圧縮して生成されたグループ圧縮データを含む圧縮テーブルで使用者が所望のレコードを検索するための検索条件を受信する段階と、
検索が行われるコンピュータの性能及び前記検索条件を満たす前記選別情報に対応する前記グループ圧縮データの個数のうち少なくともいずれか一つに基づいて前記レコードの検索を並列に処理するためのDB検索過程の個数を決定する段階と、
決定された前記DB検索過程の個数に基づいて前記検索条件を満たすレコードの検索を並列に行う段階と、
を含み、
前記検索条件を満たすレコードの検索を並列に行う段階は、
決定された個数の前記DB検索過程のそれぞれについて、前記検索条件を満たす前記選別情報に対応する前記グループ圧縮データの個数に基づいて少なくとも一つの前記グループ圧縮データを割り当てる段階と、
それぞれの前記DB検索過程別に前記割り当てられた少なくとも一つのグループ圧縮データの圧縮解除及び前記検索条件を満たすレコードの検索を並列に行う段階と、
を含むことを特徴とするアーカイビングされたデータベースの検索方法。 - 前記検索条件を満たすレコードの検索を並列に行う段階は、
前記圧縮テーブルでアーカイビングした原本テーブルに含まれたフィールドの種類、大きさ、順序及び名称に対する情報であるテーブル構造情報にさらに基づくことを特徴とする請求項5に記載のアーカイビングされたデータベースの検索方法。 - 前記DB検索過程は、
それぞれの前記DB検索過程別に割り当てられたプロセス(process)またはスレッド(thread)を利用して検索を行うことを特徴とする請求項5に記載のアーカイビングされたデータベースの検索方法。 - 時間及びフィールド値のうち少なくともいずれか一つに対する選別情報及び前記選別情報に対応する複数のレコードを圧縮して生成されたグループ圧縮データを含む圧縮テーブルで使用者が所望のレコードを検索するための検索条件を受信する受信部と、
検索が行われるコンピュータの性能及び前記検索条件を満たす前記選別情報に対応する前記グループ圧縮データの個数のうち少なくともいずれか一つに基づいて前記レコードの検索を並列に処理するためのDB検索過程の個数を決定する検索準備部と、
決定された前記DB検索過程の個数に基づいて前記検索条件を満たすレコードの検索を並列に行う並列検索部と、
を含み、
前記検索準備部は、
前記コンピュータに含まれたCPUの個数、メモリーの容量及び格納装置の入出力速度のうち少なくともいずれか一つに対するコンピュータ性能情報を収集し、
前記圧縮テーブルに格納された前記グループ圧縮データの中で前記受信された検索条件を満たす前記選別情報に対応する前記グループ圧縮データの個数を決定し、
収集された前記コンピュータ性能情報及び前記決定されたグループ圧縮データの個数のうち少なくともいずれか一つに基づいて前記レコードの検索を並列に処理するためのDB検索過程の個数を決定することを特徴とするアーカイビングされたデータベースの検索装置。 - 時間及びフィールド値のうち少なくともいずれか一つに対する選別情報及び前記選別情報に対応する複数のレコードを圧縮して生成されたグループ圧縮データを含む圧縮テーブルで使用者が所望のレコードを検索するための検索条件を受信する受信部と、
検索が行われるコンピュータの性能及び前記検索条件を満たす前記選別情報に対応する前記グループ圧縮データの個数のうち少なくともいずれか一つに基づいて前記レコードの検索を並列に処理するためのDB検索過程の個数を決定する検索準備部と、
決定された前記DB検索過程の個数に基づいて前記検索条件を満たすレコードの検索を並列に行う並列検索部と、
を含み、
前記並列検索部は、
決定された前記個数のDB検索過程のそれぞれについて、前記検索条件を満たす前記選別情報に対応する前記グループ圧縮データの個数に基づいて少なくとも一つの前記グループ圧縮データを割り当て、
それぞれの前記DB検索過程別に前記割り当てられた少なくとも一つのグループ圧縮データの圧縮解除及び前記検索条件を満たすレコードの検索を並列に行うことを特徴とするアーカイビングされたデータベースの検索装置。 - 前記並列検索部は、
前記圧縮テーブルでアーカイビングした原本テーブルに含まれたフィールドの種類、大きさ、順序及び名称に対する情報であるテーブル構造情報にさらに基づくことを特徴とする請求項9に記載のアーカイビングされたデータベースの検索装置。 - 前記DB検索過程は、
それぞれの前記DB検索過程別に割り当てられたプロセスまたはスレッドを利用して検索を行うことを特徴とする請求項9に記載のアーカイビングされたデータベースの検索装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2016-0023401 | 2016-02-26 | ||
KR1020160023401A KR101663547B1 (ko) | 2016-02-26 | 2016-02-26 | 데이터베이스의 아카이빙 방법 및 장치, 아카이빙된 데이터베이스의 검색 방법 및 장치 |
PCT/KR2016/011463 WO2017146337A1 (ko) | 2016-02-26 | 2016-10-13 | 데이터베이스의 아카이빙 방법 및 장치, 아카이빙된 데이터베이스의 검색 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019512125A JP2019512125A (ja) | 2019-05-09 |
JP6638821B2 true JP6638821B2 (ja) | 2020-01-29 |
Family
ID=57145318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018543247A Active JP6638821B2 (ja) | 2016-02-26 | 2016-10-13 | データベースのアーカイビング方法及び装置、アーカイビングされたデータベースの検索方法及び装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11030050B2 (ja) |
EP (1) | EP3422204A4 (ja) |
JP (1) | JP6638821B2 (ja) |
KR (1) | KR101663547B1 (ja) |
CN (1) | CN108701134A (ja) |
AU (1) | AU2016394743A1 (ja) |
WO (1) | WO2017146337A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110874417B (zh) | 2018-09-04 | 2024-04-16 | 华为技术有限公司 | 数据检索的方法和装置 |
CN111090652B (zh) * | 2019-12-20 | 2023-05-23 | 山大地纬软件股份有限公司 | 一种可水平扩展归档数据库的数据归档方法和装置 |
US11907713B2 (en) | 2019-12-28 | 2024-02-20 | Intel Corporation | Apparatuses, methods, and systems for fused operations using sign modification in a processing element of a configurable spatial accelerator |
KR102559290B1 (ko) * | 2020-01-06 | 2023-07-26 | 주식회사 아미크 | 하이브리드 클라우드 기반의 실시간 데이터 아카이빙 방법 및 시스템 |
US11676066B2 (en) * | 2020-01-17 | 2023-06-13 | Western Digital Technologies, Inc. | Parallel model deployment for artificial intelligence using a primary storage system |
KR102256814B1 (ko) | 2020-09-10 | 2021-05-27 | 주식회사 아미크 | 목적 데이터 선별 방법 및 시스템 |
CN113111032B (zh) * | 2021-04-20 | 2022-03-08 | 河南水利与环境职业学院 | 一种档案管理系统数据归档方法和系统 |
CN113791742B (zh) * | 2021-11-18 | 2022-03-25 | 南湖实验室 | 一种高性能的数据湖系统及数据存储方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9477729B2 (en) * | 2004-02-20 | 2016-10-25 | Informatica Llc | Domain based keyword search |
US8832045B2 (en) | 2006-04-07 | 2014-09-09 | Data Storage Group, Inc. | Data compression and storage techniques |
US8229902B2 (en) * | 2006-11-01 | 2012-07-24 | Ab Initio Technology Llc | Managing storage of individually accessible data units |
JP2010287024A (ja) * | 2009-06-11 | 2010-12-24 | Yaskawa Information Systems Co Ltd | アーカイブシステム、アーカイブシステム用検索プログラムならびにアーカイブシステムによる検索方法 |
JP5621229B2 (ja) * | 2009-08-27 | 2014-11-12 | 日本電気株式会社 | ストレージシステム、管理方法及びプログラム |
US9767098B2 (en) * | 2012-08-08 | 2017-09-19 | Amazon Technologies, Inc. | Archival data storage system |
JP2013065224A (ja) * | 2011-09-20 | 2013-04-11 | Kddi Corp | メールアーカイブシステム |
KR20140072929A (ko) * | 2012-11-16 | 2014-06-16 | 현대중공업 주식회사 | 아카이빙 작업수행 자동화 방법 |
EP2937794B1 (en) * | 2014-04-22 | 2016-08-17 | DataVard GmbH | Method and system for archiving digital data |
-
2016
- 2016-02-26 KR KR1020160023401A patent/KR101663547B1/ko active IP Right Grant
- 2016-10-13 CN CN201680081603.6A patent/CN108701134A/zh not_active Withdrawn
- 2016-10-13 JP JP2018543247A patent/JP6638821B2/ja active Active
- 2016-10-13 EP EP16891741.7A patent/EP3422204A4/en not_active Withdrawn
- 2016-10-13 AU AU2016394743A patent/AU2016394743A1/en not_active Abandoned
- 2016-10-13 WO PCT/KR2016/011463 patent/WO2017146337A1/ko active Application Filing
- 2016-10-13 US US16/077,208 patent/US11030050B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN108701134A (zh) | 2018-10-23 |
US20190026189A1 (en) | 2019-01-24 |
KR101663547B1 (ko) | 2016-10-07 |
JP2019512125A (ja) | 2019-05-09 |
EP3422204A4 (en) | 2020-01-22 |
EP3422204A1 (en) | 2019-01-02 |
US11030050B2 (en) | 2021-06-08 |
WO2017146337A1 (ko) | 2017-08-31 |
AU2016394743A1 (en) | 2018-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6638821B2 (ja) | データベースのアーカイビング方法及び装置、アーカイビングされたデータベースの検索方法及び装置 | |
JP6598101B2 (ja) | インデックス情報を生成するデータベースのアーカイビング方法及び装置、インデックス情報を含むアーカイビングされたデータベースの検索方法及び装置 | |
US20140215170A1 (en) | Block Compression in a Key/Value Store | |
US9305041B2 (en) | Compression of serialized B-tree data | |
KR101725172B1 (ko) | 개별적으로 액세스 가능한 데이터 유닛의 스토리지 관리 방법 | |
JP2012504824A (ja) | 列ベースのデータ符号化構造の問い合わせのための効率的な大規模結合 | |
US9280551B2 (en) | De-duplication deployment planning | |
CN107391769B (zh) | 一种索引查询方法及装置 | |
CN111611250A (zh) | 数据存储设备、数据查询方法、装置、服务器及存储介质 | |
CN106897280A (zh) | 数据查询方法及装置 | |
US9183320B2 (en) | Data managing method, apparatus, and recording medium of program, and searching method, apparatus, and medium of program | |
US20140012879A1 (en) | Database management system, apparatus, and method | |
US10083121B2 (en) | Storage system and storage method | |
JP6273969B2 (ja) | データ加工装置、情報処理装置、方法、およびプログラム | |
JP6150785B2 (ja) | 個別にアクセス可能なデータ単位の記憶の管理 | |
KR102529704B1 (ko) | 인 메모리 데이터베이스의 데이터를 처리하는 방법 및 장치 | |
JP2020108045A (ja) | データ圧縮方法 | |
US20190057097A1 (en) | Information processing device, information processing method, and computer-readable recording medium | |
CN115840785A (zh) | 一种分布式终端数据查询系统及方法 | |
CN115510051A (zh) | 数据处理方法、查询方法、装置及电子设备 | |
WO2017158812A1 (ja) | データ分類方法及びデータ分類装置 | |
Zhang et al. | Improving Storage Efficiency for Raw Image Photo Repository by Exploiting Similarity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180823 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190730 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6638821 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |