JP2021111352A - コンピュータプログラム、データアーカイブ方法、記憶媒体およびコンピュータ装置 - Google Patents
コンピュータプログラム、データアーカイブ方法、記憶媒体およびコンピュータ装置 Download PDFInfo
- Publication number
- JP2021111352A JP2021111352A JP2020175322A JP2020175322A JP2021111352A JP 2021111352 A JP2021111352 A JP 2021111352A JP 2020175322 A JP2020175322 A JP 2020175322A JP 2020175322 A JP2020175322 A JP 2020175322A JP 2021111352 A JP2021111352 A JP 2021111352A
- Authority
- JP
- Japan
- Prior art keywords
- data
- target system
- function
- compressed
- partition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/113—Details of archiving
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/122—File system administration, e.g. details of archiving or snapshots using management policies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1744—Redundancy elimination performed by the file system using compression, e.g. sparse files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2308—Concurrency control
- G06F16/2315—Optimistic concurrency control
- G06F16/2322—Optimistic concurrency control using timestamps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24573—Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
- G06F16/278—Data partitioning, e.g. horizontal or vertical partitioning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】ハイブリッドクラウド基盤のリアルタイムデータアーカイブ方法およびシステムを提供する。【解決手段】データを格納する対象システムから遠隔機能の呼び出しを受信し、このような遠隔機能の呼び出しに応答し、対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第1機能を、前記ネットワークを介して前記対象システムに提供し、前記格納システムにアーカイブされたデータを照会するための第2機能を、前記ネットワークを介して前記対象システムに提供することにより、遠隔ニアライン(near−line)データアーカイブ機能を提供することができる、データアーカイブ方法および装置を提供する。【選択図】図3
Description
以下の説明は、ハイブリッドクラウド基盤のリアルタイムデータアーカイブ方法およびそのシステムに関する。
近年は、データ関連の規制強化、医療産業の成長と患者のデータ保存管理の重要性の増大、企業内のデータ管理への関心が高まっており、データアーカイブに対する研究の必要性が高まっている。例えば、データ関連の規制の観点において、金融取引データや医療情報のようなデータは、消費者権利保護のために数年から数十年にわったってデータを保管するように法で規定されているため、各種データ関連の規制によって長期間のデータ保存が必要な状況である。また、医療産業分野では、画像診断の依存度が上昇して医療画像のデータ量が増加するにともない、データの保管や管理のためのストレージおよびバックアップの需要をはじめ、増加し続けるデータ管理のためのアーカイブシステムの必要性が高まっている。また、企業のデータ管理の観点では、企業が送受信する膨大な量のデータをサーバで保管し、サーバに保存されたデータをリアルタイムで復旧したりバックアップしたりする作業だけでなく、重要なデータを保安しながら管理する機能の重要性が増している。さらに、製造業の自動化の観点では、伝統的に労動集約的な製造会社の多くは中国やインドなどの低賃金国に工場を移転したが、ロボット技術の発展によって生産の効率性と高い品質の融合型ロボット工場が構築され、工程自動化が加速化している。
第4次産業革命時代の渡来によってビックデータ分野が注目されるようになったが、現在の国内のビックデータ分野は、サーバ、ストレージ、ネットワークなどのインフラ投資に集中している量産型であるため、今後のアーカイブ技術の開発により、インフラに対する投資を分散させ、ソフトウェアおよびサービス分野への発展の拡大が求められている。これにより、従来に比べて高いデータ圧縮率と圧縮速度を備えながら迅速なデータ照会が可能なアーカイブ技術の開発への需要が高まっている。
データを格納する対象システムから遠隔機能の呼び出しを受信し、このような遠隔機能の呼び出しに応答し、対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第1機能を、前記ネットワークを介して前記対象システムに提供し、前記格納システムにアーカイブされたデータを照会するための第2機能を、前記ネットワークを介して前記対象システムに提供することにより、遠隔ニアライン(near−line)データアーカイブ機能を提供することができる、データアーカイブ方法および装置を提供する。
少なくとも1つのプロセッサを含むコンピュータ装置が実行するデータアーカイブ方法であって、前記少なくとも1つのプロセッサにより、データを格納する対象システムから遠隔機能の呼び出しを受信する段階、前記少なくとも1つのプロセッサにより、前記遠隔機能の呼び出しに応答し、前記対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第1機能を、前記ネットワークを介して前記対象システムに提供する段階、および前記少なくとも1つのプロセッサにより、前記格納システムにアーカイブされたデータを照会するための第2機能を、前記ネットワークを介して前記対象システムに提供する段階を含む、データアーカイブ方法を提供する。
一側によると、前記第1機能を提供する段階は、前記対象システムのローカルデータベースに格納されたデータのうちの少なくとも一部を圧縮して前記ローカルデータベースのテーブルにアーカイブするための機能を提供することを特徴としてよい。
他の側面によると、前記第1機能を提供する段階は、前記対象システムのローカルデータベースに格納されたデータのうちの少なくとも一部を圧縮して前記対象システムの外部データベースのテーブルにアーカイブするための機能を提供することを特徴としてよい。
また他の側面によると、前記第1機能を提供する段階は、前記対象システムのローカルデータベースに格納されたデータのうちの少なくとも一部をファイルとして圧縮して前記対象システムの外部システムが含む格納場所にアーカイブするための機能を提供することを特徴としてよい。
また他の側面によると、前記第1機能を提供する段階は、前記対象システムのローカルデータベースのテーブルに含まれたデータレコードに対するパーティションをデータレコードの選別情報に基づいて決定するように前記対象システムを制御する第1−1機能、前記パーティションごとにデータレコードを圧縮して圧縮パーティションを生成するように前記対象システムを制御する第1−2機能、前記圧縮パーティションと前記圧縮パーティションを固有に識別する格納キーとを連係させて圧縮テーブルに格納するように前記対象システムを制御する第1−3機能、および前記格納キーと前記選別情報とを連係させて前記ローカルデータベースのインデックステーブルに記録するように前記対象システムを制御する第1−4機能を提供することを特徴としてよい。
また他の側面によると、前記選別情報は、該当のデータレコードの任意のフィールド値を含み、前記第1−4機能は、前記格納キーと前記任意のフィールド値とを連係させて前記ローカルデータベースのグループインデックステーブルに記録するように前記対象システムを制御することを特徴としてよい。
また他の側面によると、前記選別情報は、該当のデータレコードの時間に関する情報を含み、前記第1−4機能は、前記格納キーと前記時間に関する情報とを連係させて期間インデックステーブルに記録するように前記対象システムを制御することを特徴としてよい。
また他の側面によると、前記第1機能を提供する段階は、前記テーブルに含まれたデータレコードそれぞれに対し、プライマリキー(primary key)と、該当のデータレコードを含んで圧縮された圧縮パーティション内での該当のデータレコードの位置であるキーインデックス情報と、該当のデータレコードを含んで圧縮された圧縮パーティションに対応する格納キーとを連係させてキーインデックステーブルに記録するように前記対象システムを制御する第1−5機能をさらに提供することを特徴としてよい。
また他の側面によると、前記第1−5機能は、前記プライマリキーによって前記テーブルと連結する連結テーブルでデータレコードを圧縮して生成された第2圧縮パーティションに対し、前記第2圧縮パーティションに含まれたデータレコードのうちで前記テーブルに含まれたデータレコードと前記プライマリキーが等しいデータレコードを検索し、前記検索されたデータレコードに対し、前記第2圧縮パーティション内での位置であるサブインデックス情報を前記キーインデックステーブル上の前記プライマリキーが等しいデータレコードに対してさらに記録するように前記対象システムを制御することを特徴としてよい。
また他の側面によると、前記第1機能を提供する段階は、前記圧縮されたデータレコードを前記テーブルから削除するように前記対象システムを制御する第1−6機能をさらに提供することを特徴としてよい。
また他の側面によると、前記第1機能を提供する段階は、前記削除されたデータレコードの復元要求に応答し、前記インデックステーブルで前記復元要求が含む識別情報と連係する格納キーを検索し、前記圧縮テーブルで前記検索された格納キーと連係する圧縮パーティションを検索し、前記検索された圧縮パーティションの圧縮を解除して前記削除されたデータレコードを復元し、前記復元されたデータレコードを前記識別情報に基づいて前記テーブルに記録するように前記対象システムを制御する第1−7機能をさらに提供することを特徴としてよい。
また他の側面によると、前記第1−2機能は、前記決定されたパーティションに含まれたデータレコードをバイナリオブジェクトとして圧縮して前記圧縮パーティションを生成するように前記対象システムを制御することを特徴としてよい。
また他の側面によると、前記第2機能を提供する段階は、データレコードの選別情報を含む検索条件を受信するように前記対象システムを制御する第2−1機能、前記対象システムのローカルデータベース上でデータレコードの選別情報と該当のデータレコードが含まれた圧縮パーティションを固有に識別する格納キーとを連係させて記録するインデックステーブルから、前記検索条件が含む選別情報と連係する格納キーを検索するように前記対象システムを制御する第2−2機能、および格納キーと圧縮パーティションとを連係させて記録する圧縮テーブルで、前記検索された格納キーと連係する圧縮パーティションを検索するように前記対象システムを制御する第2−3機能を提供することを特徴としてよい。
また他の側面によると、前記データアーカイブ方法は、前記格納システムにアーカイブされたデータの寿命周期を管理するための第3機能を、前記ネットワークを介して前記対象システムに提供する段階をさらに含むことを特徴としてよい。
さらに他の側面によると、前記第3機能を提供する段階は、前記格納システムにアーカイブされたデータの保管期間が経過した場合、データベースのテーブルに圧縮された状態で管理されるデータをファイルとしてアーカイブして保管するように前記対象システムを制御するための第3−1機能、および前記ファイルとしてアーカイブされたデータを削除するように前記対象システムを制御するための第3−2機能を提供することを特徴としてよい。
コンピュータ装置と結合して前記方法をコンピュータ装置に実行させるためにコンピュータ読み取り可能な記録媒体に記録された、コンピュータプログラムを提供する。
前記方法をコンピュータ装置に実行させるためのプログラムが記録されている、コンピュータ読み取り可能な記録媒体を提供する。
コンピュータ読み取り可能な命令を実行するように実現される少なくとも1つのプロセッサを含み、前記少なくとも1つのプロセッサにより、データを格納する対象システムから遠隔機能の呼び出しを受信し、前記遠隔機能の呼び出しに応答し、前記対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第1機能を、前記ネットワークを介して前記対象システムに提供し、前記格納システムにアーカイブされたデータを照会するための第2機能を、前記ネットワークを介して前記対象システムに提供することを特徴とするコンピュータ装置を提供する。
データを格納する対象システムから遠隔機能の呼び出しを受信し、このような遠隔機能の呼び出しに応答し、対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第1機能を、前記ネットワークを介して前記対象システムに提供し、前記格納システムにアーカイブされたデータを照会するための第2機能を、前記ネットワークを介して前記対象システムに提供することにより、遠隔ニアライン(near−line)データアーカイブ機能を提供することができる。
本発明は、多様な変更が加えられても、多様な実施形態を有してもよいものであり、特定の実施形態については、図面を参照しながら以下の詳細な説明において詳しく説明する。しかし、これは、本発明を特定の実施形態に対して限定しようとするものではなく、本発明の思想および技術範囲に含まれるすべての変更、均等物、あるいは置換物を含むものと理解されなければならない。各図面を説明するにあたり、類似の構成要素には類似の参照符号を付与した。
第1、第2、A、Bなどの用語は、多様な構成要素を説明するために使用されるものに過ぎず、前記構成要素がこのような用語によって限定されてはならない。前記用語は、1つの構成要素を他の構成要素と区別することを目的とするものに過ぎない。例えば、本発明の権利範囲を逸脱しない限り、第1構成要素が第2構成要素と命名されてもよく、同じように、第2構成要素が第1構成要素と命名されてもよい。および/またはという用語は、複数の関連して記載された項目の組み合わせ、または複数の関連して記載された項目のうちのいずれかの項目を含む。
ある構成要素が他の構成要素に「連結されて」いるか「接続されて」いるという記載は、その他の構成要素に直接に連結あるいは接続されている状態はもちろん、その中間に他の構成要素が存在する場合も含まれると理解されなければならない。この反面、ある構成要素が他の構成要素に「直接に連結されて」いるか「直接に接続されて」いると記載されるときには、その中間に他の構成要素が存在しない状態であると理解されなければならない。
本出願で使用される用語は、特定の実施形態を説明するためのものに過ぎず、本発明を限定しようと意図するものではない。単数の表現は、文脈において明らかな説明がない限り、複数の表現も含む。本出願において、「含む」または「有する」などの用語は、明細書に記載された特徴、数字、段階、動作、構成要素、部品、またはこれらを組み合わせたものが存在することを指定するためのものであり、1つまたはそれ以上の他の特徴や数字、段階、動作、構成要素、部品、またはこれらを組み合わせたものなどの存在または付加的な可能性を予め排除しないものと理解されなければならない。
異なるように定義されない限り、技術的や科学的な用語を含んでここで使用されるすべての用語は、本発明が属する技術分野において通常の知識を有する者が一般的に理解しているものと同じ意味をもつ。一般的に使用される、事前に定義されたものと同じ用語は、関連技術の文脈に記載されている意味と一致する意味をもつと解釈されなければならず、本出願で明らかに定義しない限り、理想的や過度に形式的な意味として解釈されてはならない。
以下、実施形態について、添付の図面を参照しながら詳しく説明する。
本発明の実施形態に係るデータアーカイブシステムは、少なくとも1つのコンピュータ装置によって実現されてよく、本発明の実施形態に係るデータアーカイブ方法は、データアーカイブシステムに含まれる少なくとも1つのコンピュータ装置によって実行されてよい。コンピュータ装置においては、本発明の一実施形態に係るコンピュータプログラムがインストールされて実現されてよく、コンピュータ装置は、実現するコンピュータプログラムの制御にしたがって本発明の実施形態に係るデータ処理方法を実行してよい。上述したコンピュータプログラムは、コンピュータ装置と結合してデータアーカイブ方法をコンピュータ装置に実行させるためにコンピュータ読み取り可能な記録媒体に記録されてよい。
図1は、本発明の一実施形態における、ネットワーク環境の例を示した図である。図1のネットワーク環境は、複数の電子機器110、120、130、140、複数のサーバ150、160、およびネットワーク170を含む例を示している。このような図1は、発明の説明のための一例に過ぎず、電子機器の数やサーバの数が図1のように限定されることはない。また、図1のネットワーク環境は、本実施形態に適用可能な環境のうちの1つの例を説明するものに過ぎず、本実施形態に適用可能な環境が図1のネットワーク環境に限定されることはない。
複数の電子機器110、120、130、140は、コンピュータ装置によって実現される固定端末や移動端末であってよい。複数の電子機器110、120、130、140の例としては、スマートフォン、携帯電話、ナビゲーション、PC(personal computer)、ノート型PC、デジタル放送用端末、PDA(Personal Digital Assistant)、PMP(Portable Multimedia Player)、タブレットなどがある。一例として、図1では、電子機器110の例としてスマートフォンを示しているが、本発明の実施形態において、電子機器110は、実質的に無線または有線通信方式を利用し、ネットワーク170を介して他の電子機器120、130、140および/またはサーバ150、160と通信することのできる多様な物理的なコンピュータ装置のうちの1つを意味してよい。
通信方式が限定されることはなく、ネットワーク170が含むことのできる通信網(一例として、移動通信網、有線インターネット、無線インターネット、放送網)を利用する通信方式だけではなく、機器間の近距離無線通信が含まれてもよい。例えば、ネットワーク170は、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークのうちの1つ以上の任意のネットワークを含んでよい。さらに、ネットワーク170は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スター−バスネットワーク、ツリーまたは階層的ネットワークなどを含むネットワークトポロジのうちの任意の1つ以上を含んでもよいが、これらに限定されることはない。
サーバ150、160それぞれは、複数の電子機器110、120、130、140とネットワーク170を介して通信して命令、コード、ファイル、コンテンツ、サービスなどを提供する1つ以上のコンピュータ装置によって実現されてよい。例えば、サーバ150は、ネットワーク170を介して接続した複数の電子機器110、120、130、140にサービス(一例として、アーカイブサービス、ファイル配布サービス、地図サービス、コンテンツ提供サービス、グループ通話サービス(または、音声会議サービス)、メッセージングサービス、メールサービス、ソーシャルネットワークサービス、翻訳サービス、金融サービス、決済サービス、検索サービスなど)を提供するシステムであってよい。
図2は、本発明の一実施形態における、コンピュータ装置の例を示したブロック図である。上述した複数の電子機器110、120、130、140それぞれやサーバ150、160それぞれは、図2に示したコンピュータ装置200によって実現されてよい。
このようなコンピュータ装置200は、図2に示すように、メモリ210、プロセッサ220、通信インタフェース230、および入力/出力インタフェース240を含んでよい。メモリ210は、コンピュータ読み取り可能な記録媒体であって、RAM(random access memory)、ROM(read only memory)、およびディスクドライブのような永続的大容量記録装置を含んでよい。ここで、ROMやディスクドライブのような永続的大容量記録装置は、メモリ210とは区分される別の永続的記録装置としてコンピュータ装置200に含まれてもよい。また、メモリ210には、オペレーティングシステムと、少なくとも1つのプログラムコードが記録されてよい。このようなソフトウェア構成要素は、メモリ210とは別のコンピュータ読み取り可能な記録媒体からメモリ210にロードされてよい。このような別のコンピュータ読み取り可能な記録媒体は、フロッピー(登録商標)ドライブ、ディスク、テープ、DVD/CD−ROMドライブ、メモリカードなどのコンピュータ読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータ読み取り可能な記録媒体ではない通信インタフェース230を通じてメモリ210にロードされてもよい。例えば、ソフトウェア構成要素は、ネットワーク170を介して受信されるファイルによってインストールされるコンピュータプログラムに基づいてコンピュータ装置200のメモリ210にロードされてよい。
プロセッサ220は、基本的な算術、ロジック、および入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ210または通信インタフェース230によって、プロセッサ220に提供されてよい。例えば、プロセッサ220は、メモリ210のような記録装置に記録されたプログラムコードにしたがって受信される命令を実行するように構成されてよい。
通信モジュール230は、ネットワーク170を介してコンピュータ装置200が他の装置(一例として、上述した記録装置)と互いに通信するための機能を提供してよい。一例として、コンピュータ装置200のプロセッサ220がメモリ210のような記録装置に記録されたプログラムコードにしたがって生成した要求や命令、データ、ファイルなどが、通信インタフェース230の制御にしたがってネットワーク170を介して他の装置に伝達されてよい。これとは逆に、他の装置からの信号や命令、データファイルなどが、ネットワーク170を経てコンピュータ装置200の通信モジュール230を通じてコンピュータ装置200に受信されてよい。通信インタフェース230を通じて受信された信号や命令、データなどは、プロセッサ220やメモリ210に伝達されてよく、ファイルなどは、コンピュータ装置200がさらに含むことのできる記録媒体(上述した永続的記録装置)に記録されてよい。
入力/出力インタフェース240は、入力/出力装置250とのインタフェースのための手段であってよい。例えば、入力装置は、マイク、キーボード、またはマウスなどの装置を、出力装置は、ディスプレイ、スピーカのような装置を含んでよい。他の例として、入力/出力インタフェース240は、タッチスクリーンのように入力と出力のための機能が1つに統合された装置とのインタフェースのための手段であってもよい。入力/出力装置250は、コンピュータ装置200と1つの装置で構成されてもよい。
また、他の実施形態において、コンピュータ装置200は、図2の構成要素よりも少ないか多くの構成要素を含んでもよい。しかし、大部分の従来技術的構成要素を明確に図に示す必要はない。例えば、コンピュータ装置200は、上述した入力/出力装置250のうちの少なくとも一部を含むように実現されてもよいし、トランシーバやデータベースなどのような他の構成要素をさらに含んでもよい。
図3は、本発明の一実施形態における、データアーカイブシステムを概括的に示した図である。
データアーカイブシステム310は、図2で説明したコンピュータ装置200のような物理的な装置または複数の物理的な装置の結合によって実現されてよく、図3に示すように、データ圧縮モジュール311、照会モジュール312、ディスプレイおよび制御モジュール313、およびニアライン(near−line)インタフェースモジュール314を含んでよい。ここで、データ圧縮モジュール311、照会モジュール312、ディスプレイおよび制御モジュール313、およびニアラインインタフェースモジュール314それぞれは、データアーカイブシステム310にインストールされたアーカイブソリューションプログラムのコードにしたがってデータアーカイブシステム310を実現するコンピュータ装置200のプロセッサ220が実行する動作に対する機能的表現であってよい。一例として、アーカイブソリューションプログラムは、データ圧縮機能を提供するためのコードを含んでよく、プロセッサ220は、このようなコードに基づいてデータ圧縮機能を提供してよい。この場合、プロセッサ220のデータ圧縮機能の提供のための動作(ら)に対する機能的表現として「データ圧縮モジュール310」使用されてよい。
言い換えれば、データアーカイブシステム310は、コンピュータ装置200においてアーカイブソリューションプログラムをインストールして実行することによって実現されてよい。例えば、アーカイブソリューションプログラムは、クラウドSaaS(Software as a Service)型の製品として開発され、多様なクラウドベンダーのクラウドシステムに搭載可能であり、以下で説明される対象システム320にアーカイブのための機能を提供してよい。他の例として、データアーカイブシステム310は、遠隔ニアラインデータアーカイブ技術(アーカイブソリューションプログラム)とハードウェアとが統合されたアプライアンス(appliance)サーバの形態で実現されてもよい。アプライアンスサーバの場合、製品の形態によって迅速なデリバリ(delivery)と簡単なメンテナンスが可能であり、製品の一貫した品質維持と価格競争力を提供することができる。
対象システム320も、図2で説明したコンピュータ装置200のような物理的な装置または複数の物理的な装置の結合によって実現されてよく、図3に示すように、データベース321、制御モジュール322、およびニアラインインタフェースモジュール323を含んでよい。このとき、制御モジュール322およびニアラインインタフェースモジュール323も、対象システム320を実現するコンピュータ装置200のプロセッサ220が実行する動作に対する機能的表現であってよい。
データアーカイブシステム310と対象システム320は、ネットワーク(一例として、図1および図2で説明したネットワーク170)を介して互いに通信してよく、対象システム320は、制御モジュール322の制御にしたがってニアラインインタフェースモジュール323を通じてデータアーカイブシステム310が提供する機能を呼び出してよい。この場合、データアーカイブシステム310は、対象システム320に対象システム320が呼び出す機能を提供してよい。例えば、対象システム320は、企業資源計画(Enterprise Resource Planning:ERP)のための統合情報システムであってよく、ニアラインインタフェースモジュール323は、一例として、SAP ERPのためのRFC(Remote Function Call)を基盤としてよい。
図4は、本発明の一実施形態における、データアーカイブ方法の例を示したフローチャートである。本実施形態に係るデータアーカイブ方法は、上述したデータアーカイブシステム310を実現するコンピュータ装置200によって実行されてよい。このとき、コンピュータ装置200のプロセッサ220は、メモリ210が含むオペレーティングシステムのコードと、少なくとも1つのコンピュータプログラムのコードとによる制御命令(instruction)を実行するように実現されてよい。ここで、プロセッサ220は、コンピュータ装置200に記録されたコードが提供する制御命令にしたがってコンピュータ装置200が図4の方法に含まれる段階410〜440を実行するようにコンピュータ装置200を制御してよい。また、コンピュータプログラムは、上述したアーカイブソリューションプログラムに対応してよい。
段階410で、コンピュータ装置200は、データを格納する対象システムから遠隔機能の呼び出しを受信してよい。ここで、対象システムは、図3で説明した対象システム320に対応してよく、遠隔機能の呼び出しは、対象システム320のニアラインインタフェースモジュール323で発生してよい。
段階420で、コンピュータ装置200は、遠隔機能の呼び出しに応答し、対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第1機能を、ネットワークを介して対象システムに提供してよい。
例えば、図3を参照すれば、データアーカイブシステム310は、対象システム320の呼び出しにしたがい、対象システム320のデータベース321に格納されたデータの少なくとも一部を格納システム330にアーカイブするための第1機能を、ネットワークを介して対象システム320に提供してよい。
ここで、格納システム330は、実施形態によっては、対象システム320に含まれるローカルデータベース(一例として、データベース321)や対象システム320の外部データベースであってもよいし、および/または対象システム320の外部システム(一例として、ファイルサーバまたはクラウドサーバ)が含む格納場所であってもよい。
例えば、データアーカイブシステム310は、第1機能として、対象システム320のデータベース321に格納されたデータのうちの少なくとも一部を圧縮してデータベース321のテーブルにアーカイブするための機能を提供してよい。この場合、圧縮されたデータは、ファイル形態で格納されるのではなく、対象システム320のデータベース321のテーブルに格納されるため、アーカイブの速度が高まり、データ照会の速度も向上させることができる。
他の例として、データアーカイブシステム310は、第1機能として、対象システム320のデータベース321に格納されたデータのうちの少なくとも一部を圧縮して対象システム320の外部データベースのテーブルにアーカイブするための機能を提供してよい。例えば、データアーカイブシステム310の観点において対象システム320をクライアントと仮定するとき、データアーカイブシステム310は、圧縮されたデータを他のクライアントが含むデータベースのテーブルに格納してよい。
また他の例として、データアーカイブシステム310は、第1機能として、対象システム320のデータベース321に格納されたデータのうちの少なくとも一部をファイルとして圧縮して対象システム320の外部システムが含む格納場所にアーカイブするための機能を提供してよい。例えば、データアーカイブシステム310がクラウドシステム内に実現された場合、データアーカイブシステム310は、圧縮されたデータを含むファイルをクラウドシステムの格納場所に格納してよい。
より具体的な例として、データアーカイブシステム310は、ディスプレイおよび制御モジュール313により、対象システム320にアーカイブサービスのための格納周期の管理、アーカイブ構成、アーカイブ実行、モニタリング、データ照会、およびデータ管理機能などを提供するためのユーザインタフェースを提供することができる。
このとき、ディスプレイおよび制御モジュール313で提供されたユーザインタフェースによってアーカイブの実行が要求されれば、データアーカイブシステム310は、データ圧縮モジュール311によって設定されたアーカイブ構成にしたがい、対象システム320のデータベース321に格納されたデータの少なくとも一部を格納システム330にアーカイブするための第1機能を対象システム320に提供してよい。言い換えれば、対象システム320は、データアーカイブシステム310から提供される第1機能により、自身のデータベース321に格納されたデータのうちの少なくとも一部を格納システム330にアーカイブしてよい。
段階430で、コンピュータ装置200は、格納システムにアーカイブされたデータを照会するための第2機能を、ネットワークを介して対象システムに提供してよい。このような第2機能も、対象システムからの遠隔機能の呼び出しによって提供されてよい。
例えば、図3を参照すると、データアーカイブシステム310は、対象システム320の呼び出しにしたがって格納システム330にアーカイブされたデータを照会するための第2機能を、ネットワークを介して対象システム320に提供してよい。
ディスプレイおよび制御モジュール313で提供されたユーザインタフェースによってデータ照会が要求されれば、データアーカイブシステム310は、照会モジュール312により、格納システム330にアーカイブされたデータの照会のための第2機能を対象システム320に提供してよい。言い換えれば、対象システム320は、データアーカイブシステム310から提供される第2機能により、格納システム330にアーカイブされたデータを照会してよい。
このように、対象システム320は、ハードウェアを別途で追加しなくても、データアーカイブシステム310が提供する機能を利用してデータベース321に格納されたデータをアーカイブすることができる。
上述したように、データアーカイブシステム310が提供する第1機能は、圧縮されたデータをデータベース(対象システム320のデータベース321または外部データベース)のテーブルに格納して保管するか、またはファイル形態で保管するための機能を含んでよい。このとき、データベースのテーブルに圧縮されて保管されたアーカイブデータも、データとしてデータベースのボリューム増加を引き起こす恐れがあるため、データアーカイブシステム310は、データ寿命周期を管理してよい。例えば、データアーカイブシステム310は、「データベース−>データ圧縮アーカイブ−>ファイルアーカイブ−>アーカイブ消散」の手順でデータ寿命周期を管理してよい。ここで、「データベース」とは、データが対象システム320のデータベース321に格納された状態で管理されるものを意味してよい。また、「データ圧縮アーカイブ」とは、データが圧縮され、データベース(対象システム320のデータベース321または外部データベース)のテーブルに圧縮された状態で管理されることを意味してよい。また、「ファイルアーカイブ」は、圧縮データの保管期間が経過すれば、データベースのテーブルに圧縮された状態で管理されるデータをファイルとしてアーカイブして保管することを意味してよく、「アーカイブ消散」は、ファイルとしてアーカイブされたデータのうちで保管の意味をこれ以上もたないデータを削除することを意味してよい。
「ファイルアーカイブ」は、対象システム320の格納場所で行われてもよいが、対象システム320の外部システムの格納場所で行われてもよい。より具体的な例として、データアーカイブシステム310は、アーカイブデータを対象システム320の外部に存在するクラウドシステムに送信するために、圧縮対象の抽出が完了した対象システム320に接続してよい。このとき、データアーカイブシステム310は、ニアラインインタフェースモジュール314によって対象システムを呼び出してよい。このような呼び出しはAPIコールに基づいてよく、圧縮されたデータは多様な種類のストレージに格納されているため、データベース、ディスク、ファイル、インメモリ(in−memory)、量子メモリ(quantum memory)、NoSQL、グラフデータベース(graph−DB)、ブロックチェーンデータベースなどのような多様な種類のストレージに接続可能なように実現されてよい。一方、データアーカイブシステム310は、財務、原価、生産、販売、資材、品質、システムなどのようなビジネスタイプによって送信シナリオを定義してよい。実施形態によっては、データアーカイブシステム310は、ネットワーク帯域幅を考慮した上で、送信シナリオの小グループを生成してもよい。また、データアーカイブシステム310は、送信シナリオにオブジェクトを割り当ててよい。送信シナリオの小グループが存在する場合、データアーカイブシステム310は、送信シナリオの小グループに抽出が完了したオブジェクトを割り当ててよい。また、データアーカイブシステム310は、抽出オブジェクトをバイナリオブジェクトに変換してよく、送信シナリオごとにおよび/または小グループごとに、オブジェクトの容量および数量に対する送信内訳現況表を構成してよい。また、データアーカイブシステム310は、送信シミュレーションを行ってもよい。このとき、データアーカイブシステム310は、送信シナリオごとにおよび/または小グループごとに、シミュレーション対象を選定し、送信シミュレーションを行い、オブジェクトごとに送信時間を確認することにより、のちの送信において最適な時間をオブジェクトデータ割合ごとに予測してよい。送信シミュレーションの後、データアーカイブシステム310は、シナリオ情報、小グループ情報、および/またはオブジェクト情報を利用して実際のデータ送信を行ってよい。このとき、データアーカイブシステム310は、送信シミュレーション情報を基づき、最も長い送信時間がかかる小グループおよび/またはオブジェクトを基準として送信時間が短い小グループおよび/またはオブジェクトを配列することで、全体の終了時間を最適化してよい。この場合、データアーカイブシステム310は、データの性格ごとにデータ格納位置を区分して格納してよく、送信状況モニタリングツールを利用してリアルタイムで送信件数および実行時間を確認してよい。また、データアーカイブシステム310は、送信実行マップに抽出進行状況をアップデートし、エラー発生時には、完了後の順序から行って速度および完全性を維持してよい。データの送信は、ストリーミング方式またはオブジェクト単位送信を選択して行われてよい。また、データアーカイブシステム310は、対象システム320で送信したシナリオごとにおよび/または小グループごとにデータに対する格納システム330への送信が完了したかを確認した後、送信シナリオごとにおよび/または小グループごとにオブジェクト容量および数量現況表と送信されたデータとを比較してアーカイブデータの送信過程を検証してよい。このとき、データの送信は、1:1の関係で送信されてもよいし、1:Nの関係として互いに異なるサーバに同時に送信されてもよい。この場合には、サーバごとに送信内訳現況表が構成されてよい。
図5は、本発明の一実施形態における、第1機能によってデータをアーカイブする過程の例を示したフローチャートである。本実施形態に係る過程は、データアーカイブシステム310が提供する第1機能を利用して対象システム320を実現するコンピュータ装置200によって実行されてよい。このとき、コンピュータ装置200のプロセッサ220は、メモリ210が含むオペレーティングシステムのコードと、少なくとも1つのコンピュータプログラムのコードとによる制御命令(instruction)を実行するように実現されてよい。ここで、プロセッサ220は、コンピュータ装置200に記録されたコードが提供する制御命令にしたがってコンピュータ装置200が図5の方法に含まれる段階510〜550を実行するようにコンピュータ装置200を制御してよい。ここで、コードは、データアーカイブシステム310が提供する第1機能のためのコードを含んでよい。
段階510で、コンピュータ装置200は、データベースのテーブルに含まれたデータレコードに対するパーティションをデータレコードの選別情報に基づいて決定してよい。ここで、データベースは、図3で説明した対象システム320のデータベース321に対応してよい。選別情報は、データレコードに対する時間に関する情報および/またはデータレコードの任意のフィールド値を含んでよい。コンピュータ装置200は、このような時間に関する情報および/またはフィールド値に基づいてデータレコードに対するパーティションを決定してよい。テーブルは、データベースでデータを格納する基本構造をなす単位であって、段階510では、データベースに含まれた複数のテーブルのうちで容量を節約するためにアーカイブしようとするテーブルを意味してよい。
例えば、コンピュータ装置200は、フィールド値が所定の範囲以内であるデータレコードを1つのパーティションとして選別してよい。このとき、フィールド値は、テーブルで検索が最も頻繁に発生するフィールドのフィールド値によって決定されてよい。これは、アーカイブされたデータをのちに検索するときに、該当のフィールド値に基づいて生成されたインデックス情報を利用することで検索の効率性を極大化することができるためである。他の例として、コンピュータ装置は、時間に関する情報が所定の範囲以内であるデータレコードを1つのパーティションとして選別してよい。
また、パーティションは、テーブルに含まれた全体のデータレコードのうちから選別されたデータレコードの集合で構成されてよい。パーティションは、少なくとも1つ以上が生成されてよく、必要によっては、テーブルの全体ではなく、一部のデータレコードだけを対象として限定してパーティションを生成してよい。例えば、テーブルから2015年以降のデータレコードは除外し、2015年以前のデータレコードだけを対象としてアーカイブのためのパーティションを生成してよい。
一方、1つのパーティションに含まれるデータレコードの個数は、テーブルに含まれた全体のレコードの個数、インメモリデータベースを検索するコンピュータの性能、およびデータベースで頻度が高い検索条件などを総合的に分析および検討して決定されてよい。
他の実施形態では、選別されたパーティションのうちでデータレコードの個数が閾値を超える超過パーティションが存在すれば、この超過パーティションをレコードの個数が閾値以下である複数のパーティションに分離してよい。例えば、1つのパーティションに含まれるデータレコードの個数である閾値が10万個に設定されたとする。しかし、選別されたパーティションが閾値を超える個数のデータレコードを含んでいれば、これはコンピュータの過負荷および非効率を招くようになり、問題発生の原因となり得る。したがって、1つのパーティションが10万個を超えるデータレコードを有する場合、これを10万個単位の複数のパーティションに分離して複数のパーティションを生成してよい。例えば、1つのパーティションが25万個のデータレコードを有する場合、コンピュータ装置200は、この超過パーティションを10万個ずつのデータレコードを有する2つのパーティションと5万個のデータレコードを有する1つのパーティションとして、合計3つのパーティションに分離してよい。
一方、上述したように分離された複数のパーティションは、互いに同じフィールド値による分類基準によって分類されるため、このような複数のパーティションを区別する方法はない。したがって、分離された複数のレコードグループそれぞれに一連番号(例えば、1、2、3、4、・・・)を付与してインデックステーブルの一連番号フィールドにさらに格納してよい。この場合、アーカイブされたデータを検索するときにも、分離された複数のパーティションそれぞれを区別して検索することができるようになる。このような一連番号は、以下で説明するシーケンスに対応してよい。
段階520で、コンピュータ装置200は、パーティションごとにデータレコードを圧縮して圧縮パーティションを生成してよい。一例として、コンピュータ装置200は、決定されたパーティションに含まれたデータレコードをバイナリオブジェクトとして圧縮して圧縮パーティションを生成してよい。
一例として、コンピュータ装置200は、圧縮パーティションを生成するために、先ず、圧縮パーティションに含まれるデータレコードをバッファに格納してよい。データレコードが格納されるバッファのサイズは、テーブルの構造(フィールドの個数、種類、およびサイズ)、および圧縮パーティションに含まれるデータレコードの閾値に基づいて決定されてよい。例えば、テーブルがDATE(文字8字)、NAME(文字30字)、およびAGE(整数4バイト)の合計3つのフィールドを含んでおり、圧縮パーティションに含まれたデータレコードの個数に対する閾値が10万個であるとすると、文字1字を2バイトとして計算するとき、バッファのサイズは、最小10万×(8×2+30×2+4)=800万バイト(約8メガバイト)となってよい。このとき、コンピュータ装置200は、圧縮パーティションに含まれたデータレコードおよびそのデータレコードのフィールド値を順にすべて読み取り、順にバッファに格納してよい。
この後、コンピュータ装置200は、バッファに格納されたデータを圧縮して圧縮パーティションを生成してよい。圧縮パーティションは、バッファに格納されたデータを圧縮して生成されたバイナリオブジェクト形態の結果物であってよい。このとき、圧縮による損失が発生しないようにするために、無損失の圧縮アルゴリズムであるZIP、CTW、LZ77、LZW、gzip、bzip2、DEFLATEなどが使用されてよい。
このとき、コンピュータ装置200は、生成された圧縮パーティションごとに固有に付与された格納キーを生成してよい。
段階530で、コンピュータ装置200は、圧縮パーティションと圧縮パーティションを固有に識別する格納キーとを連係させて圧縮テーブルに格納してよい。上述では、圧縮されたデータが対象システム320のデータベース321のテーブルや外部データベースのテーブルに格納されることをについて説明した。圧縮テーブルは、パーティションごとに圧縮して生成された圧縮パーティションを格納するためのフィールドと、該当の圧縮パーティションに対応するように固有に付与された格納キーを格納するためのフィールドを含んでよい。格納キーは、圧縮パーティションごとに固有に付与された値を含むキーであって、格納キーに該当する圧縮テーブルのフィールドに圧縮パーティションごとに共有する格納キーの値が格納されてよい。また、格納キーに該当するフィールドは1つ以上であってもよく、この1つ以上のフィールドに分散して格納された格納キーの値が結合されたときに、圧縮パーティションごとに固有の格納キーが形成されるように実現されてもよい。
段階540で、コンピュータ装置200は、格納キーと選別情報とを連係させてデータベースのインデックステーブルに格納してよい。一例として、選別情報が該当のデータレコードの任意のフィールド値を含む場合、コンピュータ装置200は、段階440で、格納キーと任意のフィールド値とを連係させてグループインデックステーブルに格納してよい。グループインデックステーブルに格納された格納キーとフィールド値は、任意のフィールド値を含む検索条件によって圧縮格納されたデータレコードを検索するためのインデックスとして活用されてよい。他の例として、選別情報がデータレコードの時間に関する情報を含む場合、コンピュータ装置200は、格納キーと時間に関する情報とを連係させて期間インデックステーブルに格納してよい。期間インデックステーブルに格納された格納キーと時間に関する情報は、任意の時間に関する情報を含む検索条件によって圧縮格納されたデータレコードを検索するためのインデックスとして活用されてよい。言い換えれば、グループインデックステーブルおよび/または期間インデックステーブルを含むインデックステーブルは、検索条件が含むフィールド値および/または時間に関する情報に対応する格納キーを取得するのに利用されてよく、格納キーは、圧縮テーブルで格納キーに対応する圧縮パーティションを取得するのに利用されてよい。
段階550で、コンピュータ装置200は、圧縮されたデータレコードをテーブルから削除してよい。データベースを圧縮してアーカイブする目的は、データベースの格納空間を節約することにあるため、コンピュータ装置200は、アーカイブされたデータレコードをテーブルから削除することによってデータベースの格納空間を節約してよい。ただし、実施形態によっては、圧縮されたデータレコードをテーブルからすぐに削除するのではなく、一定期間が経過した後にテーブルから削除してもよい。
一方、削除されたデータレコードは、のちに該当のテーブルに復旧されてもよい。例えば、コンピュータ装置200は、削除されたデータレコードの復元要求に応答し、インデックステーブルで復元要求が含む識別情報と連係する格納キーを検索し、圧縮テーブルで検索された格納キーと連係する圧縮パーティションを検索してよい。この後、コンピュータ装置200は、検索された圧縮パーティションの圧縮を解除して削除されたデータレコードを復元し、復元されたデータレコードを識別情報に基づいてテーブルに記録してよい。このとき、圧縮パーティションが含むデータレコードのうちで復元が要求された特定のデータレコードを識別するために、以下で説明するキーインデックステーブルの情報が活用されてもよい。
このような段階510〜550は、データアーカイブシステム310が提供する第1機能を利用してなされてよい。言い換えれば、データアーカイブシステム310は、対象システム320が段階510〜550を実行するように制御するための機能を含む第1機能を提供してよい。
図6は、本発明の一実施形態における、圧縮テーブルの構造の第1例を示した図である。図6のテーブル610は、Doc.No.フィールド611、時間に対するDateフィールド612、および特定の属性に対するCol1フィールド613を含んでいる。このとき、コンピュータ装置200は、選別情報として、時間に関する情報であるテーブル610のDateフィールド612のフィールド値またはCol1フィールド613のフィールド値に基づいてテーブル610のデータレコードを分類および圧縮することによって圧縮パーティションを生成してよい。このとき、コンピュータ装置200は、圧縮パーティションを固有に識別するための格納キーと該当の圧縮パーティションとを互いに連係させて格納することによって圧縮テーブル620を生成してよい。例えば、図6の実施形態に係る圧縮テーブル620は、格納キーをフィールド値として有するOBJECT IDフィールド621と、圧縮パーティションをフィールド値として有するCOMPRESSED DATAフィールド622とを含んでよい。
図7は、本発明の一実施形態における、圧縮テーブルの構造の第2例を示した図であり、図8は、本発明の一実施形態における、期間インデックステーブルの構造の例を示した図であり、図9は、本発明の一実施形態における、グループインデックステーブルの構造の例を示した図である。
図7は、図6で説明したテーブル610に基づいて圧縮テーブル700を生成する他の実施形態を説明している。例えば、コンピュータ装置200は、選別情報として、時間に関する情報であるテーブル610のDateフィールド612のフィールド値に基づいてテーブル610のデータレコードを分類および圧縮することによって圧縮パーティションを生成してよい。また、コンピュータ装置200は、選別情報と該当する圧縮パーティションとを互いに連係させて格納することによって圧縮テーブル700を生成してよい。例えば、図7の実施形態に係る圧縮テーブル700は、時間に関する情報をフィールド値として有するPERIODフィールド710と、圧縮パーティションをフィールド値として有するCOMPRESSED DATAフィールド720とを含んでよい。
図8は、圧縮テーブル620がDateフィールド612のフィールド値(時間に関する情報)に基づいてデータレコードを分類および圧縮することによって生成された圧縮パーティションを含む場合に生成および活用されることのできる期間インデックステーブル800の例を示している。このとき、期間インデックステーブル800は、時間に関する情報をフィールド値として有するPERIODフィールド810と、格納キーをフィールド値として有するOBJECT IDフィールド820とを含んでよい。例えば、コンピュータ装置200は、時間に関する情報(一例として、「2020.01」)を選別情報として含む検索条件を受信する場合、期間インデックステーブル800で検索条件に含まれた時間に関する情報を利用して対応する格納キー(一例として、期間インデックステーブル800で時間に関する情報「2020.01」に対応する格納キー「O0001」)を検索してよく、検索された格納キーを利用して、圧縮テーブル620で格納キーに対応する圧縮パーティション(一例として、圧縮テーブル62で格納キー「O0001」に対応する「50,000Rows」の圧縮パーティション)を検索することができるようになる。
また、図9は、圧縮テーブル62がCol1フィールド613のフィールド値に基づいてデータレコードを分類および圧縮することによって生成された圧縮パーティションを含む場合に生成および活用されることのできるグループインデックステーブル900の例を示している。このとき、グループインデックステーブル900は、Col1フィールド613のフィールド値を自身のフィールド値として有するPERIODフィールド910、および格納キーをフィールド値として有するOBJECT IDフィールド920を含んでよい。例えば、コンピュータ装置200は、Col1フィールド613のフィールド値(一例として、「1000」)を選別情報として含む検索条件を受信する場合、グループインデックステーブル900で検索条件に含まれたフィールド値を利用して、対応する格納キー(一例として、グループインデックステーブル900でフィールド値「1000」に対応する格納キー「O0001」)を検索してよく、検索された格納キーを利用して、圧縮テーブル620で格納キーに対応する圧縮パーティション(一例として、圧縮テーブル620で格納キー「O0001」に対応する「50,000Rows」の圧縮パーティション)を検索することができるようになる。
図10は、本発明の一実施形態における、圧縮テーブルの構造の第2例を示した図であり、図11は、本発明の一実施形態における、期間インデックステーブルとグループインデックステーブルが結合された形態のインデックステーブルの構造の例を示した図である。
図10は、図6で説明したテーブル610に基づいて圧縮テーブル1000を生成するまた他の実施形態を説明している。例えば、コンピュータ装置200は、時間に関する情報であるテーブル610のDateフィールド612のフィールド値およびCol1フィールド613のフィールド値の2つのフィールド値に基づいてテーブル610のデータレコードを分類および圧縮することによって圧縮パーティションを生成してよい。
より具体的な例として、コンピュータ装置200は、Dataフィールド612のフィールド値が「2002.01」でありながらCol1フィールド613のフィールド値が「1000」であるデータレコードを圧縮して第1圧縮パーティションを、Dataフィールド612のフィールド値が「2002.01」でありながらCol1フィールド613のフィールド値が「2000」であるデータレコードを圧縮して第2圧縮パーティションを、Dataフィールド612のフィールド値が「2002.02」でありながらCol1フィールド613のフィールド値が「1000」であるデータレコードを圧縮して第3圧縮パーティションを、Dataフィールド612のフィールド値が「2002.02」でありながらCol1フィールド613のフィールド値が「2000」であるデータレコードを圧縮して第4圧縮パーティションを、Dataフィールド612のフィールド値が「2002.03」でありながらCol1フィールド613のフィールド値が「1000」であるデータレコードを圧縮して第5圧縮パーティションを、Dataフィールド612のフィールド値が「2002.03」でありながらCol1フィールド613のフィールド値が「2000」であるデータレコードを圧縮して第6圧縮パーティションを、それぞれ生成してよい。
この場合、コンピュータ装置200は、圧縮パーティションを固有に識別するための格納キーと該当の圧縮パーティションとを互いに連係させて格納することによって圧縮テーブル1000を生成してよい。例えば、図10の実施形態に係る圧縮テーブル1000は、格納キーをフィールド値として有するOBJECT IDフィールド1010と、圧縮パーティションをフィールド値として有するCOMPRESSED DATAフィールド1020とを含んでよい。
図11は、期間インデックステーブルとグループインデックステーブルが結合された形態のインデックステーブル1100の例を示している。このとき、インデックステーブル1100は、時間に関する情報をフィールド値として有するPERIODフィールド1110、Col1フィールド613のフィールド値を自身のフィールド値として有する Col1フィールド1120、および格納キーをフィールド値として有するOBJECT IDフィールド1130を含んでよい。例えば、コンピュータ装置200は、時間に関する情報(一例として、「2020.02」)およびCol1フィールド613のフィールド値(一例として、「1000」)を選別情報として含む検索条件を受信する場合、インデックステーブル1100で検索条件が含む時間に関する情報とフィールド値の両方を満たす格納キー(一例として、インデックステーブル1100の格納キー「O0003」)を検索してよく、検索された格納キーを利用して、圧縮テーブル1000で格納キーに対応する圧縮パーティション(一例として、圧縮テーブル1000で格納キー「O0003」に対応する「30,000Rows」の圧縮パーティション)を検索することができるようになる。
図12は、本発明の一実施形態における、第1機能によってデータをアーカイブする過程のまた他の例を示したフローチャートである。本実施形態に係る過程は、図5で説明した段階540の後に段階1210をさらに含んでよい。
段階1210で、コンピュータ装置200は、テーブルに含まれたデータレコードそれぞれに対し、プライマリキー(primary key)と、該当のデータレコードを含んで圧縮された圧縮パーティション内での該当のデータレコードの位置であるキーインデックス情報と、該当のデータレコードを含んで圧縮された圧縮パーティションに対応する格納キーとを連係させてキーインデックステーブルに格納してよい。このような段階1210は、データアーカイブシステム310が提供する第1機能を利用してなされてよい。言い換えれば、データアーカイブシステム310は、対象システム320が段階1210を実行するように制御するための機能を含む第1機能を提供してよい。
プライマリキーとは、インメモリデータベースでレコードごとに固有に識別される値を有するフィールドでの当の値を意味してよく、基本キー、主キー、またはユニークキーとも呼ばれる。また、1つのテーブルには1つ以上のプライマリキーが存在してよい。また、キーインデックス情報は、特定のプライマリキーの値を有するデータレコードが圧縮パーティション内でどの位置に格納されているかに関する情報である。例えば、圧縮パーティションが含む10万個のデータレコードに関する情報のうちで1000番目に格納されたデータレコードであるという格納順に関する情報がキーインデックス情報に格納されてよい。
一方、キーインデックステーブルにプライマリキーを格納する理由は、検索対象となるテーブルを他のフィールド値および時間に関する情報だけでなく、このプライマリキーによって直接に検索できるようにするためである。すなわち、ユーザが特定のプライマリキーを入力しながら、このプライマリキーを有するデータレコードをテーブルから検索しようとするときに、キーインデックステーブルが使用されてよい。より具体的に説明すると、コンピュータ装置200は、特定のプライマリキーを有するデータレコードのキーインデックス情報と格納キーをキーインデックステーブルで検索してよい。この場合、コンピュータ装置200は、取得した格納キーを利用して、圧縮テーブルで格納キーに対応する圧縮パーティションを取得してよく、キーインデックス情報を利用して、圧縮パーティションでユーザが所望する特定のデータレコードを検索することができるようになる。上述したように、このようなキーインデックステーブルのキーインデックス情報は、特定の条件のデータレコードをテーブルに復元するにあたり、圧縮パーティションが含むデータレコードのうちから特定の条件のデータレコードを識別するために活用されてもよい。
図13は、本発明の一実施形態における、圧縮テーブルおよびキーインデックステーブルの構造の例を示した図である。
圧縮テーブル1310は、格納キーをフィールド値として有するOBJECT IDフィールド1311、対象テーブルの処理順(シーケンス)をフィールド値として有するSEQフィールド1312、および圧縮パーティションをフィールド値として有するCOMPRESSED DATAフィールド1313を含んでよい。シーケンスは、親テーブルと子テーブルが存在するとき、親テーブルを先に抽出し、抽出された親テーブルのデータを利用して子テーブルを処理する処理順を定義してよい。
キーインデックステーブル1320は、上述したように、プライマリキーをフィールド値として有するDoc.No.フィールド1321、格納キーをフィールド値として有するOBJECT IDフィールド1322、およびキーインデックス情報をフィールド値として有するKey Location info.フィールド1323を含んでよい。例えば、キーインデックス情報1@1001において、「@」の前の「1」は、SEQフィールド1312のフィールド値に対応するシーケンスを、「@」の後の「1001」は、該当の圧縮パーティションが含むデータレコードのうちの1001番目のデータレコードを指示してよい。より具体的な例として、キーインデックステーブル1320の1番目のレコードは、プライマリキーが「1」であるデータレコードが、格納キーが「O0001」であり、シーケンスが「1」である圧縮パーティションのデータレコードのうちの1001番目のデータレコードとして含まれていることを指示してよい。これと同じように、キーインデックステーブル1320の2番目のレコードは、プライマリキーが「2」であるデータレコードが、格納キーが「O0001」であり、シーケンスが「2」である圧縮パーティションのデータレコードのうちの2001番目のデータレコードとして含まれていることを指示してよい。
このように、キーインデックス情報は、圧縮パーティション内での特定のデータレコードの位置に関する情報を含んでよく、このようなキーインデックス情報とプライマリキー、および格納キーを含むキーインデックステーブル(一例として、図13のキーインデックステーブル1320)を活用することにより、ユーザの検索条件によって照会するようになるデータレコードの数を減らすことができる。
他の実施形態において、コンピュータ装置200は、プライマリキーによって第1テーブル(一例として、段階410で説明したテーブル)と連結する連結テーブルでデータレコードを圧縮して生成された第2圧縮パーティションに対し、第2圧縮パーティションに含まれたデータレコードのうちで第1テーブルに含まれたデータレコードとプライマリキーが等しいデータレコードを検索してよく、検索されたデータレコードに対し、第2圧縮パーティション内での位置であるサブインデックス情報をキーインデックステーブル上のプライマリキーが等しいデータレコードに対してさらに格納してよい。連結テーブルは、プライマリキーによって第1テーブルと連結するテーブルである。すなわち、プライマリキーは、第1テーブルと連結テーブルの両方に存在するようになる。第2圧縮パーティションは、プライマリキーによって第1テーブルと連結する連結テーブルが存在するとき、該当の連結テーブルでデータレコードを圧縮して生成されたデータであってよい。このとき、第2圧縮パーティションは、図4で説明した圧縮パーティションと同じ方式で生成されてよく、圧縮パーティションと同じように、固有の格納キーとともに圧縮テーブルに格納されてよい。サブインデックス情報は、特定のプライマリキーを有するデータレコードがどのような第2圧縮パーティション内でどの位置に格納されているかに関する情報である。例えば、第2圧縮パーティションに含まれた10万個のデータレコードに関する情報のうちの1000番目に格納されたデータレコードであるという格納順に関する情報がサブインデックス情報として格納されてよい。例えば、インメモリデータベースに第1テーブルとプライマリキーによって連結する連結テーブルが存在し、第1テーブルには存在しないが連結テーブルには存在するフィールドに対し、ユーザがこのフィールドのフィールド値情報を必要とすることがある。この場合、コンピュータ装置200は、のちに、この連結テーブルまで検索することができるように、キーインデックステーブル上の等しいプライマリキーを有するデータレコードに対してサブインデックス情報をさらに格納してよい。
また他の実施形態において、コンピュータ装置200は、第1テーブルに対して多数の連結テーブルが存在する場合、連結テーブルそれぞれに対するサブインデックス情報を集めて圧縮した後、キーインデックステーブルに新たなサブインデックス情報として格納してもよい。例えば、コンピュータ装置200が連結テーブルで等しいプライマリキーを有するデータレコードに対し、2つ以上の第2圧縮パーティション内での位置に対するサブインデックス情報をすべて集めてよく、集めた値を圧縮し、キーインデックステーブル上の等しいプライマリキーの値を含むデータレコードに新たなサブインデックス情報として格納してよい。
図14は、本発明の一実施形態における、圧縮テーブルおよびキーインデックステーブルの構造の他の例を示した図である。
圧縮テーブル1410は、格納キーをフィールド値として有するOBJECT IDフィールド1411、テーブルの識別子をフィールド値として有するTABLEフィールド1412、シーケンスをフィールド値として有するSEQフィールド1413、および圧縮パーティションをフィールド値として有するCOMPRESSED DATAフィールド1414を含んでよい。TABLEフィールド1412は、テーブルの識別子をフィールド値として含んでよく、これにより、対応する圧縮パーティションがどのテーブルから抽出されたデータレコードを含んでいるかを識別してよい。
本実施形態に係るキーインデックステーブル1420は、プライマリキーをフィールド値として有するDoc.No.フィールド1421、格納キーをフィールド値として有するOBJECT IDフィールド1422、キーインデックス情報をフィールド値として有するKey Location info.フィールド1423、およびサブインデックス情報をフィールド値として有するSub Location info.フィールド1424を含んでよい。
例えば、キーインデックステーブル1420の1番目のレコードは、プライマリキーが「1」であるデータレコードが、格納キーが「O0001」であり、シーケンスが「1」である圧縮パーティションのデータレコードのうちの10001番目のデータレコードとして含まれていることを指示してよい。このとき、Sub Location info.フィールド1424のフィールド値「TAB1@1001−2/TAB2@2001−3」は、プライマリキーが「1」であるデータレコードの連結テーブルに対して生成された第2圧縮パーティション内での位置を示している。例えば、フィールド値「TAB1@1001−2/TAB2@2001−3」において、「@」の前の「TAB1」と「TAB2」は、等しいプライマリキーによって連結する連結テーブルを意味してよく、「@」の後の「1001−2」は、連結テーブル「TAB1」に対する第2圧縮パーティションが含むデータレコードのうちの1001番目のデータレコードから2つのデータレコード(1001番目のデータレコード(第1データレコード)と1002番目のデータレコード(第2データレコード))を示している。さらに、「@」の後の「2001−3」は、連結テーブル「TAB2」に対する第2圧縮パーティションが含むデータレコードのうちの2001番目のデータレコードから3つのデータレコード(2001番目のデータレコード(第3データレコード)と、2002番目のデータレコード(第4データレコード)と、2003番目のデータレコード(第5データレコード))を示している。このとき、第1データレコードから第5データレコードまでが、すべて等しいプライマリキーによって識別されてよい。
図15は、本発明の一実施形態における、第2機能によってアーカイブされたデータを検索する過程の例を示した図である。本実施形態に係る過程は、データアーカイブシステム310が提供する第2機能を利用して対象システム320を実現するコンピュータ装置200によって実行されてよい。
段階1510で、コンピュータ装置200は、データレコードの選別情報を含む検索条件を受信してよい。このような選別情報は、検索しようとするデータレコードの任意のフィールド値および/または該当のデータレコードの時間に関する情報を含んでよい。選別情報が含むフィールド値および/または時間に関する情報は、範囲の形態で含まれてもよい。
段階1520で、コンピュータ装置200は、データベース上でデータレコードの選別情報と該当のデータレコードが含まれた圧縮パーティションを固有に識別する格納キーとを連係させて格納するインデックステーブルから、検索条件が含む選別情報と連係する格納キーを検索してよい。上述したように、インデックステーブルは、グループインデックステーブルおよび/または期間インデックステーブルを含んでよく、グループインデックステーブルは、特定のフィールド値と格納キーとを連係させて格納してよく、期間インデックステーブルは、時間に関する情報と格納キーとを連係させて格納することについて説明した。したがって、コンピュータ装置200は、選別情報が含むフィールド値および/または時間に関する情報に対応する格納キーをグループインデックステーブルおよび/または期間インデックステーブルで検索することができるようになる。例えば、コンピュータ装置200は、選別情報がデータレコードの任意のフィールド値を含む場合、格納キーと任意のフィールド値とを連係させて格納するグループインデックステーブルで検索条件の選別情報として含まれた任意のフィールド値と連係する格納キーを検索してよい。他の例として、コンピュータ装置200は、選別情報がデータレコードの時間に関する情報を含む場合、格納キーと時間に関する情報とを連係させて格納する期間インデックステーブルで検索条件の選別情報として含まれた時間に関する情報と連係する格納キーを検索してよい。
段階1530で、コンピュータ装置200は、格納キーと圧縮パーティションとを連係させて格納する不揮発性の格納手段で検索された格納キーと連係する圧縮パーティションを検索してよい。上述したように、圧縮テーブルは、圧縮パーティションと圧縮パーティションを固有に識別する格納キーとを連係させて格納しているため、コンピュータ装置200は、このような圧縮テーブルで格納キーによって該当の圧縮パーティションを検索することができるようになる。
上述したように、キーインデックステーブルがさらに活用される場合、ユーザは、プライマリキーを検索に活用してよい。キーインデックステーブルは、上述したように、データベース上の任意のテーブルが含むデータレコードそれぞれに対し、プライマリキーと、該当のデータレコードを含んで圧縮された圧縮パーティション内での該当のデータレコードの位置であるキーインデックス情報と、該当のデータレコードを含んで圧縮された圧縮パーティションに対応する格納キーとを連係させて格納してよい。このとき、検索条件がデータレコードのプライマリキーをさらに含む場合、コンピュータ装置200は、キーインデックステーブルで検索条件がさらに含むプライマリキーと連係するキーインデックス情報および格納キーを検索してよい。この後、コンピュータ装置200は、検索されたキーインデックス情報および格納キーにさらに基づき、段階1530で検索された圧縮パーティションから検索条件による特定のデータレコードを検索することができるようになる。
また、キーインデックステーブルは、プライマリキーによって任意のテーブルと連結する連結テーブルが存在する場合、連結テーブルでデータレコードを圧縮して生成された第2圧縮パーティションに対し、データレコードの第2圧縮パーティションでの位置であるサブインデックス情報をさらに含んでよい。したがって、検索条件がプライマリキーをさらに含む場合、コンピュータ装置200は、キーインデックステーブルで検索条件がさらに含むプライマリキーと連係するサブインデックス情報をさらに検索することができ、第2圧縮パーティションおよびサブインデックス情報に基づいて第2圧縮パーティションで検索条件によるデータレコードをさらに検索することにより、特定のデータレコードに対し、検索しようとする第1テーブルのフィールド値だけではなく、第1テーブルとプライマリキーによって連結する連結テーブルのフィールド値も取得することができるようになる。
一方、上述したように、圧縮テーブルは、コンピュータ装置200とネットワークを介して接続する他のコンピュータ装置のデータベースの圧縮テーブルを含んでもよい。この場合、コンピュータ装置200は、段階1530で、ネットワークを介して、他のコンピュータ装置のデータベースの圧縮テーブルから、段階1520で検索された格納キーと連係する圧縮パーティションを検索してよい。
このような段階1510〜1530は、データアーカイブシステム310が提供する第2機能を利用してなされてよい。言い換えれば、データアーカイブシステム310は、対象システム320が段階1510〜1530を実行するように制御するための機能を含む第2機能を提供してよい。
図16および図17は、本発明の一実施形態における、アーカイブされたデータを検索する例を示した図である。
図16は、クエリ1610にしたがい、圧縮テーブル1620でアーカイブされたデータを検索する例を示している。図16の実施形態では、圧縮テーブル1620がインデックステーブルと結合した形態として、PERIODフィールド1621、COL1フィールド1622、TABLEフィールド1623、OBJECT IDフィールド1624、SEQフィールド1625、およびCOMPRESSED DATAフィールド1626を含んでいる。実施形態によっては、PERIODフィールド1621とCOL1フィールド1622は、別のインデックステーブルに存在してもよい。この場合、圧縮テーブル1620とインデックステーブルとを連結するために、2つのテーブルそれぞれにOBJECT IDフィールド1624が存在してよい。実施形態によっては、TABLEフィールド1623とSEQフィールド1625も、インデックステーブルに存在してもよい。
このとき、クエリ1610は、テーブル「TAB1」から、PERIODフィールド1621のフィールド値が「2002.01」であり、COL1フィールド1622のフィールド値が「1000」であるデータレコードを検索しろという命令を意味してよい。このとき、コンピュータ装置200は、圧縮テーブル1620でクエリ1610に該当するデータレコードが、圧縮テーブル1620の1番目のレコードのCOMPRESSED DATAフィールド1626に格納された圧縮パーティションであることを確認することができる。したがって、コンピュータ装置200は、該当の圧縮パーティションの圧縮を解除し、該当の圧縮パーティションが含むデータレコード(「50,000rows」のデータレコード)を検索の結果として提供することができる。
図17は、クエリ1710にしたがい、圧縮テーブル1620でアーカイブされたデータを検索する例を示している。図17の実施形態において、クエリ1710は、プライマリキーを検索条件として活用しているため、キーインデックステーブル1720が活用されてよい。キーインデックステーブル1720は、Doc.No.フィールド1721、OBJECT IDフィールド1722、Key Location Info.フィールド1723、およびSub Location Info.フィールド1724を含んでいる。
このとき、クエリ1710は、テーブル「TAB1」およびテーブル「TAB2」から、プライマリキーとしてのDoc.No.フィールド1721のフィールド値が「1」であるデータレコードを検索しろという命令を意味してよい。このとき、コンピュータ装置200は、キーインデックステーブル1720でDoc.No.フィールド1721のフィールド値が「1」である1番目のレコードを確認することができ、1番目のレコードのSub Location Info.フィールド1724のフィールド値により、圧縮テーブル1620でプライマリキーが「1」であるデータレコードを検索することができる。例えば、コンピュータ装置200は、Doc.No.フィールド1721のフィールド値が「1」であるキーインデックステーブル1720の1番目のレコードのサブインデックス情報「TAB1@1001−2/TAB2@2001−3」により、圧縮テーブル1620でプライマリキーが「1」であるデータレコードを抽出してよい。このとき、サブインデックス情報が含む位置により、圧縮パーティションの全体のデータレコードをすべて検索する必要がなく、簡単かつ迅速に特定のプライマリキーの値を有するデータレコードを検索することができる。
図3を参照すると、データアーカイブシステム310は、データ照会ログを活用し、対象システム320の外部の他のシステム(一例として、クラウドストレージシステム)が格納システム330を含んでいる実施形態において、対象システム320と格納システム330のデータを最適化してよい。例えば、データアーカイブシステム310は、(1)オンプレミス(on−premise、企業などがクラウド環境ではなく自社の設備で保有して運営する)のデータベースに対する過去のテーブルアクセスログ、(2)過去のテーブルアクセスログに基づいてマシンラーニングによって予測したアクセス量、および(3)データの格納システム330への転換以後のアクセスログのうちの少なくとも1つを分析することで、対象システム320と格納システム330との間のデータ容量およびユーザアクセス速度を持続的に最適化してよい。
図18は、本発明の一実施形態における、データを効果的に記録するための過程の例を示した図である。図18は、対象システム320とクラウドシステム1810を示している。このような図18の実施形態では、格納システム330とデータアーカイブシステム310の両方がクラウドシステム1810上に実現されてよい。遠隔格納場所(クラウドシステム1810に実現された格納システム330)にデータを効率的に格納するために、データアーカイブシステム310は、データ使用率に応じてストレージクラスを差別的に管理してよい。例えば、データアーカイブシステム310は、対象システム320がオンプレミスのデータベースでのデータ使用率に基づいてデータを送信するように制御するための機能を対象システム320に提供してよい。このとき、データアーカイブシステム310は、このような機能によって対象システム310のデータ使用現況を分析して各クラスに分離した後、クラウドシステム1810にデータを送信する前にデータを各クラスに分離してよい。このとき、クラウドシステム1810もクラスごとにクラスストレージを含んでよく、特定のクラスストレージに該当するクラスのデータが格納されてよい。
また、データアーカイブシステム310は、クラウドシステム1810に送信されたデータの使用現況をビジネスオブジェクト、期間別にモニタリングして分離および格納してよい。例えば、データアーカイブシステム310は、クラウドシステム1810の格納場所内でのデータ使用率に基づいてストレージを管理してよい。
一方、データアーカイブシステム310は、対象システム320のデータ使用現況をクラウドシステム1810に送信するように制御し、マシンラーニングを活用してデータの活用度を分析した後、それぞれのクラスストレージに格納してよい。例えば、データアーカイブシステム310は、企業内のデータ使用現況を一定の期間にわたってクラウドシステム1810に移管するように対象システム310を制御してよく、移管されたデータ使用現況をマシンラーニングにかけることよってデータ使用率を予測してよい。また、データアーカイブシステム310は、予測されたデータ使用率に基づいてデータが最適化されるように、データを対象システム320とクラウドシステム1810間の移管を処理してよい。例えば、クラウドシステム1810の格納場所(格納システム320)に格納されたデータのうちでデータ使用率が第1閾値以上のデータは、対象システム320の格納場所(データベース321)に移管してよく、対象システム320の格納場所に格納されたデータのうちでデータ使用率が第2閾値以下のデータは、クラウドシステム1810の格納場所に移管してよい。データの移管には、上述した図3〜17の実施形態によって説明したデータの圧縮や圧縮解除が要求されてよい。
このように、データアーカイブシステム310は、対象システム320のデータ使用現況(過去)、クラウドシステムのデータ使用現況(現在)、およびマシンラーニングによって予測されたデータ使用率(未来)に基づき、持続的なストレージ最適化の作業を実行することができる。
また他の実施形態として、データアーカイブシステム310は、対象システム320の性能を最適化するための機能を提供してよい。一例として、対象システム320がクラウド環境にインスタンスの形態で位置する場合が考えられる。この場合、例えば、対象システム320のデータ削除後(または、上述した持続的なストレージの最適化作業によって格納空間の使用量が減少した後)、データアーカイブシステム310は、対象システム320のデータベース容量に基づき、クラウド環境にインスタンスの形態で位置した対象システム320の全体的な性能(CPU、メモリ使用量、システム応答速度など)をモニタリングしてよく、モニタリングされた性能に基づき、費用節減が可能なサーバタイプに対象システム320の仕様を変更することによって対象システム320側の費用を減らすことができる。例えば、データアーカイブシステム310は、データボリュームの最適化の観点ではなく、CPUとメモリ効率をともに考慮したインスタンス最適化機能を提供してよい。このために、データアーカイブシステム310は、データボリュームの減少による追加資源の最適化の可能性を検討してよい。より具体的な例として、データアーカイブシステム310は、ここ最近の一定期間(一例として、1年間)の使用頻度が高いプログラムの技術的(technical)BOM(Bill of material)とプログラムの内部構造を分析して各フローの時間を測定してよく、データベース関連のロジックのプロセッシングタイムを減らすことにより、CPU、メモリなどの仕様を縮小することができるようにする。また、データアーカイブシステム310は、対象システム320の実現のためのインスタンスを初期設定のインスタンスのクラスに比べて経済的に一段階低いインスタンスに変更してもよい。各フローの時間の測定には、技術的BOMとプログラムの内部構造の他にも、システム応答率、CPU使用率、プロセッシングタイム、データベース応答時間などが活用されてよい。
また他の実施形態として、データアーカイブシステム310は、データ非識別化機能を提供してよい。データアーカイブの収集時に、ビジネス的要求事項および/または法的要求事項によって非識別化が要求されることがある。または、格納システム330にアーカイブされたデータを、対象システム320ではない他のシステムで活用するために非識別化が要求されることもある。図19は、本発明の一実施形態における、データを非識別化する方法の例を示した図である。
このように、本発明の実施形態によると、データを格納する対象システムから遠隔機能の呼び出しを受信し、このような遠隔機能の呼び出しに応答し、対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第1機能を、前記ネットワークを介して前記対象システムに提供し、前記格納システムにアーカイブされたデータの照会のための第2機能を、前記ネットワークを介して前記対象システムに提供することにより、遠隔ニアライン(near−line)データアーカイブ機能を提供することができる。
上述したシステムまたは装置は、ハードウェア構成要素、またはハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば、実施形態で説明された装置および構成要素は、例えば、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ、マイクロコンピュータ、FPGA(field programmable gate array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令を実行して応答することができる様々な装置のように、1つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム(OS)およびOS上で実行される1つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを記録、操作、処理、および生成してもよい。理解の便宜のために、1つの処理装置が使用されるとして説明される場合もあるが、当業者は、処理装置が複数個の処理要素および/または複数種類の処理要素を含んでもよいことが理解できるであろう。例えば、処理装置は、複数個のプロセッサまたは1つのプロセッサおよび1つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。
ソフトウェアは、コンピュータプログラム、コード、命令、またはこれらのうちの1つ以上の組み合わせを含んでもよく、思うままに動作するように処理装置を構成したり、独立的または集合的に処理装置に命令したりしてよい。ソフトウェアおよび/またはデータは、処理装置に基づいて解釈されたり、処理装置に命令またはデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、仮想装置、コンピュータ記録媒体または装置に具現化されてよい。ソフトウェアは、ネットワークによって接続されたコンピュータシステム上に分散され、分散された状態で記録されても実行されてもよい。ソフトウェアおよびデータは、1つ以上のコンピュータ読み取り可能な記録媒体に記録されてよい。
実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータ読み取り可能な媒体に記録されてよい。コンピュータ読み取り可能な媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含んでよい。媒体は、コンピュータ実行可能なプログラムを継続して記録するものであっても、実行またはダウンロードのために一時記録するものであってもよい。また、媒体は、単一または複数のハードウェアが結合した形態の多様な格納手段または格納手段であってよく、あるコンピュータシステムに直接接続する媒体に限定されることはなく、ネットワーク上に分散して存在するものであってもよい。媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク、および磁気テープのような磁気媒体、CD−ROMおよびDVDのような光媒体、フロプティカルディスク(floptical disk)のような光磁気媒体、およびROM、RAM、フラッシュメモリなどを含み、プログラム命令が記録されるように構成されたものであってよい。また、媒体の他の例として、アプリケーションを配布するアプリケーションストアやその他の多様なソフトウェアを供給または配布するサイト、サーバなどで管理する記録媒体または格納媒体が挙げられる。プログラム命令の例には、コンパイラによって生成されるもののような機械語コードだけでなく、インタプリタなどを使用してコンピュータによって実行されることのできる高級言語コードが含まれる。
以上のように、実施形態を、限定された実施形態および図面に基づいて説明したが、当業者であれば、上述した記載から多様な修正および変形が可能であろう。例えば、説明された技術が、説明された方法とは異なる順序で実行されたり、かつ/あるいは、説明されたシステム、構造、装置、回路などの構成要素が、説明された方法とは異なる形態で結合されたりまたは組み合わされたり、他の構成要素または均等物によって対置されたり置換されたとしても、適切な結果を達成することができる。
したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付される特許請求の範囲に属する。
310:データアーカイブシステム
311:データ圧縮モジュール
312:照会モジュール
313:ディスプレイおよび制御モジュール
314:ニアラインインタフェースモジュール
320:対象システム
321:データベース
322:制御モジュール
323:ニアラインインタフェースモジュール
330:格納システム
311:データ圧縮モジュール
312:照会モジュール
313:ディスプレイおよび制御モジュール
314:ニアラインインタフェースモジュール
320:対象システム
321:データベース
322:制御モジュール
323:ニアラインインタフェースモジュール
330:格納システム
Claims (20)
- コンピュータ装置と結合してデータアーカイブ方法をコンピュータ装置に実行させるためにコンピュータ読み取り可能な記録媒体に記録されたコンピュータプログラムであって、
前記データアーカイブ方法は、
データを格納する対象システムから遠隔機能の呼び出しを受信する段階、
前記遠隔機能の呼び出しに応答し、前記対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第1機能を、前記ネットワークを介して前記対象システムに提供する段階、および
前記格納システムにアーカイブされたデータを照会するための第2機能を、前記ネットワークを介して前記対象システムに提供する段階
を含むことを特徴とする、コンピュータプログラム。 - 前記第1機能を提供する段階は、
前記対象システムのローカルデータベースに格納されたデータのうちの少なくとも一部を圧縮して前記ローカルデータベースのテーブルにアーカイブするための機能を提供すること
を特徴とする、請求項1に記載のコンピュータプログラム。 - 前記第1機能を提供する段階は、
前記対象システムのローカルデータベースに格納されたデータのうちの少なくとも一部を圧縮して前記対象システムの外部データベースのテーブルにアーカイブするための機能を提供すること
を特徴とする、請求項1に記載のコンピュータプログラム。 - 前記第1機能を提供する段階は、
前記対象システムのローカルデータベースに格納されたデータのうちの少なくとも一部をファイルとして圧縮して前記対象システムの外部システムが含む格納場所にアーカイブするための機能を提供すること
を特徴とする、請求項1に記載のコンピュータプログラム。 - 前記第1機能を提供する段階は、
前記対象システムのローカルデータベースのテーブルに含まれたデータレコードに対するパーティションをデータレコードの選別情報に基づいて決定するように前記対象システムを制御する第1−1機能、
前記パーティションごとにデータレコードを圧縮して圧縮パーティションを生成するように前記対象システムを制御する第1−2機能、
前記圧縮パーティションと前記圧縮パーティションを固有に識別する格納キーとを連係させて圧縮テーブルに格納するように前記対象システムを制御する第1−3機能、および
前記格納キーと前記選別情報とを連係させて前記ローカルデータベースのインデックステーブルに格納するように前記対象システムを制御する第1−4機能
を提供することを特徴とする、請求項1に記載のコンピュータプログラム。 - 前記選別情報は、該当のデータレコードの任意のフィールド値を含み、
前記第1−4機能は、前記格納キーと前記任意のフィールド値とを連係させて前記ローカルデータベースのグループインデックステーブルに格納するように前記対象システムを制御すること
を特徴とする、請求項5に記載のコンピュータプログラム。 - 前記選別情報は、該当のデータレコードの時間に関する情報を含み、
前記第1−4機能は、前記格納キーと前記時間に関する情報とを連係させて期間インデックステーブルに格納するように前記対象システムを制御すること
を特徴とする、請求項5に記載のコンピュータプログラム。 - 前記第1機能を提供する段階は、
前記テーブルに含まれたデータレコードそれぞれに対し、プライマリキー(primary key)と、該当のデータレコードを含んで圧縮された圧縮パーティション内での該当のデータレコードの位置であるキーインデックス情報と、該当のデータレコードを含んで圧縮された圧縮パーティションに対応する格納キーとを連係させてキーインデックステーブルに格納するように前記対象システムを制御する第1−5機能
をさらに提供することを特徴とする、請求項5に記載のコンピュータプログラム。 - 前記第1−5機能は、
前記プライマリキーによって前記テーブルと連結する連結テーブルでデータレコードを圧縮して生成された第2圧縮パーティションに対し、
前記第2圧縮パーティションに含まれたデータレコードのうちで前記テーブルに含まれたデータレコードと前記プライマリキーが等しいデータレコードを検索し、前記検索されたデータレコードに対し、前記第2圧縮パーティション内での位置であるサブインデックス情報を前記キーインデックステーブル上の前記プライマリキーが等しいデータレコードに対してさらに格納するように前記対象システムを制御すること
を特徴とする、請求項8に記載のコンピュータプログラム。 - 前記第1機能を提供する段階は、
前記圧縮されたデータレコードを前記テーブルから削除するように前記対象システムを制御する第1−6機能
をさらに提供することを特徴とする、請求項5に記載のコンピュータプログラム。 - 前記第1機能を提供する段階は、
前記削除されたデータレコードの復元要求に応答し、前記インデックステーブルから前記復元要求が含む識別情報と連係する格納キーを検索し、前記圧縮テーブルで前記検索された格納キーと連係する圧縮パーティションを検索し、前記検索された圧縮パーティションの圧縮を解除して前記削除されたデータレコードを復元し、前記復元されたデータレコードを前記識別情報に基づいて前記テーブルに記録するように前記対象システムを制御する第1−7機能
をさらに提供することを特徴とする、請求項10に記載のコンピュータプログラム。 - 前記第1−2機能は、前記決定されたパーティションに含まれたデータレコードをバイナリオブジェクトとして圧縮して前記圧縮パーティションを生成するように前記対象システムを制御すること
を特徴とする、請求項5に記載のコンピュータプログラム。 - 前記第2機能を提供する段階は、
データレコードの選別情報を含む検索条件を受信するように前記対象システムを制御する第2−1機能、
前記対象システムのローカルデータベース上でデータレコードの選別情報と該当のデータレコードが含まれた圧縮パーティションを固有に識別する格納キーとを連係させて格納するインデックステーブルから、前記検索条件が含む選別情報と連係する格納キーを検索するように前記対象システムを制御する第2−2機能、および
格納キーと圧縮パーティションとを連係させて格納する圧縮テーブルで前記検索された格納キーと連係する圧縮パーティションを検索するように前記対象システムを制御する第2−3機能
を提供することを特徴とする、請求項1に記載のコンピュータプログラム。 - 前記データアーカイブ方法は、
前記格納システムにアーカイブされたデータの寿命周期を管理するための第3機能を、前記ネットワークを介して前記対象システムに提供する段階
をさらに含むことを特徴とする、請求項1に記載のコンピュータプログラム。 - 前記第3機能を提供する段階は、
前記格納システムにアーカイブされたデータの保管期間が経過した場合、データベースのテーブルに圧縮された状態で管理されるデータをファイルとしてアーカイブして保管するように前記対象システムを制御するための第3−1機能、および
前記ファイルとしてアーカイブされたデータを削除するように前記対象システムを制御するための第3−2機能
を提供することを特徴とする、請求項14に記載のコンピュータプログラム。 - 少なくとも1つのプロセッサを含むコンピュータ装置が実行するデータアーカイブ方法であって、
前記少なくとも1つのプロセッサにより、データを格納する対象システムから遠隔機能の呼び出しを受信する段階、
前記少なくとも1つのプロセッサにより、前記遠隔機能の呼び出しに応答し、前記対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第1機能を、前記ネットワークを介して前記対象システムに提供する段階、および
前記少なくとも1つのプロセッサにより、前記格納システムにアーカイブされたデータを照会するための第2機能を、前記ネットワークを介して前記対象システムに提供する段階
を含む、データアーカイブ方法。 - 前記第1機能を提供する段階は、
前記対象システムのローカルデータベースのテーブルに含まれたデータレコードに対するパーティションをデータレコードの選別情報に基づいて決定するように前記対象システムを制御する第1−1機能、
前記パーティションごとにデータレコードを圧縮して圧縮パーティションを生成するように前記対象システムを制御する第1−2機能、
前記圧縮パーティションと前記圧縮パーティションを固有に識別する格納キーとを連係させて圧縮テーブルに格納するように前記対象システムを制御する第1−3機能、および
前記格納キーと前記選別情報とを連係させて前記ローカルデータベースのインデックステーブルに格納するように前記対象システムを制御する第1−4機能
を提供することを特徴とする、請求項16に記載のデータアーカイブ方法。 - 前記第2機能を提供する段階は、
データレコードの選別情報を含む検索条件を受信するように前記対象システムを制御する第2−1機能、
前記対象システムのローカルデータベース上でデータレコードの選別情報と該当のデータレコードが含まれた圧縮パーティションを固有に識別する格納キーとを連係させて格納するインデックステーブルから、前記検索条件が含む選別情報と連係する格納キーを検索するように前記対象システムを制御する第2−2機能、および
格納キーと圧縮パーティションと連係させて格納する圧縮テーブルで前記検索された格納キーと連係する圧縮パーティションを検索するように前記対象システムを制御する第2−3機能
を提供することを特徴とする、請求項16に記載のデータアーカイブ方法。 - 請求項16〜18のいずれかに記載の方法をコンピュータ装置に実行させるためのコンピュータプログラムが記録されている、コンピュータ読み取り可能な記録媒体。
- コンピュータ読み取り可能な命令を実行するように実現される少なくとも1つのプロセッサ
を含み、
前記少なくとも1つのプロセッサにより、
データを格納する対象システムから遠隔機能の呼び出しを受信し、
前記遠隔機能の呼び出しに応答し、前記対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第1機能を、前記ネットワークを介して前記対象システムに提供し、
前記格納システムにアーカイブされたデータを照会するための第2機能を、前記ネットワークを介して前記対象システムに提供すること
を特徴とする、コンピュータ装置。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2020-0001413 | 2020-01-06 | ||
KR20200001413 | 2020-01-06 | ||
KR1020200108750A KR102559290B1 (ko) | 2020-01-06 | 2020-08-27 | 하이브리드 클라우드 기반의 실시간 데이터 아카이빙 방법 및 시스템 |
KR10-2020-0108750 | 2020-08-27 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021111352A true JP2021111352A (ja) | 2021-08-02 |
Family
ID=76600356
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020175322A Pending JP2021111352A (ja) | 2020-01-06 | 2020-10-19 | コンピュータプログラム、データアーカイブ方法、記憶媒体およびコンピュータ装置 |
JP2021547809A Active JP7324471B2 (ja) | 2020-01-06 | 2020-12-22 | データのハイブリッド保存を利用したデータアーカイブ方法およびシステム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021547809A Active JP7324471B2 (ja) | 2020-01-06 | 2020-12-22 | データのハイブリッド保存を利用したデータアーカイブ方法およびシステム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11249975B2 (ja) |
JP (2) | JP2021111352A (ja) |
KR (4) | KR102559290B1 (ja) |
CN (2) | CN114761939A (ja) |
WO (1) | WO2021141294A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220222006A1 (en) * | 2021-01-14 | 2022-07-14 | Seagate Technology Llc | In-device handling of file and object life cycle |
KR102365970B1 (ko) * | 2021-08-30 | 2022-02-23 | 주식회사 펠릭스 | 아카이브 관리 시스템 |
KR20230148034A (ko) | 2022-04-15 | 2023-10-24 | 주식회사 메디컬에이아이 | 클라우드기반 생체데이터의 개인정보 비식별화 방법 |
KR102537328B1 (ko) * | 2022-11-15 | 2023-05-30 | 주식회사 이노야드 | 라이다 센서 기반 흉상 모델링 및 흉부 치수 측정 방법 및 장치 |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10161913A (ja) * | 1996-10-01 | 1998-06-19 | Fujitsu Ltd | ネットワークアーカイバシステム及びネットワークアーカイバシステムを構築するプログラムを記録したコンピュータ読み取り可能な記録媒体 |
EP1026603A3 (en) * | 1999-02-02 | 2002-01-30 | SmithKline Beecham Corporation | Apparatus and method for depersonalizing information |
JP2001043115A (ja) * | 1999-07-29 | 2001-02-16 | Nec Corp | ファイル管理システム及びファイル管理方法 |
US20020129216A1 (en) * | 2001-03-06 | 2002-09-12 | Kevin Collins | Apparatus and method for configuring available storage capacity on a network as a logical device |
CA2411297A1 (en) * | 2001-11-21 | 2003-05-21 | Ge Medical Systems Information Technologies, Inc. | Image tessellation for region-specific coefficient access |
JP2003264540A (ja) * | 2002-03-07 | 2003-09-19 | Dainippon Printing Co Ltd | 情報配信方法およびシステム |
JP4412983B2 (ja) | 2003-11-28 | 2010-02-10 | 富士通株式会社 | アーカイブ装置およびアーカイブ処理プログラム |
US7243110B2 (en) * | 2004-02-20 | 2007-07-10 | Sand Technology Inc. | Searchable archive |
JP4645084B2 (ja) * | 2004-07-13 | 2011-03-09 | 富士ゼロックス株式会社 | データ管理システム、データ管理方法及びそのためのプログラム |
GB2456996B (en) * | 2006-12-26 | 2011-09-21 | Fujitsu Ltd | Data compression apparatus and data decompression apparatus |
JP5324797B2 (ja) * | 2007-02-26 | 2013-10-23 | Soop株式会社 | データ管理システム |
JPWO2009022531A1 (ja) * | 2007-08-13 | 2010-11-11 | 日本電気株式会社 | データ圧縮伸張方法 |
FR2922701B1 (fr) * | 2007-10-23 | 2009-11-20 | Inside Contacless | Procede de personnalisation securise d'un chipset nfc |
JP5267983B2 (ja) * | 2008-10-01 | 2013-08-21 | 株式会社日立製作所 | タグアクセスシステム及びデータ格納方法 |
KR100960092B1 (ko) * | 2009-11-02 | 2010-05-31 | 주식회사 나노엔텍 | 이미지 데이터 등록 방법 및 시스템 |
DE102010011344B4 (de) * | 2010-03-12 | 2015-08-27 | Artec Computer Gmbh | Verfahren zur Herstellung und Verwaltung eines großvolumigen Langzeitarchivs |
US20110252207A1 (en) | 2010-04-08 | 2011-10-13 | Oracle International Corporation | Dynamic content archiving |
KR20130020231A (ko) * | 2011-08-19 | 2013-02-27 | 주식회사 인프라웨어 | 웹 어플리케이션의 저작권 보호 시스템 |
KR101287518B1 (ko) | 2012-02-08 | 2013-08-23 | 주식회사 파수닷컴 | Epub 기반 컨텐츠에 대한 디지털 저작권 관리장치 및 방법, 그리고 사용자 권한에 따른 epub 기반 컨텐츠 제공장치 및 방법 |
EP2883170A4 (en) * | 2012-08-08 | 2015-07-29 | Amazon Tech Inc | STORAGE SYSTEM FOR ARCHIVING DATA |
KR20140072929A (ko) * | 2012-11-16 | 2014-06-16 | 현대중공업 주식회사 | 아카이빙 작업수행 자동화 방법 |
KR20150075190A (ko) * | 2013-12-24 | 2015-07-03 | 주식회사 케이티 | 사용자의 비용 계획에 근거한 스토리지 서비스 제공 장치 및 방법 |
US9411975B2 (en) * | 2014-03-31 | 2016-08-09 | Intel Corporation | Methods and apparatus to securely share data |
JP6309866B2 (ja) * | 2014-09-04 | 2018-04-11 | 株式会社東芝 | 匿名化システム |
US9250839B1 (en) * | 2014-10-31 | 2016-02-02 | Kyocera Document Solutions Inc. | Printing system for data handling having a primary server for storing active and passive data and a second server for storing normalized and analytical data |
KR101728878B1 (ko) * | 2015-05-08 | 2017-05-02 | (주)케이사인 | 개인정보 이관 시스템 |
JP2017005412A (ja) * | 2015-06-08 | 2017-01-05 | 国立大学法人京都大学 | データ処理装置、データ送信方法、コンピュータプログラム、及びデータサーバ |
KR101663547B1 (ko) * | 2016-02-26 | 2016-10-07 | 주식회사 아미크 | 데이터베이스의 아카이빙 방법 및 장치, 아카이빙된 데이터베이스의 검색 방법 및 장치 |
KR101656750B1 (ko) * | 2016-02-26 | 2016-09-23 | 주식회사 아미크 | 인덱스정보를 생성하는 데이터베이스의 아카이빙 방법 및 장치, 인덱스정보를 포함하는 아카이빙된 데이터베이스의 검색 방법 및 장치 |
US10762037B2 (en) | 2016-03-25 | 2020-09-01 | Hitachi, Ltd | Data processing system |
CN109643247B (zh) * | 2016-07-20 | 2023-07-04 | 世界线公司 | 用于市场导向的混合云基础架构的多标准自适应调度 |
KR20180126960A (ko) * | 2017-05-19 | 2018-11-28 | 한국전자통신연구원 | 가상 데스크탑 서비스 제공 장치 및 그 방법 |
KR102009419B1 (ko) * | 2017-07-20 | 2019-08-09 | 라인 가부시키가이샤 | 실행 가능한 압축 파일을 보호하기 위한 파일 보호 방법 및 시스템 |
CN107423426B (zh) * | 2017-08-02 | 2020-06-02 | 众安信息技术服务有限公司 | 一种区块链块数据的数据归档方法及电子设备 |
KR102109467B1 (ko) * | 2019-04-30 | 2020-05-12 | 주식회사 데이타젠네트웍스 | 업무영역의 상관관계를 이용한 데이터 식별 시스템 및 방법 |
-
2020
- 2020-08-27 KR KR1020200108750A patent/KR102559290B1/ko active IP Right Grant
- 2020-10-19 JP JP2020175322A patent/JP2021111352A/ja active Pending
- 2020-11-06 KR KR1020200147425A patent/KR102267441B1/ko active IP Right Grant
- 2020-12-21 KR KR1020200179839A patent/KR102301304B1/ko active IP Right Grant
- 2020-12-22 CN CN202080084429.7A patent/CN114761939A/zh active Pending
- 2020-12-22 CN CN202080084433.3A patent/CN114787790A/zh active Pending
- 2020-12-22 JP JP2021547809A patent/JP7324471B2/ja active Active
- 2020-12-22 WO PCT/KR2020/018913 patent/WO2021141294A1/ko active Application Filing
- 2020-12-30 KR KR1020200187260A patent/KR102270896B1/ko active IP Right Grant
-
2021
- 2021-08-18 US US17/405,839 patent/US11249975B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2022520654A (ja) | 2022-03-31 |
US20210374118A1 (en) | 2021-12-02 |
US11249975B2 (en) | 2022-02-15 |
JP7324471B2 (ja) | 2023-08-10 |
KR102559290B1 (ko) | 2023-07-26 |
KR20210088407A (ko) | 2021-07-14 |
KR102267441B1 (ko) | 2021-06-22 |
KR102270896B1 (ko) | 2021-06-30 |
CN114787790A (zh) | 2022-07-22 |
WO2021141294A1 (ko) | 2021-07-15 |
KR20210088419A (ko) | 2021-07-14 |
KR102301304B1 (ko) | 2021-09-14 |
CN114761939A (zh) | 2022-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10528599B1 (en) | Tiered data processing for distributed data | |
JP2021111352A (ja) | コンピュータプログラム、データアーカイブ方法、記憶媒体およびコンピュータ装置 | |
CN109564568B (zh) | 用于分布式数据集索引的装置、方法和机器可读存储介质 | |
CN109997126B (zh) | 事件驱动提取、变换、加载(etl)处理 | |
US10069916B2 (en) | System and method for transparent context aware filtering of data requests | |
US11868359B2 (en) | Dynamically assigning queries to secondary query processing resources | |
WO2016018942A1 (en) | Systems and methods for an sql-driven distributed operating system | |
US11727004B2 (en) | Context dependent execution time prediction for redirecting queries | |
US10990627B1 (en) | Sharing character data across lookups to identify matches to a regular expression | |
US11556497B2 (en) | Real-time archiving method and system based on hybrid cloud | |
US20220327095A1 (en) | Data archiving method and system for minimizing cost of data transmission and retrieval | |
JP7300684B2 (ja) | 目的データ選別方法およびシステム | |
JP7376027B2 (ja) | 企業分割時に組織データを選別して移管する方法およびシステム | |
KR102529704B1 (ko) | 인 메모리 데이터베이스의 데이터를 처리하는 방법 및 장치 | |
JP2020088847A (ja) | データ処理用の方法及び装置 | |
US11500896B2 (en) | Method and system for selectively separating organization data according to business division | |
CN115328702A (zh) | 日志数据备份方法、装置、电子设备及存储介质 | |
CN117950584A (zh) | 数据存储方法、装置、电子设备及存储介质 | |
Padhy et al. | A Gentle Introduction to Hadoop Platforms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230912 |