JP2021111352A

JP2021111352A - コンピュータプログラム、データアーカイブ方法、記憶媒体およびコンピュータ装置

Info

Publication number: JP2021111352A
Application number: JP2020175322A
Authority: JP
Inventors: セフンチョン; Sehun Jung
Original assignee: Armiq Co Ltd
Current assignee: Armiq Co Ltd
Priority date: 2020-01-06
Filing date: 2020-10-19
Publication date: 2021-08-02
Also published as: JP2022520654A; US20210374118A1; US11249975B2; JP7324471B2; KR102559290B1; KR20210088407A; KR102267441B1; KR102270896B1; CN114787790A; WO2021141294A1; KR20210088419A; KR102301304B1; CN114761939A

Abstract

【課題】ハイブリッドクラウド基盤のリアルタイムデータアーカイブ方法およびシステムを提供する。【解決手段】データを格納する対象システムから遠隔機能の呼び出しを受信し、このような遠隔機能の呼び出しに応答し、対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第１機能を、前記ネットワークを介して前記対象システムに提供し、前記格納システムにアーカイブされたデータを照会するための第２機能を、前記ネットワークを介して前記対象システムに提供することにより、遠隔ニアライン（ｎｅａｒ−ｌｉｎｅ）データアーカイブ機能を提供することができる、データアーカイブ方法および装置を提供する。【選択図】図３

Description

以下の説明は、ハイブリッドクラウド基盤のリアルタイムデータアーカイブ方法およびそのシステムに関する。

近年は、データ関連の規制強化、医療産業の成長と患者のデータ保存管理の重要性の増大、企業内のデータ管理への関心が高まっており、データアーカイブに対する研究の必要性が高まっている。例えば、データ関連の規制の観点において、金融取引データや医療情報のようなデータは、消費者権利保護のために数年から数十年にわったってデータを保管するように法で規定されているため、各種データ関連の規制によって長期間のデータ保存が必要な状況である。また、医療産業分野では、画像診断の依存度が上昇して医療画像のデータ量が増加するにともない、データの保管や管理のためのストレージおよびバックアップの需要をはじめ、増加し続けるデータ管理のためのアーカイブシステムの必要性が高まっている。また、企業のデータ管理の観点では、企業が送受信する膨大な量のデータをサーバで保管し、サーバに保存されたデータをリアルタイムで復旧したりバックアップしたりする作業だけでなく、重要なデータを保安しながら管理する機能の重要性が増している。さらに、製造業の自動化の観点では、伝統的に労動集約的な製造会社の多くは中国やインドなどの低賃金国に工場を移転したが、ロボット技術の発展によって生産の効率性と高い品質の融合型ロボット工場が構築され、工程自動化が加速化している。

第４次産業革命時代の渡来によってビックデータ分野が注目されるようになったが、現在の国内のビックデータ分野は、サーバ、ストレージ、ネットワークなどのインフラ投資に集中している量産型であるため、今後のアーカイブ技術の開発により、インフラに対する投資を分散させ、ソフトウェアおよびサービス分野への発展の拡大が求められている。これにより、従来に比べて高いデータ圧縮率と圧縮速度を備えながら迅速なデータ照会が可能なアーカイブ技術の開発への需要が高まっている。

韓国公開特許第２０１４−００７２９２９号公報

データを格納する対象システムから遠隔機能の呼び出しを受信し、このような遠隔機能の呼び出しに応答し、対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第１機能を、前記ネットワークを介して前記対象システムに提供し、前記格納システムにアーカイブされたデータを照会するための第２機能を、前記ネットワークを介して前記対象システムに提供することにより、遠隔ニアライン（ｎｅａｒ−ｌｉｎｅ）データアーカイブ機能を提供することができる、データアーカイブ方法および装置を提供する。

少なくとも１つのプロセッサを含むコンピュータ装置が実行するデータアーカイブ方法であって、前記少なくとも１つのプロセッサにより、データを格納する対象システムから遠隔機能の呼び出しを受信する段階、前記少なくとも１つのプロセッサにより、前記遠隔機能の呼び出しに応答し、前記対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第１機能を、前記ネットワークを介して前記対象システムに提供する段階、および前記少なくとも１つのプロセッサにより、前記格納システムにアーカイブされたデータを照会するための第２機能を、前記ネットワークを介して前記対象システムに提供する段階を含む、データアーカイブ方法を提供する。

一側によると、前記第１機能を提供する段階は、前記対象システムのローカルデータベースに格納されたデータのうちの少なくとも一部を圧縮して前記ローカルデータベースのテーブルにアーカイブするための機能を提供することを特徴としてよい。

他の側面によると、前記第１機能を提供する段階は、前記対象システムのローカルデータベースに格納されたデータのうちの少なくとも一部を圧縮して前記対象システムの外部データベースのテーブルにアーカイブするための機能を提供することを特徴としてよい。

また他の側面によると、前記第１機能を提供する段階は、前記対象システムのローカルデータベースに格納されたデータのうちの少なくとも一部をファイルとして圧縮して前記対象システムの外部システムが含む格納場所にアーカイブするための機能を提供することを特徴としてよい。

また他の側面によると、前記第１機能を提供する段階は、前記対象システムのローカルデータベースのテーブルに含まれたデータレコードに対するパーティションをデータレコードの選別情報に基づいて決定するように前記対象システムを制御する第１−１機能、前記パーティションごとにデータレコードを圧縮して圧縮パーティションを生成するように前記対象システムを制御する第１−２機能、前記圧縮パーティションと前記圧縮パーティションを固有に識別する格納キーとを連係させて圧縮テーブルに格納するように前記対象システムを制御する第１−３機能、および前記格納キーと前記選別情報とを連係させて前記ローカルデータベースのインデックステーブルに記録するように前記対象システムを制御する第１−４機能を提供することを特徴としてよい。

また他の側面によると、前記選別情報は、該当のデータレコードの任意のフィールド値を含み、前記第１−４機能は、前記格納キーと前記任意のフィールド値とを連係させて前記ローカルデータベースのグループインデックステーブルに記録するように前記対象システムを制御することを特徴としてよい。

また他の側面によると、前記選別情報は、該当のデータレコードの時間に関する情報を含み、前記第１−４機能は、前記格納キーと前記時間に関する情報とを連係させて期間インデックステーブルに記録するように前記対象システムを制御することを特徴としてよい。

また他の側面によると、前記第１機能を提供する段階は、前記テーブルに含まれたデータレコードそれぞれに対し、プライマリキー（ｐｒｉｍａｒｙｋｅｙ）と、該当のデータレコードを含んで圧縮された圧縮パーティション内での該当のデータレコードの位置であるキーインデックス情報と、該当のデータレコードを含んで圧縮された圧縮パーティションに対応する格納キーとを連係させてキーインデックステーブルに記録するように前記対象システムを制御する第１−５機能をさらに提供することを特徴としてよい。

また他の側面によると、前記第１−５機能は、前記プライマリキーによって前記テーブルと連結する連結テーブルでデータレコードを圧縮して生成された第２圧縮パーティションに対し、前記第２圧縮パーティションに含まれたデータレコードのうちで前記テーブルに含まれたデータレコードと前記プライマリキーが等しいデータレコードを検索し、前記検索されたデータレコードに対し、前記第２圧縮パーティション内での位置であるサブインデックス情報を前記キーインデックステーブル上の前記プライマリキーが等しいデータレコードに対してさらに記録するように前記対象システムを制御することを特徴としてよい。

また他の側面によると、前記第１機能を提供する段階は、前記圧縮されたデータレコードを前記テーブルから削除するように前記対象システムを制御する第１−６機能をさらに提供することを特徴としてよい。

また他の側面によると、前記第１機能を提供する段階は、前記削除されたデータレコードの復元要求に応答し、前記インデックステーブルで前記復元要求が含む識別情報と連係する格納キーを検索し、前記圧縮テーブルで前記検索された格納キーと連係する圧縮パーティションを検索し、前記検索された圧縮パーティションの圧縮を解除して前記削除されたデータレコードを復元し、前記復元されたデータレコードを前記識別情報に基づいて前記テーブルに記録するように前記対象システムを制御する第１−７機能をさらに提供することを特徴としてよい。

また他の側面によると、前記第１−２機能は、前記決定されたパーティションに含まれたデータレコードをバイナリオブジェクトとして圧縮して前記圧縮パーティションを生成するように前記対象システムを制御することを特徴としてよい。

また他の側面によると、前記第２機能を提供する段階は、データレコードの選別情報を含む検索条件を受信するように前記対象システムを制御する第２−１機能、前記対象システムのローカルデータベース上でデータレコードの選別情報と該当のデータレコードが含まれた圧縮パーティションを固有に識別する格納キーとを連係させて記録するインデックステーブルから、前記検索条件が含む選別情報と連係する格納キーを検索するように前記対象システムを制御する第２−２機能、および格納キーと圧縮パーティションとを連係させて記録する圧縮テーブルで、前記検索された格納キーと連係する圧縮パーティションを検索するように前記対象システムを制御する第２−３機能を提供することを特徴としてよい。

また他の側面によると、前記データアーカイブ方法は、前記格納システムにアーカイブされたデータの寿命周期を管理するための第３機能を、前記ネットワークを介して前記対象システムに提供する段階をさらに含むことを特徴としてよい。

さらに他の側面によると、前記第３機能を提供する段階は、前記格納システムにアーカイブされたデータの保管期間が経過した場合、データベースのテーブルに圧縮された状態で管理されるデータをファイルとしてアーカイブして保管するように前記対象システムを制御するための第３−１機能、および前記ファイルとしてアーカイブされたデータを削除するように前記対象システムを制御するための第３−２機能を提供することを特徴としてよい。

コンピュータ装置と結合して前記方法をコンピュータ装置に実行させるためにコンピュータ読み取り可能な記録媒体に記録された、コンピュータプログラムを提供する。

前記方法をコンピュータ装置に実行させるためのプログラムが記録されている、コンピュータ読み取り可能な記録媒体を提供する。

コンピュータ読み取り可能な命令を実行するように実現される少なくとも１つのプロセッサを含み、前記少なくとも１つのプロセッサにより、データを格納する対象システムから遠隔機能の呼び出しを受信し、前記遠隔機能の呼び出しに応答し、前記対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第１機能を、前記ネットワークを介して前記対象システムに提供し、前記格納システムにアーカイブされたデータを照会するための第２機能を、前記ネットワークを介して前記対象システムに提供することを特徴とするコンピュータ装置を提供する。

データを格納する対象システムから遠隔機能の呼び出しを受信し、このような遠隔機能の呼び出しに応答し、対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第１機能を、前記ネットワークを介して前記対象システムに提供し、前記格納システムにアーカイブされたデータを照会するための第２機能を、前記ネットワークを介して前記対象システムに提供することにより、遠隔ニアライン（ｎｅａｒ−ｌｉｎｅ）データアーカイブ機能を提供することができる。

本発明の一実施形態における、ネットワーク環境の例を示した図である。本発明の一実施形態における、コンピュータ装置の例を示したブロック図である。本発明の一実施形態における、アーカイブのためのコンピュータシステムを概括的に示した図である。本発明の一実施形態における、データアーカイブ方法の例を示したフローチャートである。本発明の一実施形態における、第１機能によってデータをアーカイブする過程の例を示したフローチャートである。本発明の一実施形態における、圧縮テーブルの構造の第１例を示した図である。本発明の一実施形態における、圧縮テーブルの構造の第２例を示した図である。本発明の一実施形態における、期間インデックステーブルの構造の例を示した図である。本発明の一実施形態における、グループインデックステーブルの構造の例を示した図である。本発明の一実施形態における、圧縮テーブルの構造の第２例を示した図である。本発明の一実施形態における、期間インデックステーブルとグループインデックステーブルが結合された形態のインデックステーブルの構造の例を示した図である。本発明の一実施形態における、第１機能によってデータをアーカイブする過程のまた他の例を示したフローチャートである。本発明の一実施形態における、圧縮テーブルおよびキーインデックステーブルの構造の例を示した図である。本発明の一実施形態における、圧縮テーブルおよびキーインデックステーブルの構造の他の例を示した図である。本発明の一実施形態における、第２機能によってアーカイブされたデータを検索する過程の例を示した図である。本発明の一実施形態における、アーカイブされたデータを検索する例を示した図である。本発明の一実施形態における、アーカイブされたデータを検索する例を示した図である。本発明の一実施形態における、データを効果的に格納するための過程の例を示した図である。本発明の一実施形態における、データを非識別化する方法の例を示した図である。

本発明は、多様な変更が加えられても、多様な実施形態を有してもよいものであり、特定の実施形態については、図面を参照しながら以下の詳細な説明において詳しく説明する。しかし、これは、本発明を特定の実施形態に対して限定しようとするものではなく、本発明の思想および技術範囲に含まれるすべての変更、均等物、あるいは置換物を含むものと理解されなければならない。各図面を説明するにあたり、類似の構成要素には類似の参照符号を付与した。

第１、第２、Ａ、Ｂなどの用語は、多様な構成要素を説明するために使用されるものに過ぎず、前記構成要素がこのような用語によって限定されてはならない。前記用語は、１つの構成要素を他の構成要素と区別することを目的とするものに過ぎない。例えば、本発明の権利範囲を逸脱しない限り、第１構成要素が第２構成要素と命名されてもよく、同じように、第２構成要素が第１構成要素と命名されてもよい。および／またはという用語は、複数の関連して記載された項目の組み合わせ、または複数の関連して記載された項目のうちのいずれかの項目を含む。

ある構成要素が他の構成要素に「連結されて」いるか「接続されて」いるという記載は、その他の構成要素に直接に連結あるいは接続されている状態はもちろん、その中間に他の構成要素が存在する場合も含まれると理解されなければならない。この反面、ある構成要素が他の構成要素に「直接に連結されて」いるか「直接に接続されて」いると記載されるときには、その中間に他の構成要素が存在しない状態であると理解されなければならない。

本出願で使用される用語は、特定の実施形態を説明するためのものに過ぎず、本発明を限定しようと意図するものではない。単数の表現は、文脈において明らかな説明がない限り、複数の表現も含む。本出願において、「含む」または「有する」などの用語は、明細書に記載された特徴、数字、段階、動作、構成要素、部品、またはこれらを組み合わせたものが存在することを指定するためのものであり、１つまたはそれ以上の他の特徴や数字、段階、動作、構成要素、部品、またはこれらを組み合わせたものなどの存在または付加的な可能性を予め排除しないものと理解されなければならない。

異なるように定義されない限り、技術的や科学的な用語を含んでここで使用されるすべての用語は、本発明が属する技術分野において通常の知識を有する者が一般的に理解しているものと同じ意味をもつ。一般的に使用される、事前に定義されたものと同じ用語は、関連技術の文脈に記載されている意味と一致する意味をもつと解釈されなければならず、本出願で明らかに定義しない限り、理想的や過度に形式的な意味として解釈されてはならない。

以下、実施形態について、添付の図面を参照しながら詳しく説明する。

本発明の実施形態に係るデータアーカイブシステムは、少なくとも１つのコンピュータ装置によって実現されてよく、本発明の実施形態に係るデータアーカイブ方法は、データアーカイブシステムに含まれる少なくとも１つのコンピュータ装置によって実行されてよい。コンピュータ装置においては、本発明の一実施形態に係るコンピュータプログラムがインストールされて実現されてよく、コンピュータ装置は、実現するコンピュータプログラムの制御にしたがって本発明の実施形態に係るデータ処理方法を実行してよい。上述したコンピュータプログラムは、コンピュータ装置と結合してデータアーカイブ方法をコンピュータ装置に実行させるためにコンピュータ読み取り可能な記録媒体に記録されてよい。

図１は、本発明の一実施形態における、ネットワーク環境の例を示した図である。図１のネットワーク環境は、複数の電子機器１１０、１２０、１３０、１４０、複数のサーバ１５０、１６０、およびネットワーク１７０を含む例を示している。このような図１は、発明の説明のための一例に過ぎず、電子機器の数やサーバの数が図１のように限定されることはない。また、図１のネットワーク環境は、本実施形態に適用可能な環境のうちの１つの例を説明するものに過ぎず、本実施形態に適用可能な環境が図１のネットワーク環境に限定されることはない。

複数の電子機器１１０、１２０、１３０、１４０は、コンピュータ装置によって実現される固定端末や移動端末であってよい。複数の電子機器１１０、１２０、１３０、１４０の例としては、スマートフォン、携帯電話、ナビゲーション、ＰＣ（ｐｅｒｓｏｎａｌｃｏｍｐｕｔｅｒ）、ノート型ＰＣ、デジタル放送用端末、ＰＤＡ（ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔ）、ＰＭＰ（ＰｏｒｔａｂｌｅＭｕｌｔｉｍｅｄｉａＰｌａｙｅｒ）、タブレットなどがある。一例として、図１では、電子機器１１０の例としてスマートフォンを示しているが、本発明の実施形態において、電子機器１１０は、実質的に無線または有線通信方式を利用し、ネットワーク１７０を介して他の電子機器１２０、１３０、１４０および／またはサーバ１５０、１６０と通信することのできる多様な物理的なコンピュータ装置のうちの１つを意味してよい。

通信方式が限定されることはなく、ネットワーク１７０が含むことのできる通信網（一例として、移動通信網、有線インターネット、無線インターネット、放送網）を利用する通信方式だけではなく、機器間の近距離無線通信が含まれてもよい。例えば、ネットワーク１７０は、ＰＡＮ（ｐｅｒｓｏｎａｌａｒｅａｎｅｔｗｏｒｋ）、ＬＡＮ（ｌｏｃａｌａｒｅａｎｅｔｗｏｒｋ）、ＣＡＮ（ｃａｍｐｕｓａｒｅａｎｅｔｗｏｒｋ）、ＭＡＮ（ｍｅｔｒｏｐｏｌｉｔａｎａｒｅａｎｅｔｗｏｒｋ）、ＷＡＮ（ｗｉｄｅａｒｅａｎｅｔｗｏｒｋ）、ＢＢＮ（ｂｒｏａｄｂａｎｄｎｅｔｗｏｒｋ）、インターネットなどのネットワークのうちの１つ以上の任意のネットワークを含んでよい。さらに、ネットワーク１７０は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スター−バスネットワーク、ツリーまたは階層的ネットワークなどを含むネットワークトポロジのうちの任意の１つ以上を含んでもよいが、これらに限定されることはない。

サーバ１５０、１６０それぞれは、複数の電子機器１１０、１２０、１３０、１４０とネットワーク１７０を介して通信して命令、コード、ファイル、コンテンツ、サービスなどを提供する１つ以上のコンピュータ装置によって実現されてよい。例えば、サーバ１５０は、ネットワーク１７０を介して接続した複数の電子機器１１０、１２０、１３０、１４０にサービス（一例として、アーカイブサービス、ファイル配布サービス、地図サービス、コンテンツ提供サービス、グループ通話サービス（または、音声会議サービス）、メッセージングサービス、メールサービス、ソーシャルネットワークサービス、翻訳サービス、金融サービス、決済サービス、検索サービスなど）を提供するシステムであってよい。

図２は、本発明の一実施形態における、コンピュータ装置の例を示したブロック図である。上述した複数の電子機器１１０、１２０、１３０、１４０それぞれやサーバ１５０、１６０それぞれは、図２に示したコンピュータ装置２００によって実現されてよい。

このようなコンピュータ装置２００は、図２に示すように、メモリ２１０、プロセッサ２２０、通信インタフェース２３０、および入力／出力インタフェース２４０を含んでよい。メモリ２１０は、コンピュータ読み取り可能な記録媒体であって、ＲＡＭ（ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）、ＲＯＭ（ｒｅａｄｏｎｌｙｍｅｍｏｒｙ）、およびディスクドライブのような永続的大容量記録装置を含んでよい。ここで、ＲＯＭやディスクドライブのような永続的大容量記録装置は、メモリ２１０とは区分される別の永続的記録装置としてコンピュータ装置２００に含まれてもよい。また、メモリ２１０には、オペレーティングシステムと、少なくとも１つのプログラムコードが記録されてよい。このようなソフトウェア構成要素は、メモリ２１０とは別のコンピュータ読み取り可能な記録媒体からメモリ２１０にロードされてよい。このような別のコンピュータ読み取り可能な記録媒体は、フロッピー（登録商標）ドライブ、ディスク、テープ、ＤＶＤ／ＣＤ−ＲＯＭドライブ、メモリカードなどのコンピュータ読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータ読み取り可能な記録媒体ではない通信インタフェース２３０を通じてメモリ２１０にロードされてもよい。例えば、ソフトウェア構成要素は、ネットワーク１７０を介して受信されるファイルによってインストールされるコンピュータプログラムに基づいてコンピュータ装置２００のメモリ２１０にロードされてよい。

プロセッサ２２０は、基本的な算術、ロジック、および入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ２１０または通信インタフェース２３０によって、プロセッサ２２０に提供されてよい。例えば、プロセッサ２２０は、メモリ２１０のような記録装置に記録されたプログラムコードにしたがって受信される命令を実行するように構成されてよい。

通信モジュール２３０は、ネットワーク１７０を介してコンピュータ装置２００が他の装置（一例として、上述した記録装置）と互いに通信するための機能を提供してよい。一例として、コンピュータ装置２００のプロセッサ２２０がメモリ２１０のような記録装置に記録されたプログラムコードにしたがって生成した要求や命令、データ、ファイルなどが、通信インタフェース２３０の制御にしたがってネットワーク１７０を介して他の装置に伝達されてよい。これとは逆に、他の装置からの信号や命令、データファイルなどが、ネットワーク１７０を経てコンピュータ装置２００の通信モジュール２３０を通じてコンピュータ装置２００に受信されてよい。通信インタフェース２３０を通じて受信された信号や命令、データなどは、プロセッサ２２０やメモリ２１０に伝達されてよく、ファイルなどは、コンピュータ装置２００がさらに含むことのできる記録媒体（上述した永続的記録装置）に記録されてよい。

入力／出力インタフェース２４０は、入力／出力装置２５０とのインタフェースのための手段であってよい。例えば、入力装置は、マイク、キーボード、またはマウスなどの装置を、出力装置は、ディスプレイ、スピーカのような装置を含んでよい。他の例として、入力／出力インタフェース２４０は、タッチスクリーンのように入力と出力のための機能が１つに統合された装置とのインタフェースのための手段であってもよい。入力／出力装置２５０は、コンピュータ装置２００と１つの装置で構成されてもよい。

また、他の実施形態において、コンピュータ装置２００は、図２の構成要素よりも少ないか多くの構成要素を含んでもよい。しかし、大部分の従来技術的構成要素を明確に図に示す必要はない。例えば、コンピュータ装置２００は、上述した入力／出力装置２５０のうちの少なくとも一部を含むように実現されてもよいし、トランシーバやデータベースなどのような他の構成要素をさらに含んでもよい。

図３は、本発明の一実施形態における、データアーカイブシステムを概括的に示した図である。

データアーカイブシステム３１０は、図２で説明したコンピュータ装置２００のような物理的な装置または複数の物理的な装置の結合によって実現されてよく、図３に示すように、データ圧縮モジュール３１１、照会モジュール３１２、ディスプレイおよび制御モジュール３１３、およびニアライン（ｎｅａｒ−ｌｉｎｅ）インタフェースモジュール３１４を含んでよい。ここで、データ圧縮モジュール３１１、照会モジュール３１２、ディスプレイおよび制御モジュール３１３、およびニアラインインタフェースモジュール３１４それぞれは、データアーカイブシステム３１０にインストールされたアーカイブソリューションプログラムのコードにしたがってデータアーカイブシステム３１０を実現するコンピュータ装置２００のプロセッサ２２０が実行する動作に対する機能的表現であってよい。一例として、アーカイブソリューションプログラムは、データ圧縮機能を提供するためのコードを含んでよく、プロセッサ２２０は、このようなコードに基づいてデータ圧縮機能を提供してよい。この場合、プロセッサ２２０のデータ圧縮機能の提供のための動作（ら）に対する機能的表現として「データ圧縮モジュール３１０」使用されてよい。

言い換えれば、データアーカイブシステム３１０は、コンピュータ装置２００においてアーカイブソリューションプログラムをインストールして実行することによって実現されてよい。例えば、アーカイブソリューションプログラムは、クラウドＳａａＳ（ＳｏｆｔｗａｒｅａｓａＳｅｒｖｉｃｅ）型の製品として開発され、多様なクラウドベンダーのクラウドシステムに搭載可能であり、以下で説明される対象システム３２０にアーカイブのための機能を提供してよい。他の例として、データアーカイブシステム３１０は、遠隔ニアラインデータアーカイブ技術（アーカイブソリューションプログラム）とハードウェアとが統合されたアプライアンス（ａｐｐｌｉａｎｃｅ）サーバの形態で実現されてもよい。アプライアンスサーバの場合、製品の形態によって迅速なデリバリ（ｄｅｌｉｖｅｒｙ）と簡単なメンテナンスが可能であり、製品の一貫した品質維持と価格競争力を提供することができる。

対象システム３２０も、図２で説明したコンピュータ装置２００のような物理的な装置または複数の物理的な装置の結合によって実現されてよく、図３に示すように、データベース３２１、制御モジュール３２２、およびニアラインインタフェースモジュール３２３を含んでよい。このとき、制御モジュール３２２およびニアラインインタフェースモジュール３２３も、対象システム３２０を実現するコンピュータ装置２００のプロセッサ２２０が実行する動作に対する機能的表現であってよい。

データアーカイブシステム３１０と対象システム３２０は、ネットワーク（一例として、図１および図２で説明したネットワーク１７０）を介して互いに通信してよく、対象システム３２０は、制御モジュール３２２の制御にしたがってニアラインインタフェースモジュール３２３を通じてデータアーカイブシステム３１０が提供する機能を呼び出してよい。この場合、データアーカイブシステム３１０は、対象システム３２０に対象システム３２０が呼び出す機能を提供してよい。例えば、対象システム３２０は、企業資源計画（ＥｎｔｅｒｐｒｉｓｅＲｅｓｏｕｒｃｅＰｌａｎｎｉｎｇ：ＥＲＰ）のための統合情報システムであってよく、ニアラインインタフェースモジュール３２３は、一例として、ＳＡＰＥＲＰのためのＲＦＣ（ＲｅｍｏｔｅＦｕｎｃｔｉｏｎＣａｌｌ）を基盤としてよい。

図４は、本発明の一実施形態における、データアーカイブ方法の例を示したフローチャートである。本実施形態に係るデータアーカイブ方法は、上述したデータアーカイブシステム３１０を実現するコンピュータ装置２００によって実行されてよい。このとき、コンピュータ装置２００のプロセッサ２２０は、メモリ２１０が含むオペレーティングシステムのコードと、少なくとも１つのコンピュータプログラムのコードとによる制御命令（ｉｎｓｔｒｕｃｔｉｏｎ）を実行するように実現されてよい。ここで、プロセッサ２２０は、コンピュータ装置２００に記録されたコードが提供する制御命令にしたがってコンピュータ装置２００が図４の方法に含まれる段階４１０〜４４０を実行するようにコンピュータ装置２００を制御してよい。また、コンピュータプログラムは、上述したアーカイブソリューションプログラムに対応してよい。

段階４１０で、コンピュータ装置２００は、データを格納する対象システムから遠隔機能の呼び出しを受信してよい。ここで、対象システムは、図３で説明した対象システム３２０に対応してよく、遠隔機能の呼び出しは、対象システム３２０のニアラインインタフェースモジュール３２３で発生してよい。

段階４２０で、コンピュータ装置２００は、遠隔機能の呼び出しに応答し、対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第１機能を、ネットワークを介して対象システムに提供してよい。

例えば、図３を参照すれば、データアーカイブシステム３１０は、対象システム３２０の呼び出しにしたがい、対象システム３２０のデータベース３２１に格納されたデータの少なくとも一部を格納システム３３０にアーカイブするための第１機能を、ネットワークを介して対象システム３２０に提供してよい。

ここで、格納システム３３０は、実施形態によっては、対象システム３２０に含まれるローカルデータベース（一例として、データベース３２１）や対象システム３２０の外部データベースであってもよいし、および／または対象システム３２０の外部システム（一例として、ファイルサーバまたはクラウドサーバ）が含む格納場所であってもよい。

例えば、データアーカイブシステム３１０は、第１機能として、対象システム３２０のデータベース３２１に格納されたデータのうちの少なくとも一部を圧縮してデータベース３２１のテーブルにアーカイブするための機能を提供してよい。この場合、圧縮されたデータは、ファイル形態で格納されるのではなく、対象システム３２０のデータベース３２１のテーブルに格納されるため、アーカイブの速度が高まり、データ照会の速度も向上させることができる。

他の例として、データアーカイブシステム３１０は、第１機能として、対象システム３２０のデータベース３２１に格納されたデータのうちの少なくとも一部を圧縮して対象システム３２０の外部データベースのテーブルにアーカイブするための機能を提供してよい。例えば、データアーカイブシステム３１０の観点において対象システム３２０をクライアントと仮定するとき、データアーカイブシステム３１０は、圧縮されたデータを他のクライアントが含むデータベースのテーブルに格納してよい。

また他の例として、データアーカイブシステム３１０は、第１機能として、対象システム３２０のデータベース３２１に格納されたデータのうちの少なくとも一部をファイルとして圧縮して対象システム３２０の外部システムが含む格納場所にアーカイブするための機能を提供してよい。例えば、データアーカイブシステム３１０がクラウドシステム内に実現された場合、データアーカイブシステム３１０は、圧縮されたデータを含むファイルをクラウドシステムの格納場所に格納してよい。

より具体的な例として、データアーカイブシステム３１０は、ディスプレイおよび制御モジュール３１３により、対象システム３２０にアーカイブサービスのための格納周期の管理、アーカイブ構成、アーカイブ実行、モニタリング、データ照会、およびデータ管理機能などを提供するためのユーザインタフェースを提供することができる。

このとき、ディスプレイおよび制御モジュール３１３で提供されたユーザインタフェースによってアーカイブの実行が要求されれば、データアーカイブシステム３１０は、データ圧縮モジュール３１１によって設定されたアーカイブ構成にしたがい、対象システム３２０のデータベース３２１に格納されたデータの少なくとも一部を格納システム３３０にアーカイブするための第１機能を対象システム３２０に提供してよい。言い換えれば、対象システム３２０は、データアーカイブシステム３１０から提供される第１機能により、自身のデータベース３２１に格納されたデータのうちの少なくとも一部を格納システム３３０にアーカイブしてよい。

段階４３０で、コンピュータ装置２００は、格納システムにアーカイブされたデータを照会するための第２機能を、ネットワークを介して対象システムに提供してよい。このような第２機能も、対象システムからの遠隔機能の呼び出しによって提供されてよい。

例えば、図３を参照すると、データアーカイブシステム３１０は、対象システム３２０の呼び出しにしたがって格納システム３３０にアーカイブされたデータを照会するための第２機能を、ネットワークを介して対象システム３２０に提供してよい。

ディスプレイおよび制御モジュール３１３で提供されたユーザインタフェースによってデータ照会が要求されれば、データアーカイブシステム３１０は、照会モジュール３１２により、格納システム３３０にアーカイブされたデータの照会のための第２機能を対象システム３２０に提供してよい。言い換えれば、対象システム３２０は、データアーカイブシステム３１０から提供される第２機能により、格納システム３３０にアーカイブされたデータを照会してよい。

このように、対象システム３２０は、ハードウェアを別途で追加しなくても、データアーカイブシステム３１０が提供する機能を利用してデータベース３２１に格納されたデータをアーカイブすることができる。

上述したように、データアーカイブシステム３１０が提供する第１機能は、圧縮されたデータをデータベース（対象システム３２０のデータベース３２１または外部データベース）のテーブルに格納して保管するか、またはファイル形態で保管するための機能を含んでよい。このとき、データベースのテーブルに圧縮されて保管されたアーカイブデータも、データとしてデータベースのボリューム増加を引き起こす恐れがあるため、データアーカイブシステム３１０は、データ寿命周期を管理してよい。例えば、データアーカイブシステム３１０は、「データベース−＞データ圧縮アーカイブ−＞ファイルアーカイブ−＞アーカイブ消散」の手順でデータ寿命周期を管理してよい。ここで、「データベース」とは、データが対象システム３２０のデータベース３２１に格納された状態で管理されるものを意味してよい。また、「データ圧縮アーカイブ」とは、データが圧縮され、データベース（対象システム３２０のデータベース３２１または外部データベース）のテーブルに圧縮された状態で管理されることを意味してよい。また、「ファイルアーカイブ」は、圧縮データの保管期間が経過すれば、データベースのテーブルに圧縮された状態で管理されるデータをファイルとしてアーカイブして保管することを意味してよく、「アーカイブ消散」は、ファイルとしてアーカイブされたデータのうちで保管の意味をこれ以上もたないデータを削除することを意味してよい。

「ファイルアーカイブ」は、対象システム３２０の格納場所で行われてもよいが、対象システム３２０の外部システムの格納場所で行われてもよい。より具体的な例として、データアーカイブシステム３１０は、アーカイブデータを対象システム３２０の外部に存在するクラウドシステムに送信するために、圧縮対象の抽出が完了した対象システム３２０に接続してよい。このとき、データアーカイブシステム３１０は、ニアラインインタフェースモジュール３１４によって対象システムを呼び出してよい。このような呼び出しはＡＰＩコールに基づいてよく、圧縮されたデータは多様な種類のストレージに格納されているため、データベース、ディスク、ファイル、インメモリ（ｉｎ−ｍｅｍｏｒｙ）、量子メモリ（ｑｕａｎｔｕｍｍｅｍｏｒｙ）、ＮｏＳＱＬ、グラフデータベース（ｇｒａｐｈ−ＤＢ）、ブロックチェーンデータベースなどのような多様な種類のストレージに接続可能なように実現されてよい。一方、データアーカイブシステム３１０は、財務、原価、生産、販売、資材、品質、システムなどのようなビジネスタイプによって送信シナリオを定義してよい。実施形態によっては、データアーカイブシステム３１０は、ネットワーク帯域幅を考慮した上で、送信シナリオの小グループを生成してもよい。また、データアーカイブシステム３１０は、送信シナリオにオブジェクトを割り当ててよい。送信シナリオの小グループが存在する場合、データアーカイブシステム３１０は、送信シナリオの小グループに抽出が完了したオブジェクトを割り当ててよい。また、データアーカイブシステム３１０は、抽出オブジェクトをバイナリオブジェクトに変換してよく、送信シナリオごとにおよび／または小グループごとに、オブジェクトの容量および数量に対する送信内訳現況表を構成してよい。また、データアーカイブシステム３１０は、送信シミュレーションを行ってもよい。このとき、データアーカイブシステム３１０は、送信シナリオごとにおよび／または小グループごとに、シミュレーション対象を選定し、送信シミュレーションを行い、オブジェクトごとに送信時間を確認することにより、のちの送信において最適な時間をオブジェクトデータ割合ごとに予測してよい。送信シミュレーションの後、データアーカイブシステム３１０は、シナリオ情報、小グループ情報、および／またはオブジェクト情報を利用して実際のデータ送信を行ってよい。このとき、データアーカイブシステム３１０は、送信シミュレーション情報を基づき、最も長い送信時間がかかる小グループおよび／またはオブジェクトを基準として送信時間が短い小グループおよび／またはオブジェクトを配列することで、全体の終了時間を最適化してよい。この場合、データアーカイブシステム３１０は、データの性格ごとにデータ格納位置を区分して格納してよく、送信状況モニタリングツールを利用してリアルタイムで送信件数および実行時間を確認してよい。また、データアーカイブシステム３１０は、送信実行マップに抽出進行状況をアップデートし、エラー発生時には、完了後の順序から行って速度および完全性を維持してよい。データの送信は、ストリーミング方式またはオブジェクト単位送信を選択して行われてよい。また、データアーカイブシステム３１０は、対象システム３２０で送信したシナリオごとにおよび／または小グループごとにデータに対する格納システム３３０への送信が完了したかを確認した後、送信シナリオごとにおよび／または小グループごとにオブジェクト容量および数量現況表と送信されたデータとを比較してアーカイブデータの送信過程を検証してよい。このとき、データの送信は、１：１の関係で送信されてもよいし、１：Ｎの関係として互いに異なるサーバに同時に送信されてもよい。この場合には、サーバごとに送信内訳現況表が構成されてよい。

図５は、本発明の一実施形態における、第１機能によってデータをアーカイブする過程の例を示したフローチャートである。本実施形態に係る過程は、データアーカイブシステム３１０が提供する第１機能を利用して対象システム３２０を実現するコンピュータ装置２００によって実行されてよい。このとき、コンピュータ装置２００のプロセッサ２２０は、メモリ２１０が含むオペレーティングシステムのコードと、少なくとも１つのコンピュータプログラムのコードとによる制御命令（ｉｎｓｔｒｕｃｔｉｏｎ）を実行するように実現されてよい。ここで、プロセッサ２２０は、コンピュータ装置２００に記録されたコードが提供する制御命令にしたがってコンピュータ装置２００が図５の方法に含まれる段階５１０〜５５０を実行するようにコンピュータ装置２００を制御してよい。ここで、コードは、データアーカイブシステム３１０が提供する第１機能のためのコードを含んでよい。

段階５１０で、コンピュータ装置２００は、データベースのテーブルに含まれたデータレコードに対するパーティションをデータレコードの選別情報に基づいて決定してよい。ここで、データベースは、図３で説明した対象システム３２０のデータベース３２１に対応してよい。選別情報は、データレコードに対する時間に関する情報および／またはデータレコードの任意のフィールド値を含んでよい。コンピュータ装置２００は、このような時間に関する情報および／またはフィールド値に基づいてデータレコードに対するパーティションを決定してよい。テーブルは、データベースでデータを格納する基本構造をなす単位であって、段階５１０では、データベースに含まれた複数のテーブルのうちで容量を節約するためにアーカイブしようとするテーブルを意味してよい。

例えば、コンピュータ装置２００は、フィールド値が所定の範囲以内であるデータレコードを１つのパーティションとして選別してよい。このとき、フィールド値は、テーブルで検索が最も頻繁に発生するフィールドのフィールド値によって決定されてよい。これは、アーカイブされたデータをのちに検索するときに、該当のフィールド値に基づいて生成されたインデックス情報を利用することで検索の効率性を極大化することができるためである。他の例として、コンピュータ装置は、時間に関する情報が所定の範囲以内であるデータレコードを１つのパーティションとして選別してよい。

また、パーティションは、テーブルに含まれた全体のデータレコードのうちから選別されたデータレコードの集合で構成されてよい。パーティションは、少なくとも１つ以上が生成されてよく、必要によっては、テーブルの全体ではなく、一部のデータレコードだけを対象として限定してパーティションを生成してよい。例えば、テーブルから２０１５年以降のデータレコードは除外し、２０１５年以前のデータレコードだけを対象としてアーカイブのためのパーティションを生成してよい。

一方、１つのパーティションに含まれるデータレコードの個数は、テーブルに含まれた全体のレコードの個数、インメモリデータベースを検索するコンピュータの性能、およびデータベースで頻度が高い検索条件などを総合的に分析および検討して決定されてよい。

他の実施形態では、選別されたパーティションのうちでデータレコードの個数が閾値を超える超過パーティションが存在すれば、この超過パーティションをレコードの個数が閾値以下である複数のパーティションに分離してよい。例えば、１つのパーティションに含まれるデータレコードの個数である閾値が１０万個に設定されたとする。しかし、選別されたパーティションが閾値を超える個数のデータレコードを含んでいれば、これはコンピュータの過負荷および非効率を招くようになり、問題発生の原因となり得る。したがって、１つのパーティションが１０万個を超えるデータレコードを有する場合、これを１０万個単位の複数のパーティションに分離して複数のパーティションを生成してよい。例えば、１つのパーティションが２５万個のデータレコードを有する場合、コンピュータ装置２００は、この超過パーティションを１０万個ずつのデータレコードを有する２つのパーティションと５万個のデータレコードを有する１つのパーティションとして、合計３つのパーティションに分離してよい。

一方、上述したように分離された複数のパーティションは、互いに同じフィールド値による分類基準によって分類されるため、このような複数のパーティションを区別する方法はない。したがって、分離された複数のレコードグループそれぞれに一連番号（例えば、１、２、３、４、・・・）を付与してインデックステーブルの一連番号フィールドにさらに格納してよい。この場合、アーカイブされたデータを検索するときにも、分離された複数のパーティションそれぞれを区別して検索することができるようになる。このような一連番号は、以下で説明するシーケンスに対応してよい。

段階５２０で、コンピュータ装置２００は、パーティションごとにデータレコードを圧縮して圧縮パーティションを生成してよい。一例として、コンピュータ装置２００は、決定されたパーティションに含まれたデータレコードをバイナリオブジェクトとして圧縮して圧縮パーティションを生成してよい。

一例として、コンピュータ装置２００は、圧縮パーティションを生成するために、先ず、圧縮パーティションに含まれるデータレコードをバッファに格納してよい。データレコードが格納されるバッファのサイズは、テーブルの構造（フィールドの個数、種類、およびサイズ）、および圧縮パーティションに含まれるデータレコードの閾値に基づいて決定されてよい。例えば、テーブルがＤＡＴＥ（文字８字）、ＮＡＭＥ（文字３０字）、およびＡＧＥ（整数４バイト）の合計３つのフィールドを含んでおり、圧縮パーティションに含まれたデータレコードの個数に対する閾値が１０万個であるとすると、文字１字を２バイトとして計算するとき、バッファのサイズは、最小１０万×（８×２＋３０×２＋４）＝８００万バイト（約８メガバイト）となってよい。このとき、コンピュータ装置２００は、圧縮パーティションに含まれたデータレコードおよびそのデータレコードのフィールド値を順にすべて読み取り、順にバッファに格納してよい。

この後、コンピュータ装置２００は、バッファに格納されたデータを圧縮して圧縮パーティションを生成してよい。圧縮パーティションは、バッファに格納されたデータを圧縮して生成されたバイナリオブジェクト形態の結果物であってよい。このとき、圧縮による損失が発生しないようにするために、無損失の圧縮アルゴリズムであるＺＩＰ、ＣＴＷ、ＬＺ７７、ＬＺＷ、ｇｚｉｐ、ｂｚｉｐ２、ＤＥＦＬＡＴＥなどが使用されてよい。

このとき、コンピュータ装置２００は、生成された圧縮パーティションごとに固有に付与された格納キーを生成してよい。

段階５３０で、コンピュータ装置２００は、圧縮パーティションと圧縮パーティションを固有に識別する格納キーとを連係させて圧縮テーブルに格納してよい。上述では、圧縮されたデータが対象システム３２０のデータベース３２１のテーブルや外部データベースのテーブルに格納されることをについて説明した。圧縮テーブルは、パーティションごとに圧縮して生成された圧縮パーティションを格納するためのフィールドと、該当の圧縮パーティションに対応するように固有に付与された格納キーを格納するためのフィールドを含んでよい。格納キーは、圧縮パーティションごとに固有に付与された値を含むキーであって、格納キーに該当する圧縮テーブルのフィールドに圧縮パーティションごとに共有する格納キーの値が格納されてよい。また、格納キーに該当するフィールドは１つ以上であってもよく、この１つ以上のフィールドに分散して格納された格納キーの値が結合されたときに、圧縮パーティションごとに固有の格納キーが形成されるように実現されてもよい。

段階５４０で、コンピュータ装置２００は、格納キーと選別情報とを連係させてデータベースのインデックステーブルに格納してよい。一例として、選別情報が該当のデータレコードの任意のフィールド値を含む場合、コンピュータ装置２００は、段階４４０で、格納キーと任意のフィールド値とを連係させてグループインデックステーブルに格納してよい。グループインデックステーブルに格納された格納キーとフィールド値は、任意のフィールド値を含む検索条件によって圧縮格納されたデータレコードを検索するためのインデックスとして活用されてよい。他の例として、選別情報がデータレコードの時間に関する情報を含む場合、コンピュータ装置２００は、格納キーと時間に関する情報とを連係させて期間インデックステーブルに格納してよい。期間インデックステーブルに格納された格納キーと時間に関する情報は、任意の時間に関する情報を含む検索条件によって圧縮格納されたデータレコードを検索するためのインデックスとして活用されてよい。言い換えれば、グループインデックステーブルおよび／または期間インデックステーブルを含むインデックステーブルは、検索条件が含むフィールド値および／または時間に関する情報に対応する格納キーを取得するのに利用されてよく、格納キーは、圧縮テーブルで格納キーに対応する圧縮パーティションを取得するのに利用されてよい。

段階５５０で、コンピュータ装置２００は、圧縮されたデータレコードをテーブルから削除してよい。データベースを圧縮してアーカイブする目的は、データベースの格納空間を節約することにあるため、コンピュータ装置２００は、アーカイブされたデータレコードをテーブルから削除することによってデータベースの格納空間を節約してよい。ただし、実施形態によっては、圧縮されたデータレコードをテーブルからすぐに削除するのではなく、一定期間が経過した後にテーブルから削除してもよい。

一方、削除されたデータレコードは、のちに該当のテーブルに復旧されてもよい。例えば、コンピュータ装置２００は、削除されたデータレコードの復元要求に応答し、インデックステーブルで復元要求が含む識別情報と連係する格納キーを検索し、圧縮テーブルで検索された格納キーと連係する圧縮パーティションを検索してよい。この後、コンピュータ装置２００は、検索された圧縮パーティションの圧縮を解除して削除されたデータレコードを復元し、復元されたデータレコードを識別情報に基づいてテーブルに記録してよい。このとき、圧縮パーティションが含むデータレコードのうちで復元が要求された特定のデータレコードを識別するために、以下で説明するキーインデックステーブルの情報が活用されてもよい。

このような段階５１０〜５５０は、データアーカイブシステム３１０が提供する第１機能を利用してなされてよい。言い換えれば、データアーカイブシステム３１０は、対象システム３２０が段階５１０〜５５０を実行するように制御するための機能を含む第１機能を提供してよい。

図６は、本発明の一実施形態における、圧縮テーブルの構造の第１例を示した図である。図６のテーブル６１０は、Ｄｏｃ．Ｎｏ．フィールド６１１、時間に対するＤａｔｅフィールド６１２、および特定の属性に対するＣｏｌ１フィールド６１３を含んでいる。このとき、コンピュータ装置２００は、選別情報として、時間に関する情報であるテーブル６１０のＤａｔｅフィールド６１２のフィールド値またはＣｏｌ１フィールド６１３のフィールド値に基づいてテーブル６１０のデータレコードを分類および圧縮することによって圧縮パーティションを生成してよい。このとき、コンピュータ装置２００は、圧縮パーティションを固有に識別するための格納キーと該当の圧縮パーティションとを互いに連係させて格納することによって圧縮テーブル６２０を生成してよい。例えば、図６の実施形態に係る圧縮テーブル６２０は、格納キーをフィールド値として有するＯＢＪＥＣＴＩＤフィールド６２１と、圧縮パーティションをフィールド値として有するＣＯＭＰＲＥＳＳＥＤＤＡＴＡフィールド６２２とを含んでよい。

図７は、本発明の一実施形態における、圧縮テーブルの構造の第２例を示した図であり、図８は、本発明の一実施形態における、期間インデックステーブルの構造の例を示した図であり、図９は、本発明の一実施形態における、グループインデックステーブルの構造の例を示した図である。

図７は、図６で説明したテーブル６１０に基づいて圧縮テーブル７００を生成する他の実施形態を説明している。例えば、コンピュータ装置２００は、選別情報として、時間に関する情報であるテーブル６１０のＤａｔｅフィールド６１２のフィールド値に基づいてテーブル６１０のデータレコードを分類および圧縮することによって圧縮パーティションを生成してよい。また、コンピュータ装置２００は、選別情報と該当する圧縮パーティションとを互いに連係させて格納することによって圧縮テーブル７００を生成してよい。例えば、図７の実施形態に係る圧縮テーブル７００は、時間に関する情報をフィールド値として有するＰＥＲＩＯＤフィールド７１０と、圧縮パーティションをフィールド値として有するＣＯＭＰＲＥＳＳＥＤＤＡＴＡフィールド７２０とを含んでよい。

図８は、圧縮テーブル６２０がＤａｔｅフィールド６１２のフィールド値（時間に関する情報）に基づいてデータレコードを分類および圧縮することによって生成された圧縮パーティションを含む場合に生成および活用されることのできる期間インデックステーブル８００の例を示している。このとき、期間インデックステーブル８００は、時間に関する情報をフィールド値として有するＰＥＲＩＯＤフィールド８１０と、格納キーをフィールド値として有するＯＢＪＥＣＴＩＤフィールド８２０とを含んでよい。例えば、コンピュータ装置２００は、時間に関する情報（一例として、「２０２０．０１」）を選別情報として含む検索条件を受信する場合、期間インデックステーブル８００で検索条件に含まれた時間に関する情報を利用して対応する格納キー（一例として、期間インデックステーブル８００で時間に関する情報「２０２０．０１」に対応する格納キー「Ｏ０００１」）を検索してよく、検索された格納キーを利用して、圧縮テーブル６２０で格納キーに対応する圧縮パーティション（一例として、圧縮テーブル６２で格納キー「Ｏ０００１」に対応する「５０，０００Ｒｏｗｓ」の圧縮パーティション）を検索することができるようになる。

また、図９は、圧縮テーブル６２がＣｏｌ１フィールド６１３のフィールド値に基づいてデータレコードを分類および圧縮することによって生成された圧縮パーティションを含む場合に生成および活用されることのできるグループインデックステーブル９００の例を示している。このとき、グループインデックステーブル９００は、Ｃｏｌ１フィールド６１３のフィールド値を自身のフィールド値として有するＰＥＲＩＯＤフィールド９１０、および格納キーをフィールド値として有するＯＢＪＥＣＴＩＤフィールド９２０を含んでよい。例えば、コンピュータ装置２００は、Ｃｏｌ１フィールド６１３のフィールド値（一例として、「１０００」）を選別情報として含む検索条件を受信する場合、グループインデックステーブル９００で検索条件に含まれたフィールド値を利用して、対応する格納キー（一例として、グループインデックステーブル９００でフィールド値「１０００」に対応する格納キー「Ｏ０００１」）を検索してよく、検索された格納キーを利用して、圧縮テーブル６２０で格納キーに対応する圧縮パーティション（一例として、圧縮テーブル６２０で格納キー「Ｏ０００１」に対応する「５０，０００Ｒｏｗｓ」の圧縮パーティション）を検索することができるようになる。

図１０は、本発明の一実施形態における、圧縮テーブルの構造の第２例を示した図であり、図１１は、本発明の一実施形態における、期間インデックステーブルとグループインデックステーブルが結合された形態のインデックステーブルの構造の例を示した図である。

図１０は、図６で説明したテーブル６１０に基づいて圧縮テーブル１０００を生成するまた他の実施形態を説明している。例えば、コンピュータ装置２００は、時間に関する情報であるテーブル６１０のＤａｔｅフィールド６１２のフィールド値およびＣｏｌ１フィールド６１３のフィールド値の２つのフィールド値に基づいてテーブル６１０のデータレコードを分類および圧縮することによって圧縮パーティションを生成してよい。

より具体的な例として、コンピュータ装置２００は、Ｄａｔａフィールド６１２のフィールド値が「２００２．０１」でありながらＣｏｌ１フィールド６１３のフィールド値が「１０００」であるデータレコードを圧縮して第１圧縮パーティションを、Ｄａｔａフィールド６１２のフィールド値が「２００２．０１」でありながらＣｏｌ１フィールド６１３のフィールド値が「２０００」であるデータレコードを圧縮して第２圧縮パーティションを、Ｄａｔａフィールド６１２のフィールド値が「２００２．０２」でありながらＣｏｌ１フィールド６１３のフィールド値が「１０００」であるデータレコードを圧縮して第３圧縮パーティションを、Ｄａｔａフィールド６１２のフィールド値が「２００２．０２」でありながらＣｏｌ１フィールド６１３のフィールド値が「２０００」であるデータレコードを圧縮して第４圧縮パーティションを、Ｄａｔａフィールド６１２のフィールド値が「２００２．０３」でありながらＣｏｌ１フィールド６１３のフィールド値が「１０００」であるデータレコードを圧縮して第５圧縮パーティションを、Ｄａｔａフィールド６１２のフィールド値が「２００２．０３」でありながらＣｏｌ１フィールド６１３のフィールド値が「２０００」であるデータレコードを圧縮して第６圧縮パーティションを、それぞれ生成してよい。

この場合、コンピュータ装置２００は、圧縮パーティションを固有に識別するための格納キーと該当の圧縮パーティションとを互いに連係させて格納することによって圧縮テーブル１０００を生成してよい。例えば、図１０の実施形態に係る圧縮テーブル１０００は、格納キーをフィールド値として有するＯＢＪＥＣＴＩＤフィールド１０１０と、圧縮パーティションをフィールド値として有するＣＯＭＰＲＥＳＳＥＤＤＡＴＡフィールド１０２０とを含んでよい。

図１１は、期間インデックステーブルとグループインデックステーブルが結合された形態のインデックステーブル１１００の例を示している。このとき、インデックステーブル１１００は、時間に関する情報をフィールド値として有するＰＥＲＩＯＤフィールド１１１０、Ｃｏｌ１フィールド６１３のフィールド値を自身のフィールド値として有するＣｏｌ１フィールド１１２０、および格納キーをフィールド値として有するＯＢＪＥＣＴＩＤフィールド１１３０を含んでよい。例えば、コンピュータ装置２００は、時間に関する情報（一例として、「２０２０．０２」）およびＣｏｌ１フィールド６１３のフィールド値（一例として、「１０００」）を選別情報として含む検索条件を受信する場合、インデックステーブル１１００で検索条件が含む時間に関する情報とフィールド値の両方を満たす格納キー（一例として、インデックステーブル１１００の格納キー「Ｏ０００３」）を検索してよく、検索された格納キーを利用して、圧縮テーブル１０００で格納キーに対応する圧縮パーティション（一例として、圧縮テーブル１０００で格納キー「Ｏ０００３」に対応する「３０，０００Ｒｏｗｓ」の圧縮パーティション）を検索することができるようになる。

図１２は、本発明の一実施形態における、第１機能によってデータをアーカイブする過程のまた他の例を示したフローチャートである。本実施形態に係る過程は、図５で説明した段階５４０の後に段階１２１０をさらに含んでよい。

段階１２１０で、コンピュータ装置２００は、テーブルに含まれたデータレコードそれぞれに対し、プライマリキー（ｐｒｉｍａｒｙｋｅｙ）と、該当のデータレコードを含んで圧縮された圧縮パーティション内での該当のデータレコードの位置であるキーインデックス情報と、該当のデータレコードを含んで圧縮された圧縮パーティションに対応する格納キーとを連係させてキーインデックステーブルに格納してよい。このような段階１２１０は、データアーカイブシステム３１０が提供する第１機能を利用してなされてよい。言い換えれば、データアーカイブシステム３１０は、対象システム３２０が段階１２１０を実行するように制御するための機能を含む第１機能を提供してよい。

プライマリキーとは、インメモリデータベースでレコードごとに固有に識別される値を有するフィールドでの当の値を意味してよく、基本キー、主キー、またはユニークキーとも呼ばれる。また、１つのテーブルには１つ以上のプライマリキーが存在してよい。また、キーインデックス情報は、特定のプライマリキーの値を有するデータレコードが圧縮パーティション内でどの位置に格納されているかに関する情報である。例えば、圧縮パーティションが含む１０万個のデータレコードに関する情報のうちで１０００番目に格納されたデータレコードであるという格納順に関する情報がキーインデックス情報に格納されてよい。

一方、キーインデックステーブルにプライマリキーを格納する理由は、検索対象となるテーブルを他のフィールド値および時間に関する情報だけでなく、このプライマリキーによって直接に検索できるようにするためである。すなわち、ユーザが特定のプライマリキーを入力しながら、このプライマリキーを有するデータレコードをテーブルから検索しようとするときに、キーインデックステーブルが使用されてよい。より具体的に説明すると、コンピュータ装置２００は、特定のプライマリキーを有するデータレコードのキーインデックス情報と格納キーをキーインデックステーブルで検索してよい。この場合、コンピュータ装置２００は、取得した格納キーを利用して、圧縮テーブルで格納キーに対応する圧縮パーティションを取得してよく、キーインデックス情報を利用して、圧縮パーティションでユーザが所望する特定のデータレコードを検索することができるようになる。上述したように、このようなキーインデックステーブルのキーインデックス情報は、特定の条件のデータレコードをテーブルに復元するにあたり、圧縮パーティションが含むデータレコードのうちから特定の条件のデータレコードを識別するために活用されてもよい。

図１３は、本発明の一実施形態における、圧縮テーブルおよびキーインデックステーブルの構造の例を示した図である。

圧縮テーブル１３１０は、格納キーをフィールド値として有するＯＢＪＥＣＴＩＤフィールド１３１１、対象テーブルの処理順（シーケンス）をフィールド値として有するＳＥＱフィールド１３１２、および圧縮パーティションをフィールド値として有するＣＯＭＰＲＥＳＳＥＤＤＡＴＡフィールド１３１３を含んでよい。シーケンスは、親テーブルと子テーブルが存在するとき、親テーブルを先に抽出し、抽出された親テーブルのデータを利用して子テーブルを処理する処理順を定義してよい。

キーインデックステーブル１３２０は、上述したように、プライマリキーをフィールド値として有するＤｏｃ．Ｎｏ．フィールド１３２１、格納キーをフィールド値として有するＯＢＪＥＣＴＩＤフィールド１３２２、およびキーインデックス情報をフィールド値として有するＫｅｙＬｏｃａｔｉｏｎｉｎｆｏ．フィールド１３２３を含んでよい。例えば、キーインデックス情報１＠１００１において、「＠」の前の「１」は、ＳＥＱフィールド１３１２のフィールド値に対応するシーケンスを、「＠」の後の「１００１」は、該当の圧縮パーティションが含むデータレコードのうちの１００１番目のデータレコードを指示してよい。より具体的な例として、キーインデックステーブル１３２０の１番目のレコードは、プライマリキーが「１」であるデータレコードが、格納キーが「Ｏ０００１」であり、シーケンスが「１」である圧縮パーティションのデータレコードのうちの１００１番目のデータレコードとして含まれていることを指示してよい。これと同じように、キーインデックステーブル１３２０の２番目のレコードは、プライマリキーが「２」であるデータレコードが、格納キーが「Ｏ０００１」であり、シーケンスが「２」である圧縮パーティションのデータレコードのうちの２００１番目のデータレコードとして含まれていることを指示してよい。

このように、キーインデックス情報は、圧縮パーティション内での特定のデータレコードの位置に関する情報を含んでよく、このようなキーインデックス情報とプライマリキー、および格納キーを含むキーインデックステーブル（一例として、図１３のキーインデックステーブル１３２０）を活用することにより、ユーザの検索条件によって照会するようになるデータレコードの数を減らすことができる。

他の実施形態において、コンピュータ装置２００は、プライマリキーによって第１テーブル（一例として、段階４１０で説明したテーブル）と連結する連結テーブルでデータレコードを圧縮して生成された第２圧縮パーティションに対し、第２圧縮パーティションに含まれたデータレコードのうちで第１テーブルに含まれたデータレコードとプライマリキーが等しいデータレコードを検索してよく、検索されたデータレコードに対し、第２圧縮パーティション内での位置であるサブインデックス情報をキーインデックステーブル上のプライマリキーが等しいデータレコードに対してさらに格納してよい。連結テーブルは、プライマリキーによって第１テーブルと連結するテーブルである。すなわち、プライマリキーは、第１テーブルと連結テーブルの両方に存在するようになる。第２圧縮パーティションは、プライマリキーによって第１テーブルと連結する連結テーブルが存在するとき、該当の連結テーブルでデータレコードを圧縮して生成されたデータであってよい。このとき、第２圧縮パーティションは、図４で説明した圧縮パーティションと同じ方式で生成されてよく、圧縮パーティションと同じように、固有の格納キーとともに圧縮テーブルに格納されてよい。サブインデックス情報は、特定のプライマリキーを有するデータレコードがどのような第２圧縮パーティション内でどの位置に格納されているかに関する情報である。例えば、第２圧縮パーティションに含まれた１０万個のデータレコードに関する情報のうちの１０００番目に格納されたデータレコードであるという格納順に関する情報がサブインデックス情報として格納されてよい。例えば、インメモリデータベースに第１テーブルとプライマリキーによって連結する連結テーブルが存在し、第１テーブルには存在しないが連結テーブルには存在するフィールドに対し、ユーザがこのフィールドのフィールド値情報を必要とすることがある。この場合、コンピュータ装置２００は、のちに、この連結テーブルまで検索することができるように、キーインデックステーブル上の等しいプライマリキーを有するデータレコードに対してサブインデックス情報をさらに格納してよい。

また他の実施形態において、コンピュータ装置２００は、第１テーブルに対して多数の連結テーブルが存在する場合、連結テーブルそれぞれに対するサブインデックス情報を集めて圧縮した後、キーインデックステーブルに新たなサブインデックス情報として格納してもよい。例えば、コンピュータ装置２００が連結テーブルで等しいプライマリキーを有するデータレコードに対し、２つ以上の第２圧縮パーティション内での位置に対するサブインデックス情報をすべて集めてよく、集めた値を圧縮し、キーインデックステーブル上の等しいプライマリキーの値を含むデータレコードに新たなサブインデックス情報として格納してよい。

図１４は、本発明の一実施形態における、圧縮テーブルおよびキーインデックステーブルの構造の他の例を示した図である。

圧縮テーブル１４１０は、格納キーをフィールド値として有するＯＢＪＥＣＴＩＤフィールド１４１１、テーブルの識別子をフィールド値として有するＴＡＢＬＥフィールド１４１２、シーケンスをフィールド値として有するＳＥＱフィールド１４１３、および圧縮パーティションをフィールド値として有するＣＯＭＰＲＥＳＳＥＤＤＡＴＡフィールド１４１４を含んでよい。ＴＡＢＬＥフィールド１４１２は、テーブルの識別子をフィールド値として含んでよく、これにより、対応する圧縮パーティションがどのテーブルから抽出されたデータレコードを含んでいるかを識別してよい。

本実施形態に係るキーインデックステーブル１４２０は、プライマリキーをフィールド値として有するＤｏｃ．Ｎｏ．フィールド１４２１、格納キーをフィールド値として有するＯＢＪＥＣＴＩＤフィールド１４２２、キーインデックス情報をフィールド値として有するＫｅｙＬｏｃａｔｉｏｎｉｎｆｏ．フィールド１４２３、およびサブインデックス情報をフィールド値として有するＳｕｂＬｏｃａｔｉｏｎｉｎｆｏ．フィールド１４２４を含んでよい。

例えば、キーインデックステーブル１４２０の１番目のレコードは、プライマリキーが「１」であるデータレコードが、格納キーが「Ｏ０００１」であり、シーケンスが「１」である圧縮パーティションのデータレコードのうちの１０００１番目のデータレコードとして含まれていることを指示してよい。このとき、ＳｕｂＬｏｃａｔｉｏｎｉｎｆｏ．フィールド１４２４のフィールド値「ＴＡＢ１＠１００１−２／ＴＡＢ２＠２００１−３」は、プライマリキーが「１」であるデータレコードの連結テーブルに対して生成された第２圧縮パーティション内での位置を示している。例えば、フィールド値「ＴＡＢ１＠１００１−２／ＴＡＢ２＠２００１−３」において、「＠」の前の「ＴＡＢ１」と「ＴＡＢ２」は、等しいプライマリキーによって連結する連結テーブルを意味してよく、「＠」の後の「１００１−２」は、連結テーブル「ＴＡＢ１」に対する第２圧縮パーティションが含むデータレコードのうちの１００１番目のデータレコードから２つのデータレコード（１００１番目のデータレコード（第１データレコード）と１００２番目のデータレコード（第２データレコード））を示している。さらに、「＠」の後の「２００１−３」は、連結テーブル「ＴＡＢ２」に対する第２圧縮パーティションが含むデータレコードのうちの２００１番目のデータレコードから３つのデータレコード（２００１番目のデータレコード（第３データレコード）と、２００２番目のデータレコード（第４データレコード）と、２００３番目のデータレコード（第５データレコード））を示している。このとき、第１データレコードから第５データレコードまでが、すべて等しいプライマリキーによって識別されてよい。

図１５は、本発明の一実施形態における、第２機能によってアーカイブされたデータを検索する過程の例を示した図である。本実施形態に係る過程は、データアーカイブシステム３１０が提供する第２機能を利用して対象システム３２０を実現するコンピュータ装置２００によって実行されてよい。

段階１５１０で、コンピュータ装置２００は、データレコードの選別情報を含む検索条件を受信してよい。このような選別情報は、検索しようとするデータレコードの任意のフィールド値および／または該当のデータレコードの時間に関する情報を含んでよい。選別情報が含むフィールド値および／または時間に関する情報は、範囲の形態で含まれてもよい。

段階１５２０で、コンピュータ装置２００は、データベース上でデータレコードの選別情報と該当のデータレコードが含まれた圧縮パーティションを固有に識別する格納キーとを連係させて格納するインデックステーブルから、検索条件が含む選別情報と連係する格納キーを検索してよい。上述したように、インデックステーブルは、グループインデックステーブルおよび／または期間インデックステーブルを含んでよく、グループインデックステーブルは、特定のフィールド値と格納キーとを連係させて格納してよく、期間インデックステーブルは、時間に関する情報と格納キーとを連係させて格納することについて説明した。したがって、コンピュータ装置２００は、選別情報が含むフィールド値および／または時間に関する情報に対応する格納キーをグループインデックステーブルおよび／または期間インデックステーブルで検索することができるようになる。例えば、コンピュータ装置２００は、選別情報がデータレコードの任意のフィールド値を含む場合、格納キーと任意のフィールド値とを連係させて格納するグループインデックステーブルで検索条件の選別情報として含まれた任意のフィールド値と連係する格納キーを検索してよい。他の例として、コンピュータ装置２００は、選別情報がデータレコードの時間に関する情報を含む場合、格納キーと時間に関する情報とを連係させて格納する期間インデックステーブルで検索条件の選別情報として含まれた時間に関する情報と連係する格納キーを検索してよい。

段階１５３０で、コンピュータ装置２００は、格納キーと圧縮パーティションとを連係させて格納する不揮発性の格納手段で検索された格納キーと連係する圧縮パーティションを検索してよい。上述したように、圧縮テーブルは、圧縮パーティションと圧縮パーティションを固有に識別する格納キーとを連係させて格納しているため、コンピュータ装置２００は、このような圧縮テーブルで格納キーによって該当の圧縮パーティションを検索することができるようになる。

上述したように、キーインデックステーブルがさらに活用される場合、ユーザは、プライマリキーを検索に活用してよい。キーインデックステーブルは、上述したように、データベース上の任意のテーブルが含むデータレコードそれぞれに対し、プライマリキーと、該当のデータレコードを含んで圧縮された圧縮パーティション内での該当のデータレコードの位置であるキーインデックス情報と、該当のデータレコードを含んで圧縮された圧縮パーティションに対応する格納キーとを連係させて格納してよい。このとき、検索条件がデータレコードのプライマリキーをさらに含む場合、コンピュータ装置２００は、キーインデックステーブルで検索条件がさらに含むプライマリキーと連係するキーインデックス情報および格納キーを検索してよい。この後、コンピュータ装置２００は、検索されたキーインデックス情報および格納キーにさらに基づき、段階１５３０で検索された圧縮パーティションから検索条件による特定のデータレコードを検索することができるようになる。

また、キーインデックステーブルは、プライマリキーによって任意のテーブルと連結する連結テーブルが存在する場合、連結テーブルでデータレコードを圧縮して生成された第２圧縮パーティションに対し、データレコードの第２圧縮パーティションでの位置であるサブインデックス情報をさらに含んでよい。したがって、検索条件がプライマリキーをさらに含む場合、コンピュータ装置２００は、キーインデックステーブルで検索条件がさらに含むプライマリキーと連係するサブインデックス情報をさらに検索することができ、第２圧縮パーティションおよびサブインデックス情報に基づいて第２圧縮パーティションで検索条件によるデータレコードをさらに検索することにより、特定のデータレコードに対し、検索しようとする第１テーブルのフィールド値だけではなく、第１テーブルとプライマリキーによって連結する連結テーブルのフィールド値も取得することができるようになる。

一方、上述したように、圧縮テーブルは、コンピュータ装置２００とネットワークを介して接続する他のコンピュータ装置のデータベースの圧縮テーブルを含んでもよい。この場合、コンピュータ装置２００は、段階１５３０で、ネットワークを介して、他のコンピュータ装置のデータベースの圧縮テーブルから、段階１５２０で検索された格納キーと連係する圧縮パーティションを検索してよい。

このような段階１５１０〜１５３０は、データアーカイブシステム３１０が提供する第２機能を利用してなされてよい。言い換えれば、データアーカイブシステム３１０は、対象システム３２０が段階１５１０〜１５３０を実行するように制御するための機能を含む第２機能を提供してよい。

図１６および図１７は、本発明の一実施形態における、アーカイブされたデータを検索する例を示した図である。

図１６は、クエリ１６１０にしたがい、圧縮テーブル１６２０でアーカイブされたデータを検索する例を示している。図１６の実施形態では、圧縮テーブル１６２０がインデックステーブルと結合した形態として、ＰＥＲＩＯＤフィールド１６２１、ＣＯＬ１フィールド１６２２、ＴＡＢＬＥフィールド１６２３、ＯＢＪＥＣＴＩＤフィールド１６２４、ＳＥＱフィールド１６２５、およびＣＯＭＰＲＥＳＳＥＤＤＡＴＡフィールド１６２６を含んでいる。実施形態によっては、ＰＥＲＩＯＤフィールド１６２１とＣＯＬ１フィールド１６２２は、別のインデックステーブルに存在してもよい。この場合、圧縮テーブル１６２０とインデックステーブルとを連結するために、２つのテーブルそれぞれにＯＢＪＥＣＴＩＤフィールド１６２４が存在してよい。実施形態によっては、ＴＡＢＬＥフィールド１６２３とＳＥＱフィールド１６２５も、インデックステーブルに存在してもよい。

このとき、クエリ１６１０は、テーブル「ＴＡＢ１」から、ＰＥＲＩＯＤフィールド１６２１のフィールド値が「２００２．０１」であり、ＣＯＬ１フィールド１６２２のフィールド値が「１０００」であるデータレコードを検索しろという命令を意味してよい。このとき、コンピュータ装置２００は、圧縮テーブル１６２０でクエリ１６１０に該当するデータレコードが、圧縮テーブル１６２０の１番目のレコードのＣＯＭＰＲＥＳＳＥＤＤＡＴＡフィールド１６２６に格納された圧縮パーティションであることを確認することができる。したがって、コンピュータ装置２００は、該当の圧縮パーティションの圧縮を解除し、該当の圧縮パーティションが含むデータレコード（「５０，０００ｒｏｗｓ」のデータレコード）を検索の結果として提供することができる。

図１７は、クエリ１７１０にしたがい、圧縮テーブル１６２０でアーカイブされたデータを検索する例を示している。図１７の実施形態において、クエリ１７１０は、プライマリキーを検索条件として活用しているため、キーインデックステーブル１７２０が活用されてよい。キーインデックステーブル１７２０は、Ｄｏｃ．Ｎｏ．フィールド１７２１、ＯＢＪＥＣＴＩＤフィールド１７２２、ＫｅｙＬｏｃａｔｉｏｎＩｎｆｏ．フィールド１７２３、およびＳｕｂＬｏｃａｔｉｏｎＩｎｆｏ．フィールド１７２４を含んでいる。

このとき、クエリ１７１０は、テーブル「ＴＡＢ１」およびテーブル「ＴＡＢ２」から、プライマリキーとしてのＤｏｃ．Ｎｏ．フィールド１７２１のフィールド値が「１」であるデータレコードを検索しろという命令を意味してよい。このとき、コンピュータ装置２００は、キーインデックステーブル１７２０でＤｏｃ．Ｎｏ．フィールド１７２１のフィールド値が「１」である１番目のレコードを確認することができ、１番目のレコードのＳｕｂＬｏｃａｔｉｏｎＩｎｆｏ．フィールド１７２４のフィールド値により、圧縮テーブル１６２０でプライマリキーが「１」であるデータレコードを検索することができる。例えば、コンピュータ装置２００は、Ｄｏｃ．Ｎｏ．フィールド１７２１のフィールド値が「１」であるキーインデックステーブル１７２０の１番目のレコードのサブインデックス情報「ＴＡＢ１＠１００１−２／ＴＡＢ２＠２００１−３」により、圧縮テーブル１６２０でプライマリキーが「１」であるデータレコードを抽出してよい。このとき、サブインデックス情報が含む位置により、圧縮パーティションの全体のデータレコードをすべて検索する必要がなく、簡単かつ迅速に特定のプライマリキーの値を有するデータレコードを検索することができる。

図３を参照すると、データアーカイブシステム３１０は、データ照会ログを活用し、対象システム３２０の外部の他のシステム（一例として、クラウドストレージシステム）が格納システム３３０を含んでいる実施形態において、対象システム３２０と格納システム３３０のデータを最適化してよい。例えば、データアーカイブシステム３１０は、（１）オンプレミス（ｏｎ−ｐｒｅｍｉｓｅ、企業などがクラウド環境ではなく自社の設備で保有して運営する）のデータベースに対する過去のテーブルアクセスログ、（２）過去のテーブルアクセスログに基づいてマシンラーニングによって予測したアクセス量、および（３）データの格納システム３３０への転換以後のアクセスログのうちの少なくとも１つを分析することで、対象システム３２０と格納システム３３０との間のデータ容量およびユーザアクセス速度を持続的に最適化してよい。

図１８は、本発明の一実施形態における、データを効果的に記録するための過程の例を示した図である。図１８は、対象システム３２０とクラウドシステム１８１０を示している。このような図１８の実施形態では、格納システム３３０とデータアーカイブシステム３１０の両方がクラウドシステム１８１０上に実現されてよい。遠隔格納場所（クラウドシステム１８１０に実現された格納システム３３０）にデータを効率的に格納するために、データアーカイブシステム３１０は、データ使用率に応じてストレージクラスを差別的に管理してよい。例えば、データアーカイブシステム３１０は、対象システム３２０がオンプレミスのデータベースでのデータ使用率に基づいてデータを送信するように制御するための機能を対象システム３２０に提供してよい。このとき、データアーカイブシステム３１０は、このような機能によって対象システム３１０のデータ使用現況を分析して各クラスに分離した後、クラウドシステム１８１０にデータを送信する前にデータを各クラスに分離してよい。このとき、クラウドシステム１８１０もクラスごとにクラスストレージを含んでよく、特定のクラスストレージに該当するクラスのデータが格納されてよい。

また、データアーカイブシステム３１０は、クラウドシステム１８１０に送信されたデータの使用現況をビジネスオブジェクト、期間別にモニタリングして分離および格納してよい。例えば、データアーカイブシステム３１０は、クラウドシステム１８１０の格納場所内でのデータ使用率に基づいてストレージを管理してよい。

一方、データアーカイブシステム３１０は、対象システム３２０のデータ使用現況をクラウドシステム１８１０に送信するように制御し、マシンラーニングを活用してデータの活用度を分析した後、それぞれのクラスストレージに格納してよい。例えば、データアーカイブシステム３１０は、企業内のデータ使用現況を一定の期間にわたってクラウドシステム１８１０に移管するように対象システム３１０を制御してよく、移管されたデータ使用現況をマシンラーニングにかけることよってデータ使用率を予測してよい。また、データアーカイブシステム３１０は、予測されたデータ使用率に基づいてデータが最適化されるように、データを対象システム３２０とクラウドシステム１８１０間の移管を処理してよい。例えば、クラウドシステム１８１０の格納場所（格納システム３２０）に格納されたデータのうちでデータ使用率が第１閾値以上のデータは、対象システム３２０の格納場所（データベース３２１）に移管してよく、対象システム３２０の格納場所に格納されたデータのうちでデータ使用率が第２閾値以下のデータは、クラウドシステム１８１０の格納場所に移管してよい。データの移管には、上述した図３〜１７の実施形態によって説明したデータの圧縮や圧縮解除が要求されてよい。

このように、データアーカイブシステム３１０は、対象システム３２０のデータ使用現況（過去）、クラウドシステムのデータ使用現況（現在）、およびマシンラーニングによって予測されたデータ使用率（未来）に基づき、持続的なストレージ最適化の作業を実行することができる。

また他の実施形態として、データアーカイブシステム３１０は、対象システム３２０の性能を最適化するための機能を提供してよい。一例として、対象システム３２０がクラウド環境にインスタンスの形態で位置する場合が考えられる。この場合、例えば、対象システム３２０のデータ削除後（または、上述した持続的なストレージの最適化作業によって格納空間の使用量が減少した後）、データアーカイブシステム３１０は、対象システム３２０のデータベース容量に基づき、クラウド環境にインスタンスの形態で位置した対象システム３２０の全体的な性能（ＣＰＵ、メモリ使用量、システム応答速度など）をモニタリングしてよく、モニタリングされた性能に基づき、費用節減が可能なサーバタイプに対象システム３２０の仕様を変更することによって対象システム３２０側の費用を減らすことができる。例えば、データアーカイブシステム３１０は、データボリュームの最適化の観点ではなく、ＣＰＵとメモリ効率をともに考慮したインスタンス最適化機能を提供してよい。このために、データアーカイブシステム３１０は、データボリュームの減少による追加資源の最適化の可能性を検討してよい。より具体的な例として、データアーカイブシステム３１０は、ここ最近の一定期間（一例として、１年間）の使用頻度が高いプログラムの技術的（ｔｅｃｈｎｉｃａｌ）ＢＯＭ（Ｂｉｌｌｏｆｍａｔｅｒｉａｌ）とプログラムの内部構造を分析して各フローの時間を測定してよく、データベース関連のロジックのプロセッシングタイムを減らすことにより、ＣＰＵ、メモリなどの仕様を縮小することができるようにする。また、データアーカイブシステム３１０は、対象システム３２０の実現のためのインスタンスを初期設定のインスタンスのクラスに比べて経済的に一段階低いインスタンスに変更してもよい。各フローの時間の測定には、技術的ＢＯＭとプログラムの内部構造の他にも、システム応答率、ＣＰＵ使用率、プロセッシングタイム、データベース応答時間などが活用されてよい。

また他の実施形態として、データアーカイブシステム３１０は、データ非識別化機能を提供してよい。データアーカイブの収集時に、ビジネス的要求事項および／または法的要求事項によって非識別化が要求されることがある。または、格納システム３３０にアーカイブされたデータを、対象システム３２０ではない他のシステムで活用するために非識別化が要求されることもある。図１９は、本発明の一実施形態における、データを非識別化する方法の例を示した図である。

このように、本発明の実施形態によると、データを格納する対象システムから遠隔機能の呼び出しを受信し、このような遠隔機能の呼び出しに応答し、対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第１機能を、前記ネットワークを介して前記対象システムに提供し、前記格納システムにアーカイブされたデータの照会のための第２機能を、前記ネットワークを介して前記対象システムに提供することにより、遠隔ニアライン（ｎｅａｒ−ｌｉｎｅ）データアーカイブ機能を提供することができる。

上述したシステムまたは装置は、ハードウェア構成要素、またはハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば、実施形態で説明された装置および構成要素は、例えば、プロセッサ、コントローラ、ＡＬＵ（ａｒｉｔｈｍｅｔｉｃｌｏｇｉｃｕｎｉｔ）、デジタル信号プロセッサ、マイクロコンピュータ、ＦＰＧＡ（ｆｉｅｌｄｐｒｏｇｒａｍｍａｂｌｅｇａｔｅａｒｒａｙ）、ＰＬＵ（ｐｒｏｇｒａｍｍａｂｌｅｌｏｇｉｃｕｎｉｔ）、マイクロプロセッサ、または命令を実行して応答することができる様々な装置のように、１つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム（ＯＳ）およびＯＳ上で実行される１つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを記録、操作、処理、および生成してもよい。理解の便宜のために、１つの処理装置が使用されるとして説明される場合もあるが、当業者は、処理装置が複数個の処理要素および／または複数種類の処理要素を含んでもよいことが理解できるであろう。例えば、処理装置は、複数個のプロセッサまたは１つのプロセッサおよび１つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。

ソフトウェアは、コンピュータプログラム、コード、命令、またはこれらのうちの１つ以上の組み合わせを含んでもよく、思うままに動作するように処理装置を構成したり、独立的または集合的に処理装置に命令したりしてよい。ソフトウェアおよび／またはデータは、処理装置に基づいて解釈されたり、処理装置に命令またはデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、仮想装置、コンピュータ記録媒体または装置に具現化されてよい。ソフトウェアは、ネットワークによって接続されたコンピュータシステム上に分散され、分散された状態で記録されても実行されてもよい。ソフトウェアおよびデータは、１つ以上のコンピュータ読み取り可能な記録媒体に記録されてよい。

実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータ読み取り可能な媒体に記録されてよい。コンピュータ読み取り可能な媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含んでよい。媒体は、コンピュータ実行可能なプログラムを継続して記録するものであっても、実行またはダウンロードのために一時記録するものであってもよい。また、媒体は、単一または複数のハードウェアが結合した形態の多様な格納手段または格納手段であってよく、あるコンピュータシステムに直接接続する媒体に限定されることはなく、ネットワーク上に分散して存在するものであってもよい。媒体の例としては、ハードディスク、フロッピー（登録商標）ディスク、および磁気テープのような磁気媒体、ＣＤ−ＲＯＭおよびＤＶＤのような光媒体、フロプティカルディスク（ｆｌｏｐｔｉｃａｌｄｉｓｋ）のような光磁気媒体、およびＲＯＭ、ＲＡＭ、フラッシュメモリなどを含み、プログラム命令が記録されるように構成されたものであってよい。また、媒体の他の例として、アプリケーションを配布するアプリケーションストアやその他の多様なソフトウェアを供給または配布するサイト、サーバなどで管理する記録媒体または格納媒体が挙げられる。プログラム命令の例には、コンパイラによって生成されるもののような機械語コードだけでなく、インタプリタなどを使用してコンピュータによって実行されることのできる高級言語コードが含まれる。

以上のように、実施形態を、限定された実施形態および図面に基づいて説明したが、当業者であれば、上述した記載から多様な修正および変形が可能であろう。例えば、説明された技術が、説明された方法とは異なる順序で実行されたり、かつ／あるいは、説明されたシステム、構造、装置、回路などの構成要素が、説明された方法とは異なる形態で結合されたりまたは組み合わされたり、他の構成要素または均等物によって対置されたり置換されたとしても、適切な結果を達成することができる。

したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付される特許請求の範囲に属する。

３１０：データアーカイブシステム
３１１：データ圧縮モジュール
３１２：照会モジュール
３１３：ディスプレイおよび制御モジュール
３１４：ニアラインインタフェースモジュール
３２０：対象システム
３２１：データベース
３２２：制御モジュール
３２３：ニアラインインタフェースモジュール
３３０：格納システム

Claims

コンピュータ装置と結合してデータアーカイブ方法をコンピュータ装置に実行させるためにコンピュータ読み取り可能な記録媒体に記録されたコンピュータプログラムであって、
前記データアーカイブ方法は、
データを格納する対象システムから遠隔機能の呼び出しを受信する段階、
前記遠隔機能の呼び出しに応答し、前記対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第１機能を、前記ネットワークを介して前記対象システムに提供する段階、および
前記格納システムにアーカイブされたデータを照会するための第２機能を、前記ネットワークを介して前記対象システムに提供する段階
を含むことを特徴とする、コンピュータプログラム。
前記第１機能を提供する段階は、
前記対象システムのローカルデータベースに格納されたデータのうちの少なくとも一部を圧縮して前記ローカルデータベースのテーブルにアーカイブするための機能を提供すること
を特徴とする、請求項１に記載のコンピュータプログラム。
前記第１機能を提供する段階は、
前記対象システムのローカルデータベースに格納されたデータのうちの少なくとも一部を圧縮して前記対象システムの外部データベースのテーブルにアーカイブするための機能を提供すること
を特徴とする、請求項１に記載のコンピュータプログラム。
前記第１機能を提供する段階は、
前記対象システムのローカルデータベースに格納されたデータのうちの少なくとも一部をファイルとして圧縮して前記対象システムの外部システムが含む格納場所にアーカイブするための機能を提供すること
を特徴とする、請求項１に記載のコンピュータプログラム。
前記第１機能を提供する段階は、
前記対象システムのローカルデータベースのテーブルに含まれたデータレコードに対するパーティションをデータレコードの選別情報に基づいて決定するように前記対象システムを制御する第１−１機能、
前記パーティションごとにデータレコードを圧縮して圧縮パーティションを生成するように前記対象システムを制御する第１−２機能、
前記圧縮パーティションと前記圧縮パーティションを固有に識別する格納キーとを連係させて圧縮テーブルに格納するように前記対象システムを制御する第１−３機能、および
前記格納キーと前記選別情報とを連係させて前記ローカルデータベースのインデックステーブルに格納するように前記対象システムを制御する第１−４機能
を提供することを特徴とする、請求項１に記載のコンピュータプログラム。
前記選別情報は、該当のデータレコードの任意のフィールド値を含み、
前記第１−４機能は、前記格納キーと前記任意のフィールド値とを連係させて前記ローカルデータベースのグループインデックステーブルに格納するように前記対象システムを制御すること
を特徴とする、請求項５に記載のコンピュータプログラム。
前記選別情報は、該当のデータレコードの時間に関する情報を含み、
前記第１−４機能は、前記格納キーと前記時間に関する情報とを連係させて期間インデックステーブルに格納するように前記対象システムを制御すること
を特徴とする、請求項５に記載のコンピュータプログラム。
前記第１機能を提供する段階は、
前記テーブルに含まれたデータレコードそれぞれに対し、プライマリキー（ｐｒｉｍａｒｙｋｅｙ）と、該当のデータレコードを含んで圧縮された圧縮パーティション内での該当のデータレコードの位置であるキーインデックス情報と、該当のデータレコードを含んで圧縮された圧縮パーティションに対応する格納キーとを連係させてキーインデックステーブルに格納するように前記対象システムを制御する第１−５機能
をさらに提供することを特徴とする、請求項５に記載のコンピュータプログラム。
前記第１−５機能は、
前記プライマリキーによって前記テーブルと連結する連結テーブルでデータレコードを圧縮して生成された第２圧縮パーティションに対し、
前記第２圧縮パーティションに含まれたデータレコードのうちで前記テーブルに含まれたデータレコードと前記プライマリキーが等しいデータレコードを検索し、前記検索されたデータレコードに対し、前記第２圧縮パーティション内での位置であるサブインデックス情報を前記キーインデックステーブル上の前記プライマリキーが等しいデータレコードに対してさらに格納するように前記対象システムを制御すること
を特徴とする、請求項８に記載のコンピュータプログラム。
前記第１機能を提供する段階は、
前記圧縮されたデータレコードを前記テーブルから削除するように前記対象システムを制御する第１−６機能
をさらに提供することを特徴とする、請求項５に記載のコンピュータプログラム。
前記第１機能を提供する段階は、
前記削除されたデータレコードの復元要求に応答し、前記インデックステーブルから前記復元要求が含む識別情報と連係する格納キーを検索し、前記圧縮テーブルで前記検索された格納キーと連係する圧縮パーティションを検索し、前記検索された圧縮パーティションの圧縮を解除して前記削除されたデータレコードを復元し、前記復元されたデータレコードを前記識別情報に基づいて前記テーブルに記録するように前記対象システムを制御する第１−７機能
をさらに提供することを特徴とする、請求項１０に記載のコンピュータプログラム。
前記第１−２機能は、前記決定されたパーティションに含まれたデータレコードをバイナリオブジェクトとして圧縮して前記圧縮パーティションを生成するように前記対象システムを制御すること
を特徴とする、請求項５に記載のコンピュータプログラム。
前記第２機能を提供する段階は、
データレコードの選別情報を含む検索条件を受信するように前記対象システムを制御する第２−１機能、
前記対象システムのローカルデータベース上でデータレコードの選別情報と該当のデータレコードが含まれた圧縮パーティションを固有に識別する格納キーとを連係させて格納するインデックステーブルから、前記検索条件が含む選別情報と連係する格納キーを検索するように前記対象システムを制御する第２−２機能、および
格納キーと圧縮パーティションとを連係させて格納する圧縮テーブルで前記検索された格納キーと連係する圧縮パーティションを検索するように前記対象システムを制御する第２−３機能
を提供することを特徴とする、請求項１に記載のコンピュータプログラム。
前記データアーカイブ方法は、
前記格納システムにアーカイブされたデータの寿命周期を管理するための第３機能を、前記ネットワークを介して前記対象システムに提供する段階
をさらに含むことを特徴とする、請求項１に記載のコンピュータプログラム。
前記第３機能を提供する段階は、
前記格納システムにアーカイブされたデータの保管期間が経過した場合、データベースのテーブルに圧縮された状態で管理されるデータをファイルとしてアーカイブして保管するように前記対象システムを制御するための第３−１機能、および
前記ファイルとしてアーカイブされたデータを削除するように前記対象システムを制御するための第３−２機能
を提供することを特徴とする、請求項１４に記載のコンピュータプログラム。
少なくとも１つのプロセッサを含むコンピュータ装置が実行するデータアーカイブ方法であって、
前記少なくとも１つのプロセッサにより、データを格納する対象システムから遠隔機能の呼び出しを受信する段階、
前記少なくとも１つのプロセッサにより、前記遠隔機能の呼び出しに応答し、前記対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第１機能を、前記ネットワークを介して前記対象システムに提供する段階、および
前記少なくとも１つのプロセッサにより、前記格納システムにアーカイブされたデータを照会するための第２機能を、前記ネットワークを介して前記対象システムに提供する段階
を含む、データアーカイブ方法。
前記第１機能を提供する段階は、
前記対象システムのローカルデータベースのテーブルに含まれたデータレコードに対するパーティションをデータレコードの選別情報に基づいて決定するように前記対象システムを制御する第１−１機能、
前記パーティションごとにデータレコードを圧縮して圧縮パーティションを生成するように前記対象システムを制御する第１−２機能、
前記圧縮パーティションと前記圧縮パーティションを固有に識別する格納キーとを連係させて圧縮テーブルに格納するように前記対象システムを制御する第１−３機能、および
前記格納キーと前記選別情報とを連係させて前記ローカルデータベースのインデックステーブルに格納するように前記対象システムを制御する第１−４機能
を提供することを特徴とする、請求項１６に記載のデータアーカイブ方法。
前記第２機能を提供する段階は、
データレコードの選別情報を含む検索条件を受信するように前記対象システムを制御する第２−１機能、
前記対象システムのローカルデータベース上でデータレコードの選別情報と該当のデータレコードが含まれた圧縮パーティションを固有に識別する格納キーとを連係させて格納するインデックステーブルから、前記検索条件が含む選別情報と連係する格納キーを検索するように前記対象システムを制御する第２−２機能、および
格納キーと圧縮パーティションと連係させて格納する圧縮テーブルで前記検索された格納キーと連係する圧縮パーティションを検索するように前記対象システムを制御する第２−３機能
を提供することを特徴とする、請求項１６に記載のデータアーカイブ方法。
請求項１６〜１８のいずれかに記載の方法をコンピュータ装置に実行させるためのコンピュータプログラムが記録されている、コンピュータ読み取り可能な記録媒体。
コンピュータ読み取り可能な命令を実行するように実現される少なくとも１つのプロセッサ
を含み、
前記少なくとも１つのプロセッサにより、
データを格納する対象システムから遠隔機能の呼び出しを受信し、
前記遠隔機能の呼び出しに応答し、前記対象システムに格納されたデータのうちの少なくとも一部を格納システムにアーカイブするための第１機能を、前記ネットワークを介して前記対象システムに提供し、
前記格納システムにアーカイブされたデータを照会するための第２機能を、前記ネットワークを介して前記対象システムに提供すること
を特徴とする、コンピュータ装置。