JP7141908B2 - Data management system and data management method - Google Patents

Data management system and data management method Download PDF

Info

Publication number
JP7141908B2
JP7141908B2 JP2018198161A JP2018198161A JP7141908B2 JP 7141908 B2 JP7141908 B2 JP 7141908B2 JP 2018198161 A JP2018198161 A JP 2018198161A JP 2018198161 A JP2018198161 A JP 2018198161A JP 7141908 B2 JP7141908 B2 JP 7141908B2
Authority
JP
Japan
Prior art keywords
data
time
backup
request
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018198161A
Other languages
Japanese (ja)
Other versions
JP2020067681A (en
Inventor
恵美子 小林
聡一 高重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018198161A priority Critical patent/JP7141908B2/en
Publication of JP2020067681A publication Critical patent/JP2020067681A/en
Application granted granted Critical
Publication of JP7141908B2 publication Critical patent/JP7141908B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、概して、要求対象のデータを提供する技術に関するものである。 The present invention relates generally to techniques for providing requested data.

企業内の業務システムにおいて、業務アプリケーションが生成するデータは、記憶装置に保存される。記憶装置のハードウェア障害、ソフトウェア障害、または人的エラーによるデータ破損に備えたデータ保護のため、バックアップを取得する運用が行われる。バックアップを定期的に取得し、複数世代のバックアップデータが保存される場合もある。ここでは、業務アプリケーションが生成するデータが保存される記憶装置を1次ストレージ、バックアップデータが保存される記憶装置を2次ストレージと呼ぶ。1次ストレージと2次ストレージとは、同じ装置内に設けられる場合もあるが、バックアップデータは、保護用であり、使用頻度が低いことから、性能の低いディスク、別の装置などに保存される場合もある。さらにバックアップデータは、長期の保存用にアーカイブ用の記憶装置に保存される場合もある。保存される記憶装置は、ブロックストレージ、ファイルストレージ、オブジェクトストレージなど、仕様およびプロトコルが異なる可能性がある。 In a business system within a company, data generated by a business application is stored in a storage device. A backup operation is performed for data protection against data corruption due to storage device hardware failure, software failure, or human error. Backups are acquired periodically, and multiple generations of backup data may be stored. Here, a storage device that stores data generated by a business application is called primary storage, and a storage device that stores backup data is called secondary storage. Primary storage and secondary storage may be provided in the same device, but backup data is for protection and is used infrequently, so it is stored on a low-performance disk or another device. In some cases. Backup data may also be stored in archival storage for long-term storage. The stored storage devices may have different specifications and protocols, such as block storage, file storage, object storage, and the like.

業務アプリケーションのデータに対しては、企業内での分析、監査、アプリケーションの開発テストといった業務アプリケーション以外の用途での利用要求がある。その場合、データを管理するデータ管理者は、利用要求に合致するデータを抽出して提供する。要求されたデータは、1次ストレージにある場合、2次ストレージにある場合、またはアーカイブ用ストレージにしかない場合もあり、データ管理者は、データが格納されているストレージを特定してデータを抽出しなければならないため、作業負荷がかかる。 Business application data is requested to be used for uses other than business applications, such as in-house analysis, auditing, and application development testing. In that case, the data manager who manages the data extracts and provides the data that matches the usage request. The requested data may be in primary storage, secondary storage, or only in archival storage, and the data manager identifies the storage where the data resides and extracts the data. work load.

ここで、業務アプリケーションのデータを別用途に提供する場合、業務アプリケーションには影響を与えないことが望ましい。よって、1次ストレージのデータについて、スナップショットを取得して提供する方法がある。この点、データの提供のために、データオブジェクトのスナップショットを取得し、ライブクローンボリュームを作成し、アプリケーションにマウントさせる一連のワークフローを定義し、自動実行する方法が示されている(特許文献1参照)。 Here, when providing business application data for another purpose, it is desirable not to affect the business application. Therefore, there is a method of obtaining and providing a snapshot of the data in the primary storage. In this regard, in order to provide data, a method for automatically executing a workflow that acquires a snapshot of a data object, creates a live clone volume, and mounts it to an application is defined (Patent Document 1). reference).

米国特許第9665437号明細書U.S. Pat. No. 9,665,437

特許文献1に記載の技術では、利用にあわせてワークフローを定義し、取得したスナップショットからデータを提供する。しかしながら、特許文献1に記載の技術は、バックアップが既に取得されているバックアップデータには適用することができない。このため、利用したい単位が過去1年の顧客毎の消費分析といった場合、必要なデータが複数のアプリケーション(顧客名簿管理、売り上げ管理など)のデータであって、長期期間分であるため、同一のストレージには保存されない可能性が高く、さらに、データの利用要求で指定される時間とバックアップの取得時間とは一致しない可能性が高いため、要求されたデータを提供することが困難となってしまう。 In the technique described in Patent Document 1, a workflow is defined according to usage, and data is provided from acquired snapshots. However, the technology described in Patent Literature 1 cannot be applied to backup data that has already been backed up. For this reason, if the unit you want to use is a consumption analysis for each customer in the past year, the necessary data is data for multiple applications (customer list management, sales management, etc.), and it is for a long period. There is a high possibility that it will not be stored in the storage, and there is a high possibility that the time specified in the data usage request will not match the backup acquisition time, so it will be difficult to provide the requested data. .

本発明は以上の点を考慮してなされたもので、要求対象の時間に合ったデータを提供し得るデータ管理システムを提案しようとするものである。 SUMMARY OF THE INVENTION The present invention has been made in consideration of the above points, and intends to propose a data management system capable of providing data that matches the requested time.

かかる課題を解決するため本発明においては、複数のストレージ装置を含んで構成されるデータ管理システムであって、要求対象の時間を示す情報が含まれる要求を受け付ける要求受付部と、データを保管するための保管データが取得された時間を示す情報と、前記保管データが格納されるストレージ装置を示す情報とが対応付けられているデータ管理情報に基づいて、前記複数のストレージ装置に記憶される保管データの中から、前記要求受付部により受け付けられた要求に含まれる要求対象の時間に合う保管データを特定するデータ特定部と、前記データ特定部による特定結果を出力する出力部と、を設けるようにした。 In order to solve this problem, the present invention provides a data management system including a plurality of storage devices, comprising: Storage stored in the plurality of storage devices based on data management information in which information indicating the time when the storage data for storage was acquired and information indicating the storage device in which the storage data is stored are associated A data specifying unit for specifying, from among data, storage data that matches the requested time included in the request accepted by the request accepting unit; and an output unit for outputting the specified result by the data specifying unit. did.

上記構成では、例えば、要求対象の時間と、データの保管データが取得された日時との関連付けが把握されているので、要求されたデータの時間要件に合った保管データを特定でき、当該保管データに係る情報から当該保管データを得ることができるようになる。 In the above configuration, for example, the association between the requested time and the date and time when the stored data of the data was acquired is grasped, so the stored data that meets the time requirements of the requested data can be specified, and the stored data The stored data can be obtained from the information related to

本発明によれば、要求対象のデータを提供することができる。 According to the present invention, requested data can be provided.

第1の実施の形態によるデータ管理システムに係る構成の一例を示す図である。It is a figure showing an example of composition concerning a data management system by a 1st embodiment. 第1の実施の形態による管理サーバのハードウェア構成の一例を示す図である。3 illustrates an example hardware configuration of a management server according to the first embodiment; FIG. 第1の実施の形態によるデータ管理プログラムの機能モジュールに係る構成の一例を示す図である。FIG. 3 is a diagram showing an example of a configuration related to functional modules of a data management program according to the first embodiment; FIG. 第1の実施の形態によるデータ管理情報の一例を示す図である。4 is a diagram showing an example of data management information according to the first embodiment; FIG. 第1の実施の形態によるAP管理情報の一例を示す図である。It is a figure which shows an example of AP management information by 1st Embodiment. 第1の実施の形態によるデータ属性管理情報の一例を示す図である。4 is a diagram showing an example of data attribute management information according to the first embodiment; FIG. 第1の実施の形態によるデータ提供処理に係るフローチャートの一例を示す図である。FIG. 7 is a diagram showing an example of a flowchart relating to data provision processing according to the first embodiment; 第1の実施の形態による日時指定時のデータ特定処理に係るフローチャートの一例を示す図である。FIG. 10 is a diagram showing an example of a flowchart relating to data identification processing when date and time are specified according to the first embodiment; 第1の実施の形態による期間指定時のデータ特定処理に係るフローチャートの一例を示す図である。FIG. 7 is a diagram showing an example of a flowchart relating to data specifying processing when a period is specified according to the first embodiment; 第1の実施の形態による期間指定時のバックアップデータの選択の概念図である。4 is a conceptual diagram of selection of backup data when a period is specified according to the first embodiment; FIG. 第1の実施の形態によるストレージ装置管理情報の一例を示す図である。FIG. 3 is a diagram showing an example of storage device management information according to the first embodiment; FIG. 第1の実施の形態による要求レベル確認処理に係るフローチャートの一例を示す図である。FIG. 7 is a diagram showing an example of a flowchart relating to request level confirmation processing according to the first embodiment; 第1の実施の形態による復元時間確認処理に係るフローチャートの一例を示す図である。FIG. 7 is a diagram showing an example of a flowchart relating to restoration time confirmation processing according to the first embodiment; 第1の実施の形態による提供形態決定処理に係るフローチャートの一例を示す図である。FIG. 7 is a diagram showing an example of a flowchart relating to provision form determination processing according to the first embodiment; 第1の実施の形態による入出力インタフェースの一例を示す図である。FIG. 3 is a diagram showing an example of an input/output interface according to the first embodiment; FIG. 第2の実施の形態による業務データ管理情報の一例を示す図である。It is a figure which shows an example of business data management information by 2nd Embodiment. 第3の実施の形態によるストレージ階層管理情報の一例を示す図である。FIG. 12 is a diagram showing an example of storage tier management information according to the third embodiment; FIG. 第3の実施の形態による使用履歴管理情報の一例を示す図である。FIG. 13 is a diagram showing an example of usage history management information according to the third embodiment; FIG.

以下図面について、本発明の一実施の形態を詳述する。 One embodiment of the present invention will be described in detail below with reference to the drawings.

(1)第1の実施の形態
図1において、100は全体として第1の実施の形態によるデータ管理システムを示す。
(1) First Embodiment In FIG. 1, 100 indicates a data management system according to the first embodiment as a whole.

図1は、データ管理システム100に係る構成の一例を示す図である。データ管理システム100は、管理サーバ110、ホスト計算機120、SDS(Software Defined Storage)システム130、およびクライアント端末140を含んで構成される。 FIG. 1 is a diagram showing an example of the configuration of a data management system 100. As shown in FIG. The data management system 100 includes a management server 110 , a host computer 120 , an SDS (Software Defined Storage) system 130 and a client terminal 140 .

管理サーバ110とホスト計算機120とは、管理用NW(Network)150で接続される。管理サーバ110とSDSシステム130とは、管理用NW150で接続される。管理サーバ110とクライアント端末140とは、アクセス用NW160で接続される。ホスト計算機120とSDSシステム130とは、NW170(IP(Internet Protocol)ネットワークまたはSAN(Storage Area Network))で接続される。なお、ネットワークの構成は、上述の構成に限られるものではなく、適宜の構成を採用可能である。 The management server 110 and the host computer 120 are connected by a NW (Network) 150 for management. Management server 110 and SDS system 130 are connected by NW 150 for management. The management server 110 and the client terminal 140 are connected by an access NW 160 . The host computer 120 and the SDS system 130 are connected by a NW 170 (IP (Internet Protocol) network or SAN (Storage Area Network)). In addition, the configuration of the network is not limited to the configuration described above, and an appropriate configuration can be adopted.

管理サーバ110は、データ管理プログラム111を実行し、SDSシステム130に格納(記憶)されているデータを管理する。 The management server 110 executes the data management program 111 and manages data stored (stored) in the SDS system 130 .

ホスト計算機120は、一または複数設けられ、1つ以上のAP(Application Program)を含んで構成される業務AP121を提供し、SDSシステム130にデータを格納する。 One or a plurality of host computers 120 are provided to provide business APs 121 including one or more APs (Application Programs), and store data in the SDS system 130 .

SDSシステム130は、コントロールノード131を備える。コントロールノード131は、制御ソフトウェアを実行し、SDSシステム130を構成するストレージ装置132を仮想化し、ホスト計算機120に対するインタフェースを提供する。SDSシステム130を構成するストレージ装置132として、業務AP121のデータを格納する1次ストレージ、当該データの保管データ(当該データのバックアップを取得したバックアップデータ、当該データのアーカイブを取得したアーカイブデータ、スナップショットにより取得したスナップショットデータ)を格納する2次ストレージがある。以降では、バックアップデータとアーカイブデータとスナップショットデータとを特に区別せず、バックアップデータの場合を例に挙げて説明するが、アーカイブデータ、スナップショットデータにも適用可能である。なお、ストレージ装置132は、複数の汎用サーバのディスクを仮想化したストレージであってもよいし、一般的なストレージサブシステムであってもよい。 The SDS system 130 has a control node 131 . The control node 131 executes control software, virtualizes the storage device 132 that constitutes the SDS system 130 , and provides an interface to the host computer 120 . As the storage device 132 constituting the SDS system 130, primary storage for storing the data of the business AP 121, storage data of the data (backup data obtained by backing up the data, archive data obtained by archiving the data, snapshot There is a secondary storage that stores snapshot data acquired by Hereinafter, backup data, archive data, and snapshot data will not be particularly distinguished, and the case of backup data will be described as an example, but the present invention can also be applied to archive data and snapshot data. Note that the storage device 132 may be a storage obtained by virtualizing disks of a plurality of general-purpose servers, or may be a general storage subsystem.

クライアント端末140は、データを利用するユーザが使用(操作)する端末であって、データ管理プログラム111にアクセス(例えば、ユーザがデータを要求するための利用要求を送信)する。 The client terminal 140 is a terminal used (operated) by a user who uses data, and accesses the data management program 111 (eg, transmits a use request for the user to request data).

図2は、データ管理プログラム111を実行する管理サーバ110のハードウェア構成の一例を示す図である。管理サーバ110は、1つ以上の、CPU201(中央処理装置)、メモリ202、ハードディスク等の2次記憶装置203、キーボード、マウスからの入力とディスプレイへの出力とを制御する入出力IF(interface)204、ネットワーク(管理用NW150、アクセス用NW160等)に接続するためのネットワークIF205を含んで構成される。 FIG. 2 is a diagram showing an example of the hardware configuration of the management server 110 that executes the data management program 111. As shown in FIG. The management server 110 includes one or more CPU 201 (central processing unit), memory 202, secondary storage device 203 such as a hard disk, input/output IF (interface) for controlling input from a keyboard and mouse and output to a display. 204, which includes a network IF 205 for connecting to a network (NW 150 for management, NW 160 for access, etc.).

管理サーバ110のメモリ202上には、データ管理プログラム111がロードされ、CPU201により実行される。なお、管理サーバ110の機能(例えば、図3に示すデータ管理プログラム111の機能モジュール)は、上述のようにソフトウェアにより実現されてもよいし、専用の回路などのハードウェアにより実現されてもよいし、ソフトウェアとハードウェアとが組み合わされて実現されてもよい。また、管理サーバ110の機能の一部は、管理サーバ110と通信可能な他のコンピュータにより実現されてもよい。 A data management program 111 is loaded onto the memory 202 of the management server 110 and executed by the CPU 201 . Note that the functions of the management server 110 (for example, the functional modules of the data management program 111 shown in FIG. 3) may be realized by software as described above, or may be realized by hardware such as a dedicated circuit. However, it may be realized by combining software and hardware. Also, part of the functions of the management server 110 may be implemented by another computer that can communicate with the management server 110 .

また、2次記憶装置203には、データ管理プログラム111が使用するデータ管理DB(database)206が保存される。なお、管理サーバ110は、物理マシンでなく仮想マシンとして実装されてもよい。 The secondary storage device 203 also stores a data management DB (database) 206 used by the data management program 111 . Note that the management server 110 may be implemented as a virtual machine instead of a physical machine.

付言するならば、SDSシステム130として構成されるストレージ装置132のうち、汎用サーバのハードウェア構成については、図2に示す構成と同様であり、その説明を省略する。 As an additional remark, the hardware configuration of the general-purpose server in the storage device 132 configured as the SDS system 130 is the same as the configuration shown in FIG. 2, and the description thereof will be omitted.

図3は、データ管理プログラム111の機能モジュールに係る構成の一例を示す図である。データ管理プログラム111は、セルフサービスポータルIF部301、データ管理DB部302、要求受付部303、データ特定部304、データ情報収集部305、バックアップ情報収集部306、データ評価部307、および出力部308を含んで構成される。 FIG. 3 is a diagram showing an example of a configuration related to functional modules of the data management program 111. As shown in FIG. The data management program 111 includes a self-service portal IF section 301, a data management DB section 302, a request reception section 303, a data identification section 304, a data information collection section 305, a backup information collection section 306, a data evaluation section 307, and an output section 308. Consists of

セルフサービスポータルIF部301は、クライアント端末140と通信を行い、データを利用するユーザとのインタフェースを提供する。データ管理DB部302は、データ管理DB206(データに関する属性、バックアップ情報、復元情報など)を管理する。要求受付部303は、例えば、要求対象の時間(例えば、後述の対象時間)を示す情報が含まれる要求(例えば、ユーザからのデータの利用要求)を受け付ける。 The self-service portal IF unit 301 communicates with the client terminal 140 and provides an interface for users who use data. The data management DB unit 302 manages the data management DB 206 (attributes related to data, backup information, restoration information, etc.). The request receiving unit 303 receives, for example, a request (for example, a data usage request from a user) including information indicating a requested time (for example, a target time to be described later).

データ特定部304は、例えば、データを保管するための保管データが取得された時間(日付、時刻など)を示す情報と、保管データが格納されるストレージ装置(保管場所、ストレージ識別子、ボリューム識別子など)を示す情報とが対応付けられているデータ管理情報(例えば、後述の図4参照)に基づいて、複数のストレージ装置132に記憶される保管データの中から、要求受付部303により受け付けられた要求に含まれる要求対象の時間に合う保管データを特定する。 The data identification unit 304 includes, for example, information indicating the time (date, time, etc.) when the storage data for storing the data was acquired, and the storage device (storage location, storage identifier, volume identifier, etc.) in which the storage data is stored. ) is associated with information indicating the Identify the stored data that matches the requested time included in the request.

データ情報収集部305は、データに関する情報を業務AP121から収集したり、データの管理者からの入力により収集したりする。バックアップ情報収集部306は、データのバックアップ情報をSDSシステム130から収集したり、ホスト計算機120のバックアップ実行ツールから収集したりする。 The data information collection unit 305 collects information about data from the business AP 121 or according to an input from a data manager. The backup information collection unit 306 collects data backup information from the SDS system 130 or from the backup execution tool of the host computer 120 .

データ評価部307は、例えば、データ管理情報に基づいて、データ特定部304により特定された保管データについて、要求に含まれる要求対象の時間との時間差分を算出し、算出した時間差分が要求に含まれる要求レベルを満たすか否かを評価する。また、例えば、データ評価部307は、データ特定部304により特定された保管データの復元にかかる時間を算出し、算出した復元にかかる時間が要求に含まれる可能待ち時間以内であるか否かを評価する。出力部308は、データ特定部304による特定結果を出力する(特定した保管データを提供するための形式変換、転送等を行う)。例えば、出力部308は、データ特定部304により特定された保管データに係る情報を出力する。出力部308は、当該保管データの保管先を示す情報を出力するものであってもよいし、当該保管データを出力するものであってもよいし、当該保管データを識別する識別子および当該データを保管する保管先を識別する識別子を出力するものであってもよい。 For example, based on the data management information, the data evaluation unit 307 calculates the time difference between the storage data specified by the data specifying unit 304 and the requested time included in the request. Evaluate whether the included level of requirements is met. Further, for example, the data evaluation unit 307 calculates the time required to restore the stored data identified by the data identification unit 304, and determines whether the calculated time required for restoration is within the possible waiting time included in the request. evaluate. The output unit 308 outputs the result of identification by the data identification unit 304 (performs format conversion, transfer, etc. for providing the identified storage data). For example, the output unit 308 outputs information related to storage data specified by the data specifying unit 304 . The output unit 308 may output information indicating the storage destination of the stored data, may output the stored data, or may output an identifier for identifying the stored data and the data. An identifier for identifying a storage location to store the data may be output.

図4は、データ管理DB206に含まれるデータ管理情報の一例(データ管理テーブル400)を示す図である。データ管理テーブル400では、バックアップが取得されているデータについて、データ毎に、時間軸でバックアップ情報を管理する。データ管理テーブル400は、データ識別子フィールド401、日付フィールド402、識別子フィールド403、バックアップ取得単位フィールド404、保管場所フィールド405、サイズフィールド406、および取得時刻フィールド407を含んで構成される。 FIG. 4 is a diagram showing an example of data management information (data management table 400) included in the data management DB 206. As shown in FIG. The data management table 400 manages backup information for each piece of data for which backup has been acquired, on the time axis. The data management table 400 includes a data identifier field 401 , date field 402 , identifier field 403 , backup acquisition unit field 404 , storage location field 405 , size field 406 and acquisition time field 407 .

データ識別子フィールド401は、データを識別するデータ識別子を示す情報を格納する。日付フィールド402は、バックアップデータの取得の日付(バックアップの日付)を示す情報を格納する。識別子フィールド403は、バックアップデータ(バックアップファイル)を識別する識別子を格納する。バックアップ取得単位フィールド404は、バックアップの取得単位を示す情報を格納する。保管場所フィールド405は、バックアップ先(保管先)を示すストレージ情報を格納する。サイズフィールド406は、バックアップデータのサイズを示す情報を格納する。取得時刻フィールド407は、バックアップデータの取得の時刻を示す情報を格納する。 The data identifier field 401 stores information indicating a data identifier that identifies data. The date field 402 stores information indicating the date of backup data acquisition (backup date). The identifier field 403 stores an identifier that identifies backup data (backup file). The backup acquisition unit field 404 stores information indicating the backup acquisition unit. The storage location field 405 stores storage information indicating the backup destination (storage destination). The size field 406 stores information indicating the size of backup data. The acquisition time field 407 stores information indicating the acquisition time of the backup data.

ここで、データ識別子は、DBのデータの場合は、DBのテーブル名またはカラム名、オブジェクトの場合は、オブジェクト識別子、ファイルの場合は、ファイル識別子など、APのデータを識別するデータの単位である。保管場所は、ストレージ識別子、ストレージ内のボリューム識別子、ディレクトリ等であり、バックアップデータの保管先を識別するためのものである。図4の例では、ストレージ識別子(ストレージ1)とボリューム識別子(LU1)とで保管場所を示している
。取得単位としては、フルバックアップ、差分バックアップ、増分バックアップなど、バックアップの方式を管理する。
Here, the data identifier is a data unit for identifying AP data, such as a DB table name or column name in the case of DB data, an object identifier in the case of an object, and a file identifier in the case of a file. . The storage location is a storage identifier, a volume identifier in the storage, a directory, or the like, and is used to identify the storage destination of backup data. In the example of FIG. 4, the storage location is indicated by the storage identifier (storage 1) and the volume identifier (LU1). As a unit of acquisition, backup methods such as full backup, differential backup, and incremental backup are managed.

フルバックパップは、全てのデータを保持するバックアップの方式である。差分バックアップは、フルバックアップからの差分を保持するバックアップの方式である。増分バックアップは、前回のバックアップからの増分(変更分)を保持するバックアップの方式である。例えば、下記のようにデータが更新され、バックアップが取られた場合において、差分バックアップと増分バックアップとの違いを説明する。
時刻A:データWにデータXが追加
時刻B:フルバックアップ
時刻C:データYの追加
時刻D:差分バックアップ(または増分バックアップ)
時刻E:データZの追加
時刻F:差分バックアップ(または増分バックアップ)
A full backup is a backup method that retains all data. A differential backup is a backup method that retains a difference from a full backup. Incremental backup is a backup method that retains increments (changes) from the previous backup. For example, the difference between a differential backup and an incremental backup will be explained when data is updated and a backup is taken as follows.
Time A: Data X added to Data W Time B: Full backup Time C: Data Y added Time D: Differential backup (or incremental backup)
Time E: Addition of data Z Time F: Differential backup (or incremental backup)

時刻Bのフルバックアップでは、全てのデータ(データWおよびデータX)がバックアップデータとして保存される。 In the full backup at time B, all data (data W and data X) are saved as backup data.

時刻Dの差分バックアップでは、前回のフルバックアップのバックアップデータ(データWおよびデータX)との差分のデータ(データY)がバックアップデータとして保存される。時刻Dの増分バックアップでは、前回のバックアップ(時刻B)からの変更分のデータ(データY)がバックアップデータとして保存される。 In the differential backup at time D, differential data (data Y) from the backup data (data W and data X) of the previous full backup is saved as backup data. In the incremental backup at time D, the changed data (data Y) from the previous backup (time B) is saved as backup data.

時刻Fの差分バックアップでは、前回のフルバックアップのバックアップデータ(データWおよびデータX)との差分のデータ(データYおよびデータZ)がバックアップデータとして保存される。時刻Fの増分バックアップでは、前回のバックアップ(時刻D)からの変更分のデータ(データZ)がバックアップデータとして保存される。 In the differential backup at time F, differential data (data Y and data Z) from the backup data (data W and data X) of the previous full backup is saved as backup data. In the incremental backup at time F, the changed data (data Z) from the previous backup (time D) is saved as backup data.

なお、本実施の形態では、バックアップの方式として、フルバックアップ、差分バックアップ、および増分バックアップを例に挙げて説明するが、マルチレベル増分バックアップ、逆増分バックアップなど、他のバックアップの方式を採用することもできる。 In this embodiment, full backup, differential backup, and incremental backup are used as examples of backup methods. can also

バックアップ情報については、データ管理プログラム111が、バックアップ実行ツールから取得して登録してもよいし、SDSシステム130から2次ストレージに保管されたデータの情報を取得して登録してもよい。データ識別子については、データ管理プログラム111が、業務AP121から取得してもよいし、バックアップ情報の取得時にバックアップデータを復元し、データの内容を読み出して登録してもよい。登録したデータ識別子については、バックアップデータの復元、読み出しをバックアップ情報の取得の都度、または定期的に実行することで、追加があれば更新する。 The data management program 111 may acquire and register the backup information from the backup execution tool, or may acquire and register information on data stored in the secondary storage from the SDS system 130 . The data identifier may be obtained by the data management program 111 from the business AP 121, or may be restored by restoring the backup data when obtaining the backup information, and reading and registering the contents of the data. The registered data identifiers are updated, if any, by restoring and reading the backup data each time backup information is acquired or periodically.

また、図4には示さないが、例えば、図10に示すように、データ管理テーブル400では、データ内にタイムスタンプがある場合には、データ内の最初のタイムスタンプである初回タイムスタンプとデータ内の最後のタイムスタンプである最終タイムスタンプとを追加で管理する。タイムスタンプの情報については、例えば、データ管理プログラム111がバックアップデータを一旦復元し、データの内容を読み出す際に併せて登録する。 Although not shown in FIG. 4, for example, as shown in FIG. 10, in the data management table 400, if there is a time stamp in the data, the initial time stamp, which is the first time stamp in the data, and the data Additionally manage the final timestamp, which is the last timestamp in the . The time stamp information is registered together with the data management program 111, for example, when the backup data is temporarily restored and the contents of the data are read.

図5は、AP管理情報の一例(AP管理テーブル500)を示す図である。AP管理テーブル500は、データ管理DB206に含まれる。AP管理テーブル500は、バックアップデータが取得されたAPの情報を管理するテーブルである。AP管理テーブル500は、AP識別子フィールド501、APタイプフィールド502、およびバックアップ手段フィールド503を含んで構成される。 FIG. 5 is a diagram showing an example of AP management information (AP management table 500). AP management table 500 is included in data management DB 206 . The AP management table 500 is a table for managing information on APs from which backup data has been obtained. The AP management table 500 includes an AP identifier field 501 , an AP type field 502 and a backup means field 503 .

AP識別子フィールド501は、APを識別するAP識別子を示す情報を格納する。APタイプフィールド502は、APのタイプ(例えば、ソフトウェア名)を示す情報を格納する。バックアップ手段フィールド503は、バックアップの実行手段を示す情報(データの提供時にデータを復元する際に用いる情報であって、どのようにバックアップが行われたかを識別可能な情報)を格納する。図5では、APをDBシステムとして、AP識別子には、DB名、APタイプには、DB管理システムの名称を登録する例を示す。AP識別子、APタイプ、およびバックアップ手段の情報は、例えば、管理者により登録される。 The AP identifier field 501 stores information indicating an AP identifier that identifies an AP. The AP type field 502 stores information indicating the type of AP (for example, software name). The backup means field 503 stores information indicating backup execution means (information that is used when data is restored when data is provided and that can identify how the backup was performed). FIG. 5 shows an example in which the AP is a DB system, the DB name is registered as the AP identifier, and the name of the DB management system is registered as the AP type. Information on the AP identifier, AP type, and backup means is registered by, for example, an administrator.

図6は、データ属性管理情報の一例(データ属性管理テーブル600)を示す図である。データ属性管理テーブル600は、データ管理DB206に含まれる。データ属性管理テーブル600は、データの属性を管理するテーブルである。データ属性管理テーブル600は、データ識別子フィールド601、タイプフィールド602、およびタイムスタンプカラムフィールド603を含んで構成される。 FIG. 6 is a diagram showing an example of data attribute management information (data attribute management table 600). A data attribute management table 600 is included in the data management DB 206 . The data attribute management table 600 is a table for managing data attributes. The data attribute management table 600 includes a data identifier field 601 , type field 602 and timestamp column field 603 .

データ識別子フィールド601は、データを識別するデータ識別子を示す情報を格納する。タイプフィールド602は、データのタイプを示す情報を格納する。タイムスタンプカラムフィールド603は、データ内のタイムスタンプを示す情報を格納する。データのタイプとしては、データの追加、更新、削除に対する仕様が追記型であるのか更新型であるのかが管理される。 A data identifier field 601 stores information indicating a data identifier that identifies data. The type field 602 stores information indicating the type of data. A timestamp column field 603 stores information indicating the timestamp in the data. As for the type of data, it is managed whether the specifications for adding, updating, or deleting data are write-once or update.

図7は、データ管理プログラム111がデータの利用要求に対するデータを提供するデータ提供処理に係るフローチャートの一例を示す図である。 FIG. 7 is a diagram showing an example of a flowchart relating to data provision processing in which the data management program 111 provides data in response to a data utilization request.

ステップS701では、データ管理プログラム111は、クライアント端末140からデータの利用要求を受け付ける。利用要求には、ユーザから要求されたデータのデータ名(データ識別子)、データを取得する時間範囲(対象時間)、データの精度に関する要求レベル、データの提供まで待つことを許容する時間(可能待ち時間)などの情報が含まれる。付言するならば、利用要求には、上述した全ての情報が含まれるものに限られるものではない。例えば、要求対象のデータの種別が1種類である場合は、データ識別子が含まれていなくてもよい。 In step S<b>701 , the data management program 111 receives a data usage request from the client terminal 140 . The usage request includes the data name (data identifier) of the data requested by the user, the time range for data acquisition (target time), the required level of data accuracy, and the time allowed to wait until data is provided (possible waiting time). time) and other information. Additionally, the usage request is not limited to including all of the above information. For example, if there is only one type of data to be requested, the data identifier may not be included.

なお、ユーザインターフェースの一例(画面)については、図15を用いて後述する。要求レベルは、要求された対象時間に対して提供可能なデータの時間との差分に対する精度を要求するものであり、要求レベルとしては、例えば、2段階(低、高)から選択される。可能待ち時間としては、ユーザがデータの提供を希望する時間(例えば、1時間以内)が指定される。 An example (screen) of the user interface will be described later with reference to FIG. The required level requires accuracy with respect to the difference between the requested target time and the time of data that can be provided, and is selected from two levels (low, high), for example. As the possible waiting time, the time (for example, within one hour) that the user desires to receive the data is specified.

ステップS702では、データ管理プログラム111は、ユーザから要求されたデータ名(データ識別子)でデータ管理テーブル400を検索する。 In step S702, the data management program 111 searches the data management table 400 for the data name (data identifier) requested by the user.

ステップS703では、データ管理プログラム111は、要求されたデータ名(データ識別子)のデータが存在するか否か(一致するデータ名があるか否か)を判定し、存在すると判定した場合、ステップS704に処理を移し、存在しないと判定した場合、ステップS711に処理を移す。 In step S703, the data management program 111 determines whether or not data of the requested data name (data identifier) exists (whether or not there is a matching data name). , and if it is determined that it does not exist, the process moves to step S711.

ステップS704では、データ管理プログラム111は、要求されたデータの条件に合うデータの候補を抽出するために、要求されるデータの対象時間が日時指定か期間指定か(日時指定であるか否か)を判定し、日時指定であると判定した場合、ステップS705に処理を移し、期間指定であると判定した場合、ステップS706に処理を移す。 In step S704, the data management program 111 determines whether the target time of the requested data is date and time specification or period specification (whether date and time is specified) in order to extract data candidates that meet the conditions of the requested data. If it is determined that the date and time are specified, the process proceeds to step S705, and if it is determined that the period is specified, the process proceeds to step S706.

ステップS705では、データ管理プログラム111は、日時指定時のデータ特定処理を実行し、ステップS707に処理を移す。なお、日時指定時のデータ特定処理の詳細については、図8を用いて後述する。 In step S705, the data management program 111 executes data identification processing at the time of specifying the date and time, and shifts the processing to step S707. The details of the data specifying process when specifying the date and time will be described later with reference to FIG.

ステップS706では、データ管理プログラム111は、期間指定時のデータ特定処理を実行し、ステップS707に処理を移す。なお、期間指定時のデータ特定処理の詳細については、図9を用いて後述する。 In step S706, the data management program 111 executes data identification processing when specifying a period, and moves the processing to step S707. The details of the data specifying process when specifying a period will be described later with reference to FIG. 9 .

ステップS707では、データ管理プログラム111は、利用要求で要求レベルが指定されている場合、要求レベルを満足するデータを提供できるかを確認する処理(要求レベル確認処理)を行う。なお、要求レベル確認処理の詳細については、図12を用いて後述する。 In step S707, the data management program 111 performs processing (request level confirmation processing) for confirming whether or not data satisfying the requested level can be provided when the requested level is specified in the usage request. Details of the request level confirmation process will be described later with reference to FIG. 12 .

ステップS708では、データ管理プログラム111は、利用要求で可能待ち時間が指定されている場合、特定したデータの候補について、復元に要する時間を算出し、要求された可能待ち時間を満足するかを確認する処理(復元時間確認処理)を行う。なお、復元時間確認処理の詳細については、図13を用いて後述する。 In step S708, the data management program 111 calculates the time required for restoration of the identified data candidate, and checks whether the requested possible waiting time is satisfied. (restoration time confirmation process). Details of the restoration time confirmation process will be described later with reference to FIG. 13 .

ステップS709では、データ管理プログラム111は、提供形態決定処理を行う。なお、提供形態決定処理では、提供するデータの提供形態が決定されるが、詳細については、図14を用いて後述する。 In step S709, the data management program 111 performs provision form determination processing. In addition, in the provision form determination process, the provision form of the data to be provided is determined, and the details will be described later with reference to FIG. 14 .

ステップS710では、データ管理プログラム111は、データを復元して提供形態のデータを作成する。データの復元については、例えば、データ管理プログラム111は、AP管理テーブル500に基づいて、バックアップ手段(例えば、DBのインスタンス)を特定し、特定したバックアップ手段を用いてデータを復元する。 In step S710, the data management program 111 restores the data and creates data in the provision form. For data restoration, for example, the data management program 111 identifies backup means (for example, a DB instance) based on the AP management table 500 and restores data using the identified backup means.

ステップS711では、データ管理プログラム111は、利用要求に対する結果を出力し、データ提供処理を終了する。例えば、データ管理プログラム111は、結果として、提供形態のデータへのアクセス方法を出力する。なお、出力の例については、図15を用いて後述する。 In step S711, the data management program 111 outputs the result of the utilization request, and terminates the data provision process. For example, the data management program 111 outputs, as a result, a method of accessing data in the form of provision. Note that an output example will be described later with reference to FIG. 15 .

ここで、要求されたデータの時間に一致するデータが最新のバックアップデータ以降である場合、バックアップデータには要求に合うデータがないことになる。その場合、1次ストレージのデータボリュームのスナップショットを取得して保存してもよい。取得したデータについては、バックアップデータと同様に取得時刻、保存先などを管理してもよい。 Here, if the data that matches the time of the requested data is after the latest backup data, it means that there is no data that matches the requested data in the backup data. In that case, a snapshot of the data volume in the primary storage may be obtained and stored. As for the acquired data, the acquisition time, storage destination, etc. may be managed in the same manner as backup data.

図8は、日時指定時のデータ特定処理(ステップS705)に係るフローチャートの一例を示す図である。 FIG. 8 is a diagram showing an example of a flowchart relating to the data specifying process (step S705) when the date and time are specified.

ステップS801では、データ管理プログラム111は、指定日時(指定された日時)に取得日時(日付および取得時刻)が一致するバックアップデータがあるかをデータ管理テーブル400から検索する。 In step S801, the data management program 111 searches the data management table 400 for backup data whose acquisition date and time (date and time) match the specified date and time.

ステップS802では、データ管理プログラム111は、検索の結果、一致するものがあるか否かを判定し、あると判定した場合、ステップS803に処理を移し、ないと判定した場合、ステップS804に処理を移す。 In step S802, the data management program 111 determines whether or not there is a match as a result of the search. Transfer.

ステップS803では、データ管理プログラム111は、該当のバックアップデータを特定し、ステップS805に処理を移す。 In step S803, the data management program 111 identifies the corresponding backup data, and shifts the process to step S805.

ステップS804では、データ管理プログラム111は、バックアップの取得日時が指定日時に最も近いバックアップのバックパップデータを特定し、ステップS805に処理を移す。 In step S804, the data management program 111 identifies the backup data whose backup acquisition date and time is closest to the specified date and time, and shifts the process to step S805.

ステップS805では、データ管理プログラム111は、選択したバックパップデータ(該データ)が差分データ(差分バックアップで取得されたバックアップデータ)であるか否かを判定し、差分データであると判定した場合、ステップS806に処理を移し、差分データでないと判定した場合、ステップS807に処理を移す。 In step S805, the data management program 111 determines whether or not the selected backup data (the data) is differential data (backup data obtained by differential backup). The process moves to step S806, and when it is determined that the data is not difference data, the process moves to step S807.

ステップS806では、データ管理プログラム111は、元となるフルバックアップデータを特定し、日時指定時のデータ特定処理を終了する。 In step S806, the data management program 111 identifies the original full backup data, and terminates the data identification processing when the date and time are specified.

ステップS807では、データ管理プログラム111は、選択したバックアップデータ(該データ)が増分データ(増分バックアップで取得されたバックアップデータ)であるか否かを判定し、増分データであると判定した場合、ステップS808に処理を移し、増分データでないと判定した場合、該データがフルバックアップのバックアップデータであるので、日時指定時のデータ特定処理を終了する。 In step S807, the data management program 111 determines whether or not the selected backup data (data) is incremental data (backup data obtained by incremental backup). When the process is shifted to S808 and it is determined that the data is not the incremental data, the data is the backup data of the full backup, so the data specifying process at the time of designating the date and time ends.

ステップS808では、データ管理プログラム111は、フルバックアップデータと、フルバックアップデータから該データまでの増分データとを特定し、日時指定時のデータ特定処理を終了する。 In step S808, the data management program 111 identifies the full backup data and the incremental data from the full backup data to the data, and terminates the data identification processing at the date and time designation.

このように、データ特定部304は、例えば、データ管理情報に基づいて、要求に含まれるデータ識別子に対応するデータの保管データがある(例えば、ステップS703で「Yes」)と判定した場合、要求に含まれる要求対象の時間と一致する保管データが存在するか否かを判定し(例えば、ステップS802)、存在すると判定したときは、保管データを特定し(例えば、ステップ803)、存在しないと判定したときは、要求に含まれる要求対象の時間に最も近い日時の保管データを特定する(例えば、ステップ804)。 In this way, the data identification unit 304, for example, based on the data management information, when it determines that there is stored data corresponding to the data identifier included in the request (for example, "Yes" in step S703), the request (eg, step S802). When determined, the storage data with the closest date and time to the requested time included in the request is identified (eg, step 804).

図9は、期間指定時のデータ特定処理(ステップS706)に係るフローチャートの一例を示す図である。期間指定時のデータ特定処理については、適時、図10を用いて説明する。 FIG. 9 is a diagram showing an example of a flowchart relating to the data specifying process (step S706) when specifying a period. The data specifying process when specifying the period will be explained with reference to FIG. 10 when appropriate.

図10は、期間指定時のバックアップデータの選択の概念図である。図10(A)は、バックアップの取得時間に対して、要求された対象期間のバックアップデータを取り出す場合の例を時間軸で表す図である。図10(B)は、(A)のバックアップの特定の例に併せて、データ管理テーブル400の一部として管理し得る初回タイムスタンプ408と最終タイムスタンプ409との例を示す。 FIG. 10 is a conceptual diagram of selection of backup data when a period is specified. FIG. 10A is a diagram showing an example of retrieving backup data for a requested target period with respect to the backup acquisition time on the time axis. FIG. 10(B) shows an example of initial timestamp 408 and final timestamp 409 that can be managed as part of data management table 400 in conjunction with the particular example of backup in (A).

ステップS901では、データ管理プログラム111は、要求されたデータ(対象データ)が追記型であるか否かを判定し、追記型であると判定した場合、ステップS902に処理を移し、追記型でないと判定した場合、ステップS908に処理を移す。 In step S901, the data management program 111 determines whether or not the requested data (target data) is of the write-once type. If so, the process moves to step S908.

ステップS902では、データ管理プログラム111は、対象データにタイムスタンプカラムがあるか否かを判定し、あると判定した場合、ステップS903に処理を移し、ないと判定した場合、ステップS908に処理を移す。 In step S902, the data management program 111 determines whether or not there is a time stamp column in the target data. .

ステップS903では、データ管理プログラム111は、データ管理テーブル400の初回タイムスタンプが要求された開始日時以前、かつ、最新のバックアップデータ(ここではバックアップデータAとする)を特定する。図10の例では、対象期間が4/25~5/10であるので、初回タイムスタンプが開始日時4/24以前で最新の4/20であるレコード1001のバックアップデータが特定される。 In step S903, the data management program 111 identifies the latest backup data (here, backup data A) before the start date and time when the first time stamp of the data management table 400 is requested. In the example of FIG. 10, the target period is from 4/25 to 5/10, so the backup data of the record 1001 whose first time stamp is before the start date and time 4/24 and is the latest 4/20 is specified.

ステップS904では、データ管理プログラム111は、特定したバックアップデータについて、最終タイムスタンプが要求された終了日時以降であるか否かを判定し、以降であると判定した場合、ステップS906に処理を移し、以降でないと判定した場合、ステップS905に処理を移す。図10の例では、レコード1001の最終タイムスタンプ(2017/4/29)は、要求された終了日時(2017/5/10)以降ではないと判定される。 In step S904, the data management program 111 determines whether or not the final time stamp of the specified backup data is after the requested end date and time. If it is determined that it is not after that, the process moves to step S905. In the example of FIG. 10, it is determined that the final timestamp (2017/4/29) of record 1001 is not after the requested end date and time (2017/5/10).

ステップS905では、データ管理プログラム111は、該バックアップデータ以降にバックアップが取得されたバックアップデータについて、最終タイムスタンプが要求された終了日時以降になるまで、確認を繰り返す。 In step S905, the data management program 111 repeats confirmation of the backup data that was backed up after the backup data until the final time stamp is after the requested end date and time.

ステップS906では、データ管理プログラム111は、最終タイムスタンプが終了日時以降のバックアップデータ(ここではバックアップデータB)を特定する。図10の例では、レコード1003が、要求された終了日時(2017/5/10)以降で直近の終了タイムスタンプ(2017/5/13)を有するバックアップデータの情報である。 In step S906, the data management program 111 identifies backup data (here, backup data B) whose last time stamp is after the end date and time. In the example of FIG. 10, record 1003 is information of backup data having the latest end time stamp (May 13, 2017) after the requested end date and time (May 10, 2017).

ステップS907では、データ管理プログラム111は、最初に選択したバックアップデータAから終了日時が含まれる該バックアップデータBまでの全バックアップデータを対象として特定し、ステップS911に処理を移す。図10の例では、レコード1001とレコード1003との間にあるレコード1002のバックアップデータが特定される。なお、データ管理プログラム111は、最初に特定したバックアップデータAの最終タイムスタンプが終了日時以降の場合、該バックアップデータAのみを特定する。 In step S907, the data management program 111 specifies all the backup data from the first selected backup data A to the backup data B including the end date and time, and shifts the process to step S911. In the example of FIG. 10, the backup data of record 1002 between records 1001 and 1003 is specified. Note that the data management program 111 specifies only the backup data A when the final time stamp of the first specified backup data A is after the end date and time.

ステップS908では(データが更新型である場合、または、データが追記型であり、タイムスタンプカラムがない場合)、データ管理プログラム111は、バックアップの取得日時が、要求された開始日時以前で、かつ開始日時に最も近い日時のバックアップデータ(バックアップデータC)を特定する。 In step S908 (if the data is update type, or if the data is write-once type and there is no timestamp column), the data management program 111 determines that the backup acquisition date and time is before the requested start date and time, and The backup data (backup data C) with the closest date and time to the start date and time is specified.

ステップS909では、データ管理プログラム111は、バックアップの取得日時が、要求された終了日時以降で、かつ終了日時に最も近い日時のバックアップデータ(バックアップデータD)を特定する。 In step S909, the data management program 111 identifies the backup data (backup data D) whose backup acquisition date and time is after the requested end date and time and is closest to the end date and time.

ステップS910では、データ管理プログラム111は、特定したバックアップデータCからバックアップデータDまでの全バックアップデータを対象として特定する。 In step S910, the data management program 111 identifies all backup data from the identified backup data C to backup data D as targets.

ステップS911では、データ管理プログラム111は、特定したバックアップデータ(特定データ)に差分データがあるか否かを判定し、あると判定した場合、ステップS912に処理を移し、ないと判定した場合、ステップS913に処理を移す。 In step S911, the data management program 111 determines whether or not the specified backup data (specific data) has differential data. The process moves to S913.

ステップS912では、データ管理プログラム111は、元となるフルバックデータを特定し、期間指定時のデータ特定処理を終了する。 In step S912, the data management program 111 identifies the original fullback data, and terminates the data identification processing when specifying a period.

ステップS913では、データ管理プログラム111は、特定したバックアップデータ(特定データ)に増分データがあるか否かを判定し、あると判定した場合、ステップS914に処理を移し、ないと判定した場合、期間指定時のデータ特定処理を終了する。 In step S913, the data management program 111 determines whether or not the identified backup data (specific data) has incremental data. If yes, the process proceeds to step S914. Ends data identification processing at the time of designation.

ステップS914では、データ管理プログラム111は、フルバックアップデータと、フルバックアップデータから該データまでの増分データとを特定し、期間指定時のデータ特定処理を終了する。 In step S914, the data management program 111 identifies the full backup data and the incremental data from the full backup data to the data, and terminates the data identification processing when specifying a period.

このように、データ特定部304は、例えば、データ管理情報に基づいて、要求に含まれるデータ識別子に対応するデータの保管データがある(例えば、ステップS703で「Yes」)と判定した場合、データの保管データにタイムスタンプの情報があるか否かを判定し(例えば、ステップS902)、タイムスタンプの情報があると判定したときは、データの保管データの初回タイムスタンプが要求に含まれる開始日時以前かつ最新である第1の保管データを特定し(例えば、ステップS903)、データの保管データの最終タイムスタンプが前記要求に含まれる終了日時以降となる第2の保管データを特定し(例えば、ステップS906)、第1の保管データから第2の保管データまでの全ての保管データを特定する(例えば、ステップS907)。 In this way, for example, based on the data management information, the data identification unit 304 determines that there is stored data corresponding to the data identifier included in the request (for example, "Yes" in step S703). It is determined whether or not the stored data has timestamp information (for example, step S902). Identify the first stored data that is previous and latest (for example, step S903), and identify the second stored data whose final time stamp is later than the end date and time included in the request (for example, step S903). Step S906), specify all the stored data from the first stored data to the second stored data (eg, step S907).

また、例えば、データ特定部304は、データ管理情報に基づいて、要求に含まれる要求対象の時間に合うバックアップデータが存在するか否かを判定し(例えば、ステップS703、ステップS801~ステップS804、ステップS901~ステップS910)、存在すると判定した場合、バックアップデータの取得単位が差分バックアップであるときは、バックアップデータの直近のフルバックアップのフルバックアップデータを特定し(例えば、ステップS806、ステップS912)、バックアップデータの取得単位が増分バックアップであるときは、バックアップデータの直近のフルバックアップのフルバックアップデータと、フルバックアップデータからバックアップデータまでの増分バックアップデータと、を特定する(例えば、ステップS808、ステップS914)。 Further, for example, the data identification unit 304 determines whether or not there is backup data matching the requested time included in the request based on the data management information (for example, steps S703, steps S801 to S804, steps S901 to step S910), if it is determined that the backup data exists, and if the backup data acquisition unit is a differential backup, the full backup data of the most recent full backup of the backup data is specified (for example, steps S806 and S912), and the backup data When the unit of data acquisition is incremental backup, the full backup data of the most recent full backup of the backup data and the incremental backup data from the full backup data to the backup data are specified (for example, steps S808 and S914). .

図11は、ストレージ装置管理情報の一例(ストレージ装置管理テーブル1100)を示す図である。ストレージ装置管理テーブル1100は、データ管理DB206に含まれる。ストレージ装置管理テーブル1100は、ストレージ識別子フィールド1101、タイプフィールド1102、プロトコルフィールド1103、ディスク種別フィールド1104、および性能フィールド1105を含んで構成される。 FIG. 11 is a diagram showing an example of storage device management information (storage device management table 1100). A storage device management table 1100 is included in the data management DB 206 . The storage device management table 1100 includes a storage identifier field 1101, type field 1102, protocol field 1103, disk type field 1104, and performance field 1105. FIG.

ストレージ識別子フィールド1101は、ストレージ装置132を識別するストレージ識別子を示す情報を格納する。タイプフィールド1102は、アクセスタイプを示す情報を格納する。プロトコルフィールド1103は、対応するプロトコルを示す情報を格納する。ディスク種別フィールド1104は、構成するディスクの種別を示す情報を格納する。性能フィールド1105は、ディスクの性能(例えば、転送速度)を示す情報を格納する。これらは、管理者により設定されてもよいし、ストレージ管理ツールから取得して登録されてもよい。 The storage identifier field 1101 stores information indicating a storage identifier that identifies the storage device 132 . The type field 1102 stores information indicating the access type. The protocol field 1103 stores information indicating the corresponding protocol. The disk type field 1104 stores information indicating the type of the constituting disk. The performance field 1105 stores information indicating disk performance (for example, transfer speed). These may be set by an administrator, or may be acquired from a storage management tool and registered.

さらに、ボリューム識別子フィールド1106を設け、ボリュームの作成時に、対応するディスクの種別に併せてボリューム識別子を示す情報が登録されてもよい。 Furthermore, a volume identifier field 1106 may be provided, and information indicating the volume identifier may be registered together with the type of the corresponding disk when the volume is created.

図12は、要求レベルを満足するデータを提供できるかを確認する要求レベル確認処理(ステップS707)に係るフローチャートの一例を示す図である。 FIG. 12 is a diagram showing an example of a flowchart relating to the requested level confirmation process (step S707) for confirming whether or not data that satisfies the requested level can be provided.

ステップS1201では、データ管理プログラム111は、特定したバックアップデータについて、対象時間との時間差分を算出する。例えば、データ管理プログラム111は、要求されたデータの対象時間が日時指定である場合、特定したバックアップデータの取得日時と指定された日時との差分を算出する。また、例えば、データ管理プログラム111は、対象時間が期間指定である場合、指定された開始日時と特定したバックアップデータの最初の日時(タイムスタンプカラムがない場合はバックアップの取得日時)との差分と、指定された終了日時と特定したバックアップデータの最後の日時との差分とを算出し、差分の合計とする。 In step S1201, the data management program 111 calculates the time difference from the target time for the specified backup data. For example, when the target time of the requested data is specified by date and time, the data management program 111 calculates the difference between the acquisition date and time of the specified backup data and the specified date and time. In addition, for example, when the target time is specified for a period, the data management program 111 calculates the difference between the specified start date and time and the first date and time of the specified backup data (if there is no timestamp column, the backup acquisition date and time), and , the difference between the designated end date and time and the last date and time of the specified backup data is calculated, and the difference is taken as the total.

ステップS1202では、データ管理プログラム111は、利用要求(入力された利用条件)から要求レベルを取得する。 In step S1202, the data management program 111 acquires the requested level from the usage request (the input usage condition).

ステップS1203では、データ管理プログラム111は、時間差分が要求レベルを満たすか否かを判定し、満たすと判定した場合、ステップS1204に処理を移し、満たさないと判定した場合、ステップS1205に処理を移す。例えば、要求レベルは、低、高の2段階で設定されるものとし、判定のためのしきい値をレベル別に設ける。要求レベルが「低」の場合は、時間差分が「高」の場合より大きい第1のしきい値となり、「高」の場合は、時間差分が「低」の場合より小さい第2のしきい値となるように設定される。設定については、データ管理プログラム111の情報として予め定義されてもよいし、管理者により定義されてもよいし、ユーザにより定義されてもよい。この場合、データ管理プログラム111は、要求レベルを満たすか否かの判定は、時間差分が、要求レベルに対応するしきい値以内であるか否かを判定する。 In step S1203, the data management program 111 determines whether or not the time difference satisfies the required level. . For example, the request level is set in two stages, low and high, and a threshold for determination is provided for each level. If the request level is "low", the first threshold is higher than if the time difference is "high", and if it is "high", the second threshold is lower than if the time difference is "low". value. The settings may be defined in advance as information of the data management program 111, defined by the administrator, or defined by the user. In this case, the data management program 111 determines whether or not the required level is satisfied by determining whether the time difference is within a threshold value corresponding to the required level.

ステップS1204では、データ管理プログラム111は、要求レベルの判定結果を「満足」とし、要求レベル確認処理を終了する。 In step S1204, the data management program 111 determines that the required level determination result is "satisfactory", and terminates the required level confirmation process.

ステップS1205では、データ管理プログラム111は、要求レベルの判定結果を「不満足」とし、要求レベル確認処理を終了する。 In step S1205, the data management program 111 sets the determination result of the required level to "unsatisfactory", and terminates the required level confirmation process.

ここで要求レベルを満たさない場合は、追加の処理として、データ管理プログラム111は、データの更新記録(例えば、ジャーナルファイル)からの復元を実施してもよい。追加の処理として、データの過去の更新記録のバックアップを利用する方法がある。データ管理プログラム111は、データの過去の更新記録のバックアップが保存されていて利用可能であるか否かを判定し、利用不可である場合、要求レベルの判定結果を「不満足」とする。データ管理プログラム111は、データの更新記録が利用可能である場合、特定したバックアップデータの日時と対象日時(期間指定の場合は終了日時)との差分となっている時間帯を指定して更新記録があるかを検索する。検索の結果、差分の時間帯の更新記録があった場合は、更新記録を対象データとして、復元するように追加する。その場合、データ管理プログラム111は、適用する更新記録の最新日時と対象日時との差分を再算出し、要求レベルに対する判定を実施する。 If the required level is not satisfied here, the data management program 111 may perform restoration from the data update record (for example, journal file) as additional processing. As an additional process, there is a method of using a backup of past update records of data. The data management program 111 determines whether or not a backup of the past update record of the data is saved and is available, and if it is not available, the request level determination result is "unsatisfactory". If the data update record is available, the data management program 111 designates the time period that is the difference between the date and time of the specified backup data and the target date and time (the end date and time if the period is specified), and performs the update record. Search if there is As a result of the search, if there is an update record in the time period of the difference, the update record is added as target data so as to be restored. In this case, the data management program 111 recalculates the difference between the latest date and time of the update record to be applied and the target date and time, and determines the request level.

図13は、要求された可能待ち時間を満足するかを確認する復元時間確認処理(ステップS708)に係るフローチャートの一例を示す図である。 FIG. 13 is a diagram showing an example of a flowchart relating to the restoration time confirmation process (step S708) for confirming whether the requested possible waiting time is satisfied.

ステップS1301では、データ管理プログラム111は、特定したバックアップデータについて復元時間の算出を行う。算出処理では、例えば、データ管理プログラム111は、データ特定処理で対象と特定したバックアップデータのうち、フルバックアップデータについて、データ管理テーブル400で管理するバックアップ情報から保管先とサイズとを読み出す。データ管理プログラム111は、ストレージ装置132の構成情報(例えば、ボリューム識別子フィールド1106がある場合は、ストレージ装置管理テーブル1100)からボリュームの使用するディスクを判別し、ストレージ装置管理テーブル1100からバックアップデータの保管されているストレージ装置132の仕様のうち、ディスクの性能の情報を読み出す。データ管理プログラム111は、該当のサイズのデータを該当のディスクから読み出す時間(読出時間)を算出する(データサイズ/IOPS(Input / Output Per Second))。例えば、データ管理プログラム111は、当該復元データが格納されているストレージ装置132から管理サーバ110へのバックアップデータの転送時間を算出して読出時間に加算して復元時間とする。また、例えば、データ管理プログラム111は、復元データを所定のサーバに設ける場合、当該復元データが格納されているストレージ装置132から管理サーバ110へのバックアップデータの転送時間と、管理サーバ110から所定のサーバへの復元データの転送時間とを算出して読出時間に加算して復元時間とする。 In step S1301, the data management program 111 calculates the restoration time for the identified backup data. In the calculation process, for example, the data management program 111 reads the storage location and size from the backup information managed by the data management table 400 for the full backup data among the backup data specified as targets in the data specifying process. The data management program 111 determines the disk used by the volume from the configuration information of the storage device 132 (for example, if there is a volume identifier field 1106, the storage device management table 1100), and stores the backup data from the storage device management table 1100. The disk performance information is read out of the specifications of the storage device 132 . The data management program 111 calculates the time (read time) for reading the data of the corresponding size from the corresponding disk (data size/IOPS (Input/Output Per Second)). For example, the data management program 111 calculates the transfer time of the backup data from the storage device 132 in which the restoration data is stored to the management server 110 and adds it to the read time to obtain the restoration time. Further, for example, when restoring data to be stored in a predetermined server, the data management program 111 sets the transfer time of the backup data from the storage device 132 storing the restored data to the management server 110, and the predetermined time from the management server 110. The transfer time of the restored data to the server is calculated and added to the readout time to obtain the restoration time.

なお、算出には、ストレージ装置132のプロセッサ使用率を重み付けしてもよい。また、特定されたバックアップデータが差分バックパップまたは増分バックアップについても同様に算出する。 Note that the processor usage rate of the storage device 132 may be weighted in the calculation. Also, the specified backup data is calculated in the same way for the differential backup or the incremental backup.

ここで、復元時間の算出については、過去の履歴を使用する方法でもよい。バックアップデータを復元して提供する場合に、復元にかかった実行時間を計測し、履歴として管理(2次記憶装置203に記憶)しておく。対象として特定されたバックアップデータが履歴にある場合、計測された実行時間を読み出して、復元時間とする。複数回、復元が実行されている場合は、全ての実行時間を読み出して代表値(例えば、平均値)を算出してもよい。 Here, a method using past history may be used to calculate the restoration time. When the backup data is restored and provided, the execution time required for restoration is measured and managed as a history (stored in the secondary storage device 203). If the backup data specified as the target exists in the history, the measured execution time is read and set as the restoration time. If restoration is executed multiple times, all execution times may be read out and a representative value (for example, average value) may be calculated.

ステップS1302では、データ管理プログラム111は、利用要求(入力されたデータの利用条件)から可能待ち時間を取得する。 In step S1302, the data management program 111 acquires the possible waiting time from the usage request (use condition of the input data).

ステップS1303では、データ管理プログラム111は、算出した復元時間が可能待ち時間以内であるか否かを判定し、以内であると判定した場合、ステップS1304に処理を移し、以内でないと判定した場合、ステップS1305に処理を移す。 In step S1303, the data management program 111 determines whether or not the calculated restoration time is within the possible waiting time. The process moves to step S1305.

ステップS1304では、データ管理プログラム111は、復元時間の判定結果を「満足」とし、復元時間確認処理を終了する。 In step S1304, the data management program 111 determines that the restoration time determination result is "satisfactory", and terminates the restoration time confirmation process.

ステップS1305では、データ管理プログラム111は、復元時間の判定結果を「不満足」とし、復元時間確認処理を終了する。 In step S1305, the data management program 111 sets the restoration time judgment result as "unsatisfactory", and terminates the restoration time confirmation process.

ここで、要求レベルを満たさない場合は、追加の処理として、データ管理プログラム111は、別のバックアップデータを代替として使用可能であるか否かを判定する処理を実施してもよい。追加処理では、データ管理プログラム111は、最初に対象として特定したバックアップデータに差分バックアップデータまたは増分バックアップデータが含まれているか否かを判定する。データ管理プログラム111は、差分バックアップデータまたは増分バックアップデータが含まれていると判定した場合、フルバックアップデータに対する時間差分および復元時間を算出し直す。データ管理プログラム111は、算出し直した復元時間が要件レベルを満たすか否かを判定し、満たすと判定した場合、差分バックアップデータまたは増分バックアップデータを対象データから除き、判定結果を「満足」とする。 Here, if the required level is not satisfied, as additional processing, the data management program 111 may perform processing to determine whether or not another backup data can be used as an alternative. In the addition process, the data management program 111 determines whether or not the backup data initially identified as the target includes differential backup data or incremental backup data. When the data management program 111 determines that differential backup data or incremental backup data is included, it recalculates the time difference and restoration time with respect to the full backup data. The data management program 111 determines whether or not the recalculated restoration time satisfies the required level, and if it determines that it satisfies the requirement level, the data management program 111 excludes the differential backup data or the incremental backup data from the target data, and sets the determination result as "satisfactory". do.

図14は、データの提供の形態(提供形態)を決定する提供形態決定処理(ステップS709)に係るフローチャートの一例を示す図である。提供形態決定処理では、提供データのサイズ(容量)とネットワーク性能とに基づいて提供形態が決定される。 FIG. 14 is a diagram showing an example of a flowchart relating to the provision form determination process (step S709) for determining the form of provision of data (form of provision). In the providing form determination process, the providing form is determined based on the size (capacity) of the provided data and the network performance.

ステップS1401では、データ管理プログラム111は、提供するバックアップデータのサイズから復元した場合のデータサイズ(復元データのサイズ)を見積もる。 In step S1401, the data management program 111 estimates the data size (size of restored data) when restored from the size of the backup data to be provided.

ステップS1402では、データ管理プログラム111は、見積もったデータサイズとネットワークの性能とから転送時間(例えば、所定のサーバからクライアント端末140への転送時間)を見積もる。 In step S1402, the data management program 111 estimates transfer time (for example, transfer time from a predetermined server to the client terminal 140) from the estimated data size and network performance.

ステップS1403では、データ管理プログラム111は、転送時間の見積もりがしきい値以下であるか否かを判定し、しきい値以下であると判定した場合、ステップS1404に処理を移し、しきい値を超えると判定した場合、ステップS1405に処理を移す。 In step S1403, the data management program 111 determines whether or not the estimated transfer time is equal to or less than the threshold. If it is determined that it exceeds, the process moves to step S1405.

ステップS1404では、データ管理プログラム111は、ファイルでの提供形態(ファイル形式で提供)と決定し、提供形態決定処理を終了する。この場合、データ管理プログラム111は、データをファイルに書き出し、所定のサーバ(ファイルを利用者がアクセス可能なサーバ)に転送することになる。 In step S1404, the data management program 111 determines the form of provision as a file (provided in file format), and terminates the form of provision determination processing. In this case, the data management program 111 writes the data to a file and transfers it to a predetermined server (a server to which the user can access the file).

ステップS1405では、データ管理プログラム111は、仮想マシンでの提供形態(仮想マシン形式で提供)と決定し、提供形態決定処理を終了する。この場合、データ管理プログラム111は、仮想マシンに復元したデータを含むAP環境を構築し、仮想マシンのAPにアクセスしてデータを利用可能にし、結果の出力において、仮想マシンへのアクセス情報を出力することになる。 In step S1405, the data management program 111 determines that the provision form is a virtual machine (provided in the form of a virtual machine), and terminates the provision form determination process. In this case, the data management program 111 constructs an AP environment including the data restored to the virtual machine, accesses the AP of the virtual machine to make the data available, and outputs access information to the virtual machine in outputting the result. will do.

また、データ管理プログラム111は、提供データのセキュリティポリシーに従って提供形態を決定するようにしてもよい。セキュリティポリシーは、管理者により設定される。セキュリティポリシーとして、アクセスコントロールを行う場合、提供データを管理者側環境に配置して制御する形態、仮想マシン形態でAPに対するアクセスを制御する形態等を管理者が設定可能とする。 Also, the data management program 111 may determine the provision form according to the security policy of the provided data. A security policy is set by an administrator. When performing access control as a security policy, the administrator can set a form in which provided data is arranged and controlled in the administrator side environment, a form in which access to the AP is controlled in the form of a virtual machine, and the like.

また、利用者が提供形態を指定するインタフェースが設けられてもよく、その場合、データ管理プログラム111は、指定された形態でデータを提供する。 Also, an interface may be provided for the user to specify the form of provision, in which case the data management program 111 will provide the data in the specified form.

図15は、入出力インタフェースの一例(入出力画面1500)を示す図である。入出力画面1500の上段エリア1501は、利用者が利用要求(利用条件)を入力するエリアであり、下段エリア1502は、利用要求に対する結果を出力するエリアである。 FIG. 15 is a diagram showing an example of an input/output interface (input/output screen 1500). An upper area 1501 of the input/output screen 1500 is an area for the user to input a usage request (use conditions), and a lower area 1502 is an area for outputting the result of the usage request.

入力情報として、データ名1503、要求するデータの対象時間(期間指定1504または日時指定1505)、要求レベル1506、可能待ち時間1507がある。要求するデータの対象時間としては、ユーザは、期間指定1504または日時指定1505を選択して設定する。ここで、ユーザが日時指定1505を設定するケースとしては、例えば、当該時点のデータを再現してテストを行うケースが挙げられる。また、ユーザが期間指定1504を設定するケースとしては、例えば、期間内に更新されたデータを用いた分析を行うケースが挙げられる。 Input information includes a data name 1503 , requested data target time (specified period 1504 or date and time specified 1505 ), request level 1506 , and possible waiting time 1507 . The user selects and sets a period designation 1504 or a date and time designation 1505 as the target time of the requested data. Here, as a case where the user sets the date and time designation 1505, for example, there is a case where the data at the time point is reproduced and the test is performed. Further, as a case where the user sets the period designation 1504, for example, there is a case of performing analysis using data updated within the period.

出力情報として、提供データ名1508、提供形態1509、アクセス方法を示すアクセス先1510、要件を満たすか否かを示す要件満足レベル1511がある。要件満足レベルの付加情報として、時間の差分と提供までの時間とが出力される。 Output information includes a provided data name 1508, a providing form 1509, an access destination 1510 indicating an access method, and a requirement satisfaction level 1511 indicating whether or not requirements are satisfied. As additional information on the requirement satisfaction level, the difference in time and the time until provision are output.

要件満足レベルは、対象期間に対する提供データの時間差分から要求レベルを満たすか否かの判定を行う処理(図12)と、算出した復元時間が可能待ち時間を満たすか否かの判定を行う処理(図13)の結果をもとに決定される。ここでの要件満足レベルは、例えば、3つのレベルを設け、両方の判定結果が満足である場合、レベル「高」、どちらか一方の判定結果が満足である場合、レベル「中」、両方の判定結果とも不満足である場合、レベル「低」とする。 The requirement satisfaction level consists of a process of determining whether the required level is satisfied from the time difference of the provided data for the target period (Fig. 12) and a process of determining whether the calculated restoration time satisfies the possible waiting time ( It is determined based on the result of FIG. 13). Here, for example, three levels are provided for the requirement satisfaction level. If both judgment results are satisfied, the level is "high". If both judgment results are unsatisfactory, the level is set to "low".

なお、利用要求に対して、データを復元する前に特定したバックアップデータについて要件満足レベル(時間の差分、提供までの時間)を出力し、ユーザが確認後に復元する構成としてもよい。 In response to a usage request, the requirement satisfaction level (difference in time, time until provision) of the specified backup data before restoring the data may be output, and the restoration may be performed after confirmation by the user.

以上、上述した構成によれば、利用者からの要求に対して、保存するバックアップデータから最適なバックアップデータを特定し、利用者にデータを提供することを可能とする。例えば、データの利用要求で指定される時間断面が、バックアップの取得日時とは異なる場合でも、既存のバックアップデータの中から利用要求に合うデータを抽出することができる。また、例えば、利用要求を満たすかを示す補助情報として、指定日時との差分情報(例えば、時間の差分)と、準備目安時間(例えば、提供までの時間)とを付加して、結果を出力することを可能とする。かかる時間の差分によれば、ユーザは、提供されるデータの精度を把握できるようになる。かかる提供までの時間によれば、ユーザは、データが提供されるまでの時間を把握できるようになる。 As described above, according to the configuration described above, in response to a request from the user, it is possible to specify the optimum backup data from the stored backup data and provide the data to the user. For example, even if the time section specified in the data usage request is different from the date and time of backup acquisition, data that meets the usage request can be extracted from the existing backup data. Also, for example, as auxiliary information indicating whether the usage request is satisfied, difference information from the specified date and time (e.g., time difference) and estimated preparation time (e.g., time until provision) are added, and the result is output. make it possible to Such time difference allows the user to grasp the accuracy of the data provided. According to the time until provision, the user can grasp the time until the data is provided.

本実施の形態によれば、様々な種類の記憶装置に様々なタイミングで保存された保管データについて、時間情報、保管場所情報などを管理することで、利用単位にあった適切な保管データを適切な単位で提供することを可能にする。また、業務APが生成するデータへの利用要求に対して、別のストレージ装置に保管された保管データを使用して、利用要件にあった保管データを特定して提供することで、業務APの稼動への影響を回避できるようになる。 According to the present embodiment, by managing time information, storage location information, etc., for storage data stored in various types of storage devices at various timings, appropriate storage data that matches the unit of use can be obtained. It allows us to provide in small units. In addition, in response to a usage request for data generated by a business application, stored data stored in a separate storage device can be used to specify and provide stored data that meets the usage requirements. It becomes possible to avoid the influence on the operation.

(2)第2の実施の形態
本実施の形態では、データを要求する単位に対して、複数のデータを含むケースについて説明する。本実施の形態では、第1の実施の形態と異なる構成について主に説明する。
(2) Second Embodiment In this embodiment, a case will be described in which a plurality of pieces of data are included in a unit requesting data. In this embodiment, a configuration different from that of the first embodiment is mainly described.

図16は、第1の実施の形態の管理情報に追加して本実施の形態で管理する業務データ管理情報の一例(業務データ管理テーブル1600)を示す。業務データ管理テーブル1600は、データ管理DB206に含まれる。業務データ管理テーブル1600は、業務識別子フィールド1601、データ項目名フィールド1602、APフィールド1603、およびAP内データ識別子フィールド1604を含んで構成される。 FIG. 16 shows an example of business data management information (business data management table 1600) managed in this embodiment in addition to the management information of the first embodiment. A business data management table 1600 is included in the data management DB 206 . The business data management table 1600 includes a business identifier field 1601 , data item name field 1602 , AP field 1603 , and intra-AP data identifier field 1604 .

業務識別子フィールド1601は、業務を識別可能な業務識別子を示す情報を格納する。データ項目名フィールド1602は、データの項目名を示す情報を格納する。APフィールド1603は、APとそのタイプを識別する情報とを格納する。AP内データ識別子フィールド1604は、AP内でのデータを識別する識別子(業務に係るデータを識別するデータ識別子)を示す情報を格納する。 The business identifier field 1601 stores information indicating a business identifier that can identify a business. The data item name field 1602 stores information indicating the item name of data. AP field 1603 stores information identifying the AP and its type. The intra-AP data identifier field 1604 stores information that indicates an identifier that identifies data within the AP (data identifier that identifies business-related data).

本実施の形態では、利用者は、利用条件の入力時に業務名(業務識別子)を指定する。データ管理プログラム111は、業務データ管理テーブル1600を検索して、一致する業務識別子を特定する。データ管理プログラム111は、業務識別子に対応するデータ項目名と、APと、AP内データ識別子とを特定する。データ管理プログラム111は、特定したAP内データ識別子をデータ名(データ識別子)として、データ管理テーブル400を検索し(ステップS702)、以降の処理を同様に実施する。なお、時間要件の指定については第1の実施の形態と同様である。 In this embodiment, the user designates a business name (business identifier) when entering usage conditions. The data management program 111 searches the business data management table 1600 to identify a matching business identifier. The data management program 111 identifies the data item name corresponding to the business identifier, the AP, and the intra-AP data identifier. The data management program 111 searches the data management table 400 using the identified intra-AP data identifier as a data name (data identifier) (step S702), and similarly performs subsequent processing. Designation of the time requirement is the same as in the first embodiment.

このように、データ特定部304は、業務データ管理情報に基づいて、要求に含まれる業務識別子に対応するデータ識別子を特定し、データ管理情報に基づいて、特定したデータ識別子に対応するデータの保管データがあるか否かを判定する。 In this way, the data identification unit 304 identifies the data identifier corresponding to the business identifier included in the request based on the business data management information, and stores the data corresponding to the identified data identifier based on the data management information. Determine whether or not there is data.

以上により、データを要求する単位を業務として、複数のデータを含む場合においても、利用者が業務名を指定することで、複数のデータについて、それぞれ必要な時間のデータを提供することが可能になる。 As a result, even if the data request unit is business and multiple data are included, the user can specify the business name to provide the data at the required time for each of the multiple data. Become.

次に、利用単位に対する複数のデータのバックアップが仕様の異なるストレージ装置132に保管されている場合の処理を説明する。 Next, a process when a plurality of data backups for a usage unit are stored in storage devices 132 with different specifications will be described.

図16の例では、同じ業務識別子に対応するデータが異なるAPであり、バックアップデータは異なるストレージ装置132に保管されているものとする。ここで、第1の実施の形態の図11に示したストレージ装置管理テーブル1100に登録されているストレージ装置132の仕様を参照する。例えば、顧客DBのバックアップデータは、ストレージAに保管され、在庫DBのバックアップデータは、ストレージBに保管されているものとする。この場合、SDSシステム130では、バックアップデータを取り出すとき、異なるプロトコルに対して、プロトコル変換を行い、共通のプロトコル(同じ形式)で取り出す。例えば、ブロックストレージに保管された顧客DBのバックアップデータをファイルとして取り出し、ファイルストレージに保管された在庫DBのバックアップデータは、そのままファイルとして取り出す。共通のプロトコルで取り出すことで、業務単位で必要となる複数のデータをまとめて提供することができる。 In the example of FIG. 16, it is assumed that the data corresponding to the same business identifier are from different APs and the backup data are stored in different storage devices 132 . Here, refer to the specifications of the storage device 132 registered in the storage device management table 1100 shown in FIG. 11 of the first embodiment. For example, it is assumed that the backup data of the customer DB is stored in the storage A, and the backup data of the inventory DB is stored in the storage B. In this case, the SDS system 130 performs protocol conversion for different protocols when retrieving backup data, and retrieves it in a common protocol (same format). For example, the backup data of the customer DB stored in the block storage is taken out as a file, and the backup data of the stock DB stored in the file storage is taken out as a file as it is. By retrieving with a common protocol, it is possible to collectively provide multiple pieces of data required for each business.

(3)第3の実施の形態
本実施の形態では、バックアップデータのストレージ装置132への配置を制御する方法について説明する。本実施の形態では、上述した実施の形態と異なる構成について主に説明する。
(3) Third Embodiment In the present embodiment, a method for controlling placement of backup data in the storage device 132 will be described. In this embodiment, a configuration different from that of the above-described embodiment will be mainly described.

SDSシステム130では、多種のストレージ装置132を仮想化して管理し、ストレージ装置132のディスクの性能別に階層を設け、階層間のデータ移行を行う階層制御機能(階層制御部)を提供する。管理サーバ110(データ管理プログラム111の図示は省略するデータ移行部)は、バックアップデータの使用履歴に基づいて、バックアップデータの保管先に対するデータ移行をSDSシステム130の階層制御機能に要求する。 The SDS system 130 virtualizes and manages various storage devices 132, provides tiers according to disk performance of the storage devices 132, and provides a tier control function (hierarchy control unit) for migrating data between tiers. The management server 110 (data migration unit not shown in the data management program 111) requests the hierarchical control function of the SDS system 130 to migrate data to the storage destination of the backup data based on the usage history of the backup data.

図17は、ストレージ階層管理情報の一例(ストレージ階層管理テーブル1700)を示す図である。ストレージ階層管理テーブル1700は、データ管理DB206に含まれる。ストレージ階層管理テーブル1700は、レベルフィールド1701、ストレージ識別子フィールド1702、ディスクフィールド1703、性能フィールド1704、および空き容量フィールド1705を含んで構成される。 FIG. 17 is a diagram showing an example of storage tier management information (storage tier management table 1700). A storage tier management table 1700 is included in the data management DB 206 . The storage tier management table 1700 includes a level field 1701 , a storage identifier field 1702 , a disk field 1703 , a performance field 1704 and a free space field 1705 .

レベルフィールド1701は、階層のレベルを示す情報を格納する。ストレージ識別子フィールド1702は、管理対象のストレージ装置132を識別するストレージ識別子を示す情報を格納する。ディスクフィールド1703は、ディスクの種別を示す情報を格納する。性能フィールド1704は、ディスクの性能(例えば、転送速度(MB/s))を示す情報を格納する。空き容量フィールド1705は、ディスクの空き容量を示す情報を格納する。 A level field 1701 stores information indicating the level of the hierarchy. The storage identifier field 1702 stores information indicating a storage identifier that identifies the storage device 132 to be managed. The disk field 1703 stores information indicating the type of disk. The performance field 1704 stores information indicating disk performance (eg, transfer rate (MB/s)). The free capacity field 1705 stores information indicating the free capacity of the disk.

レベルに対するストレージ装置132、ディスクの割当については、管理者またはシステムにより事前に設定される。性能、空き容量については、管理サーバ110が定期的にSDSシステム130または各ストレージ装置132から情報を取得して登録し、例えば、平均転送速度、取得時点での空き容量が管理される。階層は、例えば、性能のよい順に高、中、低の3階層とし、それぞれレベル1、2、3としてレベルフィールド1701で管理される。 The assignment of storage devices 132 and disks to levels is set in advance by an administrator or system. Regarding performance and free space, the management server 110 periodically acquires and registers information from the SDS system 130 or each storage device 132, and for example, average transfer speed and free space at the time of acquisition are managed. Hierarchies are, for example, three hierarchies of high, medium, and low in descending order of performance, which are managed in the level field 1701 as levels 1, 2, and 3, respectively.

管理サーバ110(データ管理プログラム111の図示は省略する記憶部)は、バックアップデータを使用したデータの提供時に復元までの実行時間を計測し、履歴として管理(2次記憶装置に記憶)する。本実施の形態では、管理サーバ110は、バックアップデータを使用する際の利用条件である可能待ち時間についても履歴として記録(記憶)する。管理サーバ110は、バックアップデータ毎に提供のために使用した履歴を管理する。管理サーバ110は、期間要求に併せて提供データのサイズが異なる場合であっても、バックアップからの復元時間はバックアップデータ全体に対して行うため、その際にかかった時間を記録する。なお、記録については、本実施の形態では、使用履歴管理情報として登録する。 The management server 110 (not shown storage unit of the data management program 111) measures the execution time until restoration when providing data using backup data, and manages (stores in the secondary storage device) as a history. In this embodiment, the management server 110 also records (stores) the possible waiting time, which is a usage condition when using backup data, as a history. The management server 110 manages the history used for providing each piece of backup data. Even if the size of the provided data differs according to the period request, the management server 110 records the time taken to restore the entire backup data from the backup. Note that the record is registered as use history management information in the present embodiment.

図18は、使用履歴管理情報の一例(使用履歴管理テーブル1800)を示す図である。使用履歴管理テーブル1800は、データ管理DB206に含まれる。使用履歴管理テーブル1800は、バックアップ識別子フィールド1801、使用日時フィールド1802、復元時間フィールド1803、可能待ち時間フィールド1804を含んで構成される。なお、記録は、テーブルへの出力(登録)に限られるものではなく、ログファイル等への出力であってもよい。 FIG. 18 is a diagram showing an example of usage history management information (usage history management table 1800). A usage history management table 1800 is included in the data management DB 206 . The usage history management table 1800 includes a backup identifier field 1801 , a usage date/time field 1802 , a restoration time field 1803 and a possible waiting time field 1804 . Note that the recording is not limited to the output (registration) to the table, and may be the output to a log file or the like.

バックアップ識別子フィールド1801は、バックアップデータを識別するバックアップ識別子(保管識別子)を示す情報を格納する。使用日時フィールド1802は、復元に使用した日時を示す情報を格納する。復元時間フィールド1803は、バックアップデータの復元に要した時間を示す情報を格納する。可能待ち時間フィールド1804は、要求時に指定された可能待ち時間を示す情報を格納する。 The backup identifier field 1801 stores information indicating a backup identifier (storage identifier) that identifies backup data. The date and time of use field 1802 stores information indicating the date and time used for restoration. The restore time field 1803 stores information indicating the time required to restore the backup data. Possible wait time field 1804 stores information indicating the possible wait time specified in the request.

管理サーバ110では、バックアップデータ毎の使用頻度が予め設定した一定レベル(例えば、1回/週)以上になった場合、要求された可能待ち時間の平均と復元時間の平均とを算出し、可能待ち時間に対する復元時間の時間差分を算出する。管理サーバ110は、差分が予め設定した上限基準値以上(復元時間が可能待ち時間より長い)の場合、該バックアップデータが保管される階層を、現在の階層より高い階層がある場合、ストレージ階層管理テーブル1700を参照し、空き容量を確認する。管理サーバ110は、バックアップデータのサイズ(データ管理テーブル400参照)以上の空き容量がある場合、該階層にデータを移行するようにSDSシステム130に指示を出す。 In the management server 110, when the frequency of use of each piece of backup data reaches a predetermined level (for example, once/week) or more, the average requested waiting time and the average restoration time are calculated. Calculate the time difference of the restoration time with respect to the waiting time. If the difference is equal to or greater than a preset upper limit reference value (the restoration time is longer than the possible waiting time), the management server 110 selects the tier in which the backup data is stored. Refer to the table 1700 to check the free space. The management server 110 instructs the SDS system 130 to migrate the data to the tier when there is free space equal to or greater than the size of the backup data (see the data management table 400).

管理サーバ110は、算出した差分が予め設定した下限基準値以下(復元時間が可能待ち時間より短い)の場合、該バックアップデータが保管される階層を、現在の階層より低い階層がある場合、ストレージ階層管理テーブル1700を参照し、当該階層のストレージ装置132(ディスク)の空き容量を確認する。また、管理サーバ110は、当該階層のストレージ装置132の性能(転送速度)を参照して、バックアップデータのサイズ(データ管理テーブル400参照)から、復元した場合の復元時間を算出し、平均可能待ち時間内に収まるかを確認する。管理サーバ110は、空き容量があり、復元時間が収まる場合、該階層のストレージ装置132にデータを移行する。 If the calculated difference is equal to or less than a preset lower limit reference value (restoration time is shorter than the possible waiting time), the management server 110 selects the tier in which the backup data is stored. The tier management table 1700 is referenced to check the free space of the storage device 132 (disk) of the tier. In addition, the management server 110 refers to the performance (transfer speed) of the storage device 132 of the relevant tier, calculates the restoration time in the case of restoration from the size of the backup data (see the data management table 400), and calculates the average possible waiting time. Make sure it fits in time. The management server 110 migrates the data to the storage device 132 of the tier if there is free space and the restoration time is within the time limit.

このように、データ移行部は、例えば、ストレージ装置管理情報と、記憶部に記憶されている情報(使用履歴管理情報)とに基づいて、復元に要した時間が可能待ち時間よりも長い保管データを格納するディスクよりも性能の高いディスクに保管データを移行する処理、および/または、復元に要した時間が可能待ち時間よりも短い保管データを格納するディスクよりも性能の低いディスクに保管データを移行する処理を行う。 In this way, the data migration unit, for example, based on the storage device management information and the information (usage history management information) stored in the storage unit, restores the stored data whose restoration time is longer than the possible waiting time. The process of migrating the saved data to a disk with higher performance than the disk that stores the saved data, and/or the time required for restoration is shorter than the waiting time. Perform migration processing.

本実施の形態では、利用者の要求を満たすように保管データの配置を適切に実行し、ストレージ装置132の効率利用を可能とする。 In this embodiment, storage data is arranged appropriately so as to satisfy the user's request, and efficient use of the storage device 132 is made possible.

(4)第4の実施の形態
本実施の形態では、バックアップデータの利用履歴に基づいて、バックアップの取得を制御する方法について説明する。本実施の形態では、上述した実施の形態と異なる構成について主に説明する。
(4) Fourth Embodiment In this embodiment, a method of controlling backup acquisition based on the usage history of backup data will be described. In this embodiment, a configuration different from that of the above-described embodiment will be mainly described.

SDSシステム130においては、ボリュームのスナップショット機能、ローカル装置または別装置へボリュームをコピーするコピー機能を提供する。バックアップの実行頻度、保管先等は、管理者がバックアップ管理手段(ソフトウェア等)に設定し、バックアップ管理手段が設定に基づいてSDSシステム130のスナップショット機能またはコピー機能を実行する。管理サーバ110(データ管理プログラム111の図示は省略する処理部)は、定期的に使用履歴から、バックアップデータの保管先、フルバックアップの取得間隔を判断し、バックアップ実行手段に対して、要求を送信することで、バックアップの取得に係る制御を行う。 The SDS system 130 provides a volume snapshot function and a copy function for copying a volume to a local device or another device. The backup execution frequency, storage destination, etc. are set in the backup management means (software etc.) by the administrator, and the backup management means executes the snapshot function or copy function of the SDS system 130 based on the settings. The management server 110 (not shown processing unit of the data management program 111) periodically determines the backup data storage destination and full backup acquisition interval from the usage history, and sends a request to the backup execution means. By doing so, control related to backup acquisition is performed.

管理サーバ110は、保管先の判断では、第3の実施の形態で示したバックアップデータの使用履歴から、使用頻度と平均復元時間とを算出する。管理サーバ110は、使用頻度が基準値以上の高頻度であり、かつ、平均復元時間が基準値以上である場合、保管先として最も高い階層(レベル1)を選択する。また、管理サーバ110は、使用頻度が基準値以上であり、平均復元時間が基準値未満である場合、または、使用頻度が基準値未満であり、平均復元時間が基準値以上である場合、中間の階層(レベル2)を選択する。また、管理サーバ110は、使用頻度が基準値未満であり、かつ、平均復元時間が基準値未満である場合、最も低い階層(レベル3)を選択する。管理サーバ110は、選択した階層(レベル)に複数のストレージ装置132がある場合、例えば、空き容量がバックアップデータのサイズより大きく、最も空き容量が大きいストレージ装置132を保管先として選択する。管理サーバ110は、空き容量がバックアップデータのサイズより大きなストレージ装置132がない場合、1段低い階層のストレージ装置132から選択してもよい。 The management server 110 calculates the usage frequency and the average restoration time from the usage history of the backup data shown in the third embodiment in determining the storage destination. The management server 110 selects the highest tier (level 1) as the storage destination when the usage frequency is higher than the reference value and the average restoration time is higher than the reference value. In addition, if the frequency of use is equal to or greater than the reference value and the average restoration time is less than the reference value, or if the frequency of use is less than the reference value and the average restoration time is equal to or greater than the reference value, the management server 110 hierarchy (level 2). Also, the management server 110 selects the lowest tier (level 3) when the frequency of use is less than the reference value and the average restoration time is less than the reference value. If there are multiple storage devices 132 in the selected tier (level), the management server 110 selects, for example, the storage device 132 with the largest free space that is larger than the size of the backup data as the storage destination. If there is no storage device 132 whose free space is larger than the size of the backup data, the management server 110 may select from the storage device 132 in the lower tier.

なお、管理サーバ110は、バックアップデータの使用履歴から平均復元時間を算出して、使用頻度を用いることなく、保管先を判断してもよい。 Note that the management server 110 may calculate the average restoration time from the usage history of the backup data and determine the storage destination without using the usage frequency.

さらに、管理サーバ110では、使用履歴をもとに、バックアップデータの取得間隔を判断する。管理サーバ110は、バックアップデータ別に使用頻度を算出する。ここでは、バックアップデータの取得単位を元に、フルバックアップデータに関連する差分バックアップデータ、増分バックアップデータを識別する。 Furthermore, the management server 110 determines the backup data acquisition interval based on the usage history. The management server 110 calculates the frequency of use for each piece of backup data. Here, differential backup data and incremental backup data related to full backup data are identified based on the unit of backup data acquisition.

管理サーバ110は、フルバックアップデータの使用頻度が基準値以下である場合、フルバックアップデータ、差分バックアップデータまたは増分バックアップデータの間隔を長くする。長くする割合としては、予め決めた値を設定してもよいし、使用頻度に併せて割合を決定してもよい。 When the frequency of use of full backup data is equal to or less than the reference value, the management server 110 lengthens the interval between full backup data, differential backup data, or incremental backup data. As the lengthening rate, a predetermined value may be set, or the rate may be determined according to the frequency of use.

管理サーバ110は、差分バックアップデータまたは増分バックアップデータの使用頻度が基準値以上であり、差分バックアップデータまたは増分バックアップからの平均復元時間が基準値以上である場合、フルバックアップの取得間隔を短くする。短くする割合については、予め決めた値を設定してもよいし、差分バックアップまたは増分バックアップの間隔として、差分バックアップまたは増分バックアップ間隔を併せて短くしてもよい。使用頻度の比較では、フルバックアップデータのみの使用頻度と差分バックアップデータまたは増分バックアップデータの使用頻度とを比較してもよい。差分バックアップデータまたは増分バックアップデータの使用頻度の方がフルバックアップのみより多い場合、上記を設定する。 The management server 110 shortens the full backup acquisition interval when the frequency of use of the differential backup data or the incremental backup data is equal to or higher than the reference value and the average restoration time from the differential backup data or the incremental backup is equal to or higher than the reference value. A predetermined value may be set for the rate of shortening, or the differential backup or incremental backup interval may be shortened together as the differential backup or incremental backup interval. In comparing the usage frequencies, the usage frequency of only full backup data and the usage frequency of differential backup data or incremental backup data may be compared. If differential backup data or incremental backup data is used more frequently than full backup only, set the above.

管理サーバ110は、差分バックアップデータまたは増分バックアップデータの使用頻度が基準値以上で、差分バックアップまたは増分バックアップからの平均復元時間が基準値未満である場合、差分バックアップまたは増分バックアップの取得間隔を短くする。この場合、フルバックアップの間隔は変更しない。 When the frequency of use of differential backup data or incremental backup data is equal to or greater than the reference value and the average restoration time from the differential backup or incremental backup is less than the reference value, the management server 110 shortens the differential backup or incremental backup acquisition interval. . In this case, do not change the full backup interval.

それ以外の場合は、フルバックアップ、差分バックアップまたは増分バックアップとも取得間隔を変更しない。 Otherwise, do not change the acquisition interval for full backup, differential backup, or incremental backup.

ここで、基準値については、予め管理者またはシステムにより設定された値を使用する。平均復元時間に対する基準値については、使用履歴から要求された可能待ち時間の平均値を使用してもよい。 Here, for the reference value, a value set in advance by an administrator or system is used. For the reference value for the average recovery time, the average possible waiting time requested from the usage history may be used.

このように、処理部は、例えば、記憶部に記憶されている情報から算出した保管データの復元に要した時間の代表値(例えば、平均復元時間)に基づいて、保管データの保管先を変更する処理、および/または、記憶部に記憶されている情報(使用履歴管理情報)から算出した保管データが使用される頻度に基づいて、保管データを取得する間隔を変更する処理を行う。 In this way, the processing unit changes the storage destination of the stored data based on, for example, the representative value of the time required to restore the stored data calculated from the information stored in the storage unit (for example, the average restoration time). and/or change the interval for acquiring the stored data based on the frequency of use of the stored data calculated from the information (usage history management information) stored in the storage unit.

本実施の形態によれば、保管データの使用状況に併せて、提供にかかる復元時間を考慮してデータの精度を向上できるよう、保管データの取得に係る制御を行うことを可能にする。 According to the present embodiment, it is possible to control the acquisition of stored data so that the accuracy of data can be improved in consideration of the restoration time required for provision in accordance with the usage status of stored data.

なお、第3の実施の形態、第4の実施の形態については、バックアップデータが本来の使用目的である障害時のデータ回復時に使用についても、要求される復元時間を満たす必要がある。よって、管理サーバ110がバックアップデータの配置、取得頻度の制御を行ってよいかどうかをAP毎に管理者が設定してもよい。その場合、制御が許可された場合のみ上記の制御を実行する。 It should be noted that in the third and fourth embodiments, it is necessary to satisfy the required restoration time even for data recovery in the event of a failure, which is the original purpose of the backup data. Therefore, the administrator may set for each AP whether or not the management server 110 may control the arrangement and acquisition frequency of backup data. In that case, the above control is executed only when the control is permitted.

(5)他の実施の形態
なお上述の実施の形態においては、本発明をデータ管理システムに適用するようにした場合について述べたが、本発明はこれに限らず、この他種々のシステム、装置、方法、プログラムに広く適用することができる。
(5) Other Embodiments In the above-described embodiments, the case of applying the present invention to a data management system was described, but the present invention is not limited to this, and various other systems and devices can be used. , methods and programs.

また上述の実施の形態においては、説明の便宜上、XXテーブル、XXファイルを用いて各種のデータを説明したが、データ構造は限定されるものではなく、XX情報などと表現してもよい。 In the above-described embodiment, for convenience of explanation, XX tables and XX files have been used to describe various types of data, but the data structure is not limited and may be expressed as XX information or the like.

また、上記の説明において各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記憶装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。 In the above description, information such as programs, tables, and files that implement each function are stored in memory, hard disks, SSD (Solid State Drives), and other storage devices, or IC cards, SD cards, DVDs, and other recording media. can be placed in

また上述した構成については、本発明の要旨を超えない範囲において、適宜に、変更したり、組み替えたり、組み合わせたり、省略したりしてもよい。 Moreover, the above-described configurations may be appropriately changed, rearranged, combined, or omitted within the scope of the present invention.

100……データ管理システム、110……管理サーバ、120……ホスト計算機、130……SDSシステム、140……クライアント端末。 100... Data management system, 110... Management server, 120... Host computer, 130... SDS system, 140... Client terminal.

Claims (10)

複数のストレージ装置を含んで構成されるデータ管理システムであって、
要求対象の時間を示す情報と、要求対象のデータを識別するデータ識別子を示す情報と、要求対象の精度に関する要求レベルの情報とが含まれる要求を受け付ける要求受付部と、
データを保管するための保管データが取得された時間を示す情報と、前記保管データが格納されるストレージ装置を示す情報とが対応付けられているデータ管理情報に基づいて、前記複数のストレージ装置に記憶される保管データの中から、前記要求受付部により受け付けられた要求に含まれる要求対象の時間に合う保管データを特定するデータ特定部と、
前記データ管理情報に基づいて、前記データ特定部により特定された保管データについて、前記要求に含まれる要求対象の時間との時間差分を算出し、算出した時間差分が前記要求に含まれる要求レベルを満たすか否かを評価するデータ評価部と、
前記データ特定部による特定結果を出力する出力部と、
を備えることを特徴とするデータ管理システム。
A data management system comprising a plurality of storage devices,
a request receiving unit that receives a request containing information indicating the requested time, information indicating a data identifier for identifying the requested data, and request level information regarding the accuracy of the requested target ;
based on data management information in which information indicating a time when storage data for storing data is acquired and information indicating a storage device in which the storage data is stored are associated with each other; a data identification unit that identifies, from among the stored data stored, storage data matching the requested time included in the request received by the request reception unit;
calculating a time difference between the storage data specified by the data specifying unit and the requested time included in the request based on the data management information, and calculating the request level included in the request based on the calculated time difference; a data evaluation unit that evaluates whether or not the
an output unit that outputs a result of identification by the data identification unit;
A data management system comprising:
前記データ管理情報には、データを識別する識別子を示す情報が更に対応付けられて含まれ、
前記要求に含まれる要求対象の時間を示す情報として、データを要求する日時を示す情報が指定され、
前記要求には、要求対象のデータを識別する識別子を示す情報が更に含まれ、
前記データ特定部は、前記データ管理情報に基づいて、前記要求に含まれるデータ識別子に対応するデータの保管データがあると判定した場合、前記要求に含まれる要求対象の時間と一致する保管データが存在するか否かを判定し、存在すると判定したときは、前記保管データを特定し、存在しないと判定したときは、前記要求に含まれる要求対象の時間に最も近い日時の保管データを特定する、
ことを特徴とする請求項1に記載のデータ管理システム。
The data management information further includes information indicating an identifier that identifies data in association with it,
Information indicating a date and time for requesting data is specified as information indicating the time of the request target included in the request,
The request further includes information indicating an identifier that identifies the requested data,
When the data identification unit determines that there is storage data of data corresponding to the data identifier included in the request based on the data management information, the storage data matching the requested time included in the request does not exist. Determine whether or not it exists, and if it is determined that it exists, specify the stored data, and if it is determined that it does not exist, specify the stored data that has the closest date and time to the requested time included in the request. ,
The data management system according to claim 1, characterized by:
前記データ管理情報には、データを識別する識別子を示す情報と、保管データ内の最初のタイムスタンプである初回タイムスタンプおよび前記保管データ内の最後のタイムスタンプである最終タイムスタンプの情報とが更に対応付けられ、
前記要求に含まれる要求対象の時間を示す情報として、データを要求する期間を示す開始日時と終了日時との情報が指定され、
前記要求には、要求対象のデータを識別する識別子を示す情報が更に含まれ、
前記データ特定部は、前記データ管理情報に基づいて、前記要求に含まれるデータ識別子に対応するデータの保管データがあると判定した場合、前記データの保管データにタイムスタンプの情報があるか否かを判定し、タイムスタンプの情報があると判定したときは、前記データの保管データの初回タイムスタンプが前記要求に含まれる開始日時以前かつ最新である第1の保管データを特定し、前記データの保管データの最終タイムスタンプが前記要求に含まれる終了日時以降となる第2の保管データを特定し、前記第1の保管データから前記第2の保管データまでの全ての保管データを特定する、
ことを特徴とする請求項1に記載のデータ管理システム。
The data management information further includes information indicating an identifier for identifying data, and information of an initial time stamp that is the first time stamp in the stored data and a final time stamp that is the last time stamp in the stored data. is associated with
Information of a start date and time and an end date and time indicating a period for requesting data is specified as information indicating the requested time included in the request,
The request further includes information indicating an identifier that identifies the requested data,
The data identification unit determines whether or not the stored data of the data has time stamp information when determining that there is stored data of the data corresponding to the data identifier included in the request based on the data management information. is determined, and when it is determined that there is time stamp information, the first stored data whose initial time stamp is before the start date and time included in the request and is the latest is specified, and Identifying second stored data whose final time stamp is later than the end date and time included in the request, and identifying all stored data from the first stored data to the second stored data;
The data management system according to claim 1, characterized by:
前記データ管理情報には、保管データの取得単位として、全てのデータをバックアップするフルバックアップ、フルバックアップからの差分をバックアップする差分バックアップ、または前回のバックアップからの変更分をバックアップする増分バックアップを示す取得単位の情報が更に対応付けられて含まれ、
前記データ特定部は、前記データ管理情報に基づいて、前記要求に含まれる要求対象の時間に合うバックアップデータが存在するか否かを判定し、存在すると判定した場合、前記バックアップデータの取得単位が差分バックアップであるときは、前記バックアップデータの直近のフルバックアップのフルバックアップデータを特定し、前記バックアップデータの取得単位が増分バックアップであるときは、前記バックアップデータの直近のフルバックアップのフルバックアップデータと、前記フルバックアップデータから前記バックアップデータまでの増分バックアップデータと、を特定する、
ことを特徴とする請求項1に記載のデータ管理システム。
In the data management information, acquisition indicating a full backup for backing up all data, a differential backup for backing up the difference from the full backup, or an incremental backup for backing up the changed portion from the previous backup, as a unit for acquiring stored data. Unit information is further associated and included,
Based on the data management information, the data specifying unit determines whether or not there exists backup data matching the requested time included in the request. when it is a backup, full backup data of the most recent full backup of the backup data is specified, and when the acquisition unit of the backup data is an incremental backup, full backup data of the most recent full backup of the backup data; identifying incremental backup data from said full backup data to said backup data;
The data management system according to claim 1, characterized by:
前記要求には、要求対象のデータを識別するデータ識別子を示す情報と、要求対象の可能待ち時間の情報とが更に含まれ、
前記データ特定部により特定された保管データの復元にかかる時間を算出し、算出した復元にかかる時間が前記要求に含まれる可能待ち時間以内であるか否かを評価するデータ評価部を備える、
ことを特徴とする請求項1に記載のデータ管理システム。
The request further includes information indicating a data identifier that identifies the data to be requested and information on possible waiting time of the requested data,
a data evaluation unit that calculates the time required to restore the stored data identified by the data identification unit and evaluates whether the calculated restoration time is within the possible waiting time included in the request;
The data management system according to claim 1, characterized by:
前記データ管理情報には、データを識別する識別子を示す情報が更に対応付けられ、
前記要求には、業務を識別可能な業務識別子を示す情報が更に含まれ、
前記データ特定部は、業務を識別可能な業務識別子を示す情報と、前記業務に係るデータを識別するデータ識別子を示す情報とが対応付けられている業務データ管理情報に基づいて、前記要求に含まれる業務識別子に対応するデータ識別子を特定し、前記データ管理情報に基づいて、特定したデータ識別子に対応するデータの保管データがあるか否かを判定する、
ことを特徴とする請求項1に記載のデータ管理システム。
Information indicating an identifier for identifying data is further associated with the data management information,
The request further includes information indicating a business identifier that can identify the business,
The data identification unit is configured to, based on business data management information in which information indicating a business identifier capable of identifying a business and information indicating a data identifier identifying data related to the business are associated with each other, identifying a data identifier corresponding to the business identifier that is stored, and determining whether or not there is stored data corresponding to the identified data identifier based on the data management information;
The data management system according to claim 1, characterized by:
前記出力部は、ストレージ装置を識別可能な情報と、前記ストレージ装置のプロトコルを示す情報とが対応付けられているストレージ装置管理情報に基づいて、前記データ特定部により特定された保管データが異なるプロトコルのストレージ装置から特定された場合、プロトコルの変換を行い、同じ形式の保管データとして出力する、
ことを特徴とする請求項1に記載のデータ管理システム。
The output unit uses a different protocol for the storage data specified by the data specifying unit based on storage device management information in which information that can identify a storage device and information indicating a protocol of the storage device are associated. If it is identified from the storage device of , convert the protocol and output as stored data in the same format
The data management system according to claim 1, characterized by:
前記要求には、要求対象のデータを識別するデータ識別子を示す情報と、要求対象の可能待ち時間を示す情報とが含まれ、
前記データ特定部により特定された保管データを識別する保管識別子を示す情報と、前記出力部が前記保管データの復元に要した時間を示す情報と、前記要求に含まれる可能待ち時間を示す情報とを対応付けて記憶する記憶部と、
ストレージ装置を識別可能な情報と、前記ストレージ装置に設けられる保管データを格納するディスクを示す情報と前記ディスクの性能を示す情報とが対応付けられているストレージ装置管理情報と、前記記憶部に記憶されている情報とに基づいて、復元に要した時間が可能待ち時間よりも長い保管データを格納するディスクよりも性能の高いディスクに前記保管データを移行する処理、および/または、復元に要した時間が可能待ち時間よりも短い保管データを格納するディスクよりも性能の低いディスクに前記保管データを移行する処理を行うデータ移行部と、を備える、
ことを特徴とする請求項1に記載のデータ管理システム。
The request includes information indicating a data identifier that identifies requested data and information indicating a possible waiting time for the requested object,
information indicating a storage identifier that identifies the storage data specified by the data specifying unit; information indicating the time required for the output unit to restore the storage data; information indicating a possible waiting time included in the request; a storage unit that associates and stores
Storage device management information in which information that can identify a storage device, information that indicates a disk that stores storage data provided in the storage device, and information that indicates the performance of the disk are associated, and stored in the storage unit. Based on this information, the time required for restoration is longer than the possible waiting time, and/or the process of migrating the saved data to a disk with higher performance than the disk storing the saved data, and/or the time required for restoration. a data migration unit that performs a process of migrating the stored data to a disk having performance lower than the disk storing the stored data whose time is shorter than the possible waiting time;
The data management system according to claim 1, characterized by:
前記データ特定部により特定された保管データを識別する保管識別子を示す情報と、前記出力部が前記保管データの復元に要した時間を示す情報と、前記保管データが取得された時間を示す情報とを対応付けて記憶する記憶部と、
前記記憶部に記憶されている情報から算出した保管データの復元に要した時間の代表値に基づいて、前記保管データの保管先を変更する処理、および/または、前記記憶部に記憶されている情報から算出した保管データが使用される頻度に基づいて、保管データを取得する間隔を変更する処理を行う処理部を備える、
ことを特徴とする請求項1に記載のデータ管理システム。
Information indicating a storage identifier that identifies the storage data identified by the data identification unit, information indicating the time required for the output unit to restore the storage data, and information indicating the time when the storage data was acquired a storage unit that associates and stores
a process of changing the storage destination of the stored data based on a representative value of the time required to restore the stored data calculated from the information stored in the storage unit, and/or A processing unit that performs a process of changing the interval for acquiring stored data based on the frequency of use of stored data calculated from information,
The data management system according to claim 1, characterized by:
複数のストレージ装置を含んで構成されるデータ管理システムにおけるデータ管理方法であって、
要求受付部が、要求対象の時間を示す情報と、要求対象のデータを識別するデータ識別子を示す情報と、要求対象の精度に関する要求レベルの情報とが含まれる要求を受け付ける第1のステップと、
データ特定部が、データを保管するための保管データが取得された時間を示す情報と、前記保管データが格納されるストレージ装置を示す情報とが対応付けられているデータ管理情報に基づいて、前記複数のストレージ装置に記憶される保管データの中から、前記要求受付部により受け付けられた要求に含まれる要求対象の時間に合う保管データを特定する第2のステップと、
データ評価部が、前記データ管理情報に基づいて、前記データ特定部により特定された保管データについて、前記要求に含まれる要求対象の時間との時間差分を算出し、算出した時間差分が前記要求に含まれる要求レベルを満たすか否かを評価する第3のステップと、
出力部が、前記データ特定部による特定結果を出力する第のステップと、
を備えることを特徴とするデータ管理方法。
A data management method in a data management system including a plurality of storage devices, comprising:
a first step in which the request receiving unit receives a request containing information indicating the requested time, information indicating a data identifier identifying the requested data, and request level information regarding the accuracy of the requested target ;
based on the data management information in which the information indicating the time when the storage data for storing the data was acquired and the information indicating the storage device in which the storage data is stored are associated with each other; a second step of identifying, from among stored data stored in a plurality of storage devices, stored data that matches the requested time included in the request received by the request receiving unit;
A data evaluation unit calculates, based on the data management information, a time difference between the storage data identified by the data identification unit and a requested time included in the request, and the calculated time difference is included in the request. a third step of evaluating whether or not the included requirement level is met;
a fourth step in which an output unit outputs a result of identification by the data identification unit;
A data management method comprising:
JP2018198161A 2018-10-22 2018-10-22 Data management system and data management method Active JP7141908B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018198161A JP7141908B2 (en) 2018-10-22 2018-10-22 Data management system and data management method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018198161A JP7141908B2 (en) 2018-10-22 2018-10-22 Data management system and data management method

Publications (2)

Publication Number Publication Date
JP2020067681A JP2020067681A (en) 2020-04-30
JP7141908B2 true JP7141908B2 (en) 2022-09-26

Family

ID=70390312

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018198161A Active JP7141908B2 (en) 2018-10-22 2018-10-22 Data management system and data management method

Country Status (1)

Country Link
JP (1) JP7141908B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000347925A (en) 1999-03-31 2000-12-15 Sony Corp Information providing processing method, information providing processing program storage medium and information providing processor
JP2005122611A (en) 2003-10-20 2005-05-12 Hitachi Ltd Storage device and method for acquiring backup
JP2010152707A (en) 2008-12-25 2010-07-08 Hitachi Information Systems Ltd Backup method of database and database system
JP2010231394A (en) 2009-03-26 2010-10-14 Nec Corp Information processing system, information restoration control method, information restoration program, history storing program, and information storing program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000347925A (en) 1999-03-31 2000-12-15 Sony Corp Information providing processing method, information providing processing program storage medium and information providing processor
JP2005122611A (en) 2003-10-20 2005-05-12 Hitachi Ltd Storage device and method for acquiring backup
JP2010152707A (en) 2008-12-25 2010-07-08 Hitachi Information Systems Ltd Backup method of database and database system
JP2010231394A (en) 2009-03-26 2010-10-14 Nec Corp Information processing system, information restoration control method, information restoration program, history storing program, and information storing program

Also Published As

Publication number Publication date
JP2020067681A (en) 2020-04-30

Similar Documents

Publication Publication Date Title
US8930667B2 (en) Controlling the placement of data in a storage system
US9116913B2 (en) File storage system and file cloning method
JP4733461B2 (en) Computer system, management computer, and logical storage area management method
JP5023018B2 (en) Storage system and data management method
US8359440B2 (en) Management server device for managing virtual storage device, and method for managing virtual storage device
JP5895099B2 (en) Destination file server and file system migration method
JP5514903B2 (en) File level hierarchical storage management system, method, and apparatus
US9235589B2 (en) Optimizing storage allocation in a virtual desktop environment
US9396198B2 (en) Computer system, file management method and metadata server
US20080195827A1 (en) Storage control device for storage virtualization system
US20110125890A1 (en) Volume selection method and information processing system
USRE42859E1 (en) File server that allows an end user to specify storage characteristics with ease
JP5640151B2 (en) Computer and data management method by computer
JPWO2007099636A1 (en) File system migration method, file system migration program, and file system migration apparatus
CN104662522A (en) System and method for full virtual machine backup using storage system functionality
US10521398B1 (en) Tracking version families in a file system
JP6442642B2 (en) Management system and management method for managing computer system
JP7141908B2 (en) Data management system and data management method
US20180165380A1 (en) Data processing system and data processing method
US20070124366A1 (en) Storage control method for managing access environment enabling host to access data
JP6585283B2 (en) Data processing system and data processing method
JP2009176119A (en) File use circumstance determination system
WO2018051429A1 (en) File server and information system
JP5810982B2 (en) SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM
WO2016027370A1 (en) Archive control system and method

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181129

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210416

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220912

R150 Certificate of patent or registration of utility model

Ref document number: 7141908

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150