JP2020035430A - ホットバックアップシステム、ホットバックアップ方法、及びコンピュータ機器 - Google Patents

ホットバックアップシステム、ホットバックアップ方法、及びコンピュータ機器 Download PDF

Info

Publication number
JP2020035430A
JP2020035430A JP2019132717A JP2019132717A JP2020035430A JP 2020035430 A JP2020035430 A JP 2020035430A JP 2019132717 A JP2019132717 A JP 2019132717A JP 2019132717 A JP2019132717 A JP 2019132717A JP 2020035430 A JP2020035430 A JP 2020035430A
Authority
JP
Japan
Prior art keywords
server
data
delay
backup
master server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019132717A
Other languages
English (en)
Other versions
JP6827501B2 (ja
Inventor
ビン シャン,
Bing Xiang
ビン シャン,
シャオリャン コン,
Xiaoliang Cong
シャオリャン コン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Publication of JP2020035430A publication Critical patent/JP2020035430A/ja
Application granted granted Critical
Publication of JP6827501B2 publication Critical patent/JP6827501B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1466Management of the backup or restore process to make the backup process non-disruptive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1471Saving, restoring, recovering or retrying involving logging of persistent data for recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated

Abstract

【課題】2台のサーバからなるホットバックアップ方法を改善する技術を提供する。【解決手段】ホットバックアップシステム100は、集中管理モジュールが送信した書き込み命令を受信し、業務サーバによって送信された第1のデータをマスターサーバのデータベースに書き込むためのマスターサーバと、マスターサーバとリアルタイムでデータ同期を行い、集中管理モジュールが送信した読み出し命令を受信し、読み出した第2のデータを集中管理モジュールに送信して、集中管理モジュールが第2のデータを業務サーバに送信するスレーブサーバと、マスターサーバが生成したデータ操作情報の遅延バックアップを行うための遅延サーバと、システムの稼働状態異常が監視された場合、稼働状態の異常に基づいて、マスターサーバ、スレーブサーバ及び遅延サーバのアイデンティティロールの切替え管理を夫々行うための集中管理モジュールと、を含む。【選択図】図1

Description

本発明は、コンピュータ技術分野に関し、特に、ホットバックアップシステム、ホットバックアップ方法、及びコンピュータ機器に関する。
データ通信システムは、通常、システムの高い信頼性を必要とし、突然の故障や自発的なメンテナンスに遭遇しても、システムの通常の稼働に影響を与えない。信頼性と保守性を向上させるために、障害に備えるバックアップおよび復旧を行う必要がある。信頼性が高く要求されるシステムの場合、最適なバックアップ案は、2台のサーバからなるホットバックアップである。
現在、市販されているサーバまたはデータベースは、通常、2台のサーバからなるホットバックアップ技術を採用して耐障害性、誤動作許容性などを解決し、長時間の業務中断を回避して、システムの長期的な信頼性のあるサービスを確保する。例えば、システムの稼働中に、2台のサーバにはまったく同じシステムとデータがロードされており、通信ケーブルを介して同期を維持し、現在稼動しているサーバをマスターサーバとし、もう1台のサーバをスタンバイサーバとしている。スタンバイサーバは、マスターサーバの状態を断続的に検出し、マスターサーバの異常を検出した場合には、マスター・スタンバイのロールを切替える。しかし、現在の2台のサーバからなるホットバックアップ技術は、ディザスタリカバリ、誤動作、および過負荷などの問題を解決するうえで得られる効果が悪く、改善する必要がある。
本発明の目的は、上記の技術問題の一つを少なくともある程度解決することである。
そのため、本発明の第1の目的は、ホットバックアップシステムを提供し、当該システムは、4台のサーバからなるホットバックアップのモードを採用することによって、ホットバックアップシステムが高い可用性、耐障害性などの特徴を有するようになり、また、4つのロールによって読み出しと書き込みが分離されるモードを採用することにより、データ障害レベルに基づいて、ディザスタリカバリ、誤動作、過負荷などのさまざまな状況を迅速に解決することができる。
本発明の第2の目的は、ホットバックアップ方法を提供することである。
本発明の第3の目的は、コンピュータ機器を提供することである。
上記の目的を達成するために、本発明の第1の態様の実施例に係るホットバックアップシステムは、集中管理モジュールと、それぞれ前記集中管理モジュールに接続されたマスターサーバとスレーブサーバと遅延サーバと、を含み、前記集中管理モジュールは、業務サーバとのデータ伝送を行い、前記マスターサーバは、前記集中管理モジュールによって送信された、前記業務サーバによって送信された第1のデータが含まれた書き込み命令を受信し、前記書き込み命令に基づいて前記第1のデータを前記マスターサーバのデータベースに書き込み、前記スレーブサーバは、前記マスターサーバとリアルタイムでデータ同期を行い、前記集中管理モジュールによって送信された読み出し命令を受信し、前記読み出し命令に基づいて、読み出した第2のデータを前記集中管理モジュールに送信して、前記集中管理モジュールが前記第2のデータを前記業務サーバに送信し、前記遅延サーバは、予め設定された遅延バックアップパラメータに基づいて、前記マスターサーバで生成されたデータ操作情報の遅延バックアップを行い、前記集中管理モジュールは、さらに、前記ホットバックアップシステムの稼働状態の異常が監視された場合、前記稼働状態の異常に基づいて、前記マスターサーバ、スレーブサーバおよび遅延サーバのアイデンティティロールの切替え管理をそれぞれ行う。
本発明の実施例のホットバックアップシステムによれば、マスターサーバが業務サーバとのデータ伝送を行い、マスターサーバが業務サーバによって送信されたデータを格納し、スレーブサーバがマスターサーバとリアルタイムでデータ同期を行い、集中管理モジュールによって送信された読み出し命令を受信し、当該読み出し命令に基づいて、読み出した第2のデータを集中管理モジュールに送信し、集中管理モジュールが前記第2のデータを業務サーバに送信して、業務サーバとのデータ伝送を行う。集中管理モジュールが、システムの稼働状態の異常を監視した場合、当該稼働状態の異常に基づいてマスターサーバ、スレーブサーバおよび遅延サーバのアイデンティティロールの切替え管理をそれぞれ行うことができる。すなわち、集中管理モジュールが、データ障害レベルに基づいて様々なデータベースディザスタリカバリの問題を迅速に解決し、マスター・スレーブの切替えによってネットワークまたは機械の故障問題を解決し、遅延サーバの切替えによってデータベース誤動作の問題を迅速に解決する。これにより、ディザスタリカバリ、誤動作、および過負荷などの問題を解決するうえで得られる効果がより良くなり、システムの高い信頼性と保守性が大幅に向上する。
上記の目的を達成するために、本発明の第2の態様の実施例が提供される。本発明の第1の態様の実施例に記載のホットバックアップシステムによって実行されるホットバックアップ方法は、業務サーバによって送信された第1のデータを取得するステップと、前記第1のデータに対する書き込み命令を生成し、前記書き込み命令に基づいて前記第1のデータをマスターサーバのデータベースに書き込むステップと、前記マスターサーバとリアルタイムでデータ同期を行うようにスレーブサーバを制御するステップと、前記スレーブサーバに読み出し命令を送信し、前記スレーブサーバが前記読み出し命令に基づいて読み出した第2のデータを受信し、前記第2のデータを前記業務サーバに送信するステップと、予め設定された遅延バックアップパラメータに基づいて、前記マスターサーバで生成されたデータ操作情報の遅延バックアップを行うように遅延サーバを制御するステップと、前記ホットバックアップシステムの稼働状態の異常が監視された場合、前記稼働状態の異常に基づいて前記マスターサーバ、スレーブサーバおよび遅延サーバのアイデンティティロールの切替え管理をそれぞれ行うステップと、を含む。
本発明の実施例のホットバックアップ方法によれば、マスターサーバが業務サーバとのデータ伝送を行い、マスターサーバが業務サーバによって送信されたたデータを格納し、スレーブサーバがマスターサーバとリアルタイムでデータ同期を行い、集中管理モジュールによって送信された読み出し命令を受信し、当該読み出し命令に基づいて読み出した第2のデータを集中管理モジュールに送信し、集中管理モジュールが前記第2のデータを業務サーバに送信し、業務サーバとのデータ伝送を実現し、集中管理モジュールが、システムの稼働状態の異常が監視された場合に、当該稼働状態の異常に基づいてマスターサーバ、スレーブサーバおよび遅延サーバのアイデンティティロールの切替え管理をそれぞれ行うことができる。すなわち、集中管理モジュールがデータ障害レベルに基づいて様々なデータベースのディザスタリカバリ問題を迅速に解決し、マスター・スレーブの切替えによってネットワークまたは機械の故障問題が解決され、遅延サーバの切替えによってデータベース誤動作の問題が高速に解決される。これにより、ディザスタリカバリ、誤動作、および過負荷などの問題を解決するうえで得られる効果がより良くなり、システムの高い信頼性と保守性が大幅に向上する。
上記の目的を達成するために、本発明の第3の態様の実施例によって提供されるコンピュータ機器は、メモリと、プロセッサと、メモリに格納され、プロセッサで実行可能なコンピュータプログラムと、を含み、前記プロセッサは、前記プログラムを実行する際に、本発明の第2の態様の実施例に記載のホットバックアップ方法を実現する。
本発明の付加的な特徴および利点は、一部が以下の説明に示され、一部が下記の説明により明らかになり、または本発明の実践により理解される。
本発明の上記及び/または付加的な特徴及び利点は、下記の図面を参照して実施例を説明することにより、明らかになり、理解しやすくなる。
本発明の一実施例に係るホットバックアップシステムの概略構成図である。 本発明の具体的な一実施例に係るホットバックアップシステムの概略構成図である。 本発明の一実施例に係るホットバックアップ方法のフローチャートである。 本発明の一実施例に係るコンピュータ機器の概略構成図である。
以下、本発明の実施例について詳細に説明し、前記実施例の例が図面に示されている。同一又は類似の符号は常に同一又は類似の要素を表す。以下に図面を参照ながら説明された実施例は、例示であり、本発明を解釈するためのものであるので、本発明を限定するものであると理解してはいけない。
以下、図面を参照しながら、本発明の実施例のホットバックアップシステム、ホットバックアップ方法、及びコンピュータ機器を説明する。
図1は、本発明の一実施例に係るホットバックアップシステムの概略構成図である。図1に示すように、当該ホットバックアップシステム100は、集中管理モジュール110と、それぞれ集中管理モジュール110に接続されたマスターサーバ120とスレーブサーバ130と遅延サーバ140と、を含むことができる。本発明の実施例において、集中管理モジュール110は、通信ケーブルを介してマスターサーバ120、スレーブサーバ130および遅延サーバ140にそれぞれ通信可能に接続することができる。
具体的には、集中管理モジュール110は、業務サーバとデータ伝送を行う。一例として、集中管理モジュール110は、業務サーバとの通信リンクを構築し、当該通信リンクを介して業務サーバとのデータ伝送を行うことができる。例えば、集中管理モジュール110は、業務サーバによって送信された格納待ちのデータを受信し、当該格納待ちのデータをマスターサーバ120のデータベースに送信して格納することができる。また、データベースからデータを読み出して、読み出したデータを業務サーバに送信して、業務サーバとのデータ伝送を行うこともできる。
本発明の実施例において、本発明の実施例のホットバックアップシステム100は、3つのサーバを含むことができ、当該3つのサーバは、それぞれアイデンティティ、マスターサーバ、スレーブサーバおよび遅延サーバという各自のアイデンティティを持っている。マスターサーバ120は、集中管理モジュール110によって送信された、業務サーバによって送信された第1のデータが含まれた書き込み命令を受信し、当該書き込み命令に基づいて、第1のデータをマスターサーバ120のデータベースに書き込むことができる。例えば、集中管理モジュール110は、業務サーバによって送信された第1のデータを受信した場合、当該第1のデータに対する書き込み命令を生成し、当該書き込み命令をマスターサーバ120に送信することができる。マスターサーバ120は、集中管理モジュール110によって送信された書き込み命令を受信した場合、当該書き込み命令に基づいて、当該書き込み命令に含まれる第1のデータをマスターサーバ120のデータベースに書き込んで、データのデータベースへの書き込みを行うことができる。
スレーブサーバ130は、マスターサーバ120とリアルタイムでデータ同期を行い、集中管理モジュール110によって送信された読み出し命令を受信し、読み出し命令に基づいて、読み出した第2のデータを集中管理モジュール110に送信して、集中管理モジュール110が第2のデータを業務サーバに送信する。例を挙げると、スレーブサーバ130は、マスターサーバ120にハートビートパッケージをリアルタイムで送信して両者の通信接続を維持し、当該通信接続を介してリアルタイムでマスターサーバ120にデータ同期要求をリアルタイムで送信することができる。マスターサーバ120は、当該データ同期要求を受信した場合、自身のデータベースに格納されたデータをスレーブサーバ130に送信して、データ同期機能を実現することができる。
本発明の実施例において、スレーブサーバ130は、読み出し機能をさらに有することができる。すなわち、集中管理モジュール110によって送信された読み出し命令を受信し、当該読み出し命令に基づいて、読み出した第2のデータを集中管理モジュール110に送信することができる。集中管理モジュール110は、スレーブサーバ130から読み出した第2のデータを業務サーバに送信することで、対応する業務データ操作が行われる。
遅延サーバ140は、予め設定された遅延バックアップパラメータに基づいて、マスターサーバ120で生成されたデータ操作情報の遅延バックアップを行うことができる。本発明の実施例において、前記遅延バックアップパラメータは、1時間程度の遅延時間を含んでも良い。例を挙げると、遅延サーバ140は、予め設定された遅延バックアップパラメータに基づいて、マスターサーバ120に格納されたデータ操作情報の遅延バックアップを行うことができる。例えば、マスターサーバ120に現在格納されているデータがデータAであると、遅延サーバ140は、1時間遅延した後、マスターサーバ120から格納されているデータAを読み出し、当該データAを格納してバックアップすることによって、マスターサーバのデータの遅延バックアップの機能を実現する。このようにして、遅延サーバがマスターサーバのデータの遅延バックアップを行うことによって、現在のシステムにデータ送信故障が発生したとき、遅延サーバ中のバックアップデータを利用してマスターサーバ中のデータを、前記遅延時間前の状態に復元することができる。例えば、マスターサーバ中のデータを1時間前の状態に復元することによって、データベースの誤動作時の迅速な障害復旧の目的を実現することができる。
集中管理モジュール110は、さらに、ホットバックアップシステム100の稼働状態の異常が監視された場合、稼働状態の異常に基づいて、マスターサーバ120、スレーブサーバ130および遅延サーバ140のアイデンティティロールの切替え管理をそれぞれ行う。選択可能に、集中管理モジュール110は、ホットバックアップシステム100の稼働状態の異常が監視された場合には、当該稼働状態の異常に基づいて、対応するデータ障害レベルを決定し、当該データ障害レベルに基づいて、マスターサーバ120、スレーブサーバ130および遅延サーバ140の新たなアイデンティティ属性をそれぞれ決定し、当該新たなアイデンティティ属性に基づいて、マスターサーバ120、スレーブサーバ130および遅延サーバ140のアイデンティティの切替えをそれぞれ行う。
例を挙げると、集中管理モジュール110は、ホットバックアップシステム100の稼働状態をリアルタイムで監視することができ、ホットバックアップシステム100の稼働状態が異常であることを検出した場合には、当該稼働状態の異常に基づいて、対応するデータ障害レベルを決定することができる。例えば、当該データ障害レベルは、第1のレベルと第2のレベルとを含むことができる。第1のレベルの障害の程度は、第2のレベルの障害の程度よりも小さく、例えば、第1のレベルは、マスターサーバの稼働状態が異常(すなわち、データ格納不能)であり、第2のレベルは、マスターサーバとスレーブサーバとの稼働状態がいずれも異常であってもよい。対応するデータ障害レベルを決定した後、当該データ障害レベルに基づいて、マスターサーバ120、スレーブサーバ130および遅延サーバ140の新たなアイデンティティ属性をそれぞれ決定し、当該新たなアイデンティティ属性に基づいてマスターサーバ120、スレーブサーバ130および遅延サーバ140のアイデンティティの切替えをそれぞれ行うことができる。
例えば、データ障害レベルが前記第1のレベルであると決定した場合、集中管理モジュール110は、スレーブサーバ130を新たなマスターサーバとし、稼働状態が異常である元のマスターサーバを再起動して新たなスレーブサーバとし、遅延サーバ140をそのまま新たな遅延サーバとすることができる。また、例えば、データ障害レベルが前記第2のレベルであると決定した場合、集中管理モジュール110は、元の遅延サーバを新たなマスターサーバとし、稼働状態が異常である元のマスターサーバを再起動して新たなスレーブサーバとし、稼働状態が異常である元のスレーブサーバを再起動して新たな遅延サーバとすることができる。このように、データ障害レベルに基づいて様々なデータベースディザスタリカバリの問題が迅速に解決され、マスター・スレーブの切替えによってネットワークまたは機械の故障問題が解決され、遅延サーバの切替えによってデータベース誤動作の問題が迅速に解決される。
データベースを任意の時点でロールバックするために、選択可能に、本発明の一実施例において、マスターサーバ120は、さらに、Binlogでマスターサーバ120中のデータベースのデータバックアップを行うことができる。本発明の実施例において、遅延サーバ140は、予め設定された遅延バックアップパラメータに基づいて、マスターサーバ120中のBinlogログファイルから、前記データ操作情報を取得し、取得した前記データ操作情報を格納することができる。前記遅延バックアップパラメータは、遅延時間を含んでも良い。
例えば、マスターサーバ120は、Binlog技術を採用してマスターサーバ120中のデータベースのデータバックアップを行い、Binlogログファイルを生成することができ、当該Binlogログファイルには、マスターサーバ120で生成されたデータ操作情報がバイナリの方式で記録されている。遅延サーバ140は、一定の時間遅延して、マスターサーバ120中のBinlogログファイルから、当該時間内にマスターサーバ120で生成されたデータ操作情報を取得し、取得したデータ操作情報を格納してバックアップすることができる。例えば、遅延時間が1時間であることを例とすると、遅延サーバ140は、1時間毎に、マスターサーバ120中のBinlogログファイルから、直前の1時間内にマスターサーバ120で生成されたデータ操作情報を1回読み出し、読み出したデータ操作情報を格納してバックアップすることができる。したがって、Binlogでマスターサーバ中のデータを格納してバックアップすることによって、バックアップされたBinlogログファイルが自身のBinlogリストア機能を利用してデータベースを任意の時点にロールバックすることができる。
システムの高い信頼性と可用性をさらに向上させるために、選択可能に、本発明の一実施例において、遅延サーバ140は、さらに、マスターサーバ120中からバックアップデータを読み出し、前記バックアップデータに基づいて統計機能を行い、前記バックアップデータが増分リストアおよびロールバックに利用できるか否かを定期的に検証することができる。つまり、遅延サーバ140は、マスターサーバ120からバックアップデータを読み出し、当該バックアップデータに基づいて統計機能を行い、例えば、業務についてのデータ統計などを行うことができ、当該バックアップデータを定期的に検証して、当該バックアップデータが増分リストアおよびロールバックに利用できるか否かを検出することによって、マスターサーバが誤って不正なデータを利用して復元することを防止して、データの安全性を確保することができる。
システムの高い信頼性をさらに向上させ、4台のサーバに基づくホットバックアップシステムを実現するために、選択可能に、本発明の一実施例において、図2に示すように、当該ホットバックアップシステム100は、サンドボックスサーバ150をさらに含むことができる。サンドボックスサーバ150は、マスターサーバ120で生成されたデータ操作情報を周期的にバックアップし、マスターサーバ120のフルバックアップリストア機能が利用できるか否かを定期的に検証することができる。例えば、サンドボックスサーバ150は、毎日、マスターサーバ120で生成されたデータ操作情報を一回バックアップし、当該バックアップのデータを毎日一回リストアし、すなわちマスターサーバの前日のデータとしてリストアし、リストア結果を判断することによって、マスターサーバ120のフルバックアップリストア機能が利用できるか否かを検証することができる。例えば、リストアされたデータがマスターサーバ120のフルバックアップに一致する場合、マスターサーバ120のフルバックアップリストア機能が利用できると判定することができる。
選択可能に、サンドボックスサーバ150は、さらに、マスターサーバ120から周期的にバックアップしたデータを、予備研究、試験、および実環境テストなどの危険度の高い操作に利用することによって、サンドボックスサーバの機能を最大限に活用して拡張し、システム機器の多機能を豊かにすることができる。
システムの高い信頼性をさらに向上して、ディザスタリカバリ、誤動作、および過負荷などの問題を解決するうえで得られる効果をより良くするために、本発明の実施例のホットバックアップシステムは、4台のサーバからなるホットバックアップ技術を採用することができる。このように、ホットバックアップシステムの稼働状態の異常が監視された場合、稼働状態の異常に基づいて、マスターサーバ、スレーブサーバ、遅延サーバ、およびサンドボックスサーバのアイデンティティロールの切替え管理をそれぞれ行うことができる。一例として、集中管理モジュール110は、ホットバックアップシステムの稼働状態の異常が監視された場合、前記稼働状態の異常に基づいて対応するデータ障害レベルを決定し、当該データ障害レベルに基づいてマスターサーバ120、スレーブサーバ130、遅延サーバ140、およびサンドボックスサーバ150の新たなアイデンティティ属性をそれぞれ決定し、前記新たなアイデンティティ属性に基づいて、マスターサーバ120、スレーブサーバ130、遅延サーバ140、およびサンドボックスサーバ150のアイデンティティの切替えをそれぞれ行うことができる。データ障害レベルは、第1のレベル、第2のレベル、および第3のレベルを含むことができる。第1のレベルの障害の程度は第2のレベルの障害の程度よりも小さく、第2のレベルの障害の程度は第3のレベルの障害の程度よりも小さい。例えば、第1のレベルは、マスターサーバの稼働状態が異常(すなわち、データ格納不能)であり、第2のレベルは、マスターサーバとスレーブサーバとの稼働状態がいずれも異常であり、第3のレベルは、マスターサーバ、スレーブサーバ、および遅延サーバの稼働状態がいずれも異常であってもよい。
例を挙げると、データ障害レベルが前記第1のレベルであると決定した場合、集中管理モジュール110は、スレーブサーバ130を新たなマスターサーバとし、稼働状態が異常である元のマスターサーバを再起動して新たなスレーブサーバとし、遅延サーバ140をそのまま新たな遅延サーバとし、サンドボックスサーバをそのまま新たなサンドボックスサーバとすることができる。また、例えば、データ障害レベルが前記第2のレベルであると決定した場合、集中管理モジュール110は、元の遅延サーバを新たなマスターサーバとし、稼働状態が異常である元のマスターサーバを再起動して新たなスレーブサーバとし、稼働状態が異常である元のスレーブサーバを再起動して新たな遅延サーバとし、サンドボックスサーバをそのまま新たなサンドボックスサーバとすることができる。
また、例えば、第3のレベルがデータ障害レベルであると決定した場合、集中管理モジュール110は、元のサンドボックスサーバを新たなマスターサーバとし、稼働状態が異常である元のマスターサーバを再起動して新たなスレーブサーバとし、稼働状態が異常である元のスレーブサーバを再起動して新たな遅延サーバとし、稼働状態が異常である元の遅延サーバを新たなサンドボックスサーバとすることができる。このように、データ障害レベルに基づいて様々なデータベースディザスタリカバリの問題が迅速に解決され、マスター・スレーブの切替えによってネットワークまたは機械の故障問題が解決され、遅延サーバの切替えによってデータベース誤動作の問題が迅速に解決される。
本発明の実施例のホットバックアップシステムによれば、マスターサーバが業務サーバとのデータ伝送を行い、マスターサーバが業務サーバによって送信されたデータの格納を実現し、スレーブサーバがマスターサーバとリアルタイムでデータ同期を行い、集中管理モジュールによって送信された読み出し命令を受信し、当該読み出し命令に基づいて、読み出した第2のデータを集中管理モジュールに送信して、集中管理モジュールが前記第2のデータを業務サーバに送信するようにして、業務サーバとのデータ伝送を実現し、集中管理モジュールが、システムの稼働状態の異常がモニタリングされた場合、当該稼働状態の異常に基づいて、マスターサーバ、スレーブサーバおよび遅延サーバのアイデンティティロールの切替え管理をそれぞれ行うことができる。すなわち、集中管理モジュールが、データ障害レベルに基づいて様々なデータベースディザスタリカバリの問題を迅速に解決し、マスター・スレーブの切替えによってネットワークまたは機械の故障問題を解決し、遅延サーバの切替えによってデータベース誤動作の問題を迅速に解決する。これにより、ディザスタリカバリ、誤動作、および過負荷などの問題を解決するうえで得られる効果がより良くなり、システムの高い信頼性と保守性が大幅に向上する。
本発明は、ホットバックアップ方法をさらに提供する。本発明の実施例において、本発明の上記のいずれか1つの実施例に記載のホットバックアップシステムによってホットバックアップ方法を実行することができる。図3は、本発明の一実施例に係るホットバックアップ方法のフローチャートである。なお、本発明の実施例のホットバックアップ方法は本発明の実施例の集中管理モジュール側から説明することができる。図3に示すように、当該ホットバックアップ方法は、S310〜S360を含む。
S310において、業務サーバによって送信された第1のデータを取得する。
選択可能に、業務サーバとの通信リンクを構築し、当該通信リンクを介して業務サーバとのデータ伝送を行うことができる。例えば、当該通信リンクを介して業務サーバによって送信された第1のデータを受信することができる。
S320において、第1のデータに対する書き込み命令を生成し、書き込み命令に基づいて第1のデータをマスターサーバのデータベースに書き込む。
選択可能に、業務サーバによって送信された第1のデータを受信した場合、当該第1のデータに対する書き込み命令を生成し、当該書き込み命令に基づいて第1のデータをマスターサーバのデータベースに書き込むことができる。
S330において、マスターサーバとリアルタイムでデータ同期を行うようにスレーブサーバを制御する。
例えば、マスターサーバにハートビートパッケージをリアルタイムで送信して両者の通信接続を維持し、当該通信接続を介してマスターサーバにデータ同期要求をリアルタイムで送信するようにスレーブサーバを制御することができる。マスターサーバは、当該データ同期要求を受信した場合、自身データベースに格納されているデータをスレーブサーバに送信してデータ同期の機能を実現することができる。
S340において、スレーブサーバに読み出し命令を送信し、スレーブサーバが読み出し命令に基づいて読み出した第2のデータを受信し、第2のデータを業務サーバに送信する。
選択可能に、スレーブサーバは、読み出し機能をさらに有することができ、すなわち、集中管理モジュールによって送信された読み出し命令を受信し、当該読み出し命令に基づいて、読み出した第2のデータを集中管理モジュールに送信し、集中管理モジュールは当該読み出した第2のデータを業務サーバに送信して、対応する業務データ操作を行うようにすることができる。
S350において、予め設定された遅延バックアップパラメータに基づいてマスターサーバで生成されたデータ操作情報の遅延バックアップを行うように遅延サーバを制御する。本発明の実施例において、前記遅延バックアップパラメータは、1時間程度の遅延時間を含むことができる。
例を挙げると、予め設定された遅延バックアップパラメータに基づいてマスターサーバに格納されたデータ操作情報の遅延バックアップを行うように遅延サーバを制御することができる。例えば、マスターサーバに現在格納されているデータがデータAである場合には、1時間遅延した後、マスターサーバから格納されているデータAを読み出し、当該データAを格納してバックアップするようにサーバを制御することで、マスターサーバのデータの遅延バックアップの機能を実現することができる。これにより、遅延サーバがマスターサーバのデータの遅延バックアップを行うことにより、現在のシステムに送信データの故障が発生した場合には、遅延サーバ中のバックアップデータを利用してマスターサーバ中のデータを、前記遅延時間前の状態に復元することができる。例えば、マスターサーバ中のデータを1時間前の状態に復元することにより、データベースの誤動作時の迅速な障害復旧を実現することができる。
データベースを任意の時点にロールバックするために、選択可能に、本発明の一実施例において、Binlogで前記マスターサーバ中のデータベースのデータバックアップを行うようにマスターサーバを制御することができる。本発明の実施例において、予め設定された遅延バックアップパラメータに基づいて前記マスターサーバで生成されたデータ操作情報の遅延バックアップを行うように遅延サーバを制御する前記ステップの具体的な実現過程は、予め設定された遅延バックアップパラメータに基づいて、マスターサーバ中のBinlogログファイルからデータ操作情報を取得し、取得されたデータ操作情報を格納するように遅延サーバを制御するステップであってもよく、遅延バックアップパラメータは、遅延時間を含む。
例えば、Binlog技術を採用してマスターサーバ120中のデータベースのデータバックアップを行って、Binlogログファイルを生成するようにマスターサーバを制御することができ、当該Binlogログファイルには、マスターサーバ120中でバイナリの方式で生成されたデータ操作情報が記録されている。一定時間遅延した後、マスターサーバ120中のBinlogログファイルから、当該段時間内にマスターサーバ120で生成されたデータ操作情報を取得し、取得したデータ操作情報を格納してバックアップするように遅延サーバを制御することができる。例えば、遅延時間が1時間であることを例とすると、1時間毎に、マスターサーバ120中のBinlogログファイルから、直前の1時間内にマスターサーバ120で生成されたデータ操作情報を1回読み出し、読み出したデータ操作情報を格納してバックアップするように遅延サーバを制御することができる。したがって、Binlogでマスターサーバ中のデータを格納してバックアップすることによって、バックアップのBinlogログファイルが自身のBinlogリストア機能を利用してデータベースを任意の時点にロールバックすることができる。
S360において、ホットバックアップシステムの稼働状態の異常が監視された場合には、稼働状態の異常に基づいてマスターサーバ、スレーブサーバおよび遅延サーバのアイデンティティロールの切替え管理をそれぞれ行う。
選択可能に、ホットバックアップシステムの稼働状態の異常が監視された場合には、当該稼働状態の異常に基づいて対応されるデータ障害レベルを決定し、当該データ障害レベルに基づいて、マスターサーバ、スレーブサーバおよび遅延サーバの新たなアイデンティティ属性をそれぞれ決定し、当該新たなアイデンティティ属性に基づいてマスターサーバ、スレーブサーバおよび遅延サーバのアイデンティティの切替えをそれぞれ行うことができる。
例を挙げると、ホットバックアップシステムの稼働状態をリアルタイムで監視することができ、ホットバックアップシステムの稼働状態が異常であることが検出された場合に、当該稼働状態の異常に基づいて対応するデータ障害レベルを決定することができる。例えば、当該データ障害レベルは、第1のレベルと第2のレベルとを含むことができ、第1のレベルの障害の程度は、第2のレベルの障害の程度よりも小さい。例えば、第1のレベルは、マスターサーバの稼働状態が異常(すなわち、データ格納不能)であり、第2のレベルは、マスターサーバとスレーブサーバとの稼働状態がいずれも異常であるとしてもよい。対応するデータ障害レベルが決定された後、当該データ障害レベルに基づいて、マスターサーバ、スレーブサーバおよび遅延サーバの新たなアイデンティティ属性をそれぞれ決定し、当該新たなアイデンティティ属性に基づいて、マスターサーバ、スレーブサーバおよび遅延サーバのアイデンティティの切替えをそれぞれ行うことができる。
例えば、データ障害レベルが前記第1のレベルであると決定された場合には、スレーブサーバを新たなマスターサーバとし、稼働状態が異常である元のマスターサーバを再起動して新たなスレーブサーバとし、遅延サーバをそのまま新たな遅延サーバとすることができる。また、例えば、データ障害レベルが前記第2のレベルであると決定された場合には、元の遅延サーバを新たなマスターサーバとし、稼働状態が異常である元のマスターサーバを再起動して新たなスレーブサーバとし、稼働状態が異常である元のスレーブサーバを再起動して新たな遅延サーバとすることができる。このように、データ障害レベルに基づいて様々なデータベースディザスタリカバリの問題が迅速に解決され、マスター・スレーブ切替えによってネットワークまたは機械の故障問題が解決され、遅延サーバの切替えによってデータベース誤動作の問題が迅速に解決される。
システムの高い信頼性と可用性をさらに向上させるために、選択可能に、本発明の一実施例において、前記マスターサーバからバックアップデータを読み出し、前記バックアップデータに基づいて統計機能を行い、前記バックアップデータが増分リストアおよびロールバックに利用できるか否かを定期的に検証するように遅延サーバを制御することができる。つまり、マスターサーバからバックアップデータを読み出し、当該バックアップデータに基づいて、統計機能を行い、例えば、業務についてのデータ統計などを行い、当該バックアップデータを定期的に検証して、当該バックアップデータが増分リストアおよびロールバックに利用できるか否かを検出するように遅延サーバを制御することができ、マスターサーバが誤って不正なデータを利用して復元することを防止して、データの安全性を確保することができる。
システムの高い信頼性をさらに向上させ、4台のサーバに基づくホットバックアップシステムを実現するために、当該ホットバックアップシステムは、サンドボックスサーバをさらに含むことができる。選択可能に、本発明の一実施例において、前記マスターサーバで生成されたデータ操作情報を周期的にバックアップし、前記マスターサーバのフルバックアップリストア機能が利用できるか否かを定期的に検証するようにサンドボックスサーバを制御することができる。例えば、毎日、マスターサーバ120で生成されたデータ操作情報を一回バックアップし、当該バックアップのデータを毎日一回リストアし、すなわちマスターサーバを前日のデータとしてリストアし、リストア結果を判断することによって、マスターサーバのフルバックアップリストア機能が利用できるか否かを検証するようにサンドボックスサーバを制御することができる。例えば、リストアされたデータがマスターサーバのフルバックアップに一致する場合、マスターサーバのフルバックアップリストア機能が利用できると判定することができる。
システムの高い信頼性をさらに向上して、ディザスタリカバリ、誤動作、および過負荷などの問題を解決するうえで得られる効果をより良くするために、本発明の実施例のホットバックアップシステムは、4台のサーバからなるホットバックアップ技術を採用することで、ホットバックアップシステムの稼働状態の異常が監視された場合、稼働状態の異常に基づいてマスターサーバ、スレーブサーバ、遅延サーバ、およびサンドボックスサーバのアイデンティティロールの切替え管理をそれぞれ行うことができる。一例として、ホットバックアップシステムの稼働状態の異常が監視された場合には、前記稼働状態の異常に基づいて対応するデータ障害レベルを決定し、前記データ障害レベルに基づいて前記マスターサーバ、スレーブサーバ、遅延サーバ、およびサンドボックスサーバの新たなアイデンティティ属性をそれぞれ決定した後、前記新たなアイデンティティ属性に基づいて前記マスターサーバ、スレーブサーバ、遅延サーバ、およびサンドボックスサーバのアイデンティティの切替えをそれぞれ行うことができる。データ障害レベルは、第1のレベル、第2のレベル、および第3のレベルを含むことができる。第1のレベルの障害の程度は第2のレベルの障害の程度よりも小さく、第2のレベルの障害の程度は第3のレベルの障害の程度よりも小さい。例えば、第1のレベルは、マスターサーバの稼働状態が異常(すなわち、データ格納不能)であり、第2のレベルは、マスターサーバとスレーブサーバとの稼働状態がいずれも異常であり、第3のレベルは、マスターサーバ、スレーブサーバ、および遅延サーバの稼働状態がいずれも異常であってもよい。
例を挙げると、データ障害レベルが前記第1のレベルであると決定された場合には、スレーブサーバを新たなマスターサーバとし、稼働状態が異常である元のマスターサーバを再起動して新たなスレーブサーバとし、遅延サーバをそのまま新たな遅延サーバとし、サンドボックスサーバをそのまま新たなサンドボックスサーバとすることができる。また、例えば、データ障害レベルが前記第2のレベルであると決定され場合、元の遅延サーバを新たなマスターサーバとし、稼働状態が異常である元のマスターサーバを再起動して新たなスレーブサーバとし、稼働状態が異常である元のスレーブサーバを再起動して新たな遅延サーバとし、サンドボックスサーバをそのまま新たなサンドボックスサーバとすることができる。
また、例えば、第3のレベルがデータ障害レベルであると決定された場合には、元のサンドボックスサーバを新たなマスターサーバとし、稼働状態が異常である元のマスターサーバを再起動して新たなスレーブサーバとし、稼働状態が異常である元のスレーブサーバを再起動して新たな遅延サーバとし、稼働状態が異常である元の遅延サーバを新たなサンドボックスサーバとすることができる。このように、データ障害レベルに基づいて様々なデータベースディザスタリカバリの問題が迅速に解決され、マスター・スレーブの切替えによってネットワークまたは機械の故障問題が解決され、遅延サーバの切替えによってデータベース誤動作の問題が迅速に解決される。
本発明の実施例のホットバックアップ方法によれば、マスターサーバが業務サーバとのデータ伝送が行い、マスターサーバが、業務サーバによって送信されたデータを格納し、スレーブサーバがマスターサーバとのデータ同期をリアルタイムで行い、集中管理モジュールによって送信された読み出し命令を受信し、当該読み出し命令に基づいて、読み出した第2のデータを集中管理モジュールに送信し、集中管理モジュールが前記第2のデータを業務サーバに送信して、業務サーバとのデータ伝送を実現し、集中管理モジュールが、システムの稼働状態の異常が監視された場合に、当該稼働状態の異常に基づいて、マスターサーバ、スレーブサーバおよび遅延サーバのアイデンティティロールの切替え管理をそれぞれ行うことができる。すなわち、集中管理モジュールが、データ障害レベルに基づいて様々なデータベースディザスタリカバリの問題を迅速に解決し、マスター/スレーブの切替えによってネットワークまたは機械の故障問題を解決し、遅延サーバの切替えによってデータベース誤動作の問題を迅速に解決する。これにより、ディザスタリカバリ、誤動作、および過負荷などの問題を解決するうえで得られる効果がより良くなり、システムの高い信頼性と保守性が大幅に向上する。
本発明は、上記の実施例を実現するために、コンピュータ機器をさらに提供する。
図4は、本発明の一実施例に係るコンピュータ機器の概略構成図である。図4に示すように、当該コンピュータ機器400は、メモリ410と、プロセッサ420と、メモリ410に格納されプロセッサ420で実行可能なコンピュータプログラム430と、を含むことができる。プロセッサ420が前記プログラム430を実行すると、本発明の上記のいずれか1つの実施例に記載のホットバックアップ方法が実現される。
本発明の説明において、「第1」、「第2」の用語は、単に目的を説明するためのものであり、比較可能な重要性を指示又は暗示するか、或いは示された技術的特徴の数を黙示的に指示すると理解してはならない。よって、「第1」、「第2」が限定する特徴は、少なくとも1つの前記特徴を含むことを明示又は暗示するものである。本発明の説明において、明確且つ具体的な限定がない限り、「複数」とは、少なくとも2つ、例えば、2つ、3つなどを意味する。
本明細書の説明において、「一実施例」、「一部の実施例」、「例」、「具体的な例」、或いは「一部の例」などの用語を参照した説明とは、当該実施例、或いは例に合わせて説明された具体的な特徴、構成、材料或いは特性が、本開示の少なくとも1つの実施例或いは例に含まれる。本明細書において、上記用語に対する例示的な説明は、必ずしも同じ実施例或いは例を示すものではない。また、説明された具体的な特徴、構成、材料或いは特性は、いずれか1つ或いは複数の実施例又は例において適切に結合することができる。なお、相互に矛盾しない限り、当業者は、本明細書において説明された異なる実施例又は例、及び異なる実施例又は例の特徴を結合し、組み合わせることができる。
フローチャートにおける、又はここで他の形態で記載された任意のプロセス又は方法は、特定ロジック機能又はプロセスのステップを実現するための1つ又は複数の実行可能な命令コードを含むモジュール、セグメント又は一部を表すと理解されてもよい。また、本発明の好ましい実施形態の範囲は、ここで示され又は論議された順番ではなく、係る機能に応じてほぼ同時の形態又は逆の順番で機能を実行することができる他の実現を含むことができる。これは、当業者であれば理解すべきものである。
フローチャートで示され又はここで他の形態で説明されたロジック及び/又はステップは、例えば、ロジック機能を実現するための実行可能な命令の順番付けられたリストと見なすことができ、任意のコンピュータ読み取り可能な記憶媒体に具体的に実装されている。命令実行システム、装置、又はデバイス(例えばコンピュータに基づいたシステム、プロセッサを含むシステム、又は他の命令実行システム、装置又はデバイスから命令を獲得して命令を実行するシステム)に利用されるか、又はこれらの命令実行システム、装置又はデバイスと組み合わせて利用される。本願明細書において、「コンピュータ読み取り可能な記憶媒体」は、命令実行システム、装置又はデバイスによって、又は、命令実行システム、装置又はデバイスと組み合わせて使用するためのプログラムを含む、格納、通信、伝播、又は伝送することができる任意の装置であってもよい。コンピュータ読み取り可能な記憶媒体のより具体的な例(非限定的なリスト)として、1つ又は複数の配線を備える電気接続部(電子デバイス)、ポータブルコンピュータディスクカートリッジ(磁気デバイス)、ランダムアクセスメモリ(RAM)読み出し専用メモリ(ROM)、消去可能なプログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバデバイス、及びポータブルコンパクトディスク読み出し専用リメモリ(CDROM)を含む。また、コンピュータ読み取り可能な記憶媒体は、前記プログラムが印刷され得る紙又は他の適切な媒体であってもよい。これは、例えば、紙や他の媒体を光学的スキャンし、次に編集し、解釈し、又は必要な場合に他の適切な形態で処理して前記プログラムを電子的に取得して、そしてコンピュータメモリに格納するからである。
なお、本発明の各部分は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせによって実現することができる。上記実施形態において、複数のステップ又は方法は、メモリに記憶された且つ適切な命令実行システムによって実行されるソフトウェア又はファームウェアによって実現することができる。例えば、ハードウェアで実現される場合に、もう1つの実施形態と同様に、本分野において周知である、データ信号に対してロジック機能を実現するためのロジックゲート回路を備える離散ロジック回路、適切な組み合わせロジックゲート回路を備える特定用途向け集積回路、プログラマブルゲートアレイ(PGA)、フィールドプログラマブルゲートアレイ(FPGA)などの当分野の周知技術のうちいずれか1つ又はこれらの組み合わせによって実現することができる。
普通の当業者であれば、上記の実施例に係る方法に含まれる全部又は一部のステップは、プログラムによってハードウェアを命令することで実行することができると理解される。前記プログラムは、コンピュータ読み取り可能な記憶媒体に格納することができ、当該プログラムが実行される場合に、方法の実施例におけるステップの1つ又はそれらの組み合わせが実行される。
また、本発明の各実施例における各機能ユニットは、1つの処理モジュールに集積されてもよいし、それぞれが個別の物理的存在であってもよいし、2つ以上のユニットが1つのモジュールに集積されてもよい。前記集積モジュールは、ハードウェアの形態で実現されてもよいし、ソフトウェア機能モジュールの形態で実現されてもよい。前記集積モジュールがソフト機能モジュールの形態で実現されるとともに、独立した製品として販売又は使用される場合に、1つのコンピュータ読み取り可能な記憶媒体に記憶されてもよい。
上記の記憶媒体は、読み出し専用メモリ、磁気ディスク、又はCDなどであってもよい。なお、以上、本発明の実施例を示して説明したが、上記実施例は例示するものであって、本発明を制限するためのものであると理解してはならない。通常の当業者であれば、本発明の範囲内で上記実施例に対して変更、修正、取り替え、変形を行うことができる。

Claims (11)

  1. 集中管理モジュールと、それぞれ前記集中管理モジュールに接続されたマスターサーバとスレーブサーバと遅延サーバと、を含み、
    前記集中管理モジュールは、業務サーバとのデータ伝送を行い、
    前記マスターサーバは、前記集中管理モジュールによって送信された、前記業務サーバによって送信された第1のデータが含まれた書き込み命令を受信し、前記書き込み命令に基づいて前記第1のデータを前記マスターサーバのデータベースに書き込み、
    前記スレーブサーバは、前記マスターサーバとリアルタイムでデータ同期を行い、前記集中管理モジュールによって送信された読み出し命令を受信し、前記読み出し命令に基づいて、読み出した第2のデータを前記集中管理モジュールに送信して、前記集中管理モジュールが前記第2のデータを前記業務サーバに送信し、
    前記遅延サーバは、予め設定された遅延バックアップパラメータに基づいて、前記マスターサーバで生成されたデータ操作情報の遅延バックアップを行い、
    前記集中管理モジュールは、さらに、前記ホットバックアップシステムの稼働状態の異常が監視された場合に、前記稼働状態の異常に基づいて、前記マスターサーバ、スレーブサーバおよび遅延サーバのアイデンティティロールの切替え管理をそれぞれ行うことを特徴とする、ホットバックアップシステム。
  2. 前記マスターサーバは、さらに、Binlogで前記マスターサーバ中のデータベースのデータバックアップを行い、
    前記遅延サーバは、具体的には、予め設定された遅延バックアップパラメータに基づいて、前記マスターサーバ中のBinlogログファイルから前記データ操作情報を取得し、取得した前記データ操作情報を格納し、前記遅延バックアップパラメータは、遅延時間を含むことを特徴とする、請求項1に記載のホットバックアップシステム。
  3. 前記遅延サーバは、さらに、前記マスターサーバからバックアップデータを読み出し、前記バックアップデータに基づいて統計機能を行い、前記バックアップデータが増分リストアおよびロールバックに利用できるか否かを定期的に検証することを特徴とする、請求項1に記載のホットバックアップシステム。
  4. 前記ホットバックアップシステムは、
    前記マスターサーバで生成されたデータ操作情報を周期的にバックアップし、前記マスターサーバのフルバックアップリストア機能が利用できるか否かを定期的に検証するためのサンドボックスサーバをさらに含むことを特徴とする、請求項1に記載のホットバックアップシステム。
  5. 前記集中管理モジュールは、具体的には、前記稼働状態の異常に基づいて対応するデータ障害レベルを決定し、前記データ障害レベルに基づいて、前記マスターサーバ、スレーブサーバ、遅延サーバ、およびサンドボックスサーバの新たなアイデンティティ属性をそれぞれ決定し、前記新たなアイデンティティ属性に基づいて、前記マスターサーバ、スレーブサーバ、遅延サーバ、およびサンドボックスサーバのアイデンティティの切替えをそれぞれ行うことを特徴とする、請求項4に記載のホットバックアップシステム。
  6. 請求項1〜5のいずれかに記載のホットバックアップシステムによって実行されるホットバックアップ方法であって、
    業務サーバによって送信された第1のデータを取得するステップと、
    前記第1のデータに対する書き込み命令を生成し、前記書き込み命令に基づいて前記第1のデータをマスターサーバのデータベースに書き込むステップと、
    前記マスターサーバとリアルタイムでデータ同期を行うようにスレーブサーバを制御するステップと、
    前記スレーブサーバに読み出し命令を送信し、前記スレーブサーバが前記読み出し命令に基づいて読み出した第2のデータを受信し、前記第2のデータを前記業務サーバに送信するステップと、
    予め設定された遅延バックアップパラメータに基づいて前記マスターサーバで生成されたデータ操作情報の遅延バックアップを行うように遅延サーバを制御するステップと、
    前記ホットバックアップシステムの稼働状態の異常が監視された場合に、前記稼働状態の異常に基づいて、前記マスターサーバ、スレーブサーバおよび遅延サーバのアイデンティティロールの切替え管理をそれぞれ行うステップと、を含むことを特徴とする、ホットバックアップ方法。
  7. 前記方法は、
    Binlogで前記マスターサーバ中のデータベースのデータバックアップを行うように前記マスターサーバを制御するステップをさらに含み、
    前記予め設定された遅延バックアップパラメータに基づいて前記マスターサーバで生成されたデータ操作情報の遅延バックアップを行うように遅延サーバを制御するステップは、
    予め設定された遅延バックアップパラメータに基づいて、前記マスターサーバ中のBinlogログファイルから前記データ操作情報を取得し、取得した前記データ操作情報を格納するように前記遅延サーバを制御するステップを含み、
    前記遅延バックアップパラメータは、遅延時間を含むことを特徴とする、請求項6に記載のホットバックアップ方法。
  8. 前記方法は、
    前記マスターサーバからバックアップデータを読み出し、前記バックアップデータに基づいて統計機能を行い、前記バックアップデータが増分リストアおよびロールバックに利用できるか否かを定期的に検証するように前記遅延サーバを制御するステップをさらに含むことを特徴とする、請求項6に記載のホットバックアップ方法。
  9. 前記方法は、
    前記マスターサーバで生成されたデータ操作情報を周期的にバックアップし、前記マスターサーバのフルバックアップリストア機能が利用できるか否かを定期的に検証するようにサンドボックスサーバを制御するステップをさらに含むことを特徴とする、請求項6に記載のホットバックアップ方法。
  10. 前記稼働状態の異常に基づいて、前記マスターサーバ、スレーブサーバおよび遅延サーバのアイデンティティロールの切替え管理をそれぞれ行うステップは、
    前記稼働状態の異常に基づいて対応するデータ障害レベルを決定するステップと、
    前記データ障害レベルに基づいて、前記マスターサーバ、スレーブサーバ、遅延サーバ、およびサンドボックスサーバの新たなアイデンティティ属性をそれぞれ決定するステップと、
    前記新たなアイデンティティ属性に基づいて前記マスターサーバ、スレーブサーバ、遅延サーバ、およびサンドボックスサーバのアイデンティティの切替えをそれぞれ行うステップと、を含むことを特徴とする、請求項9に記載のホットバックアップ方法。
  11. メモリと、プロセッサと、メモリに格納され、プロセッサで実行可能なコンピュータプログラムと、を含むコンピュータ機器であって、
    前記プロセッサは、前記プログラムを実行するときに、請求項6〜10のいずれかに記載のホットバックアップ方法を実現することを特徴とする、コンピュータ機器。
JP2019132717A 2018-08-30 2019-07-18 ホットバックアップシステム、ホットバックアップ方法、及びコンピュータ機器 Active JP6827501B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201811002727.8A CN109032849B (zh) 2018-08-30 2018-08-30 热备份系统、热备份方法和计算机设备
CN201811002727.8 2018-08-30

Publications (2)

Publication Number Publication Date
JP2020035430A true JP2020035430A (ja) 2020-03-05
JP6827501B2 JP6827501B2 (ja) 2021-02-10

Family

ID=64625642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019132717A Active JP6827501B2 (ja) 2018-08-30 2019-07-18 ホットバックアップシステム、ホットバックアップ方法、及びコンピュータ機器

Country Status (4)

Country Link
US (1) US11397647B2 (ja)
EP (1) EP3617886B1 (ja)
JP (1) JP6827501B2 (ja)
CN (1) CN109032849B (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263095B (zh) * 2019-05-31 2021-10-01 众安在线财产保险股份有限公司 数据备份与恢复方法、装置、计算机设备及存储介质
CN110362429B (zh) * 2019-07-12 2021-08-06 优刻得科技股份有限公司 数据库的连续数据保护方法、系统、设备和介质
CN110768821B (zh) * 2019-09-23 2022-04-08 北京控制工程研究所 一种针对四机热备份计算机的数据交换比对区设计方法
CN112540884B (zh) * 2019-09-23 2024-04-05 西安诺瓦星云科技股份有限公司 热备份效果检测方法、装置、系统和计算机可读介质
CN111800476A (zh) * 2020-06-14 2020-10-20 洪江川 基于大数据和云计算的数据处理方法及云端大数据服务器
CN112445654A (zh) * 2020-11-30 2021-03-05 北京数码视讯技术有限公司 数据处理系统和方法
CN112506714B (zh) * 2021-01-12 2022-04-01 博智安全科技股份有限公司 一种Windows系统热备份方法和对应的热恢复方法
CN113342581A (zh) * 2021-08-05 2021-09-03 中国人民解放军国防科技大学 一种基于云平台的主备软件管理方法和系统
CN113792340B (zh) * 2021-09-09 2023-09-05 烽火通信科技股份有限公司 一种用于数据库逻辑日志审计的方法及装置
CN115361269B (zh) * 2022-07-08 2023-05-30 福建新大陆通信科技股份有限公司 一种应急广播设备热备份方法
CN115694749A (zh) * 2022-10-25 2023-02-03 重庆长安汽车股份有限公司 一种应用冗余方法、装置、设备、存储介质
CN116233367B (zh) * 2023-02-28 2023-09-22 广州淏华实业有限公司 一种银行室内金库智慧监控方法及其系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004280528A (ja) * 2003-03-17 2004-10-07 Hitachi Ltd データベースシステム、サーバ、問い合わせ投入方法及びデータ更新方法
WO2010106991A1 (ja) * 2009-03-19 2010-09-23 株式会社ココリンク データの複製管理方法及びシステム
WO2017042890A1 (ja) * 2015-09-08 2017-03-16 株式会社東芝 データベースシステム、サーバ装置、プログラムおよび情報処理方法
CN106850255A (zh) * 2016-12-20 2017-06-13 曙光信息产业(北京)有限公司 一种多机备份的实现方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5239640A (en) * 1991-02-01 1993-08-24 International Business Machines Corporation Data storage system and method including data and checksum write staging storage
US6721902B1 (en) * 2000-10-12 2004-04-13 Hewlett-Packard Development Company, L.P. Method and system for providing LUN-based backup reliability via LUN-based locking
EP1370947A4 (en) * 2001-02-13 2009-05-27 Candera Inc STORAGE VIRTUALIZATION SERVER SILICON BASE
EP1537496B1 (en) * 2002-09-10 2008-07-02 Exagrid Systems, Inc. Data protection system and method
JP2005031716A (ja) * 2003-07-07 2005-02-03 Hitachi Ltd データバックアップの方法及び装置
US7228395B2 (en) * 2003-10-09 2007-06-05 International Business Machines Corporation System and method of servicing read requests from a common mirror
US8209506B2 (en) * 2007-09-05 2012-06-26 Emc Corporation De-duplication in a virtualized storage environment
US8112661B1 (en) * 2009-02-02 2012-02-07 Netapp, Inc. Method and system for changing a protection policy for a dataset in a network storage system
EP2452469A1 (en) * 2009-07-10 2012-05-16 Nokia Siemens Networks OY Method and device for conveying traffic
US8943328B2 (en) * 2010-01-29 2015-01-27 Hewlett-Packard Development Company, L.P. Key rotation for encrypted storage media
CN101917263A (zh) * 2010-08-16 2010-12-15 深圳市赫迪威信息技术有限公司 多机热备的方法及系统
US20160162371A1 (en) * 2011-01-05 2016-06-09 Netapp, Inc. Supporting multi-tenancy through service catalog
CN102158540A (zh) * 2011-02-18 2011-08-17 广州从兴电子开发有限公司 分布式数据库实现系统及方法
US9798629B1 (en) * 2013-12-16 2017-10-24 EMC IP Holding Company LLC Predicting backup failures due to exceeding the backup window
CN103970624A (zh) 2014-05-06 2014-08-06 上海动联信息技术股份有限公司 一种身份认证一体机的备份方法及还原方法
CN104158693B (zh) 2014-08-27 2018-04-13 乐视网信息技术(北京)股份有限公司 数据服务的容灾备份方法和系统
US10061233B2 (en) * 2014-12-09 2018-08-28 International Business Machines Corporation Computer system backup performance optimization through performance analytics
CN104537046B (zh) * 2014-12-24 2018-09-11 北京奇虎科技有限公司 数据补全方法和装置
CN106254100B (zh) * 2016-07-27 2019-04-16 腾讯科技(深圳)有限公司 一种数据容灾方法、装置和系统
CN107957918B (zh) * 2016-10-14 2019-05-10 腾讯科技(深圳)有限公司 数据恢复方法和装置
CN108390781A (zh) * 2018-02-12 2018-08-10 王磊 一种主机自动热备份的方法与系统
CN110545541B (zh) * 2019-09-20 2023-06-23 百度在线网络技术(北京)有限公司 防御攻击行为的方法、装置、设备、终端和介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004280528A (ja) * 2003-03-17 2004-10-07 Hitachi Ltd データベースシステム、サーバ、問い合わせ投入方法及びデータ更新方法
WO2010106991A1 (ja) * 2009-03-19 2010-09-23 株式会社ココリンク データの複製管理方法及びシステム
WO2017042890A1 (ja) * 2015-09-08 2017-03-16 株式会社東芝 データベースシステム、サーバ装置、プログラムおよび情報処理方法
CN106850255A (zh) * 2016-12-20 2017-06-13 曙光信息产业(北京)有限公司 一种多机备份的实现方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
川上 明久: "実践AWS! 企業クラウドの設計パターン", 日経SYSTEMS 2015年9月号, JPN6020036776, 26 August 2015 (2015-08-26), JP, pages 74 - 79, ISSN: 0004356078 *
松信 嘉範: "MySQLパワーアップ講座 後編 MySQLのレプリケーション", SOFTWAREDESIGN 2008年10月号, JPN6020036771, 18 October 2008 (2008-10-18), JP, pages 114 - 121, ISSN: 0004356076 *
松信 嘉範: "本気で取り組むDBAのためのMySQL入門", DB MAGAZINE 2004年12月号, JPN6020036773, 1 December 2004 (2004-12-01), JP, pages 206 - 213, ISSN: 0004356077 *

Also Published As

Publication number Publication date
EP3617886B1 (en) 2021-07-14
US11397647B2 (en) 2022-07-26
JP6827501B2 (ja) 2021-02-10
EP3617886A1 (en) 2020-03-04
CN109032849A (zh) 2018-12-18
US20200073761A1 (en) 2020-03-05
CN109032849B (zh) 2021-03-23

Similar Documents

Publication Publication Date Title
JP6827501B2 (ja) ホットバックアップシステム、ホットバックアップ方法、及びコンピュータ機器
US9798632B2 (en) Providing boot data in a cluster network environment
US11194679B2 (en) Method and apparatus for redundancy in active-active cluster system
CN108038019B (zh) 一种基板管理控制器的故障自动恢复方法及系统
CN109495312B (zh) 基于仲裁盘和双链路的高可用集群的实现方法和系统
WO2017177941A1 (zh) 主备数据库切换方法和装置
US20070276983A1 (en) System method and circuit for differential mirroring of data
KR20110044858A (ko) 데이터 센터들에 걸쳐 데이터 서버들내 데이터 무결정의 유지
CN102708150A (zh) 异步复制数据的方法、装置和系统
CN104036043A (zh) 一种mysql高可用的方法及管理节点
CN110825562B (zh) 数据备份方法、装置、系统和存储介质
CN104486438A (zh) 分布式存储系统的容灾方法及装置
CN111158955A (zh) 一种基于卷复制的高可用系统以及多服务器数据同步方法
US11550677B2 (en) Client-less database system recovery
WO2018076696A1 (zh) 一种数据同步方法及带外管理设备
CN108243031A (zh) 一种双机热备的实现方法及装置
US20090150459A1 (en) Highly available multiple storage system consistency heartbeat function
US11016863B2 (en) Self-contained disaster detection for replicated multi-controller systems
CN115373896B (zh) 一种基于分布式块存储的副本数据恢复方法和系统
CN116069373A (zh) 一种bmc固件升级方法、装置及其介质
CN104346233A (zh) 一种用于计算机系统的故障恢复方法及装置
US9535806B1 (en) User-defined storage system failure detection and failover management
US11010269B2 (en) Distributed processing system and method for management of distributed processing system
CN110321261B (zh) 一种监控系统及监控方法
CN117827544B (zh) 热备份系统、方法、电子设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190718

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210119

R150 Certificate of patent or registration of utility model

Ref document number: 6827501

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250