JP2005173751A - 仮想マシンシステムを用いたマスタシステム稼動管理方法 - Google Patents
仮想マシンシステムを用いたマスタシステム稼動管理方法 Download PDFInfo
- Publication number
- JP2005173751A JP2005173751A JP2003409789A JP2003409789A JP2005173751A JP 2005173751 A JP2005173751 A JP 2005173751A JP 2003409789 A JP2003409789 A JP 2003409789A JP 2003409789 A JP2003409789 A JP 2003409789A JP 2005173751 A JP2005173751 A JP 2005173751A
- Authority
- JP
- Japan
- Prior art keywords
- master
- master system
- virtual machine
- operation management
- management method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
【課題】 マスタシステムとバックアップシステムが固定された拠点に存在することで、悪意ある第三者から障害を発生させる行為があった場合、障害切り替えやデータの回復が出来なくなるという問題や、天災等の物理的要因より拠点そのものに障害が発生した際に即座に別拠点を用意する必要があるという問題があった。本発明は、仮想マシンシステムを用いて、安定したマスタシステム稼働管理を実現する。
【解決手段】 本発明では、ネットワークを介して接続する複数拠点に設置したコンピュータシステムに仮想マシンシステム技術を適用し、マスタシステムとバックアップシステムを定期的、又は不定期的に切り替え処理を行うことで、安定したシステム稼働管理を実現する。また、仮想マシンシステム技術を取り入れることで、ハードウェアはシステムに依存しない為、新たな拠点を用意する際の迅速な対応を実現する。
【選択図】 図1
【解決手段】 本発明では、ネットワークを介して接続する複数拠点に設置したコンピュータシステムに仮想マシンシステム技術を適用し、マスタシステムとバックアップシステムを定期的、又は不定期的に切り替え処理を行うことで、安定したシステム稼働管理を実現する。また、仮想マシンシステム技術を取り入れることで、ハードウェアはシステムに依存しない為、新たな拠点を用意する際の迅速な対応を実現する。
【選択図】 図1
Description
本発明は、バックアップシステムを用いてコンピュータシステムの安定稼動を実現する稼働管理方法に関し、特に仮想マシンシステム技術を用いてコンピュータシステムの安定稼動を実現する稼働管理方法に関する。
社会の基幹となるような重要なサービスを提供するシステムにおいてはマスタシステムの安定稼動が要求され、障害発生の際にも即時に再開することが必須とされている。このため、マスタシステムの他にバックアップシステムを設定し、障害発生の際に即時回復を図る対策が取られている。
従来、ある拠点のシステムをバックアップする方法としては、マスタシステムのバックアップデータを、バックアップセンタとなる固定された拠点に保管する方法が用いられている。そして、マスタシステム障害時には新たにハードウェアを調達し、バックアップデータを基にマスタシステムの復旧を行う方法が用いられている。最近では非特許文献1及び非特許文献2に示すような仮想マシンシステムの考えが導入されており、ハード構成の異なるコンピュータ間でも同一の機能を持つシステムとして稼動させることが可能になっているので、バックアップシステムに必ずしもマスタシステムと同一のハード構成を要しなくなっている。
SoftwareDesign 2002年11月号 「VMwareメカニズム徹底解剖」
UNIX(登録商標) MAGAZINE 2002年1月号 「Vmware Workstation」
上記従来の方法では、マスタシステムとバックアップシステムは固定された拠点に存在するので、悪意ある第三者にその存在を発見され、両者に障害を発生させる行為があった場合、稼動切り替えやデータの回復ができなくなるという問題があった。また、天災等の外部からの物理的要因によって、拠点そのものに障害が発生した場合、即座に別拠点でシステムを稼働させる為に新たなバックアップセンタを用意する必要があるという問題があった。この場合、仮想システム技術を用いればハードウェアを同一にする必要は無いが、マスタシステムとバックアップシステムという2つの固定システムが常時必要なため、新たなシステムの構築は必須であった。
本発明の目的は、上記課題を解決し複数拠点に設置したマスタシステム及びバックアップシステムを安定に稼動し、障害時に速やかにマスタシステムの切り替えまたは再起動を可能とする稼動管理方法を提供することにある。
上記課題を解決するために、本発明はネットワークを介して接続する複数拠点に設置したコンピュータシステムに非特許文献1及び非特許文献2に示すような仮想マシンシステム技術を適用し、3つ以上の複数拠点に設置したコンピュータシステムを複数の仮想システムとして設定し、仮想システムの1つをマスタシステム、他の少なくとも1つをバックアップシステムとして設定する。このマスタシステムとバックアップシステムの設定は恒久的でなく、仮想システムにデータ同期機能とマスタシステム設定切り替え機能を備えて、マスタシステムのマシンを自律的に変更する。これにより上記課題を解決する。3つ以上の複数拠点に設置したコンピュータシステムが必要であるが、これらは仮想マシンとして稼動しているので複数のシステムとして利用することが可能であり、1つのコンピュータの1つの仮想マシンがバックアップシステムとして待機状態でも他の仮想マシンは別のマスタシステムとして稼動することができるので、資源を有効に利用することができる。
ハードウェア構成としては、各拠点に設置のコンピュータは、仮想システムとして設定できるものであれば、ハードウェア、ソフトウェア構成は問わない。1台のコンピュータに1システムとは限らず、システムが必要とするスペックを満たしていれば、全く関係のない複数システムを1台のサーバに構築しても良い。各コンピュータ間はネットワークで接続し、マスタシステムの変動時に次のマスタシステムとなるコンピュータに対しデータ転送を行う。
次に、マスタシステムを自律的に変更する処理を説明する。上記複数のシステムにそれぞれマスタシステム制御機能を持たせ、各システム上で独立して定期的にランダム値を発行する。但し、発行タイミングはシステム間で同期を取ることとする。マスタシステム制御機能は、自身の発行したランダム値と他のシステムで発行したランダム値を比較し、自身の値が最も大きい場合に自身を次のマスタシステムとして稼働する。この時、前回マスタシステムとして稼働していたシステムが自身でない場合は、前回のマスタシステムからデータを取得してデータ同期を取った後に切り替え処理を行う。前回のマスタシステムが自身である場合には、連続してマスタシステムとなることはなく、マスタシステム制御機能が動作する都度、別コンピュータ上のシステムが稼働する。自身の値が他のコンピュータで発行されたものより小さい場合には、次の実行スケジュールまで待機する。尚、制御機能実行のタイミングはシステム毎のスケジューリング機能により制御する。マスタシステムを変更する処理方法はこれに限定されず、予め作成したスケジュールに従って定期的に変更しても、予め設定した関数の値に従って変更しても良い。
各システムにはマスタリストを持たせ、それにリストアップされているコンピュータを参照することで、現在稼働しているコンピュータと、過去のマスタシステムを稼働させていたコンピュータを認識できる仕組みとする。システムの変更処理に基づく切り替えでなく、マスタシステムに障害が発生した場合の切り替えではデータを取得することができないので、このリストを参照して各システムがマスタシステムの生死を監視し、マスタシステムに障害が確認された際に、データが一番新しい前回稼働していたシステムをマスタシステムに選定し、即座に切り替え処理を行う。
以上のように本発明の仮想マシンシステムを用いたマスタシステム稼動管理方法によれば、仮想システムによりバックアップを実現するので、仮想システムを実装できるものであればハードウェアに依存せず、マスタシステム環境とは異なる構成のコンピュータをバックアップコンピュータとして利用できる。また、マスタシステムが自立的に切り替わる為、どの拠点のシステムが今マスタシステムとして稼働しているかわかり難くする効果があり、1つのシステムに外部からの侵入があった場合でも、切り替え用のシステムがどこにあるかもわからないので、外部からの侵入に対して有効である。
また、構成や仕様の異なるコンピュータシステムを利用することができる為、全く同じハードウェアやシステムを準備すること無く、新たなバックアップシステムを設定することが可能である。
以下、本発明による仮想マシンシステムを用いたマスタシステム稼動管理方法の実施の形態を図を用いて説明する。
図1は、本発明による複数拠点に設置のコンピュータ上でマスタシステムの設定を変更する仮想システムの構成の一例である。ここでは3つのセンタの4台のコンピュータを用いた例を示す。各拠点のコンピュータには共通して仮想システムを構築する。仮想マシンシステムを動作させるそれぞれのコンピュータのホストOSa100、OSb200、OSc300、OSd400は、各機器で同じである必要はない。仮想システム上には複数の異なるシステムを構築することが可能である。例えばコンピュータ1にはSystemA101とSystemB201を構築している。各センタはそれぞれ専用線103、203、303で接続し、別センタのコンピュータとの通信に使用する。各コンピュータのシステム毎に、コンピュータ1のSystemA101のマスタシステム制御機能102のようなマスタシステム制御機能を備え、これによりシステム間でランダムにマスタシステムを変更させる。マスタシステム制御機能102には、マスタシステムの変更をスケジューリングするスケジューリング機能104とマスタの変更履歴を格納するマスタリスト105を備える。
次に、マスタシステム制御機能の処理の流れを図2により説明する。図2は、図1のSystemAが構築されているコンピュータ1、コンピュータ3、コンピュータ4のうち、コンピュータ1上のマスタシステム制御機能102の処理を表すフローである。まず、コンピュータ1のSystemAのスケジューリング機能104により定期的にランダム値を発行する(ステップ201)。他のSystemAが構築されたコンピュータもスケジューリング機能により同時にランダム値を発行する。自身の発行したランダム値を他のコンピュータ上のランダム値と比較し(ステップ202)、自身の値が最も大きい場合には、それまでマスタシステムであったコンピュータからデータのコピーを行い(ステップ204)、次のマスタシステムとして稼働を開始する(ステップ205)。マスタシステムとして稼働したシステムは、自身のマスタリスト105の最後に自マシン名を追加し(ステップ209)、他のシステムに更新したマスタリストを配信する(ステップ210)。これにより、全てのシステムが現在稼働しているマスタシステムの存在を認識する。但し、自身のランダム値が他のランダム値より大きくとも、それまで自身がマスタシステムとして稼働していた場合(ステップ203)には、連続して次のマスタシステムとせずに、次のマスタシステムが稼働したことを確認(ステップ207)した後、自身のシステム稼動を停止する(ステップ206)。自身がマスタシステムであった場合の次のマスタシステムは、自身以外でランダム値が最も大きいシステムとなる。また、自身のランダム値が他のランダム値よりも小さい値の場合にも、同様にシステムを停止する(ステップ207、206)。
ここではマスタシステムが続けて同じシステムにならない場合を説明したが、より不確定性を増したい場合には、連続設定を許可することとしても良い。
図3は、図2の処理の流れに従ってマスタシステムがランダムに変更した例を表すチャート図である。ここではスケジュール機能により1時間単位でマスタシステム制御機能が動作し、マスタシステムが変更している様子を表している。このようなタイムチャートを1日等の短い単位で予め作成し、これに基づいてマスタシステムの変更を実施しても良い。
次に、マスタシステムの障害時における、マスタシステム制御機能の処理について図4を用いて説明する。各システムは自身が持つマスタリストを参照し、現在のマスタシステムにむけてpingコマンドを実行することでマスタシステムの生死を監視する(ステップ401)。pingの応答が返ってこない場合(ステップ402)にはマスタシステム障害発生とみなし、マスタリストの前回稼働していたシステムと自身を比較する(ステップ403)。障害の場合はデータ同期が取れないので、一番新しいデータを持つシステム、すなわち前回稼働していたシステムが代替となる必要がある。自身が前回稼働していたシステムである場合には自身をマスタシステムとして設定し、稼働を開始する(ステップ404)。稼働開始後、正常時のマスタシステム変更処理と同様に、マスタリストの最後に自マシンを追加し(ステップ405)、全システムに向けて更新したマスタリストを配信する(ステップ406)。これにより、全てのシステムが現在稼働しているマスタシステムの存在を認識する。以上のようにして、障害時の速やかなマスタシステム切り替えが実現する。
100、200、300、400…仮想マシンシステムを動作させるコンピュータOS、101…仮想システム上のシステム、102…マスタシステム制御機能、103、203、303…各拠点を接続する専用線、104…スケジューリング機能、105…マスタリスト。
Claims (3)
- ネットワークを介して接続する複数拠点に設置したコンピュータシステムを複数の仮想マシンシステムとして設定し、複数の仮想マシンシステム間でデータ同期処理を行う機能を備え、少なくとも1つをマスタシステムとして設定し、他の少なくとも1つを待機システムとして設定し、マスタシステム変更機能を備え、前記マスタシステムを定期的または不定期的に変更することを特徴とする、仮想マシンシステムを用いたマスタシステム稼動管理方法。
- 請求項1に記載のマスタシステム稼動管理方法において、一つの物理的コンピュータ上に複数の仮想コンピュータが存在する設定とし、各々が独立に稼動してマスタシステムの変更を実施することを特徴とする仮想マシンシステムを用いたマスタシステム稼動管理方法。
- 請求項1または請求項2に記載のマスタシステム稼動管理方法において、マスタシステムとして設定したシステムに障害が発生した時に自律的に最新のデータを持つ代替システムを選定する機能を複数コンピュータの全てに備え、該選定したシステムをマスタシステムとして設定し、マスタシステムの処理を引き継ぐことを特徴とする仮想マシンシステムを用いたマスタシステム稼動管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003409789A JP2005173751A (ja) | 2003-12-09 | 2003-12-09 | 仮想マシンシステムを用いたマスタシステム稼動管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003409789A JP2005173751A (ja) | 2003-12-09 | 2003-12-09 | 仮想マシンシステムを用いたマスタシステム稼動管理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005173751A true JP2005173751A (ja) | 2005-06-30 |
Family
ID=34731029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003409789A Pending JP2005173751A (ja) | 2003-12-09 | 2003-12-09 | 仮想マシンシステムを用いたマスタシステム稼動管理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005173751A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009211517A (ja) * | 2008-03-05 | 2009-09-17 | Nec Corp | 仮想計算機冗長化システム |
US7634681B2 (en) | 2005-11-29 | 2009-12-15 | Hitachi, Ltd. | Failure recovery method |
JP2010530108A (ja) * | 2007-06-15 | 2010-09-02 | サヴィス・インコーポレーテッド | 共有データセンタ災害復旧システム及び方法 |
JP2010231257A (ja) * | 2009-03-25 | 2010-10-14 | Nec Corp | 高可用性システム、高可用性システムの対障害対策方法 |
US8032786B2 (en) | 2007-06-06 | 2011-10-04 | Hitachi, Ltd. | Information-processing equipment and system therefor with switching control for switchover operation |
JP2012248184A (ja) * | 2011-05-26 | 2012-12-13 | Siemens Ag | 自動化システムへアクセスする方法、ならびに本方法に基づいて動作するシステム |
JP2014154056A (ja) * | 2013-02-13 | 2014-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 冗長化システムおよび現用機決定方法 |
WO2019132431A1 (ko) * | 2017-12-28 | 2019-07-04 | 효성중공업 주식회사 | 이중화 보드에서 마스터/슬레이브 설정방법 및 그 보드 |
JP2021019209A (ja) * | 2019-07-17 | 2021-02-15 | 株式会社京三製作所 | モバイルipシステムおよびホームエージェント冗長制御方法 |
-
2003
- 2003-12-09 JP JP2003409789A patent/JP2005173751A/ja active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7634681B2 (en) | 2005-11-29 | 2009-12-15 | Hitachi, Ltd. | Failure recovery method |
US7934119B2 (en) | 2005-11-29 | 2011-04-26 | Hitachi, Ltd. | Failure recovery method |
US8352778B2 (en) | 2005-11-29 | 2013-01-08 | Hitachi, Ltd. | Failure recovery method |
US8694820B2 (en) | 2005-11-29 | 2014-04-08 | Hitachi, Ltd. | Failure recovery method |
US8032786B2 (en) | 2007-06-06 | 2011-10-04 | Hitachi, Ltd. | Information-processing equipment and system therefor with switching control for switchover operation |
JP2010530108A (ja) * | 2007-06-15 | 2010-09-02 | サヴィス・インコーポレーテッド | 共有データセンタ災害復旧システム及び方法 |
JP2009211517A (ja) * | 2008-03-05 | 2009-09-17 | Nec Corp | 仮想計算機冗長化システム |
JP2010231257A (ja) * | 2009-03-25 | 2010-10-14 | Nec Corp | 高可用性システム、高可用性システムの対障害対策方法 |
JP2012248184A (ja) * | 2011-05-26 | 2012-12-13 | Siemens Ag | 自動化システムへアクセスする方法、ならびに本方法に基づいて動作するシステム |
JP2014154056A (ja) * | 2013-02-13 | 2014-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 冗長化システムおよび現用機決定方法 |
WO2019132431A1 (ko) * | 2017-12-28 | 2019-07-04 | 효성중공업 주식회사 | 이중화 보드에서 마스터/슬레이브 설정방법 및 그 보드 |
JP2021019209A (ja) * | 2019-07-17 | 2021-02-15 | 株式会社京三製作所 | モバイルipシステムおよびホームエージェント冗長制御方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2902922B1 (en) | Distributed file system and data backup method for distributed file system | |
CN111427728B (zh) | 状态管理方法、主备切换方法及电子设备 | |
CN105812169B (zh) | 一种主备机切换方法及装置 | |
JP3887130B2 (ja) | 高可用性計算機システム及び同システムにおけるデータバックアップ方法 | |
WO2016177231A1 (zh) | 基于双主控的主备倒换方法及装置 | |
CN115576655B (zh) | 容器数据保护系统、方法、装置、设备及可读存储介质 | |
JP2005173751A (ja) | 仮想マシンシステムを用いたマスタシステム稼動管理方法 | |
CN111597536A (zh) | 一种hadoop集群kerberos高可用认证方法 | |
CN104572344A (zh) | 一种多云间数据备份的方法和系统 | |
CN104010034A (zh) | 一种高可用集群关于组依赖的管理方法 | |
CN105589756A (zh) | 批处理集群系统以及方法 | |
CN105959078A (zh) | 一种集群时间同步方法、集群及时间同步系统 | |
JP5775473B2 (ja) | エッジ装置冗長化システム、切替制御装置およびエッジ装置冗長化方法 | |
CN107046474A (zh) | 一种服务集群 | |
JP2007233586A (ja) | 二重化制御装置及び二重化制御方法 | |
CN112087506B (zh) | 一种集群节点管理方法、装置及计算机存储介质 | |
CN102591750A (zh) | 集群系统的恢复方法 | |
CN111083074A (zh) | 主备双ospf状态机的高可用性方法和系统 | |
CN102983997A (zh) | 主控服务迁移方法及装置 | |
CN102355595A (zh) | 一种网络电视多平台容灾方法及系统 | |
CN114650213B (zh) | 配置Jenkins服务器集群的方法、装置、存储介质 | |
JP2010231257A (ja) | 高可用性システム、高可用性システムの対障害対策方法 | |
JP2009075710A (ja) | 冗長化システム | |
CN113961398A (zh) | 业务处理方法、装置、系统、设备、存储介质和产品 | |
TW201408885A (zh) | 風扇共用控制系統及方法 |