JP4920248B2 - サーバの障害回復方法及びデータベースシステム - Google Patents
サーバの障害回復方法及びデータベースシステム Download PDFInfo
- Publication number
- JP4920248B2 JP4920248B2 JP2005348918A JP2005348918A JP4920248B2 JP 4920248 B2 JP4920248 B2 JP 4920248B2 JP 2005348918 A JP2005348918 A JP 2005348918A JP 2005348918 A JP2005348918 A JP 2005348918A JP 4920248 B2 JP4920248 B2 JP 4920248B2
- Authority
- JP
- Japan
- Prior art keywords
- server
- database
- servers
- processing
- data area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1479—Generic software techniques for error detection or fault masking
- G06F11/1482—Generic software techniques for error detection or fault masking by means of middleware or OS functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2025—Failover techniques using centralised failover control functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2038—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
Description
図14〜図17は、第2の実施形態を示し、前記第1の実施形態に示したフローチャートを置き換えて新たな処理を表したフローチャートである。本第2実施形態では、第一の実施形態における図7、図9、図11、図12の処理を図14,図15、図16、図17と置き換えたものであり、その他の処理は前記第1の実施形態と同様である。
120、220、320 DBサーバ
110、210、310、410 クラスタプログラム
420 データベース管理サーバ
500 ログ領域
600 データ領域
431 領域割当管理部
432 回復処理管理部
433 トランザクション制御部
434 領域・サーバ対応表
435 トランザクション・領域対応表
Claims (4)
- 現用系のサーバと待機系のサーバを有して、データベース処理のトランザクションを分割して実行する複数のサーバと、前記サーバがアクセスするデータ領域とログ領域とを予め設定したストレージ装置と、前記複数のサーバに割り当てるトランザクションを管理する管理サーバと、を備え、前記複数のサーバのうちの何れかに障害が発生したときには、障害のない正常なサーバに前記トランザクションを引き継ぐサーバの障害回復方法であって、
前記複数のサーバのうち障害の発生したサーバを特定する手順と、
前記障害が発生したサーバが利用していたストレージ装置のデータ領域とログ領域とをそれぞれ特定する手順と、
前記障害が発生したサーバで実行されていた処理に関連するトランザクションを実行していた少なくとも2以上の他のサーバの処理を中断する手順と、
前記障害が発生したサーバがアクセスする前記データ領域を正常な少なくとも2以上の他のサーバに割り当てる手順と、
前記障害が発生したサーバがアクセスする前記ログ領域を、前記障害が発生したサーバのデータ領域が割り当てられた少なくとも2以上のサーバで共有する手順と、
前記障害が発生したサーバがアクセスするデータ領域を割り当てられた少なくとも2以上のサーバのそれぞれが、前記共有したログ領域に基づいて処理を中断した時点まで前記データ領域を回復する手順と、
を含み、
前記障害が発生したサーバがアクセスする前記データ領域を正常な少なくとも2以上の他のサーバに割り当てる手順は、
前記サーバの負荷に基づいて縮退と系切り替えの一方を選択する手順と、
前記系切り替えを選択した場合には、待機系のサーバで障害の発生した現用系のサーバの処理を引き継ぐ手順と、
前記縮退を選択した場合には、前記障害が発生したサーバのデータ領域を引き継ぐサーバの負荷が等しくなるように前記データ領域を正常なサーバに割り当てる手順と、
を含むことを特徴とするサーバの障害回復方法。 - 前記サーバの負荷に基づいて縮退と系切り替えの一方を選択する手順は、
縮退を選択したときのサーバの負荷と、系切り替えを選択したときのサーバの負荷を比較して、サーバの負荷の偏りが少ない方を選択することを特徴とする請求項1に記載のサーバの障害回復方法。 - ネットワークを介して接続されて現用系と待機系からなり、データベース処理のトランザクションを分割して実行する複数のデータベースサーバと、
前記データベースサーバがアクセスする複数のデータ領域と、複数のログ領域を予め設定したストレージ装置と、
前記複数のデータベースサーバに割り当てるトランザクションを管理する管理サーバと、
を備え、前記複数のデータベースサーバのうちの何れかに障害が発生したときには、障害のない正常なデータベースサーバに前記トランザクションを引き継ぐデータベースシステムにおいて、
前記管理サーバは、
前記複数のデータ領域及びログ領域にアクセスするデータベースサーバを割り当てる領域割り当て管理部と、
前記複数のデータベースサーバに前記トランザクションを配分するトランザクション制御部と、
前記複数のデータベースサーバのうち障害が発生したデータベースサーバを特定し、縮退または系切り替えの一方を選択するクラスタ管理部と、
前記障害が発生したデータベースサーバがアクセスするデータ領域を回復する回復処理管理部と、を備え、
前記領域割り当て管理部は、
前記障害が発生したデータベースサーバがアクセスしていたストレージ装置のデータ領域とログ領域とをそれぞれ特定し、
前記トランザクション制御部は、
前記障害が発生したデータベースサーバで実行されていた処理に関連するトランザクションを実行していた少なくとも2以上の他のデータベースサーバの処理を中断し、前記障害が発生したデータベースサーバがアクセスしていた前記データ領域を正常な少なくとも2以上の他のデータベースサーバに割り当て、
前記クラスタ管理部は、
前記データベースサーバの負荷に基づいて縮退と系切り替えの一方を選択し、
前記回復処理管理部は、
前記障害が発生したデータベースサーバがアクセスする前記ログ領域を、前記障害が発生したデータベースサーバのデータ領域が割り当てられた少なくとも2以上のデータベースサーバで共有させ、前記障害が発生したデータベースサーバがアクセスするデータ領域を割り当てられた少なくとも2以上のデータベースサーバのそれぞれに、前記共有したログ領域に基づいて処理を中断した時点まで前記データ領域を回復させ、前記クラスタ管理部が前記系切り替えを選択した場合には、待機系のデータベースサーバで障害の発生した現用系のデータベースサーバの処理を引き継ぎ、前記クラスタ管理部が前記縮退を選択した場合には、前記障害が発生したデータベースサーバのデータ領域を引き継ぐサーバの負荷が等しくなるように前記データ領域を正常なデータベースサーバに割り当てることを特徴とするデータベースシステム。 - 前記クラスタ管理部は、
前記縮退を選択したときのサーバの負荷と、系切り替えを選択したときのサーバの負荷を比較して、サーバの負荷の偏りが少ない方を選択することを特徴とする請求項3に記載のデータベースシステム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005348918A JP4920248B2 (ja) | 2005-12-02 | 2005-12-02 | サーバの障害回復方法及びデータベースシステム |
US11/347,202 US20070130220A1 (en) | 2005-12-02 | 2006-02-06 | Degraded operation technique for error in shared nothing database management system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005348918A JP4920248B2 (ja) | 2005-12-02 | 2005-12-02 | サーバの障害回復方法及びデータベースシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007156679A JP2007156679A (ja) | 2007-06-21 |
JP4920248B2 true JP4920248B2 (ja) | 2012-04-18 |
Family
ID=38120023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005348918A Expired - Fee Related JP4920248B2 (ja) | 2005-12-02 | 2005-12-02 | サーバの障害回復方法及びデータベースシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20070130220A1 (ja) |
JP (1) | JP4920248B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016046951A1 (ja) * | 2014-09-26 | 2016-03-31 | 株式会社日立製作所 | 計算機システム及びそのファイル管理方法 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8126848B2 (en) * | 2006-12-07 | 2012-02-28 | Robert Edward Wagner | Automated method for identifying and repairing logical data discrepancies between database replicas in a database cluster |
US20080140734A1 (en) * | 2006-12-07 | 2008-06-12 | Robert Edward Wagner | Method for identifying logical data discrepancies between database replicas in a database cluster |
JP4648447B2 (ja) * | 2008-11-26 | 2011-03-09 | 株式会社日立製作所 | 障害復旧方法、プログラムおよび管理サーバ |
JP2011008419A (ja) * | 2009-06-24 | 2011-01-13 | Nec System Technologies Ltd | 分散型情報処理システム及び制御方法並びにコンピュータプログラム |
JP5337639B2 (ja) * | 2009-09-04 | 2013-11-06 | 株式会社日立ハイテクノロジーズ | 半導体装置の製造検査装置、および半導体装置の製造検査装置の制御方法 |
JP2013161252A (ja) * | 2012-02-03 | 2013-08-19 | Fujitsu Ltd | 冗長コンピュータ制御プログラム、方法、及び装置 |
JP5798056B2 (ja) * | 2012-02-06 | 2015-10-21 | 日本電信電話株式会社 | 呼処理情報の冗長化制御システムおよびこれに利用する予備保守サーバ |
JP6291711B2 (ja) * | 2013-01-21 | 2018-03-14 | 日本電気株式会社 | フォールトトレラントシステム |
US20150113314A1 (en) * | 2013-07-11 | 2015-04-23 | Brian J. Bulkowski | Method and system of implementing a distributed database with peripheral component interconnect express switch |
CN103984768B (zh) | 2014-05-30 | 2017-09-29 | 华为技术有限公司 | 一种数据库集群管理数据的方法、节点及系统 |
JP7498731B2 (ja) * | 2022-01-17 | 2024-06-12 | 株式会社日立製作所 | クラスタシステム、復旧方法 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5287501A (en) * | 1991-07-11 | 1994-02-15 | Digital Equipment Corporation | Multilevel transaction recovery in a database system which loss parent transaction undo operation upon commit of child transaction |
JPH06250869A (ja) * | 1993-03-01 | 1994-09-09 | Hitachi Ltd | 分散制御システム |
US5497487A (en) * | 1994-04-28 | 1996-03-05 | The United States Of America As Represented By The Secretary Of The Navy | Merge, commit recovery protocol for real-time database management systems |
US5860137A (en) * | 1995-07-21 | 1999-01-12 | Emc Corporation | Dynamic load balancing |
US6523130B1 (en) * | 1999-03-11 | 2003-02-18 | Microsoft Corporation | Storage system having error detection and recovery |
JP2001084234A (ja) * | 1999-09-14 | 2001-03-30 | Hitachi Ltd | オンライン処理システム |
JP2001184325A (ja) * | 1999-12-27 | 2001-07-06 | Mitsubishi Electric Corp | 通信制御装置、プロセッサモジュール及び記録媒体 |
US6732186B1 (en) * | 2000-06-02 | 2004-05-04 | Sun Microsystems, Inc. | High availability networking with quad trunking failover |
US7562110B2 (en) * | 2001-01-11 | 2009-07-14 | F5 Networks, Inc. | File switch and switched file system |
US6954884B2 (en) * | 2001-06-01 | 2005-10-11 | Lucent Technologies Inc. | System and method for effecting recovery of a network |
US6950833B2 (en) * | 2001-06-05 | 2005-09-27 | Silicon Graphics, Inc. | Clustered filesystem |
JP2003131900A (ja) * | 2001-10-24 | 2003-05-09 | Hitachi Ltd | サーバシステム運用管理方式 |
US7178050B2 (en) * | 2002-02-22 | 2007-02-13 | Bea Systems, Inc. | System for highly available transaction recovery for transaction processing systems |
JP2003258997A (ja) * | 2002-02-27 | 2003-09-12 | Nippon Telegr & Teleph Corp <Ntt> | サービス制御ノードシステムの予備方式 |
US9087319B2 (en) * | 2002-03-11 | 2015-07-21 | Oracle America, Inc. | System and method for designing, developing and implementing internet service provider architectures |
US20040107381A1 (en) * | 2002-07-12 | 2004-06-03 | American Management Systems, Incorporated | High performance transaction storage and retrieval system for commodity computing environments |
JP2004318744A (ja) * | 2003-04-21 | 2004-11-11 | Hitachi Ltd | 高可用性を提供するデータベース処理方法 |
US8234517B2 (en) * | 2003-08-01 | 2012-07-31 | Oracle International Corporation | Parallel recovery by non-failed nodes |
JP2005196602A (ja) * | 2004-01-09 | 2005-07-21 | Hitachi Ltd | 無共有型データベース管理システムにおけるシステム構成変更方法 |
JP2005301436A (ja) * | 2004-04-07 | 2005-10-27 | Hitachi Ltd | クラスタシステムおよびクラスタシステムにおける障害回復方法 |
US7403945B2 (en) * | 2004-11-01 | 2008-07-22 | Sybase, Inc. | Distributed database system providing data and space management methodology |
-
2005
- 2005-12-02 JP JP2005348918A patent/JP4920248B2/ja not_active Expired - Fee Related
-
2006
- 2006-02-06 US US11/347,202 patent/US20070130220A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016046951A1 (ja) * | 2014-09-26 | 2016-03-31 | 株式会社日立製作所 | 計算機システム及びそのファイル管理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2007156679A (ja) | 2007-06-21 |
US20070130220A1 (en) | 2007-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4920248B2 (ja) | サーバの障害回復方法及びデータベースシステム | |
US9182918B2 (en) | Network storage systems having clustered raids for improved redundancy and load balancing | |
US8195777B2 (en) | System and method for adding a standby computer into clustered computer system | |
US8595364B2 (en) | System and method for automatic storage load balancing in virtual server environments | |
US9477743B2 (en) | System and method for load balancing in a distributed system by dynamic migration | |
US7725768B1 (en) | System and method for handling a storage resource error condition based on priority information | |
US9590843B2 (en) | Method and system for providing distributed management in a networked virtualization environment | |
JP4842593B2 (ja) | ストレージ仮想化装置のデバイス制御引継ぎ方法 | |
US10298715B2 (en) | Distributed processing system, task processing method, and storage medium | |
US8402236B2 (en) | Computer system managing volume allocation and volume allocation management method | |
US20060155912A1 (en) | Server cluster having a virtual server | |
WO2011074284A1 (ja) | 仮想計算機の移動方法、仮想計算機システム及びプログラムを格納した記憶媒体 | |
US8078904B2 (en) | Redundant configuration method of a storage system maintenance/management apparatus | |
JP2005216151A (ja) | 資源運用管理システム及び資源運用管理方法 | |
US8201022B2 (en) | Method and system for data processing with high availability | |
JP2007115019A (ja) | ストレージのアクセス負荷を分散する計算機システム及びその制御方法 | |
JP2020021277A (ja) | 情報処理システム、情報処理システムの管理方法及びプログラム | |
WO2015063889A1 (ja) | 管理システム、プラン生成方法、およびプラン生成プログラム | |
US7849264B2 (en) | Storage area management method for a storage system | |
US9262289B2 (en) | Storage apparatus and failover method | |
US20050198411A1 (en) | Commingled write cache in dual input/output adapter | |
US10884881B2 (en) | Scale-out storage system and configuration information control method for implementing high-availability, high-speed failover | |
US7558858B1 (en) | High availability infrastructure with active-active designs | |
US20240354008A1 (en) | Storage system and storage node management method | |
JP5071518B2 (ja) | データベース処理方法、データベース処理システム及びデータベース管理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080905 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100812 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110106 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110825 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120110 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120201 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4920248 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150210 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |