JP3573092B2 - コンピュータシステムにおける共有資源の排他利用方式 - Google Patents

コンピュータシステムにおける共有資源の排他利用方式 Download PDF

Info

Publication number
JP3573092B2
JP3573092B2 JP2000381751A JP2000381751A JP3573092B2 JP 3573092 B2 JP3573092 B2 JP 3573092B2 JP 2000381751 A JP2000381751 A JP 2000381751A JP 2000381751 A JP2000381751 A JP 2000381751A JP 3573092 B2 JP3573092 B2 JP 3573092B2
Authority
JP
Japan
Prior art keywords
cable
nodes
shared resource
node
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000381751A
Other languages
English (en)
Other versions
JP2002185478A (ja
Inventor
英樹 鵜川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2000381751A priority Critical patent/JP3573092B2/ja
Publication of JP2002185478A publication Critical patent/JP2002185478A/ja
Application granted granted Critical
Publication of JP3573092B2 publication Critical patent/JP3573092B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)
  • Small-Scale Networks (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、コンピュータシステムにおける共有資源の排他利用方式に関し、特にハートビート回線の障害時に、共有ディスクへ排他的にアクセスする場合であっても、共有ディスクに論理ディスクを確保することを不要にしたコンピュータシステムにおける共有資源の排他利用方法、及びそのコンピュータシステムに関する。
【0002】
【従来の技術】
コンピュータのクラスタ・システムの一つに、複数のノード(パソコン等のコンピュータ本体)がディスク(外部記憶装置等)を共有する方式がある。
従来の方式を、図1を借用して説明する。図1は本願発明の実施例のシステム構成図である。
図1において、第1ノード1は第1SCSIケーブル5により共有ディスク4と接続され、第2ノード2は第2SCSIケーブル6により共有ディスク4と接続されている。また、第1ノード1と第2ノード2はハートビート回線3で接続され、各ノードが正常に稼動しているか等の情報を交換している。
【0003】
第1ノード1に障害が発生した場合は、ハートビート回線3での情報交換により、第1ノード1で行われていたサービスが第2ノード2で行われるようになる。この時、第1ノード1が第1SCSIケーブル5によりアクセスしていた共有ディスク4も、第2ノード2が第2SCSIケーブル6によりアクセスするようになる。
この様に、ハートビート回線3が「正常に機能している場合」はクラスタを構成する各ノードに障害が発生しても、共有ディスク4は各ノードから排他的にアクセスされ、中のデータが破壊される事はない。
【0004】
ハートビート回線3が「正常に機能していない場合」は、第1ノード1から第2ノード2が正常に機能しているか否か、第2ノード2から第1ノード1が正常に機能しているか否かの確認が出来ず、それぞれ他ノードに障害が発生した事とみなされ、第1ノード1は第2ノード2で行われていたサービスを行うようになり、第2ノード2は第1ノード1で行われていたサービスを行うようになる。この結果、第1ノード1と第2ノード2で同じサービスが実行されるようになり、共有ディスク4へのアクセスも、第1ノード1と第2ノード2の双方から行われるようになり、中のデータを破壊してしまう。
【0005】
これを防ぐために従来は、ハートビート回線3での通信が途絶えた場合、第1ノード1及び第2ノード2は、それぞれ第1SCSIケーブル5,第2SCSIケーブル6より共有ディスク4の特定の論理ディスクに対して書き込みを行い、先に書き込みを行ったノードがそれ以降共有ディスク4に対してアクセスを行うようにしていた。
【0006】
【発明が解決しようとする課題】
しかしながら、従来の方式においては、ハートビート回線3での通信が途絶えた後、各ノードが共有ディスク4の特定の論理ディスクへ書き込みを行うため、この特定の論理ディスクをこの目的のためだけに用意しなくてはならないと言う事である。この論理ディスクはクラスタを構成するノードのうち、どのノードが共有ディスク4へアクセスしても良いかを決定するためだけの物であり、その為だけに最低でも共有ディスク4に構成できる最小の論理ディスクを割り当てなければならないのは無駄である。
【0007】
そこで本発明の課題は、例えばハートビート回線の障害時に、共有ディスクへ排他的にアクセスする場合であっても、共有ディスクに論理ディスクを確保することを不要にしたコンピュータシステムにおける共有資源の排他利用方法、及びそのコンピュータシステムを提供することである。
【0008】
【課題を解決するための手段】
前記課題を解決するために本発明は、LAN上にLANケーブルを介して接続された複数のノードが共有資源を制御し、前記複数のノード間を相互に接続した障害検出用回線により該複数のノードの障害検出を行い、障害の発生したノードによる前記共有資源の制御を排他するコンピュータシステムにおける共有資源の排他利用方法において、
前記複数のノードは、
前記障害検出用回線が正常に機能するか否かを監視し、
前記障害検出用回線が正常に機能していないことを検出した場合には、前記複数のノードから前記共有資源に対して該共有資源の占有を指示するコマンドを発行し、
占有権を取得したノードが、前記共有資源制御することを特徴とする。
【0009】
このようにすれば、障害検出用回線が正常に機能していないことを検出した場合には、複数のノードから共有資源に対して該共有資源の占有を指示するコマンドを発行し、占有権を取得したノードが共有資源の制御を可能にしているので、たとえ障害検出用回線が障害を起した場合であっても、占有権を取得したノードのみが共有資源を制御可能となる。従って、共有資源(共有ディスク)の無駄な使用をすること無しに、共有資源のデータ等の破壊防止ができる。
【0010】
【発明の実施の形態】
以下、本発明を図示の実施例に基づいて説明する。
(1)第1実施例
図1を参照すると、本発明の第1実施例としてのクラスタ・システムが示されている。
図1において、第1ノード1は,クラスタ・システムを構成するノードのうちの一つである。
同様に、第2ノード2もクラスタ・システムを構成するノードのうちの一つである。第1,第2ノードとしては、例えば、パソコン等のコンピュータ本体等がある。第1,第2ノードは、次に説明するハートビート回線が正常に機能するか否かを監視する機能正否監視手段を備える(図示省略)。
【0011】
クラスタ・システム内には、クラスタの各ノードからアクセスする事が出来る「磁気ディスク装置」からなる「共有資源」である共有ディスク4があり、共有ディスク4は第1ノード1とは第1SCSIケーブル5により接続され、第2ノード2とは第2SCSIケーブル6により接続されている。なお、SCSIケーブルは、SCSI−1,SCSI−2,SCSI−3規格の何れのものでもよい。
また、クラスタ・システム内の各ノードは「障害検出用回線」であるハートビート回線3で接続されて、各ノード間で各ノードで実行しているサービスの状況やノードが正常に機能しているか等の情報を通信している。
7は、「LANケーブル」であるEthernetケーブルである。なお、Ethernetケーブルに低速から高速まで各種のものがあるが、何れのものでもよい。
【0012】
次に、本実施例の動作を説明する。
図1において、ハートビート回線3に障害が発生し第1ノード1と第2ノード2間の通信が途絶えると、第1ノード1からは第2ノード2が正常に機能しているかどうかが判らなくなり、第2ノード2からは第1ノード1が正常に機能しているかどうかが判らなくなる。
各ノードは他ノードで実行していたサービスをフェイルオーバー(故障したノードの処理を、代替ノードが引き継ぐこと)して自ノードで実行する必要があるかどうかを判断しなければならない。
【0013】
そこで、第1ノード1は第1SCSIケーブル5で接続された、第2ノード2は第2SCSIケーブル6で接続された共有ディスク4に対してSCSI コマンドの 「占有を指示するコマンド」であるRESERVE コマンド [56h] (SCSI規格)を発行し、共有ディスク4を占有状態に設定できたノードのみが共有ディスク4をアクセス出来るようになる。
【0014】
(2)第2実施例
本発明の第2実施例として、その基本的構成は上記の通りであるが、共有ディスクを占有状態に設定するコマンドの送信方法についてさらに工夫している。
その構成を図2に示す。図2において、第1ノード1は第1FCケーブル15により共有ディスク4と接続され第2ノード2は第2FCケーブル16により共有ディスク4と接続されている。なお、FCケーブルはFiber Channelケーブルである。
【0015】
ハートビート回線3に障害が発生すると、第1ノード1は第1FCケーブル15で接続された共有ディスク4に対し、また第2ノード2は第2FCケーブル16で接続された共有ディスク4に対してSCSIコマンドの RESERVE コマンド [56h] を発行し、共有ディスク4を占有状態に設定できたノードのみが共有ディスク4をアクセス出来るようになる。
このように、本実施例では、クラスタ・システムでの共有ディスク4に対して各ノードとFCケーブル15,16を通してSCSIコマンドで占有状態に設定する為、ハートビート回線3に障害が発生しても、共有ディスクを排他的に利用できる効果を有する。
【0016】
(3)第3実施例
別の構成を図3に示す。図3において、第1ノード1及び第2ノード2はEthernetケーブル7により共有ディスク4と接続されている。
ハートビート回線に障害が発生すると、第1ノード1及び第2ノード2は、Ethernetケーブル7に接続された共有ディスク4に対してSCSIコマンドの RESERVE コマンド [56h] を発行し、共有ディスク4を占有状態に設定できたノードのみが共有ディスク4をアクセス出来るようになる。
このように、本実施例では、クラスタ・システムでの共有ディスク4に対して各ノードとEthernet ケーブルを通してSCSIコマンドで占有状態に設定する為、ハートビート回線3に障害が発生しても、共有ディスクを排他的に利用できる効果を有する。
【0017】
なお、前記各実施例では共有資源として共有ディスクの場合を説明したが、例えば共有資源としてはプリンタ,磁気テープ装置等の場合であっても、本発明を適用可能であるのは勿論である。
【0018】
【発明の効果】
以上説明したように本発明によれば、クラスタ・システムでの共有資源(共有ディスク)に対して各ノードと各種ケーブル(SCSIケーブル等)を通して占有を指示するコマンド(SCSIコマンド)で占有状態に設定する為、障害検出用回線(ハートビート回線)に障害が発生しても、共有ディスク上に論理ディスク領域を占有することなく、共有ディスクを排他的に利用できる効果を有する。
【図面の簡単な説明】
【図1】本発明の第1実施例のシステム構成図である。
【図2】本発明の第2実施例のシステム構成図である。
【図3】本発明の第3実施例のシステム構成図である。
【符号の説明】
1 第1ノード
2 第2ノード
3 ハートビート回線
4 共有ディスク
5 第1SCSIケーブル
6 第2SCSIケーブル
7 Ethernet

Claims (12)

  1. LAN上にLANケーブルを介して接続された複数のノードが共有資源を制御し、前記複数のノード間を相互に接続した障害検出用回線により該複数のノードの障害検出を行い、障害の発生したノードによる前記共有資源の制御を排他するコンピュータシステムにおける共有資源の排他利用方法において、
    前記複数のノードは、
    前記障害検出用回線が正常に機能するか否かを監視し、
    前記障害検出用回線が正常に機能していないことを検出した場合には、前記複数のノードから前記共有資源に対して該共有資源の占有を指示するコマンドを発行し、
    占有権を取得したノードが、前記共有資源制御する
    ことを特徴とするコンピュータシステムにおける共有資源の排他利用方法
  2. 前記共有資源と複数のノードを接続するケーブルはSCSIケーブルであり、前記占有を指示するコマンドはSCSIコマンドであることを特徴とする請求項1記載のコンピュータシステムにおける共有資源の排他利用方法
  3. 前記共有資源と複数のノードを接続するケーブルはFCケーブルであり、前記占有を指示するコマンドはSCSIコマンドであることを特徴とする請求項1記載のコンピュータシステムにおける共有資源の排他利用方法
  4. 前記共有資源と複数のノードを接続するケーブルはSCSIケーブルであると共に、前記共有資源はLANケーブルに接続され、前記占有を指示するコマンドはSCSIコマンドであることを特徴とする請求項1記載のコンピュータシステムにおける共有資源の排他利用方法
  5. 前記共有資源は、磁気ディスク装置であることを特徴とする請求項1乃至請求項4の何れか1つに記載のコンピュータシステムにおける共有資源の排他利用方法
  6. 前記LANケーブルは、Ethernetケーブルであることを特徴とする請求項1乃至請求項5の何れか1つに記載のコンピュータシステムにおける共有資源の排他利用方法
  7. LAN上にLANケーブルを介して接続され、共有資源を制御する複数のノードと、前記複数のノード間を相互に接続し、該複数のノードの障害検出に用いられる障害検出用回線とを備え、障害の発生したノードによる前記共有資源の制御を排他するコンピュータシステムにおいて、
    前記複数のノードが、前記障害検出用回線が正常に機能するか否かを監視する機能正否監視手段を備え、
    該機能正否監視手段が、前記障害検出用回線が正常に機能していないことを検出した場合には、前記複数のノードから前記共有資源に対して該共有資源の占有を指示するコマンドを発行し、占有権を取得したノードが前記共有資源を制御することを特徴とするコンピュータシステム。
  8. 前記共有資源と複数のノードを接続するケーブルはSCSIケーブルであり、前記占有を指示するコマンドはSCSIコマンドであることを特徴とする請求項7記載のコンピュータシステム。
  9. 前記共有資源と複数のノードを接続するケーブルはFCケーブルであり、前記占有を指示するコマンドはSCSIコマンドであることを特徴とする請求項7記載のコンピュータシステム。
  10. 前記共有資源と複数のノードを接続するケーブルはSCSIケーブルであると共に、前記共有資源はLANケーブルに接続され、前記占有を指示するコマンドはSCSIコマンドであることを特徴とする請求項7記載のコンピュータシステム。
  11. 前記共有資源は、磁気ディスク装置であることを特徴とする請求項7乃至請求項10の何れか1つに記載のコンピュータシステム。
  12. 前記LANケーブルは、 Ethernet ケーブルであることを特徴とする請求項7乃至請求項11の何れか1つに記載のコンピュータシステム。
JP2000381751A 2000-12-15 2000-12-15 コンピュータシステムにおける共有資源の排他利用方式 Expired - Fee Related JP3573092B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000381751A JP3573092B2 (ja) 2000-12-15 2000-12-15 コンピュータシステムにおける共有資源の排他利用方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000381751A JP3573092B2 (ja) 2000-12-15 2000-12-15 コンピュータシステムにおける共有資源の排他利用方式

Publications (2)

Publication Number Publication Date
JP2002185478A JP2002185478A (ja) 2002-06-28
JP3573092B2 true JP3573092B2 (ja) 2004-10-06

Family

ID=18849699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000381751A Expired - Fee Related JP3573092B2 (ja) 2000-12-15 2000-12-15 コンピュータシステムにおける共有資源の排他利用方式

Country Status (1)

Country Link
JP (1) JP3573092B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004302512A (ja) * 2003-03-28 2004-10-28 Hitachi Ltd クラスタコンピューティングシステム、および、そのフェールオーバー方法
JP5096799B2 (ja) * 2007-05-29 2012-12-12 株式会社野村総合研究所 クラスタシステム、計算機、および障害対処方法

Also Published As

Publication number Publication date
JP2002185478A (ja) 2002-06-28

Similar Documents

Publication Publication Date Title
JP4500490B2 (ja) コンピュータ・クラスタリング・システムにおいて「スプリット・ブレイン」を防止する方法
US5784617A (en) Resource-capability-based method and system for handling service processor requests
JP4506594B2 (ja) 冗長パス制御方法
US6363462B1 (en) Storage controller providing automatic retention and deletion of synchronous back-up data
KR100232247B1 (ko) 클러스터화된 다중처리 시스템 및 시스템내 디스크 액세스 경로의 고장 회복 방법
US7370099B2 (en) Cluster computing system and its failover method
US6009535A (en) SCSI adaptor failover for a disk drive system
US7975006B2 (en) Method and device for managing cluster membership by use of storage area network fabric
KR100736647B1 (ko) Raid 장치, 통신 접속 감시 방법 및 프로그램 기록매체
US8074009B2 (en) Sharing of host bus adapter context
US7937610B2 (en) Fast node failure detection via disk based last gasp mechanism
JP2002229837A (ja) 共有ディスク・パラレル・データ・ファイル内のデータに対するアクセスを制御する方法
US20070130432A1 (en) Storage system for copying data between storage devices, and method of copying data
US20060146809A1 (en) Method and apparatus for accessing for storage system
US20040153717A1 (en) Apparatus and method for enhancing data availability by implementing inter-storage-unit communication
JP4106014B2 (ja) 少なくとも1つの不揮発性データ記憶装置を含む複数ノード・データ処理システムにおける通信方法およびプログラム
JP2001043026A (ja) 系間情報通信システム
US20040139196A1 (en) System and method for releasing device reservations
JP2004164047A (ja) 記憶システム
JP3573092B2 (ja) コンピュータシステムにおける共有資源の排他利用方式
EP1107119A2 (en) Extending cluster membership and quorum determinations to intelligent storage systems
US7302607B2 (en) Two node virtual shared disk cluster recovery
JP2006134207A (ja) ストレージ仮想化装置およびそれを用いたコンピュータシステム
US7412500B2 (en) Method and apparatus for using a serial cable as a cluster quorum device
JP4468395B2 (ja) クラスタシステム及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040302

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040608

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040621

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070709

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080709

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090709

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100709

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110709

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110709

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120709

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees