JP2007133665A - 計算機システム、分散処理方法、計算機及び分散処理プログラム - Google Patents
計算機システム、分散処理方法、計算機及び分散処理プログラム Download PDFInfo
- Publication number
- JP2007133665A JP2007133665A JP2005326196A JP2005326196A JP2007133665A JP 2007133665 A JP2007133665 A JP 2007133665A JP 2005326196 A JP2005326196 A JP 2005326196A JP 2005326196 A JP2005326196 A JP 2005326196A JP 2007133665 A JP2007133665 A JP 2007133665A
- Authority
- JP
- Japan
- Prior art keywords
- computer
- processing
- storage device
- computers
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】各計算機100が、自身のRAS情報102を取得して他の各計算機100に送信し、他の各計算機100からのRAS情報102を受信して自身のRAS情報102と共に主記憶装置(又は自身に直接接続する補助記憶装置)に保存し、クライアント200からの業務要求を受け付けたときに、自らの主記憶装置のRAS情報102を参照して、負荷分散を行うこととしている。
【選択図】図1
Description
最初に、図1を参照して、実施の形態の計算機システムのネットワーク構成の一例を説明する。この計算機システムは、LAN(Local Area Network)やインターネット等のネットワーク201と、このネットワーク201に接続され、業務運用を実行する複数の計算機100とからなるクラスタシステム200を備えている。また、このクラスタシステム200のネットワーク201には、複数のクライアント202が接続されている。なお、ここでは、クライアント202が、ネットワーク201に直接接続される場合を示しているが、ファイヤウォールサーバやルータ等の機器を介してネットワーク201に接続していてもよい。
また、計算機100は、クライアント202からの業務要求の送信の同期には3秒程度掛かり、他計算機100からのRAS情報のブロードキャストの同期には1秒程度掛かる。
図3(A)では、テーブル126としてRAS情報102(図2参照)に含まれる項目ごとに説明を付記してRAS情報102の内容が表されている。ホスト名103は、クラスタシステム200上で計算機100を一意に識別する各計算機100の識別情報であり、他計算機100との通信を行うときの識別子として用いられる。
まず、クライアント202が計算機Aへ業務要求を送信すると(601)、計算機Aでは、業務要求受信手段116が業務要求を受信する。そして、計算機Aは、業務負荷分散計算機判別手段117(以下判別手段117ともいう)の処理を実行する(図7参照)。判別手段117が記憶装置に保存しているRAS情報102を参照して、自身(自計算機A)が一番負荷が低いと判別した場合には、共有ディスク125(図2参照)から読み出した対象の業務プログラム101を実行して業務を処理し、クライアント202に業務応答を行う(603)。クライアント202では、その業務応答を受信して(605)、処理を終了する。
計算機Aでは、異常検知手段119を実行させて、業務遂行不可となる異常が検知されると、業務引継ぎ計算機判別手段120により引継ぎ先の計算機B等を判別させる。そして、計算機Aでは、判別された計算機Bに対して業務引継ぎ要求を業務引継ぎ要求送信手段121により送信し、再起動させる(901)。この再起動は、例えば、計算機A自身が業務引継ぎ要求の送信後自動的に行うようにしても、計算機Aのオペレータ等に警報音等で報知して、オペレータ等の操作により行うようにしてもよい。
判別手段120は、引継ぎ要求を受信すると、まず引継ぎ業務を判別する(1101)。続いて、判別手段120は、全引継ぎ業務を遂行中の計算機100があるかを判別する(1102)。判別手段120は、該当する計算機がある場合(1102,Yes)は、該当計算機B等が複数あるかどうかを判別する(1104)。そして、判別手段120は、該当計算機が複数ある場合(1104,Yes)は一番業務負荷の低い計算機を判別する(1105)。そして、判別手段120は、該当計算機Bが複数なくて1台の計算機Bのとき(1104,No)にはその計算機Bに対して、また、一番業務負荷の低い計算機Bとして判別されたときにはその計算機Bに対して、業務引継ぎ要求送信手段121により業務引継ぎ要求を送信させる。
また、以上の処理は、計算機Aが自身で異常を検知して系切り替えを行う場合であるが、計算機Aが突然停止する場合も考えられる。その場合には、計算機AのRAS情報Aが一定時間更新されないことを監視する計算機100が、計算機Aがシステムダウンしたと判断して前記の方法で業務引継ぎ計算機を判別し業務引継ぎさせることが可能である。
[他の処理1]
計算機の演算装置が自らの運用状態を取得するタイミングは、所定時間ごとに周期的に行うようにしても、運用状態が変化したときに行うようにしてもよい。計算機の演算装置が通信装置によりネットワークを介して他の各計算機に自らの運用情報を周期的に送信する場合には、各計算機が周期的に共通の運用情報を共有できるようになる。特に、統計的に各計算機の運用状態が大きく異なる場合には、運用状態の異なる時間帯ごとに周期を変えることで時間帯によらずに適正に分散処理を行える。また、各計算機の各演算装置が自らの運用状態に変化が生じたときに運用情報を更新し、各通信装置により前記ネットワークを介して他の各計算機に自らの変更後の運用情報を送信する場合には、各計算機が運用情報の変化に対応して共通の運用情報をリアルタイムに共有できるようになる。なお、各計算機へ自らの運用情報として送信するタイミングは、運用情報を取得したときに続けて行うようにしても、その取得とは別に所定時間ごとに行うようにしてもよい。
計算機の演算装置は、記憶装置を参照して、各計算機の各運用情報に基づいて処理要求の転送先を決定する場合に、ネットワークに接続した他の計算機の運用情報と自らの運用情報とを比較し、運用情報の比較の結果に応じて処理要求による処理を実行する計算機の識別情報を特定し、特定した計算機がネットワークに接続する他の計算機の場合には、該当する他の計算機の識別情報を基に記憶装置からアドレスを参照し、通信装置により他の計算機に対して処理要求を転送することが、好ましい。
計算機の演算装置は、通信装置によりネットワークを介して処理要求を受け付けたときに、分散処理を行うものとして記憶装置に識別情報及びアドレスを登録してある他の計算機か否かを判定し、登録されていない計算機からの処理要求である場合には、記憶装置から処理要求に対応するアプリケーションプログラムを読み出して実行するようにしてもよい。
計算機の演算装置は、通信装置によりネットワークを介して受信した他の各計算機の運用情報を、自らの運用情報と合わせて各記憶装置に保存するようにしてもよい。これにより、各計算機の各演算装置は、処理要求を受け付けたときに、速やかに、運用情報を参照して、対応する各計算機を特定できるようになる。
計算機の演算装置は、運用情報としてRAS情報を各記憶装置に保存するようにしてもよい。なお、RAS情報には、ネットワーク上で各計算機を一意に識別するホスト名等の識別情報を含むようにしてもよい。また、RAS情報には、各計算機の各演算装置が業務プログラム等の対象のアプリケーションプログラムを実行しているか否かの情報を含む稼動状態とするようにしてもよい。また、これと共に、各計算機の各演算装置が、業務プログラム等の対象のアプリケーションプログラムの稼働時間を含む稼動状態とするようにしてもよい。また、RAS情報には、業務プログラム等の対象のアプリケーションプログラムの名称及びそのアプリケーションプログラムの格納場所に基づいて、各計算機の各演算装置が遂行中の業務の識別情報を取得するようにしてもよい。また、RAS情報には、各計算機の各演算装置が、実行中の業務負荷を取得するようにしてもよい。業務負荷は、例えば、負荷率で表すようにしてもよい。また、RAS情報としては、ホスト名と稼動状態と遂行中業務と業務負荷と遂行可能業務とを全て含むことが好ましい。
計算機の演算装置は、アプリケーションプログラムを読み出して実行する前に、記憶装置を参照して、ネットワークに接続した他の計算機の運用情報と自らの運用情報とを比較し、運用情報の比較の結果に応じて処理要求による処理を実行する計算機を特定し、特定した計算機が自らの場合には、記憶装置から処理要求に対応するアプリケーションプログラムを読み出して実行するようにしてもよい。
計算機は、さらにユーザインタフェースを備え、演算装置が、ユーザインタフェースを介して処理要求を受け付けたときに、記憶装置を参照して、ネットワークに接続した他の計算機の運用情報と自らの運用情報とを比較し、運用情報の比較の結果に応じて処理要求による処理を実行する計算機を特定するようにしてもよい。
計算機の演算装置は、特定した計算機が自らの場合には、記憶装置から処理要求に対応するアプリケーションプログラムを読み出して実行するようにしてもよい。
計算機の演算装置は、自らの運用状態に変更があった場合には、変更後の運用状態の運用情報に記憶装置の登録を更新すると共に、変更後の運用情報を、通信装置によりネットワークを介して他の各計算機に送信し、通信装置によりネットワークを介して受信した他の計算機の変更後の運用情報に記憶装置の登録を更新することとする。
これにより、計算機は、自らの運用状態に変更があった場合に、変更後の運用情報を自らの更新する共に他の計算機に送信するようにしたため、ネットワーク上の対象の計算機同士で運用情報を共有することができる。また、このように、ネットワーク上の計算機同士で同一の運用情報を共有しているため、同一の運用情報を参照して分散処理を同一の手順で行うことにより、いずれの計算機でも同一解を算出することができる。そのため、ネットワーク上であたかもロードバランサが稼動しているかのように、各計算機が自律的に分散処理を行うことができる。
101 業務プログラム
102 RAS情報
103 ホスト名
104 稼動状態
105 遂行中業務
106 業務負荷
107 遂行可能業務
108 ホスト名取得手段
109 稼動状態取得手段
110 遂行中業務取得手段
111 業務負荷取得手段
112 遂行可能業務取得手段
113 RAS情報収集手段
114 RAS情報送信手段
115 RAS情報受信手段
116 業務要求受信手段
117 業務負荷分散計算機判別手段
118 業務要求転送手段
119 異常検知手段
120 業務引継ぎ計算機判別手段
121 業務引継ぎ要求送信手段
122 業務引継ぎ要求受信手段
123 RAS情報監視手段
124 業務プログラム起動手段
125 共有ディスク
130 RAS情報保存手段
200 クラスタシステム
201 ネットワーク
202 クライアント
Claims (11)
- 任意のネットワークに接続した複数の計算機間で分散処理を行う計算機システムであって、
前記各計算機は、演算装置と記憶装置と通信装置とを備え、
前記各計算機の前記各記憶装置には、前記各計算機の識別情報と前記ネットワーク上のアドレスとを関連付けてあらかじめ登録しておき、
前記各計算機の前記各演算装置は、自らの運用状態を取得して、前記各通信装置により前記ネットワークを介して前記アドレス先の他の前記各計算機へ自らの運用情報として送信すると共に、前記各通信装置により前記ネットワークを介して他の前記各計算機から各運用情報を受信して、前記各計算機間で共通の各運用情報を前記各記憶装置に保存することとし、
一の前記計算機の前記演算装置は、処理要求を受け付けたときに自らの前記記憶装置を参照して、前記各計算機の各運用情報に基づいて前記処理要求を前記他の計算機に割り振って、分散処理を行うようにしたことを特徴とする計算機システム。 - 任意のネットワークに接続した複数の計算機間で行う分散処理方法であって、
前記各計算機の各記憶装置には、前記各計算機の識別情報と前記ネットワーク上のアドレスとを関連付けてあらかじめ登録しておき、
前記各計算機の各演算装置が、自らの運用状態を取得して、前記各通信装置により前記ネットワークを介して前記アドレス先の他の前記各計算機へ自らの運用情報として送信すると共に、前記各通信装置により前記ネットワークを介して他の前記各計算機から各運用情報を受信して、前記各計算機間で共通の各運用情報を前記各記憶装置に保存していき、
一の前記計算機の前記演算装置は、処理要求を受け付けたときに自らの前記記憶装置を参照して、前記各計算機の各運用情報に基づいて前記処理要求を前記他の計算機に割り振って、分散処理を行うようにしたことを特徴とする分散処理方法。 - 任意のネットワークに接続した複数の他の計算機との間で処理を分散する計算機であって、
演算装置と記憶装置と通信装置とを備え、
前記演算装置は、
前記他の計算機の識別情報と前記ネットワーク上のアドレスとを関連付けて前記記憶装置にあらかじめ登録しておき、
自らの運用状態を取得して、前記通信装置により前記ネットワークを介して前記アドレス先の他の前記各計算機へ前記自らの運用情報として送信すると共に、前記通信装置により前記ネットワークを介して他の前記各計算機から各運用情報を受信して、前記各計算機間で共通の各運用情報を前記記憶装置に保存することとし、
処理要求を受け付けたときに自らの前記記憶装置を参照して、前記各計算機の各運用情報に基づいて処理要求を前記他の計算機に前記通信装置により転送して、分散処理を行うようにしたことを特徴とする計算機。 - 前記演算装置は、前記記憶装置の運用情報を参照して、保存されている運用情報の中で最も処理要求負荷の低い前記計算機の識別情報を探索し、探索した識別情報の前記計算機に対して、前記通信装置により前記ネットワークを介して処理要求を転送するようにしたことを特徴とする請求項3に記載の計算機。
- 前記演算装置は、前記他の計算機から転送された処理要求を受け付けて、仮に処理を実行した場合に、自身の負荷が前記他の計算機の負荷よりも高くなるか否かを判定し、
自身の負荷が高くなる場合には、前記記憶装置を参照して、前記各計算機の各運用情報に基づいて処理要求を転送元以外の他の計算機に前記通信装置により転送して、分散処理を行うようにしたことを特徴とする請求項3に記載の計算機。 - 前記演算装置は、
対象の処理を通常運用している前記他の計算機を運用系計算機として識別する運用情報と、また、前記運用系計算機の運用している処理を引き継ぎ可能な待機中の前記他の計算機を待機系計算機として識別する運用情報とを、前記記憶装置に登録しておき、
自身が前記運用系計算機として登録されている場合には、自身の処理遂行異常を検知したときに、前記記憶装置の運用情報を参照して、処理を引き継ぎ可能な待機系計算機を判別し、判別した待機系計算機へ前記通信装置により前記ネットワークを介して処理引き継ぎ要求を送信して、待機系計算機に処理引き継ぎを行わせるようにしたことを特徴とする請求項3に記載の計算機。 - 前記演算装置は、
対象の処理を通常運用している前記他の計算機を運用系計算機として識別する運用情報と、また、前記運用系計算機の運用している処理を引き継ぎ可能な待機中の前記他の計算機を待機系計算機として識別する運用情報とを、前記記憶装置に登録しておき、
自身が前記待機系計算機として登録されている場合には、前記通信装置によりネットワークを介して前記運用系計算機から処理引き継ぎ要求を受信した場合には、運用系処理遂行異常時の処理引き継ぎとして、対象の処理を運用することを特徴とする請求項3に記載の計算機。 - 前記演算装置は、
自身が前記運用系計算機として登録されている場合に、前記記憶装置の運用情報を参照して、処理を引き継ぎ可能な待機系計算機の候補が複数存在するときには、処理負荷が最も低い待機系計算機に処理引き継ぎを行わせることを特徴とする請求項6に記載の計算機。
特徴とする請求項6に記載の計算機。 - 前記演算装置は、
自身が前記運用系計算機として登録されている場合に、前記記憶装置の各運用情報を参照して、処理引き継ぎ可能な前記待機系計算機での処理が不足しているか否かを判定すると共に、処理を引き継がせる1台の前記待機系計算機に高い負荷を与えるか否かを判定し、処理が不足しているか及び/又は高い負荷を与える場合には、複数の前記待機系計算機に対して処理引き継ぎ要求を前記通信装置により前記ネットワークを介して送信して、複数の前記待機系計算機に処理を割り振るようにしたことを特徴とする請求項6に記載の計算機。 - 前記演算装置は、
前記記憶装置の各運用情報の更新状態を監視し、所定数の前記運用系計算機の各運用情報が所定時間経過しても更新されない場合には、前記運用系計算機による処理を前記待機系計算機に引き継がせることを特徴とする請求項6に記載の計算機。 - 任意のネットワークに接続した複数の他の計算機との間で処理を分散する計算機に実行させる分散処理プログラムであって、
計算機の演算装置に、
前記他の計算機の識別情報と前記ネットワーク上のアドレスとを関連付けて前記記憶装置にあらかじめ登録させ、
自らの運用状態を取得して、前記通信装置により前記ネットワークを介して前記アドレス先の他の前記各計算機へ前記自らの運用情報として送信すると共に、前記通信装置により前記ネットワークを介して他の前記各計算機から各運用情報を受信して、前記各計算機間で共通の各運用情報を前記記憶装置に保存することとし、
処理要求を受け付けたときに前記記憶装置を参照して、前記各計算機の各運用情報に基づいて処理要求を前記他の計算機に前記通信装置により転送することを実行して、複数の前記他の計算機同士で分散処理を行わせるようにしたことを特徴とする分散処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005326196A JP2007133665A (ja) | 2005-11-10 | 2005-11-10 | 計算機システム、分散処理方法、計算機及び分散処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005326196A JP2007133665A (ja) | 2005-11-10 | 2005-11-10 | 計算機システム、分散処理方法、計算機及び分散処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007133665A true JP2007133665A (ja) | 2007-05-31 |
Family
ID=38155272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005326196A Pending JP2007133665A (ja) | 2005-11-10 | 2005-11-10 | 計算機システム、分散処理方法、計算機及び分散処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007133665A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012090180A (ja) * | 2010-10-21 | 2012-05-10 | Data Access Kk | ノード、クラスタリングシステム、クラスタリングシステムの制御方法、およびプログラム |
JP2015207256A (ja) * | 2014-04-23 | 2015-11-19 | 日本電信電話株式会社 | 分散処理システム、分散データ管理装置および分散データ管理方法 |
JP5862662B2 (ja) * | 2011-05-20 | 2016-02-16 | 富士通株式会社 | データ処理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08235127A (ja) * | 1995-02-28 | 1996-09-13 | Chugoku Nippon Denki Software Kk | 自動負荷分散方法および装置 |
JPH09293059A (ja) * | 1996-04-25 | 1997-11-11 | Hitachi Ltd | 分散システム及びその運用管理方法 |
JP2000047894A (ja) * | 1998-07-31 | 2000-02-18 | Mitsubishi Electric Corp | 計算機システム |
JP2001202346A (ja) * | 2000-01-19 | 2001-07-27 | Yamaguchi Technology Licensing Organization Ltd | 計算機の分散処理システム |
JP2004287889A (ja) * | 2003-03-24 | 2004-10-14 | Ntt Data Corp | 分散処理システム、分散処理用装置、方法及びコンピュータプログラム |
-
2005
- 2005-11-10 JP JP2005326196A patent/JP2007133665A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08235127A (ja) * | 1995-02-28 | 1996-09-13 | Chugoku Nippon Denki Software Kk | 自動負荷分散方法および装置 |
JPH09293059A (ja) * | 1996-04-25 | 1997-11-11 | Hitachi Ltd | 分散システム及びその運用管理方法 |
JP2000047894A (ja) * | 1998-07-31 | 2000-02-18 | Mitsubishi Electric Corp | 計算機システム |
JP2001202346A (ja) * | 2000-01-19 | 2001-07-27 | Yamaguchi Technology Licensing Organization Ltd | 計算機の分散処理システム |
JP2004287889A (ja) * | 2003-03-24 | 2004-10-14 | Ntt Data Corp | 分散処理システム、分散処理用装置、方法及びコンピュータプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012090180A (ja) * | 2010-10-21 | 2012-05-10 | Data Access Kk | ノード、クラスタリングシステム、クラスタリングシステムの制御方法、およびプログラム |
JP5862662B2 (ja) * | 2011-05-20 | 2016-02-16 | 富士通株式会社 | データ処理方法 |
JP2015207256A (ja) * | 2014-04-23 | 2015-11-19 | 日本電信電話株式会社 | 分散処理システム、分散データ管理装置および分散データ管理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7418627B2 (en) | Cluster system wherein failover reset signals are sent from nodes according to their priority | |
JP6476348B2 (ja) | 自動スイッチオーバーの実装 | |
AU2002363958B2 (en) | Real composite objects for providing high availability of resources on networked systems | |
US7296268B2 (en) | Dynamic monitor and controller of availability of a load-balancing cluster | |
US8006124B2 (en) | Large-scale cluster monitoring system, and method of automatically building/restoring the same | |
JP4733399B2 (ja) | 計算機システム、計算機、ストレージ装置及び管理端末 | |
JP5863942B2 (ja) | ウィットネスサービスの提供 | |
US9450700B1 (en) | Efficient network fleet monitoring | |
JP4572250B2 (ja) | 計算機切り替え方法、計算機切り替えプログラム及び計算機システム | |
US20030158933A1 (en) | Failover clustering based on input/output processors | |
US20110107358A1 (en) | Managing remote procedure calls when a server is unavailable | |
JP2005301975A (ja) | マルチサイト上の遠隔二重化リンクを経由するハートビート装置、及びその使用方法 | |
JP2007226400A (ja) | 計算機管理方法、計算機管理プログラム、実行サーバの構成を管理する待機サーバ及び計算機システム | |
US9208124B2 (en) | Reset of processing core in multi-core processing system | |
WO2016082078A1 (zh) | 路径管理的系统、装置和方法 | |
JP2007133665A (ja) | 計算機システム、分散処理方法、計算機及び分散処理プログラム | |
US8036105B2 (en) | Monitoring a problem condition in a communications system | |
JPH09293059A (ja) | 分散システム及びその運用管理方法 | |
JP5435205B2 (ja) | マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム | |
US20050259572A1 (en) | Distributed high availability system and method | |
US8074109B1 (en) | Third-party voting to select a master processor within a multi-processor computer | |
JP4520899B2 (ja) | クラスタ制御方法、クラスタ制御プログラム、クラスタシステムおよび待機サーバ | |
JP7044971B2 (ja) | クラスタシステム、オートスケールサーバ監視装置、オートスケールサーバ監視プログラムおよびオートスケールサーバ監視方法 | |
JP7298412B2 (ja) | 異常判定装置、異常判定方法およびプログラム | |
JP2008146397A (ja) | プロセスの監視装置及び監視方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091020 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100126 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100326 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100601 |