JP2010204875A - 分散処理システム及びその制御方法、並びに分散処理システムに用いられる制御プログラム - Google Patents

分散処理システム及びその制御方法、並びに分散処理システムに用いられる制御プログラム Download PDF

Info

Publication number
JP2010204875A
JP2010204875A JP2009048716A JP2009048716A JP2010204875A JP 2010204875 A JP2010204875 A JP 2010204875A JP 2009048716 A JP2009048716 A JP 2009048716A JP 2009048716 A JP2009048716 A JP 2009048716A JP 2010204875 A JP2010204875 A JP 2010204875A
Authority
JP
Japan
Prior art keywords
node
application
processing
communication
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009048716A
Other languages
English (en)
Inventor
Yoshifumi Kokado
能史 小角
Hironobu Sugata
宏順 須賀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009048716A priority Critical patent/JP2010204875A/ja
Publication of JP2010204875A publication Critical patent/JP2010204875A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】障害が発生したノードにおける処理を、通信性能が十分良いノードに引き継がせることができるようにする。
【解決手段】ノード200,300,400,500間における通信性能をノード間通信性能取得手段101で取得し、どのアプリケーション201,301,401,501間で通信が行われていたかをアプリケーション名登録手段103で取得する。そして、障害が発生したアプリケーション又はノードを特定し、ノード間通信性能取得手段101で取得した情報から最も通信性能が良いノードを特定し、この通信瀬能が良いノードを処理の引き継ぎ先とする。
【選択図】図1

Description

本発明は、コンピュータ及び通信ネットワークを用いた分散処理システムに関し、特にフェイルオーバー、即ちノード間通信において障害が発生した場合に、障害が発生したノード上で行っていた処理を、他のノードに引き継ぐための技術に関するものである。
従来のフェイルオーバークラスタシステムの一例が、特許文献1に記載されている。この従来のフェイルオーバークラスタシステムは、要求されるサービスのレベルをあらかじめ与えておき、その設定にしたがって障害発生時にフェイルオーバーする。
また、特許文献2において、複数のノードが相互に稼働状態を監視する手順と、監視結果に基づいて障害の発生を検知する手順と、障害が発生したことを検知したときには、障害が発生したノードを除くクラスタ内の各ノードが、予め共有する装置に格納された障害の発生したノードの処理を他のノードへ引き継ぐ引き継ぎ情報を読み込む手順と、各ノードが、引き継ぎ情報に基づいて障害が発生したノードの処理を引き継ぐ手順とを含む方法が開示されている。
また、特許文献3において、高速パケットデータサービスのためのリソースの状態を基地局がRNC(Radio Network Controller)に報告する方法であって、ローカルセル別に高速パケットデータサービスの支援可否を判定する段階と、この判定により、各ローカルセル別に高速パケットデータサービスの利用状態に関する情報をRNCに伝送する段階とを有する方法が開示されている。
特開2006−260357号公報 特開2006−79161号公報 特表2007−511950号公報
しかしながら、無線LANのアドホックネットワークのような各ノード間の通信性能が一律ではないネットワークでは、障害が発生したノードで動作するアプリケーションの処理を他ノードで引き継ぐ時に、引き継いだノード上で動作するアプリケーションが十分な通信性能を出せない場合があるという問題がある。その理由は、障害が発生したノード上のアプリケーションと通信を行っていたアプリケーションがどのノード上に存在するかが引き継ぎ先を決定する手段(管理ノード)の側からはわからないためである。
そこで、本発明は、障害が発生したノードで動作するアプリケーションの処理を、通信性能が十分良いノードに引き継がせることができるようにすることを目的とする。
上記課題を解決するために、本発明は、複数の処理ノードと、前記処理ノードを管理する管理ノードとが、通信ネットワークを介して接続され、前記処理ノードには、送信用のアプリケーションを搭載するノードと、受信用のアプリケーションを搭載するノードとが含まれて構成される分散処理システムであって、前記管理ノードは、前記処理ノード間での通信における前記各処理ノードの通信性能に関する情報を取得するノード間通信性能取得手段と、前記各アプリケーションに付される識別情報を、当該各アプリケーションを搭載する前記処理ノードの識別情報とを関連付けて登録し、当該登録された情報に基づいて、互いに通信する前記アプリケーションおよび前記処理ノードを識別可能にするアプリケーション名登録手段と、前記処理ノードおよび前記アプリケーションの障害を検知する障害検知手段と、前記障害検知手段により障害の発生が検知された場合に、前記アプリケーション名登録手段に登録された情報に基づいて、当該障害の主体となる障害処理ノードと当該障害の発生前に通信していた既通信処理ノードを特定し、前記ノード間通信性能取得手段により取得された情報に基づいて、前記既通信処理ノードのうち前記障害処理ノードとの通信において十分な前記通信性能を有すると認められる通信機能充足処理ノードを特定し、前記通信機能充足処理ノードに、前記障害処理ノードが前記障害の発生前に行っていた前記アプリケーションによる処理を引き継がせる処理を行う配置先決定手段とを備えるものである。
また、本発明は、通信に関するアプリケーションを搭載する複数の処理ノードが通信ネットワークを介して接続されてなる分散処理システムにおける制御方法であって、前記処理ノード間での通信における前記各処理ノードの通信性能に関する情報を取得するステップと、前記各アプリケーションに付される識別情報を、当該各アプリケーションを搭載する前記処理ノードの識別情報とを関連付けて登録するステップと、前記処理ノードおよび前記アプリケーションの障害を検知するステップと、前記障害が検知された場合に、前記登録された識別情報に基づいて、当該障害の主体となる障害処理ノードと当該障害の発生前に通信していた既通信処理ノードを特定するステップと、前記通信性能に関する情報に基づいて、前記既通信処理ノードのうち前記障害処理ノードとの通信において十分な前記通信性能を有すると認められる通信機能充足処理ノードを特定するステップと、前記通信機能充足処理ノードに、前記障害処理ノードが前記障害の発生前に行っていた前記アプリケーションによる処理を引き継がせるステップとを備えるものである。
また、本発明は、通信に関するアプリケーションを搭載する複数の処理ノードと、前記処理ノードを管理する管理ノードとが、通信ネットワークを介して接続されてなる分散処理システムにおいて用いられる制御プログラムであって、前記管理ノードを構成するコンピュータに、前記処理ノード間での通信における前記各処理ノードの通信性能に関する情報を取得する処理と、前記各アプリケーションに付される識別情報を、当該各アプリケーションを搭載する前記処理ノードの識別情報とを関連付けて登録する処理と、前記処理ノードおよび前記アプリケーションの障害を検知する処理と、前記障害が検知された場合に、前記登録された識別情報に基づいて、当該障害の主体となる障害処理ノードと当該障害の発生前に通信していた既通信処理ノードを特定する処理と、前記通信性能に関する情報に基づいて、前記既通信処理ノードのうち前記障害処理ノードとの通信において十分な前記通信性能を有すると認められる通信機能充足処理ノードを特定する処理と、前記通信機能充足処理ノードに、前記障害処理ノードが前記障害の発生前に行っていた前記アプリケーションによる処理を引き継がせる処理とを実行させるものである。
上記本発明によれば、障害が発生したノードが障害発生前に通信していたノードを特定し、この通信先のノードの中から通信性能が十分良いノードを特定することができる。これにより、障害が発生したノードが行っていた処理を、通信性能が十分良いノードに選択的に引き継がせることが可能となる。
本発明の実施の形態1に係る配置先決定システムの構成を示す機能ブロック図である。 実施の形態1に係る配置先決定システムの動作を示すフローチャートである。 実施の形態1に係る配置先決定システムの動作を示すフローチャートである。 本発明の実施の形態2に係る配置先決定システムの構成を示す機能ブロック図である。 実施の形態2に係る配置先決定システムの動作を示すフローチャートである。 実施の形態2に係る配置先決定システムの動作を示すフローチャートである。 本発明の実施の形態3に係る配置先決定システムの構成を示す機能ブロック図である。 ノード間通信性能情報の具体例である。 アプリケーション間通信情報の具体例である。 アプリケーション間の通信が行われるまでの動作を示すシーケンス図である。
実施の形態1
以下、図面を参照して本発明の実施の形態を説明する。図1に示す本実施の形態に係る配置先決定システムは、複数の処理ノードを管理する機能を集約した管理ノード100と、アプリケーションを実施する複数の処理ノード200,300,400,500と、各ノード100,200,300,400,500を相互に接続するネットワーク600とから構成されている。
管理ノード100は、各処理ノード200,300,400,500間における通信性能に関する情報を取得するノード間通信性能取得手段101と、ノード間通信性能取得手段101が取得した情報を保存するノード間通信性能情報102と、処理ノード200,300,400,500に搭載されたアプリケーションが通信を行う際に使用する名前(識別情報)を登録するアプリケーション名登録手段103と、アプリケーション名登録手段103に登録された識別情報を保存するアプリケーション間通信情報104と、アプリケーションやノード200,300,400,500に発生した障害を検知する障害検知手段105と、障害検知手段105により障害が検知された時に障害が発生したアプリケーションの新たな配置先を決定する配置先決定手段106とを含む。
処理ノード200は、送信処理を実施する送信アプリケーション201と、送信アプリケーション201を実行するアプリケーション実行手段202とを含む。
処理ノード300は、受信処理を実施する受信アプリケーション301と、受信アプリケーション301を実行するアプリケーション実行手段302とを含む。
処理ノード400は、受信処理を実施する受信アプリケーション401と、受信アプリケーション401を実行するアプリケーション実行手段402とを含む。
処理ノード500は、受信処理を実施する受信アプリケーション501と、受信アプリケーション501を実行するアプリケーション実行手段502とを含む。
これらの手段はそれぞれ概略つぎのように動作する。ノード間通信性能取得手段101は、各処理ノード200,300,400,500間における通信性能を測定して、その測定結果をノード間通信性能情報102に保存する。
アプリケーション名登録手段103は、送信アプリケーション201および各受信アプリケーション301,401,501から得られる識別情報としての名前と、前記受信アプリケーション301,401,501が動作する処理ノード300,400,500の位置情報とを関連付け、アプリケーション間通信情報104に登録する。送信アプリケーション201および受信アプリケーション301,401,501からアプリケーション名登録手段103に登録された名前が同じである場合、それらの送信アプリケーション201と受信アプリケーション301,401,501とは通信を行うことを意味する。
障害検知手段105は、送信アプリケーション201、各受信アプリケーション301,401,501、又は各処理ノード200,300,400,500に発生した障害を検知し、配置先決定手段106に通知する。
配置先決定手段106は、障害検知手段105から障害が発生した旨の通知を受け取ると、障害が発生した送信アプリケーション201又は各受信アプリケーション301,401,501を動作させるための他の処理ノード(配置先処理ノード)を決定し、この配置先処理ノード上のアプリケーション実行手段202,302,402,502に対して、障害発生したアプリケーションに相当するアプリケーション201,301,401,501を実行させる命令を送信する。
各処理ノード200,300,400,500上のアプリケーション実行手段202,302,402,502は、それぞれ管理ノード100上の配置先決定手段106からアプリケーション201,301,401,501を実行させる命令を受信すると、同じ処理ノード200,300,400,500上に存在するアプリケーション201,301,401,501を実行する。
次に、本実施の形態の全体の動作について詳細に説明する。ここでは、処理ノード200上の送信アプリケーション201と、処理ノード300上の受信アプリケーション301とが動作している時に、処理ノード300に障害が発生し、処理ノード400上の受信アプリケーション401を起動する場合について、障害発生前の動作と障害発生時の動作について別々に説明する。
図1及び図2を参照し、障害発生前の動作を説明する。まず、ノード間通信性能取得手段101は、各処理ノード200,300,400,500の通信性能に関する情報を取得し、取得した情報をノード間通信性能情報102に保存する(ステップS100)。この例では、処理ノード100と処理ノード500との間の通信性能は両アプリケーション201,501の通信性能としては不十分であり、処理ノード100と処理ノード400との間の通信性能は両アプリケーション201,401の通信性能としては十分良いとする。
次に、送信アプリケーション201が実行されると、アプリケーション名登録手段103に、通信時に利用する名前を登録する(ステップS101)。アプリケーション名登録手段103は、登録された名前と、この送信アプリケーション201が動作する(搭載される)装置が処理ノード200であるという情報とを関連付けて、アプリケーション間通信情報104に保存する(ステップS102)。
次に、受信アプリケーション301が実行されると、アプリケーション名登録手段103、通信時に利用する名前を登録する(ステップS101)。アプリケーション名登録手段103は、登録された名前と、この受信アプリケーション301が動作する装置が処理ノード300であるという情報とを関連付けて、アプリケーション間通信情報104に保存する(ステップS102)。
続いて、図1および図3を参照し、障害発生時の動作について説明する。まず、処理ノード300に障害が発生すると(ステップS200)、障害検知手段105は、障害の発生を検知し、処理ノード300で障害が発生したことを配置先決定手段106に通知する(ステップS201)。配置先決定手段106は、処理ノード300で障害が発生した通知を受信すると、処理ノード300上で動作する受信アプリケーション301を停止し、他の処理ノード上のアプリケーションを動作させる計画を立て始める(ステップS202)。
配置先決定手段106は、アプリケーション間通信情報104から、受信アプリケーション301と処理ノード200上の送信アプリケーション201とが通信を行っていたことを取得する(ステップS203)。さらに、配置先決定手段106は、ノード間通信性能情報102から、処理ノード200と処理ノード400との間での通信性能、および処理ノード200と処理ノード500との間での通信性能を取得し、処理ノード200と処理ノード500との間での通信性能が十分良いことを取得する(ステップS204)。
次に、配置先決定手段106は、処理ノード200との通信性能が十分良い処理ノード500上のアプリケーション実行手段502に、受信アプリケーション501を実行するように命令する(ステップS205)。最後に、アプリケーション実行手段502は、受信アプリケーション501を実行する(ステップS206)。
次に、本実施の形態の効果について説明する。本実施の形態では、ノード間通信性能情報102が、各処理ノード200,300,400,500間における通信性能を保持し、アプリケーション間通信情報104が、どのアプリケーション201,301,401,501同士が通信を行っていたかという情報を保持する。これにより、配置先決定手段106は、ノード間通信性能情報102及びアプリケーション間通信情報104からの情報を参照することで、受信側の処理ノード300,400,500に障害が発生した時に、障害が発生したもの以外の処理ノード300,400,500の中から、送信アプリケーション201との通信性能が十分良い処理ノード300,400,500を選択し、受信アプリケーション301,401,501を起動することができる。
実施の形態2
次に、本発明の実施の形態2について図面を参照して説明する。図4に示す本実施の形態に係る配置先決定システムは、図1の構成に存在する配置先決定手段106を引継ぎ先決定手段107に置き替え、受信アプリケーション301を現用系受信アプリケーション303に置き替え、アプリケーション実行手段302をアプリケーション制御手段304に置き替え、受信アプリケーション401を待機系系受信アプリケーション403に置き替え、アプリケーション実行手段402をアプリケーション制御手段404に置き替え、受信アプリケーション501を待機系系受信アプリケーション503に置き替え、アプリケーション実行手段502をアプリケーション制御手段504に置き替えた構成になる。
これらの置き替えた手段は、それぞれ概略つぎのように動作する。引継ぎ先決定手段107は、障害検知手段105から処理ノード303の障害を検知したことを通知されると、現用系受信アプリケーション303の処理を引き継ぐための待機系受信アプリケーション403,503を決定し、その待機系受信アプリケーション403,503が存在する処理ノード400,500上のアプリケーション制御手段404,504に対して、待機系受信アプリケーション403,503の状態を現用系に切替える命令を送信する。各アプリケーション制御手段404,504は、引継ぎ先決定手段107から受信した命令に従い、同一の処理ノード400,500上に存在する受信アプリケーション403,503の状態を制御する。
次に、本実施の形態の全体の動作について詳細に説明する。この例では、各処理ノード200,300,400,500上の各アプリケーション201,303,403,503が動作しており、送信アプリケーション201と現用系受信アプリケーション303とが通信を行っている時に、処理ノード300に障害が発生し、処理ノード400上の待機系受信アプリケーション403を現用系に切替えることで、現用系受信アプリケーション303が行っていた処理を引き継ぐ場合について、障害発生前の動作と障害発生時の動作について別々に説明する。
図4および図5を参照し、障害発生前の動作について説明する。まず、ノード間通信性能取得手段101は、各処理ノード200,300,400,500間の通信性能を取得して、取得した情報をノード間通信性能情報102に保存する(ステップS400)。この例では、処理ノード200と処理ノード500との間の通信性能は不十分であり、処理ノード200と処理ノード400の間の通信性能は十分良いとする。
次に、現用系受信アプリケーション303が実行されると、通信に利用する名前と、現用系受信アプリケーション103が動作する(搭載される)装置が処理ノード300であるという情報とを関連付けてアプリケーション名登録手段103に登録する(ステップS401)。アプリケーション名登録手段103は、通信に利用する名前と、この現用系受信アプリケーション303が処理ノード300上で受信するという情報とを関連付けてアプリケーション間通信情報104に保存する(ステップS402)。
次に、現用系受信アプリケーション403が実行されると、通信に利用する名前と、現用系受信アプリケーション403が動作する装置が処理ノード400であるという情報とを関連付けてアプリケーション名登録手段103に登録する(ステップS401)。アプリケーション名登録手段103は、通信に利用する名前と、この現用系受信アプリケーション403が処理ノード400上で動作するという情報とを関連付けてアプリケーション間通信情報104に保存する(ステップS402)。
次に、待機系受信アプリケーション503が実行されると、通信に利用する名前と登録を実施した待機系受信アプリケーション503が動作する装置が処理ノード500であるという情報とを関連付けてアプリケーション名登録手段103に登録する(ステップS401)。アプリケーション名登録手段103は、通信に利用する名前と、この待機系受信アプリケーション503が処理ノード500上で動作するという情報とを関連付けてアプリケーション間通信情報104に保存する(ステップS402)。
次に、送信アプリケーション201が実行されると、通信に利用する名前と、送信アプリケーション201が動作する装置が処理ノード200であるという情報とを関連付けてアプリケーション名登録手段103に登録する(ステップS401)。アプリケーション名登録手段103は、通信に利用する名前と、この送信アプリケーション201が処理ノード200上で動作するという情報とを関連付けてアプリケーション間通信情報104に保存する(ステップS402)。
待機系受信アプリケーション403および待機系受信アプリケーション503は、それぞれアプリケーション名登録手段103に名前を登録した後、各処理ノード200,300,400,500上のアプリケーション制御手段202,304,404,504からの通知があるまで待機する(ステップS403)。
続いて、図4および図6を参照し、処理ノード300に障害が発生した時の動作について説明する。まず、処理ノード300に障害が発生すると(ステップS500)、障害検知手段105が障害の発生を検知し、処理ノード300で障害が発生したことを引き継ぎ先決定手段107に通知する(ステップS501)。引継ぎ先決定手段107は、処理ノード300で障害が発生した通知を受信すると、処理ノード300上で動作する現用系受信アプリケーション303を停止し、他の処理ノード400,500上で動作する待機系受信アプリケーションの中から処理を引き継ぐアプリケーション403,503の選択を開始する(ステップS502)。引継ぎ先決定手段107は、アプリケーション間通信情報104から受信アプリケーション301と処理ノード200上の送信アプリケーション201とが通信を行っていたことと、この通信に利用する名前を取得する(ステップS503)。
次に、引継ぎ先決定手段107は、アプリケーション間通信情報104から待機系受信アプリケーション403および待機系受信アプリケーション503が既に受信できる状態で実行されており、この通信に利用する名前と関連付けられていることを取得する(ステップS504)。
次に、引継ぎ先決定手段107は、ノード間通信性能情報102から処理ノード200と処理ノード400との間での通信性能、および処理ノード200と処理ノード500との間での通信性能を取得し、処理ノード200と処理ノード500との間での通信性能が十分良いことを取得する(ステップS505)。
次に、引継ぎ先決定手段107は、処理ノード200との間で通信性能が十分良い処理ノード500上のアプリケーション制御手段504に、待機系受信アプリケーション503を現用系に切り替えるように命令する(ステップS506)。
最後に、アプリケーション制御手段504は、待機系受信アプリケーション503を現用系に切替える(ステップS507)。
次に、本実施の形態の効果について説明する。本実施の形態では、ノード間通信性能情報102が、各処理ノード200,300,400,500間における通信性能を保持する。また、アプリケーション間通信情報104が、どのアプリケーション201,303,403,503同士が通信を行うかという情報を保持すると共に、現用系受信アプリケーション303の処理を引き継ぐことが可能な待機系受信アプリケーションがどの処理ノード400,500で起動しているかという情報を保存している。これにより、引継ぎ先決定手段107は、それらの情報を参照することで、処理ノード300に障害が発生した時に、待機系受信アプリケーション403,503が既に実行されている処理ノード400,500の中から送信アプリケーション201との通信性能が十分良い処理ノード400,500で動作している待機系受信アプリケーションを現用系に切替えることができる。
実施例
次に、具体的な実施例を用いて本発明を説明する。図7に示すように、図1に記載の管理ノード100は、CORBA(Common Object Request Broker Architecture)名前サーバ108と、ハートビート障害検出手段109とを含む。
定常状態で実行されている受信アプリケーションが受信アプリケーション301のみの場合、受信アプリケーション301はCORBA名前サーバ108に通信に使用する固有の名前を登録する。
送信アプリケーション201は、CORBA名前サーバ108に対して通信に使用する固有の名前として受信アプリケーション301が登録した名前と同じ名前を指定して受信アプリケーション301が動作する装置が処理ノード301であることを認識し、処理ノード301上で動作する受信アプリケーション301に対して通信によってデータの送信を開始する。
また、各処理ノード200,300,400,500上にはハートビート送信手段206,306,406,506が存在する。各ハートビート送信手段206,306,406,506は、ネットワーク600に対してハートビートパケットを一定の間隔でマルチキャスト送信し、ハートビート障害検出手段109は、各ハートビート送信手段206,306,406,506が送信するハートビートパケットが一定時間以上受信できない場合にその処理ノード200,300,400,500に障害が発生したと判断する。特定の処理ノード200,300,400,500に障害が発生すると、配置先決定手段106に対して障害の発生を通知し、配置先決定手段106は、ノード間通信性能情報102やアプリケーション間通信情報104に含まれる各種情報を元に処理ノード200との通信性能が最も良い処理ノード300,400,500上で受信アプリケーション301,401,501を実行するように決定する。
ネットワーク障害以外の処理ノード200,300,400,500上のハードウェア障害を検知する場合には、処理ノード200,300,400,500上で障害を検知して、直接配置先決定手段106に対して通知を行う方法も考えられる。
また、ノード間通信性能取得手段101には、SNMP(Simple Network Management Protocol)などの汎用的なネットワーク監視の仕組みが利用できる。ノード間通信性能取得手段101で取得し、配置先を決定する時に参考にするノード間通信性能情報102としては、通信の遅延や利用可能な帯域などがある。
次に、4つのノードから構成される場合のノード間通信性能情報102に保存するデータを図8に示す。図8に示すノード間通信性能情報102が存在し、NODE_A上に送信用アプリケーションが存在し、NODE_B上に受信用アプリケーションが存在し、互いに通信を行っている場合であり、この通信には20Mbpsの通信帯域が必要な場合に、NODE_Bで障害が発生すると、受信用アプリケーションはNODE_Cでは動作できず、NODE_Dで処理が引き継がれる。
次に、アプリケーション間通信情報104に保存されるデータの具体例を図9に示す。図9に示したアプリケーション間通信情報104では、NODE_A上のアプリケーションとNODE_B上のアプリケーションとが通信を行い、NODE_C上のアプリケーションとNODE_D上のアプリケーションとが通信を行うことを表わしている。
次に、図7における処理ノード200上の送信アプリケーション201と処理ノード300上の受信アプリケーション301とが通信を行うまでの処理の流れを図10に示す。受信アプリケーション301は、CORBA名前サーバ108にアプリケーション名と受信アプリケーション301が動作する装置が処理ノード300であることを登録する(呼び出しC100)。このとき通信に利用するアプリケーション名も一緒に登録する。
CORBA名前サーバ108は、アプリケーション名とアプリケーションが動作する装置が処理ノード300である情報とをアプリケーション間通信情報104に保存する。
次に、送信アプリケーション201は、受信アプリケーション301が動作する処理ノード300を知るために、上記アプリケーション名でCORBA名前サーバ108に問い合わせを行い、このアプリケーション名に対応する受信アプリケーション301が処理ノード300上で動作していることを取得する(呼び出しC101)。
上記問い合わせ実施時に、送信アプリケーション201が処理ノード200上で動作するという情報もCORBA名前サーバ108に送信することで、送信アプリケーション201が上記アプリケーション名で通信を行うという情報を、アプリケーション間通信情報104に登録する。
これにより、アプリケーション間通信情報104には、同一のアプリケーション名を関連付けることで送信アプリケーション201と受信アプリケーション301とが通信を行うことが登録される。送信アプリケーション201は、処理ノード300上の受信アプリケーション301に対して通信を行う。
本発明の配置先決定システムの各構成要素は、任意のコンピュータのCPU、メモリ、メモリにロードされた本図の構成要素を実現するプログラム、そのプログラムを格納するハードディスクなどの記憶ユニット、ネットワーク接続用インタフェースを中心にハードウェアとソフトウェアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。
本発明は、様々な性能のノードから構成されるネットワークを管理するクラスタリングミドルウェアにおいて、障害発生時に最適なノードで処理を引き継ぐといった用途に適用できる。なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
100 管理ノード
101 ノード間通信性能取得手段
102 ノード間通信性能情報
103 アプリケーション名登録手段
104 アプリケーション間通信情報
105 障害検知手段
106 配置先決定手段
107 引継ぎ先決定手段
200,300,400,500 処理ノード
202,302,402,502 アプリケーション実行手段
201 送信アプリケーション
301,401,501 受信アプリケーション
303 現用系受信アプリケーション
403,503 待機系受信アプリケーション
304,404,504 アプリケーション制御手段
600 ネットワーク

Claims (9)

  1. 複数の処理ノードと、前記処理ノードを管理する管理ノードとが、通信ネットワークを介して接続され、
    前記処理ノードには、送信用のアプリケーションを搭載するノードと、受信用のアプリケーションを搭載するノードとが含まれて構成される分散処理システムであって、
    前記管理ノードは、
    前記処理ノード間での通信における前記各処理ノードの通信性能に関する情報を取得するノード間通信性能取得手段と、
    前記各アプリケーションに付される識別情報を、当該各アプリケーションを搭載する前記処理ノードの識別情報とを関連付けて登録し、当該登録された情報に基づいて、互いに通信する前記アプリケーションおよび前記処理ノードを識別可能にするアプリケーション名登録手段と、
    前記処理ノードおよび前記アプリケーションの障害を検知する障害検知手段と、
    前記障害検知手段により障害の発生が検知された場合に、前記アプリケーション名登録手段に登録された情報に基づいて、当該障害の主体となる障害処理ノードと当該障害の発生前に通信していた既通信処理ノードを特定し、前記ノード間通信性能取得手段により取得された情報に基づいて、前記既通信処理ノードのうち前記障害処理ノードとの通信において十分な前記通信性能を有すると認められる通信機能充足処理ノードを特定し、前記通信機能充足処理ノードに、前記障害処理ノードが前記障害の発生前に行っていた前記アプリケーションによる処理を引き継がせる処理を行う配置先決定手段と、
    を備える分散処理システム。
  2. 前記処理ノードには、
    前記受信用のアプリケーションとして、通常時に動作する現用系受信アプリケーションを搭載する少なくとも1つのノードと、
    前記受信用のアプリケーションとして、非常時に動作する待機系受信アプリケーションを搭載する複数のノードと、
    が含まれ、
    前記配置先決定手段は、
    前記現用系受信アプリケーション又はこれを搭載するノードに障害が発生した場合に、前記待機系受信アプリケーションを搭載するノードのうち、前記送信用のアプリケーションとの通信において十分な前記通信性能を有するノードに、前記現用系受信アプリケーションによる処理を引き継がせる処理を行う、
    請求項1記載の分散処理システム。
  3. 前記処理ノードは、定期的な信号を送信するハートビート送信手段を備え、
    前記障害検知手段は、前記ハートビート送信手段により送信される信号の有無に基づいて、前記各処理ノード又はこれに搭載される前記アプリケーションの障害を検知する、
    請求項1又は2記載の分散処理システム。
  4. 通信に関するアプリケーションを搭載する複数の処理ノードが通信ネットワークを介して接続されてなる分散処理システムにおける制御方法であって、
    前記処理ノード間での通信における前記各処理ノードの通信性能に関する情報を取得するステップと、
    前記各アプリケーションに付される識別情報を、当該各アプリケーションを搭載する前記処理ノードの識別情報とを関連付けて登録するステップと、
    前記処理ノードおよび前記アプリケーションの障害を検知するステップと、
    前記障害が検知された場合に、前記登録された識別情報に基づいて、当該障害の主体となる障害処理ノードと当該障害の発生前に通信していた既通信処理ノードを特定するステップと、
    前記通信性能に関する情報に基づいて、前記既通信処理ノードのうち前記障害処理ノードとの通信において十分な前記通信性能を有すると認められる通信機能充足処理ノードを特定するステップと、
    前記通信機能充足処理ノードに、前記障害処理ノードが前記障害の発生前に行っていた前記アプリケーションによる処理を引き継がせるステップと、
    を備える分散処理システムの制御方法。
  5. 前記処理ノードに、
    前記受信用のアプリケーションとして、通常時に動作する現用系受信アプリケーションを搭載する少なくとも1つのノードと、
    前記受信用のアプリケーションとして、非常時に動作する待機系受信アプリケーションを搭載する複数のノードと、
    が含まれる場合において、
    前記現用系受信アプリケーション又はこれを搭載するノードに障害が発生した場合に、前記待機系受信アプリケーションを搭載するノードのうち、前記送信用のアプリケーションとの通信において十分な前記通信性能を有するノードに、前記現用系受信アプリケーションによる処理を引き継がせるステップ、
    を備える請求項4記載の分散処理システムの制御方法。
  6. 前記各処理ノードが、定期的な信号を送信するステップと、
    前記定期的な信号の有無に基づいて、前記各処理ノード又はこれに搭載される前記アプリケーションの障害を検知するステップと、
    を備える請求項4又は5記載の分散処理システムの制御方法。
  7. 通信に関するアプリケーションを搭載する複数の処理ノードと、前記処理ノードを管理する管理ノードとが、通信ネットワークを介して接続されてなる分散処理システムにおいて用いられる制御プログラムであって、
    前記管理ノードを構成するコンピュータに、
    前記処理ノード間での通信における前記各処理ノードの通信性能に関する情報を取得する処理と、
    前記各アプリケーションに付される識別情報を、当該各アプリケーションを搭載する前記処理ノードの識別情報とを関連付けて登録する処理と、
    前記処理ノードおよび前記アプリケーションの障害を検知する処理と、
    前記障害が検知された場合に、前記登録された識別情報に基づいて、当該障害の主体となる障害処理ノードと当該障害の発生前に通信していた既通信処理ノードを特定する処理と、
    前記通信性能に関する情報に基づいて、前記既通信処理ノードのうち前記障害処理ノードとの通信において十分な前記通信性能を有すると認められる通信機能充足処理ノードを特定する処理と、
    前記通信機能充足処理ノードに、前記障害処理ノードが前記障害の発生前に行っていた前記アプリケーションによる処理を引き継がせる処理と、
    を実行させる分散処理システムに用いられる制御プログラム。
  8. 前記処理ノードに、
    前記受信用のアプリケーションとして、通常時に動作する現用系受信アプリケーションを搭載する少なくとも1つのノードと、
    前記受信用のアプリケーションとして、非常時に動作する待機系受信アプリケーションを搭載する複数のノードと、
    が含まれる場合において、
    前記管理ノードを構成するコンピュータに、
    前記現用系受信アプリケーション又はこれを搭載するノードに障害が発生した場合に、前記待機系受信アプリケーションを搭載するノードのうち、前記送信用のアプリケーションとの通信において十分な前記通信性能を有するノードに、前記現用系受信アプリケーションによる処理を引き継がせる処理、
    を実行させる請求項7記載の分散処理システムに用いられる制御プログラム。
  9. 前記各処理ノードが、定期的な信号を送信する手段を備える場合において、
    前記管理ノードを構成するコンピュータに、
    前記定期的な信号の有無に基づいて、前記各処理ノード又はこれに搭載される前記アプリケーションの障害を検知する処理、
    を実行させる請求項7又は8記載の分散処理システムに用いられる制御プログラム。
JP2009048716A 2009-03-03 2009-03-03 分散処理システム及びその制御方法、並びに分散処理システムに用いられる制御プログラム Pending JP2010204875A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009048716A JP2010204875A (ja) 2009-03-03 2009-03-03 分散処理システム及びその制御方法、並びに分散処理システムに用いられる制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009048716A JP2010204875A (ja) 2009-03-03 2009-03-03 分散処理システム及びその制御方法、並びに分散処理システムに用いられる制御プログラム

Publications (1)

Publication Number Publication Date
JP2010204875A true JP2010204875A (ja) 2010-09-16

Family

ID=42966304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009048716A Pending JP2010204875A (ja) 2009-03-03 2009-03-03 分散処理システム及びその制御方法、並びに分散処理システムに用いられる制御プログラム

Country Status (1)

Country Link
JP (1) JP2010204875A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114167217A (zh) * 2021-12-09 2022-03-11 中国路桥工程有限责任公司 一种铁路配电网的多重故障诊断方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114167217A (zh) * 2021-12-09 2022-03-11 中国路桥工程有限责任公司 一种铁路配电网的多重故障诊断方法

Similar Documents

Publication Publication Date Title
JP7362186B2 (ja) クロックドリフト処理の方法、ネットワーク機能ネットワークエレメント、及び記憶媒体
US10778527B2 (en) Methods, systems, and computer readable media for providing a service proxy function in a telecommunications network core using a service-based architecture
US10938710B2 (en) Protection switching method and system, and network device
JPWO2016121728A1 (ja) ネットワーク機能仮想化管理およびオーケストレーション装置とシステムと管理方法とプログラム
JP5591814B2 (ja) 終端をグルーピングするための方法
CN108989200B (zh) 数据包转发方法、装置和系统
WO2010090325A1 (ja) 通信システム、通信装置、制御装置、制御方法及びプログラム
US8886838B2 (en) Method and system for transferring packets to a guest operating system
US20140019525A1 (en) Virtual desktop system, network processing device, and management method and management program thereof
JP2006215958A (ja) 周辺装置管理システム及び方法並びに周辺装置管理用プログラム
JP2016536920A (ja) ネットワークパフォーマンス監視のための機器および方法
CN1859423B (zh) 一种主机和转发设备同步切换的方法
JP2010251838A (ja) アクセスゲートウェイ装置及びアクセスゲートウェイ装置におけるセッション情報複製方法
JP2010204875A (ja) 分散処理システム及びその制御方法、並びに分散処理システムに用いられる制御プログラム
JP2011203941A (ja) 情報処理装置、監視方法、および監視プログラム
CN112448924A (zh) 一种兼容多种协议的报文处理方法、系统及交换设备
JP5276625B2 (ja) 更新api検出システム、更新api検出装置、更新api検出方法、および更新api検出プログラム
US20150156164A1 (en) Communication system, communication control method, communication relay system, and communication relay control method
WO2011020348A1 (zh) 实现网元链路状态轮询的方法、装置及网管服务器
JP5304359B2 (ja) 通信制御装置、データ同期方法およびデータ同期用プログラム
JP5861025B2 (ja) 基地局装置、通信システム及びデータ配信方法
JP2019176366A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2006129348A (ja) 親ノード決定システム及び方法、ノード装置、ならびに、コンピュータプログラム
JP5630611B2 (ja) ネットワーク監視システムおよびその監視対象装置の登録方法
WO2023181095A1 (ja) 基地局システム