JPH08329025A - プロセスマイグレーション方式 - Google Patents

プロセスマイグレーション方式

Info

Publication number
JPH08329025A
JPH08329025A JP7131781A JP13178195A JPH08329025A JP H08329025 A JPH08329025 A JP H08329025A JP 7131781 A JP7131781 A JP 7131781A JP 13178195 A JP13178195 A JP 13178195A JP H08329025 A JPH08329025 A JP H08329025A
Authority
JP
Japan
Prior art keywords
processors
multiprocessor
processor
detected
system abnormality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7131781A
Other languages
English (en)
Inventor
Kuniyasu Shimizu
邦保 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7131781A priority Critical patent/JPH08329025A/ja
Publication of JPH08329025A publication Critical patent/JPH08329025A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)

Abstract

(57)【要約】 【目的】システム異常検知時に、冗長的な処理を行うこ
となしにシステムの復旧を行うことを可能とするプロセ
スマイグレーション方式を提供する。 【構成】 複数のプロセッサ3からなるマルチプロセッ
サシステム4をネットワーク5で複数接続した分散処理
システムにおいて、プロセッサ3それぞれに、システム
異常を検知したときに、該マルチプロセッサシステム4
内の他のプロセッサ3すべてにシステム異常検知を通知
する異常状態通知部1と、システム異常を検知した際、
又は他のプロセッサよりシステム異常検知を通知された
際に、実行中のプロセスを他のマルチプロセッサシステ
ム内の所定のプロセッサにマイグレートするプロセスマ
イグレート部2とを具備してなることを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数のプロセッサから
なるマルチプロセッサシステムをネットワークで複数接
続した構成を持つ分散処理システムに適用して好適なプ
ロセスマイグレーション方式に係り、特にいずれかのプ
ロセッサがシステム異常を検知した際に、該マルチプロ
セッサシステム内の他のプロセッサとともに実行中のプ
ロセスを他のマルチプロセッサシステム内のプロセッサ
にマイグレートし、該マルチプロセッサシステムのリブ
ート後に、マイグレートしたプロセスをマイグレートバ
ックすることにより、冗長的な処理を行うことなしに、
システムの復旧を効率良く行うことを可能とするプロセ
スマイグレーション方式に関する。
【0002】
【従来の技術】計算機システムにおいて、システム稼働
中にシステム異常を発生させた場合、この計算機システ
ムをリブートすることによって計算機システムを正常の
状態に復帰させることが殆どである。
【0003】一般の計算機システムでは、このような場
合、実行中であった処理を一旦中断し、システムをリブ
ートした後に、実行中であった処理を再実行するといっ
た手順をとるが、この際、コンテクスト情報を含む各種
情報を保存していなければ、異常発生時に行われていた
処理は完全に破棄され、中断した処理を最初からやり直
すことが必要となる。
【0004】このように、異常の発生によってリブート
した場合、異常が発生した時点までの処理も再びやり直
すことになり、処理の冗長性による処理速度の低下が問
題となってしまう。
【0005】
【発明が解決しようとする課題】上述したように、一般
の計算機システムでは、異常状態を検出した場合、リブ
ートした後に継続中であった処理を最初からやり直す必
要があり、リブート以降の処理の冗長性による処理速度
の低下が問題となっていた。
【0006】本発明は、上記実情に鑑みなされたもので
あり、複数のマルチプロセッサシステムによって構成さ
れる分散システムにおいて、処理の途中で異常状態を検
出した場合に、途中まで処理したコンテクスト情報等を
他のシステム、又はリブートした後にもとのシステムが
引き継ぐことによって、冗長的な処理を行うことなしに
システムの復旧を行うことを可能とするプロセスマイグ
レーション方式を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明は、複数のプロセ
ッサからなるマルチプロセッサシステムをネットワーク
で複数接続した分散処理システムにおいて、上記プロセ
ッサそれぞれに、システム異常を検知したときに、該マ
ルチプロセッサシステム内の他のプロセッサすべてにシ
ステム異常を通知する手段と、システム異常を検知した
際、又は他のプロセッサよりシステム異常を通知された
際に、実行中のプロセスを他のマルチプロセッサシステ
ム内の所定のプロセッサにマイグレートする手段とを具
備してなることを特徴とする。
【0008】また、本発明は、上記プロセッサそれぞれ
が、さらに該マルチプロセッサシステムをリブートした
後に、上記マイグレートしたプロセスをマイグレートバ
ックする手段を具備してなることを特徴とする。
【0009】また、本発明は、複数のプロセッサからな
るマルチプロセッサシステムをネットワークで複数接続
した分散処理システムにおいて、上記プロセッサそれぞ
れに、システム異常を検知したときに、該マルチプロセ
ッサシステム内の他のプロセッサすべてにシステム異常
検出を通知する手段と、システム異常を検知した際、又
は他のプロセッサよりシステム異常を通知された際に、
実行中のプロセスに関する情報を外部記憶装置に保存す
る手段と、該マルチプロセッサシステムをリブートした
後に、上記保存した情報に基づいて、上記実行中であっ
たプロセスを再開する手段とを具備してなることを特徴
とする。
【0010】
【作用】本発明によれば、いずれかのプロセッサがシス
テム異常を検知した際に、通知手段が、該マルチプロセ
ッサ内の他のプロセッサすべてにシステム異常を検知し
た旨を通知する。
【0011】この後、システム異常を検知したプロセッ
サ、及びこのプロセッサからシステム異常検知の通知を
受けたプロセッサそれぞれが、他のマルチプロセッサシ
ステム内の所定のプロセッサに実行中のプロセスをマイ
グレートする。
【0012】そして、このすべてのプロセッサのマイグ
レートが完了した後に、該マルチプロセッサシステムの
リブートを行う。これにより、システム異常検知時に途
中まで行っていた処理を再度繰り返す等、冗長的な処理
を行うことなく、システムの復旧を行うことが可能とな
る。
【0013】また、本発明によれば、リブート完了後
に、他のマルチプロセッサシステム内のプロセッサにマ
イグレートしていたプロセスを該マルチプロセッサシス
テム内にマイグレートバックする。
【0014】これにより、一時的にマイグレート先のマ
ルチプロセッサシステムに偏っていた処理の負荷を通常
通りに回復させることができ、かつ、処理の継続性は保
たれる。
【0015】また、本発明によれば、いずれかのプロセ
ッサがシステム異常を検知した際に、通知手段が、該マ
ルチプロセッサの他のプロセッサすべてにシステム異常
を検知した旨を通知する。
【0016】この後、システム異常を検知したプロセッ
サ、及びこのプロセッサからシステム異常検知の通知を
受けたプロセッサそれぞれが、実行中のプロセスのコン
テクスト情報を含む各種情報を外部記憶装置に保存す
る。
【0017】そして、このすべてのプロセッサによる各
種情報の保存が完了した後に、該マルチプロセッサシス
テムのリブートを行う。一方、このマルチプロセッサシ
ステムのリブートが完了した後、今度は、外部記憶装置
に保存した情報に基づいて、実行中であったプロセスを
再開する。
【0018】これにより、上述と同様、システム異常検
知時に途中まで行っていた処理を再度繰り返す等、冗長
的な処理を行うことなく、システムの復旧を行うことが
可能となる。
【0019】
【実施例】以下図面を参照して本発明の実施例を説明す
る。まず、図1乃至図6を参照して本発明の第1実施例
を説明する。図1は第1実施例に係るプロセスマイグレ
ーション方式を適用してなる分散処理システムの概略構
成図である。
【0020】同実施例に係る分散処理システムを構成す
るマルチプロセッサシステム4は、ネットワーク5に接
続されており、このマルチプロセッサシステム4は、4
つのプロセッサ3から構成されている。また、これらの
プロセッサ3それぞれは、異常状態通知部1とプロセス
マイグレート部2とを備えている。
【0021】図2乃至図5は第1実施例の動作原理を説
明するための概念図である。いま、図2に示すように、
マルチプロセッサシステム4aのプロセッサ3a1が、
システム異常を検出した場合を考える。この場合、プロ
セッサ3a1は、異常状態通知部1により、マルチプロ
セッサシステム4a内の他のプロセッサ3a2〜3a4
すべてにシステム異常を検知した旨を通知する。
【0022】そして、図3に示すように、システム異常
を検知したプロセッサ3a1、及びシステム異常検知の
通知を受けたプロセッサ3a2〜3a4が、プロセスマ
イグレード部2によって、マルチプロセッサシステム4
b内の所定のプロセッサ3b1〜3b4に、実行中のプ
ロセスをマイグレートする。この例では、プロセッサ3
a1はプロセッサ3b1に、プロセッサ3a2はプロセ
ッサ3b2に、プロセッサ3a3はプロセッサ3b3
に、及びプロセッサ3a4はプロセッサ3b4にそれぞ
れ実行中のプロセスをマイグレートする。
【0023】そして、このプロセッサ3a1〜3a4そ
れぞれのマイグレートが完了した時点で、図4に示すよ
うに、マルチプロセッサシステム4aのリブートを実施
する。
【0024】さらに、このマルチプロセッサシステム4
aのリブート完了後、今度は、図5に示すように、マル
チプロセッサシステム4b側のプロセッサ3b1〜3b
4からマルチプロセッサシステム4a側のプロセッサ3
a1〜3a4へのマイグレートバックを実施する。この
マイグレートバックは、プロセスマイグレード部2によ
り行われる。
【0025】次に、図6を参照して第1実施例の動作手
順を説明する。図6は第1実施例の動作手順を説明する
ためのフローチャートである。いずれかのプロセッサが
システム異常を検知すると(図6のステップA1)、異
常状態通知部1が、該マルチプロセッサ内の他のすべて
のプロセッサに対して異常状態検知を通知する(図6の
ステップA2)。
【0026】そして、このシステム異常を検知したプロ
セッサ、及び異常状態検知を通知されたプロセッサのす
べてが、プロセスマイグレート部2により他のマルチプ
ロセッサ内の所定のプロセッサに、実行中のプロセスを
マイグレートする(図6のステップA3)。
【0027】また、この実行中プロセスのマイグレート
完了後、システム異常を発生させたシステムをリブート
する(図6のステップA4)。そして、このリブート終
了後、他のマルチプロセッサ内の所定のプロセッサにマ
イグレートしたプロセスを、もとのマルチプロセッサに
マイグレートバックする(図6のステップA5)。
【0028】以上の手順により、システム異常検知時に
途中まで行っていた処理を再度繰り返す等の冗長的な処
理を行うことなく、システムの復旧を行うことが可能と
なる。
【0029】次に図7乃至図12を参照して本発明の第
2実施例を説明する。図7は第2実施例に係るプロセス
マイグレーション方式を適用してなる分散処理システム
の概略構成図である。
【0030】同実施例に係る分散処理システムを構成す
るマルチプロセッサシステム4は、ネットワーク5に接
続されており、このマルチプロセッサシステム4は、4
つのプロセッサ3から構成されている。また、これらの
プロセッサ3それぞれは、異常状態通知部1、プロセス
保存部6及びプロセス再実行部7を備えている。
【0031】図8乃至図11は第2実施例の動作原理を
説明するための概念図である。いま、図8に示すよう
に、マルチプロセッサシステム4aのプロセッサ3a1
が、システム異常を検出した場合を考える。この場合、
プロセッサ3a1は、異常状態通知部1により、マルチ
プロセッサシステム4a内の他のプロセッサ3a2〜3
a4すべてにシステム異常を検知した旨を通知する。
【0032】そして、図9に示すように、システム異常
を検知したプロセッサ3a1、及びシステム異常検知の
通知を受けたプロセッサ3a2〜3a4が、プロセス保
存部6によって、実行中のプロセスのコンテクスト情報
を含む各種情報を、ネットワーク5に接続された外部記
憶装置8に保持する。
【0033】そして、このプロセッサ3a1〜3a4そ
れぞれによる実行中プロセスのコンテクスト情報を含む
各種情報の保存が完了した時点で、図10に示すよう
に、マルチプロセッサシステム4aのリブートを実施す
る。
【0034】さらに、このマルチプロセッサシステム4
aのリブート完了後、今度は、図11に示すように、プ
ロセス再実行部7により外部記憶装置8に保存した各種
情報に基づいたプロセスの再実行が実施される。
【0035】次に、図12を参照して第2実施例の動作
手順を説明する。図12は第2実施例の動作手順を説明
するためのフローチャートである。いずれかのプロセッ
サがシステム異常を検知すると(図12のステップB
1)、異常状態通知部1が、該マルチプロセッサ内の他
のすべてのプロセッサに対して異常状態検知を通知する
(図12のステップB2)。
【0036】そして、このシステム異常を検知したプロ
セッサ、及び異常状態検知を通知されたプロセッサのす
べてが、プロセス保存部6により外部記憶装置8へ実行
中のプロセスのコンテクスト情報を含む各種情報を保持
する(図12のステップB3)。
【0037】また、この外部記憶装置8への実行中プロ
セスのコンテクスト情報を含む各種情報の保持が完了し
た後、システム異常を発生させたシステムをリブートす
る(図12のステップB4)。
【0038】そして、このリブート終了後、外部記憶装
置8に保持した各種情報に基づいて、プロセスの再実行
を実施する(図12のステップB5)。以上の手順によ
り、第1実施例と同様、システム異常検知時に途中まで
行っていた処理を再度繰り返す等の冗長的な処理を行う
ことなく、システムの復旧を行うことが可能となる。
【0039】
【発明の効果】以上詳述したように本発明によれば、シ
ステム異常検知時に途中まで行っていた処理を再度繰り
返す等、冗長的な処理を行うことなく、システムの復旧
を行うことが可能となる。
【図面の簡単な説明】
【図1】第1実施例に係るプロセスマイグレーション方
式を適用してなる分散処理システムの概略構成図。
【図2】第1実施例の動作原理を説明するための概念
図。
【図3】第1実施例の動作原理を説明するための概念
図。
【図4】第1実施例の動作原理を説明するための概念
図。
【図5】第1実施例の動作原理を説明するための概念
図。
【図6】第1実施例の動作手順を説明するためのフロー
チャート。
【図7】第2実施例に係るプロセスマイグレーション方
式を適用してなる分散処理システムの概略構成図。
【図8】第2実施例の動作原理を説明するための概念
図。
【図9】第2実施例の動作原理を説明するための概念
図。
【図10】第2実施例の動作原理を説明するための概念
図。
【図11】第2実施例の動作原理を説明するための概念
図。
【図12】第2実施例の動作手順を説明するためのフロ
ーチャート。
【符号の説明】
1…異常状態通知部、2…プロセスマイグレート部、3
…プロセッサ、4…マルチプロセッサシステム、5…ネ
ットワーク、6…プロセス保存部、7…プロセス再実行
部。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数のプロセッサからなるマルチプロセ
    ッサシステムをネットワークで複数接続した分散処理シ
    ステムにおいて、 上記プロセッサそれぞれに、システム異常を検知したと
    きに、該マルチプロセッサシステム内の他のプロセッサ
    すべてにシステム異常検知を通知する手段と、システム
    異常を検知した際、又は他のプロセッサよりシステム異
    常検知を通知された際に、実行中のプロセスを他のマル
    チプロセッサシステム内の所定のプロセッサにマイグレ
    ートする手段とを具備してなることを特徴とするプロセ
    スマイグレーション方式。
  2. 【請求項2】 上記プロセッサそれぞれに、さらに該マ
    ルチプロセッサシステムをリブートした後に、上記マイ
    グレートしたプロセスをマイグレートバックする手段を
    具備してなることを特徴とする請求項1記載のプロセス
    マイグレーション方式。
  3. 【請求項3】 複数のプロセッサからなるマルチプロセ
    ッサシステムをネットワークで複数接続した分散処理シ
    ステムにおいて、 上記プロセッサそれぞれに、システム異常を検知したと
    きに、該マルチプロセッサシステム内の他のプロセッサ
    すべてにシステム異常検知を通知する手段と、システム
    異常を検知した際、又は他のプロセッサよりシステム異
    常検知を通知された際に、実行中のプロセスに関する情
    報を外部記憶装置に保存する手段と、該マルチプロセッ
    サシステムをリブートした後に、上記保存した情報に基
    づいて、上記実行中であったプロセスを再開する手段と
    を具備してなることを特徴とするプロセスマイグレーシ
    ョン方式。
JP7131781A 1995-05-30 1995-05-30 プロセスマイグレーション方式 Pending JPH08329025A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7131781A JPH08329025A (ja) 1995-05-30 1995-05-30 プロセスマイグレーション方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7131781A JPH08329025A (ja) 1995-05-30 1995-05-30 プロセスマイグレーション方式

Publications (1)

Publication Number Publication Date
JPH08329025A true JPH08329025A (ja) 1996-12-13

Family

ID=15066005

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7131781A Pending JPH08329025A (ja) 1995-05-30 1995-05-30 プロセスマイグレーション方式

Country Status (1)

Country Link
JP (1) JPH08329025A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005083569A1 (ja) * 2004-02-26 2005-09-09 Nec Corporation ネットワーク間のプロセス移動方法およびそのネットワークシステム
KR100737522B1 (ko) * 2005-12-02 2007-07-10 한국전자통신연구원 마이그레이션 데이터 모니터링 방법 및 시스템
US8121877B2 (en) * 2007-07-18 2012-02-21 International Business Machines Corporation Dynamic evolution of business performance management solutions using declarative evolution policies

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005083569A1 (ja) * 2004-02-26 2005-09-09 Nec Corporation ネットワーク間のプロセス移動方法およびそのネットワークシステム
JPWO2005083569A1 (ja) * 2004-02-26 2008-01-17 日本電気株式会社 ネットワーク間のプロセス移動方法およびそのネットワークシステム
US7684417B2 (en) 2004-02-26 2010-03-23 Nec Corporation Method of migrating processes between networks and network system thereof
JP4591840B2 (ja) * 2004-02-26 2010-12-01 日本電気株式会社 ネットワーク間のプロセス移動方法およびそのネットワークシステム
KR100737522B1 (ko) * 2005-12-02 2007-07-10 한국전자통신연구원 마이그레이션 데이터 모니터링 방법 및 시스템
US8121877B2 (en) * 2007-07-18 2012-02-21 International Business Machines Corporation Dynamic evolution of business performance management solutions using declarative evolution policies

Similar Documents

Publication Publication Date Title
US8688642B2 (en) Systems and methods for managing application availability
US6266781B1 (en) Method and apparatus for providing failure detection and recovery with predetermined replication style for distributed applications in a network
KR20000011834A (ko) 고장-허용오차를계산하는컴퓨터시스템및이를동작시키는방법,고장-관리컴퓨터장치,및고장-허용오차계산장치
JP5392594B2 (ja) 仮想計算機冗長化システム、コンピュータシステム、仮想計算機冗長化方法、及びプログラム
JPH08263454A (ja) 障害回復処理方法
JPH0950424A (ja) ダンプ採取装置およびダンプ採取方法
JP2005242404A (ja) コンピュータシステムの系切替方法
JPH08329025A (ja) プロセスマイグレーション方式
JP3551079B2 (ja) 修正ロードモジュール置換後の復旧方法ならびに装置
JP3022768B2 (ja) 仮想計算機システム
JPH10116261A (ja) 並列計算機システムのチェックポイントリスタート方法
JPH07219802A (ja) 2重化制御方式
JPS62115555A (ja) 計算機システムの補助記憶装置2重化管理方法
JP2010055509A (ja) 障害復旧システム、方法及びプログラム、並びにクラスタシステム
JPH064418A (ja) メモリバックアップ装置の異常処理方式
JPS6341943A (ja) 論理装置のエラ−回復方式
JPH052499A (ja) 情報処理装置のジヨブ障害再処理方式
JP2021149393A (ja) プロセッサ及びプロセッサの冗長化方法
JPH0713792A (ja) ホットスタンバイシステムにおけるエラー制御方式
JPS6077252A (ja) 入出力制御装置
JPS597982B2 (ja) 計算機システムのシステム障害時の再開始方式
JP4878113B2 (ja) Dasd故障時のリンクライブラリの復旧方法、及びプログラム
JP2012256227A (ja) プロセス障害判定復旧装置、プロセス障害判定復旧方法、プロセス障害判定復旧プログラム、および記録媒体
JPH04124735A (ja) システム起動方式
JPS635779B2 (ja)