JP5560113B2 - 計算機システム及び計算機の管理方法 - Google Patents

計算機システム及び計算機の管理方法 Download PDF

Info

Publication number
JP5560113B2
JP5560113B2 JP2010144409A JP2010144409A JP5560113B2 JP 5560113 B2 JP5560113 B2 JP 5560113B2 JP 2010144409 A JP2010144409 A JP 2010144409A JP 2010144409 A JP2010144409 A JP 2010144409A JP 5560113 B2 JP5560113 B2 JP 5560113B2
Authority
JP
Japan
Prior art keywords
message
computer
state
management
synchronization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010144409A
Other languages
English (en)
Other versions
JP2012008819A (ja
Inventor
雅昭 小川
純 濱中
崇博 大平
修治 西山
秀樹 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2010144409A priority Critical patent/JP5560113B2/ja
Publication of JP2012008819A publication Critical patent/JP2012008819A/ja
Application granted granted Critical
Publication of JP5560113B2 publication Critical patent/JP5560113B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、計算機システムおよび計算機の管理方法に関するものである。
計算機システムにおいて計算機を多重化することで、ハードウエアの故障に対しても、システム内の処理を継続することができるようにして、システム稼働時間を長時間化する技術が存在する。
例えば、システムの停止時間を最小化するための計算機としてフォールトトレラントコンピュータ(Fault Tolerant Computer)がある。この技術では、複数の計算機にて同じ処理を行い、切り替わる際には処理結果などを他の計算機に引き継ぐ処理をなくし、計算機が切り替わる際の時間を短縮しつつ、CPUの障害時にも処理の継続可能とする(特許文献1参照)。
また、例えば、互いに独立して同一処理を実行する2つの装置を備え、一方の装置においてステータスを取得し、取得されたステータスに応じた共通のイベントを、両方の装置において発生させる技術が知らされている(特許文献2参照)。
特開平8−314744号公報 特開2006−209565号公報
上述した特許文献1に記載されている技術においては、専用のハードウエアによって各計算機が同一クロックが供給されるように接続されているので、各計算機のメモリ,キャッシュのリソース状況が一致しないことより、各計算機においてプログラムの処理時間に差が生じる。また、一般的なネットワークを使用するには、同一クロックを供給することができないためプログラム開始と終了のタイミングを各計算機であわせることができず、各計算機において同期がとれない。
上述した特許文献2に記載の技術においては、計算機の状態情報を取得し、不一致のときいずれかの状態情報を選択しているところ、各計算機で発生するハードウエア異常が同一クロックを供給することができないため非同期で発生するが、計算機の状態変化が同期すること前提としているため計算機個別で非同期に発生する計算機の状態変化において状態情報が不一致であるために各計算機で異なる動作をする。
本発明の目的は、各計算機が同じ処理を行いつつ、同期実行を継続することが可能な計算機システム及び計算機の管理方法を提供することにある。
上記目的を達成するために、本発明では、自計算機の状態情報を他計算機にメッセージとして送信するメッセージ手段と、前記メッセージに対して他計算機から前記状態情報に応じた同期準備の情報を得て同期を開始する同期手段と、前記同期手段の指示に基づいて前記状態情報を応じて動作を変更する同期実行プログラムとを有することを特徴とする計算機システム。
本発明によれば、各計算機が同じ処理を行い、同期実行を継続することが可能となる。
本実施形態の計算機システム構成例を示す図である。 本実施形態の各計算機の機能を示すブロック図である。 同期機構の動作を示すフローチャートである。 同期プログラムの動作を示すフローチャートである。 ログメッセージ管理機構の動作を示すフローチャートである。 メッセージ管理機構のメッセージ送信の動作のフローチャートを示す図である。 メッセージ管理機構の通知メッセージのデータ構成を示す図である。 メッセージ管理機構のメッセージ受信の動作のフローチャートを示す図である。 メッセージ管理機構のメッセージ管理テーブルのデータ構成を示す図である。 メッセージ管理機構の出力メッセージ選択の動作のフローチャートを示す図である。 状態管理機構の状態変更の動作のフローチャートを示す図である。 状態管理機構の状態変更管理テーブルのデータ構造を示す図である。 状態管理機構の状態管理テーブルのデータ構造を示す図である。 各計算機の状態情報を一致化する処理の例を示すタイミングチャートである。
以下に実施形態について図面を用いて詳細に説明する。なお、各機能をブロックで表し、「…機構」と名付けるか、これは、「…手段」と称しても良く、例えば、全体を計算機(1つまたは複数)で実現したとき各機能はソフトウエアでも、また別構成のハードウエアでも実現できるものである。
図1は本実施形態の計算機システム10は、演算処理を行う計算機11〜13と、演算処理の結果を照合する照合ノード21〜26を備えている。
n(nは2以上の自然数)台からなる複数の計算機11〜13は、それぞれ多重化ネットワーク1に接続し、m(mは2以上の自然数)台からなる複数の照合ノード21〜26は、それぞれ多重化ネットワーク1と外部ネットワーク2に接続している。
計算機11〜13および照合ノード21〜26は、“計算機1”〜“計算機n”および“照合ノード1”〜“照合ノードm”はシステム全体でユニークとなる番号が割り振られており、同じ番号は存在しないものとする。
なお、多重化ネットワーク1は、LAN1系3,LAN2系4を有する2重化以上の多重化ネットワークであり、外部ネットワーク2は2重化以上の多重化ネットワーク1でも可能とする。また、この2つのネットワークはネットワークに限定しない。すなわちバス状でもスター状であってもよい。
各照合ノード21〜26は2台のノードで1つの対として構成されており、図1においてはm組みの照合ノードペア31〜33として構成されている。照合ノードペア31〜33のうち、1組のペアが主系となる。このように、照合ノードペア間において主従を構成する。
主系ペア31には、“主系”が割り振られており、各従系ペアには32,33にはそれぞれ“従系1”〜“従系m−1”が割り振られている。システム全体においては同じペア番号は存在しないものとする。
主系ペア31は計算機11〜13から出力された送信データを比較照合し、計算機システム10から外部ネットワーク2へ出力する。
また、主系ペア31は外部から受信するデータは、多重化ネットワーク1を介して計算機11〜13へブロードキャスト通信をする。
図1に記載の計算機システム10は、複数の計算機11〜13を多重化ネットワーク1で接続し、計算機11〜13でプログラムの同期を取りながら実行する。さらに、計算機11〜13から出力されるデータを主系ペア31において比較照合し、外部ネットワーク1へ出力することで、フォールトトレラントシステムを構成する計算機システムである。
図2は計算機11〜13内の構成を詳細に示す図である。
図1の計算機は、図2の計算機1(100)および計算機2(101)に対応する。また、図1の多重化ネットワーク1は、多重化ネットワーク110に対応するものである。
図2は、少なくとも2台の計算機1(100)と計算機2(101)が多重化ネットワーク110によって接続されている。
計算機1(100)と計算機2(101)は同一の構成を有しており、以下、詳細な構造については計算機1(100)についてのみ説明する。
本発明における計算機1(100)は、後述する同期実行プログラム130が同期待ちに到達し、各計算機のメッセージ管理機構がメッセージを送信および受信が完了したことを示す通知を受信したとき、後述するメッセージ管理機構160へ起動の通知およびメッセージ管理機構の処理が終了したことを示す通知を受信することで各計算機の状態情報の一致化を行い、各計算機で同期をとって実行するために後述する同期実行プログラム130の起動タイミングを制御する同期機構120と、
同期機構120より起動タイミングを制御され、後述する状態管理機構170の状態管理テーブルの内容によって挙動が変化し、プログラムに障害が発生した際には後述するログメッセージ管理機構150へメッセージを出力する同時実行プログラム130と、
障害または障害から回復した際に発生する状態変更のメッセージを後述するログメッセージ管理機構150へ出力するハードウエア装置140と、
同期実行プログラム130およびハードウエア装置140から出力されたメッセージを記録する。
また、後述するメッセージ管理機構160へメッセージの内容を通知し、後述するメッセージ管理機構160から通知されたメッセージを記録するログメッセージ管理機構150と、
ログメッセージ管理機構150から通知されたメッセージに対して、後述する通知メッセージデータを作成し、自計算機の後述するメッセージ管理機構が有するメッセージ管理テーブルへ通知メッセージデータを格納し、通知メッセージデータを後述する多重化ネットワーク110を介して他の計算機へ転送し、メッセージを転送中であることを示す通知を同期機構へ通知する。
また、他の計算機から後述する通知メッセージデータの受信があった場合には、後述するメッセージ管理機構が有するメッセージ管理テーブルに後述する通知メッセージデータの元に転送該当計算機の通知メッセージデータを扱うテーブルへ格納し、メッセージを受信したことを同期機構へ通知する。
また、同期機構120より同期実行プログラム130が同期待ちに入ったことを示す通知を受信すると状態変更の順番を一致化するために出力するメッセージを後述するメッセージ管理テーブルの通知メッセージデータを比較することで決定し、後述する状態管理機構170へ通知し、状態管理機構の処理が完了したことを待ち合わせる。また、メッセージが自計算機より出力されたものでない場合は、ログメッセージ管理機構150へ通知し、メッセージ管理機構の処理が終了した場合には、同期機構へ処理が終了したことを通知するメッセージ管理機構160と、
メッセージ管理機構160から通知があったメッセージに対する状態変更を行うか後述する状態管理機構が有する状態変更管理テーブルを元に判断し、後述する状態管理機構が有する状態管理テーブルの変更が必要である場合には後述する状態管理機構が有する状態管理テーブルを変更し、処理が終了したことをメッセージ管理機構へ通知する状態管理機構170を備える。
図3は同期機構120の動作のフローチャートを示す。
図3において、同期機構120は、同期実行プログラムが同期待ちになったことを示す通知を受信し、各計算機の同期実行プログラムが同期待ちになったことと後述するメッセージ管理機構のメッセージ転送および受信が完了したことを待ち合わせると(S1)、メッセージ管理機構へ各計算機の状態を一致化するための通知を送信する(S2)。また、メッセージ管理機構から状態が一致化されたことを示す通知の受信を全計算機で待ち合わせると(S3)、同期実行プログラムへ起動の通知をする(S4)。
図4は同期実行プログラム130動作のフローチャートを示す。
図4において、同期実行プログラム130は、同期機構120に対して同期起動待ちであることを通知する(S11)。
同期機構120より起動されると、後述する状態管理機構170が有する状態管理テーブルから状態を読み込み(S12)、状態管理テーブルの内容に変更が生じたか判断し(S13)、変更が生じた場合には状態変更に伴う動作を行う(S14)。
図5はログメッセージ管理機構150の動作フローチャートを示す。
図5において、ログメッセージ管理機構150は、本機構へのメッセージを受信すると(S21)、メッセージを本機構の有するバッファへ書き込み(S22)、メッセージをメッセージ管理機構へ通知する(S23)。
図6はメッセージ管理機構160が他の計算機へ通知メッセージデータを転送する動作のフローチャートを示す。
図6において、通知メッセージデータ転送は、状態変更が発生したハードウエア装置140または同期実行プログラム130からログメッセージ管理機構160へ出力されたメッセージを受信と(S31)、同期機構へ通知メッセージデータを送信中であることを示す通知を送信する(S32)。
また、後述する通知メッセージデータを作成し(S33)、後述するメッセージ管理テーブルに存在する該当計算機の通知メッセージデータを扱うテーブルへ通知メッセージデータを格納し(S34)、図2に記載の多重化ネットワーク110へ接続されている全計算機へ通知メッセージデータの転送を行う(S35)。
図7はメッセージ管理機構160が扱う通知メッセージデータのデータ構造について示す。
図7において、通知メッセージデータ310は、メッセージが出力された計算機を示す識別番号である計算機番号311と、ログメッセージ管理機構150へ通知されたメッセージ312と、状態変更が発生したハードウエア装置140または同期実行プログラム130からメッセージが出力された時間を示すメッセージ出力時間313と、メッセージ312に対するCRC値のデータ314によって構成される。
図8においてメッセージ管理機構160の他の計算機から通知メッセージデータ310を受信する動作のフローチャートを示す。
図8において、通知メッセージデータ受信は、通知メッセージデータ310を他の計算機から受信すると(S41)、後述するメッセージ管理機構160が有するメッセージ管理テーブルに通知メッセージデータの計算機番号311を元に転送該当計算機の通知メッセージデータ310を扱うテーブルへ格納する(S42)。また、同期機構へ通知メッセージデータを受信したことを示す通知を送信する(S43)。
図9において、メッセージ管理機構160が有するメッセージ管理テーブルのデータ構造について示す。
図9において、メッセージ管理テーブル320は、図1に記載の計算機11〜13の通知メッセージデータ310を格納するテーブル321〜323を持ち、通知メッセージデータ310を先頭から保持するデータ構造で構成される。
図10においてメッセージ管理機構160の出力メッセージ選択の動作のフローチャートを示す。
図10において、出力メッセージ選択は、同期機構120より同期実行プログラム130が同期待ちに遷移したことを示す通知を受信すると(S51)、メッセージ管理機構160のメッセージ管理テーブル320に通知メッセージデータ310が存在するか判断する(S52)。
メッセージ管理テーブル320に通知メッセージデータ310が存在しないときは、各計算機において同期機構120へメッセージ管理機構160の処理が終了したことを通知する(S53)。
また、メッセージ管理テーブル320に通知メッセージデータ310が存在するときは、メッセージ管理テーブル320の各計算機の通知メッセージデータ310を格納するテーブル321〜323から通知メッセージデータ310を参照し、各計算機の通知メッセージデータ310を格納するテーブル321〜323に存在する通知メッセージデータ310においてメッセージ出力時間313とメッセージのCRC314を比較する(S54)。メッセージ管理テーブル320の各計算機の通知メッセージデータ310を格納するテーブル321〜323においてメッセージ出力時間313とメッセージのCRC314が一致している通知メッセージデータ310が存在するときは一致している通知メッセージデータのなかでメッセージ出力時間313が最も古い通知メッセージデータ310を選択する(S55)。
また、メッセージ管理テーブルの各計算機の通知メッセージデータ310を格納するテーブル321〜323においてメッセージ出力時間313とメッセージのCRC314が一致している通知メッセージデータ310が存在しないときは、メッセージ出力時間313が最も古い通知メッセージデータ310を出力メッセージとして選択する。また、このとき各計算機の通知メッセージデータ310を格納するテーブル321〜323においてメッセージ出力時間313が同じものが複数存在したときは計算機番号311が小さい通知メッセージデータを選択する(S56)。
また、選択された通知メッセージデータ310から後述する状態管理機構170へメッセージ312を通知する(S57)。
また、後述する状態管理機構の状態変化の処理が終了したことを示す通知を受信するまで待ち合わせる(S58)。
また、選択された通知メッセージデータ310の計算機番号311が自計算機の番号でなかった場合には、ログメッセージ管理機構へ通知メッセージデータのメッセージ312を通知する(S59)。
また、メッセージ管理テーブル320の計算機の通知メッセージデータ310を格納するテーブル321〜323から選択された通知メッセージデータ310を削除する(S60)。
図11において状態管理機構170の状態変更の動作のフローチャートを示す。
図11において、状態変更は、メッセージ管理機構160より通知されたメッセージ312を受信すると(S71)、後述する状態管理機構170が有する状態変更管理テーブルに存在するメッセージであるか判断し(S72)、状態変更管理テーブルに存在するメッセージである場合には、状態変更管理テーブルの内容において状態が変更となる後述する状態管理機構が有する状態管理テーブルの状態遷移を行う(S73)。また、状態管理機構の処理が終了したことをメッセージ管理機構へ通知する(S74)。
図12において状態管理機構170が有する状態変更管理テーブルのデータ構造について記載する。
図12において、状態変更管理テーブル410は、メッセージ411に対して後述する状態管理テーブルの状態遷移が必要な計算機412,ハードウエア装置413,後述する状態管理テーブルの状態遷移を定義した414のデータテーブルによって構成される。
図13において状態管理機構が有する状態管理テーブルのデータ構造について記載する。
図13において、状態管理テーブル420は、多重化ネットワーク1で接続されている各計算機421〜423を構成するハードウエア装置424,426および428と、ハードウエア装置の状態425,427および429を表すデータテーブルで構成される。
図14において、タイミングチャートを示す。
図14の計算機500では、同期実行プログラム510と、同期機構520と、ログメッセージ管理機構530と、メッセージ管理機構540と、ステータス管理機構550を示している。
また、計算機501では同期実行プログラム511と、同期機構521と、ログメッセージ管理機構531と、メッセージ管理機構541と、ステータス管理機構551を示している。
計算機500においてハードウエア装置から状態変更メッセージが出力されるとa1、
また、ログメッセージ管理機構530がメッセージを記録し、メッセージ管理機構540へメッセージを通知するa2と、
また、メッセージ管理機構540が通知メッセージデータを送信中であることを示す通知を同期機構520へ通知するa3と、
また、メッセージ管理機構540がメッセージ受信すると通知メッセージデータを作成し、多重化ネットワークで接続されている全計算機へ通知メッセージデータを転送するa4と、
また、メッセージ管理機構541が通知メッセージデータを受信したことを同期機構521へ通知するb5と、
また、同期機構521が同期機構520へ通知メッセージを受信したことを通知するb6と、
また、同期実行している同期実行プログラム510および511が同期待ち合わせに遷移するa7,b7と、
また、各計算機の同期機構520および521が各計算機の同期実行プログラムが同期待ちになっていることと通知メッセージデータの送受信が完了していることを確認するc1と、
また、同期機構520および521はメッセージ管理機構540および541へメッセージの出力と各計算機の状態を一致化するために通知するa8,b8と、
また、メッセージ管理機構540,541は状態変化の順番を一致化するために出力する通知メッセージデータ310を選択し、状態管理機構550,551へ通知メッセージデータ310のメッセージ312通知するa9,b9と、
また、状態管理機構550および551において状態情報の更新が終了したことを通知するa10,b10と、
また、メッセージ管理機構541からログメッセージ管理機構531へメッセージを出力し、ログメッセージ管理機構531がメッセージを記録するb11と、
また、メッセージ管理機構540および541から処理が終了したことを同期機構520および521へ通知するa12,b12と、
また、各計算機の同期機構520および521がメッセージ管理機構540および541から処理が終了したことを待ち合わせるc2と、
また、同期機構520および521が同期実行プログラム510および511を起動するa13,b13タイミングチャートで処理を行う。
このように、複数の計算機を一般的なネットワークで接続した計算機システムにおいて、計算機が持つ状態情報を一致化することで、計算機の状態情報を参照し、計算機の状態情報によってプログラムの挙動が変化する同期実行プログラムにおいても同期実行することを可能とする。
以上説明の実施例の特徴を要約すると、一般的なネットワークに接続され同一時刻に同一プログラムを実行することでフォールトトレラントシステムを実現する各計算機は、プログラムの開始と状態情報一致化のタイミングを同期する同期機構121より実行され状態管理機構171が保持する状態管理テーブルを参照し、計算機の状態情報を元に動作を変更する同期実行プログラム130を備えている。
また、同期実行プログラム130およびハードウエア装置140より出力される状態変更を通知するメッセージを受け取りメッセージ管理機構161へ通知し、メッセージ管理機構161が保持するメッセージ管理テーブルから状態変更の順番を一致化するために選択されたメッセージを受け取るログメッセージ管理機構151を備えている。
また、ログメッセージ管理機構151から受け取ったメッセージについて情報を付加し作成した通知メッセージデータを自計算機のメッセージ管理テーブルに格納および他の計算機へ伝達する。
また、同期機構121から状態情報一致化の通知を受信したタイミングでメッセージ管理テーブルに格納されている通知メッセージデータに対して各計算機で状態変更の順番を一致化するために出力する順序を決定し、状態管理機構171へ選択されたメッセージを通知し、メッセージが自計算機より出力されたものでない場合は、ログメッセージ管理機構151へメッセージを通知するメッセージ管理機構161を備えている。
また、一般的なネットワークに接続された計算機の各計算機の状態を表す状態情報を保持する状態管理テーブルを有し、メッセージ管理機構161から通知があったメッセージに対して状態情報の変更が必要な場合には、状態変更テーブルを元に状態管理テーブルの内容を変更する状態管理機構171を備える。
これにより各計算機の状態情報を一致化する機能を実現し、複数台の計算機に非同期に発生する状態変化が発生しても各計算機において状態が一致化しているため同期実行プログラムの挙動を一致することが可能となり同時実行プログラムの実行を継続することが可能となる。
このように、複数の計算機を一般的なネットワークで接続し、同一時刻に同一プログラムを実行する計算機システムにおいて、各計算機で同期および非同期に計算機の状態変更が発生した場合においても各計算機間で状態情報を一致化することが可能であり、各計算機が保持する状態情報を参照するプログラムにおいても各計算機が同じ処理を行い、同期実行を継続することが可能となり、また各計算機は自計算機が持つ状態情報を参照することでネットワークで接続された全計算機の状態情報を知ることができる。
なお、上述した本実施の形態例に限らず、特許請求の範囲に記載された本発明の要旨を逸脱しない限り、適宜変更しうることは言うまでもない。
100 計算機1
101 計算機2
110 多重化ネットワーク
120,121 同期機構
130,131 同期実行プログラム
140,141 ハードウエア装置
150,151 ログメッセージ管理機構
160,161 メッセージ管理機構
170,171 状態管理機構

Claims (12)

  1. 自計算機の状態情報を他計算機にメッセージとして送信するメッセージ手段と、前記メッセージに対して他計算機から前記状態情報に応じた同期準備の情報を得て同期を開始する同期手段と、前記同期手段の指示に基づいて前記状態情報に応じて動作を変更する同期実行プログラムとを有し、前記状態情報は状態管理手段に保持され、前記メッセージ手段は、メッセージ管理手段と、前記メッセージ管理手段から通知のメッセージを記録する共に、ハードウエアからの状態変更に係る情報を受けるログメッセージ管理手段と、を含んでなることを特徴とする計算機システム。
  2. 前記メッセージ管理手段は、前記ログメッセージ管理手段から通知されたメッセージについて他計算機へ伝達し、同期手段から通知されたタイミングでログメッセージ管理手段と前記状態管理手段へ出力するメッセージ選択することを特徴とする請求項記載の計算機システム。
  3. 状態情報に関する情報を管理する状態管理テーブルを有することを特徴とする請求項記載の計算機システム。
  4. 前記同期実行プログラムは、同期手段よりプログラムの開始を同期して実行され、前記状態管理テーブルを参照し、プログラムの挙動が変化することを特徴とする請求項記載の計算機システム。
  5. 状態変更を管理する状態変更管理テーブルを有し、前記状態管理手段は、前記メッセージ管理手段より通知されたメッセージに対して、前記状態変更管理テーブルを参照し、状態管理テーブルの変更の有無を決定することを特徴とする請求項記載の計算機システム。
  6. 状態変更を管理する状態変更管理テーブルを有し、前記状態管理手段は、前記メッセージ管理手段より通知されたメッセージに対して状態管理テーブルの変更が必要であるとき、状態変更管理テーブルを元に状態管理テーブルを変更することを特徴とする請求項記載の計算機システム。
  7. 前記メッセージ管理手段は、前記ログメッセージ管理手段から通知されたメッセージを元に通知メッセージデータを作成し、他の計算機へ転送することを特徴とする請求項記載の計算機システム。
  8. 前記メッセージ管理手段は、他の計算機から通知された通知メッセージデータを受信し、メッセージ管理テーブルに受信した通知メッセージデータを格納することを特徴とする請求項記載の計算機システム。
  9. 前記メッセージ管理手段は、前記同期手段から通知を受信したタイミングでメッセージ管理テーブルを参照し、前記メッセージ管理テーブルに通知メッセージデータが存在した際には出力するメッセージを選択することを特徴とする請求項記載の計算機システム。
  10. 前記メッセージ管理手段は、前記ログメッセージ管理手段と状態管理手段へ選択されたメッセージを通知し、前記同期手段へメッセージの出力と計算機の状態変更が終了したことを通知することを特徴とする請求項記載の計算機システム。
  11. プログラムの開始と状態情報一致化のタイミングを同期する同期手段と、前記同期手段より計算機においてプログラムの開始を同期して実行され計算機の状態情報を参照し、計算機の状態情報を元に動作を変更する同期実行プログラムと、計算機の状態情報の変更および状態情報を保持する状態管理手段と、メッセージを管理するメッセージ管理手段と、前記同期実行プログラムおよびハードウエア装置から出力されるメッセージを記録および前記メッセージ管理手段へ通知し、メッセージ管理手段から通知のメッセージを記録するログメッセージ管理手段と、前記ログメッセージ管理手段から通知されたメッセージについて他の計算機へ伝達し、前記同期手段から通知されたタイミングで前記ログメッセージ管理手段と前記状態管理手段へ出力するメッセージ選択し、計算機の状態情報を一致化およびメッセージの出力が完了したことを同期手段へ通知するメッセージ管理手段を備えることを特徴とする計算機システム。
  12. 他の計算機と通信可能に接続され、同期実行を行うための処理部よりプログラムの開始を同期して実行され計算機の状態情報を参照することで動作を変更する同期実行プログラムと、各計算機の状態情報を保持する状態管理処理部と、プログラムまたはハードウエア装置が出力するメッセージを記録するログメッセージ管理処理部,自計算機内部からログメッセージ管理処理部へ出力されたメッセージについて他の計算機へ伝達し、同期実行をおこなうための処理部より通知があったタイミングで出力するメッセージを選択し、状態管理処理部へ選択されたメッセージを通知し、選択されたメッセージが自計算機より出力
    したメッセージではない場合は、ログメッセージ管理処理部へメッセージを通知するメッセージ管理処理部を有することを特徴とする計算機システム。
JP2010144409A 2010-06-25 2010-06-25 計算機システム及び計算機の管理方法 Active JP5560113B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010144409A JP5560113B2 (ja) 2010-06-25 2010-06-25 計算機システム及び計算機の管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010144409A JP5560113B2 (ja) 2010-06-25 2010-06-25 計算機システム及び計算機の管理方法

Publications (2)

Publication Number Publication Date
JP2012008819A JP2012008819A (ja) 2012-01-12
JP5560113B2 true JP5560113B2 (ja) 2014-07-23

Family

ID=45539275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010144409A Active JP5560113B2 (ja) 2010-06-25 2010-06-25 計算機システム及び計算機の管理方法

Country Status (1)

Country Link
JP (1) JP5560113B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6649214B2 (ja) * 2016-09-12 2020-02-19 クラリオン株式会社 ログ送信装置、ログ収集システム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05242044A (ja) * 1992-02-26 1993-09-21 Nec Corp 従属装置再開管理プログラム方式
JPH08314744A (ja) * 1995-05-18 1996-11-29 Hitachi Ltd フォールトトレラントシステム
JP3788832B2 (ja) * 1996-10-04 2006-06-21 株式会社東芝 複合系計算機システム
US6178522B1 (en) * 1998-06-02 2001-01-23 Alliedsignal Inc. Method and apparatus for managing redundant computer-based systems for fault tolerant computing
JP2000010806A (ja) * 1998-06-25 2000-01-14 Hitachi Ltd 分散プログラム実行方法及び複数コンピュータ立ち上げ方法
US6247141B1 (en) * 1998-09-24 2001-06-12 Telefonaktiebolaget Lm Ericsson (Publ) Protocol for providing replicated servers in a client-server system
US6470462B1 (en) * 1999-02-25 2002-10-22 Telefonaktiebolaget Lm Ericsson (Publ) Simultaneous resynchronization by command for state machines in redundant systems
JP3897047B2 (ja) * 2005-01-31 2007-03-22 横河電機株式会社 情報処理装置および情報処理方法
JP4468426B2 (ja) * 2007-09-26 2010-05-26 株式会社東芝 高可用システム及び実行状態制御方法

Also Published As

Publication number Publication date
JP2012008819A (ja) 2012-01-12

Similar Documents

Publication Publication Date Title
US9116972B2 (en) Information synchronisation
CN109951331B (zh) 用于发送信息的方法、装置和计算集群
JP2017534133A (ja) 分散ストレージ及びレプリケーションシステム、並びに方法
CN103207867A (zh) 处理数据块的方法、发起恢复操作的方法和节点
JP2008217306A (ja) レプリケーション方法、レプリケーションシステム、ストレージ装置、プログラム
JP5278540B2 (ja) オペレーションシステムのデータ管理方法及びサーバ
CN114415984B (zh) 数据处理方法及装置
US9396076B2 (en) Centralized version control system having high availability
JP5900094B2 (ja) データ整合システム、データ整合方法およびデータ整合プログラム
JP6511739B2 (ja) 冗長システムおよび冗長化方法
CN113326251B (zh) 数据管理方法、系统、设备和存储介质
CN106855869B (zh) 一种实现数据库高可用的方法、装置和系统
JP5560113B2 (ja) 計算機システム及び計算機の管理方法
US8977897B2 (en) Computer-readable recording medium, data management method, and storage device
JP5716460B2 (ja) クラスタシステムおよびその制御方法
CN110351122A (zh) 容灾方法、装置、系统与电子设备
JP5867902B2 (ja) データベースの非同期レプリケーション方式
EP2980707B1 (en) Method for creating a database clone of a distributed database, system for creating a database clone of a distributed database, program and computer program product
JP5956940B2 (ja) 冗長化システムおよび現用機決定方法
JP5825655B2 (ja) レプリケーションシステム
JP6927725B2 (ja) ストレージ装置、レプリケーションシステム及びレプリケーション方法
JP5843025B2 (ja) 情報処理システム
JP4435142B2 (ja) クラスタシステム及び同期化方法
JP6056801B2 (ja) フォールトトレラントサーバ、同期化方法、及びプログラム
Chaurasiya et al. Linux highly available (HA) fault-tolerant servers

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140304

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140513

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140609

R151 Written notification of patent or utility model registration

Ref document number: 5560113

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151