JP2010170294A - 連携コンピュータシステム及び同システムの連携方法 - Google Patents

連携コンピュータシステム及び同システムの連携方法 Download PDF

Info

Publication number
JP2010170294A
JP2010170294A JP2009011598A JP2009011598A JP2010170294A JP 2010170294 A JP2010170294 A JP 2010170294A JP 2009011598 A JP2009011598 A JP 2009011598A JP 2009011598 A JP2009011598 A JP 2009011598A JP 2010170294 A JP2010170294 A JP 2010170294A
Authority
JP
Japan
Prior art keywords
application
information
state
function
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009011598A
Other languages
English (en)
Other versions
JP4829985B2 (ja
Inventor
Tomohiko Eto
知彦 衛藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information Systems Ltd
Original Assignee
Hitachi Information Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information Systems Ltd filed Critical Hitachi Information Systems Ltd
Priority to JP2009011598A priority Critical patent/JP4829985B2/ja
Publication of JP2010170294A publication Critical patent/JP2010170294A/ja
Application granted granted Critical
Publication of JP4829985B2 publication Critical patent/JP4829985B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】連携先の障害が発生した相手アプリケーションの状態を容易に検知すること。
【解決手段】コンピュータ10が発信した状態情報を受信し、この状態情報に含まれる発信側アプリケーションと連携する他のアプリケーションとの対応情報を格納するアプリケーション連携テーブル部111を有する状態管理コンピュータ100を備え、コンピュータ10の連携モジュール部14が、データをコンピュータ40に発信し且つ状態情報をコンピュータ100にデータを発信し、更にコンピュータ40が状態情報をコンピュータ100に発信したとき、状態管理コンピュータ100が、受信した状態情報に含まれる発信側アプリケーション識別子を抽出し、該識別子に対応した連携先アプリケーションの識別子を確認し、発信側コンピュータ10に受信側コンピュータ40がデータを受信したことを報告するもの。
【選択図】図1

Description

本発明は、複数のコンピュータのアプリケーションが連携する連携コンピュータシステム及び同システムの連携方法に係り、特に連携する相手側コンピュータのアプリケーション障害を容易に知ることができる連携コンピュータシステム及び同システムの連携方法に関する。
近年のコンピュータシステムは、複数のコンピュータに搭載したアプリケーションプログラムを連携させ、各コンピュータのアプリケーションプログラムが取り扱うデータをネットワークを介して送受信することによって、全体として1つの機能を達成するSOA(Service
Oriented Architecture:サービス指向アーキテクチャ)技術が採用されている。このSOAは、複数のコンピュータのアプリケーションなどをコンポーネント化(部品化)し、それらを組み合わせてシステムを作る設計手法であって、例えば、受注管理システムと在庫管理システムと販売納品管理システムと経理管理システムとをネットワークを介して接続し、全体として1つの受注から請求までの業務管理システムを構築するものである。
この複数のアプリケーションを連携させたコンピュータシステム(以下、連携コンピュータシステムと呼ぶ)は、連携するアプリケーション数が多くなるに従って、あるアプリケーションに障害が発生した場合、その障害が発生したアプリケーションを特定することや、当該障害発生アプリケーションが他のどのアプリケーションに影響するかの判定や、障害発生アプリケーションに障害が発生したことを通知する通知先を判定することが困難であると言う不具合があった。
尚、前記連携コンピュータシステムにおける障害情報の収集管理に関する技術が記載された文献としては、例えば下記特許文献1が挙げられ、この特許文献1には、複数のWebサービスを組み合わせてオンラインオーダシステムを構築する連携コンピュータシステムにおいて、Webサービス間のインタフェースを統一し、この統一したインタフェースを用いて発注元のWebサービスに発注を受けたWebサービスが進捗状況を報告することが記載されている。
特開2004−310742号公報
前述の従来技術による連携コンピュータシステムにおける障害情報の収集管理は、例えば連携先の相手アプリケーション(Webサービス)がダウンしたり、ビジー状態で応答に遅延が生じている等の相手側の状態を把握することができず、更には前述した障害発生アプリケーションの特定、他のどのアプリケーションに影響するかの判定、障害発生の通知先を判定することが困難であると言う不具合があった。
本発明の目的は、連携先の障害が発生した相手アプリケーションの状態を容易に検知することができる連携コンピュータシステム及び同システムの連携方法を提供することである。
前記目的を達成するため本発明は、データを複数のアプリケーションにより連携して取り扱う複数のコンピュータと、前記複数コンピュータのアプリケーションの管理を行う状態管理コンピュータと、前記複数のコンピュータ及び状態管理コンピュータとを接続する通信ネットワークとを備え、前記コンピュータが、識別子が付与されたアプリケーションと、前記データを連携するアプリケーションに送受信すると共に発信側及び受信側アプリケーションの識別子及びアプリケーションによるデータの処理経過情報を含む状態情報を送受信する連携モジュール部を有し、前記状態管理コンピュータが、連携モジュール部から受信した状態情報に含まれる発信側アプリケーション識別子と連携する他のアプリケーション識別子との対応情報を格納するアプリケーション連携テーブル部と、該アプリケーション連携テーブル部を制御する制御部とを有する連携コンピュータシステムであって、
前記発信側アプリケーションの連携モジュール部が、前記発信側及び受信側アプリケーションの識別子を含む状態情報を前記状態管理コンピュータに送信する第1機能を有し、
前記発信側アプリケーションからのデータを受信した受信側アプリケーションの連携モジュール部が、該受信側アプリケーション識別子及び処理経過情報を含む状態情報を前記状態管理コンピュータに送信する第2機能を有し、
前記状態管理コンピュータの制御部が、
前記第1機能による状態情報と前記第2機能による状態情報を受信し、該第2機能による状態情報が第1機能による状態情報に対応することを判定したとき、前記第1機能により受信した受信側アプリケーション識別子と前記第2機能により受信した状態情報の処理経過情報とを格納した状態情報を生成し、該生成した状態情報を発信側アプリケーションの連携モジュール部に送信する第3機能と、
前記第1機能による状態情報を受信し且つ受信側アプリケーションの異常状態を判定したとき、発信側アプリケーション識別子を格納し且つ処理経過情報を異常状態とした状態情報を生成し、該生成した状態情報を発信側アプリケーションの連携モジュールに送信する第4機能とを実現することを第1の特徴とする。
また本発明は、該第1の特徴の連携コンピュータシステムにおいて、前記コンピュータの連携モジュール部が、自己コンピュータのアプリケーション稼動中又は停止中を示す稼動状態情報と自己コンピュータの負荷情報とを前記状態情報に含ませる第5機能を有し、
前記状態管理コンピュータの制御部が、前記状態情報に含まれる稼動状態情報又は負荷情報又は処理経過情報を基に受信側アプリケーションの異常状態を判定する第6機能を有し、
該第6機能により受信側アプリケーションの異常状態を判定したとき、前記受信側アプリケーションに連携する他の連携アプリケーション識別子をアプリケーション連携テーブル部を検索し、該検索した連携アプリケーション識別子の連携モジュールに、前記第1機能により受信した状態情報の処理経過情報を異常状態とした状態情報を生成し、該生成した状態情報を送信する第7機能と、
前記第6機能により受信側アプリケーションが異常状態でないと判定したとき、前記受信側アプリケーションに連携する他の連携アプリケーション識別子をアプリケーション連携テーブル部から検索し、該検索した連携アプリケーション識別子の連携モジュールに、処理経過情報を正常状態とした状態情報を生成し、該生成した状態情報を送信する第8機能とを有することを第2の特徴とする。
更に本発明は、データを複数のアプリケーションにより連携して取り扱う複数のコンピュータと、前記複数コンピュータのアプリケーションの管理を行う状態管理コンピュータと、前記複数のコンピュータ及び状態管理コンピュータとを接続する通信ネットワークとを備え、前記コンピュータが、識別子が付与されたアプリケーションと、前記データを連携するアプリケーションに送受信すると共に発信側及び受信側アプリケーションの識別子及びアプリケーションによるデータの処理経過情報を含む状態情報を送受信する連携モジュール部を有し、前記状態管理コンピュータが、連携モジュール部から受信した状態情報に含まれる発信側アプリケーション識別子と連携する他のアプリケーション識別子との対応情報を格納するアプリケーション連携テーブル部と、該アプリケーション連携テーブル部を制御する制御部とを有する連携コンピュータシステムの連携方法であって、
前記発信側アプリケーションの連携モジュール部に、前記発信側及び受信側アプリケーションの識別子を含む状態情報を前記状態管理コンピュータに送信する第1機能を設け、
前記発信側アプリケーションからのデータを受信した受信側アプリケーションの連携モジュール部に、該受信側アプリケーション識別子及びデータの処理経過情報を含む状態情報を前記状態管理コンピュータに送信する第2機能を設け、
前記状態管理コンピュータの制御部に、
前記第1機能による状態情報と前記第2機能による状態情報を受信し、該第2機能による状態情報が第1機能による状態情報に対応することを判定したとき、前記第1機能により受信した受信側アプリケーション識別子と前記第2機能により受信した状態情報の処理経過情報とを格納した状態情報を生成し、該生成した状態情報を発信側アプリケーションの連携モジュール部に送信する第3機能と、
前記第1機能による状態情報を受信し且つ受信側アプリケーションの異常状態を判定したとき、発信側アプリケーション識別子を格納し且つ処理経過情報を異常状態とした状態情報を生成し、該生成した状態情報を発信側アプリケーションの連携モジュールに送信する第4機能とを実行させることを第3の特徴とする。
また本発明は、該第3の特徴の連携コンピュータシステムの連携方法において、前記コンピュータの連携モジュール部に、自己コンピュータのアプリケーション稼動中又は停止中を示す稼動状態情報と自己コンピュータの負荷情報とを前記状態情報に含ませる第5機能を設け、
前記状態管理コンピュータの制御部に、前記状態情報に含まれる稼動状態情報又は負荷情報又は処理内容を基に受信側アプリケーションの異常状態を判定する第6機能を設け、
該第6機能により受信側アプリケーションの異常状態を判定したとき、前記受信側アプリケーションに連携する他の連携アプリケーション識別子をアプリケーション連携テーブル部を検索し、該検索した連携アプリケーション識別子の連携モジュールに、前記第1機能により受信した状態情報の処理経過情報を異常状態とした状態情報を生成し、該生成した状態情報を送信する第7機能と、
前記第6機能により受信側アプリケーションが異常状態でないと判定したとき、前記受信側アプリケーションに連携する他の連携アプリケーション識別子をアプリケーション連携テーブル部から検索し、該検索した連携アプリケーション識別子の連携モジュールに、処理経過情報を正常状態とした状態情報を生成し、該生成した状態情報を送信する第8機能とを実行させることを第4の特徴とする。
本発明による連携コンピュータシステム及び連携方法は、状態管理コンピュータが、発信側アプリケーションからの状態情報に対応した受信側アプリケーションからの状態情報を受信したとき、受信側アプリケーションの処理経過情報を格納した状態情報を生成し、この生成した状態情報を、発信側アプリケーションの連携モジュールに送信することによって、発信側アプリケーションが連携する受信側アプリケーションの状態を容易に検知することができる。また前記アプリケーションの連携モジュールからの状態情報を基に受信側の異常状態を判定したとき、連携する他のアプリケーションに、受信側が異常状態である旨の処理経過情報を含む状態情報を送信する機能を設けたことによって、他の連携するアプリケーションが受信側の異常状態を検知することができ、更に異常状態が解消した状態情報を受信したとき、処理経過情報を正常状態とした状態情報を生成して他の連携アプリケーションに送信することによって、復旧したアプリケーションの状態を検知することができる。
本発明の一実施形態による連携方法を実行する連携コンピュータシステムを示す図。 本実施形態によるアプリケーション連携テーブル部を示す図。 本実施形態による連携モジュール部が送受信する状態情報Rを示す図。 本実施形態による障害情報を報告する報告先の管理者情報を格納する障害報告先テーブル部を示す図。 アプリケーション毎に設定した障害レベルに応じた報告可否を判定するための判定テーブル部を示す図。 本実施形態による障害処理方法の動作フロー図。 本実施形態による障害処理方法の動作フロー図。
以下、本発明による連携コンピュータシステム及び同システムの連携方法の一実施形態を図面を参照して詳細に説明する。
[構成]
本実施形態による連携方法を実行する連携コンピュータシステムは、図1に示す如く、符号12により示す第1の業務用プログラムであるアプリケーションAを実行する第1のコンピュータ10と、符号22により示す第2の業務用プログラムであるアプリケーションBを実行する第2のコンピュータ20と、符号32により示す第3の業務用プログラムであるアプリケーションCを実行する第3のコンピュータ30と、符号42により示す第4の業務用プログラムであるアプリケーションDを実行する第4のコンピュータ40と、第5の業務用プログラムであるアプリケーションEを実行する第5のコンピュータ50と、第6の業務用プログラムであるアプリケーションFを実行する第6のコンピュータ60と、本実施形態の特徴である各コンピュータの状態情報Rを管理する状態管理コンピュータ100と、前記各コンピュータ10〜60並びに状態管理コンピュータ100とを接続する通信ネットワーク90とから構成される。
前記コンピュータ10は、前記アプリケーションAにより取り扱われるデータを記憶する記憶部13と、データ送受信並びに後述する状態情報R1及びR2の送受信等を行う連携モジュール部14と、前記アプリケーションAや記憶部13他を制御する制御部11とから構成され、他のコンピュータ20〜60も同様に構成されている。尚、本明細書で述べるコンピュータは、通常のコンピュータと同様に、CPU、メモリ、ハードディスク、表示部、キーボードやマウス等のポインティングデバイス、外部インタフェースその他ハードウェアや、オペレーティングシステムやツールソフトウェア等のプログラムも含むものであるが、詳細は省略して説明する。
前記連携モジュール部14等は、自己アプリケーションが取り扱うデータの送受信機能と、自己コンピュータにおける実行中のアプリケーションの動作状態(稼働中、停止中、データ入力待ち中等)、CPUの負荷率、一連の処理であるトランザクションの集中率、メモリの負荷率、あるアクセスに対して応答を返すまでの応答時間等の当該コンピュータ構成部位の負荷情報を収集する負荷情報収集機能と、後述する状態情報R1を状態管理コンピュータ100に予め定められたタイミングにて発信する発信機能と、該状態管理コンピュータ100が発信した連携する相手コンピュータの状態情報R2を受信する機能と、該受信した状態情報R2に格納された処理内容(処理経過情報)に応じた処理を行う対応処理実行機能(例えば相手アプリケーションがビジー状態のときにデータ発信を所定時間待機させる等の機能)とを備え、これら機能はハードウェア及び又はソフトウェアによって達成され、制御部や各アプリケーションの動作とは独立して機能するものとする。例えば、自己コンピュータのアプリケーションや制御部が停止した場合であっても、その停止状態の情報を収集し、送受信するように独立して動作するものとするが、電源ダウン等の場合も考えられるため、必ずしも独立して動作しなくても良い。
また前記状態情報R1は、図3に示す如く、データ発信側のコンピュータのアプリケーションの識別子であるIDを示す発信側ApIDと、データ受信側コンピュータのアプリケーションの識別子であるIDを示す受信側ApIDと、当該アプリケーションの動作状態(正常稼働中、停止中)を表す稼動状態情報と、自己コンピュータにおけるデータの処理経過情報である処理内容(例えば、データ発信、データ受信、データをアプリケーションに転送完、アプリケーションがデータ処理中、アプリケーションがデータ処理完了)を示す処理内容と、前述したCPUやメモリその他の負荷情報他を示す負荷情報等と、送受信されたデータの識別子であるデータIDと、該データの送受信時刻/前記アプリケーションへの転送時刻/CPU負荷率の検出時刻等の時刻情報の各項目欄とから構成される。
図3に示す状態情報R1の例では、発信側のApIDが「a」、受信側のApIDが「b」、稼動状態情報が「正常稼働中」、負荷情報が「CPU負荷率20%・・・」、処理内容が「データ発信」、データIDが「SD120081115315a」、時刻情報が「13:15:00」として格納され、IDaのアプリケーションAが、時刻「13:15:00」において、ID「SD120081115315a」のデータの発信を完了したことを表している。尚、本明細書においては、各コンピュータが発信する状態情報を「R1」、状態管理コンピュータ100が送信する状態情報を「R2」と呼ぶ。
前記稼動状態情報は、連携モジュールが、自己のアプリケーションの状態を監視し、アプリケーションが正常に稼働中の際には「正常稼働中」、アプリケーションが停止中の際には「停止中」、後述するアプリケーションが停止した後に再起動した際には「正常稼働中」の各情報が格納される。また状態情報を収集して発信する収集・発信機能は、連携モジュールが、自己の管轄するコンピュータにおいて、(1)データの送受信を実行したとき、(2)アプリケーションが停止したとき、(3)アプリケーション停止後に再起動して正常に稼動したとき、(4)所定の時間間隔(例えば1分間隔)毎、(5)予め定められた時刻毎(時刻分指定)他の何れかに設定した任意のタイミングに、自己アプリケーション他の状態を収集し、状態情報R1として状態管理コンピュータ100に発信するものである。
前記状態管理コンピュータ100は、図1に示す如く、複数のコンピュータ間の複数アプリケーションの連携関係を表すアプリケーション連携テーブル部111と、受信した状態情報R1を基に各コンピュータやアプリケーション毎にCPU負荷率等が予め定めた閾値を超えているか否かを判定するための判定情報を格納する高負荷等判定テーブル部112と、前記複数のコンピュータ間で送受信した状態情報R1及びR2を記憶する記憶部113と、前記高負荷等判定テーブル部112を用いた判定により閾値を超えていると判定した場合、そのコンピュータ及びアプリケーションの管理者の識別子である管理者IDを格納する障害報告先テーブル部123とを備える。
前記アプリケーション連携テーブル部111は、図2に示す如く、設定番号毎に、基になるアプリケーション(Ap)のIDと、該アプリケーションと連携する他のアプリケーションIDとの対応を示すAp対応情報とが登録され、図示の例では、連携関係として、設定番号1に「アプリケーションID=a」のアプリケーションAが、「アプリケーションID=c」のアプリケーションCと「アプリケーションID=d」のアプリケーションDに連携することが格納され、設定番号2に「アプリケーションID=b」のアプリケーションBが、「アプリケーションID=e」のアプリケーションEと「アプリケーションID=f」のアプリケーションFに連携することが格納されている。これら情報は、例えば受注管理アプリケーションが受注データを在庫管理アプリケーション及び販売納品管理アプリケーションに発注データを発信することが登録され、業務形態別のアプリケーション相互の関係により予め定められていることとする。
前記高負荷等判定テーブル部112は、CPU負荷率その他の項目毎に検出した負荷率等が予め定められた閾値を超えているか否かを判定するための判定テーブルであって、図5に示す如く、アプリケーションID毎に、基準となる閾値として、CPU負荷率とトランザクション集中率とメモリ使用率と応答時間の閾値との各項目が設定され、例えば、アプリケーションID=aのアプリケーションAが、CPU負荷率が65%以上又はトランザクション集中率が55%以上又はメモリ使用率が75%以上又は応答時間が20s(秒)以上のときに、所定の閾値を超えて管理者や連携する他アプリケーションに状態を報告するための各閾値情報を格納している。
前記障害報告先テーブル部123は、図4に示す如く、例えばID=aのアプリケーションAの障害報告先の管理者IDが「K001」の管理者であり、ID=bのアプリケーションBの障害報告先の管理者IDが「K002」と「K999」の管理者であることを表している。
[動作]
さて、このように構成された連携コンピュータシステムは、図1に示した各コンピュータの連携モジュール部14/24/34/44他が、自己のコンピュータにおける前述したアプリケーション動作状態他の情報を含む状態情報を通信ネットワーク90を介して状態管理コンピュータ100に発信し、これを受けた状態管理コンピュータ100が受信した状態情報をアプリケーションに連携する他のコンピュータ又は発信側の連携モジュール部に転送するものであって、この動作を図6A及び図6Bを参照して説明する。
[状態A]
まず、送受信両者のコンピュータのアプリケーションが正常に動作している際の動作を説明する。この状態における連携コンピュータシステムは、図6Aの状態Aに示す如く、正常稼働中のコンピュータ10のアプリケーションA(符号12)がデータをコンピュータ40に発信した場合(工程S30)、当該コンピュータ10の連携モジュール部14が図3に示した状態信号R1aを発信報告(工程S31)として状態管理コンピュータ100に発信する。
前記アプリケーションAからのデータを受信(工程S32)したコンピュータ40の連携モジュール部44は、当該データ受信したことを処理内容に格納した状態情報R1dを状態管理コンピュータ100に送信して受信報告(工程S33)を行う。
前記コンピュータ10及び40からの状態情報R1a及びR1dを受信した状態管理コンピュータ100は、アプリケーション連携テーブル部111を参照して前記状態情報R1aの発信側ApIDを基にして連携するコンピュータのアプリケーション識別子を検索(工程S35)し、発信側コンピュータ10のアプリケーションAとコンピュータ40のアプリケーションDとが連携し、且つアプリケーションAからデータをアプリケーションDに発信した事と、該アプリケーションDがアプリケーションAからのデータを受信した事、即ち、発信側アプリケーションによる状態情報R1aと受信側アプリケーションの状態情報R1dとが対応し、連携するアプリケーション間でデータ送受信が正常に完了したことを判定する。このとき本実施形態による状態管理コンピュータ100は、状態情報R1aに含まれる受信側アプリケーション識別子と状態情報R1dに含まれる処理内容(処理経過情報)とを含む状態情報R2を生成し、この状態情報R2をアプリケーションAの連携モジュール14に送信(工程S36)する様に動作する。
この状態情報R2を受信(工程S39)した発信側コンピュータ10の連携モジュール14は、受信側の連携モジュール44からの発信側ApID「d」と「処理内容」がデータ受信との情報を含む状態情報R2を受信することによって、自己が発信したデータが受信側コンピュータ40に正常に受信されたことを判定することができる。
更に本実施形態による受信側コンピュータ40の連携モジュール44は、例えばコンピュータ40の制御部が自己アプリケーションDに受信データを転送したとき、転送されたデータをアプリケーションDが処理中であるとき、データ処理を完了したとき、これら状態を処理内容に含めた状態情報R1dを状態管理コンピュータ100に報告(工程S37、工程S38)し、これを受信した状態管理コンピュータ100が、処理内容を「データ転送」/「データ処理中」/「データ処理完了」に書き換えた状態情報R2をデータ発信側のコンピュータ100に送信することによって、発信側のアプリケーション12が受信側アプリケーション42におけるデータ処理過程を判定することができる。尚、前述の例では、工程S35によりアプリケーションAとDとが連携していることを判定したが、送信側アプリケーションからの連携情報R1aに送信側及び受信側アプリケーション識別子が含まれるため、正常動作時においては、当該工程S35は必ずしも必要なものではない。また前述の工程S37及び38による処理は、後述する他の状態B〜Eに示す例においても同様である。
[状態B]
次にコンピュータ10のアプリケーション12がアプリケーション42にデータ発信を試みたとき、該アプリケーション42が停止している際の動作を説明する。この状態における連携コンピュータシステムは、図6Aの状態Bに示す如く、コンピュータ10のアプリケーションA(符号12)がデータを停止中のコンピュータ40に発信した場合(工程S40)、コンピュータ10の連携モジュール部14がアプリケーションA(符号12)が図3に示した状態信号R1aを発信報告(工程S41)として状態管理コンピュータ100に発信するものの、コンピュータ40が停止中のために該コンピュータ40は受信報告(工程S43)を行うことができない状態となる。
このとき、状態管理コンピュータ100の制御部110は、アプリケーション連携テーブル部111を参照して、前記発信側のアプリケーションA(符号12)に対してアプリケーションC及びD(符号32及び42)が連携し、且つアプリケーションAからデータをアプリケーションDに発信した事と、予め設定した閾値時間内にアプリケーションDがアプリケーションAからのデータを受信していない事による異常状態を判定(工程S51)し、コンピュータ10の連携モジュール14から受信した状態情報R1aに含まれる受信側アプリケーション識別子と前記判定した異常状態を「処理内容」に処理経過情報として格納した状態情報R2を生成してアプリケーションAに送信(工程S46)する様に動作する。
この状態情報R2を受信(工程S49)した発信側コンピュータ10の連携モジュール14は、自己の発信側ApID「a」と相手側の発信側ApID「d」を格納した状態情報R2を受信し且つ前記「処理内容」が「異常状態」であることを判定することによって、自己がアプリケーションDに発信したデータが正常に受信されなかったこと(発信データがロスト又は相手コンピュータ/アプリケーションが停止したこと)を判定することができる。
他方、前記予め設定した閾値時間内にアプリケーションDがアプリケーションAからのデータを受信していない事を判定した状態管理コンピュータ100は、障害報告先テーブル部123を参照して当該障害を報告する管理者へ電子メール他の手段により報告(工程S50)するように動作する。
尚、本例において工程S51により閾値時間だけ発信側コンピュータ及び管理者への通知を保留する理由は、通信回路網がビジー状態によりデータ転送時間が遅れる可能性があり、ビジー状態をコンピュータの停止と誤判断することを防止するためである。また、本実施形態における工程の状態情報は、図1に示した記憶部113に記憶されることによって、コンピュータ800を操作する管理者が記憶部113に記憶された状態情報を参照し、障害が発生したコンピュータ及びアプリケーションを知ることができる。尚、この状態Bは、受信側アプリケーションが正常に動作しているにも係わらず、何等かの原因によりデータ転送中にデータが消失したデータロストにおいても同様である。
[状態C]
次にコンピュータ40のアプリケーションD(符号42)がコンピュータ10のアプリケーションA(符号12)に対してデータ送信を行う準備をしている状態で、データ受信側のコンピュータ10が高負荷の際の動作を説明する。この状態における連携コンピュータシステムは、図6Bの状態Cに示す如く、コンピュータ10の連携モジュール部14が、前述した所定時間間隔のタイミングにおいて自己コンピュータの負荷情報(本例の場合、高負荷)を含む状態情報R1a(受信側のApIDは空白)を状態管理コンピュータ100に発信(工程S60)する。
この状態情報R1aを受信した状態管理コンピュータ100は、該状態情報R1に含まれる負荷情報を基に高負荷等判定テーブル112を参照してコンピュータ10の閾値を超える高負荷か否かの判定(工程S61)を行い、次いで状態情報R1aに含まれる発信側ApIDを基にアプリケーション連携テーブル部111を参照し、コンピュータ10のアプリケーションAに連携する他の全てのアプリケーションIDを検索(工程S62)する。
本例の場合、コンピュータ10のCPUが高負荷等判定テーブル112に設定した閾値に比べて高負荷のため、状態管理コンピュータ100は、前記コンピュータ10から受信した状態情報R1aを参照し、「受信側ApID」に「a」、「処理内容」に高負荷状態による「異常状態」を格納した状況情報R2を生成し、前述の工程S62により検索した連携する他のアプリケーション宛に状態情報R2を送信(工程S63)する。
コンピュータ30及び40の連携モジュール部は、受信した状態情報R2の「受信側発信ApID」が「a」且つ「処理内容」が「異常状態」であることを判定することによって、受信側ApID「a」のアプリケーションAが異常状態であることを判定し、コンピュータ10のアプリケーションAに対するデータ送受信の処理を保留(工程S64、S66)し、これら工程を各コンピュータ30及び40が予め定められた所定時間だけ待機(工程S65、S67)するように動作する。前記待機時間は、予め状態管理コンピュータ100からの指示によって設定されていても良い。
他方、本実施形態による状態管理コンピュータ100は、前述の連携するアプリケーションに対する発信側アプリケーションの異常報告と共に、障害報告先テーブル部123を参照して報告を行うべき管理者を検索し、該検索した管理者に対して電子メール等の手段によって障害報告(工程S68)を行うように動作する。
尚、前述の例では、コンピュータが高負荷の場合について説明したが、本実施形態による状態管理コンピュータ100は、前述の例に限定されるものではなく、アプリケーションAが停止、又はアプリケーションAが再起動した際の動作も同様であり、前記「処理内容」にアプリケーションAが停止の旨を含む異常状態、又はアプリケーションAが再起動した旨を含む正常状態を書き込んだ状態情報R2を生成し、連携する他のアプリケーションに送信する様に動作する。
これら一連の動作によって本実施形態による連携コンピュータシステムは、受信側のコンピュータ又はアプリケーションが高負荷/停止中/再起動時の場合、当該受信側コンピュータ等の状態を、他の連携する発信側コンピュータのアプリケーションに報告することによって、連携先コンピュータ及びアプリケーションの処理を一時保留すると共に前記受信側コンピュータ等の状態を管理者に報告することができる。
[状態D]
前述の状態Cにおいて送信側のコンピュータ30のアプリケーションC(符号32)がコンピュータ10のアプリケーションA(符号12)に対するデータ発信の処理が発生した場合(工程S10)、本実施形態によるコンピュータ30の連携モジュール34は、前述した工程S65により待機中のため、データ発信の保留を維持(工程S11)する様に動作する。
この動作によって本実施形態による連携コンピュータシステムは、コンピュータ30がコンピュータ10に対するデータ発信の保留を維持するため、例えばデータ発信を行った際のタイムアウトエラーの発生を防止することができる。
[状態E]
次に前述の状態Dにおいて、受信側のコンピュータ10の負荷率が低減した際の動作を説明する。この場合、コンピュータ10の連携モジュール14は、負荷率が低減して正常状態となった負荷情報を含む状態情報R1aを状態管理コンピュータ100に発信し、この状態情報R1aを受信した状態管理コンピュータ100は、アプリケーション連携テーブル部111を参照して受信側のコンピュータ10に連携する他のコンピュータ及びアプリケーションを検索(工程S25)し、次いで負荷率が閾値以下に低減したことを高負荷判定テーブル112を参照して判定し、この判定結果を基に図3に示した処理経過情報である「処理内容」に正常状態を格納した状況情報R2を生成し、この生成した状態情報R2を連携する他のコンピュータ30及び40に送信し、各コンピュータが該状態情報R2を基に待機状態を解除(工程S27)する様に動作する。
これら一連の動作によって本実施形態による連携コンピュータシステムは、受信側の高負荷だったアプリケーションの負荷率が低減して正常状態に復旧したことを連携する発信側のコンピュータの連携モジュールに報告することによって、例えば前記状態Dにおける工程S11によるデータ発信待機を解除し、受信側のコンピュータ10にデータ発信を行い、業務処理を続行することができる。
尚、前述の実施形態において、受信側のコンピュータ10が高負荷の場合について説明したが、本発明はこれら限られるものではなく、例えばコンピュータ10のアプリケーションが停止並びに停止から復旧した際にも同様に、受信側アプリケーション停止や復旧を送信側のアプリケーションに報告することもできる。また本実施形態による連携コンピュータシステムは、前述の異常状態を判定したとき、これを例えばアプリケーション名の表示色を他の正常アプリケーションと違えて表示部に表示(又はフラグを付けて表示)することによりシステム管理者に警告するように構成しても良い。
尚、前記実施形態においては1つのコンピュータに1つのアプリケーションを搭載する例を説明したが、本発明はこれに限られるものではなく、1つのコンピュータに複数のアプリケーションを搭載しても良い。
10,20,30,40,50,60:コンピュータ、11,21,31,41:制御部、12,22,32,33,43:アプリケーション、13,23,33,43:記憶部、90:通信ネットワーク、100:状態管理コンピュータ、110:制御部、111:アプリケーション連携テーブル部、112:高負荷等判定テーブル部、113:記憶部、123:障害報告先テーブル部。

Claims (4)

  1. データを複数のアプリケーションにより連携して取り扱う複数のコンピュータと、前記複数コンピュータのアプリケーションの管理を行う状態管理コンピュータと、前記複数のコンピュータ及び状態管理コンピュータとを接続する通信ネットワークとを備え、前記コンピュータが、識別子が付与されたアプリケーションと、前記データを連携するアプリケーションに送受信すると共に発信側及び受信側アプリケーションの識別子及びアプリケーションによるデータの処理経過情報を含む状態情報を送受信する連携モジュール部を有し、前記状態管理コンピュータが、連携モジュール部から受信した状態情報に含まれる発信側アプリケーション識別子と連携する他のアプリケーション識別子との対応情報を格納するアプリケーション連携テーブル部と、該アプリケーション連携テーブル部を制御する制御部とを有する連携コンピュータシステムであって、
    前記発信側アプリケーションの連携モジュール部が、前記発信側及び受信側アプリケーションの識別子を含む状態情報を前記状態管理コンピュータに送信する第1機能を有し、
    前記発信側アプリケーションからのデータを受信した受信側アプリケーションの連携モジュール部が、該受信側アプリケーション識別子及び処理経過情報を含む状態情報を前記状態管理コンピュータに送信する第2機能を有し、
    前記状態管理コンピュータの制御部が、
    前記第1機能による状態情報と前記第2機能による状態情報を受信し、該第2機能による状態情報が第1機能による状態情報に対応することを判定したとき、前記第1機能により受信した受信側アプリケーション識別子と前記第2機能により受信した状態情報の処理経過情報とを格納した状態情報を生成し、該生成した状態情報を、発信側アプリケーションの連携モジュール部に送信する第3機能と、
    前記第1機能による状態情報を受信し且つ受信側アプリケーションの異常状態を判定したとき、発信側アプリケーション識別子を格納し且つ処理経過情報を異常状態とした状態情報を生成し、該生成した状態情報を発信側アプリケーションの連携モジュールに送信する第4機能とを実現する連携コンピュータシステム。
  2. 請求項1記載の連携コンピュータシステムにおいて、
    前記コンピュータの連携モジュール部が、自己コンピュータのアプリケーション稼動中又は停止中を示す稼動状態情報と自己コンピュータの負荷情報とを前記状態情報に含ませる第5機能を有し、
    前記状態管理コンピュータの制御部が、前記状態情報に含まれる稼動状態情報又は負荷情報又は処理経過情報を基に受信側アプリケーションの異常状態を判定する第6機能を有し、
    該第6機能により受信側アプリケーションの異常状態を判定したとき、前記受信側アプリケーションに連携する他の連携アプリケーション識別子をアプリケーション連携テーブル部から検索し、該検索した連携アプリケーション識別子の連携モジュールに、前記第1機能により受信した状態情報の処理経過情報を異常状態とした状態情報を生成し、該生成した状態情報を送信する第7機能と、
    前記第6機能により受信側アプリケーションが異常状態でないと判定したとき、前記受信側アプリケーションに連携する他の連携アプリケーション識別子をアプリケーション連携テーブル部から検索し、該検索した連携アプリケーション識別子の連携モジュールに、処理経過情報を正常状態とした状態情報を生成し、該生成した状態情報を送信する第8機能とを有する連携コンピュータシステム。
  3. データを複数のアプリケーションにより連携して取り扱う複数のコンピュータと、前記複数コンピュータのアプリケーションの管理を行う状態管理コンピュータと、前記複数のコンピュータ及び状態管理コンピュータとを接続する通信ネットワークとを備え、前記コンピュータが、識別子が付与されたアプリケーションと、前記データを連携するアプリケーションに送受信すると共に発信側及び受信側アプリケーションの識別子及びアプリケーションによるデータの処理経過情報を含む状態情報を送受信する連携モジュール部を有し、前記状態管理コンピュータが、連携モジュール部から受信した状態情報に含まれる発信側アプリケーション識別子と連携する他のアプリケーション識別子との対応情報を格納するアプリケーション連携テーブル部と、該アプリケーション連携テーブル部を制御する制御部とを有する連携コンピュータシステムの連携方法であって、
    前記発信側アプリケーションの連携モジュール部に、前記発信側及び受信側アプリケーションの識別子を含む状態情報を前記状態管理コンピュータに送信する第1機能を設け、
    前記発信側アプリケーションからのデータを受信した受信側アプリケーションの連携モジュール部に、該受信側アプリケーション識別子及びデータの処理経過情報を含む状態情報を前記状態管理コンピュータに送信する第2機能を設け、
    前記状態管理コンピュータの制御部に、
    前記第1機能による状態情報と前記第2機能による状態情報を受信し、該第2機能による状態情報が第1機能による状態情報に対応することを判定したとき、前記第1機能により受信した受信側アプリケーション識別子と前記第2機能により受信した状態情報の処理経過情報とを格納した状態情報を生成し、該生成した状態情報を、発信側アプリケーションの連携モジュール部に送信する第3機能と、
    前記第1機能による状態情報を受信し且つ受信側アプリケーションの異常状態を判定したとき、発信側アプリケーション識別子を格納し且つ処理経過情報を異常状態とした状態情報を生成し、該生成した状態情報を発信側アプリケーションの連携モジュールに送信する第4機能とを実行させる連携コンピュータシステムの連携方法。
  4. 請求項3記載の連携コンピュータシステムの連携方法において、
    前記コンピュータの連携モジュール部に、自己コンピュータのアプリケーション稼動中又は停止中を示す稼動状態情報と自己コンピュータの負荷情報とを前記状態情報に含ませる第5機能を設け、
    前記状態管理コンピュータの制御部に、前記状態情報に含まれる稼動状態情報又は負荷情報又は処理内容を基に受信側アプリケーションの異常状態を判定する第6機能を設け、
    該第6機能により受信側アプリケーションの異常状態を判定したとき、前記受信側アプリケーションに連携する他の連携アプリケーション識別子をアプリケーション連携テーブル部から検索し、該検索した連携アプリケーション識別子の連携モジュールに、前記第1機能により受信した状態情報の処理経過情報を異常状態とした状態情報を生成し、該生成した状態情報を送信する第7機能と、
    前記第6機能により受信側アプリケーションが異常状態でないと判定したとき、前記受信側アプリケーションに連携する他の連携アプリケーション識別子をアプリケーション連携テーブル部から検索し、該検索した連携アプリケーション識別子の連携モジュールに、処理経過情報を正常状態とした状態情報を生成し、該生成した状態情報を送信する第8機能とを実行させる連携コンピュータシステムの連携方法。
JP2009011598A 2009-01-22 2009-01-22 連携コンピュータシステム及び同システムの連携方法 Expired - Fee Related JP4829985B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009011598A JP4829985B2 (ja) 2009-01-22 2009-01-22 連携コンピュータシステム及び同システムの連携方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009011598A JP4829985B2 (ja) 2009-01-22 2009-01-22 連携コンピュータシステム及び同システムの連携方法

Publications (2)

Publication Number Publication Date
JP2010170294A true JP2010170294A (ja) 2010-08-05
JP4829985B2 JP4829985B2 (ja) 2011-12-07

Family

ID=42702398

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009011598A Expired - Fee Related JP4829985B2 (ja) 2009-01-22 2009-01-22 連携コンピュータシステム及び同システムの連携方法

Country Status (1)

Country Link
JP (1) JP4829985B2 (ja)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0567011A (ja) * 1990-06-19 1993-03-19 Internatl Business Mach Corp <Ibm> データ処理システムのユーザ照会機能
JPH08202586A (ja) * 1995-01-27 1996-08-09 Chugoku Nippon Denki Software Kk 接続監視システム
JP2000106586A (ja) * 1998-09-28 2000-04-11 Toshiba Corp 情報伝送システム
JP2000315198A (ja) * 1999-05-06 2000-11-14 Hitachi Ltd 分散処理システム及びその性能モニタリング方法
JP2001519942A (ja) * 1997-03-20 2001-10-23 ファーストセンス ソフトウェア インク 分散アプリケーションを監視するシステムおよび方法
JP2002278853A (ja) * 2001-03-21 2002-09-27 Hitachi Information Systems Ltd 分散オブジェクト環境における通信障害監視システムと通信障害監視方法およびプログラム
JP2004310742A (ja) * 2003-03-26 2004-11-04 Hitachi Ltd サービス処理方法及び装置
JP2005267093A (ja) * 2004-03-17 2005-09-29 Mitsubishi Electric Corp 障害検知装置及び障害検知システム
JP2006260400A (ja) * 2005-03-18 2006-09-28 Fujitsu Ltd コンピュータ装置状態監視方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0567011A (ja) * 1990-06-19 1993-03-19 Internatl Business Mach Corp <Ibm> データ処理システムのユーザ照会機能
JPH08202586A (ja) * 1995-01-27 1996-08-09 Chugoku Nippon Denki Software Kk 接続監視システム
JP2001519942A (ja) * 1997-03-20 2001-10-23 ファーストセンス ソフトウェア インク 分散アプリケーションを監視するシステムおよび方法
JP2000106586A (ja) * 1998-09-28 2000-04-11 Toshiba Corp 情報伝送システム
JP2000315198A (ja) * 1999-05-06 2000-11-14 Hitachi Ltd 分散処理システム及びその性能モニタリング方法
JP2002278853A (ja) * 2001-03-21 2002-09-27 Hitachi Information Systems Ltd 分散オブジェクト環境における通信障害監視システムと通信障害監視方法およびプログラム
JP2004310742A (ja) * 2003-03-26 2004-11-04 Hitachi Ltd サービス処理方法及び装置
JP2005267093A (ja) * 2004-03-17 2005-09-29 Mitsubishi Electric Corp 障害検知装置及び障害検知システム
JP2006260400A (ja) * 2005-03-18 2006-09-28 Fujitsu Ltd コンピュータ装置状態監視方法

Also Published As

Publication number Publication date
JP4829985B2 (ja) 2011-12-07

Similar Documents

Publication Publication Date Title
US7457236B2 (en) Method for providing fault-tolerant application cluster service
US8010840B2 (en) Generation of problem tickets for a computer system
US6434605B1 (en) Automatic detection and recovery for problems arising with interconnected queue managers
US9015310B2 (en) Communication system using server agents according to simple network management protocol
CN106330523A (zh) 一种集群服务器容灾系统、方法和服务器节点
JP2002108728A (ja) 障害情報の掲載方法およびプロバイダ設備
US20080288812A1 (en) Cluster system and an error recovery method thereof
CN105760240A (zh) 分布式任务处理方法及装置
US20150019671A1 (en) Information processing system, trouble detecting method, and information processing apparatus
CN103491102A (zh) 互联网音视频稳定性监控方法、系统及装置
CN105227385A (zh) 一种故障处理的方法及系统
CN105095008A (zh) 一种适用于集群系统的分布式任务故障冗余方法
CN110417600A (zh) 分布式系统的节点切换方法、装置及计算机存储介质
CN102591717A (zh) 外接设备和虚拟设备的业务信息处理方法、装置和系统
CN102916830B (zh) 一种资源服务优化配置容错管理实现系统
JP4834622B2 (ja) ビジネスプロセス運用管理システム、方法、プロセス運用管理装置およびそのプログラム
US20130090760A1 (en) Apparatus and method for managing robot components
CN101677278A (zh) 网络信息系统可用性的监控方法及系统
JP4102592B2 (ja) 集約機能付障害情報通知システム及びマシンを集約機能付障害情報通知手段として機能させるためのプログラム
CN113672452A (zh) 一种数据采集任务的运行监控方法、系统
CN110659184B (zh) 健康状态检查方法、装置及系统
US8677323B2 (en) Recording medium storing monitoring program, monitoring method, and monitoring system
JP4829985B2 (ja) 連携コンピュータシステム及び同システムの連携方法
CN102185720A (zh) 一种北向通知管理接口装置及其管理方法
JP4968568B2 (ja) 障害監視方法、障害監視システムおよびプログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110131

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110830

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110916

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140922

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4829985

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees