WO2016092629A1

WO2016092629A1 - 計算機システム及び監視方法

Info

Publication number: WO2016092629A1
Application number: PCT/JP2014/082525
Authority: WO
Inventors: 健太郎角井
Original assignee: 株式会社日立製作所
Priority date: 2014-12-09
Filing date: 2014-12-09
Publication date: 2016-06-16

Abstract

計算機システムであって、データを処理する少なくとも一つの計算機と、前記各計算機の稼働状況を監視する管理装置とを備え、前記各計算機は、処理対象のデータを一意に識別する識別子からコリレータを生成し、前記管理装置は、前記コリレータを比較して、前記各計算機が実行するデータ処理の相関を判定する。

Description

計算機システム及び監視方法

　本発明は、計算機システムに関する。

　現代の計算機システムは、複数の計算機が実行するソフトウェアコンポーネントが相互に連携して目的を達成する分散システムである。このようなシステムを運用・管理する際には、複数のソフトウェアコンポーネントが各々実行する処理の間の関連性を把握することが重要である。処理の間の関連性を把握することによって、処理遅延、性能劣化などのシステムの健全性を損なう事象を発生させた個所を同定し、原因を究明することができる。

　そのため、ソフトウェアコンポーネントの処理の開始・完了などのイベントの発生に応じて、ログ情報を出力するように計算機を構成し、このログ情報を収集・分析し、異なるソフトウェアコンポーネントが出力したログ情報の間で相関（コリレーション）の有無を判定する技術が知られている。

　例えば、特許文献１には、メッセージキューを介在したメッセージ交換のログ情報から、メッセージ交換に使用したパスの共通性に着目してイベント間の相関を判定する技術が開示されている。

　また、特許文献２には、複数の情報処理装置に跨って実行される処理の実行フローを関連付けるために、情報処理装置間の通信と同時にメタデータを交換させ、各々から収集したメタデータの共通性に着目して実行フロー間の相関を判定する技術が開示されている。

米国特許第７，９９６，８５３号明細書米国特許第７，９４９，６７３号明細書

　分散システムの一例として、複数の拠点に配置された計算機又は計算機システムで生成された業務データを集約・分析し、企業活動上の意思決定に活用する、いわゆるビジネスインテリジェンスを支援するシステムがある。このようなシステムにおいて、データの発生源である拠点が地理的に広く分散しており、通信による密な連携が困難である、又は、各拠点の情報処理システムでデータ形式が統一されておらず、データを集約する過程で変換処理を必要とする状況があり得る。

　このような多拠点・多システムを前提としたデータの連携を実現する手段として、いわゆるＳＯＡ（Ｓｅｒｖｉｃｅ　Ｏｒｉｅｎｔｅｄ　Ａｒｃｈｉｔｅｃｔｕｒｅ）と称される疎結合なシステムを採用することが好適である。これは、例えば、全ての業務データを単一の中央データベースに統一し、各計算機システムが中央データベースを利用するような密結合なシステムより導入が容易であるメリットがある。ＳＯＡによるデータ連携は、典型的には、データの転送、加工、変換などの処理はビジネスプロセスと称される一連の処理として定義され、複数のビジネスプロセスが通信や中継データベースを介してデータを交換し、連携することによって実現される。

　このようなデータ連携システムを運用・管理する際には、ビジネスプロセスによるデータの転送処理や変換処理の進行、すなわち複数のビジネスプロセスに跨った処理の関連性を把握することが重要である。しかしながら、このようなデータ連携システムに前述した相関判定技術を適用することは困難である。

　すなわち、中間ファイルや中継データベースを介在させてデータを連携する場合、ビジネスプロセス間の通信が存在しない場合があり、メッセージキューのような通信用ミドルウェアが出力するログ情報を活用することが難しい。また、同じ理由によって、ビジネスプロセス同士でメタデータや何らかの共通ＩＤを交換することも難しい。

　そこで、各ビジネスプロセスが処理の対象としたデータ項目を特定できる情報をログ情報に含ませ、ログ情報の間で相関を判定することが考えられる。このような相関判定のためにログに含ませる情報はコリレータと称される。しかし、処理対象が多数のデータ項目である場合、コリレータによりログ情報が長大化し、ログ情報の生成及び収集を困難にする。また、分析するにあたっても、共通のデータ項目を含むか否かで相関を判定するため、その集合演算に要する計算量が大きくなる。さらに、業務データを処理の対象とする以上、データ項目を特定できる情報は企業活動上の機微な情報を含む可能性があり、ログ情報を機密情報として取り扱うことは、ログ情報の取り扱いを困難にする。

　本発明は、以上の課題を解決し、複数の計算機がデータを交換することによりその目的を達成するよう設計された計算機システム、特に、多数の計算機から収集したデータを転送・変換し、データベースに格納してデータ利用者の多様な利用形態に供することを目的としたシステムに好適な、システムの運用状況を把握するための監視方法を提供することを目的とする。

　本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、計算機システムであって、データを処理する少なくとも一つの計算機と、前記各計算機の稼働状況を監視する管理装置とを備え、前記各計算機は、処理対象のデータを一意に識別する識別子からコリレータを生成し、前記管理装置は、前記コリレータを比較して、前記各計算機が実行するデータ処理の相関を判定する。

　本発明の代表的な実施の形態によれば、複数のソフトウェアコンポーネントの各々が実行する処理の関連性を効率的に把握することができる。前述した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。

本発明の実施例の計算機システムの構成例を示すブロック図である。本実施例の情報処理装置の物理的な構成例を示すブロック図である。ビジネスプロセス実行環境の構成例を示すブロック図である。ビジネスプロセスによるデータ処理の一例を示す図である。複数のビジネスプロセスによるデータ処理の一例を示す図である。ログ情報の構成例を示す図である。コリレータの構成例を示す図である。ビジネスプロセス実行環境によるデータ処理及びログ出力処理のフローチャートである。管理サーバの検索部及び相関判定部の構成例を示すブロック図である。ビジネスプロセストポロジ情報の構成例を示す図である。検索処理の処理手順のフローチャートである。相関判定処理の処理手順のフローチャートである。管理クライアント画面における情報表示の例を示す図である。管理クライアント画面における他の情報表示の例を示す図である。

　以下、図面を用いて本発明の実施例を詳述する。

　図１は、本実施例の計算機システムの構成例を示す。

　図１に示す計算機システムは、ビジネスプロセス実行サーバ１１０と、管理サーバ１２０と、管理クライアント１３０で構成される。

　ビジネスプロセス実行サーバ１１０は、ビジネスプロセス実行環境１１１、ログ出力部１１２及びログ転送部１１３を有する。ビジネスプロセス実行環境１１１は、受付部１１４、メッセージ配送部１１５、ビジネスプロセス実行部１１６及びサービス実行部１１７を有する。

　管理サーバ１２０は、ログ収集部１２１、インデックス格納部１２２、インデックス１２３、検索部１２４、相関判定部１２５、クエリ受信部１２６及び検索結果送信部１２７を有する。

　管理クライアント１３０は、クエリ送信部１３１、検索結果受信部１３２及び表示部１３３を有する。

　ビジネスプロセス実行サーバ１１０は、ビジネスプロセスと称される一連の処理を実行することによって、例えばデータ連携システムにおいて必要な処理を実現する。処理を実行する際、ログ出力部１１２がログ情報を出力し、ログ転送部１１３はログ情報を管理サーバ１２０に送信する。その処理の一例、及びログ情報の一例は後述する。

　管理サーバ１２０のログ収集部１２１は、ビジネスプロセス実行サーバ１１０のログ転送部１１３が送信したログ情報を受信し、インデックス格納部１２２に転送する。インデックス格納部１２２は、転送されたログ情報をインデックス１２３に格納する。

　管理サーバ１２０と管理クライアント１３０とは協調して動作する。すなわち、管理クライアント１３０のクエリ送信部１３１は、インデックス１２３に格納されたログ情報を一定の条件に従った検索を要求するクエリを管理サーバ１２０に送信する。管理サーバ１２０の検索部１２４は、クエリ受信部１２６が受信したクエリに従って、インデックス１２３に格納されたログ情報を検索し、検索結果送信部１２７が、検索結果を管理クライアント１３０に送信する。検索部１２４による検索処理の実行時に、相関判定部１２５が相関判定処理を実行する。検索部１２４及び相関判定部１２５の構成と実行する処理の詳細の一例は後述する。管理クライアント１３０の検索結果受信部１３２は、管理サーバ１２０の検索結果送信部１２７が送信した検索結果を受信し、データ連携システムの運用管理者に好適な形式で表示部１３３に表示する。表示部１３３による表示の一例は後述する。

　図２は、本実施例のビジネスプロセス実行サーバ１１０、管理サーバ１２０及び管理クライアント１３０を構成するのに好適な情報処理装置１００の物理的な構成例を示す。

　情報処理装置１００は、プロセッサ１０１、メモリ１０２、ストレージ１０３、ネットワークインタフェース１０４及びコンソール１０５を有し、例えば、ラックマウントサーバ、ブレードサーバ又はパーソナルコンピュータなどで構成される。プロセッサ１０１は、メモリ１０２、ストレージ１０３、ネットワークインタフェース１０４及びコンソール１０５と接続される。

　プロセッサ１０１は、例えば、ＣＰＵ（Central Processing Unit）等のハードウェアによる演算装置であり、メモリ１０２に格納されたプログラムを実行する。メモリ１０２は、例えば、揮発性の半導体メモリから構成され、プログラムやデータを一時的に保持する。また、ストレージ１０３は、例えば、ハードディスクドライブ（ＨＤＤ：Hard Disk Drive）、ソリッドステートドライブ（ＳＳＤ：Solid State Drive）、又はこれらを複数台組み合わせた不揮発性の記憶装置から構成され、プログラムやデータを長期間保持する。

　ネットワークインタフェース１０４は、例えば、ＮＩＣ（Network Interface Card）などの通信デバイスで構成され、ネットワーク１０６と接続される。ネットワークインタフェース１０４は、ネットワーク１０６を介した他の情報処理装置との通信時におけるプロトコル制御を行う。なお、ネットワーク１０６は、例えばイーサネットや、ＩＥＥＥ（Institute of Electrical and Electronics Engineers）８０２．１１規格に基づく無線ネットワーク、ＳＯＮＥＴ／ＳＤＨ（Synchronous Optical Network/Synchronous Digital Hierarchy）規格に基づく広域ネットワーク、又は、これら複数のネットワーク技術を組み合わせたネットワークを適用することができる。

　コンソール１０５は、例えば、キーボード及びマウス等の入力装置と、液晶表示パネル等のディスプレイ装置とから構成される。コンソール１０５は、入力装置から与えられる各種操作入力に応じた操作信号を受信して操作入力内容をプロセッサ１０１に通知し、プロセッサ１０１から出力されるテキスト情報やグラフィカル情報に基づくテキストや画像等をディスプレイ装置に表示する。

　なお、情報処理装置１００は、プロセッサ１０１、メモリ１０２、ストレージ１０３、ネットワークインタフェース１０４及びコンソール１０５の一部又は全部を複数有してもよい。

　ストレージ１０３に格納されたオペレーティングシステム（ＯＳ：Operating System）やユーザプログラムは、情報処理装置１００の起動時や、その実行時にメモリ１０２に読み出され、メモリ１０２に読み出されたオペレーティングシステム及びユーザプログラムをプロセッサ１０１が実行することによって、情報処理装置１００としての機能が実現される。

　すなわち、ビジネスプロセス実行サーバ１１０におけるビジネスプロセス実行環境１１１、ログ出力部１１２及びログ転送部１１３の各機能や、管理サーバ１２０におけるログ収集部１２１、インデックス格納部１２２、インデックス１２３、検索部１２４、相関判定部１２５、クエリ受信部１２６及び検索結果送信部１２７の各機能や、管理クライアント１３０におけるクエリ送信部１３１、検索結果受信部１３２及び表示部１３３の各機能が、プロセッサ１０１によって実現される。

　また、メモリ１０２やストレージ１０３等の記憶保持手段によって、ビジネスプロセス実行部１１６のビジネスプロセス定義２００、処理済キーリスト２０６や、管理サーバ１２０のインデックス１２３、フィルタ５０２、フィルタ済みログ５０４、分類済ログ５０５、ビジネスプロセストポロジ情報５０６及び相関情報付きログ５０７が格納される。

　また、ネットワークインタフェース１０４等によって、ビジネスプロセス実行サーバ１１０におけるログ転送部１１３、受付部１１４及びサービス実行部１１７の機能や、管理サーバ１２０におけるログ収集部１２１、クエリ受信部１２６及び検索結果送信部１２７の各機能や、管理クライアント１３０におけるクエリ送信部１３１及び検索結果受信部１３２の各機能が実現される。

　また、コンソール１０５等により、管理クライアント１３０における画面６００が実現される。

　プロセッサ１０１が実行するプログラムは、リムーバブルメディア（ＣＤ－ＲＯＭ、フラッシュメモリなど）又はネットワークを介して情報処理装置１００に提供され、非一時的記憶媒体であるストレージ１０３に格納される。このため、情報処理装置１００は、リムーバブルメディアからデータを読み込むインターフェースを有するとよい。

　また、情報処理装置１００は、物理的に一つの計算機上で、又は、論理的又は物理的に複数の計算機上で構成される計算機システムであり、前述したプログラムが、同一の計算機上で別個のスレッドで動作してもよく、複数の物理的計算機資源上に構築された仮想計算機上で動作してもよい。

　なお、ビジネスプロセス実行サーバ１１０、管理サーバ１２０及び管理クライアント１３０の一部又は全部を、処理負荷の分散や可用性の向上等を目的として、複数台設けてもよい。また、一つの情報処理装置１００に前述した複数種類のサーバ又はクライアントの役割を兼用させるように構成してもよい。物理的な情報処理装置１００とその役割との対応関係には自由度があり、本実施形態はその多数の組み合わせの中の一例である。

　図３は、ビジネスプロセス実行サーバ１１０に含まれるビジネスプロセス実行環境１１１の構成例を示す。

　図３に示すビジネスプロセス実行環境１１１は、受付部１１４、メッセージ配送部１１５、ビジネスプロセス実行部１１６及びサービス実行部１１７を有する。受付部１１４は、ビジネスプロセス実行の要求を受信し、受信した要求に応じてビジネスプロセス実行部１１６に実行の要求を転送する。

　ビジネスプロセス実行部１１６は、ビジネスプロセス定義２００及びビジネスプロセスインスタンス２０１を含む。ビジネスプロセス定義２００は、一連の処理のフローの定義を複数含む。ビジネスプロセス実行部１１６は、受付部１１４から特定のビジネスプロセスの実行要求を受信すると、該ビジネスプロセスをビジネスプロセス定義２００から抽出し、ビジネスプロセスインスタンス２０１を生成して実行可能な状態とする。異なるビジネスプロセスからは異なるビジネスプロセスインスタンスが生成される。また、実行要求を複数回受信すれば、同一のビジネスプロセスから複数の異なるビジネスプロセスインスタンスが生成され得る。

　ビジネスプロセスインスタンス２０１は、その実行の過程においてファイル２０２、データベース２０３、及びテーブル２０４に対してアクセスすることがある。この場合、ビジネスプロセスインスタンス２０１は、サービス実行部１１７にアクセス要求を送信する。サービス実行部１１７は、典型的には、ファイル２０２やデータベース２０３に対応する複数のサービスアダプタ（サービス実行部）１１７Ａ、１１７Ｂを有し、受信したアクセス要求に応じてファイル２０２又はデータベース２０３にアクセスする。このようにして、ビジネスプロセス実行環境１１１は、ビジネスプロセスインスタンス２０１による複数のファイルやデータベースへのアクセスを可能としている。

　これら受付部１１４、ビジネスプロセス実行部１１６及びサービス実行部１１７の間の通信は、メッセージ配送部１１５が仲介する。

　図４は、ビジネスプロセスによるデータ処理の一例を示す。

　典型的には、データ連携システムにおけるビジネスプロセスインスタンス２０１は、メッセージ配送部１１５を経由してサービス実行部１１７と通信することによって、入力データベース２０３Ａ及び出力データベース２０３Ｂに対する入出力アクセスを行う。ビジネスプロセスインスタンス２０１は、入力データベース２０３Ａに含まれる入力テーブル２０４Ａの一部分である処理対象レコード２０５Ａの入力を受け、出力データベース２０３Ｂに含まれる出力テーブル２０４Ａの一部分である処理対象レコード２０５Ｂを出力する。

　ビジネスプロセスインスタンス２０１は、入力された処理対象レコード２０５Ａに対して、例えばデータ変換処理を行い、変換処理の結果を処理対象レコード２０５Ｂとして出力する。このように、ビジネスプロセスインスタンス２０１が処理対象とするレコードはテーブルの一部分であること、また、その処理範囲は処理実行時に決定されることに留意されたい。

　図５は、複数のビジネスプロセスによるデータ処理の一例を示す。

　ビジネスプロセス実行環境１１１では、前述したように、異なるビジネスプロセスから異なるビジネスプロセスインスタンスが生成され、また、同一のビジネスプロセスから複数の異なるビジネスプロセスインスタンスが生成され得る。実際上、データ連携のような複雑な処理では、異なるビジネスプロセスが連続して処理を行うように構成される。

　図５に示す例において、ビジネスプロセス定義２００から異なる２種類のビジネスプロセスインスタンス、すなわち、ビジネスプロセスＢＰ１に対応するビジネスプロセスインスタンス２０１Ａ、及びビジネスプロセスＢＰ２に対応するビジネスプロセスインスタンス２０１Ｂが生成される。ビジネスプロセスインスタンス２０１Ａは、入力データベース２０３Ｃの入力テーブル２０４Ｃから処理対象レコードを取得し、出力データベース２０３Ｄの出力テーブル２０４Ｄに処理済のレコードを挿入する。テーブル２０４Ｄはビジネスプロセスインスタンス２０１Ｂの入力テーブルでもあり、ビジネスプロセスインスタンス２０１Ｂは、取得した処理対象レコードを処理した上で出力データベース２０３Ｅの出力テーブル２０４Ｅに挿入する。

　前述した例において、ＢＰ１について三つの異なるビジネスプロセスインスタンス２０１Ａ（ＢＰ１－１、ＢＰ１－２、ＢＰ１－３）が生成され、入力テーブル２０４Ｃ及び出力テーブル２０４Ｄの処理対象レコードの範囲が異なる。また、テーブル内のレコードは、キーによって特定できる。本例では、ＢＰ１－１の処理対象レコードはキーがａｌｐｈａからｅｃｈｏまでであり、ＢＰ１－２の処理対象レコードはｆｏｘｔｒｏｔからｊｕｌｉｅｔまでであり、ＢＰ１－３の処理対象レコードはｋｉｌｏからｏｓｃａｒまでである。

　また、ＢＰ２については、一つのビジネスプロセスインスタンス２０１Ｂが生成され、その処理対象レコードはキーがａｌｐｈａからｊｕｌｉｅｔまでである。

　このような状況におけるビジネスプロセスインスタンスの関連について、処理対象レコードに注目して図式化したものが処理対象レコード関連図３００である。すなわち、処理対象レコード関連図３００によれば、ビジネスプロセスインスタンスのうちＢＰ１－１、ＢＰ１－２、及びＢＰ２は相関があるが、ＢＰ１－３は他のビジネスプロセスインスタンスと相関がない。すなわち、本実施例におけるビジネスプロセスインスタンスの相関とは、各インスタンスが同じ系列でデータ処理を行っていることである。このような相関の情報は、データ連携システムの運用管理者がその運用状況を把握するために有用であり、ビジネスプロセス実行環境１１１が出力するログ情報に基づいて、ビジネスプロセスインスタンスの相関を再現する方法を以下に説明する。

　図６は、ログ情報の構成例を示す。

　ビジネスプロセス実行環境１１１が処理の実行に際して出力するログ情報は、典型的には複数のレコードを含み、各レコードは、各レコードを一意に特定するためのＩＤ及びログ出力の日次を示すタイムスタンプのフィールドを含む。また、ログ情報は、ログの出力元を示すビジネスプロセス名、プロセスインスタンスＩＤ、及びホスト名を含む。また、ログ情報は、該ビジネスプロセスインスタンスによる処理に関する情報として、処理対象テーブル名、処理対象キー、処理内容、処理ステータス、及び所要時間を含む。処理対象テーブル名は、入力テーブル名と出力テーブル名との二つのフィールドに分けてもよい。そして、レコード間の相関を判定するために用いるコリレータ、及び相関がある他のレコードのＩＤを示すコリレーションの情報を含む。ログ情報の構成は実施例の説明のために例示するものであり、前述したフィールドの全てを含まなくてもよく、例示されていないフィールドを含んでもよい。

　ビジネスプロセスインスタンス２０１は、その実行中に、処理の開始、終了、エラーの検知などのイベントの際にログを出力するように構成してもよいが、好ましくは、少なくとも終了時の１回は出力する。ビジネスプロセス実行環境１１１から出力されたログ情報は、ログ出力部１１２を経由してログ転送部１１３に渡され、管理サーバ１２０に転送される。管理サーバ１２０のログ収集部１２１は、転送されたログをインデックス格納部１２２に渡し、インデックス格納部１２２はログを検索が容易な形式でインデックス１２３に格納する。

　図７は、コリレータの構成例を示し、図５で示したビジネスプロセスインスタンスＢＰ１－１、ＢＰ１－２、ＢＰ１－３及びＢＰ２のコリレータの例を示す。

　図６に示したログ情報に含まれるコリレータフィールドは、ビジネスプロセスインスタンス２０１が処理対象レコードを特定できる情報を出力するために用意される。すなわち、処理対象キーのフィールドの情報に相当する情報であるが、処理対象キーのフィールドのようにレコードを特定できるキーを列挙すると、多数のレコードが処理対象である場合にフィールドが長大化する懸念がある。

　そこで本実施例では、処理対象レコードのキーのそれぞれについてハッシュ関数によってハッシュ値を計算し、計算したハッシュ値にビット単位の論理和（ＯＲ）演算をすることにより生成された固定長のデータをコリレータとする。

　図７に示すように、ビジネスプロセスインスタンスＢＰ１－１については、キーａｌｐｈａからｅｃｈｏまでの各々についてハッシュ値を求めＯＲ演算を施したものをコリレータ３０１とする。同様に、ビジネスプロセスインスタンスＢＰ１－２については、ｆｏｘｔｒｏｔからｊｕｌｉｅｔまでの各々についてハッシュ値を求めＯＲ演算を施したものをコリレータ３０２とする。また、ビジネスプロセスインスタンスＢＰ１－３については、ｋｉｌｏからｏｓｃａｒまでの各々についてハッシュ値を求めＯＲ演算を施したものをコリレータ３０３とする。さらに、ビジネスプロセスインスタンスＢＰ２については、ａｌｐｈａからｊｕｌｉｅｔまでの各々についてハッシュ値を求めＯＲ演算を施したものをコリレータ３０４とする。各々ハッシュ値を求めＯＲ演算を施したものをコリレータとする。

　ハッシュ関数はコリジョンの発生を極力回避できるよう、出力の一様性に優れるものを選択するとよい。例えば、ＦＮＶ（Fowler-Noll-Vo）、ＭｕｒｍｕｒＨａｓｈなどのハッシュ関数が好適である。また、一つのキーに対して複数種類のハッシュ関数がそれぞれ出力したハッシュ値をＯＲ演算するように構成してもよい。また、ハッシュ値のビット長は、キーのカーディナリティが周知であれば、それに合わせて調整してもよい。

　ログ情報にコリレータフィールドを含める場合は、処理対象キーフィールドの出力は省略してもよい。

　図８は、ビジネスプロセス実行環境１１１によるデータ処理及びログ出力処理の処理手順の一例を示す。

　まず、ビジネスプロセスインスタンス２０１は、入力テーブル２０４Ａから処理対象レコード２０５Ａを取得する（Ｓ８０２）。次に、ビジネスプロセスインスタンス２０１は、処理対象レコード２０５Ａにデータ変換処理を実施し（Ｓ８０４）、その後、データ変換処理済みの処理対象レコード２０５Ｂを出力テーブル２０４Ｂに挿入し（Ｓ８０６）、処理対象レコードのキーを処理済キーリスト２０６に追加する（Ｓ８０８）。

　そして、入力テーブル２０４Ａに未取得のレコードがあるかを判定する（Ｓ８１０）。その結果、入力テーブル２０４Ａに未取得のレコードがあれば、ステップＳ８０２～Ｓ８１０の処理を繰り返す。一方、入力テーブル２０４Ａに未取得のレコードがなければ、データ処理が終了しているので、ビット配列Ｃを用意し、ビット配列Ｃを０で初期化する（Ｓ８１２）。次に、処理済キーリスト２０６からキーを一つ取得し（Ｓ８１４）、取得したキーのハッシュ値ｈを計算する（Ｓ８１６）。そして、ビット配列Ｃとｈとをビット単位で論理和（ＯＲ）演算を行い、演算結果でＣを置換する（Ｓ８１８）。

　その後、処理済キーリスト２０６に未取得のキーがあるかを判定する（Ｓ８２０）。処理済キーリスト２０６に未取得のキーがあれば、ステップＳ８１４～Ｓ８１８の処理を繰り返す。一方、処理済キーリスト２０６に未取得のキーがなければ、処理済キーリスト２０６の全てのキーを用いてコリレータが生成されたので、ビット配列Ｃをコリレータとしてログに出力し（Ｓ８２２）、処理を終了する。

　コリレータを含むログ情報は、ビジネスプロセス実行サーバ１１０のログ出力部１１２から出力され、ログ転送部１１３と、管理サーバ１２０のログ収集部１２１及びインデックス格納部１２２との各処理を経て、インデックス１２３に格納される。

　インデックス１２３に格納されている大量のログ情報を、データ連携システムの運用管理に活用するためには、検索の処理が必要である。そこで、図９を用いて、管理サーバ１２０の検索部１２４及び相関判定部１２５の構成を例示する。

　管理サーバ１２０の検索部１２４及び相関判定部１２５は、クエリ受信部１２６が受信したクエリを用いて、インデックス１２３を検索してログ情報を取り出し、取り出したログ情報に相関情報を付与して検索結果送信部１２７から送信する。

　検索部１２４は、クエリ解析部５０１及びデータ取得部５０３を有する。クエリ解析部５０１は、受信したクエリを解析し、インデックス１２３に格納されたログ情報を一定の条件に従って取り出すためのフィルタ５０２を生成する。クエリが指定する条件とは、典型的には、タイムスタンプが一定の期間内であることや、処理対象テーブル名が特定の名称であることなどの条件であるが、これに限定されるものではない。データ取得部５０３は、フィルタ５０２に従って該当するログ情報をインデックス１２３から取り出し、取りだしたログ情報をフィルタ済みログ５０４として相関判定部１２５に転送する。

　相関判定部１２５は、フィルタ済みログ５０４をビジネスプロセス名に従って分類し、分類済ログ５０５を生成する。相関判定部１２５は、ビジネスプロセストポロジ情報５０６を有し、ビジネスプロセストポロジ情報５０６を用いて分類済ログ５０５の相関を判定する。相関が判定されたログ情報は、相関情報付きログ５０７として検索部１２４に戻される。検索結果送信部１２７は、相関情報付きログ５０７を管理クライアント１３０に送信する。

　図１０は、ビジネスプロセストポロジ情報５０６の構成例を示す。

　前述したように、データ連携処理では複数のビジネスプロセスが連続して複数の処理をそれぞれ実行する。すなわち、複数のビジネスプロセス間の関係は、有向グラフの形でトポロジカルに表現することができる。図１０に示すビジネスプロセストポロジ情報５０６は、ビジネスプロセスＢＰ１（４０１）の処理の後にビジネスプロセスＢＰ２（４０２）の処理が実行され、その後、ビジネスプロセスＢＰ３（４０３）の処理が実行される、という関係にあることを表している。

　相関判定部１２５がビジネスプロセストポロジ情報５０６を保持する態様は図示したものに限定されず、例えば、有向グラフの各ノードをトポロジカルソートして、ビジネスプロセス名のリストとして保持してもよい。ビジネスプロセス間の処理の前後関係を表現できれば、いかなる態様であってもよい。

　図１１は、検索部１２４及び相関判定部１２５による検索処理の処理手順の一例を示す。

　検索部１２４のクエリ解析部５０１は、入力されたクエリを解析し（Ｓ１１０２）、フィルタ５０２を生成する（Ｓ１１０４）。次に、データ取得部５０３は、生成されたフィルタに従ってログをインデックス１２３から取得する（Ｓ１１０６）。そして、相関判定部１２５は、フィルタ済みログ５０４の相関を判定し、相関情報を付与し、相関情報付きログ５０７生成する（Ｓ１１０８）。相関判定処理（Ｓ１１０８）の詳細な手順は図１２を用いて後述する。相関判定部１２５は、相関情報付きログ５０７を検索部１２４に戻し、検索結果送信部１２７が相関情報付きログ５０７を出力する（Ｓ１１１０）。

　図１２は、相関判定部１２５による相関判定処理（Ｓ１１０８）の処理手順の一例を示す。

　まず、相関判定部１２５は、検索部１２４からフィルタ済みログ５０４を取得し（Ｓ１２０２）、次いでフィルタ済みログ５０４を、ログ情報の各レコードが含むビジネスプロセス名に従って分類し（Ｓ１２０４）、ビジネスプロセストポロジ情報５０６から開始ノードのビジネスプロセス名を取得し、開始ノードのビジネスプロセス名をＰとする（Ｓ１２０６）。図１０に示す有向グラフによるビジネスプロセストポロジ情報５０６の例では、開始ノードはルートノードであるビジネスプロセスＢＰ１（４０１）である。同様に、ビジネスプロセストポロジ情報５０６から、Ｐの子ノードのビジネスプロセス名を取得し、子ノードのビジネスプロセス名をＣとする（Ｓ１２０８）。図１０に示す例であれば、ビジネスプロセスＢＰ２（４０２）が、Ｐの子ノードのビジネスプロセスである。

　その後、相関判定部１２５は、フィルタ済みログ５０４を参照して、Ｐのログ情報から一つのレコードＰ１を取得し、レコードＰ１のコリレータをＣｒ１とする（Ｓ１２１０）。同様に、Ｃのログ情報から一つのレコードＣ１を取得し、レコードＣ１のコリレータをＣｒ２とする（Ｓ１２１２）。これらの処理によって、相関を判定する対象である二つのレコードのコリレータがそれぞれＣｒ１とＣｒ２に設定される。相関判定処理は、該コリレータＣｒ１及びＣｒ２に対するビット単位の論理積（ＡＮＤ）演算である（Ｓ１２１４）。該ＡＮＤ演算の結果が０である場合、相関はないと判定する。一方、ＡＮＤ演算の結果が０でなかった場合、相関があると判定し、ログ情報のレコードＰ１のコリレーションフィールドにレコードＣ１のＩＤを登録する（Ｓ１２１６）。この処理によって、Ｐ１とＣ１の間の相関（コリレーション）がログ情報に記録される。

　以降、子ノードであるＣのログ情報に未取得のレコードがあるかを判定する（Ｓ１２１８）。その結果、子ノードＣのログ情報に未取得のレコードがあれば、ステップＳ１２１２に戻り、子ノードＣの全てのレコードを取得するまで相関判定処理を繰り返す。一方、全てのレコードの処理が終了すると、現在の子ノードＣを親ノードＰに置き換える（Ｓ１２２０）。図１０に示す例であれば、ビジネスプロセスＢＰ２（４０２）をＰとする。

　そして、Ｐにさらに子ノードがあるかを判定する（Ｓ１２２２）。Ｐに子ノードがあれば、ステップＳ１２０８に戻り、相関判定処理を繰り返す。一方、Ｐに子ノードがなければ、末端ノードに到達したので、本処理手順を終了する。その後、フィルタ済みログ５０４のレコードのうち、他のレコードと相関があると判定されたレコードのコリレーションフィールドには、相関があると判定されたレコードのＩＤが登録される。この状態となったログ情報が相関情報付きログ５０７である。相関判定部１２５は相関情報付きログ５０７を検索部１２４に転送し、検索結果送信部１２７は相関情報付きログ５０７を管理クライアント１３０に送信する。

　図１３は、管理クライアント画面における情報表示の一例を示す。

　管理クライアント１３０の検索結果受信部１３２は、管理サーバ１２０から相関情報付きログ５０７を受信し、表示部１３３は該相関情報付きログ５０７を運用管理者に好適な形式で表示する。その一例である管理クライアント画面６００は、表示対象データ一覧６０１、ビジネスプロセス一覧６０２及びデータ連携タイムライン表示６０３Ａ、６０３Ｂを含む。

　表示対象データ一覧６０１は、相関情報付きログ５０７の各レコードに含まれる一つ又は複数のフィールドの値を列挙する。列挙する対象となるフィールドは、例えば処理対象テーブル名であるが、他のフィールドを列記してもよい。また、図１３に示すように、フィールドに含まれない情報を補って表示したり、多数の情報を列挙できるよう木構造で表現してもよい。運用管理者が、データ連携処理の対象である業務データを一覧できるよう構成すれば、どのような形式で表示してもよい。

　表示対象データ一覧６０１の特定の値を運用管理者が選択すると、選択された値を含むログが相関情報付きログ５０７から抽出され、表示部１３３が、ビジネスプロセス一覧６０２及びデータ連携タイムライン表示６０３Ａ、６０３Ｂを表示する。ビジネスプロセス一覧６０２は、ログ情報の各レコードに含まれるホスト名フィールド及びビジネスプロセス名フィールドを組み合わせて列挙する。すなわち、運用管理者は、データ連携処理の実行に関係したホスト及びビジネスプロセスを一覧することができる。データ連携タイムライン表示６０３Ａ及び６０３Ｂはそれぞれ、相関判定部１２５によって相関があると判定されコリレーションフィールドに相互にＩＤが登録された一連のログを、連続するタイムラインチャートに表示する。タイムラインの各行は、ログ情報のビジネスプロセス名フィールドに従ってビジネスプロセス一覧６０２と垂直方向（縦軸）の位置を揃えて表示するとよい。同様に、タイムスタンプフィールドと所要時間フィールドを用いて、水平方向（横軸）の位置と幅を調整して表示する。そして、コリレーションフィールドのＩＤに基づいて、タイムラインの各行を連結して表示する。

　図１３に示すように、相関判定の結果に従って、複数のデータ連携タイムライン６０３Ａ、６０３Ｂを表示することができる。ここで横軸に注目すると、データ連携タイムライン６０３Ａ及び６０３Ｂでオーバラップする個所があることに注目できる。このような表示は、ログに相関情報が付与されているために可能になるものである。

　図１４は、管理クライアント画面における情報表示の他の一例を示す。

　図１３と同様に、管理クライアント画面６００は、表示対象データ一覧６０１、ビジネスプロセス一覧６０２及びデータ連携タイムライン６０３Ｃを含む。図１４に示すデータ連携タイムライン６０３Ｃは、二つのタイムラインがその中途で接続されていることに注目できる。これは相関判定部１２５による相関判定の結果、ビジネスプロセスＢＰ２の二つのインスタンスのそれぞれが出力したログが、ビジネスプロセスＢＰ３の一つのインスタンスのログと相関があると判定されたことを示す。ログ情報の相関は１対１に限られるものではなく、このような多対１で表示されることがある。

　以上に説明したように、本発明の実施例では、ビジネスプロセス実行サーバ１１０が処理対象のデータを一意に識別する識別子からコリレータを生成し、管理サーバ１２０は、コリレータを比較して、ビジネスプロセス実行サーバ１１０が実行するデータ処理の相関を判定するので、複数のソフトウェアコンポーネントの各々が実行する処理の関連性を効率的に把握することができる。

　また、ビジネスプロセス実行サーバ１１０は、処理対象のデータを一意に識別する識別子のハッシュ値の論理和演算によってコリレータを生成するので、ログ情報の長大化を防ぐことができ、相関を判定するための計算量を削減することができ、さらにログ情報に含まれる機微情報によるセキュリティ上のリスクを低減することができる。

　また、管理サーバ１２０は、コリレータの論理積演算によって、データ処理の相関を判定するので、相関を判定するための計算量を削減することができる。

　また、管理サーバ１２０は、コリレータの論理積が０である場合、データ処理の相関がないと判定するので、相関を判定するための計算量を削減することができる。

　また、ビジネスプロセス実行サーバ１１０は、生成したコリレータを、データ処理のログに含めて出力し、管理サーバ１２０は、ビジネスプロセス実行サーバ１１０からログを収集するので、複数のビジネスプロセス実行サーバが設けられる分散環境においても、コリレータを容易に収集することができる。

　また、管理サーバ１２０は、判定されたデータ処理の相関を表示するためのデータを出力するので、管理クライアント１３０においてデータ処理の相関性を直感的に理解することができる。

　なお、本発明は前述した実施例に限定されるものではなく、添付した特許請求の範囲の趣旨内における様々な変形例及び同等の構成が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに本発明は限定されない。また、ある実施例の構成の一部を他の実施例の構成に置き換えてもよい。また、ある実施例の構成に他の実施例の構成を加えてもよい。また、各実施例の構成の一部について、他の構成の追加・削除・置換をしてもよい。

　また、前述した各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等により、ハードウェアで実現してもよく、プロセッサがそれぞれの機能を実現するプログラムを解釈し実行することにより、ソフトウェアで実現してもよい。

　各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、ＳＳＤ（Solid State Drive）等の記憶装置、又は、ＩＣカード、ＳＤカード、ＤＶＤ等の記録媒体に格納することができる。

　また、制御線や情報線は説明上必要と考えられるものを示しており、実装上必要な全ての制御線や情報線を示しているとは限らない。実際には、ほとんど全ての構成が相互に接続されていると考えてよい。

Claims

　計算機システムであって、
　データを処理する少なくとも一つの計算機と、
　前記各計算機の稼働状況を監視する管理装置とを備え、
　前記各計算機は、処理対象のデータを一意に識別する識別子からコリレータを生成し、
　前記管理装置は、前記コリレータを比較して、前記各計算機が実行するデータ処理の相関を判定することを特徴とする計算機システム。
　請求項１に記載の計算機システムであって、
　前記各計算機は、処理対象のデータを一意に識別する識別子のハッシュ値の論理和演算によってコリレータを生成することを特徴とする計算機システム。
　請求項２に記載の計算機システムであって、
　前記管理装置は、前記コリレータの論理積演算によって、前記データ処理の相関を判定することを特徴とする計算機システム。
　請求項３に記載の計算機システムであって、
　前記管理装置は、前記コリレータの論理積が０である場合、前記データ処理の相関がないと判定することを特徴とする計算機システム。
　請求項１から４のいずれか一つに記載の計算機システムであって、
　前記各計算機は、前記生成したコリレータを、前記データ処理のログに含めて出力し、
　前記管理装置は、前記各計算機から前記ログを収集することを特徴とする計算機システム。
　請求項１から４のいずれか一つに記載の計算機システムであって、
　前記管理装置は、前記判定された前記データ処理の相関を表示するためのデータを出力することを特徴とする計算機システム。
　少なくとも一つの計算機から構成される計算機システムの稼働状況を監視する監視方法であって、
　前記計算機システムは、データを処理する少なくとも一つの計算機と、前記各計算機の稼働状況を監視する管理装置とを有し、
　前記方法は、
　前記各計算機が、処理対象のデータを一意に識別する識別子からコリレータを生成するステップと、
　前記管理装置が、前記コリレータを比較して、前記各計算機が実行するデータ処理の相関を判定するステップとを含むことを特徴とする監視方法。
　請求項７に記載の監視方法であって、
　前記コリレータを生成するステップでは、前記各計算機は、処理対象のデータを一意に識別する識別子のハッシュ値の論理和演算によってコリレータを生成することを特徴とする監視方法。
　請求項８に記載の監視方法であって、
　前記相関を判定するステップでは、前記管理装置は、前記コリレータの論理積演算によって、前記データ処理の相関を判定することを特徴とする監視方法。
　請求項９に記載の監視方法であって、
　前記相関を判定するステップでは、前記管理装置は、前記コリレータの論理積が０である場合、前記データ処理の相関がないと判定することを特徴とする監視方法。
　請求項７から１０のいずれか一つに記載の監視方法であって、
　前記コリレータを生成するステップでは、前記各計算機は、前記生成したコリレータを、前記データ処理のログに含めて出力し、
　前記相関を判定するステップでは、前記管理装置は、前記各計算機から前記ログを収集することを特徴とする監視方法。
　請求項７から１０のいずれか一つに記載の監視方法であって、
　前記管理装置が、前記判定された前記データ処理の相関を表示するためのデータを出力するステップを含むことを特徴とする監視方法。