JP2019149079A - Failure influence investigation apparatus and failure influence investigation method - Google Patents
Failure influence investigation apparatus and failure influence investigation method Download PDFInfo
- Publication number
- JP2019149079A JP2019149079A JP2018034357A JP2018034357A JP2019149079A JP 2019149079 A JP2019149079 A JP 2019149079A JP 2018034357 A JP2018034357 A JP 2018034357A JP 2018034357 A JP2018034357 A JP 2018034357A JP 2019149079 A JP2019149079 A JP 2019149079A
- Authority
- JP
- Japan
- Prior art keywords
- job
- jobs
- net
- failure
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、障害影響調査装置および障害影響調査方法に関するものであり、具体的には、バッチジョブにおける障害影響調査を網羅的かつ効率的なものとし、また、その調査結果をニーズに即して好適に提示可能とする技術に関する。 The present invention relates to a failure effect investigation device and a failure effect investigation method. Specifically, the failure effect investigation in a batch job is made comprehensive and efficient, and the investigation result is matched to the needs. The present invention relates to a technique that can be preferably presented.
金融機関における基幹システムなど大規模システムでは、一連のジョブを適宜に組み合わせてバッチ処理し、業務遂行に必要な情報処理を行うケースが多い。こうしてバッチ処理されるジョブのいずれかで障害が発生した場合、関連する他ジョブへの影響が波及し、当該業務の遂行に支障が生じかねない。 In a large-scale system such as a core system in a financial institution, a series of jobs are appropriately combined and batch-processed to perform information processing necessary for business execution. If a failure occurs in any of the jobs that are batch-processed in this way, the influence on other related jobs may spread, and the execution of the task may be hindered.
そこで、そうした障害の発生に対応し、必要な情報を収集して復旧につなげる技術が存在する。このような技術としては、例えば、サーバと、クライアントとが、ネットワークを介して通信可能に接続されたジョブ管理システムであって、前記サーバが、ジョブネットおよびジョブ毎に任意に設定される、後続要素(後続ジョブネットおよび/またはジョブ)と、回復優先レベルと、終了期限時刻と、開始予定時刻とを記憶するジョブネット・ジョブデータベースと、異常が発生したジョブネットまたはジョブの後続要素が、異常発生から正常に動作を開始するまでの回復見込み時間を記憶する回復見込み時間データベースと、ジョブネットまたはジョブに異常が発生したことを検出する異常発生検出手段と、異常が発生したジョブネットまたはジョブの後続要素毎に回復優先レベルが設定されているか否かを判定し、設定されている場合には、後続要素間で回復優先レベルの比較を行う回復優先レベル判定手段と、異常が発生したジョブネットまたはジョブの後続要素毎に終了期限時刻が設定されているか否かを判定し、設定されている場合には、後続要素間で、終了期限時刻の比較を行う終了期限時刻判定手段と、異常が発生したジョブネットまたはジョブの後続要素毎に開始予定時刻が設定されているか否かを判定し、設定されている場合には、後続要素間で、開始予定時刻の比較を行う開始予定時刻判定手段と、異常が発生したジョブネットまたはジョブの後続要素毎に回復見込み時間が記憶されているか否かを判定し、記憶されている場合には、後続要素間で、回復見込み時間の比較を行う回復見込み時間判定手段と、前記各判定比較結果に基づいて、後続要素の回復順位を決定する回復順位決定手段と、前記決定した回復順位をユーザに通知する通知手段とを備えることを特徴とするジョブ管理システム(特許文献1参照)などが提案されている。 Therefore, there is a technology that can cope with such a failure and collect necessary information for recovery. Examples of such a technique include a job management system in which a server and a client are communicably connected via a network, and the server is arbitrarily set for each job net and job. The job net / job database that stores the elements (subsequent job nets and / or jobs), recovery priority level, end deadline time, and scheduled start time, and the subsequent elements of the job net or job where the error occurred are abnormal. The expected recovery time database that stores the expected recovery time from the occurrence to the normal start of operation, the error occurrence detection means for detecting that an error has occurred in the job net or job, and the job net or job in which the error has occurred It is judged whether recovery priority level is set for each subsequent element. Is a recovery priority level determination means for comparing recovery priority levels between subsequent elements, and whether or not an end deadline time is set for each subsequent element of a job net or job in which an error has occurred. If it is, the end deadline time determination means for comparing the end deadline time between the subsequent elements, and whether the scheduled start time is set for each subsequent element of the job net or job in which an error has occurred If set, whether or not the scheduled start time determination means for comparing the scheduled start time between the subsequent elements and the expected recovery time are stored for each subsequent element of the job net or job in which an abnormality has occurred. If it is stored, and if stored, the expected recovery time determination means for comparing the expected recovery time between the subsequent elements, and the process of the subsequent element based on each determination comparison result. A recovery order determining means for determining a rank, job management system, characterized in that it comprises a notifying means for notifying the recovery ranking the determined user (see Patent Document 1) have been proposed.
また、ジョブの定義と先行・後続の待ち合わせ条件を定義できるジョブ定義データベースと、このジョブ定義データベースに格納されたジョブ定義情報を読み出し、定義されたジョブの先行ジョブ、後続ジョブの先行・後続関係を検索する検索手段を備えたジョブ運用管理システムにおいて、前記検索手段が提供する検索画面において先行ジョブを検索条件として指定し、当該先行ジョブに後続関係を有するジョブ検索を実行して検索結果情報を保持し、検索結果の情報の1つ再指定して再帰的に検索を行うことによって前記先行ジョブに後続関係を有する後続ジョブを検索画面に表示する手段を備えることを特徴とするジョブ運用管理システム(特許文献2参照)なども提案されている。 Also, the job definition database that can define the job definition and the waiting conditions for the preceding and succeeding jobs, and the job definition information stored in this job definition database are read, and the preceding and succeeding relationships of the preceding jobs and succeeding jobs of the defined jobs are read. In a job operation management system having a search means for searching, a preceding job is specified as a search condition on a search screen provided by the searching means, and a job search having a subsequent relationship with the preceding job is executed and search result information is retained. And a means for displaying a subsequent job having a subsequent relationship with the preceding job by re-specifying one of the search result information and performing a recursive search on the search screen. Patent Document 2) is also proposed.
ところで、上述のジョブは、一連のジョブ群からなるジョブネットの構成要素である。また、そのジョブネットも、一連のジョブネット群の構成要素である。更には、そのジョブネット群もその上位構成の単位要素となりうる。こうしたジョブの包含関係において、上述のジョブは当該業務に関する最小の処理単位を成し、これを含むジョブネット、更にこれを含むジョブネット群、と次第にジョブの群れが大きくなるほど当該包含関係が拡大する。換言すれば、各業務の各業務区分等に関して、その処理単位の大きさにあわせて、ジョブに関する包含関係が階層構造の形で定義されている。 Incidentally, the above-described job is a constituent element of a job net composed of a series of jobs. The job net is also a constituent element of a series of job nets. Further, the job net group can also be a unit element of the higher-level configuration. In such job inclusion relationship, the above-mentioned job constitutes the minimum processing unit related to the job, and the inclusion relationship expands as the job net including the job net, further including the job net group, and the group of jobs gradually increases. . In other words, for each business category of each business, the inclusion relation regarding the job is defined in a hierarchical structure in accordance with the size of the processing unit.
上述のような階層構造において、いずれかのジョブで障害が発生し、その影響範囲を特定しようとしたとする。ところが従来技術等においては、当該ジョブの所属構成や階層を超えて、或いは、他業務区分や他業務にまで跨がって、更には、外部システム由来のジョブにまで跨がって、影響範囲の特定を行うことができていない。 In the hierarchical structure as described above, it is assumed that a failure has occurred in one of the jobs and an influence range is to be specified. However, in the prior art etc., the scope of influence is beyond the affiliation structure and hierarchy of the job, or across other business divisions and other business, and even across jobs from external systems. Can not be identified.
そのため、そうした影響範囲を特定するには、その都度、人手を介した相応の規模の調査が必要になる。こうした調査は、膨大な数のジョブを漏れなく調査する必要があって、それ自体が非常に困難を伴うものである上、対応人員におけるスキルや経験値に依存する属人性の強いもので、調査の精度や効率も不安定なものになりやすい。 Therefore, in order to identify such an impact range, it is necessary to conduct a survey of appropriate scale each time through human intervention. These surveys need to investigate a huge number of jobs without any omissions, and are very difficult in themselves, and have a strong personality that depends on the skills and experience of responding personnel. The accuracy and efficiency of the system are likely to be unstable.
また、上述のような調査を行ったとしても、調査結果たる影響範囲の情報を網羅的に表示し、その内容をユーザのニーズに応じて動的に制御するといった機能も提供されていない。 Further, even if the above-described investigation is performed, the function of comprehensively displaying the information on the influence range as the investigation result and dynamically controlling the contents according to the user's needs is not provided.
そこで本発明の目的は、バッチジョブにおける障害影響調査を網羅的かつ効率的なものとし、また、その調査結果をニーズに即して好適に提示可能とする技術を提供することにある。 SUMMARY OF THE INVENTION An object of the present invention is to provide a technology that makes it possible to comprehensively and efficiently investigate a failure influence in a batch job and to present the results of the investigation appropriately in accordance with needs.
上記課題を解決する本発明の障害影響調査装置は、各業務に関するジョブおよび一連の前記ジョブから構成されたジョブネット、の各階層を少なくとも含むバッチジョブの階層構造に関する情報を格納した記憶装置と、前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを障害影響範囲として特定する処理と、少なくとも前記障害影響範囲に属するジョブおよびジョブネットの各々をノードとし、当該ノードの各間をエッジで接続した有向グラフないし無向グラフと、前記障害影響範囲に属するジョブおよびジョブネットのリストと、前記障害影響範囲に属するジョブないしジョブネットの数を業務単位ごとに集計表示したグラフ、の少なくともいずれかを生成して所定装置に出力する処理と、を実行する演算装置と、を備えることを特徴とする。 The failure impact investigation device of the present invention that solves the above problems includes a storage device that stores information relating to a hierarchical structure of a batch job including at least each hierarchy of a job relating to each job and a job net composed of a series of the jobs, Based on at least the input / output relationship between jobs and job nets indicated by the information related to the hierarchical structure, the input / output relationship is established within the business and between the business, starting with the job that is subject to abend generation in the given business. A process for specifying a series of jobs and job nets as a failure influence range, and a directed graph or an undirected graph in which at least each of jobs and job nets belonging to the failure influence range is a node and each of the nodes is connected by an edge , A list of jobs and job nets belonging to the failure impact range, A processing unit that generates and outputs to at least one of a graph in which the number of jobs or job nets belonging to the failure-affected range is aggregated and displayed for each business unit, and outputs to a predetermined device. And
また本発明の障害影響調査方法は、各業務に関するジョブおよび一連の前記ジョブから構成されたジョブネット、の各階層を少なくとも含むバッチジョブの階層構造に関する情報を格納した記憶装置を備える情報処理装置が、前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを障害影響範囲として特定する処理と、少なくとも前記障害影響範囲に属するジョブおよびジョブネットの各々をノードとし、当該ノードの各間をエッジで接続した有向グラフないし無向グラフと、前記障害影響範囲に属するジョブおよびジョブネットのリストと、前記障害影響範囲に属するジョブないしジョブネットの数を業務単位ごとに集計表示したグラフ、の少なくともいずれかを生成して所定装置
に出力する処理と、を実行することを特徴とする。
The failure impact investigation method of the present invention is an information processing apparatus comprising a storage device that stores information relating to a hierarchical structure of a batch job including at least each hierarchy of a job relating to each job and a job net composed of a series of the jobs. Based on at least the input / output relationship between jobs and between job nets indicated by the information related to the hierarchical structure, the input / output relationship is established within the job and between jobs, starting from the job that is subject to abend generation in a given job. And a directed graph or undirected graph in which at least each of jobs and job nets belonging to the failure influence range is a node, and each of the nodes is connected by an edge. And a list of jobs and job nets that belong to the failure-affected range When, and executes a processing for outputting a predetermined unit number graph summary display for each business unit, of generating at least one of a job to the job net belonging to the fault influence range.
本発明によれば、バッチジョブにおける障害影響調査を網羅的かつ効率的なものとし、また、その調査結果をニーズに即して好適に提示可能となる。 According to the present invention, it is possible to comprehensively and efficiently investigate a failure influence in a batch job, and it is possible to suitably present a result of the investigation according to needs.
−−−ネットワーク構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態の障害影響調査装置100を含むネットワーク構成図である。
--- Network configuration ---
Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 is a network configuration diagram including a failure
図1に示す障害影響調査装置100は、バッチジョブにおける障害影響調査を網羅的かつ効率的なものとし、また、その調査結果をニーズに即して好適に提示可能とするコンピュータ装置である。
A failure
この障害影響調査装置100は、例えば、金融機関のシステム管理部門やその業務委託先のベンダー等が運用するサーバ装置を想定できる。障害影響調査装置100は、その運用組織内におけるセキュアなネットワーク10を介し、ユーザ端末200、および、調査対象システム300と、通信可能に結ばれている。
The failure
このうちユーザ端末200は、上述のシステム部門やベンダー等における、障害影響調査業務の担当者が操作する情報処理装置となる。また、調査対象システム300は、金融機関等における業務システムを想定する。この調査対象システム300である業務システムとしては、特に限定しない。
−−−ハードウェア構成−−−
Among these, the
--- Hardware configuration ---
また、本実施形態の障害影響調査装置100のハードウェア構成は以下の如くとなる。図2は、本実施形態における障害影響調査装置100のハードウェア構成例を示す図である。
Further, the hardware configuration of the failure
障害影響調査装置100は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される記憶装置101、RAMなど揮発性記憶素子で構成されるメモリ103、記憶装置101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算装置104、および、ネットワーク10と接続してユーザ端末200や調査対象システム300などの他装置との通信処理を担う通信装置105、を備える。
The failure
なお、本実施形態の障害対応支援装置100は、必要に応じて、ユーザからのキー入力や音声入力を受け付ける入力装置、処理データの表示を行うディスプレイ等の出力装置、を更に備えるとしてもよい。
Note that the
また、記憶装置101内には、本実施形態の障害影響調査装置100として必要な機能を実装する為のプログラム102に加えて、階層構造情報125、接続情報126、保留・保留解除情報127、稼働ログ128、イベント送信ファイル129、および、イベント受信ファイル130、が少なくとも記憶されている。これら各情報等の詳細については後述する。また、本実施形態の障害影響調査装置100は、障害影響調査方法を実行して取得した障害影響範囲の情報150を、メモリ103に保持し、その後のユーザ指示に応じて行う表示処理のソースとする。
−−−ジョブの階層構造について−−−
ここで、本実施形態におけるジョブの階層構造の概念について説明する。図3〜図5に、それぞれ本実施形態におけるジョブの階層構造例の概念を示す。
Further, in the
--- About the hierarchical structure of jobs ---
Here, the concept of the hierarchical structure of jobs in this embodiment will be described. 3 to 5 show the concept of an example of the job hierarchy structure in this embodiment.
まず図3で例示するように、当該階層構造においては、例えば、当該業務のスケジューラーサービス(例:サーバ単位)に対応したルートジョブグループを最上位階層としている。 First, as illustrated in FIG. 3, in the hierarchical structure, for example, a root job group corresponding to a scheduler service (for example, a server unit) of the business is set as the highest hierarchy.
また、このルートジョブグループは、複数のジョブグループ1を配下の階層に包含している。このジョブグループ1は、外国為替や預金など業務システムごとに設けたもので、その値は、例えば、システムID+業務システム名、といったものになる。
The root job group includes a plurality of
また、ジョブグループ1は、複数のジョブグループ2を配下の階層に包含している。このジョブグループ2は、バッチジョブ実行のカレンダー種別ごとに設けたもので、その値は、例えば、T−定例、U−不定期、などといったものになる。
The
また、ジョブグループ2は、複数のルートジョブネットを配下の階層に包含している。このルートジョブネットは、外国送金や預金残高管理などといった業務区分ごとに設けたもので、その値は、例えば、システムID+カレンダー種別+業務区分+通番、といったものになる。
The
また、ネストジョブネットは、複数のジョブを配下の階層に包含している。このネストジョブネットは、例えば、所定プログラムの実行、実行結果の分類と送信、といった一連のジョブを実行することで果たすべく機能にごとに設けたもので、その値は、例えば、ルートジョブネットの値+作業周期+通番、といったものになる。 A nested job net includes a plurality of jobs in a subordinate hierarchy. This nested job net is provided for each function to be executed by executing a series of jobs such as execution of a predetermined program, classification and transmission of execution results, and the value is, for example, the value of the root job net Value + work cycle + serial number.
また、ジョブは、当該階層構造における最下層に位置する、すなわち末端の構成要素で
あり、例えば、所定プログラムの実行、実行結果の分類と送信、といった単位機能ごとに設けたもので、その値は、例えば、ネストジョブネットの値+通番、といったものになる。
A job is a component at the bottom of the hierarchical structure, that is, a terminal component. For example, a job is provided for each unit function such as execution of a predetermined program, classification and transmission of an execution result, and its value is For example, the value of the nested job net + the serial number.
こうした階層構造のうち、ジョブとネストジョブネット、ネストジョブネットとルートジョブネットの関係例を視覚的に示した場合、図4に示すごとき構成となる。 In such a hierarchical structure, when a relationship example between a job and a nested job net and a nested job net and a root job net is shown visually, the configuration is as shown in FIG.
このように、ネストジョブネットは、最小の処理単位であるジョブの連なりから構成されている。また、ネストジョブネット同士は、その処理結果を互いの入出力として連携する構成となっている。更には、こうして連携するネストジョブネットを包含するのがルートジョブネットである。 Thus, a nested job net is composed of a series of jobs that are the minimum processing unit. In addition, the nested job nets are configured to link the processing results as input / output of each other. Furthermore, the root job net includes the nested job nets that cooperate in this way.
なお、この図4で示したように、ネストジョブネットに所属するジョブは、当該ネストジョブネット内でこそ一連のジョブとして、ジョブ同士での入出力関係に応じた接続関係も規定されている。また、ネストジョブネット同士も、互いに入出力関係が存在する場合、ネストジョブネット間の接続関係も存在する。ところが、そうした接続関係の既存規定のみを踏まえた場合、例えば、図4中の「ネストジョブネットA」の「ジョブ5」と、「ネストジョブネットB」の「ジョブ6」とは、接続関係が存在しない。
As shown in FIG. 4, the jobs belonging to the nested job net are defined as a series of jobs within the nested job net, and the connection relationship according to the input / output relationship between the jobs is also defined. Further, when the nested job nets also have an input / output relationship with each other, there is also a connection relationship between the nested job nets. However, when considering only the existing provisions of such connection relationship, for example, “
一方、「ネストジョブネットA」の「ジョブ5」でアベンドが発生した場合、その影響は、所属先の「ネストジョブネットA」の処理結果に当然波及し、それは入出力関係を有する「ネストジョブネットB」の「ジョブ6」(ネストジョブネットAの出力を入力とする)にも及んでくる。つまり、既存の接続関係の規定を踏まえているだけでは、アベンド発生対象のジョブから波及する障害影響の範囲を網羅的に特定することはできない。
On the other hand, if an abend occurs in “
そこで本実施形態では、図5で例示するように、ネストジョブネットにおいて他ネストジョブネットからのデータ入力を受ける仮想的なジョブに対応したプレノードと、他ネストジョブネットへのデータ出力を行う仮想的なジョブに対応したポストノード、の各情報を、各ネストジョブネットに関して設定・保持するものとしている。 Therefore, in this embodiment, as illustrated in FIG. 5, a pre-node corresponding to a virtual job that receives data input from another nested job net in the nested job net and a virtual that performs data output to the other nested job net. Each post node corresponding to a simple job is set and held for each nested job net.
図5で示す例では、「ネストジョブネットA」に所属する「ジョブ1」〜「ジョブ5」のそれぞれが、プレノード50およびポストノード51のそれぞれと接続関係を有するよう規定している。
In the example shown in FIG. 5, it is defined that each of “
こうした概念を導入した場合、「ネストジョブネットA」の「ジョブ5」でアベンドが発生した場合、その影響は、所属先の「ネストジョブネットA」の出力処理に対応する仮のポストノード51を介し、「ネストジョブネットB」における入力処理に対応した仮のプレノード50に及ぶことが、接続関係の規定の上からも特定できる。
When such a concept is introduced and an abend occurs in “
つまり、こうしたプレノード50、ポストノード51を付加した接続関係の規定を踏まえることにより、従来では特定漏れとなりかねなかった範囲についても、障害影響の範囲を網羅的に特定することができる。
−−−データ構造例−−−
続いて、本実施形態の障害影響調査装置100が用いるテーブル類について説明する。図6Aに、本実施形態における階層構造情報125の一例を示す。
本実施形態の階層構造情報125は、上述の図3〜5で既に示した階層構造に関する情報を格納した情報である。
In other words, by taking into account the provisions of the connection relationship to which the pre-node 50 and the post-node 51 are added, it is possible to comprehensively specify the range of failure influences even in a range that could have been specified in the past.
--- Data structure example ---
Next, tables used by the failure
The
そのデータ構造は、「外為」といった業務システムに対応したジョブグループ1の値(例えば、F:外為)から、これにカレンダー種別の値を加えたジョブグループ2(例えば、
F:外為業務/T:定例)、更にこれに業務区分とその通番といった値を加えたルートジョブネット(例えば、F:外為業務/T:定例/F-TA)、これに作業周期等の値を加えたネストジ
ョブネット(例えば、F:外為業務/T:定例/F-TA1/F-TA1)、および、ジョブ(例えば、F:外為業務/T:定例/F-TA1/F-TA1-W01/F-TA1-W0101)、といった各値を、「/」を階層区切りとして順次付加したレコードの集合体である。
Its data structure is the value of job group 2 (for example, F: forex) corresponding to a business system such as “foreign exchange”, plus the value of the calendar type to job group 2 (for example, forex).
F: Forex Work / T: Regular), and root job net (for example, F: Forex Work / T: Regular / F-TA), plus values such as work classification and serial number, and values such as work cycle Nested job net (for example, F: Forex Work / T: Regular / F-TA1 / F-TA1) and Job (for example, F: Forex Work / T: Regular / F-TA1 / F-TA1- W01 / F-TA1-W0101) is a set of records in which each value such as “/” is sequentially added with a hierarchy delimiter.
また図6Bに、本実施形態の接続情報126のデータ構成例を示す。本実施形態の接続情報126は、上述の階層構造において、互いに入出力関係を有する構成要素に関して、その接続関係を規定した情報である。
FIG. 6B shows a data configuration example of the
そのデータ構造は、例えば、入出力関係を有したジョブ同士やネストジョブネット同士を、カンマ区切りで列挙し、その接続条件の値(例えば、入出力の実行すなわち接続に関して条件が存在する“c”:条件接続、入出力の実行すなわち接続に関して条件が存在しない“s”:順接続)を末尾に付与したデータの集合体である。 The data structure is, for example, a list of jobs having input / output relationships or nested job nets separated by commas, and values of connection conditions (for example, “c” where there is a condition regarding execution of input / output, ie, connection. : Conditional connection, execution of input / output, that is, a collection of data with “s”: forward connection) in which no condition exists for the connection added at the end.
また図6Cに、本実施形態の保留・保留解除情報127のデータ構成例を示す。本実施形態の保留・保留解除情報127は、上述の接続情報126で条件付きの接続となっているジョブやネストジョブネットといった構成要素に関して、その条件に関して規定した情報である。
FIG. 6C shows a data configuration example of the hold /
その規定は、例えば、入力データのリソースとなる或いは実行に際して障害となるジョブやネストジョブネットの処理や稼働の状況ないし結果が所定のものとなるまで実行を待機する場合の「保留」、そうしたジョブやネストジョブネットの処理や稼働の状況ないし結果が所定のものとなった場合に実行を開始する場合の「保留解除」、といったものとなる。そしてこうした規定を、当該関係を有するジョブやネストジョブネットに関して付与したデータが、保留・保留解除情報127となる。
For example, a job that becomes a resource of input data, or a job that becomes an obstacle to execution or processing of a nested job net, the status of operation, or “hold” when waiting for execution until the result becomes a predetermined one, such a job And “Non-hold release” when starting execution when the processing or operation status or result of a nested job net becomes a predetermined one. Then, the data to which such a rule is given with respect to the job or the nested job net having the relationship becomes the hold /
また図6Dに、本実施形態の稼働ログ128のデータ構成例を示す。本実施形態の稼働ログ128は、各ジョブが実際に実行された日時の情報を蓄積したテーブルである。
そのデータ構造は、実行日時をキーとして、その際の実行対象のジョブやネストジョブネット等の構成要素の値を対応付けたデータの集合体である。
FIG. 6D shows a data configuration example of the operation log 128 of this embodiment. The
The data structure is a collection of data in which execution date and time are used as keys and values of components such as a job to be executed and a nested job net are associated with each other.
また図6Eに、本実施形態のイベント送信ファイル129のデータ構成例を示す。本実施形態のイベント送信ファイル129は、ジョブやネストジョブネットが、所定処理を実行して他のジョブやネストジョブネットに処理結果を送信したイベント、に関する情報を蓄積したファイルである。そのデータ構造は、送信元と送信先の各ジョブやネストジョブネットの値と、イベントを一意に特定するIDとを対応付けたデータの集合体である。
FIG. 6E shows a data configuration example of the
また図6Fに、本実施形態のイベント受信ファイル130のデータ構成例を示す。本実施形態のイベント受信ファイル130は、ジョブやネストジョブネットが、所定処理を実行した他のジョブやネストジョブネットからその処理結果を受信したイベント、に関する情報を蓄積したファイルである。そのデータ構造は、送信元と送信先の各ジョブやネストジョブネットの値と、イベントを一意に特定するIDとを対応付けたデータの集合体である。
−−−フロー例1−−−
FIG. 6F shows a data configuration example of the
--- Flow example 1 ---
以下、本実施形態における障害影響調査方法の実際手順について図に基づき説明する。以下で説明する障害影響調査方法に対応する各種動作は、障害影響調査装置100がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
Hereinafter, the actual procedure of the failure effect investigation method in the present embodiment will be described with reference to the drawings. Various operations corresponding to the failure impact investigation method described below are realized by a program that the failure
図7は、本実施形態における障害影響調査方法のフロー例1を示す図である。ここではまず、障害影響調査装置100は、アベンド発生対象のジョブ(ないしネストジョブネットやルートジョブネット)に関する指定を、ユーザ端末200から受け付ける(s100)。 具体的には、例えば、障害影響調査装置100がユーザ端末200に配信し表示させている、ツール画面1000(図11)における、指定ノード欄1001などでジョブやネストジョブネット、ルートジョブネットのIDを受け付ける状況を想定できる。
FIG. 7 is a diagram showing a flow example 1 of the failure influence investigation method in the present embodiment. Here, first, the failure
図11のツール画面1000の例では、上述の指定ノード欄1001の他、ジョブグループ1、ジョブグループ2、ルートジョブネット、ネストジョブネット、および、ジョブ、の各階層において、当該構成要素のIDを一覧から選択するインターフェイス1004、でユーザ端末200からアベンド発生対象のジョブの指定を受け付ける。
In the example of the
また、障害影響調査装置100は、s100で受けた指定ノードがルートジョブネット、ネストジョブネットの場合に、接続情報126における当該ルートジョブネット、ネストジョブネットの値に関して、プレノードを示す「Pre」の値を付与する(s101)。なお、ここでは説明の便宜上、s100で指定を受け付けたジョブやネストジョブネット等を、当該ジョブらとその接続関係をグラフ理論で表現した場合に対応する「ノード」と称している。
In addition, when the designated node received in s100 is a root job net or a nested job net, the failure
続いて、障害影響調査装置100は、上述のs100で指定を受けた、アベンド発生対象のジョブ等を起点にした、障害影響範囲に含まれるジョブやネストジョブネット等の情報を格納する、例えばジョブリスト配列(例:値の格納欄を複数有するデータ格納用のファイル)をメモリ103に作成する(s102)。また、このジョブリスト配列に、s100で指定を受けたアベンド発生対象のジョブ等の情報を格納する。
Subsequently, the failure
また、障害影響調査装置100は、接続情報126において、上述のs100で指定を受けたアベンド発生対象に関するものを、当該ジョブ等のIDをキーに検索し、当該検索で特定できた構成要素、すなわちアベンド発生対象と入出力関係を有するジョブ等の構成要素の情報を、後続ジョブのジョブとして上述のジョブリスト配列に格納する(s104)。
Further, the failure
この場合、本実施形態の接続情報126によれば、ネストジョブネットに所属する一連のジョブと、当該ネストジョブネットと入出力関係を有する他ネストジョブネットとの接続関係も、プレノード50およびポストノード51を介して特定できる。
In this case, according to the
ネストジョブネットに所属する各ジョブは、当該ネストジョブネットにおけるプレノード50およびポストノード51に、全て接続された規定となっているため、接続情報126において、各構成要素の間の接続規定を辿ることで、自ずとネストジョブネットを跨がった関係も特定できる。こうした点は、業務システムを跨がった、すなわちジョブグループを跨がる場合や、他ベンダーや他システムとの間を跨がる場合に関しても、接続情報126において規定が存在する以上、同様に後続ジョブを特定できることとなる。
また、障害影響調査装置100は、上述の後続ジョブがすでにジョブリスト配列に存在するか判定する(s105)。
Each job belonging to the nested job net is defined to be connected to all of the pre-node 50 and post-node 51 in the nested job net. Therefore, the
In addition, the failure
上述の判定の結果、上述の後続ジョブがすでにジョブリスト配列に存在する場合(s105:Yes)、障害影響調査装置100は、当該後続ジョブをジョブリスト配列に追加せず(s106)、処理をs108に遷移させる。
As a result of the determination, if the subsequent job already exists in the job list array (s105: Yes), the failure
一方、上述の判定の結果、上述の後続ジョブがジョブリスト配列に存在しない場合(s
105:No)、障害影響調査装置100は、後続ジョブをジョブリスト配列に追加し(s107)、処理をs108に遷移させる。
On the other hand, as a result of the determination described above, if the subsequent job does not exist in the job list array (s
105: No), the failure
また、障害影響調査装置100は、接続情報126における全レコードに関してs104〜s107を実行したか判定するなどして、ジョブリスト配列の終わりか判定する(s108)。
上述の判定の結果、ジョブリスト配列の終わりではないと判定した場合(s108:No)、障害影響調査装置100は、処理をs104に戻す。
Further, the failure
As a result of the above determination, when it is determined that it is not the end of the job list array (s108: No), the failure
他方、上述の判定の結果、ジョブリスト配列の終わりと判定した場合(s108:Yes)、障害影響調査装置100は、当該ジョブリスト配列を障害影響範囲の情報150として、例えば、メモリ103に格納し(s109)、処理を終了する。
On the other hand, as a result of the above determination, when it is determined that the end of the job list array is reached (s108: Yes), the failure
この障害影響範囲の情報150は、階層構造125に規定されたジョブやネストジョブネット、等のうち、アベンド発生対象を起点に、接続情報126にて規定が存在する、すなわち入出力関係が存在するジョブやネストジョブネット等を順次特定した結果であり、こうしたジョブ等の連なりを示すものとなる。そのデータ構造としては接続情報126と同様である。
−−−フロー例2−−−
The failure influence range information 150 is defined in the
--- Flow example 2 ---
また図8は、本実施形態における障害影響調査方法のフロー例2を示す図である。ここでは、上述のプレノード50およびポストノード51の生成処理について具体的に説明する。 Moreover, FIG. 8 is a figure which shows the example 2 of a flow of the failure influence investigation method in this embodiment. Here, the generation process of the pre-node 50 and the post-node 51 described above will be specifically described.
この場合、障害影響調査装置100は、上述のフロー例1で得たジョブリスト配列からジョブリスト、すなわち障害影響範囲に含まれるジョブ等の情報を読み込み(s200)、そこから1レコードを読み取る(s201)。この1レコードは、ジョブの階層構造におけるジョブやネストジョブネットを示すIDとなっている。
In this case, the failure
続いて、障害影響調査装置100は、s201で得たレコードにおける「/」の数、すなわちジョブの階層構造における階層の深さをカウントし、その値が例えば、5であるか否かにより、当該レコードが示すものがジョブかネストジョブネットか判定する(s202)。
Subsequently, the failure
上述の判定の結果、「/」の数が「5」ではなかった場合、当該レコードがネストジョブネットであることが判明した場合(s202:ネストジョブ)、障害影響調査装置100は、当該レコードが示す値すなわちフルパス(例えば、/F:/T/F-TA1/F-TA1-W01)より
ルートジョブネットのID(システムID+カレンダー種別+業務区分+通番であり、例えば、/F:/T/F-TA1)を取得する(s203)。
If the number of “/” is not “5” as a result of the determination described above, and it is determined that the record is a nested job net (s202: nested job), the failure
この場合、障害影響調査装置100は、上述のレコードが示すネストジョブネットの入力となる、すなわち先行ジョブとして、「ルートジョブネットのID+/Pre」をIDとす
るプレノード50Aを生成する。また、障害影響調査装置100は、当該プレノード50の出力先となる、すなわち後続ジョブとして、「自身のネストジョブネットのID+/Pre
」をIDとするプレノード50Bを生成する(s204)。ここで生成したプレノードらに関しては、その情報を接続情報126に格納する。
In this case, the failure
Is generated as an ID (s204). The pre-nodes generated here are stored in the
また、障害影響調査装置100は、自身の出力端となるポストノードであって、ルートジョブネットに対するたる先行ジョブとして、「自身のネストジョブネットのID+/Post」をIDとするポストノード51Aを生成する。また、障害影響調査装置100は、当該
ポストノード51Aの出力先となる、すなわち後続ジョブとして、「ルートジョブネットのID+/Post」をIDとするポストノード51Bを生成する(s205)。ここで生成したポストノードらに関しては、その情報を接続情報126に格納する。
Further, the failure
他方、上述の判定の結果、「/」の数が「5」であった場合、当該レコードがジョブであることが判明した場合(s202:ジョブ)、障害影響調査装置100は、当該レコードが示す値すなわちフルパス(例えば、/F:/T/F-TA1/F-TA1-W0101)よりネストジョブネ
ットのID(ルートジョブネットID+作業周期+通番であり、例えば、/F:/T/F-TA1-W01)を取得する(s206)。
On the other hand, if the number of “/” is “5” as a result of the determination described above, and it is determined that the record is a job (s202: job), the failure
この場合、障害影響調査装置100は、当該ジョブの入力となる、すなわち先行ジョブとして、当該ジョブの所属先であるネストジョブネット「ネストジョブネットのID+/Pre」をIDとするプレノード50Cを生成する。また、障害影響調査装置100は、当該プレノード50Cの出力先となる、すなわち後続ジョブとして、「自身のジョブID+/Pre」をIDとするプレノード50Dを生成する(s207)。
In this case, the failure
また、障害影響調査装置100は、自身の出力端となるポストノードであって、ネストジョブネットに対するたる先行ジョブとして、「自身のジョブID+/Post」をIDとするポストノード51Cを生成する。また、障害影響調査装置100は、当該ポストノード51Cの出力先となる、すなわち後続ジョブとして、「ネストジョブネットのID+/Post」をIDとするポストノード51Dを生成する(s208)。ここで生成したポストノードらに関しては、その情報を接続情報126に格納する。
Also, the failure
続いて、障害影響調査装置100は、s200で得たジョブリストの全てのレコードに関してs201〜s208を実行済みかチェックすることで、ジョブリスト終わりを判定する(s209)。
上述の判定の結果、ジョブリスト終わりではなかった場合(s209:No)、障害影響調査装置100は、処理をs201に戻す。
他方、上述の判定の結果、ジョブリスト終わりであった場合(s209:Yes)、障害影響調査装置100は、処理を終了する。
−−−フロー例3−−−
Subsequently, the failure
As a result of the above determination, if the job list is not over (s209: No), the failure
On the other hand, if the result of the determination is that the job list is over (s209: Yes), the failure
--- Flow example 3 ---
また図9は、本実施形態における障害影響調査方法のフロー例3を示す図である。ここでは、上述の階層構造におけるルートジョブグループの各間やジョブグループ1の各間など、システム間での障害影響範囲(サーバを跨ぐ障害影響範囲)を特定するに際し、当該システム間でのイベントに伴い生じた送受信の履歴に基づき、その接続関係を抽出する処理について説明する。こうした処理を行って接続情報126の精度を高めておくことで、業務システムやサーバ装置自体、すなわちコンポーネントを跨ぐシステム間の接続関係に基づく、精度良好で網羅的な障害影響範囲の特定が可能となる。
Moreover, FIG. 9 is a figure which shows the example 3 of a flow of the failure influence investigation method in this embodiment. Here, when specifying the failure impact range between systems (failure impact range across servers) such as between root job groups or between
この場合、障害影響調査装置100は、イベント送信ファイル129を読み込む(s300)。また、障害影響調査装置100は、イベント受信ファイル130を読み込む(s301)。
In this case, the failure
これらイベント送信ファイル129およびイベント受信ファイル130は、ジョブやネストジョブネットが、所定処理を実行して他のジョブやネストジョブネットに処理結果を送信したイベント、或いは他のジョブやネストジョブネットから処理結果を受信したイベント、に関する情報を格納したファイルである(図6E、図6F)。
The
続いて、障害影響調査装置100は、イベント送信ファイルから1レコードを読み取り
(s302)、それがイベント送信ジョブか判定する(s303)。この判定は、例えば、イベントID(図6Eの場合、例えば“iv01”)が特定の値(例:“01”)を含む場合に、イベント送信ジョブと判定する、といったものを想定する。こうした判定手法はイベント受信ジョブか否かの判定に関しても同様である。
上述の判定の結果、当該レコードがイベント送信ジョブでなかった場合(s303:No)、障害影響調査装置100は、処理をs309に遷移させる。
Subsequently, the failure
As a result of the above determination, when the record is not an event transmission job (s303: No), the failure
他方、上述の判定の結果、当該レコードがイベント送信ジョブである場合(s303:Yes)、障害影響調査装置100は、イベント受信ファイルから1レコードを読取り(s304)、それがイベント受信ジョブか判定する(s305)。
上述の判定の結果、当該レコードがイベント受信ジョブでなかった場合(s305:No)、障害影響調査装置100は、処理をs308に遷移させる。
On the other hand, if the record is an event transmission job as a result of the above determination (s303: Yes), the failure
As a result of the above determination, when the record is not an event reception job (s305: No), the failure
他方、上述の判定の結果、当該レコードがイベント受信ジョブである場合(s305:Yes)、障害影響調査装置100は、s302およびs304でそれぞれ読み取ったイベント送信ジョブ、イベント受信ジョブ、のレコードそれぞれが示すイベントIDが一致するか判定する(s306)。
上述の判定の結果、イベントIDが一致しなかった場合(s306:No)、障害影響調査装置100は、処理をs308に遷移させる。
On the other hand, if the record is an event reception job as a result of the above determination (s305: Yes), the failure
As a result of the above determination, when the event IDs do not match (s306: No), the failure
他方、上述の判定の結果、イベントIDが一致した場合(s306:Yes)、障害影響調査装置100は、イベント送信ファイル129の該当レコードが示す送信主体(ジョブやネストジョブネットなど)を先行ジョブ、イベント受信ファイル130の当該レコードが示す受信主体(ジョブやネストジョブネットなど)を後続ジョブ、として、この先行ジョブおよび後続ジョブの各ジョブのIDのセットを含むレコードを生成し、接続情報126に格納する(s307)。
続いて、障害影響調査装置100は、イベント受信ファイル130における全レコードについて、上述のs304〜s307を終えたか判定する(s308)。
On the other hand, if the event IDs match as a result of the above determination (s306: Yes), the failure
Subsequently, the failure
上述の判定の結果、イベント受信ファイル130における全レコードについて、上述のs304〜s307を終えていない場合(s308:No)、障害影響調査装置100は、処理をs304に戻す。
As a result of the above determination, when the above-described s304 to s307 are not finished for all records in the event reception file 130 (s308: No), the failure
他方、上述の判定の結果、イベント受信ファイル130における全レコードについて、上述のs304〜s307を終えた場合(s308:Yes)、障害影響調査装置100は、イベント送信ファイル129における全レコードについて、上述のs302〜s307を終えた判定する(s309)。
On the other hand, as a result of the determination described above, when the above-described s304 to s307 are finished for all the records in the event reception file 130 (s308: Yes), the failure
上述の判定の結果、イベント送信ファイル129における全レコードについて、上述のs302〜s307を終えていない場合(s309:No)、障害影響調査装置100は、処理をs302に戻す。
As a result of the above determination, when all the records in the
他方、上述の判定の結果、イベント送信ファイル129における全レコードについて、上述のs302〜s307を終えている場合(s309:Yes)、障害影響調査装置100は、処理を終了する。
−−−フロー例4、5−−−
On the other hand, as a result of the above-described determination, when the above-described s302 to s307 are completed for all the records in the event transmission file 129 (s309: Yes), the failure
--- Flow example 4, 5 ---
また図10Aは、本実施形態における障害影響調査方法のフロー例4を示す図であり、図10Bは、本実施形態における障害影響調査方法のフロー例5を示す図である。 FIG. 10A is a diagram illustrating a flow example 4 of the failure impact investigation method in the present embodiment, and FIG. 10B is a diagram illustrating a flow example 5 of the failure impact investigation method in the present embodiment.
本実施形態の障害影響調査装置100は、メモリ103に保持した障害影響範囲の情報150を、ユーザ所望の形態でユーザ端末200に表示させることが可能である。
The failure
この場合、障害影響調査装置100は、ツール画面1000(図11)をユーザ端末200に配信し、当該ツール画面1000のインターフェイス1003で、表示形態についてのユーザ指定を受け付ける(s400)。
In this case, the failure
このユーザ指定の例としては、まずは前方検索と後方検索のいずれかの探索結果に関するものとするかの指定と、更には、それをグラフ、リスト、および、ジョブフロー、のいずれかの形態とするかの指定と、を少なくとも含む。それぞれの指定を受け付けるため、画面1000は、インターフェイス1003、10031を備えている。
As an example of the user designation, first, it is designated whether the search result is one of the forward search and the backward search, and further, it is in any form of a graph, a list, and a job flow. And at least. In order to accept each designation, the
なお、前方検索および後方検索は、アベンドの発生対象となったジョブを起点に、入出力関係における上流側に向けたものを前方検索とし、入出力関係における下流側に向けたものを後方検索としている。 In the forward search and backward search, starting from the job for which the abend is generated, the forward search is for the upstream in the input / output relationship, and the backward search is for the downstream in the input / output relationship. Yes.
続いて、障害影響調査装置100は、s400で受けたユーザ指定が、ジョブフローであった場合(s401:ジョブフロー)、少なくとも障害影響範囲の情報150に属するジョブおよびジョブネットの各々をノードとし、当該ノードの各間のうち接続情報126で入出力関係が規定されているものに関し、当該接続情報126のレコードが示す値に基づいてエッジで接続した有向グラフを生成し(s402)、これをユーザ端末200に返信して表示させ(s405)、処理を終了する。
Next, when the user designation received in s400 is a job flow (s401: job flow), the failure
こうして生成した有向グラフの例を図12、図13にて示す。図12の表示画面1100における有向グラフでは、ジョブグループ1の各構成要素をノード1110、1120とし、その間のうち入出力関係があるものを接続情報126で特定し、エッジ1130で接続したものとなっている。障害影響調査装置100は、当然ながら、こうしたノードやエッジに対応した描画オブジェクトのデータを記憶装置101に予め保持し、適宜に読み出して利用できるものとする。また、この有向グラフでは、アベンド発生対象のジョブがジョブグラフ1の「外為」に含まれていることを示している。この業務システム「外為」から障害影響が波及している範囲は、エッジで直接結ばれた「融資」を中継点として、「ローン」や「公共債」など5つの業務システムに及んでいることが認識できる。
Examples of the directed graph generated in this way are shown in FIGS. In the directed graph on the
また、この表示画面1100において、例えば、アベンド発生対象の「外為」ノードに対して、ユーザ端末200にてダブルクリックなど所定動作が行われたとする。この場合、障害影響調査装置100は、その業務システム「外為」における、例えば、ルートジョブネット「F−TA1」配下のネストジョブネットをノード1210として、これらネストジョブネットのノード1210を、接続情報126が示す値に基づいてエッジ1220で接続した有向グラフ1202を生成し、これを含む画面(図13)をユーザ端末200に配信するとすれば好適である。
Further, on the
この図13で示す有向グラフ1202では、ノード1210の各間の接続関係に関する条件となる、保留・保留解除情報127に基づく情報も表示内容に含めている。この保留・保留解除情報127は、上述の接続情報126で条件付きの接続となっているジョブやネストジョブネットといった構成要素に関して、その条件に関して規定した情報である。
In the directed
具体的には、例えば、入力データのリソースとなる或いは実行に際して障害となるジョブやネストジョブネットの処理や稼働の状況ないし結果が所定のものとなるまで実行を待機する場合の「保留」、そうしたジョブやネストジョブネットの処理や稼働の状況ないし結果が所定のものとなった場合に実行を開始する場合の「保留解除」、といったものとな
る。
Specifically, for example, “pending” when waiting for execution until the processing or operation status or result of a job or nested job net that becomes a resource of input data or becomes an obstacle in execution becomes predetermined. For example, “hold release” for starting execution when the processing or operation status or result of a job or nested job net becomes a predetermined one.
図13で示す例の場合、例えば、ノード1210は、「F-TA1-W11 OL閉局_公共債#1」なる情報が表示されている。これは、「F-TA1-W11」なるネストジョブネットが「OL閉局_公共債#1」すなわちジョブグループ1「公共債」の「#1」に関してオンライン閉局し
た場合に稼働する、といった条件を示している。
In the case of the example illustrated in FIG. 13, for example, the
また図13で示す有向グラフ1202では、ノード1210に対応したネストジョブネットの稼働タイミングに関する情報も表示内容に含めている。この稼働タイミングに関する情報は、稼働ログ128において、当該ネストジョブネットに関して既に得られている過去の稼働時期のうち、例えば、稼働頻度最大の時期を示す情報であって、例えば24時間制で規定した時刻値(例:“5.4”であれば、午前5時24分)である。
In the directed
一方、上述のs400で受けたユーザ指定が、リスト表示であった場合(s401:リスト)、少なくとも障害影響範囲の情報150に属するジョブの各ID(フルパス)を抽出し、これを例えばジョブグループ1、ジョブグループ2、ルートジョブネット、ネストジョブネット、およびジョブ、の各単位で分類したリスト1400(図15)を生成し(s403)、これをユーザ端末200に返信して表示させ(s405)、処理を終了する。
On the other hand, if the user designation received in s400 is a list display (s401: list), at least each ID (full path) of the job belonging to the failure influence range information 150 is extracted, for example, job group 1 A list 1400 (FIG. 15) classified in units of
このリスト1400は、図15で例示するように、上述の各単位に属するノード数の一
覧の他、「depth」、「重要度カウント」、といった値についても含んでいる。このうち
「depth」は、インターフェイス1420でユーザが指定した値に対応して障害影響調査
装置100がカウントした値である。「depth」とは、アベンド発生対象のジョブとの距
離(ホップ数)を示しており、「0」であればアベンド発生対象のジョブ自身のみ、「1」であれば アベンド発生対象のジョブとエッジで直接結ばれたジョブ、といったものになる。
また、「重要度カウント」は、予めジョブごとに知見あるものが定めた重要度に関して、対応するものの数をカウントした値となる。
As illustrated in FIG. 15, the
The “importance level count” is a value obtained by counting the number of corresponding levels of importance determined in advance for each job.
他方、上述のs400で受けたユーザ指定が、グラフ表示であった場合(s401:グラフ)、少なくとも障害影響範囲の情報150に属するジョブないしジョブネットの数を例えば業務単位ごとに集計・表示したグラフ1300を生成し(s404)、これをユーザ端末200に返信して表示させ(s405)、処理を終了する。
On the other hand, when the user designation received in s400 is a graph display (s401: graph), a graph in which the number of jobs or job nets belonging to at least the failure-affected range information 150 is tabulated and displayed for each business unit, for example. 1300 is generated (s404), and this is returned to the
こうして生成したグラフの表示画面1300の例を図14で示す。この表示画面1300は、基準時刻1301、基準時刻からの経過時間1302、重要度Aまでの残り1303、および、グラフ表示領域1304、を含んでいる。
An example of the
このうちグラフ表示領域1304では、障害影響範囲の情報150が示すジョブのうち、各業務システムに含まれるものの数を縦軸に、業務システムを横軸に配置したグラフを生成・表示している。
Among these, the
また、基準時刻1301の値は、アベンド発生時刻を示す。また、基準時刻からの経過時間1302は、ユーザが基準時刻からの時間経過と共に障害影響範囲が変遷する様子を確認したい経過時間、を指定するインターフェイスである。このインターフェイスでの指定値が「0」であればアベンド発生時刻、「1」であれば、アベンド発生時刻から1時間経過後、となる。
Further, the value of the
また、重要度A発生までの残り1303は、アベンド発生対象のジョブから、その障害
影響が及ぶ重要度Aのジョブの稼働タイミングまでの残り時間を示している。よって、各ジョブのうち少なくとも「重要度A」とされる重要なジョブに関しては、その情報が階層構造情報125や接続情報126など適宜な情報にて付与されている。また各情報の稼働タイミングは、稼働ログ128が当該ジョブ等について示す、稼働頻度最大の時刻である。
The remaining 1303 until the occurrence of importance A indicates the remaining time from the abend generation target job to the operation timing of the job of importance A that is affected by the failure. Therefore, at least an important job having “importance A” among the jobs is given as appropriate information such as
よって、図10Bのフローに示すように、インターフェイス1302でユーザが経過時間の指定を変更すれば(s500)、障害影響調査装置100はこれに応じて、障害影響範囲を再び特定することになる。この場合、障害影響調査装置100は、アベンドの発生対象となったジョブを起点に、当該アベンドの発生時を基準時刻とし、インターフェイス1302で指定された経過時間までの時間帯(例:午前0時〜午前2時)に、稼働タイミングが含まれ、かつ、接続情報126および保留・保留解除情報127が示す待機ないし実行の契機に応じて、上述の時間帯(例:午前0時〜午前2時)に稼働が推測されるもの(例えば、当該時間帯に稼働タイミングが含まれる或るジョブを入力とすべく保留、すなわち待機しており、自身の稼働タイミングも当該時間帯に含まれる或るジョブ)を特定する(s501)。
Therefore, as shown in the flow of FIG. 10B, when the user changes the designation of the elapsed time through the interface 1302 (s500), the failure
また、障害影響調査装置100は、こうして特定したジョブ(およびジョブネット)に関して、上述のグラフを生成し(s502)、これをユーザ端末200に表示させることとなる(s503)。つまり、インターフェイス1302での指定を受けるごとに、障害影響範囲の特定とグラフの再生成、再表示を実行することになる。
Further, the failure
ここでは、インターフェイス1302での経過時間の指定を受けることに応じ、グラフの生成を行う場合について示したが、こうした処理は、障害影響範囲の特定を伴う、有向グラフおよびリストの生成、表示に関しても同様に実行する。
Here, the case where the graph is generated in response to the specification of the elapsed time in the
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。 Although the best mode for carrying out the present invention has been specifically described above, the present invention is not limited to this, and various modifications can be made without departing from the scope of the invention.
こうした本実施形態によれば、バッチジョブにおける障害発生時に、その影響範囲について、業務やベンダを跨ったシステム全体で網羅的に特定し、これをユーザのニーズに応じてダイナミックに表示することとなる。この場合、従来必要であった影響調査に要する時間、コストが低減され、また、ユーザが障害影響範囲を漏れなく認識しうるため、障害対応も迅速化することが期待される。このことは、当該業務を行う事業者等にとって、関連業務への影響を最小限に抑制し、業務効率向上や顧客対応の成否にもつながる。
すなわち、バッチジョブにおける障害影響調査を網羅的かつ効率的なものとし、また、その調査結果をニーズに即して好適に提示可能となる。
According to this embodiment, when a failure occurs in a batch job, the influence range is comprehensively specified in the entire system across business and vendors, and this is dynamically displayed according to the user's needs. . In this case, the time and cost required for the impact investigation, which has been necessary in the past, can be reduced, and the user can recognize the failure influence range without omission, so that it is expected that the failure response will be accelerated. For business operators who perform the business, the influence on the related business is suppressed to the minimum, leading to improvement of business efficiency and success or failure of customer service.
That is, it is possible to comprehensively and efficiently investigate the failure influence in the batch job, and it is possible to suitably present the investigation result according to the needs.
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の障害影響調査装置において、前記記憶装置は、前記階層構造に関する情報として、前記ジョブネットにおいて他ジョブネットからのデータ入力を受ける仮想的なジョブに対応したプレノード、および、前記ジョブネットにおいて他ジョブネットへのデータ出力を行う仮想的なジョブに対応したポストノード、の各情報を保持し、当該プレノードおよび当該ポストノードのそれぞれと、前記ジョブネットを構成する全てのジョブとが入出力関係を有する接続関係の情報を更に格納するものであり、前記演算装置は、前記障害影響範囲を特定する処理において、前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを特定する際、ジョブネット間の連なりに関しては、前記プレノードおよび前記ポストノードを介した接続関係に基づいて特定するものである、としてもよい。 At least the following will be clarified by the description of the present specification. That is, in the failure impact investigation apparatus according to the present embodiment, the storage device includes, as information related to the hierarchical structure, a prenode corresponding to a virtual job that receives data input from another job net in the job net, and the job Each information of the post node corresponding to a virtual job that outputs data to another job net in the net is held, and each of the pre-node and the post node and all jobs constituting the job net are input. The storage device further stores connection relationship information having an output relationship, and in the processing for specifying the failure influence range, the arithmetic device indicates an input / output relationship at least between jobs and between job nets indicated by the information on the hierarchical structure. Based on the In addition, when specifying a series of jobs and job nets that have an input / output relationship within and within the business, the series between job nets is specified based on the connection relation via the pre-node and the post-node. It is good also as what to do.
これによれば、上述のバッチジョブの階層構造でプレノードおよびポストノードが設定されていることで、アベンド発生対象のジョブを起点にして例えば後方検索を行った場合、当該ジョブの後方に連なるジョブが無いケース(しかし、所属ジョブネットはその処理結果を他のジョブネットに出力している)でも、上述の連なりの特定がそこで途切れることなく、当該ジョブの所属するジョブネットのポストノードを介して、入出力関係にある他のジョブネット(およびその所属ジョブ)との連なりを特定できる。このことは前方検索に関しても同様であり、当該ジョブの所属するジョブネットのプレノードを介して、入出力関係にある他のジョブネット(およびその所属ジョブ)との連なりを特定できる。
ひいては、バッチジョブにおける障害影響調査をより網羅的かつ効率的なものとし、また、その調査結果をユーザニーズに即して好適に提示可能となる。
According to this, since the pre-node and the post-node are set in the above-described hierarchical structure of batch jobs, for example, when a backward search is performed starting from the job where the abend is generated, the jobs that follow the job are displayed. Even if there is no case (however, the job net to which the job belongs outputs the processing result to another job net), the above-mentioned series of identifications are not interrupted there, but via the post node of the job net to which the job belongs, It is possible to specify a series with other job nets (and their jobs) that have an input / output relationship. The same applies to the forward search, and the connection with other job nets (and their belonging jobs) having an input / output relationship can be specified via the pre-node of the job net to which the job belongs.
As a result, the failure influence investigation in the batch job can be made more comprehensive and efficient, and the investigation result can be suitably presented according to the user needs.
また、本実施形態の障害影響調査装置において、前記演算装置は、前記障害影響範囲を特定する処理において、ユーザ指定に基づき、前記アベンドの発生対象となったジョブを起点に、入出力関係における上流側に向けた前方検索、および、入出力関係における下流側に向けた後方検索の、いずれかを行って、前記ジョブおよび前記ジョブネットの連なりを特定するものである、としてもよい。 Further, in the failure impact investigation device according to the present embodiment, in the processing for specifying the failure impact range, the arithmetic device is based on a user designation and starts from the job for which the abend is generated, and the upstream in the input / output relationship. Either the forward search toward the side or the backward search toward the downstream side in the input / output relationship may be performed to identify the series of the job and the job net.
これによれば、アベンド発生対象のジョブがその処理データを与えるジョブと更に当該ジョブに処理データを与えるジョブといった連なりに関して後方検索で特定できるとともに、アベンド発生対象のジョブに対して処理データを与えるジョブと更に当該ジョブに処理データを与えるジョブネットといった連なりに関して前方検索で特定できる。
ひいては、バッチジョブにおける障害影響調査をより網羅的かつ効率的なものとし、また、その調査結果をユーザニーズに即して好適に提示可能となる。
According to this, it is possible to specify by a backward search regarding a series of jobs in which an abend occurrence target job provides the processing data and a job that further provides the processing data to the job, and a job that provides the processing data to the abend generation target job In addition, it is possible to specify a series of job nets that give processing data to the job by forward search.
As a result, the failure influence investigation in the batch job can be made more comprehensive and efficient, and the investigation result can be suitably presented according to the user needs.
本実施形態の障害影響調査装置において、前記記憶装置は、前記階層構造に関する情報として、前記ジョブまたは前記ジョブネットの各間における、一方の処理状況ないし処理結果に応じた他方の待機ないし実行の契機、について少なくとも規定した連結規定の情報と、前記ジョブまたは前記ジョブネットの稼働ログと、を更に格納するものであり、前記演算装置は、前記障害影響範囲において、前記アベンドの発生対象となったジョブを起点に、当該アベンドの発生時を基準時刻とした時間経過とともに、当該連なりに含まれることになるジョブおよびジョブネットとして、前記稼働ログが示す稼働タイミングが、前記基準時刻からユーザ指定時刻までの間に含まれ、かつ、前記連結規定の情報が示す待機ないし実行の契機に応じて稼働が推測されるものを特定し、当該特定したジョブおよびジョブネットに関して、前記有向グラフないし前記無向グラフ、前記リスト、および、前記グラフ、の少なくともいずれかを生成して所定装置に出力する処理を更に実行するものである、としてもよい。 In the failure impact investigation device according to the present embodiment, the storage device uses information about the hierarchical structure as an opportunity of waiting or execution of the other according to one processing status or processing result between the jobs or the job net. , And at least the connection rule information specified for the job and the operation log of the job or the job net, and the arithmetic unit is a job subject to occurrence of the abend in the failure influence range As a starting point, the operation timing indicated by the operation log is from the reference time to the user specified time as the job and job net included in the series as time elapses with the occurrence of the abend as the reference time. The system is operated according to the standby or execution trigger included in the information of the above-mentioned connection provision. A process for specifying the measured object and generating at least one of the directed graph or the undirected graph, the list, and the graph for the specified job and job net and outputting the generated graph to a predetermined device is further executed. It is good also as what to do.
これによれば、アベンド発生時点から時間経過とともに変遷するであろう、障害影響範囲について特定し、これを視覚的に明示することができる。ひいては、バッチジョブにおける障害影響調査を網羅的かつ効率的なものとし、また、その調査結果をユーザニーズに即してより好適に提示可能となる。 According to this, it is possible to identify the fault influence range that will change with the passage of time from the time of occurrence of the abend, and to clearly indicate this. As a result, it is possible to comprehensively and efficiently investigate failure effects in batch jobs, and to present the results of the investigation more appropriately in accordance with user needs.
本実施形態の障害影響調査方法において、前記情報処理装置が、前記記憶装置において、前記階層構造に関する情報として、前記ジョブネットにおいて他ジョブネットからのデータ入力を受ける仮想的なジョブに対応したプレノード、および、前記ジョブネットにおいて他ジョブネットへのデータ出力を行う仮想的なジョブに対応したポストノード、の各情報を保持し、当該プレノードおよび当該ポストノードのそれぞれと、前記ジョブネットを構成する全てのジョブとが入出力関係を有する接続関係の情報を更に格納し、前記障害影響範囲を特定する処理において、前記階層構造に関する情報が示す、少なくともジョブ
間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを特定する際、ジョブネット間の連なりに関しては、前記プレノードおよび前記ポストノードを介した接続関係に基づいて特定する、としてもよい。
In the failure impact investigation method of the present embodiment, the information processing apparatus, in the storage device, as information related to the hierarchical structure, a pre-node corresponding to a virtual job that receives data input from another job net in the job net, And each information of a post node corresponding to a virtual job for outputting data to another job net in the job net, and all of the pre-node and the post node and all of the job nets constituting the job net In the process of further storing connection relationship information having an input / output relationship with the job and specifying the failure influence range, a predetermined value is determined based on at least the input / output relationship between jobs and between job nets indicated by the information on the hierarchical structure. Starting from the job that is the target of the abend in the job, When specifying a series of jobs and job nets having an input / output relationship with each other within and between jobs, the series of job nets may be specified based on the connection relation via the pre-node and the post-node. Good.
本実施形態の障害影響調査方法において、前記情報処理装置が、前記障害影響範囲を特定する処理において、ユーザ指定に基づき、前記アベンドの発生対象となったジョブを起点に、入出力関係における上流側に向けた前方検索、および、入出力関係における下流側に向けた後方検索の、いずれかを行って、前記ジョブおよび前記ジョブネットの連なりを特定する、としてもよい。 In the failure impact investigation method according to the present embodiment, the information processing apparatus, in the process of specifying the failure impact range, based on a user designation, starting from the job that is the target of the occurrence of the abend, upstream in the input / output relationship It is also possible to specify a series of the job and the job net by performing either a forward search toward the backward direction or a backward search toward the downstream side in the input / output relationship.
本実施形態の障害影響調査方法において、前記情報処理装置が、前記記憶装置において、前記階層構造に関する情報として、前記ジョブまたは前記ジョブネットの各間における、一方の処理状況ないし処理結果に応じた他方の待機ないし実行の契機、について少なくとも規定した連結規定の情報と、前記ジョブまたは前記ジョブネットの稼働ログと、を更に格納し、前記障害影響範囲において、前記アベンドの発生対象となったジョブを起点に、当該アベンドの発生時を基準時刻とした時間経過とともに、当該連なりに含まれることになるジョブおよびジョブネットとして、前記稼働ログが示す稼働タイミングが、前記基準時刻からユーザ指定時刻までの間に含まれ、かつ、前記連結規定の情報が示す待機ないし実行の契機に応じて稼働が推測されるものを特定し、当該特定したジョブおよびジョブネットに関して、前記有向グラフないし前記無向グラフ、前記リスト、および、前記グラフ、の少なくともいずれかを生成して所定装置に出力する処理を更に実行する、としてもよい。 In the failure impact investigation method according to the present embodiment, the information processing apparatus, as information on the hierarchical structure, in the storage device, one of processing statuses or processing results between the jobs or the job nets. Further, the information on the connection rule that defines at least the standby or execution trigger of the job and the operation log of the job or the job net is further stored, and the job that is the target of the abend generation in the failure influence range is started. In addition, with the passage of time with the occurrence of the abend as the reference time, the operation timing indicated by the operation log is between the reference time and the user specified time as jobs and job nets to be included in the series. It is included and the operation is promoted according to the standby or execution trigger indicated by the information on the connection rule. And a process of generating at least one of the directed graph or the undirected graph, the list, and the graph with respect to the specified job and job net and outputting the generated graph to a predetermined device. It is good also as.
10 ネットワーク
100 障害影響調査装置
101 記憶装置
102 プログラム
103 メモリ
104 演算装置
105 入力装置
106 出力装置
107 通信装置
125 階層構造情報
126 接続情報
127 保留・保留解除情報
128 稼働ログ
129 イベント送信ファイル
130 イベント受信ファイル
200 ユーザ端末
300 調査対象システム
DESCRIPTION OF
Claims (8)
前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを障害影響範囲として特定する処理と、少なくとも前記障害影響範囲に属するジョブおよびジョブネットの各々をノードとし、当該ノードの各間をエッジで接続した有向グラフないし無向グラフと、前記障害影響範囲に属するジョブおよびジョブネットのリストと、前記障害影響範囲に属するジョブないしジョブネットの数を業務単位ごとに集計表示したグラフ、の少なくともいずれかを生成して所定装置に出力する処理と、を実行する演算装置と、
を備えることを特徴とする障害影響調査装置。 A storage device that stores information relating to a hierarchical structure of a batch job including at least each hierarchy of a job relating to each job and a job net composed of a series of the jobs;
Based on at least the input / output relationship between jobs and job nets indicated by the information related to the hierarchical structure, the input / output relationship is established within the business and between the business, starting with the job that is subject to abend generation in the given business. A process for specifying a series of jobs and job nets as a failure influence range, and a directed graph or an undirected graph in which at least each of jobs and job nets belonging to the failure influence range is a node and each of the nodes is connected by an edge Generating at least one of a list of jobs and job nets belonging to the failure-affected range and a graph in which the number of jobs or job nets belonging to the failure-affected range is tabulated for each business unit, and outputting the generated graph to a predetermined device An arithmetic unit that executes processing;
A failure influence investigation device characterized by comprising:
前記階層構造に関する情報として、前記ジョブネットにおいて他ジョブネットからのデータ入力を受ける仮想的なジョブに対応したプレノード、および、前記ジョブネットにおいて他ジョブネットへのデータ出力を行う仮想的なジョブに対応したポストノード、の各情報を保持し、当該プレノードおよび当該ポストノードのそれぞれと、前記ジョブネットを構成する全てのジョブとが入出力関係を有する接続関係の情報を更に格納するものであり、
前記演算装置は、
前記障害影響範囲を特定する処理において、前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを特定する際、ジョブネット間の連なりに関しては、前記プレノードおよび前記ポストノードを介した接続関係に基づいて特定するものである、
ことを特徴とする請求項1に記載の障害影響調査装置。 The storage device
Information regarding the hierarchical structure corresponds to a pre-node corresponding to a virtual job that receives data input from another job net in the job net, and a virtual job that outputs data to another job net in the job net. Each post node information, and further storing connection information in which each of the pre-node and the post node and all jobs constituting the job net have an input / output relationship,
The arithmetic unit is:
In the process of specifying the failure influence range, the job within the job is started from the job for which the abend is generated in the given job based on at least the input / output relationship between the jobs and the job nets indicated by the information on the hierarchical structure. When specifying a series of jobs and job nets having an input / output relationship with each other, the series of job nets is specified based on the connection relation via the prenode and the postnode.
The failure effect investigation device according to claim 1, wherein:
前記障害影響範囲を特定する処理において、ユーザ指定に基づき、前記アベンドの発生対象となったジョブを起点に、入出力関係における上流側に向けた前方検索、および、入出力関係における下流側に向けた後方検索の、いずれかを行って、前記ジョブおよび前記ジョブネットの連なりを特定するものである、
ことを特徴とする請求項2に記載の障害影響調査装置。 The arithmetic unit is:
In the process of identifying the fault influence range, based on a user designation, starting from the job that is the target of the abend, forward search toward the upstream side in the input / output relationship, and toward the downstream side in the input / output relationship The backward search is performed to identify a series of the job and the job net.
The failure influence investigation device according to claim 2, wherein:
前記階層構造に関する情報として、前記ジョブまたは前記ジョブネットの各間における、一方の処理状況ないし処理結果に応じた他方の待機ないし実行の契機、について少なくとも規定した連結規定の情報と、前記ジョブまたは前記ジョブネットの稼働ログと、を更に格納するものであり、
前記演算装置は、
前記障害影響範囲において、前記アベンドの発生対象となったジョブを起点に、当該アベンドの発生時を基準時刻とした時間経過とともに、当該連なりに含まれることになるジョブおよびジョブネットとして、前記稼働ログが示す稼働タイミングが、前記基準時刻からユーザ指定時刻までの間に含まれ、かつ、前記連結規定の情報が示す待機ないし実行の契機に応じて稼働が推測されるものを特定し、当該特定したジョブおよびジョブネットに関して、前記有向グラフないし前記無向グラフ、前記リスト、および、前記グラフ、の少なくともいずれかを生成して所定装置に出力する処理を更に実行するものである、
ことを特徴とする請求項1に記載の障害影響調査装置。 The storage device
As the information on the hierarchical structure, the information on the connection rule that at least defines the waiting or execution timing of the other depending on the processing status or processing result between the job or the job net, the job or the job net It further stores job net operation logs,
The arithmetic unit is:
The operation log as a job and a job net that are included in the chain as time passes with the time at which the abend occurred as a reference time starting from the job that is the abend occurrence target in the failure influence range The operation timing indicated by is specified between the reference time and the user specified time, and the operation is estimated according to the standby or execution trigger indicated by the information of the connection rule, and the specified With respect to jobs and job nets, it further executes processing for generating at least one of the directed graph or the undirected graph, the list, and the graph and outputting the generated graph to a predetermined device.
The failure effect investigation device according to claim 1, wherein:
前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを障害影響範囲として特定する処理と、
少なくとも前記障害影響範囲に属するジョブおよびジョブネットの各々をノードとし、当該ノードの各間をエッジで接続した有向グラフないし無向グラフと、前記障害影響範囲に属するジョブおよびジョブネットのリストと、前記障害影響範囲に属するジョブないしジョブネットの数を業務単位ごとに集計表示したグラフ、の少なくともいずれかを生成して所定装置に出力する処理と、
を実行することを特徴とする障害影響調査方法。 An information processing apparatus comprising a storage device that stores information relating to a hierarchical structure of a batch job including at least each hierarchy of a job relating to each job and a job net composed of a series of the jobs,
Based on at least the input / output relationship between jobs and job nets indicated by the information related to the hierarchical structure, the input / output relationship is established within the business and between the business, starting with the job that is subject to abend generation in the given business. A process of identifying a series of jobs and job nets that have a failure impact range;
A directed graph or undirected graph in which at least each job and job net belonging to the failure influence range is a node, and each of the nodes is connected by an edge, a list of jobs and job nets belonging to the failure influence range, and the failure A process of generating at least one of a graph in which the number of jobs or job nets belonging to the influence range is aggregated and displayed for each business unit, and outputting the generated graph to a predetermined device;
The failure effect investigation method characterized by performing this.
前記記憶装置において、前記階層構造に関する情報として、前記ジョブネットにおいて他ジョブネットからのデータ入力を受ける仮想的なジョブに対応したプレノード、および、前記ジョブネットにおいて他ジョブネットへのデータ出力を行う仮想的なジョブに対応したポストノード、の各情報を保持し、当該プレノードおよび当該ポストノードのそれぞれと、前記ジョブネットを構成する全てのジョブとが入出力関係を有する接続関係の情報を更に格納し、
前記障害影響範囲を特定する処理において、前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを特定する際、ジョブネット間の連なりに関しては、前記プレノードおよび前記ポストノードを介した接続関係に基づいて特定する、
ことを特徴とする請求項5に記載の障害影響調査方法。 The information processing apparatus is
In the storage device, as the information related to the hierarchical structure, a pre-node corresponding to a virtual job that receives data input from another job net in the job net, and a virtual that performs data output to another job net in the job net Each post node corresponding to a specific job, and further storing connection relation information in which each of the pre-node and the post-node and all jobs constituting the job net have an input / output relationship. ,
In the process of specifying the failure influence range, the job within the job is started from the job for which the abend is generated in the given job based on at least the input / output relationship between the jobs and the job nets indicated by the information on the hierarchical structure. When specifying a series of jobs and job nets having an input / output relationship with each other, the series of job nets is specified based on the connection relation via the prenode and the postnode.
The failure effect investigation method according to claim 5, wherein:
前記障害影響範囲を特定する処理において、ユーザ指定に基づき、前記アベンドの発生対象となったジョブを起点に、入出力関係における上流側に向けた前方検索、および、入出力関係における下流側に向けた後方検索の、いずれかを行って、前記ジョブおよび前記ジョブネットの連なりを特定する、
ことを特徴とする請求項6に記載の障害影響調査方法。 The information processing apparatus is
In the process of identifying the fault influence range, based on a user designation, starting from the job that is the target of the abend, forward search toward the upstream side in the input / output relationship, and toward the downstream side in the input / output relationship Do one of the backward search, specify the series of the job and the job net,
The failure effect investigation method according to claim 6.
前記記憶装置において、前記階層構造に関する情報として、前記ジョブまたは前記ジョブネットの各間における、一方の処理状況ないし処理結果に応じた他方の待機ないし実行の契機、について少なくとも規定した連結規定の情報と、前記ジョブまたは前記ジョブネットの稼働ログと、を更に格納し、
前記障害影響範囲において、前記アベンドの発生対象となったジョブを起点に、当該アベンドの発生時を基準時刻とした時間経過とともに、当該連なりに含まれることになるジョブおよびジョブネットとして、前記稼働ログが示す稼働タイミングが、前記基準時刻からユーザ指定時刻までの間に含まれ、かつ、前記連結規定の情報が示す待機ないし実行の契機に応じて稼働が推測されるものを特定し、当該特定したジョブおよびジョブネットに関して、前記有向グラフないし前記無向グラフ、前記リスト、および、前記グラフ、の少なくともいずれかを生成して所定装置に出力する処理を更に実行する、
ことを特徴とする請求項5に記載の障害影響調査方法。 The information processing apparatus is
In the storage device, as information on the hierarchical structure, information on a connection rule that at least specifies one processing status or the other waiting or execution trigger according to the processing result between each of the job or the job net, and , Further storing an operation log of the job or the job net,
The operation log as a job and a job net that are included in the chain as time passes with the time at which the abend occurred as a reference time starting from the job that is the abend occurrence target in the failure influence range The operation timing indicated by is specified between the reference time and the user specified time, and the operation is estimated according to the standby or execution trigger indicated by the information of the connection rule, and the specified With respect to jobs and job nets, it further executes a process of generating at least one of the directed graph or the undirected graph, the list, and the graph and outputting the generated graph to a predetermined device.
The failure effect investigation method according to claim 5, wherein:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018034357A JP6920235B2 (en) | 2018-02-28 | 2018-02-28 | Failure impact investigation device and failure impact investigation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018034357A JP6920235B2 (en) | 2018-02-28 | 2018-02-28 | Failure impact investigation device and failure impact investigation method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019149079A true JP2019149079A (en) | 2019-09-05 |
JP6920235B2 JP6920235B2 (en) | 2021-08-18 |
Family
ID=67850475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018034357A Active JP6920235B2 (en) | 2018-02-28 | 2018-02-28 | Failure impact investigation device and failure impact investigation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6920235B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1196024A (en) * | 1997-09-25 | 1999-04-09 | Hitachi Software Eng Co Ltd | Work job execution relation chart display method |
JP2006277696A (en) * | 2005-03-30 | 2006-10-12 | Nec Corp | Job execution monitoring system, job control device and program, and job execution method |
JP2015064723A (en) * | 2013-09-25 | 2015-04-09 | 株式会社日立ソリューションズ | Job management system |
-
2018
- 2018-02-28 JP JP2018034357A patent/JP6920235B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1196024A (en) * | 1997-09-25 | 1999-04-09 | Hitachi Software Eng Co Ltd | Work job execution relation chart display method |
JP2006277696A (en) * | 2005-03-30 | 2006-10-12 | Nec Corp | Job execution monitoring system, job control device and program, and job execution method |
JP2015064723A (en) * | 2013-09-25 | 2015-04-09 | 株式会社日立ソリューションズ | Job management system |
Also Published As
Publication number | Publication date |
---|---|
JP6920235B2 (en) | 2021-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020276284C1 (en) | Continuous data sensing of functional states of networked computing devices to determine efficiency metrics for servicing electronic messages asynchronously | |
JP4717945B2 (en) | Business analysis program and business analysis device | |
US9122602B1 (en) | Root cause detection service | |
WO2016093836A1 (en) | Interactive detection of system anomalies | |
CN105556552A (en) | Fraud detection and analysis | |
JP7254975B2 (en) | Key-based logging for processing structured data items with executable logic | |
CN102216908A (en) | System for assisting with execution of actions in response to detected events, method for assisting with execution of actions in response to detected events, assisting device, and computer program | |
JP6163931B2 (en) | Information acquisition program, information acquisition method, and information acquisition apparatus | |
US8924794B2 (en) | Method and computer program product for forecasting system behavior | |
JP5614843B2 (en) | Integrated software design and operation management system | |
JP2011034457A (en) | Data mining system, data mining method and data mining program | |
US11935077B2 (en) | Operational predictive scoring of components and services of an information technology system | |
US11651254B2 (en) | Inference-based incident detection and reporting | |
CN113656407A (en) | Data topology generation method and device, electronic equipment and storage medium | |
JP5856906B2 (en) | Business problem analysis support system | |
JP6097666B2 (en) | Job management system | |
JP2019121863A (en) | Impact range identifying program, impact range identifying method, and impact range identifying device | |
JP4865511B2 (en) | Service management device | |
JP6920235B2 (en) | Failure impact investigation device and failure impact investigation method | |
JP2004127140A (en) | Risk prediction supporting method, and information processor | |
JP5255796B2 (en) | Operation management support system, program | |
JP2006215798A (en) | Task analysis/management support administrative device, task analysis/management support administrative method and task analysis/management support administrative program | |
JPWO2019234845A1 (en) | Future prediction simulation device, method, and computer program | |
JP6025574B2 (en) | Monitoring system and computer | |
JP2022521146A (en) | Event prediction and information provision for improved computer implementations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210720 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210726 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6920235 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |