JP2017102870A - システム運用自動化装置、システム運用自動化プログラム及びシステム運用自動化方法 - Google Patents
システム運用自動化装置、システム運用自動化プログラム及びシステム運用自動化方法 Download PDFInfo
- Publication number
- JP2017102870A JP2017102870A JP2015238011A JP2015238011A JP2017102870A JP 2017102870 A JP2017102870 A JP 2017102870A JP 2015238011 A JP2015238011 A JP 2015238011A JP 2015238011 A JP2015238011 A JP 2015238011A JP 2017102870 A JP2017102870 A JP 2017102870A
- Authority
- JP
- Japan
- Prior art keywords
- information
- application
- failure
- managed
- management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 112
- 230000004044 response Effects 0.000 claims description 69
- 230000010365 information processing Effects 0.000 claims description 16
- 230000008569 process Effects 0.000 abstract description 92
- 230000010354 integration Effects 0.000 abstract 1
- 238000007726 management method Methods 0.000 description 231
- 238000011161 development Methods 0.000 description 40
- 238000004519 manufacturing process Methods 0.000 description 30
- 238000012545 processing Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 9
- 238000012790 confirmation Methods 0.000 description 8
- 238000012423 maintenance Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000009118 appropriate response Effects 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Landscapes
- Debugging And Monitoring (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
このようなデータシステムは、個々の企業等が自己で所有するコンピュータシステムによって運営・運用される場合もあり、また、複数の企業等のデータシステムの運用を業務として請け負う、所謂システム・インテグレータと呼ばれる情報システム企業が所有する巨大なサーバシステム群によって管理・運用される場合もある。
また、データシステムで管理・運用されるデータは時々刻々と変化・更新されるものであり、それに応じて管理対象装置のシステム構成や機能等の変更や追加,拡張,バージョンアップ,メンテナンス等、必要な変更・改善を随時行う必要があり、そのような変更等は、正当性のある内容を正確かつ可能な限り迅速に反映・実行させる必要がある。
さらに、データシステムの運用には不測の障害やトラブル等の発生を絶無にすることは困難であり、障害等が発生した場合には、迅速かつ的確な対応・復旧が求められる。
まず、データシステムを運用している管理対象装置に対して、新たな構成や機能等を追加・変更等する場合には、図11(a)に示すように、データシステムの開発担当者が、管理対象装置に追加・変更等したい構成や機能について、紙の運用申請書を起票して申請を行い、開発部署内で開発管理者からの承認を得た後、その申請が運用部署に回付され、運用部署において運用担当者・運用管理者による申請の受付や申請内容の正当性のチェック・承認が行われる。その上で、運用部署で承認された申請内容を、管理対象装置に実装されている本番システムへ反映させるために、オペレーション担当者(オペレータ)の手作業による本番システムの変更作業が行われ、作業結果が運用担当者に連絡される。
その後、運用担当者は、本番システムに実行・反映された作業結果を開発担当者に連絡し、開発担当者は自己が申請した申請内容が本番システムに反映されていることを確認できるようになる。
開発部署では、運用部署から連絡されたアラートの内容が開発担当者によって確認され、過去の経験・ノウハウ等に基づく調査が行われ、障害への対応内容が運用担当者へ指示される。
また、オペレーション担当者側では、障害の調査のための本願システムへの必要な作業が実施され、その結果が運用担当者に連絡されるとともに、必要に応じて開発担当者からの指示に則って本番システムへの変更の反映等の作業が実施される。
また、複数の部署・担当者による役割分担や責任分界点が明確に定められることで、データシステムの心臓部となる本番システムには、オペレーション担当者のみがアクセス可能となり、開発担当者等が勝手に本番システムに触れるようなことは困難乃至不可能となり、例えば本番システムの内容が開発担当者の一存で変更されるようなことが防止されることになる。
この特許文献1の技術では、上述した開発担当者と開発承認者との間で行われる申請・承認の作業がオンライン化されるとともに、申請が承認されると、承認されたメンテナンス作業が自動実行されるようになる。このため、運用担当者・運用管理者による申請内容の確認や承認、オペレーション担当者による本番システムに対する作業が不要となり、全体として管理対象装置に対するメンテナンス作業が効率化されるようになる。
まず、管理対象装置のシステム変更等の申請の対応に際して、開発部署・運用部署・オペレーション担当者のように、複数の部署と担当者を経る必要がある従来の運用では、変更等の申請が行われてから最終的に本番システムへの反映が完了するまでに時間がかかるという問題があった。
これらの点は、複数の部署と担当者・管理者を経る必要のある従来システムにおける構造的・物理的な問題であり、特許文献1で提案されているような支援装置を導入したとしても、根本的に解決することはできなかった。
また、このような運用工程の遅延は、特に迅速な対応が求められるシステム提供業者等のサービスの拡大・変更に対して、サービスレベルの低下に直結するリスクに繋がるおそれがあった。
また、システム運用のノウハウは属人化しやすく、人の入れ替わりが激しい運用現場においては、常に標準的なシステム運用レベルを維持することが困難となるという問題もあった。
そして、このような問題は、特許文献1の支援装置を採用して一部の作業がオンライン化・自動化されたとしても、人為的ミスの発生を完全になくすことは不可能であった。
システム障害発生時には、より迅速な対応が求められるが、近年対応すべき情報システムの規模は膨大になっており、システム運用を人為的な判断に頼って実施することは、対応箇所の特定や対応操作において判断ミスや操作ミスが起こりやすいという問題があった。
特に、緊急な対応が求められる障害発生の場面では、本番システムに手作業で変更を加えることによるオペレーション担当者によるミスが起こりやすかった。
また、障害対応には人手を介する工程が多いことによる連携ミスや、誤認識が発生しやすいという問題もあった。
一方、障害の内容によっては、頻繁に発生する軽微な問題であって、実際にはオペレーション担当者のみの対応で解消可能な場合でも、その都度、運用部署・開発部署側に対応内容を確認する必要があることから、その点からも手間と時間がかかるという問題があった。
そして、このような障害発生時の対応において生ずる問題については、特許文献1の支援装置では全く対応することはできなかった。特許文献1の支援装置は、管理対象装置に対するメンテナンス処理の申請承認と反映作業を効率化させるために、管理装置から管理対象装置への上流から下流への一方的な命令(設定)はできても、管理対象装置で障害が発生した場合に、その通知を受けた管理装置側から管理対象装置に対して何らかの対応を自動で行うようなことはできなかった。
これによって、特に大企業や複数の企業・団体等の大量のデータを取り扱うサーバ等の管理対象装置を多数備えた大規模データシステムの運用に好適なシステム運用自動化装置、システム運用自動化プログラム及びシステム運用自動化方法を提供することができる。
ここで、以下に示す本発明のシステム運用自動化装置は、プログラム(ソフトウェア)の命令によりコンピュータで実行される処理,手段,機能によって実現される。プログラムは、コンピュータの各構成要素に指令を送り、以下に示す本発明に係る所定の処理や機能等を行わせることができる。すなわち、本発明における各処理や手段,機能は、プログラムとコンピュータとが協働した具体的手段によって実現される。
なお、プログラムの全部又は一部は、例えば、磁気ディスク,光ディスク,半導体メモリ,その他任意のコンピュータで読取り可能な記録媒体により提供され、記録媒体から読み出されたプログラムがコンピュータにインストールされて実行される。また、プログラムは、記録媒体を介さず、通信回線を通じて直接にコンピュータにロードし実行することもできる。また、本発明に係るシステム運用自動化装置は、単一の情報処理装置(例えば1台のパーソナルコンピュータ等)で構成することもでき、複数の情報処理装置(例えば複数台のサーバコンピュータ群等)で構成することもできる。
また、図2は、本発明の一実施形態に係るシステム運用自動化装置におけるシステム運用の申請時/障害発生時の対応の流れを模式的に示す説明図である。
これらの図に示すように、本発明の一実施形態に係るシステム運用自動化装置は、統合プロセス管理装置10として構成されている。
統合プロセス管理装置10は、例えばサーバコンピュータやパーソナルコンピュータ等の情報処理装置によって構成されており、まず、開発担当者・開発管理者・運用担当者・運用管理者がそれぞれ操作可能な複数の端末装置20と通信可能に接続されている。
また、統合プロセス管理装置10は、管理・運営の対象となるデータシステムが実装・運用されている管理対象装置30と通信可能に接続されている。
これら統合プロセス管理装置10と閲覧用端末装置20,管理対象装置30とは、例えばインターネットや社内LANなどのネットワークを介してデータ通信可能に接続されている。
端末装置20(20a,20b〜20n)は、開発担当者・開発管理者・運用担当者・運用管理者等がそれぞれ操作可能な情報処理装置からなり、例えばパーソナルコンピュータや携帯電話,スマートフォン,タブレット等によって構成することができる。
この端末装置20において、統合プロセス管理装置10で生成・出力される出力情報、具体的には後述するポータル・インタフェース(図6,7参照)を表示・閲覧・入力等の操作を行うことができる。
また、端末装置20は、統合プロセス管理装置10から所定の承認依頼通知や障害発生通知が送信される受信側装置となっており、本発明に係る承認者装置,障害対応者装置を構成する。
そして、各端末装置20が操作されることで、統合プロセス管理装置10が提供するポータル・インタフェースから所定のデータ入力が可能となっており、例えば、開発担当者による申請や障害対応の内容の設定、開発担当者による障害対応設定の承認、運用管理者による申請の承認などを入力・設定することができる。
また、各端末装置20を介して統合プロセス管理装置10のポータル・インタフェースが表示・閲覧されることで、例えば、開発担当者が行った申請や、障害発生に対して自動実行された対応内容を参照・確認することができるようになっている。
なお、端末装置20は、データシステムの運用に携わる担当者・管理者ごとに備えられる複数の情報処理装置によって構成することが好ましいが、例えば複数の担当者で共用する情報処理装置によって構成することもできる。したがって、本実施形態に係る端末装置20は、少なくとも一台が備えられていれば本発明を実施することができる。
管理対象装置30は、本発明に係るシステム運用自動化装置の管理対象となるデータシステムが実装・運用される情報処理装置からなり、例えば、自社のデータシステムを運用する企業等が所有するコンピュータシステムや、複数の企業等のデータシステムの運用を業務として請け負う情報システム企業(システム・インテグレータ)が所有する大規模なサーバシステム群等によって構成することができる。
図1に示す例では、管理対象装置30は、統合プロセス管理装置10とネットワークを介して接続された複数の運用管理サーバ30a〜30nと、各運用管理サーバ30a〜30nと接続される複数の管理対象機器30−1a〜n,30−2a〜n・・・30−Na〜nによって構成されている。
そして、このような複数の情報処理装置からなる管理対象装置30で運用されるデータシステム(業務システム)が、本発明に係るシステム運用自動化装置によって、効率的に運用されるように管理・制御されるようになっている。
また、管理対象装置30のいずれかのいずれかの管理対象機器30−1a〜n,30−2a〜n・・・30−Na〜nに障害が発生すると、その管理対象機器からアラートが出されて、その機器を管理する運用管理サーバ30a〜30nを介して、アラートが統合プロセス管理装置10に送信・通知され、それに対応する障害対応の内容が抽出され、障害が発生した管理対象機器に対して必要な障害対応処理が自動で実施・実行されるようになる。
例えば、新たな申請や障害対応の処理内容を記述したスクリプトが統合プロセス管理装置10に記憶・設定されており、端末装置20からの申請の選択操作や、管理対象装置30から上げられたアラートに応じて、そのスクリプトが実行されて、対応する管理対象装置30のいずれかの管理対象機器30−1a〜n,30−2a〜n・・・30−Na〜nにその内容が実行・反映されるようになる。
そして、以上のように統合プロセス管理装置10によって管理対象装置30に対して自動実行された申請や障害対応の内容が、統合プロセス管理装置10のポータル・インタフェースに出力・表示され、本システムに接続されている各担当者・管理者の端末装置20において参照・確認することができる。
統合プロセス管理装置10は、本発明に係るシステム運用自動化装置を構成する装置であり、例えばパーソナルコンピュータやサーバシステム等の一又は二以上の情報処理装置によって構成されている。
そして、上述のとおり、統合プロセス管理装置10は、ネットワークを介して、開発担当者等が操作する一又は二以上の端末装置20、管理・運営の対象となるデータシステムが実装・運用されている管理対象装置30と通信可能に接続されている。
このような統合プロセス管理装置10を備えることにより、統合プロセス管理装置10に接続され管理されている複数の管理対象装置30(運用管理サーバ・管理対象機器)に関する情報が、ポータル・インタフェースの形式で生成・出力・更新されて、任意の端末装置20の表示部において表示・閲覧・入力操作が可能となる。
記憶手段11は、複数の管理対象装置30の識別情報と、各管理対象装置30で運用されるデータシステムの運用情報、各管理対象装置30で運用可能な申請に関する申請情報、各管理対象装置30で発生する可能性のある障害に関する障害対応情報を記憶・更新する手段であり、本発明に係る記憶手段を構成している。
そして、この記憶手段11は、後述する申請実行手段で反映された申請及び障害対応実行手段で反映された障害対応に係る情報を、対応する管理対象装置30の情報として更新して記憶するようになっている。
この記憶手段11に記憶されるデータで構成されるデータベースの詳細については、図3〜5を参照しつつ後述する。
そして、この表示制御手段12は、上述した記憶手段11で更新された情報を端末装置20側において表示させるようになっている。この表示制御手段12の制御により生成・出力される表示内容は、対象となる管理対象装置30に関する情報を選択可能に表示させるポータル・インタフェースとして表示されるようなっている。
この表示制御手段12によって生成・表示されるポータル・インタフェースの詳細については、図6,7を参照しつつ後述する。
また、申請実行手段13は、入力操作に応じて申請情報が選択されると、当該申請情報に対応する承認者が操作する端末装置20(承認者装置)に、所定の承認依頼通知を電子メール等で送信・通知するようになっている。
また、障害対応実行手段14は、管理対象装置30において障害が発生すると、当該管理対象装置30に対応する障害対応者が操作する端末装置20(障害対応者装置)に、所定の障害発生通知を電子メール等で送信する。
さらに、障害対応実行手段14は、入力操作に応じて新たな障害対応情報が設定されると、当該障害対応情報に対応する承認者が操作する端末装置20(承認者装置)に、所定の承認依頼認通知を電子メール等で送信するようになっている。
これら申請実行手段13及び障害対応実行手段14で自動実行される申請及び障害対応の詳細については、図8〜10を参照しつつ後述する。
次に、上述した統合プロセス管理装置10の記憶手段11に記憶されるデータで構成されるデータベースのイメージについて図3〜5を参照しつつ説明する。
図3〜5は、本発明の一実施形態に係るシステム運用自動化装置に備えられるデータベースのイメージを示す説明図であり、図3(a)は申請情報テーブル、図3(b)は承認ワークフロー管理テーブル、図3(c)はユーザマスタテーブルの一例である。
また、図4(a)は申請メニュー管理テーブル、(b)は申請内容チェックルール管理テーブルの一例である。
また、図5(a)はシステム構成管理テーブル、図5(b)はジョブ制御情報管理テーブル、図5(c)は自動対応(RBA)マスタ管理テーブルの一例である。
図3(a)に示すように、申請情報テーブルは、管理対象装置30に対して適用・反映することができる申請種類ごとに複数のデータで構成されている。
具体的には、申請情報テーブルは、運用申請のチケット(トランザクション情報)を管理するテーブルであり、申請チケットID・申請種類・対象システム・対象ジョブ・運用日付・対象サーバ・対象RBA(RunBookAutomation:運用自動化)・対象チェックパターン等の情報が記憶されるようになっている。
図3(a)の中段の例では、管理対象装置30に適用可能な申請として「RBA(障害自動対応設定)申請」について、申請チケットID・申請種類・対象システム・対象サーバ・対象RBA等の情報が関連付けて記憶されている。
図3(a)の下段の例では、管理対象装置30の障害が発生した場合の対応として「障害メッセージ1次切り分け」について、申請チケットID・申請種類・対象システム・対象サーバ・対象チェックパターン等の情報が関連付けて記憶されている。
また、この申請情報テーブルが、後述する「ジョブ制御情報管理テーブル」と紐付けられることで、申請だけでなく、申請内容を本番システムへ反映した実行結果も、ポータル・インタフェース上で確認することができるようになる。
図3(b)に示すように、承認ワークフロー管理テーブルは、業務システム、申請の種類ごとに適用される承認ワークフローを定義するテーブルであり、申請者、承認者をユーザの役職ごとに設定することができる。
図3(b)の例では、対象システム「金融Aシステム」についての承認ワークフローとして、承認ワークフローID・対象システム・開発承認役職・運用承認役職等の情報が関連付けて記憶されている。
図3(c)に示すように、ユーザマスタテーブルは、ユーザごとの担当業務システム・役職、連絡先情報を定義するテーブルである。
図3(c)の例では、ユーザ「XXXXX」について、ユーザID・氏名・権限・役職・メールアドレス等の情報が関連付けて記憶されている。
図4(a)に示すように、申請メニュー管理テーブルは、業務システム、役職ごとに申請することが可能なメニューを定義するテーブルである。
図4(a)の例では、業務システム「金融Aシステム」の担当役職「開発部門担当者」について、「ジョブskip申請:○」・「監視申請:○」・「障害自動対応:×」等の情報が関連付けて記憶されている。
この申請メニュー管理テーブルでは、ユーザごとに申請、承認等、実施可能なアクションが定義され、ユーザマスタの権限及び機器構成テーブルのシステム設定と、申請メニュー管理テーブルとの情報に基づいて、統合プロセス管理装置10のポータル・インタフェースには、各ユーザ単位で、そのユーザが利用可能な申請のみをメニュー表示することができるようになる。
図4(b)に示すように、申請内容チェックルール管理テーブルは、申請項目ごとのチェック内容を定義するテーブルである。
図4(b)の例では、対象システム「金融Aシステム」について、対象項目「対象サーバ名」については、チェック内容として「半角英数字8バイド」が設定され、対象項目「運用日時」については、チェック内容として「申請日時の30分後以降」が設定されている。
この申請内容チェックルール管理テーブルに定義されたチェック内容に基づいて、申請内容に不備がないかが統合プロセス管理装置10で自動的にチェックされるようになる。
これによって、新たな申請を行おうとする申請者(開発担当者)は、申請に不備等があれば申請の際に即時に申請不備があることが分かり、手戻りなく迅速かつ正確な申請が行えるようになり、申請をチェック・承認する運用部門側でも、申請内容のチェック等に時間が取られることがなく、迅速な申請の承認処理を行えるようになる。
図5(a)に示すように、システム構成管理テーブルは、最新の機器構成情報を管理するテーブルである。
図5(a)の例では、対象となるシステム「金融Aシステム」について、システム名・運用管理サーバ・制御対象サーバ・ジョブ情報等の情報が関連付けて記憶されている。
このようなシステム構成管理テーブルを備えることで、システムの構成情報がシステム別に定義されるため、ユーザの役職・権限に応じて、申請可能な機器情報のみを申請対象の選択肢として表示させることができる。
これによって、申請者は、ポータル・インタフェース上に表示される、許可されたリストから申請の実施対象を選ぶだけでよいので、手動入力による記載ミスや、運用分門側での申請者の権限チェックなどの手間を省くことができるようになる。
図5(b)に示すように、ジョブ制御情報管理テーブルは、申請された運用制御情報と実施結果の情報を管理するテーブルである。
図5(b)の例では、対象システム「金融Aシステム」について、システム名・対象ジョブ・ジョブ指示内容・運用日付・実施ステータス・実施ログ等の情報が関連付けて記憶されている。
このようなジョブ制御情報管理テーブルで情報が管理されることで、申請を行った開発担当者は、端末装置20から統合プロセス管理装置10にアクセスすることで、ポータル・インタフェース上で、自身が行った申請の実施結果等をリアルタイムに確認・参照することができるようになる。
図5(c)に示すように、自動対応(RBA)マスタ管理テーブルは、管理対象装置30について障害が発生した場合の自動対象処理の起動条件や対応内容を定義するテーブルである。
図5(c)の例では、対象システム「金融Aシステム」について、RBA−ID・起動条件・自動実施内容等の情報が関連付けて記憶されている。
この自動対応マスタ管理テーブルの情報に基づいて、管理対象装置30のいずれかに障害が発生した場合には、統合プロセス管理装置10が、発生した対象の機器・サーバや発生した事象を検知して、自動実施内容に基づいて対処・実行する処理を自動で判断して実行する。なお、この自動対応マスタ管理テーブルに設定される条件や実施内容は、予め開発部門から行われた申請に基づいて、所定の内容・情報が登録される。
これによって、障害発生時の初期動作が自動化され、システム障害への対応が大幅に短縮されることになる。
従来のシステムでは、障害発生時の対応手順は高度な運用の経験やノウハウ等が必要で、ノウハウ等を有する熟練の開発担当者等からダイレクトに障害時対応を本番にシステムに反映させることはできなかった。本実施形態では、障害対応の判断や実施事項等をシステム化しパッケージ化することができ、障害対応の容易化と適切化を図ることができるようになる。
したがって、これらのデータは、管理対象装置30の運用管理サーバ30a〜30nで保持・記憶して、統合プロセス管理装置10からデータを参照するようにすることもできる。
あるいは、これらのデータを統合プロセス管理装置10側で保持・記憶して、管理対象装置30側から参照するようにしても良い。
さらに、これらのデータを、統合プロセス管理装置10と管理対象装置30の双方で、同じデータを保持して、同期して更新・管理することもできる。
次に、上述した統合プロセス管理装置10の表示制御手段12によって生成され端末装置20で閲覧・表示可能なポータル・インタフェースの表示例について図6及び7を参照しつつ説明する。
図6,7は、本発明の一実施形態に係るシステム運用自動化装置で表示・閲覧されるポータル画面のインタフェースのイメージを示す説明図で、図6は問合せ・申請メニュー画面、図7(a)は選択された申請内容の詳細画面、図7(b)は対象となる機器やジョブ等の検索画面、図7(c)は申請が運用システム上で処理・反映された結果の確認画面を、それぞれ例示している。
図6の画面例では、ログインしたユーザごとに割り当てられた「問合せ・申請メニュー」が表示されており、当該ユーザが選択可能な「申請」の情報が表示される。
したがって、ユーザは、自己が操作する端末装置20において選択・入力操作を行うことで、予め設定された自己に許可された範囲のみから、所望の申請内容や申請対象機器を選択することができる。
これによって、対象システムに対して、誤りなく正当・適切な申請を簡易かつ迅速に適用させることができるようになる。
図7(b)の画面例は、所定の検索条件を指定・入力することで、対象となるジョブやフレーム・ネットワーク等を検索・抽出するための画面である。この検索画面から、予め設定された範囲のみから申請内容、申請対象機器を検索して選択することができるようになる。
また、図6,7の画面例についても、表示項目や表示レイアウトなど、画面構成は任意に設定・変更できることも勿論である。
ユーザの端末装置20からアクセスして、表示部を介して閲覧・参照可能な表示画面であって、統合プロセス管理装置10で実行・制御される処理の内容を画面表示で確認できるものであれば、画面の表示項目や表示態様・レイアウト等は、特に限定されるものではない。
次に、以上のような構成からなる本実施形態に係るシステム運用自動化装置の動作(システム運用自動化方法)について、図8〜10を参照しつつ説明する。
図8及び9は、本発明の一実施形態に係るシステム運用自動化装置を備えたシステムにおける申請時の動作の一例を示すフローチャートである。
また、図10は、本発明の一実施形態に係るシステム運用自動化装置を備えたシステムにおける障害発生時の動作の一例を示すフローチャートである。
管理対象装置30に対する新たな機能の追加や変更・削除等の申請を行う場合には、まず、開発担当者が端末装置20を操作して、所定のアプリケーションプログラムを起動して、統合プロセス管理装置10のポータル・インタフェースにログインを行う(ステップ1)。ログインは、開発担当者等の各ユーザに割り当てられたログインIDやパスワードを入力・指定して行われる。
端末装置20からログイン操作が行われると、統合プロセス管理装置10では、ログイン画面が起動され(ステップ2)、端末装置20から入力・送信されたログインIDやパスワードについての認証処理が行われる(ステップ3)。
端末装置20では、ユーザの入力操作に応じて申請メニューが選択されると(ステップ6)、選択された申請についての具体的な申請内容の入力が行える申請新規入力画面(チケット1)が生成・表示される(ステップ7〜8)。このとき、申請に係る対象サーバなどは、画面に表示されている当該ユーザに選択・指定が許可された範囲から選択されることになる(図7(a)参照)。
そして、申請内容に修正が必要な場合には(ステップ10)、例えば「申請当日分のジョブスキップを申請することはできません。翌日以降の日付を指定してください。」というように、修正を促す警告や通知が統合プロセス管理装置10から端末装置20側に送信・出力される。
申請処理が完了すると、ユーザが端末装置20を入力操作して、申請新規入力画面(チケット1)から所定の承認申請の操作を行う(ステップ11)。
承認対象者(開発管理者)が操作する端末装置20側では、統合プロセス管理装置10から送信される承認要求メールが受領されると(ステップ14)、端末装置20上において所定の承認操作が行われる(ステップ15)。
ここで、承認対象者が複数存在する場合には、統合プロセス管理装置10では、次の承認対象者への承認依頼のメール通知が行われ(ステップ17)、全ての承認対象者の承認処理が完了するまで、ステップ12〜17の工程が繰り返される。
統合プロセス管理装置10から申請に係る処理依頼を受信した運用管理サーバ30a〜30nでは、対象となる管理対象機器30−1a〜30−Nnに対して申請内容の反映が実行され(ステップ22)、申請が反映された管理対象機器30−1a〜30−Nnでは、例えばジョブのスッキプといった、申請された処理の内容が実施される(ステップ23)。
統合プロセス管理装置10では、運用管理サーバ30a〜30nから受信した申請に係る処理結果をデータベース(記憶手段11)のジョブ制御情報管理テーブル(図5(b)参照)へ反映させて、データベースを更新する(ステップ26)。
また、統合プロセス管理装置10からは、申請者の電子メールアドレスへ、申請に係る処理結果がメールで通知される(ステップ27)。
以上により申請処理は完了となる。
管理対象装置30で発生する障害対応については、まず、予め発生が想定される障害に対する対応について、開発担当者等のユーザが端末装置20から統合プロセス管理装置10にアクセス・ログインして、障害発生時に自動実行される処理の内容等を、申請・設定処理を行う。
この障害対応の申請・設定処理は、上述した新たな申請を適用する場合のステップ1〜21の工程と同様であるので重複する説明は省略する。
設定された障害対応の内容は、統合プロセス管理装置10のデータベース(記憶手段11)の自動対応(RBA)マスタ管理テーブルに記憶される(図5(c)参照)。
なお、管理対象機器30−1a〜30−Nnで障害が発生したか否かを、運用管理サーバ30a〜30n側で監視している場合もある。その場合には、管理対象機器30−1a〜30−Nnからのアラートの有無に関わらず、運用管理サーバ30a〜30nで障害の発生が検知されることになる。
運用管理サーバ30a〜30nから障害メッセージを受信した統合プロセス管理装置10では、障害管理用のチケット(チケット2)を起票(起動)するとともに、障害メッセージの内容を解析して、自動対応(RBA)マスタ管理テーブル(図5(c)参照)を参照して、自動対応パターンを判定する(ステップ34)。
ここで判定される自動対応の内容としては、例えば「対象サーバに対して詳細情報収集スクリプトを実施する」や「該当システムの開発リーダへ情報をメール通知する」等である。
統合プロセス管理装置10から実施依頼を受信した運用管理サーバ30a〜30nでは、該当する管理対象機器30−1a〜30−Nnに対して所定のスクリプトが実施され(ステップ36)。その施結果が、運用管理サーバ30a〜30nから統合プロセス管理装置10へ通知される(ステップ37)。
また、統合プロセス管理装置10では、実施されたスクリプトに関連する通知対象者がユーザマスタテーブル(図3(c)参照)に基づいて判定され(ステップ39)、例えば該当システムの開発リーダ等、自動対応内容の申請者が抽出される。
そして、統合プロセス管理装置10からは、抽出された通知対象者(申請者)の電子メールアドレスへ、障害に対して自動実施された処理結果が障害通知メールとして通知される(ステップ40)。
以上により障害発生時の処理は完了となる。
管理対象装置30に新たな申請を適用する場合には、開発担当者が端末装置20からポータル・インタフェースにアクセス・ログインを行い、予め設定されたメニューから対応内容を選択して申請を行うと、システム(統合プロセス管理装置10)が適切な管理者や担当者を抽出・判断して、メール通知等により自動で承認依頼が行われる。
自動実行された管理対象装置30の本番システムに反映された内容は、申請をした開発担当者や承認をした運用管理者等が、端末装置20を介してポータル・インタフェースの申請画面内でいつでも確認することができる。
また、ポータル・インタフェースの表示画面に沿った選択・入力操作を行うだけで申請の起案・承認・実行が自動で実行され、申請内容の妥当性もシステム側で自動でチェックが行われるため、申請時にミスや誤り等に気付けるため、手戻りの負荷等をなくすことができる。
また、特に定型的な申請に対応する手間が簡略化され、運用担当者の作業負荷を大幅に軽減することができる。これによって、運用担当者等が本来行うべき業務や作業、例えば現場の運用改善等に時間を使うことができるようになる。
さらに、申請が自動実行されることにより、オペレータが不要(図2参照)、もしくはより少人数での運用が可能となる。
また、障害対応の申請についても、設定内容の妥当性がシステムで自動チェックされ、ミスや誤り等があれば設定入力時に気付けるため、手戻りの負荷等をなくすことができる。
この障害対応の設定について運用管理者による承認が行われると、設定内容に従って、障害発生時の自動調査や自動対応の設定が、管理対象装置30の本番システムへ自動で実行・反映される。
管理対象装置30で発生したアラートの内容や、自動実行された対応内容の確認は、管理対象装置30の本番システムにログイン等することなく、端末装置20を介してポータル・インタフェースの画面内でいつでも確認することができる。
これによって、障害発生から対応内容が本番システムへ実行・反映されるまでの時間を大幅に短縮できるとともに、障害発生時の影響拡大を防止することができる。
また、障害対応の内容は、予め想定される障害に対して適切な対応内容が開発担当者等によって設定・承認されており、障害発生と同時にその対応が自動実行されるので、人手による判断ミスや誤対応等を可能な限り軽減乃至排除することができ、また、運用ノウハウの属人化を防ぐこともできる。
さらに、障害対応の自動実行が行われることで、特に繰返し発生する軽微な問題に対応するための現場要員や運用担当等の作業負荷を大幅に軽減することができ、運用担当者等が本来実施すべき業務(運用改善等)に時間を使うことができるようになる。
従来のシステム運用では、障害発生時の対応手順には高度な運用の経験やノウハウ等が必要で、しかも、ノウハウ等を有する熟練の開発担当者等からダイレクトに障害時対応を本番にシステムに反映させることはできなかった。本実施形態では、障害対応の判断や実施事項等をシステム化しパッケージ化することが可能となり、経験やノウハウ等の少ない開発担当者でも簡単に使える(選べる)ようになり、障害対応の容易化と適切化を図ることができるようになる。
また、開発担当者によっては、例えば新入社員等、障害対応についての運用ノウハウが十分でない場合もあり、ポータル・インタフェースの簡略化したメニューで対応できるようにすることで、開発要員の教育負荷等を軽減できるという効果もある。
また、いつどんな障害が起きるかわからない管理対象装置30に対して、いつ問題が起きても、発生した障害の内容に応じて自動対応が可能となり、かつ、その対応内容の設定や自動対応結果の確認等も、ポータル・インタフェースを介して開発担当者自身が自由に随時行えるようになる。
これによって、数百台〜数千台,数万台オーダーで多数の管理対象装置を備える大企業のデータシステムや、複数企業等の異なるデータを大量に取り扱うデータシステムの運用を業務として請け負う情報システム企業が所有する巨大なサーバシステム群についても、システムを安全に維持・管理して、安定的なシステム運用を実現することができる。
したがって、ポータル・インタフェースの閲覧・参照履歴がシステム監査に対する証跡となり、本実施形態に係るシステム自体が、セキュリティや責任分界点が正しく守られていることの証明乃至保証となるという効果もある。
例えば、上述した実施形態では、本発明に係るシステム運用自動化装置が適用されるデータシステムとして、複数の管理対象装置において実装・運用される大規模データシステムを想定して説明したが、本発明が適用可能なデータシステムや管理対象装置は、その規模の大小やシステムの内容については特に限定されるものではない。
システム運用のために新たな申請が行われ、また、迅速な対応が必要な障害が発生する可能性のあるデータシステムや情報処理装置であれば、システムの規模や内容はどのようなものであっても本発明を適用・実施することができる。
11 記憶手段(データベース)
12 表示制御手段
13 申請実行手段
14 障害対応実行手段
20 端末装置
30 管理対象装置
Claims (6)
- データシステムを運用する複数の管理対象装置に接続された情報処理装置であって、
前記複数の管理対象装置の識別情報と、各管理対象装置で運用されるデータシステムの運用情報、各管理対象装置で運用可能な申請に関する申請情報、各管理対象装置で発生する可能性のある障害に関する障害対応情報を記憶する記憶手段と、
前記複数の管理対象装置の識別情報,運用情報,申請情報及び障害対応情報を、所定の表示部に選択可能に表示させる表示制御手段と、
入力操作に応じて前記申請情報が選択されると、当該申請情報に係る申請を、対応する管理対象装置に反映させる申請実行手段と、
前記管理対象装置において障害が発生すると、対応する前記障害対応情報に係る障害対応を、当該管理対象装置に反映させる障害対応実行手段と、
を備え、
前記記憶手段は、前記申請実行手段で反映された申請及び前記障害対応実行手段で反映された障害対応に係る情報を、対応する管理対象装置の情報として更新して記憶し、
前記表示制御手段は、前記記憶手段で更新された情報を表示させる
ことを特徴とするシステム運用自動化装置。 - 前記申請実行手段は、
入力操作に応じて前記申請情報が選択されると、当該申請情報に対応する承認者装置に、所定の承認依頼通知を送信する
ことを特徴とする請求項1記載のシステム運用自動化装置。 - 前記障害対応実行手段は、
前記管理対象装置において障害が発生すると、当該管理対象装置に対応する障害対応者装置に、所定の障害発生通知を送信する
ことを特徴とする請求項1又は2記載のシステム運用自動化装置。 - 前記障害対応実行手段は、
入力操作に応じて新たな障害対応情報が設定されると、当該障害対応情報に対応する承認者装置に、所定の承認依頼認通知を送信する
ことを特徴とする請求項1乃至3のいずれか一項記載のシステム運用自動化装置。 - データシステムを運用する複数の管理対象装置に接続された情報処理装置を構成するコンピュータを、
前記複数の管理対象装置の識別情報と、各管理対象装置で運用されるデータシステムの運用情報、各管理対象装置で運用可能な申請に関する申請情報、各管理対象装置で発生する可能性のある障害に関する障害対応情報を記憶する記憶手段、
前記複数の管理対象装置の識別情報,運用情報,申請情報及び障害対応情報を、所定の表示部に選択可能に表示させる表示制御手段、
入力操作に応じて前記申請情報が選択されると、当該申請情報に係る申請を、対応する管理対象装置に反映させる申請実行手段、
前記管理対象装置において障害が発生すると、対応する前記障害対応情報に係る障害対応を、当該管理対象装置に反映させる障害対応実行手段、
として機能させるとともに、
前記記憶手段に、前記申請実行手段で反映された申請及び前記障害対応実行手段で反映された障害対応に係る情報を、対応する管理対象装置の情報として更新して記憶させ、
前記表示制御手段に、前記記憶手段で更新された情報を表示させる
ことを特徴とするシステム運用自動化プログラム。 - データシステムを運用する複数の管理対象装置に接続された情報処理装置を構成するコンピュータを用いて、
前記複数の管理対象装置の識別情報と、各管理対象装置で運用されるデータシステムの運用情報、各管理対象装置で運用可能な申請に関する申請情報、各管理対象装置で発生する可能性のある障害に関する障害対応情報を記憶する記憶手順、
前記複数の管理対象装置の識別情報,運用情報,申請情報及び障害対応情報を、所定の表示部に選択可能に表示させる表示制御手順、
入力操作に応じて前記申請情報が選択されると、当該申請情報に係る申請を、対応する管理対象装置に反映させる申請実行手順、
前記管理対象装置において障害が発生すると、対応する前記障害対応情報に係る障害対応を、当該管理対象装置に反映させる障害対応実行手順、
を実行するとともに、
前記記憶手順において、前記申請実行手順で反映された申請及び前記障害対応実行手順で反映された障害対応に係る情報を、対応する管理対象装置の情報として更新して記憶し、
前記表示制御手順において、前記記憶手段で更新された情報を表示させる
ことを特徴とするシステム運用自動化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015238011A JP6761241B2 (ja) | 2015-12-04 | 2015-12-04 | システム運用自動化装置、システム運用自動化プログラム及びシステム運用自動化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015238011A JP6761241B2 (ja) | 2015-12-04 | 2015-12-04 | システム運用自動化装置、システム運用自動化プログラム及びシステム運用自動化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017102870A true JP2017102870A (ja) | 2017-06-08 |
JP6761241B2 JP6761241B2 (ja) | 2020-09-23 |
Family
ID=59016689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015238011A Active JP6761241B2 (ja) | 2015-12-04 | 2015-12-04 | システム運用自動化装置、システム運用自動化プログラム及びシステム運用自動化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6761241B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019021792A1 (ja) * | 2017-07-26 | 2019-01-31 | 株式会社日立製作所 | 運用管理方法、運用管理システム、および、運用管理プログラム |
US11657351B2 (en) | 2019-11-12 | 2023-05-23 | Nomura Research Institute, Ltd. | Management system for responding to incidents based on previous workflows |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002109037A (ja) * | 2000-10-04 | 2002-04-12 | Nec Corp | ネットワーク監視制御システム及びネットワーク監視制御方法 |
JP2005202931A (ja) * | 2003-12-17 | 2005-07-28 | Canon Software Inc | 情報処理装置管理システム及び情報処理装置管理方法およびプログラムおよび記録媒体 |
JP2009193207A (ja) * | 2008-02-13 | 2009-08-27 | Nec Corp | 情報採取手順管理システム |
-
2015
- 2015-12-04 JP JP2015238011A patent/JP6761241B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002109037A (ja) * | 2000-10-04 | 2002-04-12 | Nec Corp | ネットワーク監視制御システム及びネットワーク監視制御方法 |
JP2005202931A (ja) * | 2003-12-17 | 2005-07-28 | Canon Software Inc | 情報処理装置管理システム及び情報処理装置管理方法およびプログラムおよび記録媒体 |
JP2009193207A (ja) * | 2008-02-13 | 2009-08-27 | Nec Corp | 情報採取手順管理システム |
Non-Patent Citations (1)
Title |
---|
"統合システム運用管理JP1 Version10", HITACHI SOCIAL INNOVATION FORUM 2015, JPN6019024826, 29 October 2015 (2015-10-29), JP, pages 1 - 18, ISSN: 0004064970 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019021792A1 (ja) * | 2017-07-26 | 2019-01-31 | 株式会社日立製作所 | 運用管理方法、運用管理システム、および、運用管理プログラム |
JP2019028525A (ja) * | 2017-07-26 | 2019-02-21 | 株式会社日立製作所 | 運用管理方法、運用管理システム、および、運用管理プログラム |
US11657351B2 (en) | 2019-11-12 | 2023-05-23 | Nomura Research Institute, Ltd. | Management system for responding to incidents based on previous workflows |
Also Published As
Publication number | Publication date |
---|---|
JP6761241B2 (ja) | 2020-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7079310B2 (ja) | 診断分析装置関連情報の集約方法および集約システム | |
CN114065185A (zh) | 访问管理系统、访问管理机器人促进系统和访问管理方法 | |
US9183124B2 (en) | Automation controller for next generation testing system | |
KR20040066804A (ko) | 설비 유지 보수를 위한 작업 관리용 방법 및 장치 | |
US20140156048A1 (en) | Integrated Manufacturing and Test Process Platform | |
JP2009537900A (ja) | コンピュータ化された手順システム | |
JP2007188201A (ja) | 勤怠管理システム | |
US10984469B2 (en) | Consolidation process command center method | |
CN111260251A (zh) | 一种运维服务管理平台及其运行方法 | |
JP5989194B1 (ja) | テスト管理システムおよびプログラム | |
JP6761241B2 (ja) | システム運用自動化装置、システム運用自動化プログラム及びシステム運用自動化方法 | |
US20120136687A1 (en) | System and Method for CAPA Process Automation | |
JP6865042B2 (ja) | ナレッジ管理装置、ナレッジ管理方法およびコンピュータプログラム | |
Eytan et al. | Maintenance Service Platform (MSP) for maintenance information collection and sharing | |
US9519536B2 (en) | Electronic management system for technology support reporting | |
WO2022240310A1 (ru) | Система управления тестированием программного обеспечения | |
JP5569438B2 (ja) | あいまい記述自動検出装置及びその方法 | |
JP2021092933A (ja) | ロボティックプロセスオートメーション(rpa)管理システム、rpa管理プログラム、及びrpa管理方法 | |
US20240013231A1 (en) | System and method for data validation rule simulation | |
KR102668341B1 (ko) | 인터페이스 관리 방법, 인터페이스 거버넌스 시스템, 및 인터페이스를 관리하는, 컴퓨터로 실행가능한 프로그램을 저장하는 저장매체 | |
Iqbal et al. | Forward Engineering Completeness for Software by Using Requirements Validation Framework (S). | |
KR102668338B1 (ko) | 인터페이스 관리 방법, 인터페이스 거버넌스 시스템, 및 인터페이스를 관리하는, 컴퓨터로 실행가능한 프로그램을 저장하는 저장매체 | |
Seth et al. | JIRA report extraction | |
US20220163941A1 (en) | Industrial commissioning procedures including loop checking | |
US20230206144A1 (en) | Methods, apparatuses and computer program products for generating an incident and change management user interface |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20170707 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180612 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200811 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200904 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6761241 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |