JP2004021873A - インターネットシステム監視装置 - Google Patents
インターネットシステム監視装置 Download PDFInfo
- Publication number
- JP2004021873A JP2004021873A JP2002179306A JP2002179306A JP2004021873A JP 2004021873 A JP2004021873 A JP 2004021873A JP 2002179306 A JP2002179306 A JP 2002179306A JP 2002179306 A JP2002179306 A JP 2002179306A JP 2004021873 A JP2004021873 A JP 2004021873A
- Authority
- JP
- Japan
- Prior art keywords
- service
- monitoring
- internet
- user
- failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
Abstract
【課題】サービス利用者の観点からサービス全体の運用監視を実現し、利用者に安全性及び可用性の高いシステム及びサービスを提供する。他の目的は、サービスに障害が発生した場合に速やかに代替サービスへ切り替える処理を支援する。
【解決手段】代替サーバに監視対象サービスのドメイン、サービス提供手順を登録し、監視用ユーザを作成することでインターネットを介した複数のシステムにまたがって各種サービスを享受できるような環境全体の運用監視を実現する。また、監視対象サービスと代替サーバとでデータの照合をおこない、データ不正改ざんの監視を行うと同時に、監視対象サービスに障害が発生した場合は代替サーバにてサービスの提供を行う。これにより障害によるサービスの停止時間を短縮し、サービス利用者に安全性及び可用性の高いシステム及びサービスを提供する。
【選択図】 図1
【解決手段】代替サーバに監視対象サービスのドメイン、サービス提供手順を登録し、監視用ユーザを作成することでインターネットを介した複数のシステムにまたがって各種サービスを享受できるような環境全体の運用監視を実現する。また、監視対象サービスと代替サーバとでデータの照合をおこない、データ不正改ざんの監視を行うと同時に、監視対象サービスに障害が発生した場合は代替サーバにてサービスの提供を行う。これにより障害によるサービスの停止時間を短縮し、サービス利用者に安全性及び可用性の高いシステム及びサービスを提供する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、複数のネットワークを介して接続する利用者に各種サービスを利用できるような環境のシステム運用監視及び交替運用による高可用性を実現する方法として、システム運用、稼動状況を利用者の視点から監視する装置に関する。
【0002】
【従来の技術】
近年インターネット技術の発達に伴い、ほぼ全世界のサーバまたはコンピュータがネットワークを介してつながり、インターネット技術を利用したサービスの利用者は国内だけでなく海外にも広がっている。それに伴い1つのサーバが全サービスを提供するのではなく、各地にコンピュータを分散配置して広範囲なエリアでサービスを分散提供するシステムも現れている。このようなサービスが正常に稼動していることを確認するには、ネットワークを含めたシステム全体の運用監視及び稼動状況監視を利用者と同じレベルから行うことが重要である。
【0003】
また、インターネットというオープンネットワーク環境では、コンテンツへの不正アクセスや、クラッカーによるデータ改ざん、システム破壊の危険が常に潜在しており、これらを考慮したセキュリティ対策が不可欠となっている。
【0004】
以上のような状況を踏まえ、利用者と同じ立場で監視対象が正常に稼動しているか監視する方法として、外部に設けた監視センターから監視対象の稼動状況監視や不正改ざん監視を行う特開2001−306419号公報や、ホームページの内容のコピーを取り出しオリジナルと比較することで改ざんを検出する特開2001−331374号公報のような方法が提案されている。
【0005】
【発明が解決しようとする課題】
従来の一般的なシステム監視方法は、サーバやプロセスの起動状態や各種システムログファイルの監視といったシステム内部からの監視であり、回線障害や、性能劣化、一部の機能閉塞というような内部のログ情報だけでは検出できない障害に対応できない。特開2001−306419号公報に記載のシステムのように外部にセンタを設けて監視する方法でも、個々のコンテンツまたは個々のシステムに存在するサービスを想定しており、複数システムが順番にまたは連携して結果を出すタイプのサービス全体の整合性を監視することができなかった。また、上記公知のシステムではホームページの不正改ざんや監視対象機器の異常検知と通報を提供しているが、異常検知発見後に代替サイトへサービスを切り替えることはサポートしていなかった。
【0006】
本発明の目的は、上記課題を解決しサービス利用者の観点からサービス全体の運用監視を実現し、利用者に安全性及び可用性の高いシステム及びサービスを提供することにある。
【0007】
本発明の他の目的は、サービスに障害が発生した場合に速やかに代替サービスへ切り替える処理を支援することにある。
【0008】
【課題を解決するための手段】
本発明の第一の目的を達成するために、本発明では監視対象コンテンツやサービスの存在するネットワークにつながる別のネットワーク上にインターネット上のサービスを横断的に監視するインターネットシステム監視装置を設ける。望ましくはネットワークが階層構造を取る場合は利用者と同じ階層レベルのネットワーク上に設ける。インターネット監視装置はInternet Data Center(以下IDCと略す)やInternet Services Provider(以下ISPと略す)から監視依頼を受ける。
【0009】
監視装置は監視対象として登録したサービスの稼動状態監視機能、対象の存在するサーバの稼動状態監視機能、対象のネットワーク稼動状態監視機能、および障害通報機能を備える。さらにコンテンツ改ざんを監視する場合は、コンテンツの複製または特徴値のファイルと監視中のコンテンツとを比較するデータの同期機能を備える。
【0010】
サービスの稼動状況を監視する場合、監視装置上に監視対象となるサービスを構成するサーバ群及び各サーバに接続するハードウェア群からサービスの提供を受けるサービス利用者と同等の権限を持たせたユーザ情報と、サービス利用者が対象システムに対して実行する処理手順及びネットワーク上のどのルートを通るかをチェックシナリオとしてインターネット監視装置に登録する。インターネット監視装置は、チェックシナリオを用いて監視対象サービスに接続し、サービス利用者のネットワークパスに従って常にサービスが正常に動作しているかどうかを監視する。監視は一定時間間隔で行う。監視処理に対するサービスの標準処理時間、戻り値、及びステータスを予め設定しておき、実行したサービスが標準処理時間の許容範囲内でかつ、正常な戻り値及びステータスにて終了した場合に、対象処理が正常にサービスを提供できていると判断する。インターネット監視装置は監視結果による稼動情報をWebもしくはメールにて監視依頼元に提供する。監視依頼元はこれを利用し、利用者に対し利用目的のサービスが利用可能かどうかを利用者に通報することができる。
【0011】
監視を行ったサービスが異常をあらわす戻り値やステータスを返した場合、あるいは実行したサービスが標準処理時間の許容範囲を越えても回答を返さない場合、インターネットシステム監視装置は、対象処理に異常が発生したと判断し、どのシステム及びどのハードウェア装置で異常が発生したのかを検知する処理を行う。
【0012】
インターネットシステム監視装置には監視対象として設定された各システム管理及びシステム保守権限を持つユーザ情報を設定しておき、その権限で各サーバにアクセスし、サーバ監視機能及びネットワーク監視機能によりログを取得・解析し、各サーバの異常及び各ネットワークの異常を検知する。サーバやネットワークに異常が無い場合は個々のサービスプログラムの挙動をテストし、予め想定した戻り値との差異を検出してどのプログラムまたはどのプログラムの組み合わせに異常があるかを特定する。
【0013】
さらにインターネットシステム監視装置に監視依頼元、システム運用保守部署の連絡先を登録しておき、障害発生時には障害通報機能により障害個所及び障害原因、ボトルネック個所及びボトルネック原因を通報する。障害が復旧した場合は、復旧したサービスが正常に利用できることをチェックし、その結果利用可能となったことを監視依頼元に通報する。
【0014】
インターネットシステム監視装置は上記運用監視及び稼動状況把握とは別に、監視対象となるシステムがインターネットを介して外部公開している情報の不正改ざん及び提供サービスの不正処理がされていなことを監視する改ざん監視機能と不正アクセス監視機能を有する。
【0015】
インターネットを介して外部公開しているコンテンツ情報を、あらかじめマスタとしてインターネットシステム監視装置に保管しておき、データ同期機能にて定期的にインターネットシステム監視装置に保管されたマスタと外部公開情報との差分チェックを実施しデータが更新されているかを確認する。このチェックは両者の特徴値を比較することによっても良い。
【0016】
データ更新がインターネットを介してサービスを提供するシステムへの不正アクセス及び不正処理によって行われたものであった場合は、不正アクセス監視機能のログを解析して検知することができる。不正アクセスを検知するため、インターネットシステム監視装置に監視システムに接続するサービス利用者情報と、サービスの提供を受けるために必要なシステムアクセス順序情報を登録し、サービスを提供しているシステムを構成するサーバ群から出力されるログイン情報及びジョブログを解析して不正アクセス及び不正処理が行われたかを検知する。
【0017】
不正アクセス監視機能にて不正アクセスもしくは、不正処理が検知されなかった場合には正当な権限者によるデータ更新と判断し、インターネットシステム監視装置側に保存したマスタデータを更新する。不正アクセスもしくは、不正処理を検知した場合、障害通報機能にてサービス提供元及びシステム運用保守署へ通報する。
【0018】
本発明の第二の目的を達成するために、本発明の第一の目的を実現する構成に加え、運用切替機能を設定する。稼動状態監視機能、不正アクセス監視機能のいずれかで異常を検出した場合に監視依頼元及びシステム運用保守部署へ通報後、障害がサービス提供サーバのものであった場合、インターネットシステム監視装置は同期しているマスタデータと対象システムのハードウェア構成・ネットワーク構成に関する情報を用いて代替コンテンツを構成し、本番機に替わってサービスの提供を開始する。代替コンテンツを立ち上げる機能はインターネット監視装置の内部であっても外部であっても良い。
【0019】
障害がネットワーク障害であった場合は、障害代替操作を有するISPと連携し設定された代替ルートまたは迂回ルートにネットワークを切り替える。代替ルートまたは迂回ルートへの切替操作は監視依頼元およびISPが行ってもインターネット監視装置が行っても良い。
【0020】
代替切替の操作及び指示は異常時チェックシナリオで行う。
【0021】
インターネットシステム監視装置はネットワーク的に本番機サーバと別エリアに属しており、IPアドレスといったサーバ属性情報も異なるサイトとして起動される。サーバ等のハードウェア障害の場合は本番システムへのアクセスは物理的に不可能なので、複数のサービスで構成される場合、障害システムの上流システムへデータ送信先の変更を依頼し、自動的に代替サーバへ転送されるようにする。単独サービスの場合は、通常運用しているページに障害時のアドレス情報を表示しておき、利用者が接続不可を検知した場合代替サイトを試みるように指示しておく。コンテンツやサービスに障害がある場合、サーバやネットワークは正常なので、管理者権限によりサーバの対象個所に自動転送ページを設定する。
【0022】
【発明の実施の形態】
本発明のインターネットシステム監視装置の実施の一形態を以下に図を用いて説明する。
【0023】
図1は本発明を実現するためのシステム構成図である。インターネットシステム監視装置は監視対象インターネットシステムとインターネット網を通じて接続し、監視対象サービスの監視を行う稼動状態監視部1と不正改ざんを判定する改ざん監視部2、不正アクセス及び不正処理を検知する不正アクセス監視部3を備えてサービス稼動状況監視と改ざん監視と不正アクセスの監視を行う。障害発生時には各監視部署に通報する障害通報部4により対象となる連絡先に通報し、障害発生システムと運用を切り替える運用切替部5により代替ルート又は代替コンテンツへの切り替えを実施する。
【0024】
次にインターネットシステム監視の処理手順について説明する。
【0025】
図2は本発明のインターネットシステム稼動監視処理を示すフロー図である。インターネットシステム監視装置の稼動状態監視部1によって、監視対象管理テーブルに予め登録しているサービスの中から監視をおこなうサービスが選定される(S11)。監視対象管理テーブルに登録されている監視対象となるサービスを受けるために利用者が実行する処理手順とサーバアクセス順序、レスポンスしきい値に基づき選定されたサービスの監視ジョブを実行する(S12)。上記の手順は図6に示すようなテーブルに監視対象毎に予め登録しておく。
【0026】
テーブル構成は、各サービス名に対応して、正常時アクセスルート、異常時アクセスルート、処理手順、監視間隔、レスポンスしきい値、とサービスを実行するための権限をもつユーザID、システム保守権限をもつユーザIDからなる。
【0027】
監視ジョブの実行結果の判定は、サーバが正常稼動しているか(S13)、各サーバが提供するサービスは正常に動作したか(S14)、各サービスのレスポンスタイムはしきい値を上回るものではなかったか(S15)の順に判定を行う。いずれかの判定においてエラーが検出された場合、エラー内容およびエラー発生箇所情報を障害通報部4へ渡し(S16)、障害通報部4で稼動状態監視部1から受け取ったエラー内容、エラー発生箇所から監視対象管理テーブルにより対応する管理部署を特定し障害通報を行う(S17)。監視ジョブの実行結果は稼動状況管理テーブルに格納する(S18)。稼動状況管理テーブルの情報を監視依頼元はもちろんサービス利用者にも提供する。
【0028】
図6に稼動状況管理テーブルの構成の一例を示す。監視サービス名、サービス拠点に対応つけて、監視結果、監視時間、通報用メッセージ、交替処理手順を格納する。(S18)にて監視結果、監視時間を更新する。
【0029】
図3は本発明のインターネットシステム監視装置によるコンテンツ改ざん監視処理を示すフロー図である。監視対象サービスのシステムメンテナンスによるデータ更新は、まずインターネットシステム監視装置のマスタデータを更新し、インターネット監視システムから対象コンテンツへデータを配布するという順序で行うものとする。改ざん監視部2により監視対象管理テーブルに格納された監視間隔に基づき、対象コンテンツのデータを取得し、インターネットシステム監視装置に事前に登録している監視対象のマスタデータとの差分チェックを行う(S21)。差分チェックの結果によりデータ変更があったかどうかの判定を行う(S22)。データ変更があった場合、対象システムのジョブログ、アクセスログを取得する(S23)。システムログは定期的に取得しておいても良い。取得したジョブログ、アクセスログからデータ変更が正規ユーザによる処理によって更新されたものであるかの判定を行う(S24)。データ変更が正規ユーザによる正規処理である場合、マスタデータへの登録漏れと判断し、マスタデータを変更内容に更新し、確認日時を更新する(S25)。データ変更が無い場合は、マスタデータの確認日時を更新する。データ変更が不正ユーザもしくは不正処理による変更であると判定した場合、エラー内容およびエラー発生箇所を障害通報部4へ渡す(S26)。障害通報部4が稼動状態監視部から受け取ったエラー内容、エラー発生箇所を監視対象管理テーブルと照らし合わせエラー発生箇所管理部署へ障害通報を行う(S27)。監視結果を稼動状況管理テーブルに格納する(S28)。
【0030】
図4は本発明のインターネットシステム運用切替処理を示すフロー図である。上記サービス状況監視処理において障害通報部4が、サービス提供不能と判断されるエラーレベルの高いエラー情報を受け取った場合、エラー発生箇所保守部署に障害通報および切替指示を行う(S31)。切替操作を請け負っている場合は、障害通報後運用切替部5は稼動状況管理テーブルに登録されている交替手順に基づき交替コンテンツまたは代替ルートを立ち上げる(S32)。障害がサーバ等のハードウェア障害であった場合、インターネットシステム監視装置に登録されている、障害が発生したサービスのマスタデータを有効化し、障害が発生したサービスと同等の環境を作成する。障害がネットワーク障害であった場合、事前に用意している代替ルートにネットワークを切り替える。交替手順が完了したら、稼動状況監視部1が、交替コンテンツまたは代替ルートに対し起動確認を実施する(S33)。起動確認にて交替コンテンツまたは代替ルートが正常に起動しているか判定する(S34)。交替コンテンツまたは代替ルートの正常起動が確認できた場合、エラー発生個所保守部署、及びエラー発生個所接続元保守部署に交替完了通報とサービス切替指示を行う(S35)。通報を受けたエラー発生個所接続元保守部署は、接続先を交替コンテンツ又は代替ルートに切り替え、障害発生サービスへのアクセスを交替コンテンツまたは代替ルートへ転送する。交替コンテンツまたは代替ルートの正常起動が確認できなかった場合、(S32)から再実行する。再実行回数の限界値を設定しておき、再実行回数が限界値を上回った場合は、手動にて切り替える。
【0031】
図7は本発明のインターネットシステム監視処理実施例である。
【0032】
本発明の監視サービスは、IDCやISPから監視依頼を受けるものである。監視依頼があった場合は、監視を行うために必要な情報(サービスの提供を受けるために利用者が使用するネットワークパス、監視ユーザ、保守ユーザ等)を提供してもらう。交替サービスを依頼された場合は、依頼元と連携し代替ルートの設定や交替切替手順の設定を行う。ここで監視対象システムは、パスポート申請をインターネット上で行うサービスと、住民票の発行をインターネット上で行うサービスとする。IDCA1、A2、A3にてパスポート申請サービスを提供し、IDCB1、B2、B3にて住民票発行サービスを提供する。
【0033】
パスポート申請サービスの処理ルートをIDCA1→ISPAa→IDCA2→ISPAb→IDCA3、住民票発行サービスの処理ルートをIDCB1→ISPBa→IDCB2とする。インターネットシステム監視装置は、登録された処理ルートに従い定期的にインターネット上を横断しサービスが正常に動作しているかどうか監視する。監視結果(現在パスポート申請サービスは利用できます等)を監視依頼元にWebまたはメールで提供する。インターネット利用者にはWeb上にて情報を提供する。定期的に監視を行っている中で障害を検知した場合は、障害が発生しているという情報を提供する。
【0034】
図8は本発明のインターネットシステム運用切替処理実施例である。
【0035】
ここではISPAaに障害が発生したものとする。パスポート申請サービスの監視にて、ISPaへアクセス時に異常を検知した場合、インターネットシステム監視装置はISPAaの保守会社Aaに障害通報を行う。インターネット利用者にはWeb上にて障害情報(パスワード申請は利用できません等)を提供する。保守会社Aaが代替サービスを持たない場合、保守会社から障害復旧見込等の情報を提供してもらいインターネット利用者へ情報(XX障害によりパスポート申請はHH時MM分まで利用できません等)を提供する。保守会社Aaより障害復旧連絡を受けた場合は、直ちにサービスが正常に起動しているかを確認する。確認の結果、正常に起動していれば、インターネット利用者に復旧情報を提供する。正常起動が確認できなかった場合、再度保守部署Aaに通報する。
【0036】
保守会社Aaが交替サービスを行っている場合は、設定された交替手順に従い交替コンテンツ、代替ルートを立ち上げる。インターネット監視システムがISPAaへのアクセス時に異常を検知した場合、インターネットシステム監視装置はISPAaの保守会社Aaに障害通報を行うと同時にISPAaの接続元であるIDCA1の保守会社A1に切替指示を行う。切替指示を受けた保守会社A1はあらかじめ用意している代替ルートISPAcに接続先を切り替える。代替ルートへの切替が完了したら、保守会社Aaは切替完了通報を行う。インターネット監視システムは切替完了通報を受けると、登録された代替ルート(IDCA1→ISPAc→IDCA2→ISPAb→IDCA3)にてサービスが正常に動作しているかどうか監視をする。
【0037】
確認の結果、正常に起動していれば、インターネット利用者に復旧情報を提供する。正常起動が確認できなかった場合、再度保守部署Aaに通報する。このネットワーク切替処理をインターネットシステム監視装置が請け負っても良い。これによりパスポート申請サービスをIDCA1→ISPAc(代替ルート)→IDCA2→ISPAb→IDCA3で提供することが可能となる。交替コンテンツ、代替ルートを使用した交替サービスはインターネット監視装置内もしくはインターネットシステム監視装置外どちらで用意しても良い。
【0038】
【発明の効果】
本発明によれば、代替サーバに監視対象サービスのドメイン、サービス提供手順を登録し、監視用ユーザを作成することでインターネットを介した複数のシステムにまたがって各種サービスを享受できるような環境全体の運用監視を実現できる。
【0039】
また、監視対象サービスと代替サーバとでデータの照合をおこなうことで、データ不正改ざんの監視を行うと同時に、監視対象サービスに障害が発生した場合は代替サーバにてサービスの提供を行うことが可能になる。これにより障害によるサービスの停止時間を短縮し、サービス利用者に安全性及び可用性の高いシステム及びサービスを提供することができる。
【図面の簡単な説明】
【図1】本発明を達成するために必要なインターネットシステム監視装置の構成図。
【図2】本発明の稼動状態監視動作フローチャート。
【図3】本発明のデータ同期動作フローチャート。
【図4】本発明の運用切替動作フローチャート。
【図5】本発明の監視対象管理テーブル概念図。
【図6】稼動状況管理テーブル概念図。
【図7】本発明のインターネットシステム監視方法の実施例を示す図。
【図8】本発明のインターネットシステム交替方法の実施例を示す図。
【符号の説明】
1…稼動状況監視部、2…改ざん監視部、3…不正アクセス監視部、4…障害通報部、5…運用切替部、6…監視情報部、7…交替用データ部、A1〜A3、B1〜B2…IDC/保守会社、Aa〜Ac、Ba…ISP/保守会社。
【発明の属する技術分野】
本発明は、複数のネットワークを介して接続する利用者に各種サービスを利用できるような環境のシステム運用監視及び交替運用による高可用性を実現する方法として、システム運用、稼動状況を利用者の視点から監視する装置に関する。
【0002】
【従来の技術】
近年インターネット技術の発達に伴い、ほぼ全世界のサーバまたはコンピュータがネットワークを介してつながり、インターネット技術を利用したサービスの利用者は国内だけでなく海外にも広がっている。それに伴い1つのサーバが全サービスを提供するのではなく、各地にコンピュータを分散配置して広範囲なエリアでサービスを分散提供するシステムも現れている。このようなサービスが正常に稼動していることを確認するには、ネットワークを含めたシステム全体の運用監視及び稼動状況監視を利用者と同じレベルから行うことが重要である。
【0003】
また、インターネットというオープンネットワーク環境では、コンテンツへの不正アクセスや、クラッカーによるデータ改ざん、システム破壊の危険が常に潜在しており、これらを考慮したセキュリティ対策が不可欠となっている。
【0004】
以上のような状況を踏まえ、利用者と同じ立場で監視対象が正常に稼動しているか監視する方法として、外部に設けた監視センターから監視対象の稼動状況監視や不正改ざん監視を行う特開2001−306419号公報や、ホームページの内容のコピーを取り出しオリジナルと比較することで改ざんを検出する特開2001−331374号公報のような方法が提案されている。
【0005】
【発明が解決しようとする課題】
従来の一般的なシステム監視方法は、サーバやプロセスの起動状態や各種システムログファイルの監視といったシステム内部からの監視であり、回線障害や、性能劣化、一部の機能閉塞というような内部のログ情報だけでは検出できない障害に対応できない。特開2001−306419号公報に記載のシステムのように外部にセンタを設けて監視する方法でも、個々のコンテンツまたは個々のシステムに存在するサービスを想定しており、複数システムが順番にまたは連携して結果を出すタイプのサービス全体の整合性を監視することができなかった。また、上記公知のシステムではホームページの不正改ざんや監視対象機器の異常検知と通報を提供しているが、異常検知発見後に代替サイトへサービスを切り替えることはサポートしていなかった。
【0006】
本発明の目的は、上記課題を解決しサービス利用者の観点からサービス全体の運用監視を実現し、利用者に安全性及び可用性の高いシステム及びサービスを提供することにある。
【0007】
本発明の他の目的は、サービスに障害が発生した場合に速やかに代替サービスへ切り替える処理を支援することにある。
【0008】
【課題を解決するための手段】
本発明の第一の目的を達成するために、本発明では監視対象コンテンツやサービスの存在するネットワークにつながる別のネットワーク上にインターネット上のサービスを横断的に監視するインターネットシステム監視装置を設ける。望ましくはネットワークが階層構造を取る場合は利用者と同じ階層レベルのネットワーク上に設ける。インターネット監視装置はInternet Data Center(以下IDCと略す)やInternet Services Provider(以下ISPと略す)から監視依頼を受ける。
【0009】
監視装置は監視対象として登録したサービスの稼動状態監視機能、対象の存在するサーバの稼動状態監視機能、対象のネットワーク稼動状態監視機能、および障害通報機能を備える。さらにコンテンツ改ざんを監視する場合は、コンテンツの複製または特徴値のファイルと監視中のコンテンツとを比較するデータの同期機能を備える。
【0010】
サービスの稼動状況を監視する場合、監視装置上に監視対象となるサービスを構成するサーバ群及び各サーバに接続するハードウェア群からサービスの提供を受けるサービス利用者と同等の権限を持たせたユーザ情報と、サービス利用者が対象システムに対して実行する処理手順及びネットワーク上のどのルートを通るかをチェックシナリオとしてインターネット監視装置に登録する。インターネット監視装置は、チェックシナリオを用いて監視対象サービスに接続し、サービス利用者のネットワークパスに従って常にサービスが正常に動作しているかどうかを監視する。監視は一定時間間隔で行う。監視処理に対するサービスの標準処理時間、戻り値、及びステータスを予め設定しておき、実行したサービスが標準処理時間の許容範囲内でかつ、正常な戻り値及びステータスにて終了した場合に、対象処理が正常にサービスを提供できていると判断する。インターネット監視装置は監視結果による稼動情報をWebもしくはメールにて監視依頼元に提供する。監視依頼元はこれを利用し、利用者に対し利用目的のサービスが利用可能かどうかを利用者に通報することができる。
【0011】
監視を行ったサービスが異常をあらわす戻り値やステータスを返した場合、あるいは実行したサービスが標準処理時間の許容範囲を越えても回答を返さない場合、インターネットシステム監視装置は、対象処理に異常が発生したと判断し、どのシステム及びどのハードウェア装置で異常が発生したのかを検知する処理を行う。
【0012】
インターネットシステム監視装置には監視対象として設定された各システム管理及びシステム保守権限を持つユーザ情報を設定しておき、その権限で各サーバにアクセスし、サーバ監視機能及びネットワーク監視機能によりログを取得・解析し、各サーバの異常及び各ネットワークの異常を検知する。サーバやネットワークに異常が無い場合は個々のサービスプログラムの挙動をテストし、予め想定した戻り値との差異を検出してどのプログラムまたはどのプログラムの組み合わせに異常があるかを特定する。
【0013】
さらにインターネットシステム監視装置に監視依頼元、システム運用保守部署の連絡先を登録しておき、障害発生時には障害通報機能により障害個所及び障害原因、ボトルネック個所及びボトルネック原因を通報する。障害が復旧した場合は、復旧したサービスが正常に利用できることをチェックし、その結果利用可能となったことを監視依頼元に通報する。
【0014】
インターネットシステム監視装置は上記運用監視及び稼動状況把握とは別に、監視対象となるシステムがインターネットを介して外部公開している情報の不正改ざん及び提供サービスの不正処理がされていなことを監視する改ざん監視機能と不正アクセス監視機能を有する。
【0015】
インターネットを介して外部公開しているコンテンツ情報を、あらかじめマスタとしてインターネットシステム監視装置に保管しておき、データ同期機能にて定期的にインターネットシステム監視装置に保管されたマスタと外部公開情報との差分チェックを実施しデータが更新されているかを確認する。このチェックは両者の特徴値を比較することによっても良い。
【0016】
データ更新がインターネットを介してサービスを提供するシステムへの不正アクセス及び不正処理によって行われたものであった場合は、不正アクセス監視機能のログを解析して検知することができる。不正アクセスを検知するため、インターネットシステム監視装置に監視システムに接続するサービス利用者情報と、サービスの提供を受けるために必要なシステムアクセス順序情報を登録し、サービスを提供しているシステムを構成するサーバ群から出力されるログイン情報及びジョブログを解析して不正アクセス及び不正処理が行われたかを検知する。
【0017】
不正アクセス監視機能にて不正アクセスもしくは、不正処理が検知されなかった場合には正当な権限者によるデータ更新と判断し、インターネットシステム監視装置側に保存したマスタデータを更新する。不正アクセスもしくは、不正処理を検知した場合、障害通報機能にてサービス提供元及びシステム運用保守署へ通報する。
【0018】
本発明の第二の目的を達成するために、本発明の第一の目的を実現する構成に加え、運用切替機能を設定する。稼動状態監視機能、不正アクセス監視機能のいずれかで異常を検出した場合に監視依頼元及びシステム運用保守部署へ通報後、障害がサービス提供サーバのものであった場合、インターネットシステム監視装置は同期しているマスタデータと対象システムのハードウェア構成・ネットワーク構成に関する情報を用いて代替コンテンツを構成し、本番機に替わってサービスの提供を開始する。代替コンテンツを立ち上げる機能はインターネット監視装置の内部であっても外部であっても良い。
【0019】
障害がネットワーク障害であった場合は、障害代替操作を有するISPと連携し設定された代替ルートまたは迂回ルートにネットワークを切り替える。代替ルートまたは迂回ルートへの切替操作は監視依頼元およびISPが行ってもインターネット監視装置が行っても良い。
【0020】
代替切替の操作及び指示は異常時チェックシナリオで行う。
【0021】
インターネットシステム監視装置はネットワーク的に本番機サーバと別エリアに属しており、IPアドレスといったサーバ属性情報も異なるサイトとして起動される。サーバ等のハードウェア障害の場合は本番システムへのアクセスは物理的に不可能なので、複数のサービスで構成される場合、障害システムの上流システムへデータ送信先の変更を依頼し、自動的に代替サーバへ転送されるようにする。単独サービスの場合は、通常運用しているページに障害時のアドレス情報を表示しておき、利用者が接続不可を検知した場合代替サイトを試みるように指示しておく。コンテンツやサービスに障害がある場合、サーバやネットワークは正常なので、管理者権限によりサーバの対象個所に自動転送ページを設定する。
【0022】
【発明の実施の形態】
本発明のインターネットシステム監視装置の実施の一形態を以下に図を用いて説明する。
【0023】
図1は本発明を実現するためのシステム構成図である。インターネットシステム監視装置は監視対象インターネットシステムとインターネット網を通じて接続し、監視対象サービスの監視を行う稼動状態監視部1と不正改ざんを判定する改ざん監視部2、不正アクセス及び不正処理を検知する不正アクセス監視部3を備えてサービス稼動状況監視と改ざん監視と不正アクセスの監視を行う。障害発生時には各監視部署に通報する障害通報部4により対象となる連絡先に通報し、障害発生システムと運用を切り替える運用切替部5により代替ルート又は代替コンテンツへの切り替えを実施する。
【0024】
次にインターネットシステム監視の処理手順について説明する。
【0025】
図2は本発明のインターネットシステム稼動監視処理を示すフロー図である。インターネットシステム監視装置の稼動状態監視部1によって、監視対象管理テーブルに予め登録しているサービスの中から監視をおこなうサービスが選定される(S11)。監視対象管理テーブルに登録されている監視対象となるサービスを受けるために利用者が実行する処理手順とサーバアクセス順序、レスポンスしきい値に基づき選定されたサービスの監視ジョブを実行する(S12)。上記の手順は図6に示すようなテーブルに監視対象毎に予め登録しておく。
【0026】
テーブル構成は、各サービス名に対応して、正常時アクセスルート、異常時アクセスルート、処理手順、監視間隔、レスポンスしきい値、とサービスを実行するための権限をもつユーザID、システム保守権限をもつユーザIDからなる。
【0027】
監視ジョブの実行結果の判定は、サーバが正常稼動しているか(S13)、各サーバが提供するサービスは正常に動作したか(S14)、各サービスのレスポンスタイムはしきい値を上回るものではなかったか(S15)の順に判定を行う。いずれかの判定においてエラーが検出された場合、エラー内容およびエラー発生箇所情報を障害通報部4へ渡し(S16)、障害通報部4で稼動状態監視部1から受け取ったエラー内容、エラー発生箇所から監視対象管理テーブルにより対応する管理部署を特定し障害通報を行う(S17)。監視ジョブの実行結果は稼動状況管理テーブルに格納する(S18)。稼動状況管理テーブルの情報を監視依頼元はもちろんサービス利用者にも提供する。
【0028】
図6に稼動状況管理テーブルの構成の一例を示す。監視サービス名、サービス拠点に対応つけて、監視結果、監視時間、通報用メッセージ、交替処理手順を格納する。(S18)にて監視結果、監視時間を更新する。
【0029】
図3は本発明のインターネットシステム監視装置によるコンテンツ改ざん監視処理を示すフロー図である。監視対象サービスのシステムメンテナンスによるデータ更新は、まずインターネットシステム監視装置のマスタデータを更新し、インターネット監視システムから対象コンテンツへデータを配布するという順序で行うものとする。改ざん監視部2により監視対象管理テーブルに格納された監視間隔に基づき、対象コンテンツのデータを取得し、インターネットシステム監視装置に事前に登録している監視対象のマスタデータとの差分チェックを行う(S21)。差分チェックの結果によりデータ変更があったかどうかの判定を行う(S22)。データ変更があった場合、対象システムのジョブログ、アクセスログを取得する(S23)。システムログは定期的に取得しておいても良い。取得したジョブログ、アクセスログからデータ変更が正規ユーザによる処理によって更新されたものであるかの判定を行う(S24)。データ変更が正規ユーザによる正規処理である場合、マスタデータへの登録漏れと判断し、マスタデータを変更内容に更新し、確認日時を更新する(S25)。データ変更が無い場合は、マスタデータの確認日時を更新する。データ変更が不正ユーザもしくは不正処理による変更であると判定した場合、エラー内容およびエラー発生箇所を障害通報部4へ渡す(S26)。障害通報部4が稼動状態監視部から受け取ったエラー内容、エラー発生箇所を監視対象管理テーブルと照らし合わせエラー発生箇所管理部署へ障害通報を行う(S27)。監視結果を稼動状況管理テーブルに格納する(S28)。
【0030】
図4は本発明のインターネットシステム運用切替処理を示すフロー図である。上記サービス状況監視処理において障害通報部4が、サービス提供不能と判断されるエラーレベルの高いエラー情報を受け取った場合、エラー発生箇所保守部署に障害通報および切替指示を行う(S31)。切替操作を請け負っている場合は、障害通報後運用切替部5は稼動状況管理テーブルに登録されている交替手順に基づき交替コンテンツまたは代替ルートを立ち上げる(S32)。障害がサーバ等のハードウェア障害であった場合、インターネットシステム監視装置に登録されている、障害が発生したサービスのマスタデータを有効化し、障害が発生したサービスと同等の環境を作成する。障害がネットワーク障害であった場合、事前に用意している代替ルートにネットワークを切り替える。交替手順が完了したら、稼動状況監視部1が、交替コンテンツまたは代替ルートに対し起動確認を実施する(S33)。起動確認にて交替コンテンツまたは代替ルートが正常に起動しているか判定する(S34)。交替コンテンツまたは代替ルートの正常起動が確認できた場合、エラー発生個所保守部署、及びエラー発生個所接続元保守部署に交替完了通報とサービス切替指示を行う(S35)。通報を受けたエラー発生個所接続元保守部署は、接続先を交替コンテンツ又は代替ルートに切り替え、障害発生サービスへのアクセスを交替コンテンツまたは代替ルートへ転送する。交替コンテンツまたは代替ルートの正常起動が確認できなかった場合、(S32)から再実行する。再実行回数の限界値を設定しておき、再実行回数が限界値を上回った場合は、手動にて切り替える。
【0031】
図7は本発明のインターネットシステム監視処理実施例である。
【0032】
本発明の監視サービスは、IDCやISPから監視依頼を受けるものである。監視依頼があった場合は、監視を行うために必要な情報(サービスの提供を受けるために利用者が使用するネットワークパス、監視ユーザ、保守ユーザ等)を提供してもらう。交替サービスを依頼された場合は、依頼元と連携し代替ルートの設定や交替切替手順の設定を行う。ここで監視対象システムは、パスポート申請をインターネット上で行うサービスと、住民票の発行をインターネット上で行うサービスとする。IDCA1、A2、A3にてパスポート申請サービスを提供し、IDCB1、B2、B3にて住民票発行サービスを提供する。
【0033】
パスポート申請サービスの処理ルートをIDCA1→ISPAa→IDCA2→ISPAb→IDCA3、住民票発行サービスの処理ルートをIDCB1→ISPBa→IDCB2とする。インターネットシステム監視装置は、登録された処理ルートに従い定期的にインターネット上を横断しサービスが正常に動作しているかどうか監視する。監視結果(現在パスポート申請サービスは利用できます等)を監視依頼元にWebまたはメールで提供する。インターネット利用者にはWeb上にて情報を提供する。定期的に監視を行っている中で障害を検知した場合は、障害が発生しているという情報を提供する。
【0034】
図8は本発明のインターネットシステム運用切替処理実施例である。
【0035】
ここではISPAaに障害が発生したものとする。パスポート申請サービスの監視にて、ISPaへアクセス時に異常を検知した場合、インターネットシステム監視装置はISPAaの保守会社Aaに障害通報を行う。インターネット利用者にはWeb上にて障害情報(パスワード申請は利用できません等)を提供する。保守会社Aaが代替サービスを持たない場合、保守会社から障害復旧見込等の情報を提供してもらいインターネット利用者へ情報(XX障害によりパスポート申請はHH時MM分まで利用できません等)を提供する。保守会社Aaより障害復旧連絡を受けた場合は、直ちにサービスが正常に起動しているかを確認する。確認の結果、正常に起動していれば、インターネット利用者に復旧情報を提供する。正常起動が確認できなかった場合、再度保守部署Aaに通報する。
【0036】
保守会社Aaが交替サービスを行っている場合は、設定された交替手順に従い交替コンテンツ、代替ルートを立ち上げる。インターネット監視システムがISPAaへのアクセス時に異常を検知した場合、インターネットシステム監視装置はISPAaの保守会社Aaに障害通報を行うと同時にISPAaの接続元であるIDCA1の保守会社A1に切替指示を行う。切替指示を受けた保守会社A1はあらかじめ用意している代替ルートISPAcに接続先を切り替える。代替ルートへの切替が完了したら、保守会社Aaは切替完了通報を行う。インターネット監視システムは切替完了通報を受けると、登録された代替ルート(IDCA1→ISPAc→IDCA2→ISPAb→IDCA3)にてサービスが正常に動作しているかどうか監視をする。
【0037】
確認の結果、正常に起動していれば、インターネット利用者に復旧情報を提供する。正常起動が確認できなかった場合、再度保守部署Aaに通報する。このネットワーク切替処理をインターネットシステム監視装置が請け負っても良い。これによりパスポート申請サービスをIDCA1→ISPAc(代替ルート)→IDCA2→ISPAb→IDCA3で提供することが可能となる。交替コンテンツ、代替ルートを使用した交替サービスはインターネット監視装置内もしくはインターネットシステム監視装置外どちらで用意しても良い。
【0038】
【発明の効果】
本発明によれば、代替サーバに監視対象サービスのドメイン、サービス提供手順を登録し、監視用ユーザを作成することでインターネットを介した複数のシステムにまたがって各種サービスを享受できるような環境全体の運用監視を実現できる。
【0039】
また、監視対象サービスと代替サーバとでデータの照合をおこなうことで、データ不正改ざんの監視を行うと同時に、監視対象サービスに障害が発生した場合は代替サーバにてサービスの提供を行うことが可能になる。これにより障害によるサービスの停止時間を短縮し、サービス利用者に安全性及び可用性の高いシステム及びサービスを提供することができる。
【図面の簡単な説明】
【図1】本発明を達成するために必要なインターネットシステム監視装置の構成図。
【図2】本発明の稼動状態監視動作フローチャート。
【図3】本発明のデータ同期動作フローチャート。
【図4】本発明の運用切替動作フローチャート。
【図5】本発明の監視対象管理テーブル概念図。
【図6】稼動状況管理テーブル概念図。
【図7】本発明のインターネットシステム監視方法の実施例を示す図。
【図8】本発明のインターネットシステム交替方法の実施例を示す図。
【符号の説明】
1…稼動状況監視部、2…改ざん監視部、3…不正アクセス監視部、4…障害通報部、5…運用切替部、6…監視情報部、7…交替用データ部、A1〜A3、B1〜B2…IDC/保守会社、Aa〜Ac、Ba…ISP/保守会社。
Claims (2)
- 1または複数のシステムの組み合わせ、またはネットワークを介した複数のシステムの連携で構築したサービスを、インターネットを介した1台の端末の操作によりワンクリックで利用する環境、もしくはインターネット上のアプリケーションサービスプロバイダを介して利用する環境において、監視対象と物理的に異なるネットワーク上に位置し、サービス利用者の立場に立って定期的にインターネット上のサービスを横断的にアクセスし、サービス全体の稼動状態および各コンテンツの同一性、各プログラムの動作の正常性と監視対象が存在する各サーバの稼動状態と監視対象が位置する各ネットワークへの接続状態とを監視し、障害個所及び障害内容を検知することを特徴とするインターネットシステム監視装置。
- 請求項1に記載のインターネットシステム監視装置において、監視項目のいずれかに障害が発生したことを検知した場合に、物理的に異なるネットワーク上に位置するサーバ上に設定した代替コンテンツまたはサービスへの切り替えを行う手段を有することを特徴とするインターネットシステム監視装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002179306A JP2004021873A (ja) | 2002-06-20 | 2002-06-20 | インターネットシステム監視装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002179306A JP2004021873A (ja) | 2002-06-20 | 2002-06-20 | インターネットシステム監視装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004021873A true JP2004021873A (ja) | 2004-01-22 |
Family
ID=31176727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002179306A Pending JP2004021873A (ja) | 2002-06-20 | 2002-06-20 | インターネットシステム監視装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004021873A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006285377A (ja) * | 2005-03-31 | 2006-10-19 | Fujitsu Ltd | 故障監視プログラム及び負荷分散装置 |
JP2006309535A (ja) * | 2005-04-28 | 2006-11-09 | Matsushita Electric Ind Co Ltd | 携帯サイト監視システム |
JP2007266776A (ja) * | 2006-03-27 | 2007-10-11 | Fujitsu Ltd | 複数サーバ間でのサービス正常動作監視システムおよびその方法 |
JP2007529067A (ja) * | 2004-03-12 | 2007-10-18 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 自己修復複合ウェブ・サービスのための方法及び装置 |
JP2009169522A (ja) * | 2008-01-11 | 2009-07-30 | Canon Inc | データ共有システム、データ共有方法、情報処理装置、プログラムおよび記憶媒体 |
CN102713880A (zh) * | 2010-01-04 | 2012-10-03 | 微软公司 | 用于基于云的服务和应用的监视联盟 |
-
2002
- 2002-06-20 JP JP2002179306A patent/JP2004021873A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007529067A (ja) * | 2004-03-12 | 2007-10-18 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 自己修復複合ウェブ・サービスのための方法及び装置 |
JP2006285377A (ja) * | 2005-03-31 | 2006-10-19 | Fujitsu Ltd | 故障監視プログラム及び負荷分散装置 |
JP2006309535A (ja) * | 2005-04-28 | 2006-11-09 | Matsushita Electric Ind Co Ltd | 携帯サイト監視システム |
JP4648074B2 (ja) * | 2005-04-28 | 2011-03-09 | パナソニック株式会社 | 携帯サイト監視システム |
JP2007266776A (ja) * | 2006-03-27 | 2007-10-11 | Fujitsu Ltd | 複数サーバ間でのサービス正常動作監視システムおよびその方法 |
JP2009169522A (ja) * | 2008-01-11 | 2009-07-30 | Canon Inc | データ共有システム、データ共有方法、情報処理装置、プログラムおよび記憶媒体 |
CN102713880A (zh) * | 2010-01-04 | 2012-10-03 | 微软公司 | 用于基于云的服务和应用的监视联盟 |
US9674055B2 (en) | 2010-01-04 | 2017-06-06 | Microsoft Technology Licensing, Llc | Monitoring federation for cloud based services and applications |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7076801B2 (en) | Intrusion tolerant server system | |
US10348577B2 (en) | Discovering and monitoring server clusters | |
Pertet et al. | Causes of failure in web applications | |
JP3351318B2 (ja) | 計算機システムの監視方法 | |
CN103391216B (zh) | 一种违规外联报警及阻断方法 | |
US7512062B2 (en) | Method to maintain the integrity of remote data by making it disposable | |
JP2004258777A (ja) | セキュリティ管理装置、セキュリティ管理システム、セキュリティ管理方法、セキュリティ管理プログラム | |
US20030196148A1 (en) | System and method for peer-to-peer monitoring within a network | |
JP2008537203A (ja) | 障害復旧フレームワーク | |
JP2011527472A (ja) | ウェブページ改竄防止設備、ウェブページ改竄防止方法及びそのシステム | |
JP2004021549A (ja) | ネットワーク監視システムおよびプログラム | |
CN113489691B (zh) | 网络访问方法、装置、计算机可读介质及电子设备 | |
Reynolds et al. | On-line intrusion detection and attack prevention using diversity, generate-and-test, and generalization | |
JP2012526501A (ja) | ネットワーク内容改竄防止設備、方法及びそのシステム | |
CN112242924B (zh) | 一种主备模式的拟态括号实现装置及方法 | |
JPWO2022255247A5 (ja) | ||
CN108933693A (zh) | 一种域名服务系统故障处理方法和系统 | |
JP2004021873A (ja) | インターネットシステム監視装置 | |
US8370897B1 (en) | Configurable redundant security device failover | |
JP6555721B2 (ja) | 障害復旧システム及び方法 | |
CN117435405A (zh) | 双机热备和故障切换系统和方法 | |
US10574659B2 (en) | Network security management system | |
CN114301763B (zh) | 分布式集群故障的处理方法及系统、电子设备及存储介质 | |
CN115776414A (zh) | 一种监测方法、装置、电子设备及可读存储介质 | |
Reynolds et al. | On-line intrusion protection by detecting attacks with diversity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050603 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070807 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071211 |