JP2015513722A

JP2015513722A - コンピュータ・ネットワーク用のトランザクション実行監視方法及びシステム並びにコンピュータ記憶媒体

Info

Publication number: JP2015513722A
Application number: JP2014556914A
Authority: JP
Inventors: ウエイルオ; チャオジアーンジャン; シュワイヤーン; ヤオジャオ
Original assignee: テンセントテクノロジー（シェンツェン）カンパニーリミテッド
Priority date: 2012-04-17
Filing date: 2013-03-19
Publication date: 2015-05-14
Anticipated expiration: 2033-03-19
Also published as: CN103378982A; KR20140145115A; JP5982015B2; US20140189431A1; WO2013155912A1; US20140164840A1

Abstract

インタラクティブインターフェースの表示制御方法は、連絡先リスト及び前記連絡先リストにおける友人のメッセッジを取得するステップと、前記連絡先リストにおいての友人に対応する画像ブロックを生成するステップと、前記友人のメッセッジを画像ブロックに提示するステップと、を含む。上記インタラクティブインターフェースの表示制御方法及びリアルタイム通信装置並びにコンピュータ記憶媒体は、連絡先リストにおける友人毎に、対応する画像ブロックを生成し、該友人のメッセッジを画像ブロックに提示するので、ユーザーはインターフェースにおける画像ブロックを通じて友人のメッセッジを直接に見ることができ、操作が便利化されて、操作の便利性が向上する。

Description

本発明は、トランザクション実行監視技術に関し、特に、インターネット・トランザクション実行監視方法及びシステム並びにコンピュータ記憶媒体に関する。

ネットワークでは、各種トランザクションが実行されている。例えば、オープンプラットフォームでの第三者アプリケーション、仮想仮想ネットワークコミューニティー及び動映像再生ウェブサイトなどは、常に実行環境によってユーザーにサービスを提供する。この実行環境は、トランザクションのために論理処理やデータ記憶を提供するためのいろいろな要素を含む。トランザクションの実行中では、必ずトランザクション及び実行環境に発生する故障を密接に注視し、直ちに分析と処理を行わなければならない。

従来のトランザクション監視方法では、実行環境を種類毎にリアルタイムに監視し、この実行環境は、ネットワーク環境、サーバなどのデバイス、トランザクションコンポーネント、及びトランザクションソフトウエアなどを含む。ある実行環境に異常状況が発生したことが監視されると、メッセージ又はメールの方式で警告を発送し、トランザクションメンテナンスを行う作業者が警告内容を確認して、故障が発生した実行環境を認識するようにする。

しかし、各種実行環境同士は互いに依存する。ユーザーに安定的で正常的に実行するトランザクションを提供するために、例えば、トランザクションソフトウエアは、トランザクションコンポーネントの正常的な実行に依存し、トランザクションソフトウエアとトランザクションコンポーネントとはいずれもネットワーク環境、サーバなどの実行環境に依存する。このため、トランザクション実行中において、ある実行環境に故障が発生したことが監視された場合、常に大規模な警告が引き起こされ、トランザクションメンテナンスを行う作業者に多量の警告内容が送信されて、故障の位置特定が正確に実現できなくなる。

よって、トランザクション監視において大規模な警告が発生する問題に対して、故障の位置特定を正確に実現できるインターネット・トランザクション実行監視方法を提供する必要がある。

また、故障位置特定を正確に行うことが可能なインターネット・トランザクション実行監視システムを提供する必要がある。

また、故障位置特定を正確に行うことが可能なコンピュータ記憶媒体を提供する必要がある。

インターネット・トランザクション実行監視方法は、
インターネット・トランザクションの監視データを取得し、前記監視データから異常データを抽出するステップと、
前記異常データに基づいて対応する異常サービスを取得するステップと、
前記異常サービスに基づいてアーキテクチャ層において位置特定を行うことにより実行故障元を得るステップと、を含む。

インターネット・トランザクション実行監視システムは、
インターネット・トランザクションの監視データを取得し、前記監視データから異常データを抽出するデータ監視モジュールと、
前記異常データに基づいて対応する異常サービスを取得する異常サービス取得モジュールと、
前記異常サービスに基づいてアーキテクチャ層において位置特定を行うことにより実行故障元を得る検出モジュールと、を含む。

インターネット・トランザクション実行監視方法を制御するためのコンピュータ実行可能命令を記憶するためのコンピュータ記憶媒体において、前記インターネット・トランザクション実行監視方法は、
インターネット・トランザクションの監視データを取得し、前記監視データから異常データを抽出するステップと、
前記異常データに基づいて対応する異常サービスを取得するステップと、
前記異常サービスに基づいてアーキテクチャ層において位置特定を行うことにより実行故障元を得るステップと、を含む。

上記インターネット・トランザクション実行監視方法及びシステム、およびコンピュータ記憶媒体では、異常が発生したサービスについて、アーキテクチャ階層(architecture layer level)に従ってそのサービスと関連するアーキテクチャ層を検出して実行故障元を得ることにより、各アーキテクチャ層に発生した故障がサービス異常を引き起こす要因になるかを確認し、ひいては複数のアーキテクチャ層において実行故障の位置特定を正確に実現するので、トランザクションメンテナンスを行う作業者が多量の警告内容を一つずつ分析する必要がない。

一実施例におけるインターネット・トランザクション実行監視方法を示すフローチャートである。一実施例におけるアーキテクチャ構造を示す図である。一実施例における異常サービスに基づいてアーキテクチャ層で位置特定することにより実行故障元を得る方法を示すフローチャートである。記録された異常点を、アーキテクチャ階層におけるアーキテクチャ層の順に処理することにより実行故障元を得る方法を示すフローチャートである。一実施例におけるインターネット・トランザクション実行監視システムの構成を示す図である。一実施例における検出モジュールの構成を示す図である。別の実施例における検出モジュールの構成を示す図である。

図１に示すように、一実施例におけるインターネット・トランザクション実行監視方法は、以下のようなステップを含む。

ステップＳ１０では、インターネット・トランザクションの監視データを取得し、監視データから異常データを抽出する。

本実施例において、監視トランザクションの実行中で、トランザクションが正常か否かを明確に反映するための監視データを得る。例えば、この監視データは、ユーザーのオンライン数やユーザーのコンプレイン数やウェブページにアクセスする際に発生した遅延などであることができる。監視データは、正常実行状態でのデータ、及び実行中に故障が発生する際の異常データを含み、異常データは、例えば、ウェブページが使用できない旨を示すデータであることができる。

ステップＳ３０では、異常データに基づいて異常サービスを取得する。

本実施例において、トランザクション実行中に、各サービスによりユーザーにいろんな機能を提供する。例えば、あるトランザクションにおいて、複数のサービスが提供する各小機能が、そのアプリケーションの処理能力を形成する。抽出された異常データに基づいて故障が発生した異常サービスが得られ、後続の処理によりそのサービスの故障の発生を引起した原因が得られる。

ステップＳ５０では、異常サービスに基づいてアーキテクチャ層で実行故障元位置特定を行うことにより実行故障元を取得する。

本実施例において、トランザクションが実行されるアーキテクチャ構造は、アクセス層と、論理層と、データ層とを備える。ここで、論理層は、ユーザーにインターフェースを表示するページを提供し、ユーザーの各要求に応答し、また論理処理を行う。データ層は、データを記憶するためのもので、トランザクションは、アーキテクチャ構造で実行されてユーザーの各種要求に応答する。具体的に、アーキテクチャ構造は階層状のモデルで、前端から後端の順に、アクセス層と、論理層と、データ層とを備える。ここで、アクセス層は、ユーザーの要求を処理し、要求を後端の論理層へ転送する。論理層は、アクセス層から入力されたユーザーの要求を処理し、データ層に記憶されたデータを使ってトランザクション論理処理を行い、処理構造をアクセス層に戻す。データ層は、データを一時的に又は持続的に保存する。

図２に示すように、アーキテクチャ層が、アクセス層であるか、論理層であるか、又はデータ層であるかに関係なく、各階層はいずれもトランザクションソフトウエアと、トランザクションコンポーネントと、基礎ネットワークと、基本デバイスと、インフラストラクチャなどのような要素を含む。ここで、トランザクションコンポーネントは、パブリックドメインソフトウェアパッケージ、又はソフトウエアアーキテクチャパッケージであり、例えば、WebＳerver コンポーネントと、ネットワーク通信コンポーネントと、データベースコンポーネントなどである。トランザクションソフトウエアは、トランザクションコンポーネント上で実行され、多くはユーザーがアクセスするように直接に提供されるプログラムであり、例えば、ユーザーにインターフェースを表示するページを提供するインターフェース（Common Gateway Interface、cgiと略する）をその一つの例とする。基本デバイスは、サーバと、スイッチと、ルーターなどの設備である。インフラストラクチャは、データセンターと、電力供給装置と、データセンタースペースなどの施設である。

また、トランザクション実行アーキテクチャ構造は、アクセス層と論理層とデータ層の区画ではなく、直接、トランザクションソフトウエアと、トランザクションコンポーネントと、基本デバイスと、インフラストラクチャとによって、アーキテクチャ階層の設定を行ってもよい。

トランザクション実行アーキテクチャ構造において、異常サービスが位置するアーキテクチャ層を検出する他にも、更にこの異常サービスと関連する複数のアーキテクチャ層も検出して、実行故障元の位置特定を実現することにより、サービス異常の発生を引起している故障原因を得るようにする必要がある。

上記インターネット・トランザクション実行監視方法は、監視データ中の異常データに基づいて対応する異常サービスを取得し、異常サービスに基づいて関連するアーキテクチャ層において位置特定を行うことにより実行故障元を取得するが、ただ異常サービスをインターネット・トランザクション実行中の実行故障元とみなすだけではなく、それに応じて異常サービスと関連するアーキテクチャ層を検出することにより、実行故障元の位置特定を実現し、監視の正確性を向上するとともに、インターネット・トランザクションのメンテナンスも一層便利化する。

図３に示すように、一実施例において、上記のステップＳ５０の具体的な過程は以下のとおりである。

ステップＳ５１０では、異常サービスが位置するアーキテクチャ層に異常が存在するか否かを検出し、Yesの場合、ステップＳ５２０に移行し、Noの場合、終了する。

本実施例において、異常サービスが位置するアーキテクチャ層における各セグメントに異常があるか否かを検出し、該アーキテクチャ層に出現した異常点を記録する。アーキテクチャ層及びアーキテクチャ層における要素によって、対応する異常点がそれぞれ異なる。具体的に、異常点は、アーキテクチャ層及びアーキテクチャ層における要素に異常があるか否かを判定するためのもので、異常現象に関する記述である。例えば、アーキテクチャ層の基本デバイスについて、異常点は、サーバと接続できないことであり、基礎ネットワークについて、異常点は、ネットワークパケットロス率 (Packet loss rate)が３０%を超えたことである。

ステップＳ５２０では、異常サービスが位置するアーキテクチャ層と対応する異常点を記録する。

ステップＳ５３０では、異常サービスと関連する次のアーキテクチャ層を開始層として、前端から後端の順に各層毎に検出を行い、検出されたアーキテクチャ層に異常が存在するか否かを判断する。Yesの場合、ステップＳ５4０に移行し、Noの場合、終了する。

において、あらゆるアーキテクチャ層のサービスはいずれも通常、次のアーキテクチャ層におけるいくつかのサービスに依存して対応する機能を実現するが、これらのサービスが下流サービスである。このため、次のアーキテクチャ層を開始層として、各層毎に検出して各アーキテクチャ層に存在する異常点を得る必要がある。具体的に、前端から後端の順にアーキテクチャ層毎に検出を行い、検出されたアーキテクチャ層に下流サービスが存在するか否かを判断し、Yesの場合、下流サービスに異常点が存在するか否かを更に判断する。下流サービスに異常点が存在すると、この異常点を記録する。ここで、トランザクション実行アーキテクチャ構造において、前端から後端の順は、アクセス層、論理層、及びデータ層の順を、又はトランザクションソフトウエア、トランザクションコンポーネント、基本デバイス、及びインフラストラクチャの順を指す。

別の実施例において、上記ステップＳ５０は、以下のようなステップを更に含む。

異常サービスが位置するアーキテクチャ層に、異常サービスと関連する次のアーキテクチャ層が存在するか否かを判断する。Yesの場合、ステップＳ５３０に移行し、Noの場合、記録された異常点を実行故障元として位置特定する。

本実施例において、異常サービスが次のアーキテクチャ層におけるサービスに依存しなくても正常的に実行できると判断された場合、異常サービスが位置するアーキテクチャ層に対応する異常点が実行故障元であるため、一層ずつ検出を行う必要がなくなり、故障検出の効率を向上させる。具体的に、次のアーキテクチャ層に関連するサービス、つまり下流サービスが存在するか否かを判断する。判断により得られた下流サービスは、判断を行う異常サービスと緊密に関連するもので、判断を行う異常サービスは下流サービスに依存して実行される。

ステップＳ５4０において、前記検出されたアーキテクチャ層に対応する異常点を記録する。

ステップＳ５５０において、アーキテクチャ階層におけるアーキテクチャ層の順に記録された異常点を処理することにより、実行故障元を得る。

本実施例において、記録された複数の異常点を集中し、アーキテクチャ階層において前端から後端までの順に処理を行って、実行故障元の位置特定を実現する。トランザクションの実行中において、あらゆるアーキテクチャ層に出現された異常点は、いずれもサービスの異常を引き起こす可能性がある。このため、全ての異常点を集中すると、可能性が一番高い故障原因を特定でき、各アーキテクチャ層中の関連分析を実現できる。具体的に、アーキテクチャ階層におけるアーキテクチャ層の順に、記録された若干の異常点に対して関連分析を行うことにより実行故障元を取得する。

上記インターネット・トランザクション実行監視方法では、集中された異常点により可能性が一番高い故障原因を特定して各アーキテクチャ層中の関連分析を行い、相対的に分散している異常点を総合的に考慮して、正確な故障原因を取得する。

一実施例において、上記ステップＳ５５０の具体的な過程は、アーキテクチャ層に対応する優先順位に従って、記録された異常点から最高優先順位に対応する異常点を実行故障元として抽出する。

本実施例において、各アーキテクチャ層に、アーキテクチャ層において異常点がサービス異常を引き起こす可能性の大きさを示す優先順位を予め設定する。言い換えると、優先順位もサービス異常を発生させる影響要素を示す。優先順位が最高の異常点は、サービス異常を発生させる影響要素が最大の異常点であり、実行故障元となる可能性が一番高い。このため、アーキテクチャ層に対応する優先順位に従って、記録された若干の異常点から優先順位が最高の異常点を抽出し、抽出された異常点により故障元の位置特定を実現できる。

最高優先順位の複数の異常点については、さらにアーキテクチャ層における要素の優先順位に基づいて、どの異常点が実行故障元であるかを特定する。例えば、インフラストラクチャに故障が発生すると、必ず基本デバイス、基礎コンポーネント及び基礎ソフトウエアに影響が与えられる。そのため、インフラストラクチャと基本デバイス共に異常点が存在する場合、インフラストラクチャでの異常点を優先して実行故障元とし、その他も類推する。

図４に示すように、別の実施例において、上記ステップＳ５５０の具体的な過程は以下のようなステップを含む。

ステップＳ５５１では、記録された異常点から最後端のアーキテクチャ層に対応する異常点を抽出する。

本実施例において、前端から後端までの順に、記録された若干の異常点から最後端のアーキテクチャ層に対応する異常点を抽出し、最後端に位置するアーキテクチャ層に発生する異常点が、サービス異常を引き起こした原因となる。

ステップＳ５５３では、抽出された異常点を、実行故障元として位置特定する。

一実施例において、上記インターネット・トランザクション実行監視方法は、実行故障元及び異常点を故障位置特定ページに提示して、トランザクションメンテナンスを行う作業者が容易に見るようにすることを更に含む。

図５に示すように、一実施例において、インターネット・トランザクション実行監視システムは、データ監視モジュール１０と、異常サービス取得モジュール３０と、及び検出モジュール５０とを含む。

データ監視モジュール１０は、インターネット・トランザクションの監視データを取得し、監視データ中から異常データを抽出するためのものである。

本実施例において、監視トランザクションの実行中で、トランザクションが正常か否かを明確に反映するための監視データを得る。例えば、この監視データは、ユーザーのオンライン数、ユーザーのコンプレイン数、及びあるウェブページにアクセスする際に発生した遅延などであることができる。監視データは、正常実行状態でのデータ、及び実行中に故障が発生した際の異常データを含み、異常データは、例えばあるページが使用できない旨を示すデータであることができる。

異常サービス取得モジュール３０は、異常データに基づいて対応する異常サービスを取得するためのものである。

本実施例において、トランザクションの実行中において各種サービスによりユーザーにいろんな機能を提供する。例えば、あるトランザクションにおいて、複数のサービスが提供する各小機能がそのアプリケーションの所有する処理能力を構成する。異常サービス取得モジュール３０は、抽出された異常データに基づいて、故障が発生した異常サービスを取得し、後続の処理により該サービスの故障の発生を引き起こした原因を得る。

検出モジュール５０は、異常サービスに基づいてアーキテクチャ層において位置特定を行うことにより、実行故障元を得るためのものである。

本実施例において、トランザクションが実行されるアーキテクチャ構造は、アクセス層と、論理層と、データ層とを備える。ここで、論理層は、ユーザーにインターフェースを表示するページを提供し、ユーザーの各要求に応答し、論理処理を行う。データ層は、データを保存するためのものであり、トランザクションは、アーキテクチャ構造で実行されてユーザーの各要求に応答する。具体的に、アーキテクチャ構造はレイヤ形状のモデルであって、前端から後端までの順にアクセス層と、論理層と、データ層とを含む。ここで、アクセス層は、ユーザーの要求を処理して後端の論理層へ転送する。論理層は、アクセス層から入力されたユーザーの要求を処理し、データ層に記憶されたデータを使ってトランザクション論理処理を行い、処理構造をアクセス層に戻す。データ層は、データを一時的に又は持続的に保存するためのものである。

アーキテクチャ層がアクセス層であるか、論理層であるか、それともデータ層であるかに関わらず、各階層はいずれもトランザクションソフトウエア、トランザクションコンポーネント、基礎ネットワーク、基本デバイス、及びインフラストラクチャなどの要素を備える。ここで、トランザクションコンポーネントは、パブリックドメインソフトウェアパッケージ又はソフトウエアアーキテクチャパッケージである。トランザクションソフトウエアは、トランザクションコンポーネント上に実行され、多くは、直接にユーザーにアクセスするように提供されるプログラムである。基本デバイスは、サーバ、スイッチ、ルーターなどのデバイスであり、インフラストラクチャは、データセンター、電力供給装置、データセンタースペースなどの施設である。

また、トランザクション実行アーキテクチャ構造は、アクセス層と論理層とデータ層の区画ではなく、直接に、トランザクションソフトウエアと、トランザクションコンポーネントと、基本デバイスと、インフラストラクチャとによってアーキテクチャ階層の設定を行ってもよい。

トランザクション実行アーキテクチャ構造において、検出モジュール５０は、異常サービスが位置するアーキテクチャ層に対して検出を行う他にも、この異常サービスと関連する複数のアーキテクチャ層に対しても検出を行うことにより、実行故障元の位置特定を実現して、サービス異常の発生を引き起こした故障原因を取得する必要がある。

上記インターネット・トランザクション実行監視システムは、監視データ中の異常データに基づいて対応する異常サービスを取得し、異常サービスに基づいて関連するアーキテクチャ層において位置特定を行うことにより実行故障元位置特定を取得しており、ただ異常サービスをインターネット・トランザクション実行中の実行故障元とみなすだけではなく、それに応じて異常サービスと関連するアーキテクチャ層を検出することにより、実行故障元の位置特定を実現し、監視の正確性を向上し、インターネット・トランザクションのメンテナンスも一層便利化する。

図６に示すように、上記検出モジュール５０は、初期検出ユニット５１０と、層毎検出ユニット５３０と、処理ユニット５５０とを備える。

初期検出ユニット５１０は、異常サービスが位置するアーキテクチャ層に異常が存在するか否かを検出し、Yesの場合、異常サービスが位置するアーキテクチャ層に対応する異常点を記録し、Noの場合は、実行を終了する。

本実施例において、初期検出ユニット５１０は、異常サービスが位置するアーキテクチャ層における各セグメントが異常か否かを検出し、このアーキテクチャ層に出現した異常点を記録する。アーキテクチャ層とアーキテクチャ層における要素によって、対応する異常点がそれぞれ異なる。具体的に、異常点は、アーキテクチャ層及びアーキテクチャ層における要素に異常があるか否かを判定するもので、異常現象に関する記述である。

層毎検出ユニット５３０は、異常サービスと関連する次のアーキテクチャ層を開始層として、前端から後端までの順に各層毎に検出を行い、検出されたアーキテクチャ層に異常が存在するか否かを判断し、Yesの場合、検出されたアーキテクチャ層に対応する異常点を記録する。

本実施例において、あらゆるアーキテクチャ層のサービスは通常、次のアーキテクチャ層におけるいくつかのサービスに依存して対応する機能を実現する。このようなサービスが下流サービスである。このため、層毎検出ユニット５３０は、次のアーキテクチャ層を開始層として、各層毎に検出を行うことにより各アーキテクチャ層に存在する異常点を取得する必要がある。具体的に、層毎検出ユニット５３０は、前端から後端までの順に各アーキテクチャ層に対して検出を行い、検出されるアーキテクチャ層に下流サービスが存在するか否かを判断し、Yesの場合、下流サービスに異常点が存在するか否かを更に判断し、下流サービスに異常点が存在すると、この異常点を記録する。ここで、トランザクション実行アーキテクチャ構造において、前端から後端までの順は、アクセス層、論理層、データ層の順に基づくとか、又はトランザクションソフトウエア、トランザクションコンポーネント、基本デバイス、インフラストラクチャの順に基づくことを指す。

処理ユニット５５０は、アーキテクチャ階層におけるアーキテクチャ層の順に記録された異常点を処理することにより実行故障元を取得する。

本実施例において、処理ユニット５５０は、記録された複数の異常点を集中し、アーキテクチャ階層の前端から後端までの順に処理を行って、実行故障元の位置特定を実現する。トランザクションの実行中において、あらゆるアーキテクチャ層に出現された異常点は、いずれもサービスの異常を引き起こす可能性がある。このため、全ての異常点を集中すると、可能性が一番高い故障原因を特定でき、各アーキテクチャ層中の関連分析を実現できる。具体的に、処理ユニット５５０は、アーキテクチャ階層におけるアーキテクチャ層の順に、記録された若干の異常点に対して関連分析を行うことにより実行故障元を取得する。

上記インターネット・トランザクション実行監視システムでは、集中された異常点により可能性が一番高い故障原因を特定して各アーキテクチャ層中の関連分析を行い、相対的に分散している異常点を総合的に考慮して、正確な故障原因を取得する。

図７に示すように、上記検出モジュール５０は、階層判断ユニット５4０を更に含む。階層判断ユニット５4０は、異常サービスが位置するアーキテクチャ層に異常サービスと関連する次のアーキテクチャ層が存在するか否かを判断し、Yesの場合、層毎検出ユニット５３０に通知し、Noの場合、処理ユニット５５０に通知する。

本実施例において、階層判断ユニット５4０により異常サービスが次のアーキテクチャ層におけるサービスに依存しなくても正常的に実行できると判断された場合、異常サービスが位置するアーキテクチャ層に対応する異常点が実行故障元であるため、一層ずつ検出を行う必要がなくなり、故障検出効率が向上する。具体的に、階層判断ユニット５4０は、次のアーキテクチャ層に関連するサービス、つまり下流サービスが存在するか否かを判断する。判断により得られた下流サービスは、判断を行う異常サービスと緊密に関連するもので、判断を行う異常サービスは下流サービスに依存して実行される。

上記処理ユニット５５０は、記録された異常点を実行故障元として位置特定するものでもある。

一実施例において、上記処理ユニット５５０は、さらにアーキテクチャ層に対応する優先順位に基づいて、記録された異常点から最高優先順位に対応する異常点を、実行故障元として位置特定する。

本実施例において、各アーキテクチャ層に、アーキテクチャ層において異常点がサービス異常を引き起こす可能性の大きさを示す優先順位を予め設定する。言い換えると、優先順位もサービス異常を発生させる影響要素を示す。優先順位が最高の異常点は、サービス異常を発生させる影響要素が最大の異常点であり、実行故障元となる可能性が一番高い。このため、処理ユニット５５０は、アーキテクチャ層に対応する優先順位に基づいて、記録された若干の異常点から最高優先順位の異常点を抽出し、抽出された異常点に基づいて故障元の位置特定を実現できる。

最高優先順位の複数の異常点については、処理ユニット５５０は、さらにアーキテクチャ層における要素の優先順位に基づいて、どの異常点が実行故障元であるかを特定する。例えば、インフラストラクチャに故障が発生すると、必ず基本デバイス、基礎コンポーネント及び基礎ソフトウエアに影響が与えられる。そのため、インフラストラクチャと基本デバイス共に異常点が存在する場合、インフラストラクチャでの異常点を優先して実行故障元とし、その他のも類推である。

別の実施例において、上記処理ユニット５５０は、さらに、記録された異常点から最後端のアーキテクチャ層に対応する異常点を抽出し、抽出された異常点を実行故障元として位置特定する。

本実施例において、処理ユニット５５０は、アーキテクチャ層の前端から後端までの順に、記録された若干の異常点から最後端のアーキテクチャ層に対応する異常点を抽出し、最後端に位置するアーキテクチャ層に発生した異常点が、サービス異常を引き起こした原因となる。

一実施例において、上記インターネット・トランザクション実行監視システムは、さらに、実行故障元及び異常点を故障位置特定ページに提示して、トランザクションメンテナンスを行う作業者が容易に見るようにする。

上記インターネット・トランザクション実行監視方法及びシステム、並びにコンピュータ記憶媒体では、異常が発生したサービスについて、アーキテクチャ階層に従ってそのサービスと関連するアーキテクチャ層を検出して実行故障元を取得することにより、各アーキテクチャ層に発生した故障がサービス異常を引き起こす要因になるかを確認し、ひいては複数のアーキテクチャ層において実行故障の位置特定を正確に実現するので、トランザクションメンテナンスを行う作業者が多量の警告内容を一つずつ分析する必要がない。

本発明は、上記インターネット・トランザクション実行監視方法を実行するようコンピュータを制御するコンピュータ実行可能命令を記憶したコンピュータ記憶媒体をさらに提供する。コンピュータ記憶媒体におけるコンピュータ実行可能命令がインターネット・トランザクション実行監視方法を実行する具体的なステップは、上記方法において説明した通りで、ここではその説明を省略する。

以上で説明した実施例は、ただ本発明のいくつかの具体的な実施形態に過ぎず、その説明は比較的に具体的で詳細であるが、本発明の保護しようとする範囲を制限することではない。当業者は、本発明の思想から逸脱しない限り種々の変形と変更を行うこともでき、このような変形及び変更も本発明の保護範囲に属することは言うまでもない。従って、本発明の保護範囲は、特許請求の範囲に基づいて定めなければならない。

本開示は、コンピュータ・ネットワークに関し、特に、コンピュータ・ネットワーク用のトランザクション実行監視方法及びシステム並びにコンピュータ記憶媒体に関する。

インターネット、LAN、WANでは、例えば、オープンプラットフォームでの第三者アプリケーション、仮想ネットワークコミューニティー及び動映像再生ウェブサイトなどの各種トランザクションが実行されている。通常、トランザクションはコンピュータ・ネットワーク上の実行環境に依存してユーザーにサービスを提供する。この実行環境は、トランザクションのために論理処理やデータ記憶を提供するためのいろいろな要素を含む。トランザクションの実行中では、必ずトランザクションの実行環境に発生する故障を密接に注視し、直ちに分析と処理を行わなければならない。

コンピュータ・ネットワーク用の従来のトランザクション実行監視方法では、トランザクションの実行環境を種類毎にリアルタイムに監視し、この実行環境は、ネットワーク環境、サーバなどのデバイス、トランザクションコンポーネント、及びトランザクションソフトウエアなどを含む。トランザクションのある実行環境に異常状況が発生したことが監視されると、メッセージ又はメールの方式で警告を発送し、トランザクションメンテナンスを行う作業者が警告内容を確認して、故障が発生した実行環境を認識するようにする。

しかし、トランザクションの各種実行環境同士は互いに依存する。例えば、トランザクションソフトウエアの正常的な実行は、トランザクションコンポーネントの正常的な実行に依存し、トランザクションソフトウエアとトランザクションコンポーネントの正常的な実行はネットワーク環境、サーバなどの実行環境の正常的な実行に依存する。このため、トランザクションの実行中において、トランザクションのある実行環境に故障が発生したことが監視された場合、常に大規模な警告が引き起こされ、トランザクションメンテナンスを行う作業者は警告内容を確認することにより故障位置を特定することができなくなってしまう。

上記の一つ又は複数の問題を鑑みて、コンピュータ・ネットワーク用のトランザクション実行監視方法及びシステム並びにコンピュータ記憶媒体を提供する。

本開示の実施例によるコンピュータ・ネットワーク用のトランザクション実行監視方法は、
コンピュータ・ネットワーク上で実行するトランザクションの監視データを取得し、監視データから異常データを抽出することと、
異常データに基づいて異常サービスを取得することと、
異常サービスに基づいてコンピュータ・ネットワーク上に構築されたトランザクションのアーキテクチャ層においてトランザクションの実行故障元の位置特定を行うことと、を含む。

本開示の実施例によるコンピュータ・ネットワーク用のトランザクション実行監視システムは、
コンピュータ・ネットワーク上で実行するトランザクションの監視データを取得し、監視データから異常データを抽出するデータ監視モジュールと、
異常データに基づいて異常サービスを取得する異常サービス取得モジュールと、
異常サービスに基づいてコンピュータ・ネットワーク上に構築されたトランザクションのアーキテクチャ層においてトランザクションの実行故障元の位置特定を行う検出モジュールと、を含む。

本開示の実施例によるコンピュータ実行可能命令を記憶するためのコンピュータ記憶媒体において、前記コンピュータ実行可能命令は、
コンピュータ・ネットワーク上で実行されるトランザクションの監視データを取得し、前記監視データから異常データを抽出する処理と、
前記異常データに基づいて対応する異常サービスを取得する処理と、
前記異常サービスに基づいてアーキテクチャ層において位置特定を行うことにより実行故障元を得る処理と、
を実行するように操作可能である。

本開示の実施例によるコンピュータ・ネットワーク用のトランザクション実行監視方法及びシステム、およびコンピュータ記憶媒体により、トランザクションメンテナンスを行う作業者は多量の警告内容を一つずつ分析する必要なく、トランザクションの実行故障元を正確に認識することができる。

本開示の実施例によるコンピュータ・ネットワーク用のトランザクション実行監視方法を示すフローチャートである。本開示の実施例によるトランザクションのアーキテクチャ構造を示す図である。本開示の実施例による異常サービスに基づいてコンピュータ・ネットワーク上に構築されたトランザクションのアーキテクチャ層でトランザクションの実行故障元の位置特定を行う処理を示すフローチャートである。本開示の実施例による記録された異常点をトランザクションのアーキテクチャ構造におけるアーキテクチャ層の順に処理することによりトランザクションの実行故障元の位置特定を行う処理を示すフローチャートである。本開示の実施例によるコンピュータ・ネットワーク用のトランザクション実行監視システムの構成を示す図である。本開示の実施例による検出モジュールの構成を示す図である。本開示の別の実施例による検出モジュールの構成を示す図である。

図１は、本開示の実施例によるコンピュータ・ネットワーク用のトランザクション実行監視方法示すフローチャートである。図１に示すように、本開示の実施例によるコンピュータ・ネットワーク用のトランザクション実行監視方法は、以下のようなステップを含む。

ステップＳ１０では、コンピュータ・ネットワーク上で実行しているトランザクションの監視データを取得し、監視データから異常データを抽出する。

本実施例において、コンピュータ・ネットワーク上で実行しているトランザクションの実行過程を監視することにより、トランザクションの実行が正常か否かを明確に反映するための監視データを得る。例えば、この監視データは、ユーザーのオンライン数やユーザーのコンプレイン数やユーザーがウェブページにアクセスする際に発生した遅延などであることができる。この監視データは、コンピュータ・ネットワーク上でのトランザクションの正常実行により生成した通常データ、及びコンピュータ・ネットワーク上でのトランザクションの異常実行（すなわち、トランザクションの実行に故障が発生すること）により生成した異常データを含む。異常データは、例えば、ウェブページが使用できない旨を示すデータであることができる。

本実施例において、トランザクションは実行中に各サービスによりユーザーにいろんな機能を提供する。例えば、あるトランザクションの実行中、複数のサービスが提供する各機能が、そのトランザクションの処理能力を形成する。抽出された異常データに基づいて異常サービス（すなわち、故障が発生したサービス）を取得し、後続の処理によりこの異常サービスを引起した原因を見つけ出す。

ステップＳ５０では、異常サービスに基づいてコンピュータ・ネットワーク上に構築されたトランザクションのアーキテクチャ層でトランザクションの実行故障元の位置特定を行う。

図２は、本開示の実施例によるトランザクションのアーキテクチャ構造を示す図である。図２に示すように、本開示の実施例によるトランザクションのアーキテクチャ構造は、階層状の構造で、前端から後端までの順にアクセス層と、論理層と、データ層とを備える。ここで、アクセス層は、ユーザーの要求を受理し、ユーザーの要求を後端の論理層へ転送する階層である。論理層は、ユーザーにインターフェースを表示するページを提供するとともに、アクセス層から転送されたユーザーの要求に応じて論理処理を行い、処理結果をアクセス層を戻す階層である。データ層は、論理層が論理処理を行うのに必要な及び/又は論理処理を行うことにより生成した各種データを一時的に又は永久的に保存する階層である。トランザクションは、ユーザーの各種要求に応じて、コンピュータ・ネットワーク上に構築されたこのトランザクションのアーキテクチャ構造において実行される。

図２に示すように、アクセス層と論理層とデータ層のいずれのアーキテクチャ層も、トランザクションソフトウエアと、トランザクションコンポーネントと、基礎ネットワークと、基本デバイスと、インフラストラクチャなどのような要素を含む。ここで、トランザクションコンポーネントは、パブリックドメインソフトウェアパッケージ、又はソフトウエアアーキテクチャパッケージであり、例えば、WebＳerver コンポーネントや、ネットワーク通信コンポーネントや、データベースコンポーネントなどである。トランザクションソフトウエアは、トランザクションコンポーネント上で実行され、多くはユーザーがアクセスするように直接に提供されるプログラムであり、例えば、ユーザーに表示インターフェースを提供するコモン・ゲートウェイ・インターフェース（Common Gateway Interface、CGIと略する）である。基本デバイスは、サーバと、スイッチと、ルーターなどの設備である。インフラストラクチャは、データセンターと、電力供給装置と、データセンタースペースなどの施設である。

また、トランザクションのアーキテクチャ構造は、アクセス層と論理層とデータ層の区画ではなく、前端から後端までの順にトランザクションソフトウエアと、トランザクションコンポーネントと、基本デバイスと、インフラストラクチャとを備えてもよい。

本実施例において、異常サービスが位置するアーキテクチャ層に異常が存在するか否かを検出する他にも、更にこの異常サービスと関連する複数のアーキテクチャ層に異常が存在するか否かも検出して、実行故障元の位置特定を実現することにより、サービス異常の発生を引起している故障原因を得るようにする必要がある。

本開示の実施例によるトランザクション実行監視方法では、監視データ中の異常データに基づいて対応する異常サービスを取得し、異常サービスに基づいて関連するアーキテクチャ層においてトランザクションの実行故障元の位置特定を行うが、ただ異常サービスをトランザクション実行中の実行故障元とみなすだけではなく、それに応じて異常サービスと関連するアーキテクチャ層を検出することにより、実行故障元の位置特定を実現し、監視の正確性を向上するとともに、コンピュータ・ネットワーク上で実行されるトランザクションのメンテナンスも一層便利化する。

図３は、本開示の実施例による異常サービスに基づいてコンピュータ・ネットワーク上に構築されたトランザクションのアーキテクチャ層でトランザクションの実行故障元の位置特定を行う処理を示すフローチャートである。図３に示すように、一実施例において、上記のステップＳ５０の具体的な過程は以下のとおりである。

ステップＳ５１０では、異常サービスが位置するアーキテクチャ層に異常が存在するか否かを検出し、Yesの場合、ステップＳ５２０に移行し、Noの場合、ステップＳ５０の処理を終了する。

本実施例において、異常サービスが位置するアーキテクチャ層における各セグメントに異常があるか否かを検出し、該アーキテクチャ層に出現した異常点を記録する。異なるアーキテクチャ層及び同一のアーキテクチャ層における異なる要素によって、対応する異常点がそれぞれ異なる。具体的に、異常点は、アーキテクチャ層及びアーキテクチャ層における要素に異常があるか否かを判定するためのもので、異常現象に関する記述である。例えば、アーキテクチャ層の基本デバイスについて、異常点は、サーバと接続できないことであり、アーキテクチャ層の基礎ネットワークについて、異常点は、ネットワークパケットロス率 (Packet loss rate)が３０%を超えたことである。

ステップＳ５２０では、異常サービスが位置するアーキテクチャ層における異常点を記録する。

ステップＳ５３０では、異常サービスと関連する次のアーキテクチャ層を開始層として、トランザクションのアーキテクチャ構造における前端から後端の順に各層毎に検出を行い、現在のアーキテクチャ層に異常が存在するか否かを判断する。Yesの場合、ステップＳ５４０に移行し、Noの場合、ステップＳ５０の処理を終了する。

トランザクションのアーキテクチャ構造において、前端の一つのアーキテクチャ層のサービスは、通常、直後の後端の一つのアーキテクチャ層におけるサービスに依存して対応する機能を実現する（ここで、当該後端のアーキテクチャ層を当該前端のアーキテクチャ層の次のアーキテクチャ層と称し、当該後端のアーキテクチャ層におけるサービスを当該前端のアーキテクチャ層におけるサービスの下游サービスと称する）。本実施例では、異常サービスが位置するアーキテクチャ層の次のアーキテクチャ層を開始層として、各層毎に現在のアーキテクチャ層に異常が存在するか否かを検出する必要がある。具体的に、トランザクションのアーキテクチャ構造における前端から後端の順に、現在のアーキテクチャ層に下流サービスが存在するか否かを判断し、Yesの場合、下流サービスに異常点が存在するか否かを更に判断する。下流サービスに異常点が存在すると、この異常点を記録する。

異常サービスと関連する次のアーキテクチャ層が存在するか否かを判断する。Yesの場合、ステップＳ５３０に移行し、Noの場合、異常サービスが位置するアーキテクチャ層に異常が存在すると検出された場合に記録された異常点をトランザクションの実行故障元とする。

即ち、異常サービスが次のアーキテクチャ層におけるサービスに依存しなくても正常的に実行できると判断された場合、異常サービスが位置するアーキテクチャ層における異常点がトランザクションの実行故障元であるため、一層ずつ検出を行う必要がなくなり、故障検出の効率を向上させる。具体的に、次のアーキテクチャ層に異常サービスと関連するサービス（即ち、下流サービス）が存在するか否かを判断することにより、異常サービスと関連する次のアーキテクチャ層が存在するか否かを判断することができる。

ステップＳ５４０において、現在のアーキテクチャ層における異常点を記録する。

ステップＳ５５０において、トランザクションのアーキテクチャ構造における前端から後端の順に、記録された異常点を処理することにより、トランザクションの実行故障元の位置を特定する。

本実施例において、記録された複数の異常点を集中し、トランザクションのアーキテクチャ構造における前端から後端までの順に、記録された複数の異常点に対して処理を行って、トランザクションの実行故障元の位置特定を実現する。トランザクションの実行中において、あらゆるアーキテクチャ層に出現された異常点は、いずれも異常なサービスを引き起こす可能性がある。このため、全ての異常点を集中すると、可能性が一番高い故障原因を特定でき、各アーキテクチャ層中の関連分析を実現できる。具体的に、トランザクションのアーキテクチャ構造におけるアーキテクチャ層の順に、記録された若干の異常点に対して関連分析を行うことにより、トランザクションの実行故障元を取得する。

本開示の実施例によるトランザクション実行監視方法では、異常点を集中することにより可能性が一番高い故障原因を特定して各アーキテクチャ層中の関連分析を行い、相対的に分散している異常点を総合的に考慮して、正確な故障元を取得する。

一実施例において、上記ステップＳ５５０の具体的な過程は、アーキテクチャ層に対応する優先順位に従って、記録された異常点から最高優先順位に対応する異常点をトランザクションの実行故障元として抽出する。

本実施例において、各アーキテクチャ層に、アーキテクチャ層において異常点が異常サービスを引き起こす可能性の大きさを示す優先順位を予め設定する。言い換えると、優先順位も異常サービスを発生させる影響要素を示す。優先順位が最高の異常点は、異常サービスを発生させる影響要素が最大の異常点であり、実行故障元となる可能性が一番高い。このため、アーキテクチャ層に対応する優先順位に従って、記録された若干の異常点から優先順位が最高の異常点を抽出し、抽出された異常点によりトランザクションの実行故障元の位置特定を実現できる。

最高優先順位の複数の異常点については、さらにアーキテクチャ層における要素の優先順位に基づいて、どの異常点がトランザクションの実行故障元であるかを特定する。例えば、インフラストラクチャに故障が発生すると、必ず基本デバイス、基礎コンポーネント及び基礎ソフトウエアに影響が与えられる。そのため、インフラストラクチャと基本デバイス共に異常点が存在する場合、インフラストラクチャでの異常点をトランザクションの実行故障元とし、その他も類推する。

図４は、本開示の実施例による記録された異常点をトランザクションのアーキテクチャ構造におけるアーキテクチャ層の順に処理することによりトランザクションの実行故障元の位置特定を行う処理を示すフローチャートである。図４に示すように、別の実施例において、上記ステップＳ５５０の具体的な過程は以下のようなステップを含む。

ステップＳ５５１では、記録された異常点からトランザクションのアーキテクチャ構造における最後端のアーキテクチャ層に対応する異常点を抽出する。

本実施例において、トランザクションのアーキテクチャ構造における前端から後端までの順に、記録された若干の異常点から最後端のアーキテクチャ層に対応する異常点を抽出し、最後端に位置するアーキテクチャ層における異常点を異常サービスを引き起こした原因とする。

ステップＳ５５３では、抽出された異常点をトランザクションの実行故障元とする。

一実施例において、上記トランザクション実行監視方法は、実行故障元及びそれに対応する異常点を故障位置特定ページに提示して、トランザクションメンテナンスを行う作業者が容易に見るようにすることを更に含む。

図５は、本開示の実施例によるコンピュータ・ネットワーク用のトランザクション実行監視システムの構成を示す図である。図５に示すように、一実施例において、コンピュータ・ネットワーク用のトランザクション実行監視システムは、データ監視モジュール１０と、異常サービス取得モジュール３０と、及び検出モジュール５０とを含む。

データ監視モジュール１０は、コンピュータ・ネットワーク上で実行されているトランザクションの監視データを取得し、監視データ中から異常データを抽出するためのものである。

本実施例において、コンピュータ・ネットワーク上で実行されているトランザクションの実行過程を監視することにより、当該トランザクションの実行が正常か否かを明確に反映するための監視データを取得する。例えば、この監視データは、ユーザーのオンライン数、ユーザーのコンプレイン数、及びあるウェブページにアクセスする際に発生した遅延などであることができる。この監視データは、コンピュータ・ネットワーク上でのトランザクションの正常実行により生成した通常データ、及びコンピュータ・ネットワーク上でのトランザクションの異常実行（すなわち、トランザクションの実行に故障が発生すること）により生成した異常データを含み、異常データは、例えばあるページが使用できない旨を示すデータであることができる。

異常サービス取得モジュール３０は、異常データに基づいて異常サービスを取得するためのものである。

本実施例において、トランザクションは実行中において各種サービスによりユーザーにいろんな機能を提供する。例えば、あるトランザクションの実行中において、複数のサービスが提供する各機能がこのトランザクションの所有する処理能力を構成する。異常サービス取得モジュール３０は、抽出された異常データに基づいて、異常サービスを取得し、後続の処理により該異常サービスを引き起こした原因を見つけ出す。

検出モジュール５０は、異常サービスに基づいてコンピュータ・ネットワーク上に構築されたトランザクションのアーキテクチャ層においてトランザクションの実行故障元の位置特定を行うためのものである。

本実施例において、トランザクションのアーキテクチャ構造は、階層状の構造で、前端から後端までの順にアクセス層と、論理層と、データ層とを備える。ここで、アクセス層は、ユーザーの要求を受理し、ユーザーの要求を後端の論理層へ転送する階層である。論理層は、ユーザーにインターフェースを表示するページを提供するとともに、アクセス層から転送されたユーザーの要求に応じて論理処理を行い、処理結果をアクセス層を戻す階層である。データ層は、論理層が論理処理を行うのに必要な及び/又は論理処理を行うことにより生成した各種データを一時的に又は永久的に保存する階層である。トランザクションは、ユーザーの各種要求に応じて、コンピュータ・ネットワーク上に構築されたこのトランザクションのアーキテクチャ構造において実行される。

アーキテクチャ層がアクセス層と論理層とデータ層のいずれのアーキテクチャ層も、トランザクションソフトウエア、トランザクションコンポーネント、基礎ネットワーク、基本デバイス、及びインフラストラクチャなどの要素を備える。ここで、トランザクションコンポーネントは、パブリックドメインソフトウェアパッケージ、又はソフトウエアアーキテクチャパッケージである。トランザクションソフトウエアは、トランザクションコンポーネント上に実行され、多くは、直接にユーザーにアクセスするように提供されるプログラムである。基本デバイスは、サーバ、スイッチ、ルーターなどのデバイスであり、インフラストラクチャは、データセンター、電力供給装置、データセンタースペースなどの施設である。

本実施例において、検出モジュール５０は、異常サービスが位置するアーキテクチャ層に異常が存在するか否かを検出する他にも、この異常サービスと関連する複数のアーキテクチャ層に異常が存在するか否かも検出することにより、実行故障元の位置特定を実現して、サービス異常の発生を引き起こした故障原因を取得する必要がある。

本開示の実施例によるトランザクション実行監視システムでは、監視データ中の異常データに基づいて対応する異常サービスを取得し、異常サービスに基づいて関連するアーキテクチャ層においてトランザクションの実行故障元の位置特定を行うが、ただ異常サービスをトランザクション実行中の実行故障元とみなすだけではなく、それに応じて異常サービスと関連するアーキテクチャ層を検出することにより、実行故障元の位置特定を実現し、監視の正確性を向上し、コンピュータ・ネットワーク上で実行されるトランザクションのメンテナンスも一層便利化する。

図６は、本開示の実施例による検出モジュールの構成を示す図である。図６に示すように、検出モジュール５０は、初期検出ユニット５１０と、層毎検出ユニット５３０と、処理ユニット５５０とを備える。

初期検出ユニット５１０は、異常サービスが位置するアーキテクチャ層に異常が存在するか否かを検出し、Yesの場合、異常サービスが位置するアーキテクチャ層における異常点を記録し、Noの場合は、実行を終了する。

本実施例において、初期検出ユニット５１０は、異常サービスが位置するアーキテクチャ層における各セグメントが異常か否かを検出し、このアーキテクチャ層に出現した異常点を記録する。異なるアーキテクチャ層と同一のアーキテクチャ層における異なる要素によって、対応する異常点がそれぞれ異なる。具体的に、異常点は、アーキテクチャ層及びアーキテクチャ層における要素に異常があるか否かを判定するもので、異常現象に関する記述である。

層毎検出ユニット５３０は、異常サービスと関連する次のアーキテクチャ層を開始層として、トランザクションのアーキテクチャ構造における前端から後端までの順に各層毎に検出を行い、現在のアーキテクチャ層に異常が存在するか否かを判断し、Yesの場合、現在のアーキテクチャ層における異常点を記録する。

トランザクションのアーキテクチャ構造において、前端の一つのアーキテクチャ層のサービスは、通常、直後の後端の一つのアーキテクチャ層におけるサービスに依存して対応する機能を実現する（ここで、当該後端のアーキテクチャ層を当該前端のアーキテクチャ層の次のアーキテクチャ層と称し、当該後端のアーキテクチャ層におけるサービスを当該前端のアーキテクチャ層におけるサービスの下游サービスと称する）。本実施例では、層毎検出ユニット５３０は、異常サービスが位置するアーキテクチャ層の次のアーキテクチャ層を開始層として、各層毎に現在のアーキテクチャ層に異常が存在するか否かを検出する必要がある。具体的に、層毎検出ユニット５３０は、トランザクションのアーキテクチャ構造における前端から後端までの順に、現在のアーキテクチャ層に下流サービスが存在するか否かを判断し、Yesの場合、下流サービスに異常点が存在するか否かを更に判断し、下流サービスに異常点が存在すると、この異常点を記録する。

処理ユニット５５０は、トランザクションのアーキテクチャ構造における前端から後端の順に、記録された異常点を処理することによりトランザクションの実行故障元の位置を特定するものである。

本実施例において、処理ユニット５５０は、記録された複数の異常点を集中し、トランザクションのアーキテクチャ構造における前端から後端までの順に、記録された複数の異常点に対して処理を行って、トランザクションの実行故障元の位置特定を実現する。トランザクションの実行中において、あらゆるアーキテクチャ層に出現された異常点は、いずれも異常なサービスを引き起こす可能性がある。このため、全ての異常点を集中すると、可能性が一番高い故障原因を特定でき、各アーキテクチャ層中の関連分析を実現できる。具体的に、処理ユニット５５０は、トランザクションのアーキテクチャ構造におけるアーキテクチャ層の順に、記録された若干の異常点に対して関連分析を行うことにより、トランザクションの実行故障元を取得する。

本開示の実施例によるトランザクション実行監視システムでは、集中された異常点により可能性が一番高い故障原因を特定して各アーキテクチャ層中の関連分析を行い、相対的に分散している異常点を総合的に考慮して、正確な故障元を取得する。

図７は、本開示の別の実施例による検出モジュールの構成を示す図である。図７に示すように、検出モジュール５０は、階層判断ユニット５４０を更に含む。階層判断ユニット５４０は、異常サービスと関連する次のアーキテクチャ層が存在するか否かを判断するものであり、Yesの場合、層毎検出ユニット５３０に通知し、Noの場合、処理ユニット５５０に通知する。

本実施例において、階層判断ユニット５４０により異常サービスが次のアーキテクチャ層におけるサービスに依存しなくても正常的に実行できると判断された場合、異常サービスが位置するアーキテクチャ層における異常点がトランザクションの実行故障元であるため、一層ずつ検出を行う必要がなくなり、故障検出効率が向上する。具体的に、階層判断ユニット５４０は、次のアーキテクチャ層に異常サービスと関連するサービス（即ち、下流サービス）が存在するか否かを判断することにより、異常サービスと関連する次のアーキテクチャ層が存在するか否かを判断することができる。

本実施例において、各アーキテクチャ層に、アーキテクチャ層において異常点がサービス異常を引き起こす可能性の大きさを示す優先順位を予め設定する。言い換えると、優先順位も異常サービスを発生させる影響要素を示す。優先順位が最高の異常点は、異常サービスを発生させる影響要素が最大の異常点であり、実行故障元となる可能性が一番高い。このため、処理ユニット５５０は、アーキテクチャ層に対応する優先順位に基づいて、記録された若干の異常点から最高優先順位の異常点を抽出し、抽出された異常点に基づいて故障元の位置特定を実現できる。

最高優先順位の複数の異常点については、処理ユニット５５０は、さらにアーキテクチャ層における要素の優先順位に基づいて、どの異常点がトランザクションの実行故障元であるかを特定する。例えば、インフラストラクチャに故障が発生すると、必ず基本デバイス、基礎コンポーネント及び基礎ソフトウエアに影響が与えられる。そのため、インフラストラクチャと基本デバイス共に異常点が存在する場合、インフラストラクチャでの異常点をトランザクションの実行故障元とし、その他も類推である。

別の実施例において、上記処理ユニット５５０は、さらに、記録された異常点から最後端のアーキテクチャ層に対応する異常点を抽出し、抽出された異常点をトランザクションの実行故障元とする。

本実施例において、処理ユニット５５０は、トランザクションのアーキテクチャ構造における前端から後端までの順に、記録された若干の異常点から最後端のアーキテクチャ層に対応する異常点を抽出し、最後端に位置するアーキテクチャ層における異常点を異常サービスを引き起こした原因とする。

一実施例において、上記トランザクション実行監視システムは、さらに、実行故障元及びそれに対応する異常点を故障位置特定ページに提示して、トランザクションメンテナンスを行う作業者が容易に見るようにする。

上記トランザクション実行監視方法及びシステムでは、トランザクションのアーキテクチャ構造における前端から後端までの順に、異常サービスと関連するアーキテクチャ層を検出して、各アーキテクチャ層に発生した故障が異常サービスを引き起こす要因になるかを確認し、ひいては複数のアーキテクチャ層において実行故障の位置を正確に特定するので、トランザクションメンテナンスを行う作業者が多量の警告内容を一つずつ分析する必要がない。

本開示は、コンピュータが上記トランザクション実行監視方法を実行するよう制御するように操作可能なコンピュータ実行可能命令を記憶したコンピュータ記憶媒体をさらに提供する。コンピュータ記憶媒体におけるコンピュータ実行可能命令がトランザクション実行監視方法を実行する具体的なステップは、上記方法において説明した通りで、ここではその説明を省略する。

以上で説明した実施例は、ただ本開示のいくつかの具体的な実施形態に過ぎず、その説明は比較的に具体的で詳細であるが、本開示の保護しようとする範囲を制限することではない。当業者は、本開示の思想から逸脱しない限り種々の変形と変更を行うこともでき、このような変形及び変更も本開示の保護範囲に属することは言うまでもない。従って、本開示の保護範囲は、特許請求の範囲に基づいて定めなければならない。

Claims

インターネット・トランザクションの監視データを取得し、前記監視データから異常データを抽出するステップと、
前記異常データに基づいて対応する異常サービスを取得するステップと、
前記異常サービスに基づいてアーキテクチャ層において位置特定を行うことにより実行故障元を得るステップと、
を含むインターネット・トランザクション実行監視方法。
前記した前記異常サービスに基づいてアーキテクチャ層において位置特定を行うことにより実行故障元を得るステップは、
前記異常サービスが位置するアーキテクチャ層に異常が存在するか否かを検出し、存在する場合、前記異常サービスが位置するアーキテクチャ層に対応する異常点を記録するステップと、
前記異常サービスと関連する次のアーキテクチャ層を開始層として、前端から後端までの順に各層毎に検出を行い、検出されたアーキテクチャ層に異常が存在するか否かを判断し、存在する場合、前記検出されたアーキテクチャ層に対応する異常点を記録するステップと、
記録された異常点をアーキテクチャ階層における前記アーキテクチャ層の順に処理することにより実行故障元を得るステップと、
である、ことを特徴とする請求項１記載のインターネット・トランザクション実行監視方法。
前記した前記異常サービスに基づいてアーキテクチャ層において位置特定を行うことにより実行故障元を得るステップは、さらに
前記異常サービスが位置するアーキテクチャ層に前記異常サービスと関連する次のアーキテクチャ層が存在するか否かを判断し、存在する場合、前記した前記異常サービスと関連する次のアーキテクチャ層を開始層として前端から後端までの順に各層毎に検出を行うステップに移行し、
存在しない場合、前記記録された異常点を実行故障元として位置特定することを含む、ことを特徴とする請求項２記載のインターネット・トランザクション実行監視方法。
前記の記録された異常点をアーキテクチャ階層における前記アーキテクチャ層の順に処理することにより実行故障元を得るステップは、
前記アーキテクチャ層に対応する優先順位に基づいて、前記記録された異常点から最高優先順位に対応する異常点を実行故障元として抽出するステップである、ことを特徴とする請求項２記載のインターネット・トランザクション実行監視方法。
前記の記録された異常点をアーキテクチャ階層における前記アーキテクチャ層の順に処理することにより実行故障元を得るステップは、
前記記録された異常点から最後端のアーキテクチャ層に対応する異常点を抽出するステップと、
前記抽出された異常点を実行故障元として位置特定するステップ、
である、ことを特徴とする請求項２記載のインターネット・トランザクション実行監視方法。
前記の記録された異常点をアーキテクチャ階層における前記アーキテクチャ層の順に処理することにより実行故障元を得るステップの後に、
実行故障元と異常点を故障位置特定ページに提示するステップを更に含む、ことを特徴とする請求項５記載のインターネット・トランザクション実行監視方法。
インターネット・トランザクションの監視データを取得し、前記監視データから異常データを抽出するデータ監視モジュールと、
前記異常データに基づいて対応する異常サービスを取得する異常サービス取得モジュールと、
前記異常サービスに基づいてアーキテクチャ層において位置特定を行うことにより実行故障元を得る検出モジュールと、
を含む、ことを特徴とするインターネット・トランザクション実行監視システム。
前記検出モジュールは、
前記異常サービスが位置するアーキテクチャ層に異常が存在するか否かを検出し、存在する場合、前記異常サービスが位置するアーキテクチャ層に対応する異常点を記録する初期検出ユニットと、
前記異常サービスと関連する次のアーキテクチャ層を開始層として前端から後端までの順に各層毎に検出を行い、検出されたアーキテクチャ層に異常が存在するか否かを判断し、存在する場合、前記検出されたアーキテクチャ層に対応する異常点を記録する層毎検出ユニットと、
記録された異常点をアーキテクチャ階層における前記アーキテクチャ層の順に処理することにより実行故障元を得る処理ユニットと、
を含む、ことを特徴とする請求項７記載のインターネット・トランザクション実行監視システム。
前記検出モジュールは、さらに
前記異常サービスが位置するアーキテクチャ層に前記異常サービスと関連する次のアーキテクチャ層が存在するか否かを判断し、存在する場合は、前記層毎検出ユニットへ通知し、存在しない場合は、前記処理ユニットへ通知する階層判断ユニットを含み、
前記処理ユニットは、さらに、前記記録された異常点を実行故障元として位置特定する、
ことを特徴とする請求項８記載のインターネット・トランザクション実行監視システム。
前記処理ユニットは、さらに、前記アーキテクチャ層に対応する優先順位に基づいて、前記記録された異常点から最高優先順位に対応する異常点を実行故障元として抽出することを特徴とする請求項８記載のインターネット・トランザクション実行監視システム。
前記処理ユニットは、さらに、前記記録された異常点から最後端のアーキテクチャ層に対応する異常点を抽出し、前記抽出された異常点を実行故障元として位置特定することを特徴とする請求項８記載のインターネット・トランザクション実行監視システム。
前記システムは、さらに、実行故障元と異常点を故障位置特定ページに提示することを特徴とする請求項１１記載のインターネット・トランザクション実行監視システム。
インターネット・トランザクションの監視データを取得し、前記監視データから異常データを抽出するステップと、
前記異常データに基づいて対応する異常サービスを取得するステップと、
前記異常サービスに基づいてアーキテクチャ層において位置特定を行うことにより実行故障元を得るステップと、
を含むインターネット・トランザクション実行監視方法を制御するためのコンピュータ実行可能命令を記憶するためのコンピュータ記憶媒体。
前記した前記異常サービスに基づいてアーキテクチャ層において位置特定を行うことにより実行故障元を得るステップは、
前記異常サービスが位置するアーキテクチャ層に異常が存在するか否かを検出し、存在する場合、前記異常サービスが位置するアーキテクチャ層に対応する異常点を記録するステップと、
前記異常サービスと関連する次のアーキテクチャ層を開始層として前端から後端までの順に各層毎に検出を行い、検出されたアーキテクチャ層に異常が存在するか否かを判断し、存在する場合、前記検出されたアーキテクチャ層に対応する異常点を記録するステップと、
記録された異常点をアーキテクチャ階層における前記アーキテクチャ層の順に処理することにより実行故障元を得るステップと、
である、ことを特徴とする請求項１３記載のコンピュータ記憶媒体。
前記した前記異常サービスに基づいてアーキテクチャ層において位置特定を行うことにより実行故障元を得るステップは、さらに
前記異常サービスが位置するアーキテクチャ層に前記異常サービスと関連する次のアーキテクチャ層が存在するか否かを判断し、存在する場合、前記した前記異常サービスと関連する次のアーキテクチャ層を開始層として前端から後端までの順に各層毎に検出を行うステップに移行し、
存在しない場合、前記記録された異常点を実行故障元として位置特定することを含む、ことを特徴とする請求項１４記載のコンピュータ記憶媒体。
前記の記録された異常点をアーキテクチャ階層における前記アーキテクチャ層の順に処理することにより実行故障元を得るステップは、
前記アーキテクチャ層に対応する優先順位に基づいて、前記記録された異常点から最高優先順位に対応する異常点を実行故障元として抽出するステップである、ことを特徴とする請求項１４記載のコンピュータ記憶媒体。
前記の記録された異常点をアーキテクチャ階層における前記アーキテクチャ層の順に処理することにより実行故障元を得るステップは、
前記記録された異常点から最後端のアーキテクチャ層に対応する異常点を抽出するステップと、
前記抽出された異常点を実行故障元として位置特定するステップ、
である、ことを特徴とする請求項１４記載のコンピュータ記憶媒体。
の後に、
実行故障元異常点を故障位置特定ページに提示するステップを更に含む、ことを特徴とする請求項１７記載のコンピュータ記憶媒体。