JP2015056082A - Failure information collection device, failure information collection method, and failure information collection program - Google Patents
Failure information collection device, failure information collection method, and failure information collection program Download PDFInfo
- Publication number
- JP2015056082A JP2015056082A JP2013189931A JP2013189931A JP2015056082A JP 2015056082 A JP2015056082 A JP 2015056082A JP 2013189931 A JP2013189931 A JP 2013189931A JP 2013189931 A JP2013189931 A JP 2013189931A JP 2015056082 A JP2015056082 A JP 2015056082A
- Authority
- JP
- Japan
- Prior art keywords
- information
- information processing
- identifier
- failure
- cooperation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本願発明は、複数の情報処理が連携して動作する際に障害が発生したときの、当該情報処理に関する障害情報を収集する障害情報収集装置等に関する。 The present invention relates to a failure information collection device and the like that collects failure information related to information processing when a failure occurs when a plurality of information processings operate in cooperation.
大規模なコンピュータシステムにおいては、複数の情報処理装置を使用した分散アプリケーションが実行されることが多い。分散アプリケーションに包含される個々のアプリケーションは、それぞれ、他のアプリケーションと情報交換することにより連携して動作する。 In a large-scale computer system, a distributed application using a plurality of information processing apparatuses is often executed. Individual applications included in the distributed application operate in cooperation by exchanging information with other applications.
分散アプリケーションに包含される何れかのアプリケーションに関して障害が発生した場合、障害解析を行うために、障害が発生したアプリケーションに係る状態情報を取集する必要がある。状態情報とは、当該アプリケーションが出力する、あるいは、当該アプリケーションを実行している情報処理装置によって採取されるログ情報等であり、例えば、当該アプリケーションが使用する変数が示す値などを含んだ、当該アプリケーションに関する実行状態を示す情報である。 When a failure occurs in any of the applications included in the distributed application, it is necessary to collect state information related to the application in which the failure has occurred in order to perform failure analysis. The state information is log information output by the application or collected by the information processing apparatus that is executing the application. For example, the state information includes a value indicated by a variable used by the application, This is information indicating an execution state related to the application.
分散アプリケーションにおいては、連携先であるアプリケーションから不正な情報を入手したことが原因で障害が発生することもある。したがって、障害発生元であるアプリケーションに係る状態情報を収集するのみでは十分な障害解析を行うことができないため、全ての連携先であるアプリケーションに係る状態情報を効率的に収集する技術が求められている。 In a distributed application, a failure may occur due to illegal information obtained from an application that is a cooperation destination. Therefore, since it is not possible to perform sufficient failure analysis simply by collecting status information related to the application that is the source of the failure, there is a need for a technology that efficiently collects status information related to the applications that are all linked destinations. Yes.
上述した技術に関連する技術として、特許文献1には、複数のコンピュータが連携して動作するシステムにおいて、アプリケーションが、連携先である障害が発生した相手アプリケーションの状態を、容易に検知できるようにしたシステムが開示されている。 As a technique related to the above-described technique, Patent Document 1 discloses that in a system in which a plurality of computers operate in cooperation, an application can easily detect the state of a partner application in which a failure that is a cooperation destination has occurred. A system is disclosed.
近年では、クラウドコンピューティング環境において、分散アプリケーションが実行される機会が増加し、今後、複数のプライベートクラウド間、あるいはプライベートクラウドとパブリッククラウド間に跨って、分散アプリケーションが実行される機会が増加することが見込まれる。 In recent years, opportunities to execute distributed applications in cloud computing environments have increased, and in the future, opportunities to execute distributed applications between multiple private clouds or between private clouds and public clouds will increase. Is expected.
このような大規模なシステムにおいて、分散アプリケーションに係る障害が発生した場合、分散アプリケーションに包含される全てのアプリケーションに関する状態情報を収集する際に、人手による作業が伴うことは、作業効率の観点から現実的ではない。したがって、システムが分散アプリケーションに包含される全てのアプリケーションに関する状態情報を、効率的に漏れなく収集できるようにすることが課題である。上述した特許文献1に開示された技術は、この課題を解決することはできない。 In such a large-scale system, when a failure related to a distributed application occurs, manual operation is required when collecting status information about all applications included in the distributed application from the viewpoint of work efficiency. Not realistic. Therefore, it is a problem to enable the system to efficiently collect state information regarding all applications included in the distributed application. The technique disclosed in Patent Document 1 described above cannot solve this problem.
本願発明の主たる目的は、この課題を解決した、障害情報収集装置、障害情報取集方法、及び、障害情報収集プログラムを提供することである。 The main object of the present invention is to provide a failure information collection device, a failure information collection method, and a failure information collection program that solve this problem.
本願発明に係る障害情報収集装置は、連携して動作する複数の情報処理について、前記情報処理を識別する第1の識別子を関連付けて記憶する連携情報記憶手段と、前記第1の識別子と、前記情報処理に関する実行状態を示す状態情報を格納している場所を識別する第2の識別子とを関連付けて記憶する格納場所情報記憶手段と、前記複数の情報処理のうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、前記連携情報記憶手段及び前記格納場所情報記憶手段を参照することにより、前記障害情報処理を識別する前記第1の識別子を基に、前記複数の情報処理のうち、当該障害情報処理と連携する情報処理である連携情報処理に関する前記状態情報を格納している場所を特定して、特定された場所から、前記連携情報処理を識別する前記第1の識別子に関連付けされている前記状態情報を入手する入手手段と、を備えることを特徴とする。 The failure information collection device according to the present invention relates to a plurality of information processing operating in cooperation with each other and stores a first identifier for identifying the information processing in association with each other, the first identifier, A storage location information storage unit that stores a second identifier that identifies a location storing state information indicating an execution state related to information processing; and at least one of the plurality of information processings. Based on the first identifier for identifying the fault information processing by referring to the linkage information storage means and the storage location information storage means when a fault that causes a fault to occur is generated. In addition, the location where the state information related to the cooperative information processing that is the information processing that cooperates with the fault information processing is specified and specified. From where, characterized in that it comprises, and acquisition means for obtaining the status information that is associated with the first identifier for identifying the cooperative processing.
上記目的を達成する他の見地において、本願発明の障害情報収集方法は、情報処理装置によって、連携して動作する複数の情報処理について、前記情報処理を識別する第1の識別子を関連付けて連携情報記憶域に記憶し、前記第1の識別子と、前記情報処理に関する実行状態を示す状態情報を格納している場所を識別する第2の識別子とを関連付けて格納場所情報記憶域に記憶し、前記複数の情報処理のうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、前記連携情報記憶域及び前記格納場所情報記憶域を参照することにより、前記障害情報処理を識別する前記第1の識別子を基に、前記複数の情報処理のうち、当該障害情報処理と連携する情報処理である連携情報処理に関する前記状態情報を格納している場所を特定して、特定された場所から、前記連携情報処理を識別する前記第1の識別子に関連付けされている前記状態情報を入手することを特徴とする。 In another aspect of achieving the above object, the failure information collection method of the present invention relates to a plurality of information processings that operate in cooperation with an information processing device by associating a first identifier for identifying the information processing with associated information. Storing the first identifier and the second identifier for identifying the location storing the state information indicating the execution state related to the information processing in the storage location information storage area in association with each other, By referring to the cooperation information storage area and the storage location information storage area when a failure that causes failure information processing that is at least one of information processing among a plurality of information processing occurs, Based on the first identifier for identifying the failure information processing, the status information related to cooperative information processing that is information processing linked to the failure information processing among the plurality of information processing. To identify the location that stores, from the identified location, characterized in that to obtain the status information that is associated with the first identifier for identifying the cooperative processing.
また、上記目的を達成する更なる見地において、本願発明に係る障害情報収集プログラムは、連携して動作する複数の情報処理について、前記情報処理を識別する第1の識別子を関連付けて連携情報記憶域に記憶する連携情報記憶処理と、前記第1の識別子と、前記情報処理に関する実行状態を示す状態情報を格納している場所を識別する第2の識別子とを関連付けて格納場所情報記憶域に記憶する格納場所情報記憶処理と、前記複数の情報処理のうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、前記連携情報記憶域及び前記格納場所情報記憶域を参照することにより、前記障害情報処理を識別する前記第1の識別子を基に、前記複数の情報処理のうち、当該障害情報処理と連携する情報処理である連携情報処理に関する前記状態情報を格納している場所を特定して、特定された場所から、前記連携情報処理を識別する前記第1の識別子により関連付けされている前記状態情報を入手する入手処理と、をコンピュータに実行させることを特徴とする。 Further, in a further aspect of achieving the above object, the failure information collection program according to the present invention relates to a plurality of information processing operating in cooperation with each other by associating a first identifier for identifying the information processing with a cooperative information storage area. The association information storage process stored in the storage area, the first identifier, and the second identifier for identifying the location storing the state information indicating the execution state related to the information processing are associated and stored in the storage location information storage area Storage location information storage processing to be performed, and the failure information processing, which is at least one of the plurality of information processing, when the failure that causes the failure occurs, the linkage information storage area and the storage location Based on the first identifier for identifying the failure information processing by referring to the information storage area, information that cooperates with the failure information processing among the plurality of information processing A location where the status information related to the cooperative information processing is stored is identified, and the status information associated with the first identifier for identifying the collaborative information processing is obtained from the identified location The acquisition process is executed by a computer.
更に、本発明は、係る情報読取プログラム(コンピュータプログラム)が格納された、コンピュータ読み取り可能な、不揮発性の記憶媒体によっても実現可能である。 Furthermore, the present invention can be realized by a computer-readable non-volatile storage medium in which such an information reading program (computer program) is stored.
本願発明は、複数の情報処理が連携して動作するシステムにおいて障害が発生した際に、障害発生元である情報処理と連携する全ての情報処理に係る状態情報を、効率的に着実に収集することを可能とする。 In the present invention, when a failure occurs in a system in which a plurality of information processings operate in cooperation, state information relating to all information processing linked with the information processing that is the source of the failure is efficiently and steadily collected. Make it possible.
以下、本願発明の実施の形態について図面を参照して詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
<第1の実施形態>
図1は第1の実施形態の障害情報収集システム1の構成を概念的に示すブロック図である。本実施形態の障害情報収集システム1は、障害情報収集装置10、及び、n(nは1以上の整数)個の情報処理装置20−1乃至nを有している。これらの装置は、通信ネットワーク40(以下、単に「ネットワーク」と称する)により通信可能に接続されている。
<First Embodiment>
FIG. 1 is a block diagram conceptually showing the structure of a failure information collection system 1 of the first embodiment. The failure information collection system 1 of the present embodiment includes a failure
情報処理装置20−1乃至nは、それぞれ、アプリケーション200−1乃至nを実行している。アプリケーション200−1乃至nは、ネットワークを介して情報を交換することにより、互いに連携して動作する。アプリケーション200−1乃至nは、それぞれ所定のタイミングで、状態情報201−1乃至nを出力する。状態情報201−1乃至nは、それぞれ、アプリケーション200−1乃至nに係る実行状態を示す情報であり、例えば、アプリケーション200−1乃至nが使用する変数の情報等を含んだログ情報である。状態情報201−1乃至nは、情報処理装置20−1乃至nが備える状態情報採取機能により出力されてもよい。 The information processing apparatuses 20-1 to 20-n execute applications 200-1 to 200-n, respectively. The applications 200-1 to 200-n operate in cooperation with each other by exchanging information via the network. The applications 200-1 to 200-n output the state information 201-1 to n at predetermined timings, respectively. The status information 201-1 to n is information indicating the execution status related to the applications 200-1 to 200-n, for example, log information including information on variables used by the applications 200-1 to 200-n. The state information 201-1 to n may be output by a state information collection function included in the information processing devices 20-1 to 20-n.
情報処理装置20−1乃至nは、出力された状態情報201−乃至nを格納している。本実施形態では、情報処理装置20−1乃至nは、説明における便宜上、それぞれ、1つのアプリケーションを実行しているが、複数のアプリケーションを実行してもよい。 The information processing apparatuses 20-1 to 20-n store the output state information 201- to n. In the present embodiment, each of the information processing apparatuses 20-1 to 20-n executes one application for convenience of explanation, but may execute a plurality of applications.
障害情報収集装置10は、連携情報記憶部11、格納場所情報記憶部12、入手部13、状態情報記憶部14、及び、配置部15を備えている。
The failure
入手部13、及び、配置部15は、電子回路の場合もあれば、コンピュータプログラムとそのコンピュータプログラムに従って動作するプロセッサによって実現される場合もある。連携情報記憶部11、格納場所情報記憶部12、及び、状態情報記憶部14は、電子回路、あるいは、コンピュータプログラムとそのコンピュータプログラムに従って動作するプロセッサによりアクセス制御される、磁気ディスクや電子メモリ等の記憶デバイスである。
The obtaining
連携情報記憶部11は、連携情報110を記憶している。連携情報110の構成例を図6に示す。図6(a)は、アプリケーション200−1乃至200−nが図4に示す通りに連携する場合における連携情報110の構成例である。図6(b)は、アプリケーション200−1乃至200−nが図5に示す通りに連携する場合における連携情報110の構成例である。
The cooperation
図4に示す第1のアプリケーション連携例においては、情報処理装置が特定の機能を提供する際に中心となるアプリケーションであるメインアプリケーションとして、アプリケーション200−1及び200−2が動作する。アプリケーション200−3及び200−4は、アプリケーション200−1と連携して動作する連携アプリケーションである。アプリケーション200−4、200−5、及び、200−6は、アプリケーション200−2と連携して動作する連携アプリケーションである。尚、アプリケーション200−4は、アプリケーション200−1及び200−2の両方と連携して動作する。 In the first application cooperation example illustrated in FIG. 4, the applications 200-1 and 200-2 operate as main applications that are applications that are central when the information processing apparatus provides a specific function. The applications 200-3 and 200-4 are cooperative applications that operate in cooperation with the application 200-1. The applications 200-4, 200-5, and 200-6 are cooperative applications that operate in cooperation with the application 200-2. The application 200-4 operates in cooperation with both the applications 200-1 and 200-2.
図6(a)に示す通り、連携情報110は、メインアプリケーション毎に、メインアプリケーションを識別する識別子と、そのメインアプリケーションと連携する連携アプリケーションを識別する識別子とを関連付けたレコードを包含している。第1のアプリケーション連携例においては、連携情報110は、アプリケーション200−1を、アプリケーション200−3及び200−4に関連付けたレコードを包含している。連携情報110は、アプリケーション200−2を、アプリケーション200−4、200−5、及び、200−6に関連付けたレコードを包含している。尚、図6(a)に示す例では、連携情報110は、メインアプリケーションと連携アプリケーションを区別した構成をとっているが、メインアプリケーションと連携アプリケーションを区別しない構成をとってもよい。
As shown in FIG. 6A, the
図5に示す第2のアプリケーション連携例においては、メインアプリケーションとして、アプリケーション200−1が動作する。アプリケーション200−2及び200−3は、アプリケーション200−1と連携して動作する連携アプリケーションである。また、アプリケーション200−4は、アプリケーション200−3と連携して動作する連携アプリケーションである。アプリケーション200−4は、アプリケーション200−1と間接的に連携して動作する。 In the second application cooperation example illustrated in FIG. 5, the application 200-1 operates as the main application. The applications 200-2 and 200-3 are cooperative applications that operate in cooperation with the application 200-1. The application 200-4 is a cooperative application that operates in cooperation with the application 200-3. The application 200-4 operates indirectly in cooperation with the application 200-1.
図6(b)に示す通り、第2のアプリケーション連携例においては、連携情報110は、アプリケーション200−1を、アプリケーション200−2、200−3、及び、200−4に関連付けたレコードを包含している。
As shown in FIG. 6B, in the second application cooperation example, the
格納場所情報記憶部12は、格納場所情報120を記憶している。格納場所情報120の構成例を図7に示す。格納場所情報120は、アプリケーション200−1乃至nを識別する識別子と、そのアプリケーションに係る状態情報を格納する情報処理装置20−1乃至nを識別する識別子とを関連付けたレコードを包含している。図7に示す例の場合、格納場所情報120は、アプリケーション200−1乃至nに係る状態情報が、それぞれ、情報処理装置20−1乃至nにおいて格納されていることを示している。
The storage location
状態情報記憶部14は、アプリケーション200−1乃至nに係る状態情報201−1乃至nを、それぞれ、状態情報140−1乃至nとして、まとめて格納している。
The state
入手部13は、情報処理装置20−1乃至nにおけるいずれかの情報処理装置20−i(iは1乃至nにおけるいずれかの整数)から、実行していたアプリケーション200−iにおいて障害が発生したことを受信した場合、連携情報記憶部11における連携情報110を参照する。入手部13は、連携情報110において、アプリケーション200−iを識別する識別子を含むレコードを検索し、その検索によってヒットしたレコードに包含されるアプリケーション200−j(jは1乃至nにおけるiを除く1個以上の整数)を識別する識別子を抽出する。
The
例えば、図4に示す第1のアプリケーション連携例において、アプリケーション200−3に係る障害が発生した場合、入手部13は、連携情報110から、アプリケーション200−jとして、アプリケーション200−1及び200−4を抽出する。また、第1のアプリケーション連携例において、アプリケーション200−4に係る障害が発生した場合、入手部13は、連携情報110から、アプリケーション200−jとして、アプリケーション200−1、200−2、200−3、200−5、及び、200−6を抽出する。また、第2のアプリケーション連携例において、アプリケーション200−1に係る障害が発生した場合、入手部13は、連携情報110から、アプリケーション200−jとして、アプリケーション200−2、200−3、及び、200−4を抽出する。
For example, in the first application cooperation example illustrated in FIG. 4, when a failure relating to the application 200-3 occurs, the
入手部13は、格納場所情報記憶部12における格納場所情報120を参照することにより、抽出したアプリケーション200−jを識別する識別子により特定される、アプリケーション200−jに係る状態情報を格納する情報処理装置20−jを特定する。入手部13は、情報処理装置20−i及びjから、状態情報201−i及びjを入手して、それぞれ、状態情報記憶部14に、状態情報140−i及びjとして、まとめて格納する。
The obtaining
配置部15は、連携アプリケーションが包含するアプリケーション本体150−1乃至nを外部から受信する。アプリケーション本体150−1乃至nは、ソースファイル、あるいは、オブジェクトファイル等のファイルである。配置部15は、連携アプリケーションが包含するアプリケーション本体150−1乃至nを、所定の基準に従い、それぞれ情報処理装置20−1乃至nのいずれかに割り当てて、アプリケーション200−1乃至nとして、情報処理装置20−1乃至nへ送信する。配置部15は、上述した所定の基準として、システム管理者により割り当てが指定された情報を使用する場合もあれば、情報処理装置20−1乃至nに係る負荷状態から決定される基準を使用する場合などがある。配置部15は、アプリケーション200−1乃至nを識別する識別子と、アプリケーション200−1乃至nが割り当てられた、情報処理装置20−1乃至nを識別する識別子とを関連付けて、格納場所情報120として、格納場所情報記憶部12へ入力する。
The
配置部15は、アプリケーション200−1乃至nを識別する識別子を互いに関連付けて、連携情報110として、連携情報記憶部11へ入力する。
The
次に図2のフローチャートを参照して、本実施形態に係る障害情報収集システム1が、障害情報を収集する動作(処理)について詳細に説明する。 Next, with reference to the flowchart of FIG. 2, an operation (processing) in which the failure information collection system 1 according to the present embodiment collects failure information will be described in detail.
入手部13は、情報処理装置20−i(iは1乃至nにおける整数)から、実行していたアプリケーション200−iにおいて障害が発生したことを受信する(ステップS101)。入手部13は、連携情報記憶部11における連携情報110を参照し、アプリケーション200−iを識別する識別子を含むレコードが包含するアプリケーション200−j(jは1乃至nにおけるiを除く1個以上の整数)を識別する識別子を抽出する(ステップS102)。
The obtaining
入手部13は、格納場所情報記憶部12における格納場所情報120を参照し、アプリケーション200−jを識別する識別子により特定される、アプリケーション200−jに関する状態情報201−jを格納する情報処理装置20−jを特定する(ステップS103)。入手部13は、情報処理装置20−i及びjから、状態情報201−i及びjを入手して、状態情報記憶部に、状態情報140−i及びjとして格納し(ステップS104)、全体の処理は終了する。
The obtaining
次に図3のフローチャートを参照して、本実施形態に係る障害情報収集システム1が、障害情報110及び格納場所情報120を登録する動作(処理)について詳細に説明する。
Next, an operation (process) in which the failure information collection system 1 according to the present embodiment registers the
配置部15は、入力された連携アプリケーションが包含するアプリケーション本体150−1乃至nを、所定の基準に従い、それぞれ情報処理装置20−1乃至nのいずれかに割り当てて、アプリケーション200−1乃至nとして、情報処理装置20−1乃至nへ送信する(ステップS201)。配置部15は、アプリケーション200−1乃至nを識別する識別子と、アプリケーション200−1乃至nが割り当てられた、情報処理装置20−1乃至nを識別する識別子とを関連付けて、格納場所情報120として、格納場所情報記憶部12へ入力する(ステップS202)。配置部15は、アプリケーション200−1乃至nを識別する識別子を互いに関連付けて、連携情報110として、連携情報記憶部11へ入力し(ステップS203)、全体の処理は終了する。
The
本実施形態に係る障害情報収集装置10は、複数のアプリケーションが連携して動作するシステムにおいて障害が発生した際に、障害発生元であるアプリケーションと連携する全てのアプリケーションに係る状態情報を、効率的に着実に収集することができる。その理由は、入手部13が、障害発生元であるアプリケーションと連携する全てのアプリケーション、及び、そのアプリケーションに関する状態情報を格納している情報処理装置を、連携情報110及び格納場所情報120を基に特定し、特定された情報処理装置から、障害発生元であるアプリケーションと連携するアプリケーションに係る状態情報を入手するからである。
When a failure occurs in a system in which a plurality of applications operate in cooperation with each other, the failure
複数のアプリケーションが連携して動作するシステムにおいて、いずれかのアプリケーションに係る障害が発生した場合、障害が発生した原因が、必ずしも当該アプリケーションに存在するとは限らないため、当該アプリケーションに係る状態情報のみを採取しても十分な障害解析を行うことはできない。したがって、このような場合、障害解析を十分に行うためには、当該アプリケーションと連携する全てのアプリケーションに係る状態情報を収集する必要がある。 In a system in which multiple applications operate in cooperation, when a failure related to one of the applications occurs, the cause of the failure does not necessarily exist in the application, so only the status information related to the application is displayed. Even if collected, sufficient failure analysis cannot be performed. Therefore, in such a case, in order to sufficiently perform failure analysis, it is necessary to collect state information relating to all the applications that cooperate with the application.
昨今のクラウドコンピューティング環境を構築する大規模なコンピュータシステムにおいては、膨大な数のアプリケーションが連携して動作し、それらのアプリケーションを実行して状態情報を格納する情報処理装置も、膨大な数になる。したがって、システム管理者が、アプリケーションに係る仕様書などを基に、障害発生元であるアプリケーションと連携するアプリケーションに係る状態情報を手作業により収集することは、作業効率の観点から現実的ではない。 In a large-scale computer system that constructs a recent cloud computing environment, an enormous number of information processing apparatuses that operate in cooperation with each other and store state information by executing these applications are also enormous. Become. Therefore, it is not realistic from the viewpoint of work efficiency that the system administrator manually collects the state information related to the application that cooperates with the application that has caused the failure based on the specification related to the application.
本実施形態に係る障害情報収集装置10は、どのアプリケーション同士が連携して動作するかについて、連携情報記憶部11に連携情報110として記憶している。障害情報収集装置10は、それぞれのアプリケーションに係る状態情報がどの情報処理装置に格納されているかについて、格納場所情報記憶部12に格納場所情報120として記憶している。
そして、入手部13は、障害発生元であるアプリケーションを識別する識別子を基に、連携情報110と格納場所情報120を参照することにより、障害発生元であるアプリケーションと連携する全てのアプリケーションについて、状態情報を格納している情報処理装置を特定できる。したがって、障害情報管理装置10は、当該アプリケーションと連携する全てのアプリケーションに係る状態情報を収集することができる。
The failure
Then, the obtaining
また、配置部15は、連携アプリケーションとして、複数のアプリケーションを実行する際に、これらのアプリケーションに係る状態情報を格納する情報処理装置を、格納場所情報120として登録する。配置部15は、これらのアプリケーションが連携していることを、連携情報110として登録する。したがって、システム管理者が、連携情報110及び格納場所情報120を手作業により登録する必要がないため、障害情報管理装置10は、システム管理者に対して負担をかけることなく、上述した機能を提供することができる。また、システム管理装置がシステム管理を行うシステムにおいても同様に、障害情報管理装置10は、システム管理装置に対して負担をかけずに、上述した機能を提供することができる。
Further, when executing a plurality of applications as linked applications, the
尚、本実施形態では、アプリケーションを実行する装置と、当該アプリケーションに係る状態情報を格納する装置は、同じ情報処理装置としているが、アプリケーションを実行する装置と、当該アプリケーションに係る状態情報を格納する装置は、異なる装置であってもよい。例えば、複数の情報処理装置に係る障害情報を管理する障害管理装置が、これらの情報処理装置で実行されているアプリケーションに係る状態情報を採取して格納してもよい。その場合、格納場所情報120における状態情報格納場所は、アプリケーションが実行される情報処理装置を識別する識別子ではなく、上述した障害管理装置を識別する識別子となる。
In this embodiment, the device that executes the application and the device that stores the state information related to the application are the same information processing device, but stores the device that executes the application and the state information related to the application. The device may be a different device. For example, a failure management device that manages failure information related to a plurality of information processing devices may collect and store state information related to applications executed by these information processing devices. In this case, the status information storage location in the
<第2の実施形態>
図8は第2の実施形態の障害情報収集装置30の構成を概念的に示すブロック図である。
<Second Embodiment>
FIG. 8 is a block diagram conceptually showing the structure of the failure
本実施形態の障害情報収集装置30は、連携情報記憶部11、格納場所情報記憶部12、及び、入手部13を備えている。
The failure
連携情報記憶部11は、連携して動作する複数の情報処理202−1乃至nについて、情報処理202−1乃至nを識別する第1の識別子を関連付けて記憶する。
The cooperation
格納情報記憶部12は、第1の識別子と、情報処理202−1乃至nに関する実行状態を示す状態情報201−1乃至nを格納している場所を識別する第2の識別子とを関連付けて記憶する。
The storage
入手部13は、情報処理202−1乃至nのうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、連携情報記憶部11及び格納場所情報記憶部12を参照することにより、障害情報処理を識別する第1の識別子を基に、情報処理202−1乃至nのうち、当該障害情報処理と連携する情報処理である連携情報処理に関する状態情報を格納している場所を特定する。入手部13は、特定された場所から、連携情報処理を識別する第1の識別子に関連付けされている状態情報を入手する。
The
本実施形態に係る障害情報収集装置10は、複数の情報処理が連携して動作するシステムにおいて障害が発生した際に、障害発生元である情報処理と連携する全ての情報処理に係る状態情報を、効率的に着実に収集することができる。その理由は、入手部13が、障害発生元である情報処理と連携する全ての情報処理、及び、その情報処理に関する状態情報を格納している場所を、連携情報記憶部11及び格納場所情報記憶部12を参照することにより特定し、特定された場所から、障害発生元である情報処理と連携する情報処理に係る状態情報を入手するからである。
When a failure occurs in a system in which a plurality of information processings operate in cooperation with each other, the failure
尚、情報処理202−1乃至nは、第1の実施形態のように、アプリケーションである場合もあれば、ドライバーソフトやファームウェア等のシステム制御を行うソフトウェアである場合もある。 The information processing 202-1 to 202-n may be an application as in the first embodiment, or may be software that performs system control such as driver software and firmware.
<ハードウェア構成例>
上述した各実施形態において図1、及び、図8に示した各部は、ソフトウェアプログラムの機能(処理)単位(ソフトウェアモジュール)と捉えることができる。但し、これらの図面に示した各部の区分けは、説明の便宜上の構成であり、実装に際しては、様々な構成が想定され得る。この場合のハードウェア環境の一例を、図9を参照して説明する。
<Hardware configuration example>
In each of the above-described embodiments, each unit illustrated in FIGS. 1 and 8 can be regarded as a function (processing) unit (software module) of a software program. However, the division of each part shown in these drawings is a configuration for convenience of explanation, and various configurations can be assumed for mounting. An example of the hardware environment in this case will be described with reference to FIG.
図9は、本発明の模範的な実施形態に係る障害情報収集装置を実行可能な情報処理装置900(コンピュータ)の構成を例示的に説明する図である。即ち、図9は、図1、及び、図8に示した障害情報収集装置を実現可能なコンピュータ(情報処理装置)の構成であって、上述した実施形態における各機能を実現可能なハードウェア環境を表す。 FIG. 9 is a diagram exemplarily illustrating a configuration of an information processing apparatus 900 (computer) that can execute the failure information collection apparatus according to the exemplary embodiment of the present invention. That is, FIG. 9 shows a configuration of a computer (information processing apparatus) that can realize the failure information collection apparatus shown in FIGS. 1 and 8, and a hardware environment that can realize each function in the above-described embodiment. Represents.
図9に示した情報処理装置900は、CPU901(Central_Processing_Unit)、ROM902(Read_Only_Memory)、RAM903(Random_Access_Memory)、ハードディスク904(記憶装置)、外部装置との通信インタフェース905(Interface:以降、「I/F」と称する)、CD−ROM(Compact_Disc_Read_Only_Memory)等の記憶媒体907に格納されたデータを読み書き可能なリーダライタ908、及び、入出力インタフェース909を備え、これらの構成がバス906(通信線)を介して接続された一般的なコンピュータである。
The
そして、上述した実施形態を例に説明した本発明は、図9に示した情報処理装置900に対して、その実施形態の説明において参照したブロック構成図(図1、及び、図8)或いはフローチャート(図2乃至3)の機能を実現可能なコンピュータプログラムを供給した後、そのコンピュータプログラムを、当該ハードウェアのCPU901に読み出して解釈し実行することによって達成される。また、当該装置内に供給されたコンピュータプログラムは、読み書き可能な揮発性の記憶メモリ(RAM903)またはハードディスク904等の不揮発性の記憶デバイスに格納すれば良い。
The present invention described using the above-described embodiment as an example is a block configuration diagram (FIGS. 1 and 8) or a flowchart referred to in the description of the
また、前記の場合において、当該ハードウェア内へのコンピュータプログラムの供給方法は、CD−ROM等の各種記憶媒体907を介して当該装置内にインストールする方法や、インターネット等の通信回線を介して外部よりダウンロードする方法等のように、現在では一般的な手順を採用することができる。そして、このような場合において、本発明は、係るコンピュータプログラムを構成するコード或いは、そのコードが格納された記憶媒体907によって構成されると捉えることができる。
In the above-described case, the computer program can be supplied to the hardware by a method of installing in the apparatus via
以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。 The present invention has been described above using the above-described embodiment as an exemplary example. However, the present invention is not limited to the above-described embodiment. That is, the present invention can apply various modes that can be understood by those skilled in the art within the scope of the present invention.
1 障害情報収集システム
10 障害情報収集装置
11 連携情報記憶部
110 連携情報
12 格納場所情報記憶部
120 格納場所情報
13 入手部
14 状態情報記憶部
140−1乃至n 状態情報
15 配置部
150−1乃至n アプリケーション本体
20−1乃至n 情報処理装置
200−1乃至n アプリケーション
201−1乃至n 状態情報
30 障害情報収集装置
40 通信ネットワーク
900 情報処理装置
901 CPU
902 ROM
903 RAM
904 ハードディスク
905 通信インタフェース
906 バス
907 記憶媒体
908 リーダライタ
909 入出力インタフェース
DESCRIPTION OF SYMBOLS 1 Failure
902 ROM
903 RAM
904
Claims (10)
前記第1の識別子と、前記情報処理に関する実行状態を示す状態情報を格納している場所を識別する第2の識別子とを関連付けて記憶する格納場所情報記憶手段と、
前記複数の情報処理のうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、前記連携情報記憶手段及び前記格納場所情報記憶手段を参照することにより、前記障害情報処理を識別する前記第1の識別子を基に、前記複数の情報処理のうち、当該障害情報処理と連携する情報処理である連携情報処理に関する前記状態情報を格納している場所を特定して、特定された場所から、前記連携情報処理を識別する前記第1の識別子に関連付けされている前記状態情報を入手する入手手段と、
を備える障害情報収集装置。 For a plurality of information processing operating in cooperation with each other, cooperative information storage means for storing a first identifier for identifying the information processing in association with each other;
A storage location information storage unit that associates and stores the first identifier and a second identifier that identifies a location storing state information indicating an execution state related to the information processing;
By referring to the linkage information storage unit and the storage location information storage unit when a failure occurs in which failure information processing, which is at least one of the plurality of information processings, is a failure occurrence source, Based on the first identifier for identifying the failure information processing, the location storing the state information related to cooperative information processing that is information processing that cooperates with the fault information processing among the plurality of information processing is stored. Specifying and obtaining from the identified location the status information associated with the first identifier identifying the linked information processing;
A failure information collecting apparatus comprising:
をさらに備える、請求項1に記載の障害情報収集装置。 The apparatus further comprises an arrangement unit that determines a location for storing the state information according to a predetermined criterion, and associates the first identifier and the second identifier and inputs the first identifier and the second identifier to the storage location information storage unit. The failure information collection device according to 1.
請求項1または2に記載の障害情報収集装置。 The arrangement means associates the first identifiers with each other and inputs the information to the cooperation information storage means when determining a location for storing the state information regarding the plurality of information processing operating in cooperation with each other.
The fault information collection device according to claim 1 or 2.
をさらに備える、請求項1乃至3のいずれかに記載の障害情報収集装置。 The fault information collection device according to any one of claims 1 to 3, further comprising state information storage means for storing the state information obtained by the obtaining means.
連携して動作する複数の情報処理について、前記情報処理を識別する第1の識別子を関連付けて連携情報記憶域に記憶し、
前記第1の識別子と、前記情報処理に関する実行状態を示す状態情報を格納している場所を識別する第2の識別子とを関連付けて格納場所情報記憶域に記憶し、
前記複数の情報処理のうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、前記連携情報記憶域及び前記格納場所情報記憶域を参照することにより、前記障害情報処理を識別する前記第1の識別子を基に、前記複数の情報処理のうち、当該障害情報処理と連携する情報処理である連携情報処理に関する前記状態情報を格納している場所を特定して、特定された場所から、前記連携情報処理を識別する前記第1の識別子に関連付けされている前記状態情報を入手する、
障害情報収集方法。 Depending on the information processing device,
For a plurality of information processing operating in cooperation, a first identifier for identifying the information processing is associated and stored in the cooperation information storage area,
Storing the first identifier in a storage location information storage area in association with a second identifier for identifying a location storing state information indicating an execution state related to the information processing;
By referring to the linkage information storage area and the storage location information storage area when a failure occurs in which the failure information processing, which is at least one of the plurality of information processings, is a failure occurrence source Based on the first identifier for identifying the failure information processing, the location storing the state information related to cooperative information processing that is information processing that cooperates with the fault information processing among the plurality of information processing is stored. Identifying and obtaining from the identified location the state information associated with the first identifier identifying the linked information process;
Fault information collection method.
前記状態情報を格納する場所を、所定の基準に従って決定し、前記第1の識別子、及び、前記第2の識別子を関連付けて、前記格納場所情報記憶域に入力する
請求項5に記載の障害情報収集方法。 Depending on the information processing device,
The failure information according to claim 5, wherein a location for storing the state information is determined according to a predetermined criterion, and the first identifier and the second identifier are associated and input to the storage location information storage area. Collection method.
連携して動作する複数の前記情報処理に関する前記状態情報を格納する場所を決定する際に、前記第1の識別子を互いに関連付けて、前記連携情報記憶域に入力する
請求項5または6に記載の障害情報収集方法。 Depending on the information processing device,
The said 1st identifier is mutually linked | related and input into the said cooperation information storage area, when determining the place which stores the said status information regarding the said several information processing which operate | moves in cooperation, The said cooperation information storage area is input. Fault information collection method.
前記第1の識別子と、前記情報処理に関する実行状態を示す状態情報を格納している場所を識別する第2の識別子とを関連付けて格納場所情報記憶域に記憶する格納場所情報記憶処理と、
前記複数の情報処理のうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、前記連携情報記憶域及び前記格納場所情報記憶域を参照することにより、前記障害情報処理を識別する前記第1の識別子を基に、前記複数の情報処理のうち、当該障害情報処理と連携する情報処理である連携情報処理に関する前記状態情報を格納している場所を特定して、特定された場所から、前記連携情報処理を識別する前記第1の識別子により関連付けされている前記状態情報を入手する入手処理と、
をコンピュータに実行させる障害情報収集プログラム。 For a plurality of information processing operating in cooperation with each other, a cooperative information storage process that associates a first identifier for identifying the information processing and stores it in a cooperative information storage area;
A storage location information storage process for associating the first identifier with a second identifier for identifying a location storing state information indicating an execution state related to the information processing in a storage location information storage area;
By referring to the linkage information storage area and the storage location information storage area when a failure occurs in which the failure information processing, which is at least one of the plurality of information processings, is a failure occurrence source Based on the first identifier for identifying the failure information processing, the location storing the state information related to cooperative information processing that is information processing that cooperates with the fault information processing among the plurality of information processing is stored. Specifying and obtaining the status information associated with the first identifier that identifies the cooperative information processing from the identified location;
Information collection program that causes a computer to execute
をコンピュータに実行させる請求項8に記載の障害情報収集プログラム。 A location for storing the state information is determined according to a predetermined standard, and the computer executes an arrangement process in which the first identifier and the second identifier are associated and input to the storage location information storage area. Item 10. A failure information collection program according to item 8.
をコンピュータに実行させる請求項8または9に記載の障害情報収集プログラム。 When determining a location for storing the state information related to a plurality of the information processing operating in cooperation, the computer executes the arrangement process of associating the first identifiers with each other and inputting the information to the cooperation information storage area The failure information collection program according to claim 8 or 9.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013189931A JP2015056082A (en) | 2013-09-13 | 2013-09-13 | Failure information collection device, failure information collection method, and failure information collection program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013189931A JP2015056082A (en) | 2013-09-13 | 2013-09-13 | Failure information collection device, failure information collection method, and failure information collection program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015056082A true JP2015056082A (en) | 2015-03-23 |
Family
ID=52820428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013189931A Pending JP2015056082A (en) | 2013-09-13 | 2013-09-13 | Failure information collection device, failure information collection method, and failure information collection program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015056082A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019175169A (en) * | 2018-03-28 | 2019-10-10 | 株式会社リコー | Trouble management system, trouble management device, trouble management method and program |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07183891A (en) * | 1993-12-24 | 1995-07-21 | Mitsubishi Electric Corp | Computer system |
JP2001175460A (en) * | 1999-12-15 | 2001-06-29 | Hitachi Ltd | Program distribution management system |
JP2007108929A (en) * | 2005-10-12 | 2007-04-26 | Nec Corp | Log management system, log management manager, log management method, and program |
WO2010046972A1 (en) * | 2008-10-21 | 2010-04-29 | 富士通株式会社 | Change impact research support program, change impact research support device, and change impact research support method |
JP2011128678A (en) * | 2009-12-15 | 2011-06-30 | Hitachi Ltd | Device, method and program for monitoring operation |
JP2011197785A (en) * | 2010-03-17 | 2011-10-06 | Nomura Research Institute Ltd | System and program for collecting log |
-
2013
- 2013-09-13 JP JP2013189931A patent/JP2015056082A/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07183891A (en) * | 1993-12-24 | 1995-07-21 | Mitsubishi Electric Corp | Computer system |
JP2001175460A (en) * | 1999-12-15 | 2001-06-29 | Hitachi Ltd | Program distribution management system |
JP2007108929A (en) * | 2005-10-12 | 2007-04-26 | Nec Corp | Log management system, log management manager, log management method, and program |
WO2010046972A1 (en) * | 2008-10-21 | 2010-04-29 | 富士通株式会社 | Change impact research support program, change impact research support device, and change impact research support method |
JP2011128678A (en) * | 2009-12-15 | 2011-06-30 | Hitachi Ltd | Device, method and program for monitoring operation |
JP2011197785A (en) * | 2010-03-17 | 2011-10-06 | Nomura Research Institute Ltd | System and program for collecting log |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019175169A (en) * | 2018-03-28 | 2019-10-10 | 株式会社リコー | Trouble management system, trouble management device, trouble management method and program |
JP7069956B2 (en) | 2018-03-28 | 2022-05-18 | 株式会社リコー | Fault management system, fault management device and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11550829B2 (en) | Systems and methods for load balancing in a system providing dynamic indexer discovery | |
CN110865867B (en) | Method, device and system for discovering application topological relation | |
EP2738679A1 (en) | Computer program and management computer | |
US10944655B2 (en) | Data verification based upgrades in time series system | |
JPWO2013046287A1 (en) | Management computer and method for analyzing root cause | |
CN109672722B (en) | Data deployment method and device, computer storage medium and electronic equipment | |
CN103973470A (en) | Cluster management method and equipment for shared-nothing cluster | |
WO2013061213A1 (en) | Passive monitoring of virtual systems using extensible indexing | |
JP2022033685A (en) | Method, apparatus, electronic device, computer readable storage medium and computer program for determining robustness | |
JP5268589B2 (en) | Information processing apparatus and information processing apparatus operating method | |
US9021078B2 (en) | Management method and management system | |
JP5740338B2 (en) | Virtual environment operation support system | |
JP5642725B2 (en) | Performance analysis apparatus, performance analysis method, and performance analysis program | |
JP6364727B2 (en) | Information processing system, distributed processing method, and program | |
JP2015056082A (en) | Failure information collection device, failure information collection method, and failure information collection program | |
JP2013228970A (en) | Version-up management method in task system | |
JP6065843B2 (en) | Service level management apparatus, program, and method | |
WO2015019488A1 (en) | Management system and method for analyzing event by management system | |
US11374815B2 (en) | Network configuration diagram generate method and recording medium | |
JP2018067241A (en) | Operation log generation device, operation log generation system, operation log generation method, and operation log generation program | |
US20180365280A1 (en) | Log management apparatus and log management method | |
JP2014109975A (en) | Performance analysis device, performance analysis method and performance analysis program | |
JP2020135701A (en) | Information processing system, information processing device, and information processing program | |
JP2014178912A (en) | Server movement planning support method | |
US10158603B2 (en) | Efficient storage of network discovery ranges |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160816 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170501 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170713 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171212 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180619 |