JP2015056082A - Failure information collection device, failure information collection method, and failure information collection program - Google Patents

Failure information collection device, failure information collection method, and failure information collection program Download PDF

Info

Publication number
JP2015056082A
JP2015056082A JP2013189931A JP2013189931A JP2015056082A JP 2015056082 A JP2015056082 A JP 2015056082A JP 2013189931 A JP2013189931 A JP 2013189931A JP 2013189931 A JP2013189931 A JP 2013189931A JP 2015056082 A JP2015056082 A JP 2015056082A
Authority
JP
Japan
Prior art keywords
information
information processing
identifier
failure
cooperation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013189931A
Other languages
Japanese (ja)
Inventor
健太郎 三澤
Kentaro Misawa
健太郎 三澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013189931A priority Critical patent/JP2015056082A/en
Publication of JP2015056082A publication Critical patent/JP2015056082A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To efficiently and surely collect state information relating to all of information processing processes cooperating with an information processing process from which a failure originates, when the failure occurs in a system in which a plurality of information processing processes operate in cooperation with each other.SOLUTION: A failure information collection device 30 includes: a cooperation information storage unit 11 in which information processing processes operating in cooperation with each other are stored in association with first identifiers identifying the information processing processes; a storage place information storage unit 12 in which the first identifiers and second identifiers identifying places where pieces of state information respectively relating to information processing processes are stored are stored in association with each other; and acquisition means 13 which, if a failure occurs in information processing, refers to the cooperation information storage unit 11 and the storage place information storage unit 12 to specify a place in which a piece of state information relating to a cooperative information processing process cooperating with a faulty information processing process from which the failure originates, on the basis of the first identifier identifying the faulty information processing process and acquires the piece of state information associated by the first identifier identifying the cooperative information processing process, from the specified place.

Description

本願発明は、複数の情報処理が連携して動作する際に障害が発生したときの、当該情報処理に関する障害情報を収集する障害情報収集装置等に関する。   The present invention relates to a failure information collection device and the like that collects failure information related to information processing when a failure occurs when a plurality of information processings operate in cooperation.

大規模なコンピュータシステムにおいては、複数の情報処理装置を使用した分散アプリケーションが実行されることが多い。分散アプリケーションに包含される個々のアプリケーションは、それぞれ、他のアプリケーションと情報交換することにより連携して動作する。   In a large-scale computer system, a distributed application using a plurality of information processing apparatuses is often executed. Individual applications included in the distributed application operate in cooperation by exchanging information with other applications.

分散アプリケーションに包含される何れかのアプリケーションに関して障害が発生した場合、障害解析を行うために、障害が発生したアプリケーションに係る状態情報を取集する必要がある。状態情報とは、当該アプリケーションが出力する、あるいは、当該アプリケーションを実行している情報処理装置によって採取されるログ情報等であり、例えば、当該アプリケーションが使用する変数が示す値などを含んだ、当該アプリケーションに関する実行状態を示す情報である。   When a failure occurs in any of the applications included in the distributed application, it is necessary to collect state information related to the application in which the failure has occurred in order to perform failure analysis. The state information is log information output by the application or collected by the information processing apparatus that is executing the application. For example, the state information includes a value indicated by a variable used by the application, This is information indicating an execution state related to the application.

分散アプリケーションにおいては、連携先であるアプリケーションから不正な情報を入手したことが原因で障害が発生することもある。したがって、障害発生元であるアプリケーションに係る状態情報を収集するのみでは十分な障害解析を行うことができないため、全ての連携先であるアプリケーションに係る状態情報を効率的に収集する技術が求められている。   In a distributed application, a failure may occur due to illegal information obtained from an application that is a cooperation destination. Therefore, since it is not possible to perform sufficient failure analysis simply by collecting status information related to the application that is the source of the failure, there is a need for a technology that efficiently collects status information related to the applications that are all linked destinations. Yes.

上述した技術に関連する技術として、特許文献1には、複数のコンピュータが連携して動作するシステムにおいて、アプリケーションが、連携先である障害が発生した相手アプリケーションの状態を、容易に検知できるようにしたシステムが開示されている。   As a technique related to the above-described technique, Patent Document 1 discloses that in a system in which a plurality of computers operate in cooperation, an application can easily detect the state of a partner application in which a failure that is a cooperation destination has occurred. A system is disclosed.

特開2010-170294号公報JP 2010-170294 A

近年では、クラウドコンピューティング環境において、分散アプリケーションが実行される機会が増加し、今後、複数のプライベートクラウド間、あるいはプライベートクラウドとパブリッククラウド間に跨って、分散アプリケーションが実行される機会が増加することが見込まれる。   In recent years, opportunities to execute distributed applications in cloud computing environments have increased, and in the future, opportunities to execute distributed applications between multiple private clouds or between private clouds and public clouds will increase. Is expected.

このような大規模なシステムにおいて、分散アプリケーションに係る障害が発生した場合、分散アプリケーションに包含される全てのアプリケーションに関する状態情報を収集する際に、人手による作業が伴うことは、作業効率の観点から現実的ではない。したがって、システムが分散アプリケーションに包含される全てのアプリケーションに関する状態情報を、効率的に漏れなく収集できるようにすることが課題である。上述した特許文献1に開示された技術は、この課題を解決することはできない。   In such a large-scale system, when a failure related to a distributed application occurs, manual operation is required when collecting status information about all applications included in the distributed application from the viewpoint of work efficiency. Not realistic. Therefore, it is a problem to enable the system to efficiently collect state information regarding all applications included in the distributed application. The technique disclosed in Patent Document 1 described above cannot solve this problem.

本願発明の主たる目的は、この課題を解決した、障害情報収集装置、障害情報取集方法、及び、障害情報収集プログラムを提供することである。   The main object of the present invention is to provide a failure information collection device, a failure information collection method, and a failure information collection program that solve this problem.

本願発明に係る障害情報収集装置は、連携して動作する複数の情報処理について、前記情報処理を識別する第1の識別子を関連付けて記憶する連携情報記憶手段と、前記第1の識別子と、前記情報処理に関する実行状態を示す状態情報を格納している場所を識別する第2の識別子とを関連付けて記憶する格納場所情報記憶手段と、前記複数の情報処理のうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、前記連携情報記憶手段及び前記格納場所情報記憶手段を参照することにより、前記障害情報処理を識別する前記第1の識別子を基に、前記複数の情報処理のうち、当該障害情報処理と連携する情報処理である連携情報処理に関する前記状態情報を格納している場所を特定して、特定された場所から、前記連携情報処理を識別する前記第1の識別子に関連付けされている前記状態情報を入手する入手手段と、を備えることを特徴とする。   The failure information collection device according to the present invention relates to a plurality of information processing operating in cooperation with each other and stores a first identifier for identifying the information processing in association with each other, the first identifier, A storage location information storage unit that stores a second identifier that identifies a location storing state information indicating an execution state related to information processing; and at least one of the plurality of information processings. Based on the first identifier for identifying the fault information processing by referring to the linkage information storage means and the storage location information storage means when a fault that causes a fault to occur is generated. In addition, the location where the state information related to the cooperative information processing that is the information processing that cooperates with the fault information processing is specified and specified. From where, characterized in that it comprises, and acquisition means for obtaining the status information that is associated with the first identifier for identifying the cooperative processing.

上記目的を達成する他の見地において、本願発明の障害情報収集方法は、情報処理装置によって、連携して動作する複数の情報処理について、前記情報処理を識別する第1の識別子を関連付けて連携情報記憶域に記憶し、前記第1の識別子と、前記情報処理に関する実行状態を示す状態情報を格納している場所を識別する第2の識別子とを関連付けて格納場所情報記憶域に記憶し、前記複数の情報処理のうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、前記連携情報記憶域及び前記格納場所情報記憶域を参照することにより、前記障害情報処理を識別する前記第1の識別子を基に、前記複数の情報処理のうち、当該障害情報処理と連携する情報処理である連携情報処理に関する前記状態情報を格納している場所を特定して、特定された場所から、前記連携情報処理を識別する前記第1の識別子に関連付けされている前記状態情報を入手することを特徴とする。   In another aspect of achieving the above object, the failure information collection method of the present invention relates to a plurality of information processings that operate in cooperation with an information processing device by associating a first identifier for identifying the information processing with associated information. Storing the first identifier and the second identifier for identifying the location storing the state information indicating the execution state related to the information processing in the storage location information storage area in association with each other, By referring to the cooperation information storage area and the storage location information storage area when a failure that causes failure information processing that is at least one of information processing among a plurality of information processing occurs, Based on the first identifier for identifying the failure information processing, the status information related to cooperative information processing that is information processing linked to the failure information processing among the plurality of information processing. To identify the location that stores, from the identified location, characterized in that to obtain the status information that is associated with the first identifier for identifying the cooperative processing.

また、上記目的を達成する更なる見地において、本願発明に係る障害情報収集プログラムは、連携して動作する複数の情報処理について、前記情報処理を識別する第1の識別子を関連付けて連携情報記憶域に記憶する連携情報記憶処理と、前記第1の識別子と、前記情報処理に関する実行状態を示す状態情報を格納している場所を識別する第2の識別子とを関連付けて格納場所情報記憶域に記憶する格納場所情報記憶処理と、前記複数の情報処理のうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、前記連携情報記憶域及び前記格納場所情報記憶域を参照することにより、前記障害情報処理を識別する前記第1の識別子を基に、前記複数の情報処理のうち、当該障害情報処理と連携する情報処理である連携情報処理に関する前記状態情報を格納している場所を特定して、特定された場所から、前記連携情報処理を識別する前記第1の識別子により関連付けされている前記状態情報を入手する入手処理と、をコンピュータに実行させることを特徴とする。   Further, in a further aspect of achieving the above object, the failure information collection program according to the present invention relates to a plurality of information processing operating in cooperation with each other by associating a first identifier for identifying the information processing with a cooperative information storage area. The association information storage process stored in the storage area, the first identifier, and the second identifier for identifying the location storing the state information indicating the execution state related to the information processing are associated and stored in the storage location information storage area Storage location information storage processing to be performed, and the failure information processing, which is at least one of the plurality of information processing, when the failure that causes the failure occurs, the linkage information storage area and the storage location Based on the first identifier for identifying the failure information processing by referring to the information storage area, information that cooperates with the failure information processing among the plurality of information processing A location where the status information related to the cooperative information processing is stored is identified, and the status information associated with the first identifier for identifying the collaborative information processing is obtained from the identified location The acquisition process is executed by a computer.

更に、本発明は、係る情報読取プログラム(コンピュータプログラム)が格納された、コンピュータ読み取り可能な、不揮発性の記憶媒体によっても実現可能である。   Furthermore, the present invention can be realized by a computer-readable non-volatile storage medium in which such an information reading program (computer program) is stored.

本願発明は、複数の情報処理が連携して動作するシステムにおいて障害が発生した際に、障害発生元である情報処理と連携する全ての情報処理に係る状態情報を、効率的に着実に収集することを可能とする。   In the present invention, when a failure occurs in a system in which a plurality of information processings operate in cooperation, state information relating to all information processing linked with the information processing that is the source of the failure is efficiently and steadily collected. Make it possible.

本願発明の第1の実施形態に係る障害情報収集システムの構成を示すブロック図である。It is a block diagram which shows the structure of the failure information collection system which concerns on 1st Embodiment of this invention. 本願発明の第1の実施形態に係る障害情報収集システムが障害情報を取集する動作を示すフローチャートである。It is a flowchart which shows the operation | movement which the failure information collection system which concerns on 1st Embodiment of this invention collects failure information. 本願発明の第1の実施形態に係る障害情報収集システムが連携情報及び格納場所情報を登録する動作を示すフローチャートである。It is a flowchart which shows the operation | movement in which the failure information collection system which concerns on 1st Embodiment of this invention registers cooperation information and storage location information. 本願発明の第1の実施形態に係る第1のアプリケーション連携例を示す図である。It is a figure which shows the 1st application cooperation example which concerns on 1st Embodiment of this invention. 本願発明の第1の実施形態に係る第2のアプリケーション連携例を示す図である。It is a figure which shows the 2nd application cooperation example which concerns on 1st Embodiment of this invention. 本願発明の第1の実施形態に係る連携情報の構成例を示す図である。It is a figure which shows the structural example of the cooperation information which concerns on 1st Embodiment of this invention. 本願発明の第1の実施形態に係る格納場所情報の構成例を示す図である。It is a figure which shows the structural example of the storage location information which concerns on 1st Embodiment of this invention. 本願発明の第2の実施形態に係る障害情報収集装置の構成を示すブロック図である。It is a block diagram which shows the structure of the failure information collection apparatus which concerns on 2nd Embodiment of this invention. 本願発明の各実施形態の障害情報収集装置を実行可能な情報処理装置の構成を示すブロック図である。It is a block diagram which shows the structure of the information processing apparatus which can execute the failure information collection apparatus of each embodiment of this invention.

以下、本願発明の実施の形態について図面を参照して詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

<第1の実施形態>
図1は第1の実施形態の障害情報収集システム1の構成を概念的に示すブロック図である。本実施形態の障害情報収集システム1は、障害情報収集装置10、及び、n(nは1以上の整数)個の情報処理装置20−1乃至nを有している。これらの装置は、通信ネットワーク40(以下、単に「ネットワーク」と称する)により通信可能に接続されている。
<First Embodiment>
FIG. 1 is a block diagram conceptually showing the structure of a failure information collection system 1 of the first embodiment. The failure information collection system 1 of the present embodiment includes a failure information collection device 10 and n (n is an integer of 1 or more) information processing devices 20-1 to 20-n. These apparatuses are communicably connected via a communication network 40 (hereinafter simply referred to as “network”).

情報処理装置20−1乃至nは、それぞれ、アプリケーション200−1乃至nを実行している。アプリケーション200−1乃至nは、ネットワークを介して情報を交換することにより、互いに連携して動作する。アプリケーション200−1乃至nは、それぞれ所定のタイミングで、状態情報201−1乃至nを出力する。状態情報201−1乃至nは、それぞれ、アプリケーション200−1乃至nに係る実行状態を示す情報であり、例えば、アプリケーション200−1乃至nが使用する変数の情報等を含んだログ情報である。状態情報201−1乃至nは、情報処理装置20−1乃至nが備える状態情報採取機能により出力されてもよい。   The information processing apparatuses 20-1 to 20-n execute applications 200-1 to 200-n, respectively. The applications 200-1 to 200-n operate in cooperation with each other by exchanging information via the network. The applications 200-1 to 200-n output the state information 201-1 to n at predetermined timings, respectively. The status information 201-1 to n is information indicating the execution status related to the applications 200-1 to 200-n, for example, log information including information on variables used by the applications 200-1 to 200-n. The state information 201-1 to n may be output by a state information collection function included in the information processing devices 20-1 to 20-n.

情報処理装置20−1乃至nは、出力された状態情報201−乃至nを格納している。本実施形態では、情報処理装置20−1乃至nは、説明における便宜上、それぞれ、1つのアプリケーションを実行しているが、複数のアプリケーションを実行してもよい。   The information processing apparatuses 20-1 to 20-n store the output state information 201- to n. In the present embodiment, each of the information processing apparatuses 20-1 to 20-n executes one application for convenience of explanation, but may execute a plurality of applications.

障害情報収集装置10は、連携情報記憶部11、格納場所情報記憶部12、入手部13、状態情報記憶部14、及び、配置部15を備えている。   The failure information collection device 10 includes a cooperation information storage unit 11, a storage location information storage unit 12, an acquisition unit 13, a state information storage unit 14, and an arrangement unit 15.

入手部13、及び、配置部15は、電子回路の場合もあれば、コンピュータプログラムとそのコンピュータプログラムに従って動作するプロセッサによって実現される場合もある。連携情報記憶部11、格納場所情報記憶部12、及び、状態情報記憶部14は、電子回路、あるいは、コンピュータプログラムとそのコンピュータプログラムに従って動作するプロセッサによりアクセス制御される、磁気ディスクや電子メモリ等の記憶デバイスである。     The obtaining unit 13 and the arranging unit 15 may be an electronic circuit, or may be realized by a computer program and a processor that operates according to the computer program. The linkage information storage unit 11, the storage location information storage unit 12, and the state information storage unit 14 are an electronic circuit, or a computer program and a processor that operates according to the computer program. It is a storage device.

連携情報記憶部11は、連携情報110を記憶している。連携情報110の構成例を図6に示す。図6(a)は、アプリケーション200−1乃至200−nが図4に示す通りに連携する場合における連携情報110の構成例である。図6(b)は、アプリケーション200−1乃至200−nが図5に示す通りに連携する場合における連携情報110の構成例である。   The cooperation information storage unit 11 stores cooperation information 110. A configuration example of the cooperation information 110 is shown in FIG. FIG. 6A is a configuration example of the cooperation information 110 when the applications 200-1 to 200-n cooperate as shown in FIG. FIG. 6B is a configuration example of the cooperation information 110 when the applications 200-1 to 200-n cooperate as shown in FIG.

図4に示す第1のアプリケーション連携例においては、情報処理装置が特定の機能を提供する際に中心となるアプリケーションであるメインアプリケーションとして、アプリケーション200−1及び200−2が動作する。アプリケーション200−3及び200−4は、アプリケーション200−1と連携して動作する連携アプリケーションである。アプリケーション200−4、200−5、及び、200−6は、アプリケーション200−2と連携して動作する連携アプリケーションである。尚、アプリケーション200−4は、アプリケーション200−1及び200−2の両方と連携して動作する。   In the first application cooperation example illustrated in FIG. 4, the applications 200-1 and 200-2 operate as main applications that are applications that are central when the information processing apparatus provides a specific function. The applications 200-3 and 200-4 are cooperative applications that operate in cooperation with the application 200-1. The applications 200-4, 200-5, and 200-6 are cooperative applications that operate in cooperation with the application 200-2. The application 200-4 operates in cooperation with both the applications 200-1 and 200-2.

図6(a)に示す通り、連携情報110は、メインアプリケーション毎に、メインアプリケーションを識別する識別子と、そのメインアプリケーションと連携する連携アプリケーションを識別する識別子とを関連付けたレコードを包含している。第1のアプリケーション連携例においては、連携情報110は、アプリケーション200−1を、アプリケーション200−3及び200−4に関連付けたレコードを包含している。連携情報110は、アプリケーション200−2を、アプリケーション200−4、200−5、及び、200−6に関連付けたレコードを包含している。尚、図6(a)に示す例では、連携情報110は、メインアプリケーションと連携アプリケーションを区別した構成をとっているが、メインアプリケーションと連携アプリケーションを区別しない構成をとってもよい。   As shown in FIG. 6A, the cooperation information 110 includes a record in which an identifier for identifying the main application and an identifier for identifying the cooperation application that cooperates with the main application are associated with each main application. In the first application cooperation example, the cooperation information 110 includes a record in which the application 200-1 is associated with the applications 200-3 and 200-4. The linkage information 110 includes a record in which the application 200-2 is associated with the applications 200-4, 200-5, and 200-6. In the example shown in FIG. 6A, the linkage information 110 has a configuration in which the main application and the linkage application are distinguished from each other, but may have a configuration in which the main application and the linkage application are not distinguished.

図5に示す第2のアプリケーション連携例においては、メインアプリケーションとして、アプリケーション200−1が動作する。アプリケーション200−2及び200−3は、アプリケーション200−1と連携して動作する連携アプリケーションである。また、アプリケーション200−4は、アプリケーション200−3と連携して動作する連携アプリケーションである。アプリケーション200−4は、アプリケーション200−1と間接的に連携して動作する。   In the second application cooperation example illustrated in FIG. 5, the application 200-1 operates as the main application. The applications 200-2 and 200-3 are cooperative applications that operate in cooperation with the application 200-1. The application 200-4 is a cooperative application that operates in cooperation with the application 200-3. The application 200-4 operates indirectly in cooperation with the application 200-1.

図6(b)に示す通り、第2のアプリケーション連携例においては、連携情報110は、アプリケーション200−1を、アプリケーション200−2、200−3、及び、200−4に関連付けたレコードを包含している。   As shown in FIG. 6B, in the second application cooperation example, the cooperation information 110 includes a record in which the application 200-1 is associated with the applications 200-2, 200-3, and 200-4. ing.

格納場所情報記憶部12は、格納場所情報120を記憶している。格納場所情報120の構成例を図7に示す。格納場所情報120は、アプリケーション200−1乃至nを識別する識別子と、そのアプリケーションに係る状態情報を格納する情報処理装置20−1乃至nを識別する識別子とを関連付けたレコードを包含している。図7に示す例の場合、格納場所情報120は、アプリケーション200−1乃至nに係る状態情報が、それぞれ、情報処理装置20−1乃至nにおいて格納されていることを示している。   The storage location information storage unit 12 stores storage location information 120. A configuration example of the storage location information 120 is shown in FIG. The storage location information 120 includes a record that associates an identifier that identifies the applications 200-1 to 200-n with an identifier that identifies the information processing apparatuses 20-1 to 20-n that store state information related to the applications. In the case of the example illustrated in FIG. 7, the storage location information 120 indicates that the state information related to the applications 200-1 to 200-n is stored in the information processing apparatuses 20-1 to 20-n, respectively.

状態情報記憶部14は、アプリケーション200−1乃至nに係る状態情報201−1乃至nを、それぞれ、状態情報140−1乃至nとして、まとめて格納している。   The state information storage unit 14 collectively stores state information 201-1 to n related to the applications 200-1 to 200-n as state information 140-1 to n, respectively.

入手部13は、情報処理装置20−1乃至nにおけるいずれかの情報処理装置20−i(iは1乃至nにおけるいずれかの整数)から、実行していたアプリケーション200−iにおいて障害が発生したことを受信した場合、連携情報記憶部11における連携情報110を参照する。入手部13は、連携情報110において、アプリケーション200−iを識別する識別子を含むレコードを検索し、その検索によってヒットしたレコードに包含されるアプリケーション200−j(jは1乃至nにおけるiを除く1個以上の整数)を識別する識別子を抽出する。   The acquisition unit 13 has a fault in the application 200-i that has been executed from any one of the information processing devices 20-i (i is any integer in 1 to n) in the information processing devices 20-1 to 20-n. Is received, the cooperation information 110 in the cooperation information storage unit 11 is referred to. The obtaining unit 13 searches the linkage information 110 for a record including an identifier for identifying the application 200-i, and includes the application 200-j (j is 1 to 1 except for i in 1 to n) included in the record hit by the search. An identifier for identifying (an integer greater than or equal to) is extracted.

例えば、図4に示す第1のアプリケーション連携例において、アプリケーション200−3に係る障害が発生した場合、入手部13は、連携情報110から、アプリケーション200−jとして、アプリケーション200−1及び200−4を抽出する。また、第1のアプリケーション連携例において、アプリケーション200−4に係る障害が発生した場合、入手部13は、連携情報110から、アプリケーション200−jとして、アプリケーション200−1、200−2、200−3、200−5、及び、200−6を抽出する。また、第2のアプリケーション連携例において、アプリケーション200−1に係る障害が発生した場合、入手部13は、連携情報110から、アプリケーション200−jとして、アプリケーション200−2、200−3、及び、200−4を抽出する。   For example, in the first application cooperation example illustrated in FIG. 4, when a failure relating to the application 200-3 occurs, the acquisition unit 13 determines the applications 200-1 and 200-4 as the application 200-j from the cooperation information 110. To extract. Further, in the first application cooperation example, when a failure relating to the application 200-4 occurs, the obtaining unit 13 obtains the application 200-1, 200-2, 200-3 as the application 200-j from the cooperation information 110. , 200-5 and 200-6 are extracted. Further, in the second application cooperation example, when a failure relating to the application 200-1 occurs, the obtaining unit 13 obtains the applications 200-2, 200-3, and 200 as the application 200-j from the cooperation information 110. -4 is extracted.

入手部13は、格納場所情報記憶部12における格納場所情報120を参照することにより、抽出したアプリケーション200−jを識別する識別子により特定される、アプリケーション200−jに係る状態情報を格納する情報処理装置20−jを特定する。入手部13は、情報処理装置20−i及びjから、状態情報201−i及びjを入手して、それぞれ、状態情報記憶部14に、状態情報140−i及びjとして、まとめて格納する。   The obtaining unit 13 refers to the storage location information 120 in the storage location information storage unit 12, and stores information about the status of the application 200-j that is specified by the identifier that identifies the extracted application 200-j. The device 20-j is specified. The obtaining unit 13 obtains the state information 201-i and j from the information processing devices 20-i and j, and stores them in the state information storage unit 14 as state information 140-i and j, respectively.

配置部15は、連携アプリケーションが包含するアプリケーション本体150−1乃至nを外部から受信する。アプリケーション本体150−1乃至nは、ソースファイル、あるいは、オブジェクトファイル等のファイルである。配置部15は、連携アプリケーションが包含するアプリケーション本体150−1乃至nを、所定の基準に従い、それぞれ情報処理装置20−1乃至nのいずれかに割り当てて、アプリケーション200−1乃至nとして、情報処理装置20−1乃至nへ送信する。配置部15は、上述した所定の基準として、システム管理者により割り当てが指定された情報を使用する場合もあれば、情報処理装置20−1乃至nに係る負荷状態から決定される基準を使用する場合などがある。配置部15は、アプリケーション200−1乃至nを識別する識別子と、アプリケーション200−1乃至nが割り当てられた、情報処理装置20−1乃至nを識別する識別子とを関連付けて、格納場所情報120として、格納場所情報記憶部12へ入力する。   The arrangement unit 15 receives the application bodies 150-1 to 150-n included in the cooperative application from the outside. The application main bodies 150-1 to 150-n are files such as source files or object files. The arrangement unit 15 assigns the application main bodies 150-1 to 150-n included in the cooperative application to any one of the information processing apparatuses 20-1 to 20-n according to a predetermined standard, and performs information processing as the applications 200-1 to 200-n. Transmit to devices 20-1 through n. The placement unit 15 may use the information specified by the system administrator as the predetermined reference described above, or use the reference determined from the load state related to the information processing apparatuses 20-1 to 20-n. There are cases. The placement unit 15 associates an identifier for identifying the applications 200-1 to 200-n with an identifier for identifying the information processing apparatuses 20-1 to 20-n to which the applications 200-1 to 200-n are assigned, and stores the information as the storage location information 120. , Input to the storage location information storage unit 12.

配置部15は、アプリケーション200−1乃至nを識別する識別子を互いに関連付けて、連携情報110として、連携情報記憶部11へ入力する。   The arrangement unit 15 associates identifiers for identifying the applications 200-1 to 200-n with each other, and inputs the identifiers as the cooperation information 110 to the cooperation information storage unit 11.

次に図2のフローチャートを参照して、本実施形態に係る障害情報収集システム1が、障害情報を収集する動作(処理)について詳細に説明する。   Next, with reference to the flowchart of FIG. 2, an operation (processing) in which the failure information collection system 1 according to the present embodiment collects failure information will be described in detail.

入手部13は、情報処理装置20−i(iは1乃至nにおける整数)から、実行していたアプリケーション200−iにおいて障害が発生したことを受信する(ステップS101)。入手部13は、連携情報記憶部11における連携情報110を参照し、アプリケーション200−iを識別する識別子を含むレコードが包含するアプリケーション200−j(jは1乃至nにおけるiを除く1個以上の整数)を識別する識別子を抽出する(ステップS102)。   The obtaining unit 13 receives from the information processing apparatus 20-i (i is an integer from 1 to n) that a failure has occurred in the application 200-i being executed (step S101). The obtaining unit 13 refers to the collaboration information 110 in the collaboration information storage unit 11 and includes the application 200-j (j is one or more except for i in 1 to n) included in the record including the identifier for identifying the application 200-i. An identifier for identifying (integer) is extracted (step S102).

入手部13は、格納場所情報記憶部12における格納場所情報120を参照し、アプリケーション200−jを識別する識別子により特定される、アプリケーション200−jに関する状態情報201−jを格納する情報処理装置20−jを特定する(ステップS103)。入手部13は、情報処理装置20−i及びjから、状態情報201−i及びjを入手して、状態情報記憶部に、状態情報140−i及びjとして格納し(ステップS104)、全体の処理は終了する。   The obtaining unit 13 refers to the storage location information 120 in the storage location information storage unit 12, and stores the status information 201-j related to the application 200-j, which is specified by an identifier for identifying the application 200-j. -J is specified (step S103). The obtaining unit 13 obtains the state information 201-i and j from the information processing devices 20-i and j, and stores them in the state information storage unit as the state information 140-i and j (step S104). The process ends.

次に図3のフローチャートを参照して、本実施形態に係る障害情報収集システム1が、障害情報110及び格納場所情報120を登録する動作(処理)について詳細に説明する。   Next, an operation (process) in which the failure information collection system 1 according to the present embodiment registers the failure information 110 and the storage location information 120 will be described in detail with reference to the flowchart of FIG.

配置部15は、入力された連携アプリケーションが包含するアプリケーション本体150−1乃至nを、所定の基準に従い、それぞれ情報処理装置20−1乃至nのいずれかに割り当てて、アプリケーション200−1乃至nとして、情報処理装置20−1乃至nへ送信する(ステップS201)。配置部15は、アプリケーション200−1乃至nを識別する識別子と、アプリケーション200−1乃至nが割り当てられた、情報処理装置20−1乃至nを識別する識別子とを関連付けて、格納場所情報120として、格納場所情報記憶部12へ入力する(ステップS202)。配置部15は、アプリケーション200−1乃至nを識別する識別子を互いに関連付けて、連携情報110として、連携情報記憶部11へ入力し(ステップS203)、全体の処理は終了する。   The arrangement unit 15 assigns the application main bodies 150-1 to 150-n included in the input cooperative application to any one of the information processing apparatuses 20-1 to 20-n according to a predetermined standard, and sets them as the applications 200-1 to 200-n. The information is transmitted to the information processing apparatuses 20-1 to 20-n (step S201). The placement unit 15 associates an identifier for identifying the applications 200-1 to 200-n with an identifier for identifying the information processing apparatuses 20-1 to 20-n to which the applications 200-1 to 200-n are assigned, and stores the information as the storage location information 120. The information is input to the storage location information storage unit 12 (step S202). The arrangement unit 15 associates identifiers for identifying the applications 200-1 to 200-n with each other, and inputs them as cooperation information 110 to the cooperation information storage unit 11 (step S203), and the entire process ends.

本実施形態に係る障害情報収集装置10は、複数のアプリケーションが連携して動作するシステムにおいて障害が発生した際に、障害発生元であるアプリケーションと連携する全てのアプリケーションに係る状態情報を、効率的に着実に収集することができる。その理由は、入手部13が、障害発生元であるアプリケーションと連携する全てのアプリケーション、及び、そのアプリケーションに関する状態情報を格納している情報処理装置を、連携情報110及び格納場所情報120を基に特定し、特定された情報処理装置から、障害発生元であるアプリケーションと連携するアプリケーションに係る状態情報を入手するからである。   When a failure occurs in a system in which a plurality of applications operate in cooperation with each other, the failure information collection device 10 according to the present embodiment efficiently stores state information related to all the applications that cooperate with the application that is the failure occurrence source. Can be collected steadily. The reason is that the obtaining unit 13 selects all the applications that cooperate with the application that is the source of the failure, and the information processing device that stores the status information related to the applications, based on the cooperation information 110 and the storage location information 120. This is because the status information relating to the application that cooperates with the application that is the source of the failure is obtained from the specified information processing apparatus.

複数のアプリケーションが連携して動作するシステムにおいて、いずれかのアプリケーションに係る障害が発生した場合、障害が発生した原因が、必ずしも当該アプリケーションに存在するとは限らないため、当該アプリケーションに係る状態情報のみを採取しても十分な障害解析を行うことはできない。したがって、このような場合、障害解析を十分に行うためには、当該アプリケーションと連携する全てのアプリケーションに係る状態情報を収集する必要がある。   In a system in which multiple applications operate in cooperation, when a failure related to one of the applications occurs, the cause of the failure does not necessarily exist in the application, so only the status information related to the application is displayed. Even if collected, sufficient failure analysis cannot be performed. Therefore, in such a case, in order to sufficiently perform failure analysis, it is necessary to collect state information relating to all the applications that cooperate with the application.

昨今のクラウドコンピューティング環境を構築する大規模なコンピュータシステムにおいては、膨大な数のアプリケーションが連携して動作し、それらのアプリケーションを実行して状態情報を格納する情報処理装置も、膨大な数になる。したがって、システム管理者が、アプリケーションに係る仕様書などを基に、障害発生元であるアプリケーションと連携するアプリケーションに係る状態情報を手作業により収集することは、作業効率の観点から現実的ではない。   In a large-scale computer system that constructs a recent cloud computing environment, an enormous number of information processing apparatuses that operate in cooperation with each other and store state information by executing these applications are also enormous. Become. Therefore, it is not realistic from the viewpoint of work efficiency that the system administrator manually collects the state information related to the application that cooperates with the application that has caused the failure based on the specification related to the application.

本実施形態に係る障害情報収集装置10は、どのアプリケーション同士が連携して動作するかについて、連携情報記憶部11に連携情報110として記憶している。障害情報収集装置10は、それぞれのアプリケーションに係る状態情報がどの情報処理装置に格納されているかについて、格納場所情報記憶部12に格納場所情報120として記憶している。
そして、入手部13は、障害発生元であるアプリケーションを識別する識別子を基に、連携情報110と格納場所情報120を参照することにより、障害発生元であるアプリケーションと連携する全てのアプリケーションについて、状態情報を格納している情報処理装置を特定できる。したがって、障害情報管理装置10は、当該アプリケーションと連携する全てのアプリケーションに係る状態情報を収集することができる。
The failure information collection apparatus 10 according to the present embodiment stores as cooperation information 110 in the cooperation information storage unit 11 which applications operate in cooperation with each other. The failure information collection device 10 stores the storage location information 120 in the storage location information storage unit 12 as to which information processing device stores the state information related to each application.
Then, the obtaining unit 13 refers to the linkage information 110 and the storage location information 120 based on the identifier for identifying the application that is the failure occurrence source. An information processing apparatus that stores information can be specified. Therefore, the failure information management apparatus 10 can collect state information related to all applications that cooperate with the application.

また、配置部15は、連携アプリケーションとして、複数のアプリケーションを実行する際に、これらのアプリケーションに係る状態情報を格納する情報処理装置を、格納場所情報120として登録する。配置部15は、これらのアプリケーションが連携していることを、連携情報110として登録する。したがって、システム管理者が、連携情報110及び格納場所情報120を手作業により登録する必要がないため、障害情報管理装置10は、システム管理者に対して負担をかけることなく、上述した機能を提供することができる。また、システム管理装置がシステム管理を行うシステムにおいても同様に、障害情報管理装置10は、システム管理装置に対して負担をかけずに、上述した機能を提供することができる。   Further, when executing a plurality of applications as linked applications, the arrangement unit 15 registers an information processing apparatus that stores state information related to these applications as storage location information 120. The placement unit 15 registers that these applications are linked as linkage information 110. Therefore, since the system administrator does not need to manually register the linkage information 110 and the storage location information 120, the failure information management apparatus 10 provides the above-described functions without placing a burden on the system administrator. can do. Similarly, in the system where the system management apparatus performs system management, the failure information management apparatus 10 can provide the above-described functions without placing a burden on the system management apparatus.

尚、本実施形態では、アプリケーションを実行する装置と、当該アプリケーションに係る状態情報を格納する装置は、同じ情報処理装置としているが、アプリケーションを実行する装置と、当該アプリケーションに係る状態情報を格納する装置は、異なる装置であってもよい。例えば、複数の情報処理装置に係る障害情報を管理する障害管理装置が、これらの情報処理装置で実行されているアプリケーションに係る状態情報を採取して格納してもよい。その場合、格納場所情報120における状態情報格納場所は、アプリケーションが実行される情報処理装置を識別する識別子ではなく、上述した障害管理装置を識別する識別子となる。   In this embodiment, the device that executes the application and the device that stores the state information related to the application are the same information processing device, but stores the device that executes the application and the state information related to the application. The device may be a different device. For example, a failure management device that manages failure information related to a plurality of information processing devices may collect and store state information related to applications executed by these information processing devices. In this case, the status information storage location in the storage location information 120 is not an identifier for identifying the information processing device on which the application is executed, but an identifier for identifying the above-described failure management device.

<第2の実施形態>
図8は第2の実施形態の障害情報収集装置30の構成を概念的に示すブロック図である。
<Second Embodiment>
FIG. 8 is a block diagram conceptually showing the structure of the failure information collecting apparatus 30 of the second embodiment.

本実施形態の障害情報収集装置30は、連携情報記憶部11、格納場所情報記憶部12、及び、入手部13を備えている。   The failure information collection device 30 of this embodiment includes a cooperation information storage unit 11, a storage location information storage unit 12, and an acquisition unit 13.

連携情報記憶部11は、連携して動作する複数の情報処理202−1乃至nについて、情報処理202−1乃至nを識別する第1の識別子を関連付けて記憶する。   The cooperation information storage unit 11 stores a plurality of information processes 202-1 to 20-n that operate in cooperation in association with a first identifier that identifies the information processes 202-1 to 202-n.

格納情報記憶部12は、第1の識別子と、情報処理202−1乃至nに関する実行状態を示す状態情報201−1乃至nを格納している場所を識別する第2の識別子とを関連付けて記憶する。   The storage information storage unit 12 stores the first identifier and the second identifier for identifying the location where the state information 201-1 to n indicating the execution state regarding the information processing 202-1 to 20-n is stored. To do.

入手部13は、情報処理202−1乃至nのうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、連携情報記憶部11及び格納場所情報記憶部12を参照することにより、障害情報処理を識別する第1の識別子を基に、情報処理202−1乃至nのうち、当該障害情報処理と連携する情報処理である連携情報処理に関する状態情報を格納している場所を特定する。入手部13は、特定された場所から、連携情報処理を識別する第1の識別子に関連付けされている状態情報を入手する。   The acquisition unit 13 stores the linkage information storage unit 11 and the storage location information storage when a failure occurs in which failure information processing, which is at least one of the information processings 202-1 to 202-n, is a failure occurrence source. By referring to the unit 12, based on the first identifier for identifying the failure information processing, status information related to the cooperative information processing that is the information processing that cooperates with the fault information processing among the information processing 202-1 to 20-n. Identify the storage location. The obtaining unit 13 obtains state information associated with the first identifier for identifying the cooperative information processing from the specified location.

本実施形態に係る障害情報収集装置10は、複数の情報処理が連携して動作するシステムにおいて障害が発生した際に、障害発生元である情報処理と連携する全ての情報処理に係る状態情報を、効率的に着実に収集することができる。その理由は、入手部13が、障害発生元である情報処理と連携する全ての情報処理、及び、その情報処理に関する状態情報を格納している場所を、連携情報記憶部11及び格納場所情報記憶部12を参照することにより特定し、特定された場所から、障害発生元である情報処理と連携する情報処理に係る状態情報を入手するからである。   When a failure occurs in a system in which a plurality of information processings operate in cooperation with each other, the failure information collection device 10 according to the present embodiment displays status information related to all information processings that cooperate with the information processing that is the failure occurrence source. Can be collected efficiently and steadily. The reason is that the acquisition unit 13 stores all the information processing linked with the information processing that is the failure occurrence source, and the location where the state information related to the information processing is stored, the cooperative information storage unit 11 and the storage location information storage. This is because the status information related to the information processing linked with the information processing that is the fault occurrence source is obtained from the specified location by referring to the unit 12.

尚、情報処理202−1乃至nは、第1の実施形態のように、アプリケーションである場合もあれば、ドライバーソフトやファームウェア等のシステム制御を行うソフトウェアである場合もある。   The information processing 202-1 to 202-n may be an application as in the first embodiment, or may be software that performs system control such as driver software and firmware.

<ハードウェア構成例>
上述した各実施形態において図1、及び、図8に示した各部は、ソフトウェアプログラムの機能(処理)単位(ソフトウェアモジュール)と捉えることができる。但し、これらの図面に示した各部の区分けは、説明の便宜上の構成であり、実装に際しては、様々な構成が想定され得る。この場合のハードウェア環境の一例を、図9を参照して説明する。
<Hardware configuration example>
In each of the above-described embodiments, each unit illustrated in FIGS. 1 and 8 can be regarded as a function (processing) unit (software module) of a software program. However, the division of each part shown in these drawings is a configuration for convenience of explanation, and various configurations can be assumed for mounting. An example of the hardware environment in this case will be described with reference to FIG.

図9は、本発明の模範的な実施形態に係る障害情報収集装置を実行可能な情報処理装置900(コンピュータ)の構成を例示的に説明する図である。即ち、図9は、図1、及び、図8に示した障害情報収集装置を実現可能なコンピュータ(情報処理装置)の構成であって、上述した実施形態における各機能を実現可能なハードウェア環境を表す。   FIG. 9 is a diagram exemplarily illustrating a configuration of an information processing apparatus 900 (computer) that can execute the failure information collection apparatus according to the exemplary embodiment of the present invention. That is, FIG. 9 shows a configuration of a computer (information processing apparatus) that can realize the failure information collection apparatus shown in FIGS. 1 and 8, and a hardware environment that can realize each function in the above-described embodiment. Represents.

図9に示した情報処理装置900は、CPU901(Central_Processing_Unit)、ROM902(Read_Only_Memory)、RAM903(Random_Access_Memory)、ハードディスク904(記憶装置)、外部装置との通信インタフェース905(Interface:以降、「I/F」と称する)、CD−ROM(Compact_Disc_Read_Only_Memory)等の記憶媒体907に格納されたデータを読み書き可能なリーダライタ908、及び、入出力インタフェース909を備え、これらの構成がバス906(通信線)を介して接続された一般的なコンピュータである。   The information processing apparatus 900 illustrated in FIG. 9 includes a CPU 901 (Central_Processing_Unit), a ROM 902 (Read_Only_Memory), a RAM 903 (Random_Access_Memory), a hard disk 904 (storage device), and a communication interface 905 (Interface: “I / F” hereinafter). A reader / writer 908 capable of reading and writing data stored in a storage medium 907 such as a CD-ROM (Compact_Disc_Read_Only_Memory), and an input / output interface 909. These components are connected via a bus 906 (communication line). It is a general computer connected.

そして、上述した実施形態を例に説明した本発明は、図9に示した情報処理装置900に対して、その実施形態の説明において参照したブロック構成図(図1、及び、図8)或いはフローチャート(図2乃至3)の機能を実現可能なコンピュータプログラムを供給した後、そのコンピュータプログラムを、当該ハードウェアのCPU901に読み出して解釈し実行することによって達成される。また、当該装置内に供給されたコンピュータプログラムは、読み書き可能な揮発性の記憶メモリ(RAM903)またはハードディスク904等の不揮発性の記憶デバイスに格納すれば良い。   The present invention described using the above-described embodiment as an example is a block configuration diagram (FIGS. 1 and 8) or a flowchart referred to in the description of the information processing apparatus 900 shown in FIG. This is achieved by supplying a computer program capable of realizing the functions (FIGS. 2 to 3), reading the computer program to the CPU 901 of the hardware, and interpreting and executing the computer program. The computer program supplied to the apparatus may be stored in a readable / writable volatile storage memory (RAM 903) or a nonvolatile storage device such as the hard disk 904.

また、前記の場合において、当該ハードウェア内へのコンピュータプログラムの供給方法は、CD−ROM等の各種記憶媒体907を介して当該装置内にインストールする方法や、インターネット等の通信回線を介して外部よりダウンロードする方法等のように、現在では一般的な手順を採用することができる。そして、このような場合において、本発明は、係るコンピュータプログラムを構成するコード或いは、そのコードが格納された記憶媒体907によって構成されると捉えることができる。   In the above-described case, the computer program can be supplied to the hardware by a method of installing in the apparatus via various storage media 907 such as a CD-ROM, or an external method via a communication line such as the Internet. A general procedure can be adopted at present, such as a method of downloading more. In such a case, it can be understood that the present invention is configured by a code constituting the computer program or a storage medium 907 in which the code is stored.

以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。   The present invention has been described above using the above-described embodiment as an exemplary example. However, the present invention is not limited to the above-described embodiment. That is, the present invention can apply various modes that can be understood by those skilled in the art within the scope of the present invention.

1 障害情報収集システム
10 障害情報収集装置
11 連携情報記憶部
110 連携情報
12 格納場所情報記憶部
120 格納場所情報
13 入手部
14 状態情報記憶部
140−1乃至n 状態情報
15 配置部
150−1乃至n アプリケーション本体
20−1乃至n 情報処理装置
200−1乃至n アプリケーション
201−1乃至n 状態情報
30 障害情報収集装置
40 通信ネットワーク
900 情報処理装置
901 CPU
902 ROM
903 RAM
904 ハードディスク
905 通信インタフェース
906 バス
907 記憶媒体
908 リーダライタ
909 入出力インタフェース
DESCRIPTION OF SYMBOLS 1 Failure information collection system 10 Failure information collection apparatus 11 Cooperation information storage part 110 Cooperation information 12 Storage location information storage part 120 Storage location information 13 Acquisition part 14 State information storage part 140-1 thru | or n State information 15 Arrangement part 150-1 thru | or n Application main body 20-1 to n Information processing device 200-1 to n Application 201-1 to n Status information 30 Fault information collection device 40 Communication network 900 Information processing device 901 CPU
902 ROM
903 RAM
904 Hard disk 905 Communication interface 906 Bus 907 Storage medium 908 Reader / writer 909 Input / output interface

Claims (10)

連携して動作する複数の情報処理について、前記情報処理を識別する第1の識別子を関連付けて記憶する連携情報記憶手段と、
前記第1の識別子と、前記情報処理に関する実行状態を示す状態情報を格納している場所を識別する第2の識別子とを関連付けて記憶する格納場所情報記憶手段と、
前記複数の情報処理のうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、前記連携情報記憶手段及び前記格納場所情報記憶手段を参照することにより、前記障害情報処理を識別する前記第1の識別子を基に、前記複数の情報処理のうち、当該障害情報処理と連携する情報処理である連携情報処理に関する前記状態情報を格納している場所を特定して、特定された場所から、前記連携情報処理を識別する前記第1の識別子に関連付けされている前記状態情報を入手する入手手段と、
を備える障害情報収集装置。
For a plurality of information processing operating in cooperation with each other, cooperative information storage means for storing a first identifier for identifying the information processing in association with each other;
A storage location information storage unit that associates and stores the first identifier and a second identifier that identifies a location storing state information indicating an execution state related to the information processing;
By referring to the linkage information storage unit and the storage location information storage unit when a failure occurs in which failure information processing, which is at least one of the plurality of information processings, is a failure occurrence source, Based on the first identifier for identifying the failure information processing, the location storing the state information related to cooperative information processing that is information processing that cooperates with the fault information processing among the plurality of information processing is stored. Specifying and obtaining from the identified location the status information associated with the first identifier identifying the linked information processing;
A failure information collecting apparatus comprising:
前記状態情報を格納する場所を、所定の基準に従って決定し、前記第1の識別子、及び、前記第2の識別子を関連付けて、前記格納場所情報記憶手段に入力する配置手段
をさらに備える、請求項1に記載の障害情報収集装置。
The apparatus further comprises an arrangement unit that determines a location for storing the state information according to a predetermined criterion, and associates the first identifier and the second identifier and inputs the first identifier and the second identifier to the storage location information storage unit. The failure information collection device according to 1.
前記配置手段は、連携して動作する複数の前記情報処理に関する前記状態情報を格納する場所を決定する際に、前記第1の識別子を互いに関連付けて、前記連携情報記憶手段に入力する、
請求項1または2に記載の障害情報収集装置。
The arrangement means associates the first identifiers with each other and inputs the information to the cooperation information storage means when determining a location for storing the state information regarding the plurality of information processing operating in cooperation with each other.
The fault information collection device according to claim 1 or 2.
前記入手手段が入手した前記状態情報を記憶する状態情報記憶手段
をさらに備える、請求項1乃至3のいずれかに記載の障害情報収集装置。
The fault information collection device according to any one of claims 1 to 3, further comprising state information storage means for storing the state information obtained by the obtaining means.
情報処理装置によって、
連携して動作する複数の情報処理について、前記情報処理を識別する第1の識別子を関連付けて連携情報記憶域に記憶し、
前記第1の識別子と、前記情報処理に関する実行状態を示す状態情報を格納している場所を識別する第2の識別子とを関連付けて格納場所情報記憶域に記憶し、
前記複数の情報処理のうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、前記連携情報記憶域及び前記格納場所情報記憶域を参照することにより、前記障害情報処理を識別する前記第1の識別子を基に、前記複数の情報処理のうち、当該障害情報処理と連携する情報処理である連携情報処理に関する前記状態情報を格納している場所を特定して、特定された場所から、前記連携情報処理を識別する前記第1の識別子に関連付けされている前記状態情報を入手する、
障害情報収集方法。
Depending on the information processing device,
For a plurality of information processing operating in cooperation, a first identifier for identifying the information processing is associated and stored in the cooperation information storage area,
Storing the first identifier in a storage location information storage area in association with a second identifier for identifying a location storing state information indicating an execution state related to the information processing;
By referring to the linkage information storage area and the storage location information storage area when a failure occurs in which the failure information processing, which is at least one of the plurality of information processings, is a failure occurrence source Based on the first identifier for identifying the failure information processing, the location storing the state information related to cooperative information processing that is information processing that cooperates with the fault information processing among the plurality of information processing is stored. Identifying and obtaining from the identified location the state information associated with the first identifier identifying the linked information process;
Fault information collection method.
情報処理装置によって、
前記状態情報を格納する場所を、所定の基準に従って決定し、前記第1の識別子、及び、前記第2の識別子を関連付けて、前記格納場所情報記憶域に入力する
請求項5に記載の障害情報収集方法。
Depending on the information processing device,
The failure information according to claim 5, wherein a location for storing the state information is determined according to a predetermined criterion, and the first identifier and the second identifier are associated and input to the storage location information storage area. Collection method.
情報処理装置によって、
連携して動作する複数の前記情報処理に関する前記状態情報を格納する場所を決定する際に、前記第1の識別子を互いに関連付けて、前記連携情報記憶域に入力する
請求項5または6に記載の障害情報収集方法。
Depending on the information processing device,
The said 1st identifier is mutually linked | related and input into the said cooperation information storage area, when determining the place which stores the said status information regarding the said several information processing which operate | moves in cooperation, The said cooperation information storage area is input. Fault information collection method.
連携して動作する複数の情報処理について、前記情報処理を識別する第1の識別子を関連付けて連携情報記憶域に記憶する連携情報記憶処理と、
前記第1の識別子と、前記情報処理に関する実行状態を示す状態情報を格納している場所を識別する第2の識別子とを関連付けて格納場所情報記憶域に記憶する格納場所情報記憶処理と、
前記複数の情報処理のうち、少なくともいずれかの情報処理である障害情報処理が障害の発生元となる障害が発生した際に、前記連携情報記憶域及び前記格納場所情報記憶域を参照することにより、前記障害情報処理を識別する前記第1の識別子を基に、前記複数の情報処理のうち、当該障害情報処理と連携する情報処理である連携情報処理に関する前記状態情報を格納している場所を特定して、特定された場所から、前記連携情報処理を識別する前記第1の識別子により関連付けされている前記状態情報を入手する入手処理と、
をコンピュータに実行させる障害情報収集プログラム。
For a plurality of information processing operating in cooperation with each other, a cooperative information storage process that associates a first identifier for identifying the information processing and stores it in a cooperative information storage area;
A storage location information storage process for associating the first identifier with a second identifier for identifying a location storing state information indicating an execution state related to the information processing in a storage location information storage area;
By referring to the linkage information storage area and the storage location information storage area when a failure occurs in which the failure information processing, which is at least one of the plurality of information processings, is a failure occurrence source Based on the first identifier for identifying the failure information processing, the location storing the state information related to cooperative information processing that is information processing that cooperates with the fault information processing among the plurality of information processing is stored. Specifying and obtaining the status information associated with the first identifier that identifies the cooperative information processing from the identified location;
Information collection program that causes a computer to execute
前記状態情報を格納する場所を、所定の基準に従って決定し、前記第1の識別子、及び、前記第2の識別子を関連付けて、前記格納場所情報記憶域に入力する配置処理
をコンピュータに実行させる請求項8に記載の障害情報収集プログラム。
A location for storing the state information is determined according to a predetermined standard, and the computer executes an arrangement process in which the first identifier and the second identifier are associated and input to the storage location information storage area. Item 10. A failure information collection program according to item 8.
連携して動作する複数の前記情報処理に関する前記状態情報を格納する場所を決定する際に、前記第1の識別子を互いに関連付けて、前記連携情報記憶域に入力する前記配置処理
をコンピュータに実行させる請求項8または9に記載の障害情報収集プログラム。
When determining a location for storing the state information related to a plurality of the information processing operating in cooperation, the computer executes the arrangement process of associating the first identifiers with each other and inputting the information to the cooperation information storage area The failure information collection program according to claim 8 or 9.
JP2013189931A 2013-09-13 2013-09-13 Failure information collection device, failure information collection method, and failure information collection program Pending JP2015056082A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013189931A JP2015056082A (en) 2013-09-13 2013-09-13 Failure information collection device, failure information collection method, and failure information collection program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013189931A JP2015056082A (en) 2013-09-13 2013-09-13 Failure information collection device, failure information collection method, and failure information collection program

Publications (1)

Publication Number Publication Date
JP2015056082A true JP2015056082A (en) 2015-03-23

Family

ID=52820428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013189931A Pending JP2015056082A (en) 2013-09-13 2013-09-13 Failure information collection device, failure information collection method, and failure information collection program

Country Status (1)

Country Link
JP (1) JP2015056082A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019175169A (en) * 2018-03-28 2019-10-10 株式会社リコー Trouble management system, trouble management device, trouble management method and program

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07183891A (en) * 1993-12-24 1995-07-21 Mitsubishi Electric Corp Computer system
JP2001175460A (en) * 1999-12-15 2001-06-29 Hitachi Ltd Program distribution management system
JP2007108929A (en) * 2005-10-12 2007-04-26 Nec Corp Log management system, log management manager, log management method, and program
WO2010046972A1 (en) * 2008-10-21 2010-04-29 富士通株式会社 Change impact research support program, change impact research support device, and change impact research support method
JP2011128678A (en) * 2009-12-15 2011-06-30 Hitachi Ltd Device, method and program for monitoring operation
JP2011197785A (en) * 2010-03-17 2011-10-06 Nomura Research Institute Ltd System and program for collecting log

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07183891A (en) * 1993-12-24 1995-07-21 Mitsubishi Electric Corp Computer system
JP2001175460A (en) * 1999-12-15 2001-06-29 Hitachi Ltd Program distribution management system
JP2007108929A (en) * 2005-10-12 2007-04-26 Nec Corp Log management system, log management manager, log management method, and program
WO2010046972A1 (en) * 2008-10-21 2010-04-29 富士通株式会社 Change impact research support program, change impact research support device, and change impact research support method
JP2011128678A (en) * 2009-12-15 2011-06-30 Hitachi Ltd Device, method and program for monitoring operation
JP2011197785A (en) * 2010-03-17 2011-10-06 Nomura Research Institute Ltd System and program for collecting log

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019175169A (en) * 2018-03-28 2019-10-10 株式会社リコー Trouble management system, trouble management device, trouble management method and program
JP7069956B2 (en) 2018-03-28 2022-05-18 株式会社リコー Fault management system, fault management device and program

Similar Documents

Publication Publication Date Title
US11550829B2 (en) Systems and methods for load balancing in a system providing dynamic indexer discovery
CN110865867B (en) Method, device and system for discovering application topological relation
EP2738679A1 (en) Computer program and management computer
US10944655B2 (en) Data verification based upgrades in time series system
JPWO2013046287A1 (en) Management computer and method for analyzing root cause
CN109672722B (en) Data deployment method and device, computer storage medium and electronic equipment
CN103973470A (en) Cluster management method and equipment for shared-nothing cluster
WO2013061213A1 (en) Passive monitoring of virtual systems using extensible indexing
JP2022033685A (en) Method, apparatus, electronic device, computer readable storage medium and computer program for determining robustness
JP5268589B2 (en) Information processing apparatus and information processing apparatus operating method
US9021078B2 (en) Management method and management system
JP5740338B2 (en) Virtual environment operation support system
JP5642725B2 (en) Performance analysis apparatus, performance analysis method, and performance analysis program
JP6364727B2 (en) Information processing system, distributed processing method, and program
JP2015056082A (en) Failure information collection device, failure information collection method, and failure information collection program
JP2013228970A (en) Version-up management method in task system
JP6065843B2 (en) Service level management apparatus, program, and method
WO2015019488A1 (en) Management system and method for analyzing event by management system
US11374815B2 (en) Network configuration diagram generate method and recording medium
JP2018067241A (en) Operation log generation device, operation log generation system, operation log generation method, and operation log generation program
US20180365280A1 (en) Log management apparatus and log management method
JP2014109975A (en) Performance analysis device, performance analysis method and performance analysis program
JP2020135701A (en) Information processing system, information processing device, and information processing program
JP2014178912A (en) Server movement planning support method
US10158603B2 (en) Efficient storage of network discovery ranges

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160816

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171212

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180619