JP2007122434A - Redundant resource management device, program, and redundant resource management method - Google Patents

Redundant resource management device, program, and redundant resource management method Download PDF

Info

Publication number
JP2007122434A
JP2007122434A JP2005314123A JP2005314123A JP2007122434A JP 2007122434 A JP2007122434 A JP 2007122434A JP 2005314123 A JP2005314123 A JP 2005314123A JP 2005314123 A JP2005314123 A JP 2005314123A JP 2007122434 A JP2007122434 A JP 2007122434A
Authority
JP
Japan
Prior art keywords
redundant
individual information
management
management table
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005314123A
Other languages
Japanese (ja)
Inventor
Yasubumi Ogawa
泰文 小川
Masahiko Noguchi
昌彦 野口
Yoshitaka Hirano
美貴 平野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005314123A priority Critical patent/JP2007122434A/en
Publication of JP2007122434A publication Critical patent/JP2007122434A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a redundant resource management device capable of raising memory usage efficiency and dispensing with the previous design of a physical memory amount. <P>SOLUTION: When the updating of a process individual information management table 40 is detected, a resource information collection/arrangement determining function part 30 determines the propriety of the redundant process of the process where individual information is updated, based on the process individual information acquired from the process individual information management table 40. When the redundant process is unnecessary as the result of the determination and also the applicable redundant process exists, an indication to delete the redundant process is outputted. When the redundant process is necessary as the result of the determination, the applicable redundant process does not exist, and also the physical memory can be allocated, an indication to generate the redundant process is outputted. A redundant resource managing means 201 generates/deletes the redundant process in response to the indication to be outputted from the resource information collection/arrangement determining function part 30. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、高可用化のために1つ以上のプロセスが冗長化されたコンピュータシステムにおいて、冗長リソースのために割り当て可能なリソースの量を監視し、運用中のプロセス生成、消去および情報更新などのイベントに応じて、冗長リソースを最適かつ動的に割り当てるための、冗長リソース管理装置、プログラムおよび冗長リソース管理方法に関する。   The present invention monitors the amount of resources that can be allocated for redundant resources in a computer system in which one or more processes are made redundant for high availability, and generates, deletes, and updates information during operation. The present invention relates to a redundant resource management device, a program, and a redundant resource management method for optimally and dynamically allocating redundant resources according to the event.

一般的に高信頼システムではsingle point of failureを回避するために運用系サーバおよび待機系サーバからなる冗長化構成がとられている(特許文献1)。またサーバ単位のクラスタリングによる冗長化だけでなく、サーバ上で稼動するそれぞれのプロセスの運用系と待機系を用意するといった、リソースの冗長化によってもシステムの可用性向上が図られている(非特許文献1)。   In general, a highly reliable system has a redundant configuration including an active server and a standby server in order to avoid a single point of failure (Patent Document 1). In addition to redundancy by clustering on a server basis, system availability is also improved by resource redundancy, such as preparing an operational system and standby system for each process running on a server (Non-patent Documents). 1).

冗長化構成をとるにあたっては、運用系プロセスに必要なメモリに加えて待機系プロセスのメモリも確保しなければならないため、あらかじめ十分なメモリ量を用意しておく必要があり、またメモリ利用効率も悪い。もし十分な量のメモリを用意せず運用中に使用メモリ量が物理メモリ量を超えた場合、スワッピングが発生するために処理速度が大きく低下する。一般的に高信頼システムではリアルタイムな処理を要求される場合が多く、スワッピングの発生は極力避けるべきである。よってシステムの設計者は、スワッピングが発生しないようあらかじめシステム全体で使用するメモリ量を計算しておき、それが物理メモリ量を超えないように設計する必要がある。またシステム運用中に新たなソフトウェアのインストールやアップデートを行う場合も物理メモリ量を超えないようにしなければならない。
特許公開2001−243209 “Service Availability Forum Application Interface Specification Volume 2:Availability Management Framework”、SAI-AIS-AMF-B.01.01、p.17−28、[online]、The Service AvailabilityTM Forum、[2005年10月13日検索]、インターネット<URL:http://www.saforum.org/home>
In making a redundant configuration, it is necessary to secure the memory of the standby process in addition to the memory required for the active process, so it is necessary to prepare a sufficient amount of memory in advance and the memory utilization efficiency bad. If a sufficient amount of memory is not prepared and the amount of used memory exceeds the amount of physical memory during operation, swapping occurs and the processing speed is greatly reduced. In general, a highly reliable system often requires real-time processing, and occurrence of swapping should be avoided as much as possible. Therefore, the system designer needs to calculate the amount of memory used in the entire system in advance so that swapping does not occur, and design so that it does not exceed the amount of physical memory. Also, when installing or updating new software during system operation, the physical memory must not be exceeded.
Patent Publication 2001-243209 “Service Availability Forum Application Interface Specification Volume 2: Availability Management Framework”, SAI-AIS-AMF-B.01.01, p. 17-28, [online], The Service AvailabilityTM Forum, [October 13, 2005 search], Internet <URL: http://www.saforum.org/home>

しかしながら、実際の運用においては常時全てのプロセスが冗長化されている必要はなく、高信頼システムであっても、例えば優先度の低いプロセスや寿命の短いプロセスなどは障害等が発生しても運用系プロセスを単に再起動すれば運用上ほとんど問題にはならない。すなわち冗長化の必要性が低いプロセスまで待機系を用意し、その分までメモリを確保しておくことは、メモリの使用効率が悪くなるという問題がある。また、システムが巨大になると、全てのプロセスのメモリ使用量を把握し、スワッピングが発生しないように物理メモリの搭載量を設計することは、非常に手間がかかり、さらに運用中のインストールやアップデートまで考慮することは事前の設計では対応できないという問題がある。   However, in actual operation, it is not always necessary to make all processes redundant. Even in the case of a highly reliable system, for example, a low priority process or a short-lived process can be operated even if a failure occurs. If you simply restart the process, there will be little problem in operation. In other words, preparing a standby system for processes with low necessity for redundancy and securing memory to that extent has a problem that the use efficiency of the memory deteriorates. In addition, when the system becomes huge, it is very time-consuming to grasp the memory usage of all processes and design the physical memory loading so that swapping does not occur, and even installation and update during operation There is a problem that it is not possible to take into account the prior design.

本発明は、このような事情に鑑みてなされたもので、その目的は、システムの信頼性を維持しながら、運用状況に応じて選択的にプロセスを冗長化することで、メモリ利用効率を向上し、事前の物理メモリ量の設計が不要な冗長リソース管理装置、プログラムおよび冗長リソース管理方法を提供することにある。   The present invention has been made in view of such circumstances, and its purpose is to improve memory utilization efficiency by selectively making the process redundant according to the operation status while maintaining the reliability of the system. It is another object of the present invention to provide a redundant resource management device, a program, and a redundant resource management method that do not require prior physical memory design.

この発明は上述した課題を解決するためになされたもので、請求項1に記載の発明は、業務サービスを実行する複数のプロセスと、前記プロセスを監視して得た前記各プロセスの個別情報を出力する管理プロセスと、前記各プロセスの前記個別情報を格納する個別情報管理テーブルと、前記管理プロセスから前記個別情報を受けて、前記個別情報管理テーブルに登録する個別情報管理手段と、前記プロセスの待機系である冗長プロセスとを備えるコンピュータシステムに設けられた冗長リソース管理装置において、前記個別情報管理テーブルの更新を検出し、前記個別情報が更新されたプロセスの冗長プロセスの要否を、前記個別情報管理テーブルから取得した該プロセスの個別情報に基づき判断し、前記判断の結果、前記冗長プロセスが不要であり、かつ、該当する冗長プロセスが存在するときは、該冗長プロセスの消去の指示を出力し、前記判断の結果、前記冗長プロセスが必要であり、かつ、該当する冗長プロセスが存在せず、かつ、物理メモリを割り当て可能なときは、該冗長プロセスの生成の指示を出力する配置判断手段と、前記配置判断手段の出力する指示に従い、前記冗長プロセスの生成・消去を行なう冗長リソース管理手段とを備えることを特徴とする冗長リソース管理装置である。   The present invention has been made to solve the above-described problems, and the invention according to claim 1 includes a plurality of processes for executing business services and individual information of the respective processes obtained by monitoring the processes. A management process to output, an individual information management table for storing the individual information of each process, an individual information management means for receiving the individual information from the management process and registering it in the individual information management table, In a redundant resource management apparatus provided in a computer system including a redundant process that is a standby system, the update of the individual information management table is detected, and the necessity of the redundant process of the process in which the individual information is updated is determined as the individual process. Judgment is made based on the individual information of the process acquired from the information management table. And when the corresponding redundant process exists, an instruction to erase the redundant process is output, and as a result of the determination, the redundant process is necessary, and the corresponding redundant process does not exist, In addition, when physical memory can be allocated, an arrangement determining unit that outputs an instruction to generate the redundant process, and a redundant resource management unit that generates and erases the redundant process according to the instruction output from the arrangement determining unit; A redundant resource management apparatus comprising:

また、請求項2に記載の発明は、請求項1に記載の冗長リソース管理装置であって、前記個別情報は、該個別情報が対応するプロセスの管理用識別情報、あるいは、該個別情報が対応するプロセスの履歴情報、あるいは、該個別情報が対応するプロセスの状態情報を含むことを特徴とする。   The invention according to claim 2 is the redundant resource management apparatus according to claim 1, wherein the individual information corresponds to management identification information of a process corresponding to the individual information or the individual information. The process history information or the status information of the corresponding process is included in the individual information.

また、請求項3に記載の発明は、請求項2に記載の冗長リソース管理装置であって、前記管理用識別情報は、前記管理プロセスの識別情報、あるいは、前記プロセスの識別情報、あるいは、前記プロセスのアドレスを含み、前記履歴情報は、前記プロセスの起動に要する時間であるプロセス起動時間、あるいは、前記プロセスが起動されてから経過した時間であるプロセス寿命を含み、前記状態情報は、前記プロセスのプロセス状態、あるいは、前記プロセスの冗長プロセス割り当ての優先順位である優先度を含むことを特徴とする。   The invention according to claim 3 is the redundant resource management apparatus according to claim 2, wherein the management identification information includes identification information of the management process, identification information of the process, or The history information includes a process start time that is a time required for starting the process, or a process life that is a time that has elapsed since the process is started, and the state information includes the process information Or a priority which is a priority of redundant process allocation of the process.

また、請求項4に記載の発明は、請求項1から請求項3のいずれかの項に記載の冗長リソース管理装置であって、前記配置判断手段は、さらに、前記個別情報管理テーブルを参照して、プロセス状態が異常の前記プロセスを検出すると、該プロセスの処理引継ぎ指示を出力し、前記配置判断手段の処理引継ぎ指示を受けて、前記冗長プロセスの運転を開始させる個別情報管理手段に、前記プロセスの待機系である冗長プロセスの運転開始を指示する管理プロセス監視手段を備えることを特徴とする。   The invention according to claim 4 is the redundant resource management apparatus according to any one of claims 1 to 3, wherein the arrangement determining means further refers to the individual information management table. When the process having an abnormal process state is detected, the process takeover instruction of the process is output, and the individual information management means for starting the operation of the redundant process in response to the process takeover instruction of the arrangement determining means Management process monitoring means for instructing the start of operation of a redundant process, which is a standby system for the process, is provided.

また、請求項5に記載の発明は、業務サービスを実行する複数のプロセスと、前記プロセスを監視して、前記各プロセスの個別情報を生成する管理プロセスと、前記各プロセスの前記個別情報を格納する個別情報管理テーブルと、前記管理プロセスから前記個別情報を受けて、前記個別情報管理テーブルに登録する個別情報管理手段と、前記プロセスの待機系である冗長プロセスとを備えるコンピュータシステムに設けられた冗長リソース管理装置において、前記個別情報管理テーブルの更新を検出する第1の過程と、前記第1の過程にて更新が検出されると、前記個別情報が更新されたプロセスの冗長プロセスの要否を、前記個別情報管理テーブルから取得した該プロセスの個別情報に基づき判断する第2の過程と、前記第2の過程の結果、前記冗長プロセスが不要であり、かつ、該当する冗長プロセスが存在するときは、該冗長プロセスの消去の指示を出力し、前記第2の過程の結果、前記冗長プロセスが必要であり、かつ、該当する冗長プロセスが存在せず、かつ、物理メモリを割り当て可能なときは、該冗長プロセスの生成の指示を出力する第3の過程と、前記第3の過程にて出力した指示に従い、前記冗長プロセスの生成・消去を行なう第4の過程とを備えることを特徴とする冗長リソース管理方法である。   The invention according to claim 5 stores a plurality of processes that execute business services, a management process that monitors the processes and generates individual information of the processes, and the individual information of the processes. Provided in a computer system comprising: an individual information management table, an individual information management means for receiving the individual information from the management process and registering the individual information in the individual information management table; and a redundant process which is a standby system for the process In the redundant resource management device, a first process for detecting an update of the individual information management table, and if an update is detected in the first process, whether or not a redundant process is required for the process in which the individual information is updated Is determined based on the individual information of the process acquired from the individual information management table, and the result of the second process When the redundant process is unnecessary and there is a corresponding redundant process, an instruction to erase the redundant process is output. As a result of the second process, the redundant process is required and When the redundant process does not exist and physical memory can be allocated, the redundant process is generated according to the third process of outputting an instruction to generate the redundant process and the instruction output in the third process. A redundant resource management method comprising: a fourth step of generating / deleting.

また、請求項6に記載の発明は、請求項5に記載の冗長リソース管理方法であって、前記個別情報管理テーブルを参照して、プロセス状態が異常の前記プロセスを検出すると、該プロセスの処理引継ぎ指示を出力する第5の過程と、前記第5の過程の処理引継ぎ指示を受けて、前記プロセスの待機系である冗長プロセスの運転開始指示を出力する第6の過程とを備えることを特徴とする。   The invention according to claim 6 is the redundant resource management method according to claim 5, wherein when the process having an abnormal process state is detected with reference to the individual information management table, the process of the process is detected. A fifth process of outputting a takeover instruction; and a sixth process of outputting an operation start instruction of a redundant process which is a standby system of the process in response to the process takeover instruction of the fifth process. And

また、請求項7に記載の発明は、業務サービスを実行する複数のプロセスと、前記プロセスを監視して、前記各プロセスの個別情報を生成する管理プロセスと、前記各プロセスの前記個別情報を格納する個別情報管理テーブルと、前記管理プロセスから前記個別情報を受けて、前記個別情報管理テーブルに登録する個別情報管理手段と、前記プロセスの待機系である冗長プロセスとを備えるコンピュータシステムを、前記個別情報管理テーブルの更新を検出し、前記個別情報が更新されたプロセスの冗長プロセスの要否を、前記個別情報管理テーブルから取得した該プロセスの個別情報に基づき判断し、前記判断の結果、前記冗長プロセスが不要であり、かつ、該当する冗長プロセスが存在するときは、該冗長プロセスの消去の指示を出力し、前記判断の結果、前記冗長プロセスが必要であり、かつ、該当する冗長プロセスが存在せず、かつ、物理メモリを割り当て可能なときは、該冗長プロセスの生成の指示を出力する配置判断手段と、前記配置判断手段の出力する指示に従い、前記冗長プロセスの生成・消去を行なう冗長リソース管理手段として機能させることを特徴とするプログラムである。   The invention according to claim 7 stores a plurality of processes that execute business services, a management process that monitors the processes and generates individual information of the processes, and the individual information of the processes. A computer system comprising: an individual information management table, an individual information management unit that receives the individual information from the management process and registers the individual information in the individual information management table; and a redundant process that is a standby system of the process. The update of the information management table is detected, and the necessity of the redundant process of the process in which the individual information is updated is determined based on the individual information of the process acquired from the individual information management table. If the process is unnecessary and the corresponding redundant process exists, an instruction to erase the redundant process is output. If the result of the determination is that the redundant process is necessary, the corresponding redundant process does not exist, and physical memory can be allocated, an arrangement determining means for outputting an instruction to generate the redundant process; According to an instruction output from the arrangement determining unit, the program functions as a redundant resource managing unit that generates and deletes the redundant process.

また、請求項8に記載の発明は、請求項7に記載のプログラムであって、前記配置判断手段は、さらに、前記個別情報管理テーブルを参照して、プロセス状態が異常の前記プロセスを検出すると、該プロセスの処理引継ぎ指示を出力し、前記コンピュータシステムを、前記配置判断手段の処理引継ぎ指示を受けて、前記プロセスの待機系である冗長プロセスの運転開始を指示する管理プロセス監視手段としても機能させることを特徴とする。   The invention according to claim 8 is the program according to claim 7, wherein the arrangement determining means further refers to the individual information management table and detects the process having an abnormal process state. , Outputting a process takeover instruction for the process, and the computer system also functions as a management process monitoring means for instructing the start of operation of a redundant process that is a standby system of the process in response to the process takeover instruction of the arrangement determining means It is characterized by making it.

この発明によれば、あるプロセスの冗長プロセスの要否を、個別情報管理テーブルから取得した該プロセスの個別情報に基づき判断するので、システムの信頼性を維持しながらも、運用状況に応じて選択的にプロセスを冗長化し、メモリ利用効率を向上し、事前の物理メモリ量の設計が不要な冗長リソース管理装置の提供が可能である。   According to the present invention, whether or not a redundant process of a certain process is necessary is determined based on the individual information of the process acquired from the individual information management table, so that it can be selected according to the operation status while maintaining the reliability of the system. Therefore, it is possible to provide a redundant resource management apparatus that makes the process redundant, improves the memory utilization efficiency, and does not require a prior physical memory design.

以下、図面を参照して、本発明の実施の形態について説明する。図1は、この発明の一実施形態による冗長リソース管理装置10を備えたコンピュータシステムの構成を示す概略ブロック図である。冗長リソース管理装置10は、冗長リソース管理手段201、管理プロセス監視手段202およびリソース情報収集・配置判断機能部30を備える。冗長リソース管理手段201は、冗長リソース管理テーブル50および冗長リソース情報テーブルに対する読込み・書込みを実行し、またリソース情報収集・配置判断機能部30から冗長リソースの生成を指示された場合に冗長プロセスA1001〜C1003および冗長リソーステーブル110を生成し、冗長リソース管理テーブル50ヘデータを登録する。管理プロセス監視手段202は、プロセス個別情報管理手段70の監視、冗長リソース管理テーブル50および冗長リソース情報テーブル110からの情報取得を行う。またリソース情報収集・配置判断機能部30から受けた冗長リソース情報および処理引継ぎ通知をプロセス個別情報管理手段70へ送信する。リソース情報収集・配置判新機能部30は、プロセス個別情報管理テーブル40からデータの読込み・書込みを行い、取得した情報をもとに冗長リソースを配置するかどうか判断する。また冗長リソース管理テーブル50からデータの読込み・書込みを行い、管理プロセス監視手段202に対して処理引き継ぎ先の冗長リソース情報を伝える。その後プロセス状態406から異常状態を検出した場合、管理プロセス監視手段202へ処理引継ぎ通知を行う。   Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a schematic block diagram showing a configuration of a computer system including a redundant resource management apparatus 10 according to an embodiment of the present invention. The redundant resource management apparatus 10 includes redundant resource management means 201, management process monitoring means 202, and resource information collection / arrangement determination function unit 30. The redundant resource management unit 201 reads / writes data from / to the redundant resource management table 50 and the redundant resource information table, and, when instructed to generate redundant resources from the resource information collection / arrangement determination function unit 30, the redundant process A 1001- C1003 and redundant resource table 110 are generated, and data is registered in redundant resource management table 50. The management process monitoring unit 202 monitors the process individual information management unit 70 and acquires information from the redundant resource management table 50 and the redundant resource information table 110. Also, the redundant resource information received from the resource information collection / placement determination function unit 30 and the process takeover notification are transmitted to the process individual information management means 70. The resource information collection / placement determination function unit 30 reads / writes data from the process individual information management table 40, and determines whether or not to place redundant resources based on the acquired information. Further, data is read / written from the redundant resource management table 50, and the redundant resource information of the process takeover destination is transmitted to the management process monitoring unit 202. Thereafter, when an abnormal state is detected from the process state 406, a process takeover notification is sent to the management process monitoring unit 202.

プロセス個別情報管理テーブル40には、図2のように、プロセス個別情報管理手段70によってプロセスグループ60を管理する管理プロセスID401、プロセス毎のプロセスID402、プロセスのアドレス403、プロセス起動時間404、プロセス寿命405、プロセス状態406および未検査フラグ407、ミスカウント408が登録される。管理プロセスID401は、管理プロセス701に与えられる識別子である。プロセスID402は、プロセスグループ60に含まれるプロセスの1つ1つに与えられる識別子である。プロセスのアドレス403は、プロセスグループ60に含まれるプロセスのアドレス情報であり、管理プロセス701がOSのインターフェースに問い合わせることによりシステムから取得する。プロセス起動時間404はプロセス起動処理の開始から完了までに要する時間であり、冗長リソースを配置するかどうかの判断基準となる。プロセス寿命405はプロセスが一定期間以上生存した場合に加算していく値であり、冗長リソースを配置するかどうかの判断基準となる。プロセス寿命405は、初期値1として1ずつ加算され、プロセスの生存が確認できなかった場合は0にクリアされる。プロセス状態406は、プロセスの状態や優先度を表すために、図3(a)のプロセス状態の一覧表のように規定された識別子であり、図3(b)のように状態遷移し、冗長リソースを配置するかどうかの判断基準となる。   In the process individual information management table 40, as shown in FIG. 2, the management process ID 401 for managing the process group 60 by the process individual information management means 70, the process ID 402 for each process, the process address 403, the process activation time 404, the process life 405, a process state 406, an unchecked flag 407, and a miss count 408 are registered. The management process ID 401 is an identifier given to the management process 701. The process ID 402 is an identifier given to each process included in the process group 60. The process address 403 is address information of a process included in the process group 60, and is acquired from the system by the management process 701 inquiring of the OS interface. The process activation time 404 is the time required from the start to the completion of the process activation process, and is a criterion for determining whether or not to arrange redundant resources. The process life 405 is a value that is added when the process has survived for a certain period of time, and is a criterion for determining whether or not to arrange redundant resources. The process life 405 is incremented by 1 as the initial value 1, and is cleared to 0 when the existence of the process cannot be confirmed. The process state 406 is an identifier defined as shown in the list of process states in FIG. 3A in order to represent the process state and priority, and the state transitions as shown in FIG. This is a criterion for determining whether to allocate resources.

プロセス状態406が00〜04の場合、プロセスに対してまだ冗長リソースが生成されていない。冗長リソース生成の必要性を判断する場合、プロセス状態406が00の場合は無条件に冗長リソースを生成し、それ以外の時は5からプロセス状態の数値を引いた値が評価パラメーターとしてリソース情報収集・配置判断機能部30に用いられる。プロセス状態406が05の場合、当該プロセスグループに対応する冗長リソースグループが割り当てられており、かつプロセスが正常運転していることを表す。プロセス状態406が06の場合、当該プロセスが正常に運転していないことを表す。プロセス状態406が07の場合、プロセス個別情報管理手段70が処理引継ぎを行っている最中であることを表す。プロセス状態406が08の場合、冗長プロセスA1001〜C1003が運転していることを表す。未検査フラグ407は、プロセス状態406の更新など、冗長リソースを配置するかどうかの再判断が必要となるイベントが発生した場合に、まだリソース情報収集・配置判断機能部30の検査を受けていないことを表すフラグであり、1は未検査、0は検査済みである。冗長リソースを配置するかどうかの再判断が必要となるイベントが発生するたびに1へ更新される。ミスカウント408は、プロセス間の処理引継ぎおよび処理復旧において引継ぎミスをした回数を表すための数値であり、初期値0から1ずつ加算される。   If the process state 406 is 00-04, no redundant resource has been generated for the process. When determining the necessity of redundant resource generation, if the process state 406 is 00, the redundant resource is generated unconditionally. Otherwise, the value obtained by subtracting the process state value from 5 is collected as resource information. Used for the arrangement determination function unit 30. When the process state 406 is 05, this indicates that a redundant resource group corresponding to the process group is assigned and the process is operating normally. When the process state 406 is 06, it indicates that the process is not operating normally. When the process state 406 is 07, it represents that the process individual information management means 70 is in the process of taking over processing. When the process state 406 is 08, it indicates that the redundant processes A1001 to C1003 are operating. The unchecked flag 407 has not yet been checked by the resource information collection / placement determination function unit 30 when an event such as update of the process state 406 that requires re-determination whether to place a redundant resource occurs. This flag indicates that 1 is uninspected and 0 is inspected. It is updated to 1 each time an event that requires re-determination of whether or not to place a redundant resource occurs. The miss count 408 is a numerical value for representing the number of times of takeover mistakes in process takeover and process recovery between processes, and is incremented by 1 from the initial value 0.

冗長リソース管理テーブル50には、図4のように優先度501、冗長リソースフラグ502、管理プロセスID503、管理プロセスのアドレス504、冗長リソース情報テーブルアドレス505が登録される。優先度501は、冗長リソースを配置するかどうかの基準となる数値である。リソース情報収集・配置判断機能部30は、冗長リソース管理手段201に対して冗長リソースの生成を通知した後にプロセス状態406が変更される前にその優先度を冗長リソース管理テーブル50の優先度501にコピーする。その後リソース情報収集・配置判断機能部30が冗長リソースの配置の必要性を再判断する場合にはプロセス状態406ではなく優先度501を用いる。なお優先度501が0である時は無条件に冗長リソースが配置される。冗長リソースフラグ502は、プロセスグループ60に対応する冗長リソースグループ90が配置されているかどうかを表すフラグであり、0であれば配置されておらず、1であれば配置されていることを表す。管理プロセスID503は管理プロセス701に与えられる識別子であり、管理プロセス401と同じ値を持つ。管理プロセスのアドレス504は、管理プロセス701のアドレス情報であり、管理プロセス701自身がOSのインターフェースに問い合わせることによりシステムから取得する。冗長リソース情報テーブルアドレス505は、冗長リソースグループ90の冗長リソース情報テーブル110のアドレスであり、冗長リソース管理手段201がOSのインターフェースに問い合わせることによりシステムから取得する。   As shown in FIG. 4, a priority 501, a redundant resource flag 502, a management process ID 503, a management process address 504, and a redundant resource information table address 505 are registered in the redundant resource management table 50. The priority 501 is a numerical value serving as a reference for determining whether or not a redundant resource is arranged. The resource information collection / arrangement determination function unit 30 notifies the redundant resource management unit 201 of the generation of redundant resources and then changes the priority to the priority 501 of the redundant resource management table 50 before the process state 406 is changed. make a copy. Thereafter, when the resource information collection / arrangement determination function unit 30 re-determines the necessity of redundant resource allocation, the priority 501 is used instead of the process state 406. When the priority 501 is 0, redundant resources are unconditionally arranged. The redundant resource flag 502 is a flag indicating whether or not the redundant resource group 90 corresponding to the process group 60 is arranged. If it is 0, it is not arranged, and if it is 1, it is arranged. The management process ID 503 is an identifier given to the management process 701 and has the same value as the management process 401. The management process address 504 is address information of the management process 701, and is acquired from the system by the management process 701 itself inquiring of the OS interface. The redundant resource information table address 505 is an address of the redundant resource information table 110 of the redundant resource group 90, and is acquired from the system by the redundant resource management unit 201 inquiring of the OS interface.

プロセスグループ60は、プロセス個別情報管理手段70がプロセスを管理するための概念であり、1つの管理プロセス701と管理されるプロセスA801〜C803から構成される。管理プロセス701はプロセスグループ60に含まれるプロセスA801〜C803に関するデータの収集及び状態の監視を実行し、それらの情報をプロセス個別情報管理手段70へ送信する。またプロセスに障害が発生した場合にはそれを再起動して再起動完了通知をプロセス個別情報管理手段70へ送信する。どのプロセスがプロセスグループ60に所属するかという情報は管理プロセス701が保持している。プロセスA801〜C803は、業務サービスを実行する運用系のプロセスであり、待機系の冗長プロセスA1001〜C1003へ処理を引き継ぐ際に必要なデータを引き継ぎデータ保管機能120へ逐一書き込み、処理復旧時には反対にデータを読み込む。   The process group 60 is a concept for the process individual information management means 70 to manage processes, and is composed of one management process 701 and managed processes A801 to C803. The management process 701 executes data collection and status monitoring regarding the processes A 801 to C 803 included in the process group 60, and transmits the information to the process individual information management means 70. If a failure occurs in the process, it is restarted and a restart completion notice is transmitted to the process individual information management means 70. Information about which process belongs to the process group 60 is held by the management process 701. Processes A801 to C803 are operational processes that execute business services. Data necessary for taking over the processing to the standby redundant processes A1001 to C1003 is written to the takeover data storage function 120 one by one, and conversely when processing is restored. Read data.

プロセス個別情報管理手段70は、プロセスグループ60に所属するプロセスの情報を管理プロセス701から収集し、その情報をプロセス個別情報管理テーブル40へ書き込む。また管理プロセス監視手段202から処理引継ぎ通知を受けた場合、同時に通知される冗長リソース情報をもとにして処理を冗長プロセスA1001〜C1003へ引継ぐ。その後管理プロセスから再起動完了通知を受け、プロセス状態406を更新する。
90は、冗長リソース管理手段201が冗長プロセスを管理するための概念的な単位である冗長リソースグループであり、1つの冗長リソース情報テーブル110および冗長プロセスA1001〜C1003から構成される。冗長リソース情報テーブル110は、図5のように、管理プロセスID1101、管理プロセスのアドレス1102、冗長プロセスアドレス1103を持つ。管理プロセスID1101は、管理プロセス701の識別子であり、管理プロセスID401と同じ値を持つ。管理プロセスのアドレス1102は、管理プロセス701のアドレスであり、管理プロセスのアドレス504と同じ値を持つ。冗長リソースアドレス1103は、冗長リソースグループ90に所属する冗長プロセスA1001〜C1003のアドレス情報であり、冗長リソース管理手段201がOSのインターフェースに問い合わせることによりシステムから取得する。
The process individual information management means 70 collects information on processes belonging to the process group 60 from the management process 701 and writes the information in the process individual information management table 40. When a process takeover notification is received from the management process monitoring unit 202, the process is taken over to the redundant processes A1001 to C1003 based on the redundant resource information notified at the same time. Thereafter, a restart completion notification is received from the management process, and the process state 406 is updated.
Reference numeral 90 denotes a redundant resource group which is a conceptual unit for the redundant resource management means 201 to manage a redundant process, and includes a redundant resource information table 110 and redundant processes A1001 to C1003. As shown in FIG. 5, the redundant resource information table 110 has a management process ID 1101, a management process address 1102, and a redundant process address 1103. The management process ID 1101 is an identifier of the management process 701 and has the same value as the management process ID 401. The management process address 1102 is the address of the management process 701 and has the same value as the management process address 504. The redundant resource address 1103 is address information of the redundant processes A1001 to C1003 belonging to the redundant resource group 90, and is acquired from the system by the redundant resource management unit 201 inquiring of the OS interface.

冗長プロセスA1001〜C1003は、待機系のプロセスであり、運用系のプロセスA801〜C803が処理中に停止した場合に、引継ぎデータ保管機能120に記録されているデータを参照して、該処理を引き継ぐ。
引継ぎデータ保管機能120は、プロセス間の処理引継ぎに必要となるデータを保管する。
The redundant processes A1001 to C1003 are standby processes, and when the active processes A801 to C803 are stopped during processing, the processes are referred to by referring to the data recorded in the takeover data storage function 120. .
The takeover data storage function 120 stores data necessary for process takeover between processes.

次に、本実施形態の動作を図6〜図11のフローチャートを参照して説明する。まず、コンピュータシステムを起動すると、OSが管理プロセス701を起動する(S100)。管理プロセス701が、管理者によってあらかじめ起動するように設定されているプロセスA801〜C803を起動する。この際管理プロセス701はプロセスID402「1890,1891,1892」、プロセスのアドレス403「1000,1080,1160」、プロセスの起動時間404「32,64,32」を取得・保持しておく(S101)。管理プロセス701がプロセス個別情報管理手段70に対して、ステップS101にて取得・保持しているプロセスのデータを通知する(S102)。プロセス個別情報管理手段70が、プロセス個別情報管理テーブル40へ管理プロセスID401〜ミスカウント408までのデータを全て登録する。ここでは、図2の1行目から3行目までにプロセスA801〜C803を順に登録したとする(S103)。このとき、未検査フラグ407には、登録した全てのプロセスについて、未検査の「1」を登録する。周期的にプロセス個別情報管理テーブル40を検査しているリソース情報収集・配置判断機能部30により、未検査フラグ407が「1」であることが検出される(S104)。ここでは、図2の1行目から3行目までのプロセスA801〜C803の未検査フラグを検出したとする。   Next, the operation of the present embodiment will be described with reference to the flowcharts of FIGS. First, when the computer system is activated, the OS activates the management process 701 (S100). The management process 701 starts processes A801 to C803 that are set in advance by the administrator. At this time, the management process 701 acquires and holds the process ID 402 “1890, 1891, 1892”, the process address 403 “1000, 1080, 1160”, and the process activation time 404 “32, 64, 32” (S101). . The management process 701 notifies the process individual information management means 70 of the process data acquired / held in step S101 (S102). The process individual information management means 70 registers all the data from the management process ID 401 to the miscount 408 in the process individual information management table 40. Here, it is assumed that the processes A801 to C803 are sequentially registered from the first line to the third line in FIG. 2 (S103). At this time, unchecked “1” is registered in the unchecked flag 407 for all the registered processes. The resource information collection / arrangement determination function unit 30 that periodically checks the process individual information management table 40 detects that the unchecked flag 407 is “1” (S104). Here, it is assumed that the uninspected flags of the processes A801 to C803 from the first line to the third line in FIG. 2 are detected.

リソース情報収集・配置判断機能部30が、未検査フラグを検出したプロセスA801〜C803について、プロセス起動時間404「32,64,32」、プロセス寿命405「3,3,3」、プロセス状態406「02,02,02」を、プロセス個別情報管理テーブル40より取得する。プロセスA801〜C803に対しては、冗長リソースが未配置だが、すでに冗長リソースが配置されている場合は、優先度501を、冗長リソース管理テーブル50より取得する(図7のS105)。リソース情報収集・配置判断機能部30が、前ステップS105で取得した情報を用いて、プロセスA801〜C803に対して冗長リソースを配置するかどうかを評価する。この評価を自律的かつ動的に行うための手段として、例えば内部に以下の(1)の評価関数をもち、この関数によりプロセス個別情報管理テーブル40のデータを評価する方法を用いる。
A=ΣC・・・(1)
管理者が設定した閾値をAthとしたときA≧Athであれば冗長リソースを配置するものとする。ただし、Xはそれぞれプロセス起動時間404、プロセス寿命405、優先度501(もしくはプロセス状態406)である。ただし優先度501(もしくはプロセス状態406)が0の時は無条件に冗長リソースを配置するものとする。またCは上記の各データに対して定められた重み定数であり、管理者によって設定される。上記の評価関数は線形であるが、あるデータ(例えばプロセス状態406)の影響を強めたい(もしくは弱めたい)場合はXの代わりにX を用いる。nは、管理者によって設定される値である。
For the processes A801 to C803 in which the resource information collection / placement determination function unit 30 has detected the unchecked flag, the process activation time 404 “32, 64, 32”, the process life 405 “3, 3, 3”, and the process state 406 “ "02, 02, 02" is acquired from the process individual information management table 40. For processes A801 to C803, redundant resources are not allocated, but when redundant resources are already allocated, priority 501 is acquired from the redundant resource management table 50 (S105 in FIG. 7). The resource information collection / arrangement determination function unit 30 evaluates whether or not redundant resources are to be allocated to the processes A801 to C803 using the information acquired in the previous step S105. As a means for performing this evaluation autonomously and dynamically, for example, a method of having the following evaluation function (1) inside and evaluating the data of the process individual information management table 40 using this function is used.
A = ΣC i X i (1)
The administrator set threshold shall place the redundant resource if A ≧ A th when the A th. However, X i is a process activation time 404, a process life 405, and a priority 501 (or process state 406), respectively. However, when priority 501 (or process state 406) is 0, redundant resources are unconditionally allocated. C i is a weighting constant determined for each of the above data, and is set by the administrator. The evaluation function is a linear, certain data (e.g., process state 406) To strengthen the effect of (or want weakening) When uses X i n instead of X i. n is a value set by the administrator.

ここでは、C=2、C=−15、C=−20として、(1)式にプロセスA801の値を代入すると、A=2×32−15×3−20×2=−21。同様に、プロセスB802は、2×64−15×3−20×2=43、プロセスC803は、2×32−15×3−20×2=−21。ここで、閾値Ath=0とすると、プロセスB802のときに閾値を越えているので、評価結果は、プロセスA801〜C803の冗長リソースは配置となる(S106)。次に、冗長リソースは配置となったので、ステップS107では、“YES”へ分岐する。さらに、配置する冗長リソースは新規作成なので、ステップS108でも、“YES”に分岐する(S108)。リソース情報収集・配置判断機能部30がOSのインターフェースに問い合わせることにより、冗長プロセスを生成するのに必要なメモリ量と、システム全体で利用可能なメモリ量および現在使用中の全メモリ量を取得し、これらを比較することにより冗長プロセスの生成が可能かどうかを判断する。ただし不意のメモリ使用量増加によるシステム動作不安定を回避したい場合は、新たに生成する冗長プロセスの分を加えた使用中の全メモリ量がシステム全体で利用可能なメモリ量に対してある程度の割合をもって下回る必要がある。この割合はシステムの要求に応じてそれぞれ管理者が設定することが可能であり、本実施例ではシステム全体で利用可能なメモリ量に対して95%を超えない場合に冗長プロセスが生成可能であると判断するものとする。ここでは、充分なメモリ量があったとして、“YES”に分岐する(S109)。 Here, assuming that C 0 = 2, C 1 = −15, C 2 = −20 and substituting the value of the process A 801 into the equation (1), A = 2 × 32−15 × 3−20 × 2 = −21 . Similarly, the process B802 has 2 × 64-15 × 3-20 × 2 = 43, and the process C803 has 2 × 32-15 × 3-20 × 2 = −21. Here, if the threshold A th = 0, since the threshold is exceeded in the process B 802, the evaluation result is that the redundant resources of the processes A 801 to C 803 are arranged (S106). Next, since the redundant resources are arranged, the process branches to “YES” in step S107. Further, since the redundant resource to be arranged is newly created, the process branches to “YES” in step S108 (S108). The resource information collection / placement determination function unit 30 queries the OS interface to obtain the amount of memory required to create a redundant process, the amount of memory available to the entire system, and the total amount of memory currently in use. By comparing these, it is determined whether or not a redundant process can be generated. However, if you want to avoid system operation instability due to unexpected increase in memory usage, the total amount of memory in use, including the newly created redundant process, is a certain percentage of the amount of memory available to the entire system. It is necessary to fall below. This ratio can be set by the administrator according to the system requirements, and in this embodiment, a redundant process can be generated when the amount of memory available for the entire system does not exceed 95%. It shall be judged. Here, assuming that there is a sufficient amount of memory, the process branches to “YES” (S109).

リソース情報収集・配置判断機能部30が、冗長リソース管理手段201に対して、管理プロセス701の管理プロセスID401とそのアドレス情報、プロセスA801〜C803のアドレス403、プロセス状態406とともに冗長リソース生成通知を送信する(S110)。冗長リソース管理手段201は、生成通知等を受けると、冗長リソース情報テーブル110と冗長プロセスA1001〜C1003を生成する。このときOSのインターフェースに問い合わせることにより、冗長リソース情報テーブル110および冗長プロセスA1001〜C1003のアドレス情報を取得する(S111)。ステップS112で受けた生成通知等に基づき、冗長リソース管理手段201が、冗長リソース管理テーブル50に優先度501〜冗長リソース情報テーブルアドレス505の全ての情報を登録する。ここで冗長リソースフラグ502を1とする(S112)。冗長リソース管理手段201は、リソース情報収集・配置判断機能部30に対して、冗長リソース生成完了通知を出力する(S113)。リソース情報収集・配置判断機能部30は、冗長リソース生成完了通知を受けると、プロセス個別情報管理テーブルの冗長プロセスA801〜C803のプロセス状態406を正常運転中「05」へ更新する(S114)。   The resource information collection / placement determination function unit 30 sends a redundant resource generation notification to the redundant resource management unit 201 together with the management process ID 401 of the management process 701 and its address information, the addresses 403 of the processes A 801 to C 803, and the process state 406. (S110). When receiving the generation notification or the like, the redundant resource management unit 201 generates a redundant resource information table 110 and redundant processes A1001 to C1003. At this time, the redundant resource information table 110 and the address information of the redundant processes A1001 to C1003 are acquired by making an inquiry to the OS interface (S111). Based on the generation notification received in step S112, the redundant resource management unit 201 registers all the information of the priority 501 to the redundant resource information table address 505 in the redundant resource management table 50. Here, the redundant resource flag 502 is set to 1 (S112). The redundant resource management unit 201 outputs a redundant resource generation completion notification to the resource information collection / arrangement determination function unit 30 (S113). Upon receipt of the redundant resource generation completion notification, the resource information collection / arrangement determination function unit 30 updates the process state 406 of the redundant processes A801 to C803 in the process individual information management table to “05” during normal operation (S114).

一方、プロセスA801〜C803を起動し、プロセス個別情報管理手段70への各プロセスの情報を通知した管理プロセス701は、自身が起動したプロセスA801〜C803の監視を行なう(図8のS119)。具体的には、まず、管理プロセス701は、OSのインターフェースを利用してプロセスA801〜C803の生存時間を確認する。プロセスA801〜C803の起動直後は、時間が経過していないので、“NO”に分岐する(S120)。次に、管理プロセス701は、プロセスA801〜C803の状態を確認する。ここでは、正常に動作しているとすると、プロセス状態には変化がないので、“NO”に分岐する(S122)。プロセス寿命405にも、プロセス状態にも、変化がないため、“NO”に分岐し、ステップ119に戻る(S124)。このように、ステップS119からステップS124を繰り返していると、時間が経過してステップS120にて、“YES”に分岐するため、管理プロセス701は、プロセス個別情報管理手段70へ、プロセス寿命405変更を通知する(S121)。プロセス寿命の更新があった場合は、ステップ124で、“YES”に分岐する。プロセス個別情報管理手段70は、管理プロセス701からプロセス寿命の変更の通知を受けると、プロセス個別情報管理テーブル40のプロセス寿命405に反映し、かつ、該当するプロセスの未検査フラグ407を「1」に設定する(S125)。未検査フラグ407が「1」であることを、リソース情報収集・配置判断機能30が検出すると、以降、前述したのと同様に、ステップS104からの冗長リソースの配置判断の処理を行う。   On the other hand, the management process 701 that activates the processes A801 to C803 and notifies the process individual information management means 70 of the information of each process monitors the processes A801 to C803 activated by itself (S119 in FIG. 8). Specifically, first, the management process 701 confirms the lifetime of the processes A801 to C803 using the OS interface. Immediately after the activation of the processes A801 to C803, since time has not elapsed, the process branches to “NO” (S120). Next, the management process 701 checks the states of the processes A801 to C803. Here, assuming normal operation, there is no change in the process state, so the process branches to “NO” (S122). Since neither the process life 405 nor the process state has changed, the process branches to “NO” and returns to Step 119 (S124). As described above, if step S119 to step S124 are repeated, the time elapses and the process branches to “YES” in step S120. Therefore, the management process 701 changes the process life 405 to the process individual information management unit 70. Is notified (S121). If the process life has been updated, the process branches to “YES” in step 124. Upon receipt of the process life change notification from the management process 701, the process individual information management means 70 reflects the process life information 405 of the process individual information management table 40 and sets the uninspected flag 407 of the corresponding process to “1”. (S125). When the resource information collection / arrangement determination function 30 detects that the unchecked flag 407 is “1”, the redundant resource allocation determination processing from step S104 is performed in the same manner as described above.

一定時間が経過して、ステップS120にて“YES”に分岐する前に、例えば、プロセスA801が異常停止してしまった場合、管理プロセス701は、プロセスA801の異常停止を検出し、ステップ122にて、“YES”に分岐する。さらに、管理プロセス701は、プロセス個別情報管理手段70へ、プロセス状態が異常「06」に変化したことを通知する(S123)。ステップS124では、プロセス状態が正常「05」から異常「06」に変化したので、“YES”に分岐する。プロセス個別情報管理手段70は、管理プロセス701から通知を受けているので、プロセス個別情報管理テーブル40のプロセスA801のプロセス状態406を異常「06」に更新するとともに、未検査フラグ407を「1」に更新する(S125)。ステップS126では、プロセスA801のプロセス状態406が異常「06」であるので、“YES”に分岐する。   If, for example, the process A 801 has stopped abnormally before the predetermined time has elapsed and branched to “YES” in step S 120, the management process 701 detects the abnormal stop of the process A 801, and then proceeds to step 122. Branches to “YES”. Furthermore, the management process 701 notifies the process individual information management means 70 that the process state has changed to “06” (S123). In step S124, since the process state has changed from normal “05” to abnormal “06”, the process branches to “YES”. Since the process individual information management means 70 receives the notification from the management process 701, the process individual information management means 70 updates the process state 406 of the process A801 in the process individual information management table 40 to the abnormality “06” and sets the unexamined flag 407 to “1”. (S125). In step S126, since the process state 406 of the process A 801 is abnormal “06”, the process branches to “YES”.

リソース情報収集・配置判断機能部30は、周期的にプロセス個別情報管理テーブル40を監視しており、プロセスA801のプロセス状態406が、異常「06」になったことを検出する(図9のS127)。異常「06」を検出したリソース情報収集・配置判断機能部30は、冗長リソース管理テーブル50から抽出した、プロセスA801の冗長リソースである冗長プロセスA1001の情報と処理引継ぎ通知とを、管理プロセス監視手段202へ、出力する(S128)。   The resource information collection / arrangement determination function unit 30 periodically monitors the process individual information management table 40 and detects that the process state 406 of the process A 801 has become abnormal “06” (S127 in FIG. 9). ). The resource information collection / placement determination function unit 30 that has detected the abnormality “06” uses the management process monitoring means to extract the information of the redundant process A 1001 that is the redundant resource of the process A 801 and the process takeover notification extracted from the redundant resource management table 50. The data is output to 202 (S128).

管理プロセス監視手段202は、これらの通知を受けると、それらをプロセス個別情報管理手段70へ出力する。プロセス個別情報管理手段70は、管理プロセス監視手段202から、冗長プロセスA1001の情報と処理引継ぎ通知とを受ける(図10のS133)と、プロセス個別情報管理テーブル40のプロセスA801と、プロセスA801と同じプロセスグループ60に所属するプロセスB802およびC803のプロセス状態406を処理切替中「07」に更新する(S134)。プロセス個別情報管理手段70は、さらに管理プロセス701に冗長リソース情報を通知する(S135)とともに、プロセスA801〜C803の処理を停止する(S136)。プロセス個別情報管理手段70は、プロセス個別情報管理テーブル40のプロセスA801〜C803のミスカウント408が、ある閾値N(例えば、10)以下であることを確認する。ここでは、初回なので「0」になっているため、“YES”に分岐する(S137)。さらに、プロセス個別情報管理手段70は、通知された冗長リソースである冗長プロセスA1001〜C1003に、運転再開を通知する(S138)。   Upon receiving these notifications, the management process monitoring unit 202 outputs them to the process individual information management unit 70. The process individual information management unit 70 receives the information of the redundant process A 1001 and the process takeover notification from the management process monitoring unit 202 (S133 in FIG. 10), and is the same as the process A 801 in the process individual information management table 40 and the process A 801. The process status 406 of the processes B 802 and C 803 belonging to the process group 60 is updated to “07” during the process switching (S 134). The individual process information management means 70 further notifies the management process 701 of redundant resource information (S135) and stops the processes of the processes A801 to C803 (S136). The process individual information management means 70 confirms that the miscount 408 of the processes A801 to C803 in the process individual information management table 40 is equal to or less than a certain threshold N (for example, 10). Here, since it is “0” since it is the first time, the process branches to “YES” (S137). Furthermore, the process individual information management means 70 notifies the redundant processes A1001 to C1003, which are the notified redundant resources, of the restart of operation (S138).

冗長プロセスA1001〜C1003は、運転再開の通知を受けると、引き継ぎデータ保管機能120からデータを読み込み、該データの処理を開始する(S139)。プロセス個別情報管理手段70は、運転再開を通知した冗長プロセスA1001〜C1003が正常に動作しているか確認する。異常があれば、“NO”に分岐し、ステップS145でプロセス個別情報管理テーブル40のミスカウント408に1加算し、ステップS146で冗長プロセスA1001〜C1003を再起動したのち、ステップS137からの処理を繰り返す。ここでは、正常に動作しており、ステップS140では“YES”に分岐したとする。   Redundant processes A1001 to C1003, when notified of the restart of operation, read data from the takeover data storage function 120 and start processing the data (S139). The process individual information management means 70 confirms whether the redundant processes A1001 to C1003 that have notified the restart of operation are operating normally. If there is an abnormality, the process branches to “NO”, 1 is added to the miscount 408 of the process individual information management table 40 in step S145, the redundant processes A1001 to C1003 are restarted in step S146, and the processing from step S137 is performed. repeat. Here, it is assumed that the operation is normal and the process branches to “YES” in step S140.

プロセス個別情報管理手段70は、プロセス個別情報管理テーブル40のプロセスA801〜C803のプロセス状態406を冗長リソース運転中「08」に更新する(S141)。さらにプロセス個別情報管理手段70は、プロセス個別情報管理テーブル40のプロセスA801〜C803のミスカウント408を全て「0」に設定する(S142)。プロセス個別情報管理手段70は、プロセスA801〜C803のミスカウント408が「0」であることを確認し(S143)、処理引継ぎ成功と判断するので、“YES”に分岐する(図9のS130)。なお、ステップS140で、冗長プロセスA1001〜C1003の正常動作が、閾値Nである10回以上連続で確認できなかった場合は、ステップS145にてミスカウント408が加算され、ステップS137から直接ステップS143に遷るため、ステップS130では“NO”に分岐する。この場合、冗長リソースによる処理引継ぎは放棄し、プロセス個別情報管理手段70が、運用系のプロセスA801〜C803を再起動する(S131)。   The process individual information management means 70 updates the process state 406 of the processes A801 to C803 in the process individual information management table 40 to “08” during redundant resource operation (S141). Further, the process individual information management means 70 sets all the miscounts 408 of the processes A801 to C803 in the process individual information management table 40 to “0” (S142). The process individual information management means 70 confirms that the miscount 408 of the processes A801 to C803 is “0” (S143), and determines that the process has succeeded, so it branches to “YES” (S130 in FIG. 9). . In step S140, if the normal operation of the redundant processes A1001 to C1003 cannot be confirmed continuously for 10 times or more which is the threshold value N, a miscount 408 is added in step S145, and the process directly goes from step S137 to step S143. Therefore, the process branches to “NO” in step S130. In this case, the process takeover by the redundant resource is abandoned, and the process individual information management unit 70 restarts the active processes A801 to C803 (S131).

ここでは、ステップS130にて“YES”に分岐するので、プロセス個別情報管理手段70が、プロセスA801〜C803を再起動し(S146)、これらのプロセスの再起動完了を確認する(S147)。さらに、プロセス個別情報管理手段70は、プロセス個別情報管理テーブル40のプロセスA801〜C803のミスカウント408を参照し、閾値Nである10以下であることを確認する。ここでは、ミスカウント408の値は、「0」なので、このステップS148は、“YES”に分岐する。プロセス個別情報管理手段70は、冗長プロセスA1001〜C1003に運転停止を指示し(S149)、プロセスA801〜C803には運転開始を指示する(S150)。プロセスA801〜C803は、運転開始の指示を受けると、引継ぎデータ保管機能120からデータを読み込み、該データの処理を開始する(S151)。ステップS152では、これらのプロセスA801〜C803が正常に動作しているので、“YES”に分岐し、プロセス個別情報管理手段70は、プロセス個別情報管理テーブル40のプロセスA801〜C803のプロセス状態406を正常「05」に更新する(S153)。プロセス個別情報管理手段70は、プロセス個別情報管理テーブル40のプロセスA801〜C803のミスカウント408を「0」に設定し(S154)、ステップS119に戻って、管理プロセス701がプロセスA801〜C803にプロセス寿命に変化があって、冗長リソースの構成を変更する必要がないか、もしくは、プロセス状態に異常があって、待機系の冗長リソースに処理を引き継ぐ必要がないかを監視し続ける。   Here, since the process branches to “YES” in step S130, the process individual information management unit 70 restarts the processes A801 to C803 (S146), and confirms the completion of restarting these processes (S147). Furthermore, the process individual information management means 70 refers to the miscount 408 of the processes A801 to C803 in the process individual information management table 40 and confirms that the threshold value N is 10 or less. Here, since the value of the miscount 408 is “0”, this step S148 branches to “YES”. The process individual information management means 70 instructs the redundant processes A1001 to C1003 to stop the operation (S149), and instructs the processes A801 to C803 to start the operation (S150). Upon receiving an operation start instruction, the processes A801 to C803 read data from the takeover data storage function 120 and start processing the data (S151). In step S152, since these processes A801 to C803 are operating normally, the process branches to “YES”, and the process individual information management means 70 changes the process states 406 of the processes A801 to C803 in the process individual information management table 40. It is updated to normal “05” (S153). The process individual information management means 70 sets the miscount 408 of the processes A801 to C803 in the process individual information management table 40 to “0” (S154), returns to step S119, and the management process 701 processes the processes A801 to C803. It continues to monitor whether there is a change in the lifetime and it is not necessary to change the configuration of the redundant resource, or whether there is an abnormality in the process state and it is not necessary to take over the processing to the standby redundant resource.

ここでは、時間が経過して、ステップS121にて、プロセス寿命405が変更されて「6」になったとする。すると、ステップS125にて、未検査フラグ407に「1」が設定された後、ステップS126では、プロセス状態は正常なので、“NO”に分岐する。未検査フラグ407が「1」であることを検出したリソース情報収集・配置判断機能部30は、プロセス個別情報管理テーブル40から、プロセスA801〜C803のプロセス起動時間404「32,64,32」、プロセス寿命405「6,6,6」、プロセス状態406「02,02,02」を読み出す。これらを前述の(1)に代入すると、プロセスA801とプロセスC803は、A=2×32−15×6−20×2=−66<Ath=0、プロセスB802は、A=2×64−15×6−20×2=−2<Ath=0となり、閾値を越えるプロセスがないので、評価結果は、プロセスA801〜C803の冗長プロセスは配置しないことになる(S106)。そのため、ステップS107では、“NO”に分岐し、冗長プロセスA1001〜C1003が存在するので、ステップS115では、“YES”に分岐する。リソース情報収集・配置判断機能部30は、冗長リソース管理手段201に、冗長プロセスA1001〜C1003の消去を通知する(S116)。冗長リソース管理手段201は、該通知を受けると、冗長プロセスA1001〜C1003を消去するとともに、該冗長プロセスを登録していた冗長リソース情報テーブル110も消去する(S117)。さらに、冗長リソース管理手段201は、冗長リソース管理テーブル50の該冗長リソースグループ90の冗長リソースフラグ502を「0」に設定する(S118)。以後は、ステップS119に戻って、管理プロセス701がプロセスA801〜C803にプロセス寿命に変化があって、冗長リソースの構成を変更する必要がないか、もしくは、プロセス状態に異常があって、待機系の冗長リソースに処理を引き継ぐ必要がないかを監視し続ける。 Here, it is assumed that the process life 405 is changed to “6” in step S121 after a lapse of time. Then, after “1” is set in the unexamined flag 407 in step S125, in step S126, since the process state is normal, the process branches to “NO”. The resource information collection / arrangement determination function unit 30 that has detected that the unchecked flag 407 is “1” uses the process activation times 404 “32, 64, 32” of the processes A 801 to C 803 from the process individual information management table 40. The process life 405 “6, 6, 6” and the process state 406 “02, 02, 02” are read out. When these are substituted into the above (1), the process A 801 and the process C 803 have A = 2 × 32−15 × 6-20 × 2 = −66 <A th = 0, and the process B 802 has A = 2 × 64−. Since 15 × 6−20 × 2 = −2 <A th = 0 and there is no process exceeding the threshold value, the redundant results of the processes A801 to C803 are not arranged as the evaluation result (S106). Therefore, in step S107, the process branches to “NO”, and the redundant processes A1001 to C1003 exist. Therefore, in step S115, the process branches to “YES”. The resource information collection / arrangement determination function unit 30 notifies the redundant resource management unit 201 of deletion of the redundant processes A1001 to C1003 (S116). Upon receiving the notification, the redundant resource management unit 201 deletes the redundant processes A1001 to C1003 and also deletes the redundant resource information table 110 that has registered the redundant processes (S117). Further, the redundant resource management unit 201 sets the redundant resource flag 502 of the redundant resource group 90 of the redundant resource management table 50 to “0” (S118). Thereafter, the process returns to step S119, and the management process 701 has a change in the process life in the processes A801 to C803, and it is not necessary to change the configuration of the redundant resource, or the process state is abnormal, and the standby system Continue monitoring whether it is necessary to take over the processing of the redundant resource.

以上、この発明の実施形態を、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。   The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes a design and the like within the scope not departing from the gist of the present invention.

多くのプロセスからなり、高可用化のために待機系の冗長プロセスを備えるコンピュータシステムの冗長リソース管理装置に用いて好適である。   It is suitable for use in a redundant resource management apparatus of a computer system comprising a large number of processes and having a standby redundant process for high availability.

一実施形態による冗長リソース管理装置10を備えたコンピュータシステムの構成を示す概略ブロック図である。It is a schematic block diagram which shows the structure of the computer system provided with the redundant resource management apparatus 10 by one Embodiment. 同実施形態におけるプロセス個別情報管理テーブル40の内容例である。It is an example of the content of the process individual information management table 40 in the same embodiment. 同実施形態におけるプロセスの遷移状態一覧表と状態遷移図である。It is a transition state list of a process and a state transition diagram in the embodiment. 同実施形態における冗長リソース管理テーブル50の内容例である。It is an example of the content of the redundant resource management table 50 in the same embodiment. 同実施形態における冗長リソース情報テーブル110の内容例である。It is an example of the content of the redundant resource information table 110 in the same embodiment. 同実施形態の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the embodiment. 同実施形態の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the embodiment. 同実施形態の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the embodiment. 同実施形態の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the embodiment. 同実施形態の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the embodiment. 同実施形態の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of the embodiment.

符号の説明Explanation of symbols

10…冗長リソース管理装置
201…冗長リソース管理手段
202…管理プロセス監視手段
30…リソース情報収集・配置判断機能部
40…プロセス個別情報管理テーブル
401…管理プロセスID
402…プロセスID
403…プロセスのアドレス
404…プロセス起動時間
405…プロセス寿命
406…プロセス状態
50…冗長リソース管理テーブル
501…優先度
502…冗長リソースフラグ
503…管理プロセスID
504…管理プロセスのアドレス
60…プロセスグループ
70…プロセス個別情報管理手段
801…プロセスA
802…プロセスB
803…プロセスC
90…冗長リソースグループ
1001…冗長プロセスA
1002…冗長プロセスB
1003…冗長プロセスC
110…冗長リソース情報テーブル
1101…管理プロセスID
1102…管理プロセスのアドレス
1103…冗長リソースアドレス
120…引継ぎデータ保管機能

DESCRIPTION OF SYMBOLS 10 ... Redundant resource management apparatus 201 ... Redundant resource management means 202 ... Management process monitoring means 30 ... Resource information collection and arrangement | positioning judgment function part 40 ... Process individual information management table 401 ... Management process ID
402 ... Process ID
403 ... Process address 404 ... Process activation time 405 ... Process life 406 ... Process state 50 ... Redundant resource management table 501 ... Priority 502 ... Redundant resource flag 503 ... Management process ID
504 ... Address of management process 60 ... Process group 70 ... Process individual information management means 801 ... Process A
802 ... Process B
803 ... Process C
90 ... Redundant resource group 1001 ... Redundant process A
1002 ... Redundant process B
1003 ... Redundant process C
110 ... Redundant resource information table 1101 ... Management process ID
1102 ... Management process address 1103 ... Redundant resource address 120 ... Takeover data storage function

Claims (8)

業務サービスを実行する複数のプロセスと、前記プロセスを監視して得た前記各プロセスの個別情報を出力する管理プロセスと、前記各プロセスの前記個別情報を格納する個別情報管理テーブルと、前記管理プロセスから前記個別情報を受けて、前記個別情報管理テーブルに登録する個別情報管理手段と、前記プロセスの待機系である冗長プロセスとを備えるコンピュータシステムに設けられた冗長リソース管理装置において、
前記個別情報管理テーブルの更新を検出し、前記個別情報が更新されたプロセスの冗長プロセスの要否を、前記個別情報管理テーブルから取得した該プロセスの個別情報に基づき判断し、前記判断の結果、前記冗長プロセスが不要であり、かつ、該当する冗長プロセスが存在するときは、該冗長プロセスの消去の指示を出力し、前記判断の結果、前記冗長プロセスが必要であり、かつ、該当する冗長プロセスが存在せず、かつ、物理メモリを割り当て可能なときは、該冗長プロセスの生成の指示を出力する配置判断手段と、
前記配置判断手段の出力する指示に従い、前記冗長プロセスの生成・消去を行なう冗長リソース管理手段と
を備えることを特徴とする冗長リソース管理装置。
A plurality of processes that execute business services; a management process that outputs individual information of each process obtained by monitoring the process; an individual information management table that stores the individual information of each process; and the management process In a redundant resource management apparatus provided in a computer system comprising individual information management means for receiving the individual information from and registering in the individual information management table, and a redundant process that is a standby system of the process,
The update of the individual information management table is detected, the necessity of the redundant process of the process in which the individual information is updated is determined based on the individual information of the process acquired from the individual information management table, and as a result of the determination, When the redundant process is unnecessary and the corresponding redundant process exists, an instruction to erase the redundant process is output, and as a result of the determination, the redundant process is required and the corresponding redundant process Is not present, and when physical memory can be allocated, an arrangement determining means for outputting an instruction to generate the redundant process;
A redundant resource management device, comprising: redundant resource management means for generating / erasing the redundant process in accordance with an instruction output by the arrangement determining means.
前記個別情報は、該個別情報が対応するプロセスの管理用識別情報、あるいは、該個別情報が対応するプロセスの履歴情報、あるいは、該個別情報が対応するプロセスの状態情報を含むことを特徴とする請求項1に記載の冗長リソース管理装置。   The individual information includes management identification information of a process corresponding to the individual information, history information of a process corresponding to the individual information, or status information of a process corresponding to the individual information. The redundant resource management apparatus according to claim 1. 前記管理用識別情報は、前記管理プロセスの識別情報、あるいは、前記プロセスの識別情報、あるいは、前記プロセスのアドレスを含み、
前記履歴情報は、前記プロセスの起動に要する時間であるプロセス起動時間、あるいは、前記プロセスが起動されてから経過した時間であるプロセス寿命を含み、
前記状態情報は、前記プロセスのプロセス状態、あるいは、前記プロセスの冗長プロセス割り当ての優先順位である優先度を含むことを特徴とする請求項2に記載の冗長リソース管理装置。
The management identification information includes identification information of the management process, or identification information of the process, or an address of the process,
The history information includes a process start time which is a time required for starting the process, or a process life which is a time elapsed after the process is started,
The redundant resource management apparatus according to claim 2, wherein the state information includes a process state of the process or a priority that is a priority of a redundant process allocation of the process.
前記配置判断手段は、さらに、前記個別情報管理テーブルを参照して、プロセス状態が異常の前記プロセスを検出すると、該プロセスの処理引継ぎ指示を出力し、
前記配置判断手段の処理引継ぎ指示を受けて、前記冗長プロセスの運転を開始させる個別情報管理手段に、前記プロセスの待機系である冗長プロセスの運転開始を指示する管理プロセス監視手段を備えることを特徴とする請求項1から請求項3のいずれかの項に記載の冗長リソース管理装置。
The arrangement determining means further refers to the individual information management table, and when detecting the process having an abnormal process state, outputs a process takeover instruction for the process,
The individual information management means for starting the operation of the redundant process in response to the process takeover instruction of the arrangement determining means is provided with a management process monitoring means for instructing the operation start of the redundant process which is a standby system of the process. The redundant resource management apparatus according to any one of claims 1 to 3.
業務サービスを実行する複数のプロセスと、前記プロセスを監視して、前記各プロセスの個別情報を生成する管理プロセスと、前記各プロセスの前記個別情報を格納する個別情報管理テーブルと、前記管理プロセスから前記個別情報を受けて、前記個別情報管理テーブルに登録する個別情報管理手段と、前記プロセスの待機系である冗長プロセスとを備えるコンピュータシステムに設けられた冗長リソース管理装置において、
前記個別情報管理テーブルの更新を検出する第1の過程と、
前記第1の過程にて更新が検出されると、前記個別情報が更新されたプロセスの冗長プロセスの要否を、前記個別情報管理テーブルから取得した該プロセスの個別情報に基づき判断する第2の過程と、
前記第2の過程の結果、前記冗長プロセスが不要であり、かつ、該当する冗長プロセスが存在するときは、該冗長プロセスの消去の指示を出力し、前記第2の過程の結果、前記冗長プロセスが必要であり、かつ、該当する冗長プロセスが存在せず、かつ、物理メモリを割り当て可能なときは、該冗長プロセスの生成の指示を出力する第3の過程と、
前記第3の過程にて出力した指示に従い、前記冗長プロセスの生成・消去を行なう第4の過程と
を備えることを特徴とする冗長リソース管理方法。
A plurality of processes that execute business services, a management process that monitors the processes and generates individual information of each process, an individual information management table that stores the individual information of each process, and the management process In the redundant resource management apparatus provided in the computer system comprising the individual information management means for receiving the individual information and registering it in the individual information management table, and the redundant process that is a standby system of the process,
A first step of detecting an update of the individual information management table;
When an update is detected in the first process, a determination is made based on the individual information of the process acquired from the individual information management table as to whether a redundant process of the process whose individual information has been updated is necessary. Process,
If the redundant process is unnecessary as a result of the second process and there is a corresponding redundant process, an instruction to erase the redundant process is output, and the redundant process is determined as a result of the second process. And when there is no corresponding redundant process and physical memory can be allocated, a third step of outputting an instruction to generate the redundant process;
A redundant resource management method comprising: a fourth step of generating / erasing the redundant process in accordance with the instruction output in the third step.
前記個別情報管理テーブルを参照して、プロセス状態が異常の前記プロセスを検出すると、該プロセスの処理引継ぎ指示を出力する第5の過程と、
前記第5の過程の処理引継ぎ指示を受けて、前記プロセスの待機系である冗長プロセスの運転開始指示を出力する第6の過程と
を備えることを特徴とする請求項5に記載の冗長リソース管理方法。
A fifth step of referring to the individual information management table and outputting a process takeover instruction of the process when the process having an abnormal process state is detected;
6. The redundant resource management according to claim 5, further comprising: a sixth step of receiving a processing takeover instruction of the fifth step and outputting an operation start instruction of a redundant process which is a standby system of the process. Method.
業務サービスを実行する複数のプロセスと、前記プロセスを監視して、前記各プロセスの個別情報を生成する管理プロセスと、前記各プロセスの前記個別情報を格納する個別情報管理テーブルと、前記管理プロセスから前記個別情報を受けて、前記個別情報管理テーブルに登録する個別情報管理手段と、前記プロセスの待機系である冗長プロセスとを備えるコンピュータシステムを、
前記個別情報管理テーブルの更新を検出し、前記個別情報が更新されたプロセスの冗長プロセスの要否を、前記個別情報管理テーブルから取得した該プロセスの個別情報に基づき判断し、前記判断の結果、前記冗長プロセスが不要であり、かつ、該当する冗長プロセスが存在するときは、該冗長プロセスの消去の指示を出力し、前記判断の結果、前記冗長プロセスが必要であり、かつ、該当する冗長プロセスが存在せず、かつ、物理メモリを割り当て可能なときは、該冗長プロセスの生成の指示を出力する配置判断手段と、
前記配置判断手段の出力する指示に従い、前記冗長プロセスの生成・消去を行なう冗長リソース管理手段
として機能させることを特徴とするプログラム。
A plurality of processes that execute business services, a management process that monitors the processes and generates individual information of each process, an individual information management table that stores the individual information of each process, and the management process A computer system comprising individual information management means for receiving the individual information and registering it in the individual information management table, and a redundant process that is a standby system for the process,
The update of the individual information management table is detected, the necessity of the redundant process of the process in which the individual information is updated is determined based on the individual information of the process acquired from the individual information management table, and as a result of the determination, When the redundant process is unnecessary and the corresponding redundant process exists, an instruction to erase the redundant process is output, and as a result of the determination, the redundant process is required and the corresponding redundant process Is not present, and when physical memory can be allocated, an arrangement determining means for outputting an instruction to generate the redundant process;
A program that functions as redundant resource management means for generating / erasing the redundant process according to an instruction output by the arrangement determining means.
前記配置判断手段は、さらに、前記個別情報管理テーブルを参照して、プロセス状態が異常の前記プロセスを検出すると、該プロセスの処理引継ぎ指示を出力し、
前記コンピュータシステムを、
前記配置判断手段の処理引継ぎ指示を受けて、前記プロセスの待機系である冗長プロセスの運転開始を指示する管理プロセス監視手段としても機能させること
を特徴とする請求項7に記載のプログラム。

The arrangement determining means further refers to the individual information management table, and when detecting the process having an abnormal process state, outputs a process takeover instruction for the process,
The computer system;
8. The program according to claim 7, wherein the program is also made to function as a management process monitoring unit that receives a process takeover instruction of the arrangement determination unit and instructs a start of operation of a redundant process that is a standby system of the process.

JP2005314123A 2005-10-28 2005-10-28 Redundant resource management device, program, and redundant resource management method Pending JP2007122434A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005314123A JP2007122434A (en) 2005-10-28 2005-10-28 Redundant resource management device, program, and redundant resource management method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005314123A JP2007122434A (en) 2005-10-28 2005-10-28 Redundant resource management device, program, and redundant resource management method

Publications (1)

Publication Number Publication Date
JP2007122434A true JP2007122434A (en) 2007-05-17

Family

ID=38146219

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005314123A Pending JP2007122434A (en) 2005-10-28 2005-10-28 Redundant resource management device, program, and redundant resource management method

Country Status (1)

Country Link
JP (1) JP2007122434A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109828777A (en) * 2018-12-06 2019-05-31 珠海西山居互动娱乐科技有限公司 A kind of hand trip installation kit optimization method and system
CN110147237A (en) * 2019-05-20 2019-08-20 深圳市腾讯网域计算机网络有限公司 A kind of redundant resource minimizing technology and device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109828777A (en) * 2018-12-06 2019-05-31 珠海西山居互动娱乐科技有限公司 A kind of hand trip installation kit optimization method and system
CN110147237A (en) * 2019-05-20 2019-08-20 深圳市腾讯网域计算机网络有限公司 A kind of redundant resource minimizing technology and device
CN110147237B (en) * 2019-05-20 2023-08-08 深圳市腾讯网域计算机网络有限公司 Redundant resource removing method and device

Similar Documents

Publication Publication Date Title
US7979515B2 (en) Distribution management method, a distribution management system and a distribution management server
JP5477602B2 (en) Server reliability visualization method, computer system, and management server
CN108369544B (en) Deferred server recovery in a computing system
WO2012014305A1 (en) Method of estimating influence of configuration change event in system failure
JPWO2010140183A1 (en) Server management program, management server, and virtual server placement method
JP2009288836A (en) System failure recovery method of virtual server, and its system
WO2013139196A1 (en) Auxiliary diagnosis method, device and system for virtual machine failure
JP4506520B2 (en) Management server, message extraction method, and program
JPWO2012026040A1 (en) Diagnostic module distribution device, diagnostic module distribution method, and diagnostic module distribution program
JP2013171301A (en) Device, method, and program for job continuation management
CN114064414A (en) High-availability cluster state monitoring method and system
CN111342986B (en) Distributed node management method and device, distributed system and storage medium
TWI518680B (en) Method for maintaining file system of computer system
US20110225463A1 (en) Detecting and recovering from process failures
JP2010244463A (en) Event detection control method and system
JP6124644B2 (en) Information processing apparatus and information processing system
JP2007122434A (en) Redundant resource management device, program, and redundant resource management method
JP6317074B2 (en) Failure notification device, failure notification program, and failure notification method
JP2007193711A (en) Hard disk redundancy management device, method and program, and monitoring and control system
JP2006252189A (en) Application operation management system and method
JP2013186692A (en) Virtual machine providing system
JP2007034416A (en) Information processing system, log data management method and program for managing log data
CN110888663B (en) Application updating method, service server, transfer server, cluster and storage medium
US9880855B2 (en) Start-up control program, device, and method
CN112055041A (en) Information processing system