JP5435205B2 - Multi-node system, node, memory dump processing method, and program - Google Patents

Multi-node system, node, memory dump processing method, and program Download PDF

Info

Publication number
JP5435205B2
JP5435205B2 JP2009017529A JP2009017529A JP5435205B2 JP 5435205 B2 JP5435205 B2 JP 5435205B2 JP 2009017529 A JP2009017529 A JP 2009017529A JP 2009017529 A JP2009017529 A JP 2009017529A JP 5435205 B2 JP5435205 B2 JP 5435205B2
Authority
JP
Japan
Prior art keywords
node
memory
information
computer
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009017529A
Other languages
Japanese (ja)
Other versions
JP2010176345A (en
Inventor
葵 川原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009017529A priority Critical patent/JP5435205B2/en
Publication of JP2010176345A publication Critical patent/JP2010176345A/en
Application granted granted Critical
Publication of JP5435205B2 publication Critical patent/JP5435205B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、ノードに障害が発生した時にメモリダンプを実行するマルチノードシステム、これに用いられるノード、これらを用いたメモリダンプ処理方法、及びこれらを実現するためのプログラムに関する。   The present invention relates to a multi-node system that executes a memory dump when a failure occurs in a node, a node used therefor, a memory dump processing method using these, and a program for realizing them.

一般に、コンピュータシステムのOS(Operating System)は、ハードウェア又はソフトウェアの異常により、正常な処理を続けられなくなった場合、カーネルパニック処理を実行する。カーネルパニック処理としては、コンピュータシステムにおける処理の単なる停止や、障害発生時のメインメモリの内容を内蔵ディスク等に保存するメモリダンプ処理、コンピュータシステムの再起動などが挙げられる。このうち、障害の原因究明の点からは、メモリダンプを採取するメモリダンプ処理(例えば、特許文献1〜3参照)が有効である。   Generally, an OS (Operating System) of a computer system executes kernel panic processing when normal processing cannot be continued due to hardware or software abnormality. Examples of the kernel panic process include a mere stop of the process in the computer system, a memory dump process in which the contents of the main memory at the time of failure occurrence are stored in an internal disk, and a restart of the computer system. Among these, from the viewpoint of investigating the cause of the failure, a memory dump process (see, for example, Patent Documents 1 to 3) for collecting a memory dump is effective.

例えば、特許文献1は、分散メモリ型計算機におけるメモリダンプ処理を開示している。特許文献1に開示されているメモリダンプ処理では、障害にあったプロセッサ(ノード)からシステム管理プロセッサ(ノード)にメモリ内容の採取が依頼され、採取されたメモリ内容はシステム管理プロセッサ(ノード)に保存される。   For example, Patent Document 1 discloses a memory dump process in a distributed memory type computer. In the memory dump process disclosed in Patent Document 1, a processor (node) having a fault requests a system management processor (node) to collect memory contents, and the collected memory contents are sent to the system management processor (node). Saved.

また、特許文献2も、特許文献1と同様に、分散メモリ型計算機におけるメモリダンプ処理を開示している。但し、特許文献2に開示された処理では、特許文献1に開示された処理と異なり、障害が発生したノードは、それと記憶装置とのアクセス経路の確保を実行する。このため、特許文献2によれば、メモリダンプの確実性が図られる。   Similarly to Patent Document 1, Patent Document 2 discloses a memory dump process in a distributed memory type computer. However, in the process disclosed in Patent Document 2, unlike the process disclosed in Patent Document 1, the node in which the failure has occurred secures an access path between it and the storage device. For this reason, according to Patent Document 2, the reliability of the memory dump is achieved.

特許文献3は、クライアント・サーバシステムにおけるメモリダンプ処理を開示している。特許文献3に開示された処理では、ホストコンピュータ(オペレータ用端末)から、障害の起きた端末に対して、メモリダンプが実行される。具体的には、ホストコンピュータは、メモリ内容を採取するメモリダンププログラムを、障害の発生した端末に転送し、このプログラムの実行によりメモリダンプを行わせる。そして、ホストコンピュータは、障害の発生した端末を再起動させ、その後、障害の発生した端末に、それが採取したメモリ内容の転送を行わせる。   Patent Document 3 discloses memory dump processing in a client / server system. In the processing disclosed in Patent Document 3, a memory dump is executed from a host computer (operator terminal) to a faulty terminal. Specifically, the host computer transfers a memory dump program for collecting the memory contents to the terminal where the failure has occurred, and causes the memory dump to be performed by executing this program. Then, the host computer restarts the faulty terminal, and then causes the faulty terminal to transfer the memory contents collected by the faulty terminal.

特開平11−306051号公報Japanese Patent Laid-Open No. 11-306051 特開2007−334668号公報JP 2007-334668 A 特開平7−146807号公報JP 7-146807 A

ところで、特許文献1または特許文献2に開示されたメモリダンプ処理では、障害の発生したノードがメモリ転送処理を実行する。このため、メモリ転送処理に必要なデータが障害により破壊されていた場合、カーネルのダブルパニックが発生する可能性がある。また、ノードに固有の機能によってメモリ内容の採取が行われるため、ノード自体が障害で使用できない間は、メモリダンプができず、メモリダンプに失敗する可能性もある。   By the way, in the memory dump process disclosed in Patent Document 1 or Patent Document 2, the node in which the failure occurs executes the memory transfer process. For this reason, if the data required for the memory transfer process is destroyed due to a failure, a kernel double panic may occur. In addition, since the memory contents are collected by a function specific to the node, the memory dump cannot be performed while the node itself cannot be used due to a failure, and the memory dump may fail.

また、特許文献3に開示されたメモリダンプ処理は、障害の発生した端末において、プログラム実行等の通常のカーネル処理が正常に行える状態でなければ行うことができず、カーネルパニック処理の様なクリティカルな場面には適用できないという問題がある。   In addition, the memory dump process disclosed in Patent Document 3 cannot be performed unless a normal kernel process such as program execution can be normally performed in a faulty terminal. There is a problem that it cannot be applied to various scenes.

更に、特許文献3に開示されたメモリダンプ処理では、上述したように、障害が発生した端末を再起動する必要がある。このため、障害が発生した端末が再起動に時間が掛かるコンピュータである場合や、障害の発生したハードウェアを交換する必要がある場合等において、メモリダンプの解析をすぐに行えないという問題もある。更に、このメモリダンプの解析を直ぐに行えないという問題は、再現性の低い障害や障害解析に急を要する場合に、ダンプされたメモリの内容の消失を招く可能性を有している。   Furthermore, in the memory dump process disclosed in Patent Document 3, it is necessary to restart the terminal in which the failure has occurred, as described above. For this reason, there is a problem that memory dump analysis cannot be performed immediately when the failed terminal is a computer that takes time to restart, or when the failed hardware needs to be replaced. . Furthermore, the problem that the analysis of the memory dump cannot be performed immediately has a possibility that the contents of the dumped memory may be lost when a failure with low reproducibility or a failure analysis is urgently required.

本発明の目的は、上記問題を解消し、障害の発生したノードの状態に影響されることなく、メモリダンプ処理を実行可能なマルチノードシステム、ノード、メモリダンプ処理方法、及びプログラムを提供することにある。   An object of the present invention is to provide a multi-node system, a node, a memory dump processing method, and a program capable of solving the above-described problem and executing memory dump processing without being affected by the state of a failed node. It is in.

上記目的を達成するため、本発明におけるマルチノードシステムは、相互に通信可能な複数のノードを有するマルチノードシステムであって、
前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生していないノードは、前記障害の発生したノードのメモリから、それに記憶されている情報を取得する、ことを特徴とする。
In order to achieve the above object, a multi-node system according to the present invention is a multi-node system having a plurality of nodes capable of communicating with each other,
When a failure occurs in any of the plurality of nodes, the node in which the failure has not occurred acquires information stored in the memory of the node in which the failure has occurred. .

また、上記目的を達成するため、本発明におけるノードは、マルチノードシステムを構成する複数のノードの一つとして機能するノードであって、
メモリと、
当該ノード以外の別のノードのメモリに記憶されている情報を取得可能なリモートメモリアクセス機構と、
当該ノードに障害が発生した場合に、当該ノード以外の別のノードに、当該ノードのメモリに記憶されている情報の取得を依頼する情報取得依頼部と、
当該ノード以外の別のノードから、そのメモリに記憶されている情報の取得の依頼を受けた場合に、前記リモートメモリアクセス機構によって、前記別のノードのメモリに記憶されている情報を取得する情報取得部とを、備えていることを特徴とする。
In order to achieve the above object, the node in the present invention is a node that functions as one of a plurality of nodes constituting a multi-node system,
Memory,
A remote memory access mechanism capable of acquiring information stored in the memory of another node other than the node;
An information acquisition request unit that requests another node other than the node to acquire information stored in the memory of the node when a failure occurs in the node;
Information for acquiring information stored in the memory of the other node by the remote memory access mechanism when a request for acquisition of information stored in the memory is received from another node other than the node And an acquisition unit.

また、上記目的を達成するため、本発明におけるメモリダンプ処理方法は、相互に通信可能な複数のノードを有するマルチノードシステムを用いてメモリダンプを行うための方法であって、
(a)前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生したノードによって、前記障害の発生していないノードに、前記障害の発生したノードのメモリに記憶されている情報の取得を要求するステップと、
(b)前記(a)のステップによる要求を受け、且つ、前記障害の発生していないノードによって、前記障害の発生したノードの前記メモリに記憶されている情報を取得するステップとを有する、ことを特徴とする。
In order to achieve the above object, a memory dump processing method according to the present invention is a method for performing a memory dump using a multi-node system having a plurality of nodes capable of communicating with each other.
(A) When a failure occurs in any of the plurality of nodes, the information stored in the memory of the failed node by the failed node in the non-failed node Requesting the acquisition of
(B) receiving a request in the step (a) and obtaining information stored in the memory of the failed node by a node in which the failure has not occurred. It is characterized by.

更に、上記目的を達成するため、本発明におけるプログラムは、相互に通信可能な複数のコンピュータを有するマルチノードシステムにおけるメモリダンプを前記コンピュータによって行うためのプログラムであって、
前記コンピュータに、
前記コンピュータに障害が発生した場合は、(a)前記コンピュータのメモリに記憶されている情報の取得を、前記障害の発生していないコンピュータに要求する、ステップを実行させ、
前記コンピュータに障害が発生していない場合は、(b)前記障害が発生したコンピュータの前記メモリに記憶されている情報を取得する、ステップを実行させる、ことを特徴とする。
Furthermore, in order to achieve the above object, a program in the present invention is a program for performing a memory dump in a multi-node system having a plurality of computers capable of communicating with each other by the computer,
In the computer,
If a failure occurs in the computer, (a) request the acquisition of information stored in the memory of the computer from the computer in which the failure does not occur,
When no failure has occurred in the computer, the step of (b) acquiring information stored in the memory of the computer in which the failure has occurred is executed.

以上の特徴により、本発明におけるマルチノードシステム、ノード、メモリダンプ処理方法、及びプログラムによれば、障害の発生したノードの状態に影響されることなく、メモリダンプ処理を実行することができる。   With the above features, according to the multi-node system, the node, the memory dump processing method, and the program of the present invention, the memory dump process can be executed without being affected by the state of the failed node.

図1は、本発明の実施の形態1におけるマルチノードシステムの概略構成を示すブロック図である。FIG. 1 is a block diagram showing a schematic configuration of a multi-node system according to Embodiment 1 of the present invention. 図2は、実施の形態1において、障害が発生したノードにおける一連の動作を示すフロー図である。FIG. 2 is a flowchart showing a series of operations in the node where a failure has occurred in the first embodiment. 図3は、実施の形態1において、障害が発生していないノードにおける一連の動作を示すフロー図である。FIG. 3 is a flowchart showing a series of operations in a node in which no failure has occurred in the first embodiment. 図4は、本発明の実施の形態2におけるマルチノードシステムの概略構成を示すブロック図である。FIG. 4 is a block diagram showing a schematic configuration of the multi-node system according to Embodiment 2 of the present invention. 図5は、本発明の実施の形態2において、障害が発生したノードにおける一連の動作を示すフロー図である。FIG. 5 is a flowchart showing a series of operations in a node where a failure has occurred in the second embodiment of the present invention.

(実施の形態1)
以下、本発明の実施の形態1におけるマルチノードシステム、ノード、これらを用いたメモリダンプ処理方法、及びこれらを実現するためのプログラムについて、図1〜図3を参照しながら説明する。最初に、本実施の形態1におけるマルチノードシステムの構成について図1を用いて説明する。図1は、本発明の実施の形態1におけるマルチノードシステムの概略構成を示すブロック図である。
(Embodiment 1)
Hereinafter, a multi-node system, a node, a memory dump processing method using these, and a program for realizing them will be described with reference to FIGS. 1 to 3 according to Embodiment 1 of the present invention. First, the configuration of the multi-node system according to the first embodiment will be described with reference to FIG. FIG. 1 is a block diagram showing a schematic configuration of a multi-node system according to Embodiment 1 of the present invention.

図1に示すように、本実施の形態1におけるマルチノードシステム104は、相互に通信可能なノード100及び101を有している。図1には、ノード100及びノード101のみが示されているが、実際は、マルチノードシステム104は、更に多くのノードを有していても良い。   As shown in FIG. 1, the multi-node system 104 according to the first embodiment has nodes 100 and 101 that can communicate with each other. Although only the node 100 and the node 101 are shown in FIG. 1, the multi-node system 104 may actually have more nodes.

また、マルチノードシステム104において、ノード100及びノード101のいずれかに障害が発生した場合は、障害の発生していないノードは、障害の発生したノードのメモリから、それに記憶されている情報を取得する、つまり、メモリダンプ処理を実行する。ここで、ノード100及び101の構成について以下に説明する。   Further, in the multi-node system 104, when a failure occurs in either the node 100 or the node 101, the node in which the failure has not occurred acquires information stored in the memory of the failed node. In other words, the memory dump process is executed. Here, the configuration of the nodes 100 and 101 will be described below.

図1に示すように、本実施の形態1において、ノード100及び101は、同一の構成を有するコンピュータであり、両者は、リモートメモリアクセス機構110と、メモリ120と、二次記憶装置130と、CPU(central processing unit)150とを備えている。   As shown in FIG. 1, in the first embodiment, the nodes 100 and 101 are computers having the same configuration, and both of them are a remote memory access mechanism 110, a memory 120, a secondary storage device 130, CPU (central processing unit) 150.

リモートメモリアクセス機構110は、それを備えるノード(自ノード)以外の別のノードのメモリに記憶されている情報を取得可能に構成されている。本実施の形態1では、リモートメモリアクセス機構110は、DMA(Direct Memory Access)を備え、自ノードのCPU150を介することなく、自ノードのメモリの入出力(I/O)を実行できる。   The remote memory access mechanism 110 is configured to be able to acquire information stored in the memory of another node other than the node having the remote memory access mechanism 110 (own node). In the first embodiment, the remote memory access mechanism 110 includes DMA (Direct Memory Access), and can execute input / output (I / O) of the memory of the own node without going through the CPU 150 of the own node.

また、リモートメモリアクセス機構110は、自ノード以外の別のノードのリモートメモリアクセス機構110に対して、その別のノードのメモリに記憶されている情報の転送を要求できる。このノード間でやりとりされる、メモリのI/Oを行う命令は、以下、「ノード間主記憶転送命令」とする。そして、ノード間主記憶転送命令を受け取ったリモートメモリアクセス機構110は、メモリ120に情報を出力させ、出力された情報を、ノード間主記憶転送命令の出力元のリモートメモリアクセス機構110に送信する。   In addition, the remote memory access mechanism 110 can request the remote memory access mechanism 110 of another node other than its own node to transfer information stored in the memory of the other node. An instruction for performing memory I / O exchanged between the nodes is hereinafter referred to as an “internode main memory transfer instruction”. The remote memory access mechanism 110 that has received the inter-node main memory transfer instruction causes the memory 120 to output information, and transmits the output information to the remote memory access mechanism 110 that is the output source of the inter-node main memory transfer instruction. .

各ノードにおいて、メモリ120は、OS140のカーネルデータ121を格納し、リモートメモリアクセス機構110と二次記憶装置130とに接続されている。OS140は、CPU150を含むハードウェア資源によって実行されるプログラムであり、情報取得依頼部141と、情報取得部142と、情報出力部143とを有している。また、メモリ120に格納されているカーネルデータ121が、本実施の形態1においてメモリダンプ処理(情報取得処理)の対象となる。   In each node, the memory 120 stores the kernel data 121 of the OS 140 and is connected to the remote memory access mechanism 110 and the secondary storage device 130. The OS 140 is a program executed by hardware resources including the CPU 150, and includes an information acquisition request unit 141, an information acquisition unit 142, and an information output unit 143. In addition, the kernel data 121 stored in the memory 120 is a target of the memory dump process (information acquisition process) in the first embodiment.

このうち、情報取得依頼部141は、自ノードに障害が発生した場合に、自ノード以外の別のノードに、自ノードのメモリ120に記憶されている情報(カーネルデータ121)の取得、即ち、メモリダンプデータの取得を依頼する。   Among them, the information acquisition request unit 141 acquires information (kernel data 121) stored in the memory 120 of the own node in another node other than the own node when a failure occurs in the own node, that is, Request acquisition of memory dump data.

本実施の形態1では、ノードに障害が発生すると、先ず、障害が発生したノードのOS140は、カーネルパニック処理を実行する。次いで、メモリ120内のカーネルデータ121を取得(メモリダンプを実行)するため、情報取得依頼部141は、任意の別のノードに情報の取得を依頼する。また、障害が発生したノードのOS140は、情報の取得を依頼した後、カーネルパニック処理を一時停止する。そして、別のノードでの情報の取得が終了すると、OS140は、カーネルパニック処理を再開する。   In the first embodiment, when a failure occurs in a node, first, the OS 140 of the node in which the failure occurs executes kernel panic processing. Next, in order to acquire the kernel data 121 in the memory 120 (execute a memory dump), the information acquisition request unit 141 requests acquisition of information from any other node. In addition, the OS 140 of the node in which the failure has occurred requests the acquisition of information, and then temporarily stops the kernel panic process. Then, when the acquisition of information at another node is completed, the OS 140 resumes the kernel panic process.

また、情報取得部142は、自ノード以外の別のノードから、そのメモリに記憶されている情報の取得の依頼を受けた場合に、リモートメモリアクセス機構110によって、別のノードのメモリに記憶されている情報(カーネルデータ121)を取得する。具体的には、情報取得部142は、自ノードのリモートメモリアクセス機構110から、別のノードのリモートメモリアクセス機構110に対して、ノード間主記憶転送命令を送信し、メモリダンプを実行する。そして、情報取得部142は、取得したメモリダンプデータ(カーネルデータ121)を、自ノードのメモリ120に格納する。   Further, when the information acquisition unit 142 receives a request for acquisition of information stored in the memory from another node other than the own node, the information acquisition unit 142 is stored in the memory of another node by the remote memory access mechanism 110. Information (kernel data 121) is obtained. Specifically, the information acquisition unit 142 transmits an inter-node main memory transfer command from the remote memory access mechanism 110 of its own node to the remote memory access mechanism 110 of another node, and executes a memory dump. Then, the information acquisition unit 142 stores the acquired memory dump data (kernel data 121) in the memory 120 of the own node.

情報出力部143は、自ノードのメモリ120に格納されている情報を、自ノード内に備えられた二次記憶装置130や、ノード100及び101に接続された共有ディスク装置103に出力し、それらに格納させることができる。即ち、情報出力部143は、他のノードから取得し、自ノードのメモリ120に格納したメモリダンプデータを、二次記憶装置130又は共有ディスク装置103に出力する。   The information output unit 143 outputs the information stored in the memory 120 of the own node to the secondary storage device 130 provided in the own node or the shared disk device 103 connected to the nodes 100 and 101, Can be stored. That is, the information output unit 143 outputs the memory dump data acquired from other nodes and stored in the memory 120 of the own node to the secondary storage device 130 or the shared disk device 103.

また、本実施の形態1では、情報出力部143は、ノード間での情報の転送処理とは非同期に、メモリダンプデータを、二次記憶装置130又は共有ディスク装置103に出力することもできる。共有ディスク装置103は、本実施の形態1においては、ノード100及び101によって共有されており、例えば、NFS(Network File System)等の分散ファイルシステムを構成している。   In the first embodiment, the information output unit 143 can also output the memory dump data to the secondary storage device 130 or the shared disk device 103 asynchronously with the information transfer process between the nodes. In the first embodiment, the shared disk device 103 is shared by the nodes 100 and 101, and constitutes a distributed file system such as NFS (Network File System), for example.

また、情報出力部143による出力が行われるノードは、障害が発生していない正常に動作しているノードである。よって、二次記憶装置130は、各ノードに内蔵された装置に限定されず、二次記憶装置130としても、複数のノード間で共有され、且つ、NFSなどの分散ファイルシステムを構成する装置を用いることができる。   Further, the node on which the output by the information output unit 143 is performed is a normally operating node in which no failure has occurred. Therefore, the secondary storage device 130 is not limited to a device built in each node, and the secondary storage device 130 is a device that is shared among a plurality of nodes and that constitutes a distributed file system such as NFS. Can be used.

本実施の形態1では、ノード100とノード101とは、ノード間を接続するノード間接続装置102を介して接続され、これにより、相互に通信可能となっている。具体的には、ノード間接続装置102はルーター等であり、専用線によってノード100及び101に接続されている。ノード間接続装置102は、ノード間主記憶転送命令で指定されるノードのリモートメモリアクセス機構110に、ノード間主記憶転送命令を送信する。また、ノード間接続装置102は、情報の転送が要求されたノードのリモートメモリアクセス機構110が出力した情報を、要求元のノードに転送する。   In the first embodiment, the node 100 and the node 101 are connected via an inter-node connection device 102 that connects the nodes, thereby enabling communication with each other. Specifically, the internode connection apparatus 102 is a router or the like, and is connected to the nodes 100 and 101 by a dedicated line. The inter-node connection device 102 transmits the inter-node main memory transfer command to the remote memory access mechanism 110 of the node specified by the inter-node main memory transfer command. Further, the internode connection apparatus 102 transfers the information output from the remote memory access mechanism 110 of the node for which the information transfer is requested to the requesting node.

また、本実施の形態1においては、マルチノードシステム104は、複数のノードそれぞれのメモリが、複数のノードによって共有されている態様であっても良い。具体的には、マルチノードシステム104は、例えば、ccNUMA(cache coherency Non-Uniform Memory Access)と呼ばれるシステムを備えることができる。このシステムでは、ローカルに配置されているメモリへのI/Oと同様にして、リモートに配置されている他のノードのメモリのI/Oが可能となる。この場合、ノード100及び101は、リモートメモリアクセス機構110を備えていなくても良い。   In the first embodiment, the multi-node system 104 may be configured such that the memories of the plurality of nodes are shared by the plurality of nodes. Specifically, the multi-node system 104 can include, for example, a system called ccNUMA (cache coherency non-uniform memory access). In this system, the I / O of the memory of another node that is remotely arranged can be performed in the same manner as the I / O to the memory that is locally arranged. In this case, the nodes 100 and 101 do not have to include the remote memory access mechanism 110.

次に、図1に示したマルチノードシステム104における動作について、一つのノードに着目し、それに障害が発生している場合と、障害が発生していない場合とに分けて、図2及び図3を用いて説明する。図2は、実施の形態1において、障害が発生したノードにおける一連の動作を示すフロー図である。図3は、実施の形態1において、障害が発生していないノードにおける一連の動作を示すフロー図である。   Next, with regard to the operation in the multi-node system 104 shown in FIG. 1, paying attention to one node, it is divided into a case where a failure has occurred and a case where no failure has occurred. Will be described. FIG. 2 is a flowchart showing a series of operations in the node where a failure has occurred in the first embodiment. FIG. 3 is a flowchart showing a series of operations in a node in which no failure has occurred in the first embodiment.

なお、本実施の形態1におけるメモリダンプ処理方法は、図1に示した本実施の形態1におけるマルチノードシステムを動作させることによって実施される。このため、本実施の形態1におけるメモリダンプ処理方法の説明は、以下のマルチノードシステム104の動作の説明に代える。   Note that the memory dump processing method in the first embodiment is implemented by operating the multi-node system in the first embodiment shown in FIG. For this reason, the description of the memory dump processing method according to the first embodiment is replaced with the following description of the operation of the multi-node system 104.

また、以下の説明では、適宜、図1を参照する。更に、ノード100に障害が発生し、ノード101には障害が発生していないとする。そして、ノード100を「障害ノード100」、ノード101を「ダンプ取得ノード101」とする。また、障害ノード100とダンプ取得ノード101とのノード間主記憶転送は、高速な専用線で接続されたノード間接続装置102を介して行われる。   In the following description, FIG. 1 will be referred to as appropriate. Furthermore, it is assumed that a failure has occurred in the node 100 and no failure has occurred in the node 101. The node 100 is assumed to be the “failure node 100” and the node 101 is assumed to be the “dump acquisition node 101”. In addition, inter-node main memory transfer between the failed node 100 and the dump acquisition node 101 is performed via the inter-node connection device 102 connected by a high-speed dedicated line.

先ず、図2を用いて、障害ノード100に着目して説明を行う。また、図2においては、一般的な場合と同様に、ノード100に、動作継続が出来ないような致命的な障害が起きた場合は、ノード100のOS104によりカーネルパニック処理が実行されるとする。   First, a description will be given focusing on the failed node 100 with reference to FIG. In FIG. 2, similarly to the general case, when a fatal failure that prevents the operation from continuing in the node 100 occurs, the kernel panic process is executed by the OS 104 of the node 100. .

図2に示すように、最初に、障害ノード100の情報取得依頼部141は、相互に通信可能な他のノードの中から、任意のノードをダンプ取得ノードとして選択する(ステップA201)。本実施の形態では、ノード101がダンプ取得ノードとなる。   As shown in FIG. 2, first, the information acquisition request unit 141 of the failed node 100 selects an arbitrary node as a dump acquisition node from other nodes that can communicate with each other (step A201). In the present embodiment, the node 101 is a dump acquisition node.

次に、障害ノード100の情報取得依頼部141は、ダンプ取得ノード101に対し、障害ノード100のメモリ120に記憶されている情報の取得依頼(ダンプ取得依頼)を送信する(ステップA202)。そして、ステップA202の終了後、OS104は、カーネルパニック処理を一時停止する(ステップA203)。   Next, the information acquisition request unit 141 of the failed node 100 transmits an acquisition request (dump acquisition request) of information stored in the memory 120 of the failed node 100 to the dump acquiring node 101 (step A202). Then, after step A202 ends, the OS 104 temporarily stops the kernel panic process (step A203).

そして、ステップA203による処理の停止が継続している間、後述するダンプ取得ノード101からノード間主記憶転送命令が送信され、障害ノード100のメモリ120のI/Oは、障害ノード100のリモートメモリアクセス機構110が行う。このため、障害ノード100のCPU150が処理を行うことはない。   While the process stop at step A203 continues, an inter-node main memory transfer command is transmitted from the dump acquisition node 101, which will be described later, and the I / O of the memory 120 of the failed node 100 is the remote memory of the failed node 100. Access mechanism 110 performs. For this reason, the CPU 150 of the failed node 100 does not perform processing.

次に、障害ノード100の情報取得依頼部141は、ダンプ取得ノード101から、情報の取得が終了したことの通知(ダンプ取得終了通知)を受信する(ステップA204)。そして、障害ノード100のOS104は、ステップA204を契機に、ステップA203で停止していたカーネルパニック処理を再開する(A205)。   Next, the information acquisition requesting unit 141 of the failed node 100 receives a notification (dump acquisition end notification) from the dump acquisition node 101 that information acquisition has ended (step A204). Then, the OS 104 of the failed node 100 restarts the kernel panic process that has been stopped in Step A203, triggered by Step A204 (A205).

次に、図3を用いて、ダンプ取得ノード101に着目して説明を行う。図3に示す処理は、障害ノード100がカーネルパニック処理を開始してから終了するまでの間に実行される。   Next, a description will be given focusing on the dump acquisition node 101 with reference to FIG. The process shown in FIG. 3 is executed from when the failed node 100 starts the kernel panic process to when it ends.

図3に示すように、先ず、ダンプ取得ノード101の情報取得部142は、ダンプ取得依頼の受信を契機にして、リモートメモリアクセス機構110によって、障害ノード100のメモリ120に記憶されている情報を取得する(ステップA301)。このとき取得される情報は、障害ノード100のメモリに記憶されているカーネルデータ121(メモリダンプデータ)である。また、障害ノード(100)にノード間主記憶転送を要求する際に必要なアドレスは、常に一定となる。   As shown in FIG. 3, first, the information acquisition unit 142 of the dump acquisition node 101 receives information stored in the memory 120 of the failed node 100 by the remote memory access mechanism 110 in response to reception of the dump acquisition request. Obtain (step A301). The information acquired at this time is kernel data 121 (memory dump data) stored in the memory of the failed node 100. Further, the address required when requesting the inter-node main memory transfer to the failed node (100) is always constant.

次に、ダンプ取得ノード101の情報取得部142は、取得済みのメモリダンプデータのアドレスと、取得の対象となっているデータのアドレスとを比較し、取得すべきメモリダンプデータが未だ存在しているかどうかを判定する(ステップA302)。   Next, the information acquisition unit 142 of the dump acquisition node 101 compares the address of the acquired memory dump data with the address of the data to be acquired, and the memory dump data to be acquired still exists. It is determined whether or not (step A302).

ステップA302の判定の結果、取得すべきメモリダンプデータが未だ存在している場合は、情報取得部142は、ノード間主記憶転送命令を送信する(ステップA303)。ステップA303では、ノード間主記憶転送命令の宛先は、障害ノード100に設定される。また、転送開始アドレスは、次のステップA301で受信予定のメモリダンプデータのメモリアドレスに設定される。   As a result of the determination in step A302, when the memory dump data to be acquired still exists, the information acquisition unit 142 transmits an inter-node main memory transfer command (step A303). In step A303, the destination of the inter-node main memory transfer command is set to the failed node 100. The transfer start address is set to the memory address of the memory dump data scheduled to be received in the next step A301.

一方、ステップA302の判定の結果、取得すべきメモリダンプデータが存在していない場合は、即ち、取得すべきメモリ120の情報が全て取得されている場合は、情報取得部142は、障害ノード100に、ダンプ取得終了通知を送信する(ステップA304)。ステップA304の終了後、情報出力部143は、図3に示したダンプ取得処理とは非同期に、二次記憶装置130や、共有ディスク装置103に、取得したダンプデータを出力する。そして、ダンプ取得ノード101における処理は終了する。   On the other hand, as a result of the determination in step A302, when there is no memory dump data to be acquired, that is, when all the information of the memory 120 to be acquired is acquired, the information acquisition unit 142 determines that the failure node 100 In step A304, a dump acquisition end notification is transmitted. After step A304 ends, the information output unit 143 outputs the acquired dump data to the secondary storage device 130 or the shared disk device 103 asynchronously with the dump acquisition process shown in FIG. Then, the process in the dump acquisition node 101 ends.

このように、本実施の形態1におけるマルチノードシステム104及びメモリダンプ処理方法では、障害の発生していないノードによってメモリダンプ処理が行われる。つまり、本実施の形態1によれば、障害の発生したノードの状態に影響されることなく、メモリダンプ処理の実行が可能となる。   As described above, in the multi-node system 104 and the memory dump processing method according to the first embodiment, the memory dump process is performed by a node in which no failure has occurred. That is, according to the first embodiment, it is possible to execute the memory dump process without being affected by the state of the failed node.

具体的には、本実施の形態1では、正常に動作しているノード(ダンプ取得ノード101)が、ノード間主記憶転送命令により、障害ノード100のメモリ内容(ダンプデータ)を取得し、障害ノード100においてはDMAにより直接メモリ120の内容が転送可能となっている。よって、障害が発生したノード(障害ノード100)のOS140は処理を行う必要が無いため、障害ノード100のOS140が障害によって動作できない状態でも、メモリダンプ処理の実行が可能となる。更に、障害ノード100において、OS140の再起動が必要な場合であっても、再起動に影響されることなく、ダンプデータの参照が可能となる。   Specifically, in the first embodiment, a normally operating node (dump acquisition node 101) acquires the memory contents (dump data) of the failed node 100 by an inter-node main memory transfer instruction, In the node 100, the contents of the memory 120 can be directly transferred by DMA. Therefore, since the OS 140 of the node in which the failure has occurred (failed node 100) does not need to perform processing, the memory dump processing can be executed even when the OS 140 of the failed node 100 cannot operate due to the failure. Furthermore, even if it is necessary to restart the OS 140 in the failed node 100, the dump data can be referred to without being affected by the restart.

また、本実施の形態1では、障害の発生していない正常なノード(ダンプ取得ノード101)がメモリダンプデータの取得を行うため、障害の発生直後に自動的にメモリダンプデータの取得のための処理が開始可能である。また、このため、迅速なダンプ解析が可能となる。特に、HPC(High Performance Computing)の分野では、複数のノードを接続して運用するマルチノードシステムが主流であり、複数のノードに障害が発生した場合は、オペレータが複数のノードのメモリダンプを個別に採取する必要がある。多数のノードのメモリダンプ採取作業はオペレータにとって煩雑であり、採取時の誤操作によりメモリダンプを失う可能性もあるが、本実施の形態1によれば、このような問題を解決できる。   In the first embodiment, since a normal node (dump acquisition node 101) in which no failure has occurred acquires memory dump data, memory dump data is automatically acquired immediately after the occurrence of a failure. Processing can begin. For this reason, quick dump analysis is possible. In particular, in the field of HPC (High Performance Computing), multi-node systems that connect and operate multiple nodes are the mainstream, and when a failure occurs in multiple nodes, the operator individually performs memory dumps of multiple nodes. Need to be collected. The operation of collecting memory dumps of a large number of nodes is complicated for the operator, and there is a possibility that the memory dump may be lost due to an erroneous operation at the time of collection. However, according to the first embodiment, such a problem can be solved.

更に、本実施の形態1では、メモリダンプデータの保存先が、正常に動作しているノード(ダンプ取得ノード101)であるため、メモリダンプ処理の終了後、直ぐにメモリダンプデータの参照が可能となる。また、本実施の形態1においては、メモリダンプデータは、分散ファイルシステム等の共有ディスク装置に保存して一元管理することが可能である。このため、データ管理の容易化と、1つのノードに必要な二次記憶装置130の容量の削減化とを図ることができる。   Furthermore, in the first embodiment, since the storage destination of the memory dump data is a normally operating node (dump acquisition node 101), the memory dump data can be referred to immediately after the memory dump processing is completed. Become. In the first embodiment, the memory dump data can be stored in a shared disk device such as a distributed file system for centralized management. Therefore, data management can be facilitated and the capacity of the secondary storage device 130 required for one node can be reduced.

また、従来から、UNIX(登録商標)系OSを用いるマルチノードシステムでは、メモリダンプを取得するため、「diskdump」、「netdump」、「kdump」といったプログラムが利用される。   Conventionally, in a multi-node system using a UNIX (registered trademark) OS, programs such as “disk dump”, “net dump”, and “k dump” are used to obtain a memory dump.

このうち、「diskdump」では、障害が発生したノードの内蔵ディスクにメモリダンプデータが保存され、更に、ダンプ取得に対応したディスクドライバを別途用意する必要がある。また、「netdump」は、クライアント・サーバ方式でメモリダンプデータを取得するシステムで利用され、サーバの内蔵ディスクに、メモリダンプデータが保存される。よって、「netdump」では、専用のネットワークドライバが必要となる。   Among these, in “disk dump”, memory dump data is stored in the internal disk of the node where the failure has occurred, and it is also necessary to separately prepare a disk driver corresponding to dump acquisition. “Netdump” is used in a system that acquires memory dump data by a client-server method, and the memory dump data is stored in the internal disk of the server. Thus, “netdump” requires a dedicated network driver.

これらに対して、本実施の形態1によれば、特別なディスクドライバや専用のネットワークドライバは必要ない。UNIX系OSを用いるマルチノードシステムにおいて、「diskdump」や「netdump」に代えて、本実施の形態1を用いれば、システムのコストの低減化が可能となる。   On the other hand, according to the first embodiment, no special disk driver or dedicated network driver is required. In a multi-node system using a UNIX OS, if the first embodiment is used instead of “disk dump” or “net dump”, the cost of the system can be reduced.

また、「kdump」では、メモリダンプデータの取得処理時に起動させるカーネルを予めメインメモリに常駐させておく必要がある。このため、メモリの消費量が大きくなるので、実装メモリを出来るだけユーザに利用させるポリシで運用するHPC分野等で利用することは困難である。これに対して、本実施の形態1によれば、メモリダンプデータを取得するためのプログラムをメインメモリに常駐させる必要はなく、本実施の形態1は、HPC分野にも有用である。   In “kdump”, it is necessary to make the kernel to be activated in the memory dump data acquisition process resident in the main memory in advance. For this reason, since the amount of memory consumption increases, it is difficult to use the mounted memory in an HPC field or the like that is operated with a policy that allows the user to use the mounted memory as much as possible. On the other hand, according to the first embodiment, there is no need to make the program for acquiring the memory dump data resident in the main memory, and the first embodiment is useful also in the HPC field.

また、本実施の形態1におけるプログラムは、ノードを構成しているコンピュータに、図2に示すステップA201〜A205、及び図3に示すステップA301〜A304を実行させるプログラムであれば良い。本実施の形態1におけるプログラムを実行することによって、本実施の形態1におけるマルチノードシステム及びメモリダンプ処理方法を実現できる。この場合、ノードのCPUは、情報取得依頼部、情報取得部、情報出力部として機能し、処理を行なう。   Moreover, the program in this Embodiment 1 should just be a program which makes the computer which comprises a node perform step A201-A205 shown in FIG. 2, and step A301-A304 shown in FIG. By executing the program in the first embodiment, the multi-node system and the memory dump processing method in the first embodiment can be realized. In this case, the CPU of the node functions as an information acquisition request unit, an information acquisition unit, and an information output unit, and performs processing.

(実施の形態2)
次に、本発明の実施の形態2におけるマルチノードシステム、ノード、これらを用いたメモリダンプ処理方法、及びこれらを実現するためのプログラムについて、図4及び図5を参照しながら説明する。最初に、本実施の形態2におけるマルチノードシステムの構成について図4を用いて説明する。図4は、本発明の実施の形態2におけるマルチノードシステムの概略構成を示すブロック図である。
(Embodiment 2)
Next, a multi-node system, a node, a memory dump processing method using these, and a program for realizing these will be described with reference to FIG. 4 and FIG. First, the configuration of the multi-node system according to the second embodiment will be described with reference to FIG. FIG. 4 is a block diagram showing a schematic configuration of the multi-node system according to Embodiment 2 of the present invention.

図4に示すように、本実施の形態2におけるマルチノードシステム108においては、各ノード105及び106は、図1に示したリモートメモリアクセス機構110を備えていない。本実施の形態2においては、各ノードのCPU150が、リモートメモリアクセス機構110として機能する。   As shown in FIG. 4, in the multi-node system 108 according to the second embodiment, each of the nodes 105 and 106 does not include the remote memory access mechanism 110 shown in FIG. In the second embodiment, the CPU 150 of each node functions as the remote memory access mechanism 110.

また、本実施の形態2においては、ノード105とノード106との間の通信は、実施の形態1と異なり、LAN等のネットワーク107を介して行われている。更に、図1に示したノード間接続装置102は、ネットワーク107に組み込まれており、図2においては、ノード間接続装置の図示は省略されている。なお、これらの点以外については、本実施の形態2におけるマルチノードシステム108は、図1に示した実施の形態1におけるマルチノードシステム104と同様に構成されている。   In the second embodiment, communication between the node 105 and the node 106 is performed via a network 107 such as a LAN, unlike the first embodiment. Further, the inter-node connection device 102 shown in FIG. 1 is incorporated in the network 107, and the inter-node connection device is not shown in FIG. Except for these points, the multi-node system 108 in the second embodiment is configured in the same manner as the multi-node system 104 in the first embodiment shown in FIG.

次に、図4に示したマルチノードシステム108における動作について、ノードに障害が発生している場合を例に挙げて説明する。図5は、本発明の実施の形態2において、障害が発生したノードにおける一連の動作を示すフロー図である。   Next, the operation in the multi-node system 108 shown in FIG. 4 will be described taking as an example a case where a failure has occurred in a node. FIG. 5 is a flowchart showing a series of operations in a node where a failure has occurred in the second embodiment of the present invention.

なお、本実施の形態2におけるメモリダンプ処理方法は、図4に示した本実施の形態2におけるマルチノードシステムを動作させることによって実施される。このため、本実施の形態2におけるメモリダンプ処理方法の説明は、以下のマルチノードシステム108の動作の説明に代える。   The memory dump processing method according to the second embodiment is implemented by operating the multi-node system according to the second embodiment shown in FIG. For this reason, the description of the memory dump processing method according to the second embodiment is replaced with the following description of the operation of the multi-node system 108.

また、以下の説明では、適宜、図4を参照する。更に、ノード105に障害が発生し、ノード106には障害が発生していないとする。そして、ノード105を「障害ノード105」、ノード106を「ダンプ取得ノード106」とする。また、ダンプ取得ノード106の動作は、実施の形態1において図3に示した動作と同様である。   In the following description, FIG. 4 will be referred to as appropriate. Furthermore, it is assumed that a failure has occurred in the node 105 and no failure has occurred in the node 106. The node 105 is assumed to be a “failure node 105” and the node 106 is assumed to be a “dump acquisition node 106”. The operation of the dump acquisition node 106 is the same as the operation shown in FIG. 3 in the first embodiment.

図5に示すように、最初に、障害ノード105の情報取得依頼部145は、相互に通信可能な他のノードの中から、任意のノードをダンプ取得ノードとして選択する(ステップA501)。本実施の形態では、ノード106がダンプ取得ノードとなる。   As shown in FIG. 5, first, the information acquisition request unit 145 of the failed node 105 selects an arbitrary node as a dump acquisition node from other nodes that can communicate with each other (step A501). In this embodiment, the node 106 is a dump acquisition node.

次に、障害ノード105の情報取得依頼部145は、ダンプ取得ノード106に対し、障害ノード105のメモリ120に記憶されている情報の取得依頼(ダンプ取得依頼)を送信する(ステップA502)。そして、ステップA502の終了後、OS104は、カーネルパニック処理を一時停止する(ステップA503)。   Next, the information acquisition request unit 145 of the failure node 105 transmits an acquisition request (dump acquisition request) of information stored in the memory 120 of the failure node 105 to the dump acquisition node 106 (step A502). Then, after the end of step A502, the OS 104 temporarily stops the kernel panic process (step A503).

そして、ステップA503による処理の停止が継続している間、本実施の形態2では、障害ノード105のメモリ120のI/Oは、CPU150が、リモートメモリアクセス機構として機能することによって行われる。よって、ステップA503の実行後、CPU150は、ダンプ取得ノード106からの主記憶転送命令のみ受け付けて転送処理を行う「メモリ転送モード」に移行する(A504)。   In the second embodiment, while the process is stopped in step A503, I / O of the memory 120 of the failed node 105 is performed by the CPU 150 functioning as a remote memory access mechanism. Therefore, after execution of step A503, the CPU 150 shifts to a “memory transfer mode” in which only the main memory transfer command from the dump acquisition node 106 is accepted and transfer processing is performed (A504).

次に、障害ノード105の情報取得依頼部145は、ダンプ取得ノード106から、情報の取得が終了したことの通知(ダンプ取得終了通知)を受信する(ステップA505)。そして、障害ノード105のCPU105は、ステップA505を契機に、メモリ転送モードになる前の「通常モード」に復帰する(ステップA506)。その後、OS140は、ステップA503で停止していたカーネルパニック処理を再開する(A507)。   Next, the information acquisition request unit 145 of the failure node 105 receives a notification (dump acquisition end notification) that the information acquisition is completed from the dump acquisition node 106 (step A505). Then, the CPU 105 of the failed node 105 returns to the “normal mode” before entering the memory transfer mode, triggered by step A505 (step A506). Thereafter, the OS 140 resumes the kernel panic process that was stopped in step A503 (A507).

このように、本実施の形態2におけるマルチノードシステム108及びメモリダンプ処理方法においても、障害の発生していないノードによってメモリダンプ処理が行われる。よって、本実施の形態2を用いた場合も、実施の形態1の場合と同様に、障害の発生したノードの状態に影響されることなく、メモリダンプ処理の実行が可能となる。本実施の形態2によっても、実施の形態1で述べた効果は全て得ることができる。   As described above, also in the multi-node system 108 and the memory dump processing method according to the second embodiment, the memory dump process is performed by a node in which no failure has occurred. Therefore, even when the second embodiment is used, similarly to the first embodiment, the memory dump process can be executed without being affected by the state of the failed node. Also according to the second embodiment, all the effects described in the first embodiment can be obtained.

なお、本実施の形態2においては、障害ノード105とダンプ取得ノード106との間の通信は、LAN等のネットワーク107を介して行われる。よって、情報取得依頼部145、情報取得部142、及び情報出力部143には、TCP/IP等の利用するネットワークに適したプロトコルが実装されているものとする。   In the second embodiment, communication between the failure node 105 and the dump acquisition node 106 is performed via a network 107 such as a LAN. Therefore, it is assumed that the information acquisition request unit 145, the information acquisition unit 142, and the information output unit 143 are implemented with a protocol suitable for the network to be used, such as TCP / IP.

本発明は、相互に通信可能な複数のノードが備えられ、且つ、ノード間で主記憶転送が実行されるマルチノードシステムにおいて、障害が発生したノードのメモリダンプデータを採取する用途に有効である。このため、本発明は、産業上の利用可能性を有している。   INDUSTRIAL APPLICABILITY The present invention is effective for collecting memory dump data of a failed node in a multi-node system having a plurality of nodes capable of communicating with each other and performing main memory transfer between nodes. . Therefore, the present invention has industrial applicability.

100 ノード
101 ノード
102 ノード間接続装置
103 共有ディスク装置
104 マルチノードシステム
105 ノード
106 ノード
107 ネットワーク
108 マルチノードシステム
110 リモートメモリ機構
120 メモリ
121 カーネルデータ
130 二次記憶装置
140 OS
141、145 情報取得依頼部
142 情報取得部
143 情報出力部
100 node 101 node 102 inter-node connection device 103 shared disk device 104 multi-node system 105 node 106 node 107 network 108 multi-node system 110 remote memory mechanism 120 memory 121 kernel data 130 secondary storage device 140 OS
141, 145 Information acquisition request unit 142 Information acquisition unit 143 Information output unit

Claims (12)

相互に通信可能な複数のノードを有するマルチノードシステムであって、
前記複数のノードそれぞれは、当該ノード以外のノードからの転送命令に応じて、自身のメモリに記憶されている情報を取得し、取得した前記情報を出力する、リモートメモリアクセス機構を備え、
前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生したノードが、前記障害の発生したノードのメモリに記憶されている情報の取得を、前記障害の発生していないノードに要求すると、
前記要求を受け、且つ、前記障害の発生していないノードは、前記障害の発生したノードの前記リモートメモリアクセス機構に前記転送命令を出力し、前記障害の発生したノードのメモリから、それに記憶されている情報を取得する、ことを特徴とするマルチノードシステム。
A multi-node system having a plurality of nodes capable of communicating with each other,
Each of the plurality of nodes includes a remote memory access mechanism that acquires information stored in its own memory in response to a transfer command from a node other than the node, and outputs the acquired information.
When a failure occurs in any of the plurality of nodes, the failed node acquires information stored in the memory of the failed node to a node in which the failure has not occurred. When requested,
The node that has received the request and has not failed outputs the transfer command to the remote memory access mechanism of the failed node and stores it in the memory of the failed node. A multi-node system characterized in that information is obtained.
前記複数のノードそれぞれのメモリが、前記複数のノードによって共有されている、請求項1に記載のマルチノードシステム。   The multi-node system according to claim 1, wherein a memory of each of the plurality of nodes is shared by the plurality of nodes. 前記複数のノードに接続され、且つ、前記複数のノードそれぞれによって共有される記憶装置を更に備え、
前記障害の発生していないノードは、前記障害の発生したノードのメモリから、それに記憶されている情報を取得すると、取得した前記情報を前記記憶装置に格納させる、請求項1に記載のマルチノードシステム。
A storage device connected to the plurality of nodes and shared by each of the plurality of nodes;
2. The multi-node according to claim 1, wherein when the node in which the failure has not occurred acquires information stored in the memory of the node in which the failure has occurred, the node stores the acquired information in the storage device. system.
前記情報を取得したノードが、前記情報の取得の終了後に、前記障害の発生したノードに、前記情報の取得の終了を通知する、請求項に記載のマルチノードシステム。 The information acquired nodes is, after completion of acquisition of the information, the generated node of the fault, notifies the end of acquisition of the information, the multi-node system according to claim 1. 前記障害の発生したノードが、前記障害の発生したノードのメモリに記憶されている情報の取得を要求した後に、当該ノードにおける処理を中止し、そして、前記情報を取得したノードからの前記情報の取得の終了の通知を受けた後に、前記処理を再開する、請求項に記載のマルチノードシステム。 After the failed node requests acquisition of information stored in the memory of the failed node, the processing in the node is stopped, and the information from the node that acquired the information is The multi-node system according to claim 4 , wherein the processing is resumed after receiving an acquisition end notification. マルチノードシステムを構成する複数のノードの一つとして機能するノードであって、
メモリと、
当該ノード以外のノードからの転送命令に応じて、自身のメモリに記憶されている情報を取得し、取得した前記情報を出力する、リモートメモリアクセス機構と、
当該ノードに障害が発生した場合に、当該ノード以外のノードに、当該ノードのメモリに記憶されている情報の取得を依頼する情報取得依頼部と、
当該ノード以外のノードから、そのメモリに記憶されている情報の取得の依頼を受けた場合に、当該ノード以外のノードの前記リモートメモリアクセス機構に、前記転送命令を出力して当該ノード以外のノードのメモリに記憶されている情報を取得する情報取得部とを、備えていることを特徴とするノード。
A node functioning as one of a plurality of nodes constituting a multi-node system,
Memory,
Depending on the transfer command from the node other than the node, it obtains the information stored in its memory, and outputs the acquired information, the remote memory access mechanism,
If on the node fails, the node other than the node, the information acquisition request unit for requesting the acquisition of information stored in the memory of the node,
From node other than the node, when receiving a request for acquisition of information stored in its memory, the remote memory access mechanism of the nodes other than the node, and outputs the transfer command, the node A node, comprising: an information acquisition unit that acquires information stored in a memory of a node other than the node.
相互に通信可能な複数のノードを有し、且つ、前記複数のノードそれぞれは、当該ノード以外のノードからの転送命令に応じて、自身のメモリに記憶されている情報を取得し、取得した前記情報を出力する、リモートメモリアクセス機構を備えていマルチノードシステムを用いてメモリダンプを行うための方法であって、
(a)前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生したノードによって、前記障害の発生していないノードに、前記障害の発生したノードのメモリに記憶されている情報の取得を要求するステップと、
(b)前記(a)のステップによる要求を受け、且つ、前記障害の発生していないノードによって、前記障害の発生したノードの前記リモートメモリアクセス機構に前記転送命令を出力し、前記障害の発生したノードの前記メモリに記憶されている情報を取得するステップとを有する、
ことを特徴とするメモリダンプ処理方法。
Have a mutually communicable plurality of nodes, and wherein each of the plurality of nodes, in accordance with the transfer command from a node other than the node, obtains the information stored in its memory, and obtains the and outputs the information, that provides a remote memory access mechanism, a method for performing a memory dump using a multi-node system,
(A) When a failure occurs in any of the plurality of nodes, the information stored in the memory of the failed node by the failed node in the non-failed node Requesting the acquisition of
(B) The transfer command is output to the remote memory access mechanism of the failed node by the node that has received the request in the step (a) and the failure has not occurred, and the occurrence of the failure Obtaining information stored in the memory of the node
A memory dump processing method.
(c)前記(b)のステップの終了後に、前記情報を取得したノードによって、前記障害の発生したノードに、前記情報の取得の終了を通知するステップを更に有する請求項に記載のメモリダンプ処理方法。 The memory dump according to claim 7 , further comprising: (c) notifying the end of the acquisition of the information to the failed node by the node that acquired the information after the end of the step (b). Processing method. (d)前記(a)のステップの終了後に、前記障害の発生したノードにおける処理を中止させるステップと、
(e)前記(c)のステップの終了後に、前記(d)のステップで中止されていた処理を再開させるステップとを、更に有する、請求項に記載のメモリダンプ処理方法。
(D) after completion of the step (a), stopping the processing in the failed node;
The memory dump processing method according to claim 8 , further comprising: (e) resuming the processing that was stopped in the step (d) after the step (c) is completed.
相互に通信可能な複数のコンピュータを有し、且つ、前記複数のコンピュータそれぞれは、当該コンピュータ以外のコンピュータからの転送命令に応じて、自身のメモリに記憶されている情報を取得し、取得した前記情報を出力する、リモートメモリアクセス機構を備えていマルチノードシステムにおけるメモリダンプを前記コンピュータによって行うためのプログラムであって、
前記コンピュータに、
前記コンピュータに障害が発生した場合は、(a)前記コンピュータのメモリに記憶されている情報の取得を、前記障害の発生していないコンピュータに要求する、ステップを実行させ、
前記コンピュータに障害が発生していない場合は、(b)前記障害が発生したコンピュータの前記リモートメモリアクセス機構に前記転送命令を出力し、前記障害の発生したノードの前記メモリに記憶されている情報を取得する、ステップを実行させる、ことを特徴とするプログラム。
Have a plurality of can communicate with each other computer, and, each of the plurality of computers, according to the transfer instruction from the computer other than the computer, acquires the information stored in its memory, and obtains the and outputs the information, that provides a remote memory access mechanism, a program for performing a memory dump in a multi-node system by the computer,
In the computer,
If a failure occurs in the computer, (a) request the acquisition of information stored in the memory of the computer from the computer in which the failure does not occur,
If no failure has occurred in the computer, (b) information stored in the memory of the failed node is output to the remote memory access mechanism of the computer in which the failure has occurred. A program characterized by having a step executed.
前記(b)のステップが実行された場合に、
(c)前記(b)のステップの終了後に、前記障害が発生したコンピュータに前記情報の取得の終了を通知する、ステップを、前記コンピュータに更に実行させる、請求項10に記載のプログラム。
When the step (b) is executed,
The program according to claim 10 , further comprising: causing the computer to further execute a step of notifying the computer in which the failure has occurred after completion of the step of (c) (b).
前記(a)のステップが実行された場合に、
前記(a)のステップの終了後に、前記コンピュータにおける処理を中止させ、前記コンピュータ以外のコンピュータによる前記(c)のステップの実行によって、前記情報の取得の終了が通知されると、中止していた処理を再開させる、ステップを、前記コンピュータに更に実行させる、請求項11に記載のプログラム。

When step (a) is executed,
After the completion of the step (a), the processing in the computer was stopped, and when the completion of the acquisition of the information was notified by the execution of the step (c) by a computer other than the computer, the processing was stopped The program according to claim 11 , further causing the computer to execute a step of resuming processing.

JP2009017529A 2009-01-29 2009-01-29 Multi-node system, node, memory dump processing method, and program Expired - Fee Related JP5435205B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009017529A JP5435205B2 (en) 2009-01-29 2009-01-29 Multi-node system, node, memory dump processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009017529A JP5435205B2 (en) 2009-01-29 2009-01-29 Multi-node system, node, memory dump processing method, and program

Publications (2)

Publication Number Publication Date
JP2010176345A JP2010176345A (en) 2010-08-12
JP5435205B2 true JP5435205B2 (en) 2014-03-05

Family

ID=42707268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009017529A Expired - Fee Related JP5435205B2 (en) 2009-01-29 2009-01-29 Multi-node system, node, memory dump processing method, and program

Country Status (1)

Country Link
JP (1) JP5435205B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5929465B2 (en) * 2012-04-20 2016-06-08 富士通株式会社 Multiprocessor system
JP6287691B2 (en) * 2014-08-28 2018-03-07 富士通株式会社 Information processing apparatus, information processing method, and information processing program
JP6477266B2 (en) 2015-06-03 2019-03-06 富士通株式会社 Dump management apparatus, dump management program, and dump management method
JP6586666B2 (en) 2016-02-23 2019-10-09 富士通株式会社 Parallel processing device, node information collection method, and node information collection program

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59180760A (en) * 1983-03-31 1984-10-13 Fujitsu Ltd Remote dump system
JPH01124037A (en) * 1987-11-09 1989-05-16 Nec Corp Memory dumping system
JPH03231338A (en) * 1990-02-06 1991-10-15 Hokuriku Nippon Denki Software Kk Control system for memory dump area
JPH0916441A (en) * 1995-06-30 1997-01-17 Nec Eng Ltd Memory dumping system
JP2001034508A (en) * 1999-07-22 2001-02-09 Hitachi Ltd Memory dump collection method and its execution device, and recording medium recording memory dump collection program
JP2003030011A (en) * 2001-07-19 2003-01-31 Nec Soft Ltd System and method for sampling memory dump
JP2007334668A (en) * 2006-06-15 2007-12-27 Nec System Technologies Ltd Memory dumping method, cluster system, node constituting the system, and program

Also Published As

Publication number Publication date
JP2010176345A (en) 2010-08-12

Similar Documents

Publication Publication Date Title
US9052833B2 (en) Protection of former primary volumes in a synchronous replication relationship
WO2018107772A1 (en) Method, device and apparatus for processing write request
US11330071B2 (en) Inter-process communication fault detection and recovery system
US20070299943A1 (en) Ignoring redundant symptoms in modular self-healing systems
US8533525B2 (en) Data management apparatus, monitoring apparatus, replica apparatus, cluster system, control method and computer-readable medium
US10819641B2 (en) Highly available servers
JP5948933B2 (en) Job continuation management apparatus, job continuation management method, and job continuation management program
US11157373B2 (en) Prioritized transfer of failure event log data
JP2007279890A (en) Backup system and method
JP2007226400A (en) Computer management method, computer management program, stand-by server for managing configuration of execution server, and computer system
US8266301B2 (en) Deployment of asynchronous agentless agent functionality in clustered environments
US20150121144A1 (en) Synchronized debug information generation
JP5435205B2 (en) Multi-node system, node, memory dump processing method, and program
WO2015033433A1 (en) Storage device, and fault location identifying method
TW201348936A (en) Reset of processing core in multi-core processing system
WO2013190694A1 (en) Computer recovery method, computer system, and storage medium
KR101024249B1 (en) Real-time data replication system
JP2015069384A (en) Information processing system, control method for information processing system, and control program for information processor
WO2024083259A1 (en) Master/backup database cluster and master selection method therefor, computing device, and storage medium
US9720796B2 (en) Information processing apparatus, information processing system, control method for information processing system, and medium
US8036105B2 (en) Monitoring a problem condition in a communications system
JP2006285384A (en) Processor trouble processing method, management processor, and processor trouble processing method
US8180846B1 (en) Method and apparatus for obtaining agent status in a network management application
US20140297724A1 (en) Network element monitoring system and server
JP6224985B2 (en) Notification device and notification method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131126

R150 Certificate of patent or registration of utility model

Ref document number: 5435205

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees