JP2010176345A - マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム - Google Patents

マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム Download PDF

Info

Publication number
JP2010176345A
JP2010176345A JP2009017529A JP2009017529A JP2010176345A JP 2010176345 A JP2010176345 A JP 2010176345A JP 2009017529 A JP2009017529 A JP 2009017529A JP 2009017529 A JP2009017529 A JP 2009017529A JP 2010176345 A JP2010176345 A JP 2010176345A
Authority
JP
Japan
Prior art keywords
node
memory
failure
information
dump
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009017529A
Other languages
English (en)
Other versions
JP5435205B2 (ja
Inventor
Aoi Kawahara
葵 川原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009017529A priority Critical patent/JP5435205B2/ja
Publication of JP2010176345A publication Critical patent/JP2010176345A/ja
Application granted granted Critical
Publication of JP5435205B2 publication Critical patent/JP5435205B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】障害の発生したノードの状態に影響されることなく、メモリダンプ処理を実行可能なマルチノードシステム、ノード、メモリダンプ処理方法、及びプログラムを提供する。
【解決手段】相互に通信可能な複数のノード(100及び101)を有するマルチノードシステム104であって、いずれかのノードに障害が発生した場合に、障害の発生していないノードは、障害の発生したノードのメモリ120から、それに記憶されている情報を取得する。各ノードは、当該ノード以外のノードのメモリ120に記憶されている情報を取得可能なリモートメモリアクセス機構を備えることができる。
【選択図】図1

Description

本発明は、ノードに障害が発生した時にメモリダンプを実行するマルチノードシステム、これに用いられるノード、これらを用いたメモリダンプ処理方法、及びこれらを実現するためのプログラムに関する。
一般に、コンピュータシステムのOS(Operating System)は、ハードウェア又はソフトウェアの異常により、正常な処理を続けられなくなった場合、カーネルパニック処理を実行する。カーネルパニック処理としては、コンピュータシステムにおける処理の単なる停止や、障害発生時のメインメモリの内容を内蔵ディスク等に保存するメモリダンプ処理、コンピュータシステムの再起動などが挙げられる。このうち、障害の原因究明の点からは、メモリダンプを採取するメモリダンプ処理(例えば、特許文献1〜3参照)が有効である。
例えば、特許文献1は、分散メモリ型計算機におけるメモリダンプ処理を開示している。特許文献1に開示されているメモリダンプ処理では、障害にあったプロセッサ(ノード)からシステム管理プロセッサ(ノード)にメモリ内容の採取が依頼され、採取されたメモリ内容はシステム管理プロセッサ(ノード)に保存される。
また、特許文献2も、特許文献1と同様に、分散メモリ型計算機におけるメモリダンプ処理を開示している。但し、特許文献2に開示された処理では、特許文献1に開示された処理と異なり、障害が発生したノードは、それと記憶装置とのアクセス経路の確保を実行する。このため、特許文献2によれば、メモリダンプの確実性が図られる。
特許文献3は、クライアント・サーバシステムにおけるメモリダンプ処理を開示している。特許文献3に開示された処理では、ホストコンピュータ(オペレータ用端末)から、障害の起きた端末に対して、メモリダンプが実行される。具体的には、ホストコンピュータは、メモリ内容を採取するメモリダンププログラムを、障害の発生した端末に転送し、このプログラムの実行によりメモリダンプを行わせる。そして、ホストコンピュータは、障害の発生した端末を再起動させ、その後、障害の発生した端末に、それが採取したメモリ内容の転送を行わせる。
特開平11−306051号公報 特開2007−334668号公報 特開平7−146807号公報
ところで、特許文献1または特許文献2に開示されたメモリダンプ処理では、障害の発生したノードがメモリ転送処理を実行する。このため、メモリ転送処理に必要なデータが障害により破壊されていた場合、カーネルのダブルパニックが発生する可能性がある。また、ノードに固有の機能によってメモリ内容の採取が行われるため、ノード自体が障害で使用できない間は、メモリダンプができず、メモリダンプに失敗する可能性もある。
また、特許文献3に開示されたメモリダンプ処理は、障害の発生した端末において、プログラム実行等の通常のカーネル処理が正常に行える状態でなければ行うことができず、カーネルパニック処理の様なクリティカルな場面には適用できないという問題がある。
更に、特許文献3に開示されたメモリダンプ処理では、上述したように、障害が発生した端末を再起動する必要がある。このため、障害が発生した端末が再起動に時間が掛かるコンピュータである場合や、障害の発生したハードウェアを交換する必要がある場合等において、メモリダンプの解析をすぐに行えないという問題もある。更に、このメモリダンプの解析を直ぐに行えないという問題は、再現性の低い障害や障害解析に急を要する場合に、ダンプされたメモリの内容の消失を招く可能性を有している。
本発明の目的は、上記問題を解消し、障害の発生したノードの状態に影響されることなく、メモリダンプ処理を実行可能なマルチノードシステム、ノード、メモリダンプ処理方法、及びプログラムを提供することにある。
上記目的を達成するため、本発明におけるマルチノードシステムは、相互に通信可能な複数のノードを有するマルチノードシステムであって、
前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生していないノードは、前記障害の発生したノードのメモリから、それに記憶されている情報を取得する、ことを特徴とする。
また、上記目的を達成するため、本発明におけるノードは、マルチノードシステムを構成する複数のノードの一つとして機能するノードであって、
メモリと、
当該ノード以外の別のノードのメモリに記憶されている情報を取得可能なリモートメモリアクセス機構と、
当該ノードに障害が発生した場合に、当該ノード以外の別のノードに、当該ノードのメモリに記憶されている情報の取得を依頼する情報取得依頼部と、
当該ノード以外の別のノードから、そのメモリに記憶されている情報の取得の依頼を受けた場合に、前記リモートメモリアクセス機構によって、前記別のノードのメモリに記憶されている情報を取得する情報取得部とを、備えていることを特徴とする。
また、上記目的を達成するため、本発明におけるメモリダンプ処理方法は、相互に通信可能な複数のノードを有するマルチノードシステムを用いてメモリダンプを行うための方法であって、
(a)前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生したノードによって、前記障害の発生していないノードに、前記障害の発生したノードのメモリに記憶されている情報の取得を要求するステップと、
(b)前記(a)のステップによる要求を受け、且つ、前記障害の発生していないノードによって、前記障害の発生したノードの前記メモリに記憶されている情報を取得するステップとを有する、ことを特徴とする。
更に、上記目的を達成するため、本発明におけるプログラムは、相互に通信可能な複数のコンピュータを有するマルチノードシステムにおけるメモリダンプを前記コンピュータによって行うためのプログラムであって、
前記コンピュータに、
前記コンピュータに障害が発生した場合は、(a)前記コンピュータのメモリに記憶されている情報の取得を、前記障害の発生していないコンピュータに要求する、ステップを実行させ、
前記コンピュータに障害が発生していない場合は、(b)前記障害が発生したコンピュータの前記メモリに記憶されている情報を取得する、ステップを実行させる、ことを特徴とする。
以上の特徴により、本発明におけるマルチノードシステム、ノード、メモリダンプ処理方法、及びプログラムによれば、障害の発生したノードの状態に影響されることなく、メモリダンプ処理を実行することができる。
図1は、本発明の実施の形態1におけるマルチノードシステムの概略構成を示すブロック図である。 図2は、実施の形態1において、障害が発生したノードにおける一連の動作を示すフロー図である。 図3は、実施の形態1において、障害が発生していないノードにおける一連の動作を示すフロー図である。 図4は、本発明の実施の形態2におけるマルチノードシステムの概略構成を示すブロック図である。 図5は、本発明の実施の形態2において、障害が発生したノードにおける一連の動作を示すフロー図である。
(実施の形態1)
以下、本発明の実施の形態1におけるマルチノードシステム、ノード、これらを用いたメモリダンプ処理方法、及びこれらを実現するためのプログラムについて、図1〜図3を参照しながら説明する。最初に、本実施の形態1におけるマルチノードシステムの構成について図1を用いて説明する。図1は、本発明の実施の形態1におけるマルチノードシステムの概略構成を示すブロック図である。
図1に示すように、本実施の形態1におけるマルチノードシステム104は、相互に通信可能なノード100及び101を有している。図1には、ノード100及びノード101のみが示されているが、実際は、マルチノードシステム104は、更に多くのノードを有していても良い。
また、マルチノードシステム104において、ノード100及びノード101のいずれかに障害が発生した場合は、障害の発生していないノードは、障害の発生したノードのメモリから、それに記憶されている情報を取得する、つまり、メモリダンプ処理を実行する。ここで、ノード100及び101の構成について以下に説明する。
図1に示すように、本実施の形態1において、ノード100及び101は、同一の構成を有するコンピュータであり、両者は、リモートメモリアクセス機構110と、メモリ120と、二次記憶装置130と、CPU(central processing unit)150とを備えている。
リモートメモリアクセス機構110は、それを備えるノード(自ノード)以外の別のノードのメモリに記憶されている情報を取得可能に構成されている。本実施の形態1では、リモートメモリアクセス機構110は、DMA(Direct Memory Access)を備え、自ノードのCPU150を介することなく、自ノードのメモリの入出力(I/O)を実行できる。
また、リモートメモリアクセス機構110は、自ノード以外の別のノードのリモートメモリアクセス機構110に対して、その別のノードのメモリに記憶されている情報の転送を要求できる。このノード間でやりとりされる、メモリのI/Oを行う命令は、以下、「ノード間主記憶転送命令」とする。そして、ノード間主記憶転送命令を受け取ったリモートメモリアクセス機構110は、メモリ120に情報を出力させ、出力された情報を、ノード間主記憶転送命令の出力元のリモートメモリアクセス機構110に送信する。
各ノードにおいて、メモリ120は、OS140のカーネルデータ121を格納し、リモートメモリアクセス機構110と二次記憶装置130とに接続されている。OS140は、CPU150を含むハードウェア資源によって実行されるプログラムであり、情報取得依頼部141と、情報取得部142と、情報出力部143とを有している。また、メモリ120に格納されているカーネルデータ121が、本実施の形態1においてメモリダンプ処理(情報取得処理)の対象となる。
このうち、情報取得依頼部141は、自ノードに障害が発生した場合に、自ノード以外の別のノードに、自ノードのメモリ120に記憶されている情報(カーネルデータ121)の取得、即ち、メモリダンプデータの取得を依頼する。
本実施の形態1では、ノードに障害が発生すると、先ず、障害が発生したノードのOS140は、カーネルパニック処理を実行する。次いで、メモリ120内のカーネルデータ121を取得(メモリダンプを実行)するため、情報取得依頼部141は、任意の別のノードに情報の取得を依頼する。また、障害が発生したノードのOS140は、情報の取得を依頼した後、カーネルパニック処理を一時停止する。そして、別のノードでの情報の取得が終了すると、OS140は、カーネルパニック処理を再開する。
また、情報取得部142は、自ノード以外の別のノードから、そのメモリに記憶されている情報の取得の依頼を受けた場合に、リモートメモリアクセス機構110によって、別のノードのメモリに記憶されている情報(カーネルデータ121)を取得する。具体的には、情報取得部142は、自ノードのリモートメモリアクセス機構110から、別のノードのリモートメモリアクセス機構110に対して、ノード間主記憶転送命令を送信し、メモリダンプを実行する。そして、情報取得部142は、取得したメモリダンプデータ(カーネルデータ121)を、自ノードのメモリ120に格納する。
情報出力部143は、自ノードのメモリ120に格納されている情報を、自ノード内に備えられた二次記憶装置130や、ノード100及び101に接続された共有ディスク装置103に出力し、それらに格納させることができる。即ち、情報出力部143は、他のノードから取得し、自ノードのメモリ120に格納したメモリダンプデータを、二次記憶装置130又は共有ディスク装置103に出力する。
また、本実施の形態1では、情報出力部143は、ノード間での情報の転送処理とは非同期に、メモリダンプデータを、二次記憶装置130又は共有ディスク装置103に出力することもできる。共有ディスク装置103は、本実施の形態1においては、ノード100及び101によって共有されており、例えば、NFS(Network File System)等の分散ファイルシステムを構成している。
また、情報出力部143による出力が行われるノードは、障害が発生していない正常に動作しているノードである。よって、二次記憶装置130は、各ノードに内蔵された装置に限定されず、二次記憶装置130としても、複数のノード間で共有され、且つ、NFSなどの分散ファイルシステムを構成する装置を用いることができる。
本実施の形態1では、ノード100とノード101とは、ノード間を接続するノード間接続装置102を介して接続され、これにより、相互に通信可能となっている。具体的には、ノード間接続装置102はルーター等であり、専用線によってノード100及び101に接続されている。ノード間接続装置102は、ノード間主記憶転送命令で指定されるノードのリモートメモリアクセス機構110に、ノード間主記憶転送命令を送信する。また、ノード間接続装置102は、情報の転送が要求されたノードのリモートメモリアクセス機構110が出力した情報を、要求元のノードに転送する。
また、本実施の形態1においては、マルチノードシステム104は、複数のノードそれぞれのメモリが、複数のノードによって共有されている態様であっても良い。具体的には、マルチノードシステム104は、例えば、ccNUMA(cache coherency Non-Uniform Memory Access)と呼ばれるシステムを備えることができる。このシステムでは、ローカルに配置されているメモリへのI/Oと同様にして、リモートに配置されている他のノードのメモリのI/Oが可能となる。この場合、ノード100及び101は、リモートメモリアクセス機構110を備えていなくても良い。
次に、図1に示したマルチノードシステム104における動作について、一つのノードに着目し、それに障害が発生している場合と、障害が発生していない場合とに分けて、図2及び図3を用いて説明する。図2は、実施の形態1において、障害が発生したノードにおける一連の動作を示すフロー図である。図3は、実施の形態1において、障害が発生していないノードにおける一連の動作を示すフロー図である。
なお、本実施の形態1におけるメモリダンプ処理方法は、図1に示した本実施の形態1におけるマルチノードシステムを動作させることによって実施される。このため、本実施の形態1におけるメモリダンプ処理方法の説明は、以下のマルチノードシステム104の動作の説明に代える。
また、以下の説明では、適宜、図1を参照する。更に、ノード100に障害が発生し、ノード101には障害が発生していないとする。そして、ノード100を「障害ノード100」、ノード101を「ダンプ取得ノード101」とする。また、障害ノード100とダンプ取得ノード101とのノード間主記憶転送は、高速な専用線で接続されたノード間接続装置102を介して行われる。
先ず、図2を用いて、障害ノード100に着目して説明を行う。また、図2においては、一般的な場合と同様に、ノード100に、動作継続が出来ないような致命的な障害が起きた場合は、ノード100のOS104によりカーネルパニック処理が実行されるとする。
図2に示すように、最初に、障害ノード100の情報取得依頼部141は、相互に通信可能な他のノードの中から、任意のノードをダンプ取得ノードとして選択する(ステップA201)。本実施の形態では、ノード101がダンプ取得ノードとなる。
次に、障害ノード100の情報取得依頼部141は、ダンプ取得ノード101に対し、障害ノード100のメモリ120に記憶されている情報の取得依頼(ダンプ取得依頼)を送信する(ステップA202)。そして、ステップA202の終了後、OS104は、カーネルパニック処理を一時停止する(ステップA203)。
そして、ステップA203による処理の停止が継続している間、後述するダンプ取得ノード101からノード間主記憶転送命令が送信され、障害ノード100のメモリ120のI/Oは、障害ノード100のリモートメモリアクセス機構110が行う。このため、障害ノード100のCPU150が処理を行うことはない。
次に、障害ノード100の情報取得依頼部141は、ダンプ取得ノード101から、情報の取得が終了したことの通知(ダンプ取得終了通知)を受信する(ステップA204)。そして、障害ノード100のOS104は、ステップA204を契機に、ステップA203で停止していたカーネルパニック処理を再開する(A205)。
次に、図3を用いて、ダンプ取得ノード101に着目して説明を行う。図3に示す処理は、障害ノード100がカーネルパニック処理を開始してから終了するまでの間に実行される。
図3に示すように、先ず、ダンプ取得ノード101の情報取得部142は、ダンプ取得依頼の受信を契機にして、リモートメモリアクセス機構110によって、障害ノード100のメモリ120に記憶されている情報を取得する(ステップA301)。このとき取得される情報は、障害ノード100のメモリに記憶されているカーネルデータ121(メモリダンプデータ)である。また、障害ノード(100)にノード間主記憶転送を要求する際に必要なアドレスは、常に一定となる。
次に、ダンプ取得ノード101の情報取得部142は、取得済みのメモリダンプデータのアドレスと、取得の対象となっているデータのアドレスとを比較し、取得すべきメモリダンプデータが未だ存在しているかどうかを判定する(ステップA302)。
ステップA302の判定の結果、取得すべきメモリダンプデータが未だ存在している場合は、情報取得部142は、ノード間主記憶転送命令を送信する(ステップA303)。ステップA303では、ノード間主記憶転送命令の宛先は、障害ノード100に設定される。また、転送開始アドレスは、次のステップA301で受信予定のメモリダンプデータのメモリアドレスに設定される。
一方、ステップA302の判定の結果、取得すべきメモリダンプデータが存在していない場合は、即ち、取得すべきメモリ120の情報が全て取得されている場合は、情報取得部142は、障害ノード100に、ダンプ取得終了通知を送信する(ステップA304)。ステップA304の終了後、情報出力部143は、図3に示したダンプ取得処理とは非同期に、二次記憶装置130や、共有ディスク装置103に、取得したダンプデータを出力する。そして、ダンプ取得ノード101における処理は終了する。
このように、本実施の形態1におけるマルチノードシステム104及びメモリダンプ処理方法では、障害の発生していないノードによってメモリダンプ処理が行われる。つまり、本実施の形態1によれば、障害の発生したノードの状態に影響されることなく、メモリダンプ処理の実行が可能となる。
具体的には、本実施の形態1では、正常に動作しているノード(ダンプ取得ノード101)が、ノード間主記憶転送命令により、障害ノード100のメモリ内容(ダンプデータ)を取得し、障害ノード100においてはDMAにより直接メモリ120の内容が転送可能となっている。よって、障害が発生したノード(障害ノード100)のOS140は処理を行う必要が無いため、障害ノード100のOS140が障害によって動作できない状態でも、メモリダンプ処理の実行が可能となる。更に、障害ノード100において、OS140の再起動が必要な場合であっても、再起動に影響されることなく、ダンプデータの参照が可能となる。
また、本実施の形態1では、障害の発生していない正常なノード(ダンプ取得ノード101)がメモリダンプデータの取得を行うため、障害の発生直後に自動的にメモリダンプデータの取得のための処理が開始可能である。また、このため、迅速なダンプ解析が可能となる。特に、HPC(High Performance Computing)の分野では、複数のノードを接続して運用するマルチノードシステムが主流であり、複数のノードに障害が発生した場合は、オペレータが複数のノードのメモリダンプを個別に採取する必要がある。多数のノードのメモリダンプ採取作業はオペレータにとって煩雑であり、採取時の誤操作によりメモリダンプを失う可能性もあるが、本実施の形態1によれば、このような問題を解決できる。
更に、本実施の形態1では、メモリダンプデータの保存先が、正常に動作しているノード(ダンプ取得ノード101)であるため、メモリダンプ処理の終了後、直ぐにメモリダンプデータの参照が可能となる。また、本実施の形態1においては、メモリダンプデータは、分散ファイルシステム等の共有ディスク装置に保存して一元管理することが可能である。このため、データ管理の容易化と、1つのノードに必要な二次記憶装置130の容量の削減化とを図ることができる。
また、従来から、UNIX(登録商標)系OSを用いるマルチノードシステムでは、メモリダンプを取得するため、「diskdump」、「netdump」、「kdump」といったプログラムが利用される。
このうち、「diskdump」では、障害が発生したノードの内蔵ディスクにメモリダンプデータが保存され、更に、ダンプ取得に対応したディスクドライバを別途用意する必要がある。また、「netdump」は、クライアント・サーバ方式でメモリダンプデータを取得するシステムで利用され、サーバの内蔵ディスクに、メモリダンプデータが保存される。よって、「netdump」では、専用のネットワークドライバが必要となる。
これらに対して、本実施の形態1によれば、特別なディスクドライバや専用のネットワークドライバは必要ない。UNIX系OSを用いるマルチノードシステムにおいて、「diskdump」や「netdump」に代えて、本実施の形態1を用いれば、システムのコストの低減化が可能となる。
また、「kdump」では、メモリダンプデータの取得処理時に起動させるカーネルを予めメインメモリに常駐させておく必要がある。このため、メモリの消費量が大きくなるので、実装メモリを出来るだけユーザに利用させるポリシで運用するHPC分野等で利用することは困難である。これに対して、本実施の形態1によれば、メモリダンプデータを取得するためのプログラムをメインメモリに常駐させる必要はなく、本実施の形態1は、HPC分野にも有用である。
また、本実施の形態1におけるプログラムは、ノードを構成しているコンピュータに、図2に示すステップA201〜A205、及び図3に示すステップA301〜A304を実行させるプログラムであれば良い。本実施の形態1におけるプログラムを実行することによって、本実施の形態1におけるマルチノードシステム及びメモリダンプ処理方法を実現できる。この場合、ノードのCPUは、情報取得依頼部、情報取得部、情報出力部として機能し、処理を行なう。
(実施の形態2)
次に、本発明の実施の形態2におけるマルチノードシステム、ノード、これらを用いたメモリダンプ処理方法、及びこれらを実現するためのプログラムについて、図4及び図5を参照しながら説明する。最初に、本実施の形態2におけるマルチノードシステムの構成について図4を用いて説明する。図4は、本発明の実施の形態2におけるマルチノードシステムの概略構成を示すブロック図である。
図4に示すように、本実施の形態2におけるマルチノードシステム108においては、各ノード105及び106は、図1に示したリモートメモリアクセス機構110を備えていない。本実施の形態2においては、各ノードのCPU150が、リモートメモリアクセス機構110として機能する。
また、本実施の形態2においては、ノード105とノード106との間の通信は、実施の形態1と異なり、LAN等のネットワーク107を介して行われている。更に、図1に示したノード間接続装置102は、ネットワーク107に組み込まれており、図2においては、ノード間接続装置の図示は省略されている。なお、これらの点以外については、本実施の形態2におけるマルチノードシステム108は、図1に示した実施の形態1におけるマルチノードシステム104と同様に構成されている。
次に、図4に示したマルチノードシステム108における動作について、ノードに障害が発生している場合を例に挙げて説明する。図5は、本発明の実施の形態2において、障害が発生したノードにおける一連の動作を示すフロー図である。
なお、本実施の形態2におけるメモリダンプ処理方法は、図4に示した本実施の形態2におけるマルチノードシステムを動作させることによって実施される。このため、本実施の形態2におけるメモリダンプ処理方法の説明は、以下のマルチノードシステム108の動作の説明に代える。
また、以下の説明では、適宜、図4を参照する。更に、ノード105に障害が発生し、ノード106には障害が発生していないとする。そして、ノード105を「障害ノード105」、ノード106を「ダンプ取得ノード106」とする。また、ダンプ取得ノード106の動作は、実施の形態1において図3に示した動作と同様である。
図5に示すように、最初に、障害ノード105の情報取得依頼部145は、相互に通信可能な他のノードの中から、任意のノードをダンプ取得ノードとして選択する(ステップA501)。本実施の形態では、ノード106がダンプ取得ノードとなる。
次に、障害ノード105の情報取得依頼部145は、ダンプ取得ノード106に対し、障害ノード105のメモリ120に記憶されている情報の取得依頼(ダンプ取得依頼)を送信する(ステップA502)。そして、ステップA502の終了後、OS104は、カーネルパニック処理を一時停止する(ステップA503)。
そして、ステップA503による処理の停止が継続している間、本実施の形態2では、障害ノード105のメモリ120のI/Oは、CPU150が、リモートメモリアクセス機構として機能することによって行われる。よって、ステップA503の実行後、CPU150は、ダンプ取得ノード106からの主記憶転送命令のみ受け付けて転送処理を行う「メモリ転送モード」に移行する(A504)。
次に、障害ノード105の情報取得依頼部145は、ダンプ取得ノード106から、情報の取得が終了したことの通知(ダンプ取得終了通知)を受信する(ステップA505)。そして、障害ノード105のCPU105は、ステップA505を契機に、メモリ転送モードになる前の「通常モード」に復帰する(ステップA506)。その後、OS140は、ステップA503で停止していたカーネルパニック処理を再開する(A507)。
このように、本実施の形態2におけるマルチノードシステム108及びメモリダンプ処理方法においても、障害の発生していないノードによってメモリダンプ処理が行われる。よって、本実施の形態2を用いた場合も、実施の形態1の場合と同様に、障害の発生したノードの状態に影響されることなく、メモリダンプ処理の実行が可能となる。本実施の形態2によっても、実施の形態1で述べた効果は全て得ることができる。
なお、本実施の形態2においては、障害ノード105とダンプ取得ノード106との間の通信は、LAN等のネットワーク107を介して行われる。よって、情報取得依頼部145、情報取得部142、及び情報出力部143には、TCP/IP等の利用するネットワークに適したプロトコルが実装されているものとする。
本発明は、相互に通信可能な複数のノードが備えられ、且つ、ノード間で主記憶転送が実行されるマルチノードシステムにおいて、障害が発生したノードのメモリダンプデータを採取する用途に有効である。このため、本発明は、産業上の利用可能性を有している。
100 ノード
101 ノード
102 ノード間接続装置
103 共有ディスク装置
104 マルチノードシステム
105 ノード
106 ノード
107 ネットワーク
108 マルチノードシステム
110 リモートメモリ機構
120 メモリ
121 カーネルデータ
130 二次記憶装置
140 OS
141、145 情報取得依頼部
142 情報取得部
143 情報出力部

Claims (14)

  1. 相互に通信可能な複数のノードを有するマルチノードシステムであって、
    前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生していないノードは、前記障害の発生したノードのメモリから、それに記憶されている情報を取得する、ことを特徴とするマルチノードシステム。
  2. 前記複数のノードそれぞれが、当該ノード以外のノードのメモリに記憶されている情報を取得可能なリモートメモリアクセス機構を備えている、請求項1に記載のマルチノードシステム。
  3. 前記複数のノードそれぞれのメモリが、前記複数のノードによって共有されている、請求項1に記載のマルチノードシステム。
  4. 前記複数のノードに接続され、且つ、前記複数のノードそれぞれによって共有される記憶装置を更に備え、
    前記障害の発生していないノードは、前記障害の発生したノードのメモリから、それに記憶されている情報を取得すると、取得した前記情報を前記記憶装置に格納させる、請求項1または2に記載のマルチノードシステム。
  5. 前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生したノードが、前記障害の発生したノードのメモリに記憶されている情報の取得を、前記障害の発生していないノードに要求し、
    前記要求を受け、且つ、前記障害の発生していないノードが、前記障害の発生したノードの前記メモリに記憶されている情報を取得する、請求項1〜4のいずれに記載のマルチノードシステム。
  6. 前記情報を取得したノードが、前記情報の取得の終了後に、前記障害の発生したノードに、前記情報の取得の終了を通知する、請求項5に記載のマルチノードシステム。
  7. 前記障害の発生したノードが、前記障害の発生したノードのメモリに記憶されている情報の取得を要求した後に、当該ノードにおける処理を中止し、そして、前記情報を取得したノードからの前記情報の取得の終了の通知を受けた後に、前記処理を再開する、請求項6に記載のマルチノードシステム。
  8. マルチノードシステムを構成する複数のノードの一つとして機能するノードであって、
    メモリと、
    当該ノード以外の別のノードのメモリに記憶されている情報を取得可能なリモートメモリアクセス機構と、
    当該ノードに障害が発生した場合に、当該ノード以外の別のノードに、当該ノードのメモリに記憶されている情報の取得を依頼する情報取得依頼部と、
    当該ノード以外の別のノードから、そのメモリに記憶されている情報の取得の依頼を受けた場合に、前記リモートメモリアクセス機構によって、前記別のノードのメモリに記憶されている情報を取得する情報取得部とを、備えていることを特徴とするノード。
  9. 相互に通信可能な複数のノードを有するマルチノードシステムを用いてメモリダンプを行うための方法であって、
    (a)前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生したノードによって、前記障害の発生していないノードに、前記障害の発生したノードのメモリに記憶されている情報の取得を要求するステップと、(b)前記(a)のステップによる要求を受け、且つ、前記障害の発生していないノードによって、前記障害の発生したノードの前記メモリに記憶されている情報を取得するステップとを有する、
    ことを特徴とするメモリダンプ処理方法。
  10. (c)前記(b)のステップの終了後に、前記情報を取得したノードによって、前記障害の発生したノードに、前記情報の取得の終了を通知するステップを更に有する請求項9に記載のメモリダンプ処理方法。
  11. (d)前記(a)のステップの終了後に、前記障害の発生したノードにおける処理を中止させるステップと、
    (e)前記(c)のステップの終了後に、前記(d)のステップで中止されていた処理を再開させるステップとを、更に有する、請求項10に記載のメモリダンプ処理方法。
  12. 相互に通信可能な複数のコンピュータを有するマルチノードシステムにおけるメモリダンプを前記コンピュータによって行うためのプログラムであって、
    前記コンピュータに、
    前記コンピュータに障害が発生した場合は、(a)前記コンピュータのメモリに記憶されている情報の取得を、前記障害の発生していないコンピュータに要求する、ステップを実行させ、
    前記コンピュータに障害が発生していない場合は、(b)前記障害が発生したコンピュータの前記メモリに記憶されている情報を取得する、ステップを実行させる、ことを特徴とするプログラム。
  13. 前記(b)のステップが実行された場合に、
    (c)前記(b)のステップの終了後に、前記障害が発生したコンピュータに前記情報の取得の終了を通知する、ステップを、前記コンピュータに更に実行させる、請求項12に記載のプログラム。
  14. 前記(a)のステップが実行された場合に、
    前記(a)のステップの終了後に、前記コンピュータにおける処理を中止させ、前記コンピュータ以外のコンピュータによる前記(c)のステップの実行によって、前記情報の取得の終了が通知されると、中止していた処理を再開させる、ステップを、前記コンピュータに更に実行させる、請求項13に記載のプログラム。
JP2009017529A 2009-01-29 2009-01-29 マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム Expired - Fee Related JP5435205B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009017529A JP5435205B2 (ja) 2009-01-29 2009-01-29 マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009017529A JP5435205B2 (ja) 2009-01-29 2009-01-29 マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2010176345A true JP2010176345A (ja) 2010-08-12
JP5435205B2 JP5435205B2 (ja) 2014-03-05

Family

ID=42707268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009017529A Expired - Fee Related JP5435205B2 (ja) 2009-01-29 2009-01-29 マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5435205B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013225217A (ja) * 2012-04-20 2013-10-31 Fujitsu Ltd マルチプロセッサシステム
JP2016048514A (ja) * 2014-08-28 2016-04-07 富士通株式会社 情報処理装置、情報処理方法および情報処理プログラム
US9934084B2 (en) 2015-06-03 2018-04-03 Fujitsu Limited Dump management apparatus, dump management program, and dump management method
US10140192B2 (en) 2016-02-23 2018-11-27 Fujitsu Limited Apparatus and method to collect memory dump information of a faulty node in a parallel computer system

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59180760A (ja) * 1983-03-31 1984-10-13 Fujitsu Ltd リモ−トダンプ方式
JPH01124037A (ja) * 1987-11-09 1989-05-16 Nec Corp メモリダンプ方式
JPH03231338A (ja) * 1990-02-06 1991-10-15 Hokuriku Nippon Denki Software Kk メモリダンプ領域管理方式
JPH0916441A (ja) * 1995-06-30 1997-01-17 Nec Eng Ltd メモリダンプシステム
JP2001034508A (ja) * 1999-07-22 2001-02-09 Hitachi Ltd メモリダンプ採取方法及びその実施装置並びにその処理プログラムを記録した記録媒体
JP2003030011A (ja) * 2001-07-19 2003-01-31 Nec Soft Ltd メモリダンプ採取方式および方法
JP2007334668A (ja) * 2006-06-15 2007-12-27 Nec System Technologies Ltd メモリダンプ方法、クラスタシステム、それを構成するノードおよびプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59180760A (ja) * 1983-03-31 1984-10-13 Fujitsu Ltd リモ−トダンプ方式
JPH01124037A (ja) * 1987-11-09 1989-05-16 Nec Corp メモリダンプ方式
JPH03231338A (ja) * 1990-02-06 1991-10-15 Hokuriku Nippon Denki Software Kk メモリダンプ領域管理方式
JPH0916441A (ja) * 1995-06-30 1997-01-17 Nec Eng Ltd メモリダンプシステム
JP2001034508A (ja) * 1999-07-22 2001-02-09 Hitachi Ltd メモリダンプ採取方法及びその実施装置並びにその処理プログラムを記録した記録媒体
JP2003030011A (ja) * 2001-07-19 2003-01-31 Nec Soft Ltd メモリダンプ採取方式および方法
JP2007334668A (ja) * 2006-06-15 2007-12-27 Nec System Technologies Ltd メモリダンプ方法、クラスタシステム、それを構成するノードおよびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013225217A (ja) * 2012-04-20 2013-10-31 Fujitsu Ltd マルチプロセッサシステム
JP2016048514A (ja) * 2014-08-28 2016-04-07 富士通株式会社 情報処理装置、情報処理方法および情報処理プログラム
US9934084B2 (en) 2015-06-03 2018-04-03 Fujitsu Limited Dump management apparatus, dump management program, and dump management method
US10140192B2 (en) 2016-02-23 2018-11-27 Fujitsu Limited Apparatus and method to collect memory dump information of a faulty node in a parallel computer system

Also Published As

Publication number Publication date
JP5435205B2 (ja) 2014-03-05

Similar Documents

Publication Publication Date Title
US7757120B2 (en) Ignoring redundant symptoms in modular self-healing systems
US11157373B2 (en) Prioritized transfer of failure event log data
US9052833B2 (en) Protection of former primary volumes in a synchronous replication relationship
JP5948933B2 (ja) ジョブ継続管理装置、ジョブ継続管理方法、及び、ジョブ継続管理プログラム
US10819641B2 (en) Highly available servers
US8533525B2 (en) Data management apparatus, monitoring apparatus, replica apparatus, cluster system, control method and computer-readable medium
US8266301B2 (en) Deployment of asynchronous agentless agent functionality in clustered environments
TWI528155B (zh) 在多核心處理系統中處理核心之重設
JP2011159136A (ja) 制御装置、制御装置の異常検出・復旧方法および電子機器
US9436539B2 (en) Synchronized debug information generation
JP5435205B2 (ja) マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム
US20150172160A1 (en) Monitoring file system operations between a client computer and a file server
WO2015033433A1 (ja) ストレージ装置及び障害部位特定方法
EP3591530B1 (en) Intelligent backup and recovery of cloud computing environment
WO2013190694A1 (ja) 計算機の復旧方法、計算機システム及び記憶媒体
JP2015069384A (ja) 情報処理システム、情報処理システムの制御方法及び情報処理装置の制御プログラム
KR101024249B1 (ko) 실시간 데이터 복제 시스템
WO2024083259A1 (zh) 主备数据库集群及选主方法、计算设备及存储介质
US8036105B2 (en) Monitoring a problem condition in a communications system
JP2006285384A (ja) プロセッサ障害処理方式、管理プロセッサ及びプロセッサ障害処理方法
US9720796B2 (en) Information processing apparatus, information processing system, control method for information processing system, and medium
JP2004334863A (ja) 順番のある(in−order)キューをドレインする(drain)システムおよび方法
JP4572138B2 (ja) サーバ装置、サーバシステム、及びサーバシステムでの系切り換え方法
US20140297724A1 (en) Network element monitoring system and server
JP2007133665A (ja) 計算機システム、分散処理方法、計算機及び分散処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131126

R150 Certificate of patent or registration of utility model

Ref document number: 5435205

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees