JP2010176345A - マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム - Google Patents
マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム Download PDFInfo
- Publication number
- JP2010176345A JP2010176345A JP2009017529A JP2009017529A JP2010176345A JP 2010176345 A JP2010176345 A JP 2010176345A JP 2009017529 A JP2009017529 A JP 2009017529A JP 2009017529 A JP2009017529 A JP 2009017529A JP 2010176345 A JP2010176345 A JP 2010176345A
- Authority
- JP
- Japan
- Prior art keywords
- node
- memory
- failure
- information
- dump
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【解決手段】相互に通信可能な複数のノード(100及び101)を有するマルチノードシステム104であって、いずれかのノードに障害が発生した場合に、障害の発生していないノードは、障害の発生したノードのメモリ120から、それに記憶されている情報を取得する。各ノードは、当該ノード以外のノードのメモリ120に記憶されている情報を取得可能なリモートメモリアクセス機構を備えることができる。
【選択図】図1
Description
前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生していないノードは、前記障害の発生したノードのメモリから、それに記憶されている情報を取得する、ことを特徴とする。
メモリと、
当該ノード以外の別のノードのメモリに記憶されている情報を取得可能なリモートメモリアクセス機構と、
当該ノードに障害が発生した場合に、当該ノード以外の別のノードに、当該ノードのメモリに記憶されている情報の取得を依頼する情報取得依頼部と、
当該ノード以外の別のノードから、そのメモリに記憶されている情報の取得の依頼を受けた場合に、前記リモートメモリアクセス機構によって、前記別のノードのメモリに記憶されている情報を取得する情報取得部とを、備えていることを特徴とする。
(a)前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生したノードによって、前記障害の発生していないノードに、前記障害の発生したノードのメモリに記憶されている情報の取得を要求するステップと、
(b)前記(a)のステップによる要求を受け、且つ、前記障害の発生していないノードによって、前記障害の発生したノードの前記メモリに記憶されている情報を取得するステップとを有する、ことを特徴とする。
前記コンピュータに、
前記コンピュータに障害が発生した場合は、(a)前記コンピュータのメモリに記憶されている情報の取得を、前記障害の発生していないコンピュータに要求する、ステップを実行させ、
前記コンピュータに障害が発生していない場合は、(b)前記障害が発生したコンピュータの前記メモリに記憶されている情報を取得する、ステップを実行させる、ことを特徴とする。
以下、本発明の実施の形態1におけるマルチノードシステム、ノード、これらを用いたメモリダンプ処理方法、及びこれらを実現するためのプログラムについて、図1〜図3を参照しながら説明する。最初に、本実施の形態1におけるマルチノードシステムの構成について図1を用いて説明する。図1は、本発明の実施の形態1におけるマルチノードシステムの概略構成を示すブロック図である。
次に、本発明の実施の形態2におけるマルチノードシステム、ノード、これらを用いたメモリダンプ処理方法、及びこれらを実現するためのプログラムについて、図4及び図5を参照しながら説明する。最初に、本実施の形態2におけるマルチノードシステムの構成について図4を用いて説明する。図4は、本発明の実施の形態2におけるマルチノードシステムの概略構成を示すブロック図である。
101 ノード
102 ノード間接続装置
103 共有ディスク装置
104 マルチノードシステム
105 ノード
106 ノード
107 ネットワーク
108 マルチノードシステム
110 リモートメモリ機構
120 メモリ
121 カーネルデータ
130 二次記憶装置
140 OS
141、145 情報取得依頼部
142 情報取得部
143 情報出力部
Claims (14)
- 相互に通信可能な複数のノードを有するマルチノードシステムであって、
前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生していないノードは、前記障害の発生したノードのメモリから、それに記憶されている情報を取得する、ことを特徴とするマルチノードシステム。 - 前記複数のノードそれぞれが、当該ノード以外のノードのメモリに記憶されている情報を取得可能なリモートメモリアクセス機構を備えている、請求項1に記載のマルチノードシステム。
- 前記複数のノードそれぞれのメモリが、前記複数のノードによって共有されている、請求項1に記載のマルチノードシステム。
- 前記複数のノードに接続され、且つ、前記複数のノードそれぞれによって共有される記憶装置を更に備え、
前記障害の発生していないノードは、前記障害の発生したノードのメモリから、それに記憶されている情報を取得すると、取得した前記情報を前記記憶装置に格納させる、請求項1または2に記載のマルチノードシステム。 - 前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生したノードが、前記障害の発生したノードのメモリに記憶されている情報の取得を、前記障害の発生していないノードに要求し、
前記要求を受け、且つ、前記障害の発生していないノードが、前記障害の発生したノードの前記メモリに記憶されている情報を取得する、請求項1〜4のいずれに記載のマルチノードシステム。 - 前記情報を取得したノードが、前記情報の取得の終了後に、前記障害の発生したノードに、前記情報の取得の終了を通知する、請求項5に記載のマルチノードシステム。
- 前記障害の発生したノードが、前記障害の発生したノードのメモリに記憶されている情報の取得を要求した後に、当該ノードにおける処理を中止し、そして、前記情報を取得したノードからの前記情報の取得の終了の通知を受けた後に、前記処理を再開する、請求項6に記載のマルチノードシステム。
- マルチノードシステムを構成する複数のノードの一つとして機能するノードであって、
メモリと、
当該ノード以外の別のノードのメモリに記憶されている情報を取得可能なリモートメモリアクセス機構と、
当該ノードに障害が発生した場合に、当該ノード以外の別のノードに、当該ノードのメモリに記憶されている情報の取得を依頼する情報取得依頼部と、
当該ノード以外の別のノードから、そのメモリに記憶されている情報の取得の依頼を受けた場合に、前記リモートメモリアクセス機構によって、前記別のノードのメモリに記憶されている情報を取得する情報取得部とを、備えていることを特徴とするノード。 - 相互に通信可能な複数のノードを有するマルチノードシステムを用いてメモリダンプを行うための方法であって、
(a)前記複数のノードのいずれかに障害が発生した場合に、前記障害の発生したノードによって、前記障害の発生していないノードに、前記障害の発生したノードのメモリに記憶されている情報の取得を要求するステップと、(b)前記(a)のステップによる要求を受け、且つ、前記障害の発生していないノードによって、前記障害の発生したノードの前記メモリに記憶されている情報を取得するステップとを有する、
ことを特徴とするメモリダンプ処理方法。 - (c)前記(b)のステップの終了後に、前記情報を取得したノードによって、前記障害の発生したノードに、前記情報の取得の終了を通知するステップを更に有する請求項9に記載のメモリダンプ処理方法。
- (d)前記(a)のステップの終了後に、前記障害の発生したノードにおける処理を中止させるステップと、
(e)前記(c)のステップの終了後に、前記(d)のステップで中止されていた処理を再開させるステップとを、更に有する、請求項10に記載のメモリダンプ処理方法。 - 相互に通信可能な複数のコンピュータを有するマルチノードシステムにおけるメモリダンプを前記コンピュータによって行うためのプログラムであって、
前記コンピュータに、
前記コンピュータに障害が発生した場合は、(a)前記コンピュータのメモリに記憶されている情報の取得を、前記障害の発生していないコンピュータに要求する、ステップを実行させ、
前記コンピュータに障害が発生していない場合は、(b)前記障害が発生したコンピュータの前記メモリに記憶されている情報を取得する、ステップを実行させる、ことを特徴とするプログラム。 - 前記(b)のステップが実行された場合に、
(c)前記(b)のステップの終了後に、前記障害が発生したコンピュータに前記情報の取得の終了を通知する、ステップを、前記コンピュータに更に実行させる、請求項12に記載のプログラム。 - 前記(a)のステップが実行された場合に、
前記(a)のステップの終了後に、前記コンピュータにおける処理を中止させ、前記コンピュータ以外のコンピュータによる前記(c)のステップの実行によって、前記情報の取得の終了が通知されると、中止していた処理を再開させる、ステップを、前記コンピュータに更に実行させる、請求項13に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009017529A JP5435205B2 (ja) | 2009-01-29 | 2009-01-29 | マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009017529A JP5435205B2 (ja) | 2009-01-29 | 2009-01-29 | マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010176345A true JP2010176345A (ja) | 2010-08-12 |
JP5435205B2 JP5435205B2 (ja) | 2014-03-05 |
Family
ID=42707268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009017529A Expired - Fee Related JP5435205B2 (ja) | 2009-01-29 | 2009-01-29 | マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5435205B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013225217A (ja) * | 2012-04-20 | 2013-10-31 | Fujitsu Ltd | マルチプロセッサシステム |
JP2016048514A (ja) * | 2014-08-28 | 2016-04-07 | 富士通株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
US9934084B2 (en) | 2015-06-03 | 2018-04-03 | Fujitsu Limited | Dump management apparatus, dump management program, and dump management method |
US10140192B2 (en) | 2016-02-23 | 2018-11-27 | Fujitsu Limited | Apparatus and method to collect memory dump information of a faulty node in a parallel computer system |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59180760A (ja) * | 1983-03-31 | 1984-10-13 | Fujitsu Ltd | リモ−トダンプ方式 |
JPH01124037A (ja) * | 1987-11-09 | 1989-05-16 | Nec Corp | メモリダンプ方式 |
JPH03231338A (ja) * | 1990-02-06 | 1991-10-15 | Hokuriku Nippon Denki Software Kk | メモリダンプ領域管理方式 |
JPH0916441A (ja) * | 1995-06-30 | 1997-01-17 | Nec Eng Ltd | メモリダンプシステム |
JP2001034508A (ja) * | 1999-07-22 | 2001-02-09 | Hitachi Ltd | メモリダンプ採取方法及びその実施装置並びにその処理プログラムを記録した記録媒体 |
JP2003030011A (ja) * | 2001-07-19 | 2003-01-31 | Nec Soft Ltd | メモリダンプ採取方式および方法 |
JP2007334668A (ja) * | 2006-06-15 | 2007-12-27 | Nec System Technologies Ltd | メモリダンプ方法、クラスタシステム、それを構成するノードおよびプログラム |
-
2009
- 2009-01-29 JP JP2009017529A patent/JP5435205B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59180760A (ja) * | 1983-03-31 | 1984-10-13 | Fujitsu Ltd | リモ−トダンプ方式 |
JPH01124037A (ja) * | 1987-11-09 | 1989-05-16 | Nec Corp | メモリダンプ方式 |
JPH03231338A (ja) * | 1990-02-06 | 1991-10-15 | Hokuriku Nippon Denki Software Kk | メモリダンプ領域管理方式 |
JPH0916441A (ja) * | 1995-06-30 | 1997-01-17 | Nec Eng Ltd | メモリダンプシステム |
JP2001034508A (ja) * | 1999-07-22 | 2001-02-09 | Hitachi Ltd | メモリダンプ採取方法及びその実施装置並びにその処理プログラムを記録した記録媒体 |
JP2003030011A (ja) * | 2001-07-19 | 2003-01-31 | Nec Soft Ltd | メモリダンプ採取方式および方法 |
JP2007334668A (ja) * | 2006-06-15 | 2007-12-27 | Nec System Technologies Ltd | メモリダンプ方法、クラスタシステム、それを構成するノードおよびプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013225217A (ja) * | 2012-04-20 | 2013-10-31 | Fujitsu Ltd | マルチプロセッサシステム |
JP2016048514A (ja) * | 2014-08-28 | 2016-04-07 | 富士通株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
US9934084B2 (en) | 2015-06-03 | 2018-04-03 | Fujitsu Limited | Dump management apparatus, dump management program, and dump management method |
US10140192B2 (en) | 2016-02-23 | 2018-11-27 | Fujitsu Limited | Apparatus and method to collect memory dump information of a faulty node in a parallel computer system |
Also Published As
Publication number | Publication date |
---|---|
JP5435205B2 (ja) | 2014-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7757120B2 (en) | Ignoring redundant symptoms in modular self-healing systems | |
US11157373B2 (en) | Prioritized transfer of failure event log data | |
US9052833B2 (en) | Protection of former primary volumes in a synchronous replication relationship | |
JP5948933B2 (ja) | ジョブ継続管理装置、ジョブ継続管理方法、及び、ジョブ継続管理プログラム | |
US10819641B2 (en) | Highly available servers | |
US8533525B2 (en) | Data management apparatus, monitoring apparatus, replica apparatus, cluster system, control method and computer-readable medium | |
US8266301B2 (en) | Deployment of asynchronous agentless agent functionality in clustered environments | |
TWI528155B (zh) | 在多核心處理系統中處理核心之重設 | |
JP2011159136A (ja) | 制御装置、制御装置の異常検出・復旧方法および電子機器 | |
US9436539B2 (en) | Synchronized debug information generation | |
JP5435205B2 (ja) | マルチノードシステム、ノード、メモリダンプ処理方法、及びプログラム | |
US20150172160A1 (en) | Monitoring file system operations between a client computer and a file server | |
WO2015033433A1 (ja) | ストレージ装置及び障害部位特定方法 | |
EP3591530B1 (en) | Intelligent backup and recovery of cloud computing environment | |
WO2013190694A1 (ja) | 計算機の復旧方法、計算機システム及び記憶媒体 | |
JP2015069384A (ja) | 情報処理システム、情報処理システムの制御方法及び情報処理装置の制御プログラム | |
KR101024249B1 (ko) | 실시간 데이터 복제 시스템 | |
WO2024083259A1 (zh) | 主备数据库集群及选主方法、计算设备及存储介质 | |
US8036105B2 (en) | Monitoring a problem condition in a communications system | |
JP2006285384A (ja) | プロセッサ障害処理方式、管理プロセッサ及びプロセッサ障害処理方法 | |
US9720796B2 (en) | Information processing apparatus, information processing system, control method for information processing system, and medium | |
JP2004334863A (ja) | 順番のある(in−order)キューをドレインする(drain)システムおよび方法 | |
JP4572138B2 (ja) | サーバ装置、サーバシステム、及びサーバシステムでの系切り換え方法 | |
US20140297724A1 (en) | Network element monitoring system and server | |
JP2007133665A (ja) | 計算機システム、分散処理方法、計算機及び分散処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5435205 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |