JP4645837B2 - メモリダンプ方法、コンピュータシステム、およびプログラム - Google Patents
メモリダンプ方法、コンピュータシステム、およびプログラム Download PDFInfo
- Publication number
- JP4645837B2 JP4645837B2 JP2005315982A JP2005315982A JP4645837B2 JP 4645837 B2 JP4645837 B2 JP 4645837B2 JP 2005315982 A JP2005315982 A JP 2005315982A JP 2005315982 A JP2005315982 A JP 2005315982A JP 4645837 B2 JP4645837 B2 JP 4645837B2
- Authority
- JP
- Japan
- Prior art keywords
- partition
- cell
- system crash
- memory
- dump
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2043—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share a common memory address space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0712—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/073—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a memory management context, e.g. virtual memory or cache management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0778—Dumping, i.e. gathering error/state information after a fault for later diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2025—Failover techniques using centralised failover control functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2038—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
- Hardware Redundancy (AREA)
Description
3 予備セル
4、5、6 CPU
7、8、9 メモリ
10 クロスバー
11、12 IO部
13 ダンプ読み出し/書き込み制御部
14 ダンプ用ディスク
15 サービスプロセッサ
161、162 システムクラッシュフラグ
101、102、201〜210 ステップ
P1、P2 パーティション
Claims (3)
- CPUとメモリを含む複数のセルと、該セルと同数のIO部をクロスバーによって自由に組み合わせて各々が1つのセルと1つのIO部を含む複数のパーティションに構成可能なコンピュータシステムにおいて、
サービスプロセッサが、予めOS上で、各パーティションでシステムクラッシュが発生したときにメモリダンプを採取しない設定にしておくステップと、
いずれかのパーティションでシステムクラッシュが発生すると、前記サービスプロセッサ上で、該パーティションのシステムクラッシュフラグをセットするとともに、該パーティションを構成するセルが含むメモリの情報を保持し、該パーティションをシャットダウンするステップと、
パーティションの再起動時に、システムクラッシュフラグがセットされているパーティションがあれば、前記クロスバーが該パーティションを構成していたセルを切り離し、いずれのパーティションにも属さない予め用意された予備のセルを代わりに組み込むステップと、
前記サービスプロセッサが該パーティションを再起動するステップと、
ダンプ読み出し/書き込み制御部が、システムクラッシュしたパーティションを構成していたセルが含むメモリの情報を読み出し、ダンプ用ディスクに書き込むステップと、
前記サービスプロセッサが、システムクラッシュしたパーティションのシステムクラッシュフラグをクリアするステップと
を有するメモリダンプ方法。 - CPUとメモリを含む複数のセルと、該セルと同数のIO部をクロスバーによって自由に組み合わせて各々が1つのセルと1つのIO部を含む複数のパーティションに構成可能なコンピュータシステムにおいて、
いずれのパーティションにも属さない予備のセルと、
パーティションごとに設けられたシステムクラッシュフラグと、
を有し、
サービスプロセッサが、予めOS上で、各パーティションでシステムクラッシュが発生したときにメモリダンプを採取しない設定にしておき、いずれかのパーティションでシステムクラッシュが発生すると、該パーティションのシステムクラッシュフラグをセットするとともに、該パーティションを構成するセルが含むメモリの情報を保持し、該パーティションをシャットダウンし、パーティションの再起動時に、システムクラッシュフラグがセットされているパーティションがあれば、前記クロスバーによって、該パーティションを構成していたセルを切り離し、前記の予備のセルを代わりに組み込み、該パーティションを再起動し、該パーティションのシステムクラッシュフラグをクリアし、
ダンプ読み出し/書き込み制御部が、システムクラッシュしたパーティションを構成していたセルが切り離されて代わりに予備のセルが組み込まれた後。該システムクラッシュしたパーティションを構成していたセルが含むメモリの情報を読み出し、ダンプ用ディスクに書き込む
ことを特徴とするコンピュータシステム。 - CPUとメモリを含む複数のセルと、該セルと同数のIO部をクロスバーによって自由に組み合わせて各々が1つのセルと1つのIO部を含む複数のパーティションに構成可能なコンピュータシステムにおいて、
予めOS上で、各パーティションでシステムクラッシュが発生したときにメモリダンプを採取しない設定にしておく手順と、
いずれかのパーティションでシステムクラッシュが発生すると、サービスプロセッサ上で、該パーティションのシステムクラッシュフラグをセットするとともに、該パーティションを構成するセルが含むメモリの情報を保持し、該パーティションをシャットダウンする手順と、
パーティションの再起動時に、システムクラッシュフラグがセットされているパーティションがあれば、前記クロスバーが該パーティションを構成していたセルを切り離し、いずれのパーティションにも属さない予め用意された予備のセルを代わりに手順と、
該パーティションを再起動する手順と、
システムクラッシュしたパーティションを構成していたセルが含むメモリの情報を読み出し、ダンプ用ディスクに書き込む手順と、
システムクラッシュしたパーティションのシステムクラッシュフラグをクリアする手順と
をコンピュータに実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005315982A JP4645837B2 (ja) | 2005-10-31 | 2005-10-31 | メモリダンプ方法、コンピュータシステム、およびプログラム |
US11/554,994 US20070101191A1 (en) | 2005-10-31 | 2006-10-31 | Memory dump method, computer system, and memory dump program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005315982A JP4645837B2 (ja) | 2005-10-31 | 2005-10-31 | メモリダンプ方法、コンピュータシステム、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007122552A JP2007122552A (ja) | 2007-05-17 |
JP4645837B2 true JP4645837B2 (ja) | 2011-03-09 |
Family
ID=37998034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005315982A Expired - Fee Related JP4645837B2 (ja) | 2005-10-31 | 2005-10-31 | メモリダンプ方法、コンピュータシステム、およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20070101191A1 (ja) |
JP (1) | JP4645837B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2829974A2 (en) | 2013-07-26 | 2015-01-28 | Fujitsu Limited | Memory dump method, information processing apparatus and program |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7506203B2 (en) * | 2005-11-10 | 2009-03-17 | International Business Machines Corporation | Extracting log and trace buffers in the event of system crashes |
DE102006047632A1 (de) * | 2006-10-09 | 2008-04-10 | Robert Bosch Gmbh | Unfallsensor und Verfahren zur Verarbeitung von wenigstens einem Messsignal |
JP5251165B2 (ja) * | 2008-02-27 | 2013-07-31 | 日本電気株式会社 | 情報処理システム、リソース診断方法、および診断管理プログラム |
EP2360594B1 (en) * | 2008-11-27 | 2014-12-17 | Fujitsu Limited | Information processing apparatus, processing unit switching method, and processing unit switching program |
US8930754B2 (en) | 2008-12-12 | 2015-01-06 | Bae Systems Plc | Apparatus and method for processing data streams |
JP5120664B2 (ja) | 2009-07-06 | 2013-01-16 | 日本電気株式会社 | サーバシステム及びクラッシュダンプ採取方法 |
JP5403054B2 (ja) * | 2009-07-10 | 2014-01-29 | 富士通株式会社 | メモリダンプ機能を有するサーバおよびメモリダンプ取得方法 |
EP2660724B1 (en) * | 2010-12-27 | 2020-07-29 | Fujitsu Limited | Information processing device having memory dump function, memory dump method, and memory dump program |
JP5733389B2 (ja) * | 2011-04-22 | 2015-06-10 | 富士通株式会社 | 情報処理装置及び情報処理装置の処理方法 |
JP6083136B2 (ja) * | 2012-06-22 | 2017-02-22 | 富士通株式会社 | メモリダンプ機能を有する情報処理装置、メモリダンプ方法、およびメモリダンププログラム |
JP6073615B2 (ja) * | 2012-09-19 | 2017-02-01 | Necプラットフォームズ株式会社 | 冷却装置、電子機器、冷却方法および冷却プログラム |
GB2508344A (en) | 2012-11-28 | 2014-06-04 | Ibm | Creating an operating system dump |
JP5949540B2 (ja) * | 2012-12-27 | 2016-07-06 | 富士通株式会社 | 情報処理装置、及び記憶情報解析方法 |
JP6327026B2 (ja) * | 2014-07-10 | 2018-05-23 | 富士通株式会社 | 情報処理装置、情報処理方法およびプログラム |
US10387261B2 (en) * | 2017-05-05 | 2019-08-20 | Dell Products L.P. | System and method to capture stored data following system crash |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0581089A (ja) * | 1991-09-19 | 1993-04-02 | Tokyo Electric Co Ltd | 電子機器 |
JPH06348528A (ja) * | 1993-06-11 | 1994-12-22 | Hitachi Ltd | バックアップ切り換え制御方法 |
JPH10333944A (ja) * | 1997-05-30 | 1998-12-18 | Nec Software Ltd | メモリダンプ採取方式 |
JP2000156687A (ja) * | 1998-11-19 | 2000-06-06 | Fujitsu Ltd | 二重化装置の障害情報収集方法 |
JP2001101033A (ja) * | 1999-09-27 | 2001-04-13 | Hitachi Ltd | オペレーティングシステム及びアプリケーションプログラムの障害監視方法 |
JP2001147841A (ja) * | 1999-11-24 | 2001-05-29 | Nec Corp | コンピュータ・システム、ダンプ採取方法、及び記録媒体 |
JP2002229967A (ja) * | 2001-02-01 | 2002-08-16 | Nec Corp | 計算機システム及びcpu・メモリ搭載装置並びに入出力制御装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4888773A (en) * | 1988-06-15 | 1989-12-19 | International Business Machines Corporation | Smart memory card architecture and interface |
GB2222461B (en) * | 1988-08-30 | 1993-05-19 | Mitsubishi Electric Corp | On chip testing of semiconductor memory devices |
JP2582439B2 (ja) * | 1989-07-11 | 1997-02-19 | 富士通株式会社 | 書き込み可能な半導体記憶装置 |
US6151688A (en) * | 1997-02-21 | 2000-11-21 | Novell, Inc. | Resource management in a clustered computer system |
JP4675524B2 (ja) * | 2001-09-21 | 2011-04-27 | 富士通株式会社 | 端局装置の異常修復を制御する制御装置 |
US6976187B2 (en) * | 2001-11-08 | 2005-12-13 | Broadcom Corporation | Rebuilding redundant disk arrays using distributed hot spare space |
US7171593B1 (en) * | 2003-12-19 | 2007-01-30 | Unisys Corporation | Displaying abnormal and error conditions in system state analysis |
US20050240806A1 (en) * | 2004-03-30 | 2005-10-27 | Hewlett-Packard Development Company, L.P. | Diagnostic memory dump method in a redundant processor |
-
2005
- 2005-10-31 JP JP2005315982A patent/JP4645837B2/ja not_active Expired - Fee Related
-
2006
- 2006-10-31 US US11/554,994 patent/US20070101191A1/en not_active Abandoned
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0581089A (ja) * | 1991-09-19 | 1993-04-02 | Tokyo Electric Co Ltd | 電子機器 |
JPH06348528A (ja) * | 1993-06-11 | 1994-12-22 | Hitachi Ltd | バックアップ切り換え制御方法 |
JPH10333944A (ja) * | 1997-05-30 | 1998-12-18 | Nec Software Ltd | メモリダンプ採取方式 |
JP2000156687A (ja) * | 1998-11-19 | 2000-06-06 | Fujitsu Ltd | 二重化装置の障害情報収集方法 |
JP2001101033A (ja) * | 1999-09-27 | 2001-04-13 | Hitachi Ltd | オペレーティングシステム及びアプリケーションプログラムの障害監視方法 |
JP2001147841A (ja) * | 1999-11-24 | 2001-05-29 | Nec Corp | コンピュータ・システム、ダンプ採取方法、及び記録媒体 |
JP2002229967A (ja) * | 2001-02-01 | 2002-08-16 | Nec Corp | 計算機システム及びcpu・メモリ搭載装置並びに入出力制御装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2829974A2 (en) | 2013-07-26 | 2015-01-28 | Fujitsu Limited | Memory dump method, information processing apparatus and program |
Also Published As
Publication number | Publication date |
---|---|
JP2007122552A (ja) | 2007-05-17 |
US20070101191A1 (en) | 2007-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4645837B2 (ja) | メモリダンプ方法、コンピュータシステム、およびプログラム | |
CN109032632B (zh) | 一种fota升级方法、无线通信终端及存储介质 | |
US8812910B2 (en) | Pilot process method for system boot and associated apparatus | |
JP7002358B2 (ja) | 情報処理システム、情報処理装置、情報処理装置のbios更新方法、及び情報処理装置のbios更新プログラム | |
CN109614130A (zh) | 一种带有试运行、自检查的云广播升级方法及系统 | |
CN105653345A (zh) | 用于支持对数据的非易失性随机访问的方法和设备 | |
JP2007133544A (ja) | 障害情報解析方法及びその実施装置 | |
WO2012119432A1 (zh) | 提高计算机系统稳定性的方法及计算机系统 | |
WO2017080225A1 (zh) | 数据分区的修复方法、装置及终端 | |
CN111046024A (zh) | 一种共享存储数据库的数据处理方法、装置、设备及介质 | |
JP5403054B2 (ja) | メモリダンプ機能を有するサーバおよびメモリダンプ取得方法 | |
JP2006277078A (ja) | ログ情報管理装置、ログ情報管理方法およびログ情報管理プログラム | |
JP4322240B2 (ja) | 再起動方法、システム及びプログラム | |
KR20090125689A (ko) | 정보 처리 장치, 에러 통지 프로그램, 에러 통지 방법 | |
JP5949540B2 (ja) | 情報処理装置、及び記憶情報解析方法 | |
CN115599607A (zh) | 一种raid阵列的数据恢复方法及相关装置 | |
JP2009211625A (ja) | 情報処理装置の起動ログ保存方法 | |
CN116382850B (zh) | 一种利用多存储心跳检测的虚拟机高可用管理装置及系统 | |
JP2003122644A (ja) | 計算機及びその記憶装置 | |
JP2009015525A (ja) | データ処理装置及びその制御方法 | |
CN113590388B (zh) | 一种基于uboot的spl回滚方法及装置、存储介质、终端 | |
CN117112311B (zh) | I/o驱动的数据恢复方法、系统及装置 | |
JP7180319B2 (ja) | 情報処理装置、及び情報処理装置のダンプ管理方法 | |
JP4878113B2 (ja) | Dasd故障時のリンクライブラリの復旧方法、及びプログラム | |
JPH11134208A (ja) | 計算機システム、計算機システムの障害情報収集方法、及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080919 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100630 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101110 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101123 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4645837 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |