JP2010066869A - Information processor, control method thereof and program - Google Patents
Information processor, control method thereof and program Download PDFInfo
- Publication number
- JP2010066869A JP2010066869A JP2008230739A JP2008230739A JP2010066869A JP 2010066869 A JP2010066869 A JP 2010066869A JP 2008230739 A JP2008230739 A JP 2008230739A JP 2008230739 A JP2008230739 A JP 2008230739A JP 2010066869 A JP2010066869 A JP 2010066869A
- Authority
- JP
- Japan
- Prior art keywords
- memory
- setting
- clear
- control circuit
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、情報処理装置、その制御方法及びプログラムに関し、特に、サーバ等のコンピュータシステムの障害要因の解析を支援する技術に関する。 The present invention relates to an information processing apparatus, a control method therefor, and a program, and more particularly to a technology that supports analysis of a failure factor of a computer system such as a server.
本発明に関連する技術として、特許文献1に記載のものを挙げる。特許文献1には、例えば、段落0029等を参照すると、「異常からの復帰処理においてリセットが発生しても、データをメモリ領域(二つあるCPUのうち一方のCPUの内蔵RAM)に一時的に保持する」旨の記載がある。しかしながら、特許文献1に記載の内蔵RAMメモリは、メモリクリアされないことが前提とされている。
昨今、通信分野においてもIT(Information Technology)分野同様にオープンスタンダードの波が訪れて、汎用サーバやPICMGと呼ばれる標準化団体の規定するフォームファクタベースでのシステム構築が主流となってきている。汎用サーバやPICMGサーバは、主にIT分野の技術や思想をベースとしているため、システム内のサーバ障害が発生した際、リセットによるシステムの復旧を目指す思想となっている。 In recent years, the wave of open standards has come in the communication field as well as the IT (Information Technology) field, and system construction based on a form factor defined by a standardization organization called a general-purpose server or PICMG has become mainstream. General-purpose servers and PICMG servers are mainly based on technology and ideas in the IT field. Therefore, when a server failure occurs in the system, the idea is to restore the system by resetting.
しかしながら、通信分野のシステムは、信頼性向上を目的に冗長構成(例えば、二重化、n+1化)をとっているものが多く、そのため、障害発生したサーバをリセットして復旧させることはほとんど無く、障害ボードとしてシステムから切り離され、障害要因の特定に努めるのが常となっている。 However, many systems in the communication field have a redundant configuration (for example, duplication, n + 1) for the purpose of improving reliability. Therefore, there is almost no need to reset and recover a failed server. As a board, it is usually separated from the system and strives to identify the cause of failure.
従来、システムでハードウェア故障若しくはソフトウェア不具合に起因したサーバ障害発生において、障害復旧を目的としたリセット投入前に、メモリ上の必要最低限のログ解析用データをHDDに吐き出していたが、障害要因によってはログ解析用データをHDDに吐き出すことができず、サーバ障害要因の解析が困難となってしまうケースが多々発生していた。 Previously, when a server failure occurred due to a hardware failure or software failure in the system, the minimum required log analysis data in memory was dumped to the HDD before resetting for the purpose of failure recovery. In some cases, log analysis data cannot be discharged to the HDD, which makes it difficult to analyze the cause of a server failure.
そこで本発明は、上記実情に鑑みて、サーバ等の情報処理装置で障害が起こった場合の障害要因の解析を迅速且つ容易とすることを目的とする。 In view of the above circumstances, an object of the present invention is to quickly and easily analyze a failure factor when a failure occurs in an information processing apparatus such as a server.
上記目的を達成するために本発明は、以下の構成を備える。 In order to achieve the above object, the present invention comprises the following arrangement.
本発明に係る情報処理装置は、リブート動作時にメモリをクリアしない設定であるメモリクリア設定を記憶しておくメモリクリアON/OFF制御回路と、前記メモリクリア設定を参照して、クリアしない設定である場合に、前記メモリ上に格納されている記憶を削除しない制御を行うメモリ制御回路と、を有することを特徴とする。 The information processing apparatus according to the present invention has a memory clear ON / OFF control circuit that stores a memory clear setting that is a setting that does not clear a memory during a reboot operation, and a setting that is not cleared with reference to the memory clear setting. A memory control circuit that performs control not to delete the memory stored in the memory.
本発明に係る情報処理装置の制御方法は、リブート動作時にメモリをクリアしない設定であるメモリクリア設定を記憶しておくメモリクリアON/OFF設定工程と、前記メモリクリア設定を参照して、クリアしない設定である場合に、前記メモリ上に格納されている記憶を削除しない制御を行うメモリ制御工程と、を含むことを特徴とする。 The control method of the information processing apparatus according to the present invention does not clear the memory clear ON / OFF setting step for storing the memory clear setting, which is a setting that does not clear the memory during the reboot operation, and the memory clear setting. And a memory control step for performing control not to delete the memory stored in the memory in the case of setting.
本発明に係るプログラムは、リブート動作時にメモリをクリアしない設定であるメモリクリア設定を記憶しておくメモリクリアON/OFF制御回路を有する情報処理装置に、前記メモリクリア設定を参照して、クリアしない設定である場合に、前記メモリ上に格納されている記憶を削除しない制御を行うメモリ制御手順を実行させることを特徴とする。 The program according to the present invention does not clear the information processing apparatus having the memory clear ON / OFF control circuit for storing the memory clear setting that does not clear the memory at the time of the reboot operation with reference to the memory clear setting. In the case of setting, a memory control procedure for performing control not to delete the memory stored in the memory is executed.
本発明によれば、サーバ等の情報処理装置で障害が起こった場合の障害要因の解析を迅速且つ容易とすることが可能となる。 According to the present invention, it is possible to quickly and easily analyze a failure factor when a failure occurs in an information processing apparatus such as a server.
以下、本発明の実施の形態について図面を参照して説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
何かしらのハードウェア故障若しくはソフトウェア不具合に起因したサーバ障害発生時に、システムの早期復旧を目的に被疑サーバに対してリセットを投入するのが一般的である。ところが、本実施形態は、その際に被疑サーバをリセットすると、サーバ障害発生時のメモリデータをクリアせず、且つ、リセット後のリブート動作にてHDDからソフトウェアをファイルロードしないため、サーバ障害要因の解析を迅速且つ容易とする。 When a server failure occurs due to some kind of hardware failure or software failure, it is common to reset the suspect server for the purpose of early recovery of the system. However, in this embodiment, if the suspicious server is reset at that time, the memory data at the time of the server failure is not cleared, and the software is not loaded from the HDD in the reboot operation after the reset. Make analysis quick and easy.
まず、本実施形態の構成について説明する。図1は、本発明の実施形態の構成を示すブロック図である。図1に示すように、サーバ100は、その要部において、主要要素である、CPU101、CPU周辺制御回路102、メモリ106、HDD107、及び、FROM108を有する構成である。
First, the configuration of the present embodiment will be described. FIG. 1 is a block diagram showing the configuration of the embodiment of the present invention. As shown in FIG. 1, the
CPU101は、サーバ100の中央演算装置であり、システム全体を制御する。メモリ106は、サーバ100のメインメモリである。サーバ100のオペレーティングシステム(基本ソフトウェア。以下、「OS」という)は、不揮発性の記憶装置であるHDD107に格納されており、メモリ106に展開されることによって、所定の情報処理を実行することが可能になる。
The
CPU周辺制御回路102は、メモリ制御回路104とメモリクリアON/OFF制御回路103とIO制御回路105を含む。なお、これら各回路は、ソフトウェアプログラムによっても実現させることができる。また、FROM108は、OSファイルロード起動フラグ機能を持つBIOS(Basic I/O System)109を格納する。
The CPU
CPU101とCPU周辺制御回路102は、CPUバスで接続されている。また、メモリ106とCPU周辺制御回路102は、メモリバスで接続されており、メモリ106は、メモリ制御回路104によって制御される。また、CPU周辺制御回路102とHDD107やFROM108等の入出力手段は、IOバスで接続されており、これら入出力手段は、IO制御回路105によって制御される。
The
また、本実施形態においては、図1に示すように、システムのリブートを促すリセット信号は、CPU101とCPU周辺制御回路102に入力される。
In the present embodiment, as shown in FIG. 1, a reset signal that prompts a system reboot is input to the
以下、本実施形態の動作について説明する。図2は、本実施形態において障害が発生したあとのリブート動作の流れを示すフローチャートである。 Hereinafter, the operation of this embodiment will be described. FIG. 2 is a flowchart showing the flow of the reboot operation after a failure has occurred in this embodiment.
本実施形態に係るサーバ100において、何らかの障害が発生した場合、サーバ100に対してリセット投入、若しくはサーバ内部の自律リセット起動回路(図示せず)がONされる。その際、図1に示すリセット信号がCPU101とCPU周辺制御回路102に入力される。リセット信号を受信したCPU101とCPU周辺制御回路102は、一定のリセット期間を経て、サーバの初期化動作に遷移する。
When any failure occurs in the
図2において、リセット信号がCPU101等に入力されることでサーバ100のリセット処理が起動し(ステップS101)、一定のリセット期間を経てリセット処理が解除され(ステップS102)、サーバ初期化動作(ステップS103〜113)に遷移する。
In FIG. 2, when a reset signal is input to the
サーバ100の初期化動作として、まずCPU101は、CPUバスを介してCPU周辺制御回路102経由で、IOバス配下のFROM108に内蔵されるBIOS109と呼ばれるファームウェアのサーバ初期化プログラムを実行する為にプログラムフェッチを実施し、サーバ初期化プログラムを実行する。サーバ初期化プログラムの処理の中で、通常は、メモリ106の初期化が実行される訳だが、その際にCPU周辺制御回路102内部に組み込まれるメモリクリアON/OFF制御回路103をOFFに設定し、メモリ制御回路104がメモリ106内部のデータをクリアしないようプロテクトをかける。この仕組みと初期化手順を初期化動作プログラムに組み込む事によって、リセットによるメモリデータのクリア動作の抑止が可能となる。
As an initialization operation of the
図2において、BIOS109のサーバ初期化プログラムは、動作を開始する(ステップS103)。ここで、CPU101は、メモリクリアON/OFF制御回路103の設定を確認して(ステップS104)、メモリ初期化OFF(初期化しない)の場合(ステップS105、Yes)、メモリ制御回路104がメモリ106をクリアしないようプロテクトをかける(ステップS106)。以上で、サーバ初期化プログラムは、動作を完了する(ステップS107)。
In FIG. 2, the server initialization program of the
BIOS109は、上記の動作を含む一連のサーバ初期化プログラムの実行を完了すると、OSに処理を移すために、HDD107に格納されるプログラムをメモリ106に展開する為のブートローダ機能を実行するが、この処理をスキップし、既にメモリ106に格納されているプログラムにてOSが動作可能となるように、BIOS109のブートローダ機能にOSファイルロード起動フラグ機能を持たせて、このフラグがOFFになっている際は、OSがHDD107に格納されているプログラムをファイルロードしてこなくても、直接メモリ106に格納されているプログラムを実行できる仕組みを提供する事が可能となる。
When the
図2において、BIOS109のブートローダは、動作を開始する(ステップS108)。ここで、CPU101は、BIOS109のブートローダ機能に設定されているOSのHDDからのファイルロードの設定を確認して(ステップS109)、HDDファイルロードOFF(HDDからのファイルロードをしない)の場合(ステップS110、Yes)、BIOS109のブートローダが動作を完了する一方(ステップS111)、メモリ106上に展開されているOSに後段の起動処理を渡す(ステップS112)。なお、ステップS111と112は同時に実行するよう構成してもよい。
In FIG. 2, the boot loader of the
なお、メモリクリアの設定がONの場合(ステップS105、No)や、HDDファイルロードON/OFF設定がONの場合(ステップS110、No)は、通常の起動処理を実行する(ステップS113)。 If the memory clear setting is ON (step S105, No), or if the HDD file load ON / OFF setting is ON (step S110, No), normal startup processing is executed (step S113).
以上に説明した本発明による実施形態の効果について説明する。 The effects of the embodiment according to the present invention described above will be described.
何かしらのサーバ障害発生時の中でも、特にハードウェアの間欠的な故障や、ハード/ファーム/ソフトウェアのバグによって、サーバがハングアップしてしまった場合においては、リセット投入前にメモリ上にある必要最低限のログ解析用データをHDDに吐き出す事ができない為、リセットによりハングアップ状態から復旧させてからメモリデータを収集する事が可能である。しかしながら、通常のリブート動作は、ブート時にメモリをクリアするため、そのようなデータ収集ができない。 Even when a server failure occurs, especially if the server hangs up due to intermittent hardware failures or hardware / firmware / software bugs, the minimum required amount in memory before resetting Since a limited amount of log analysis data cannot be discharged to the HDD, it is possible to collect memory data after recovering from a hang-up state by reset. However, since the normal reboot operation clears the memory at the time of booting, such data collection cannot be performed.
ところが、本実施形態によれば、リセット投入後にメモリ上に展開されているデータで立ち上がらせる事ができるので、サーバ障害要因の解析の為のログ収集が確実となる効果がある。また、リセット投入後のサーバ立ち上げ時間として、HDDからのファイルロード時間を加味しなくて済み、リセット投入後のサーバ立ち上がり時間短縮の効果もある。したがって、本実施形態によれば、サーバ等の情報処理装置で障害が起こった場合の障害要因の解析が迅速且つ容易となる。 However, according to the present embodiment, it is possible to start up with the data developed in the memory after the reset is input, so that there is an effect that the log collection for the analysis of the server failure factor is ensured. Further, it is not necessary to consider the file load time from the HDD as the server start-up time after the reset is turned on, and there is an effect of shortening the server start-up time after the reset is turned on. Therefore, according to the present embodiment, it is possible to quickly and easily analyze a failure factor when a failure occurs in an information processing apparatus such as a server.
以上、本発明の好適な実施の形態について説明したが、本発明はこれに限定されるものではなく、要旨を逸脱しない範囲内で種々の変形実施が可能である。 The preferred embodiment of the present invention has been described above, but the present invention is not limited to this, and various modifications can be made without departing from the scope of the invention.
100 サーバ
101 CPU
102 CPU周辺制御回路
103 メモリクリアON/OFF制御回路
104 メモリ制御回路
105 IO制御回路
106 メモリ
107 HDD
108 FROM
109 BIOS
100
102 CPU
108 FROM
109 BIOS
Claims (6)
前記メモリクリア設定を参照して、クリアしない設定である場合に、前記メモリ上に格納されている記憶を削除しない制御を行うメモリ制御回路と、
を有することを特徴とする、情報処理装置。 A memory clear ON / OFF control circuit for storing a memory clear setting that is a setting that does not clear the memory during a reboot operation;
A memory control circuit that performs control not to delete the memory stored in the memory when the setting is not cleared with reference to the memory clear setting; and
An information processing apparatus comprising:
前記メモリ制御回路がメモリをクリアしない制御を行った場合に、前記ファイルロード設定フラグを参照して、オペレーティングシステムを2次記憶装置から起動しない設定である場合に、前記メモリ上に格納されている記憶に基づいてオペレーティングシステムを再開する制御手段と、
を有することを特徴とする、請求項1記載の情報処理装置。 BIOS storage means for storing a BIOS having a file load setting flag for storing a setting as to whether or not to start the operating system from the secondary storage device;
When the memory control circuit performs control that does not clear the memory, the file load setting flag is referred to, and if the setting is such that the operating system is not started from the secondary storage device, it is stored in the memory. Control means for restarting the operating system based on the memory;
The information processing apparatus according to claim 1, further comprising:
前記メモリクリア設定を参照して、クリアしない設定である場合に、前記メモリ上に格納されている記憶を削除しない制御を行うメモリ制御工程と、
を含むことを特徴とする、情報処理装置の制御方法。 A memory clear ON / OFF setting step for storing a memory clear setting that is a setting that does not clear the memory during a reboot operation;
A memory control step for performing control not to delete the memory stored in the memory when the setting is not cleared with reference to the memory clear setting; and
A method for controlling an information processing apparatus, comprising:
前記メモリクリア設定を参照して、クリアしない設定である場合に、前記メモリ上に格納されている記憶を削除しない制御を行うメモリ制御手順を、
実行させることを特徴とする、プログラム。 In an information processing apparatus having a memory clear ON / OFF control circuit for storing a memory clear setting that is a setting that does not clear a memory during a reboot operation,
With reference to the memory clear setting, when the setting is not cleared, a memory control procedure for performing control not to delete the memory stored in the memory,
A program characterized by being executed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008230739A JP2010066869A (en) | 2008-09-09 | 2008-09-09 | Information processor, control method thereof and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008230739A JP2010066869A (en) | 2008-09-09 | 2008-09-09 | Information processor, control method thereof and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010066869A true JP2010066869A (en) | 2010-03-25 |
Family
ID=42192424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008230739A Pending JP2010066869A (en) | 2008-09-09 | 2008-09-09 | Information processor, control method thereof and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010066869A (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59189423A (en) * | 1983-04-13 | 1984-10-27 | Hitachi Ltd | Reset processing circuit |
JPH0816507A (en) * | 1994-06-30 | 1996-01-19 | Funai Electric Co Ltd | Peripheral device for ide bus |
JPH08212113A (en) * | 1995-02-01 | 1996-08-20 | Nec Corp | Error information collection test system |
JPH08278867A (en) * | 1995-04-07 | 1996-10-22 | Canon Inc | Information processor and method for starting and controlling information processor |
JPH10232796A (en) * | 1997-02-18 | 1998-09-02 | Sony Corp | Runaway avoiding means |
JP2002082808A (en) * | 2000-09-07 | 2002-03-22 | Seiko Epson Corp | Method for controlling program |
-
2008
- 2008-09-09 JP JP2008230739A patent/JP2010066869A/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59189423A (en) * | 1983-04-13 | 1984-10-27 | Hitachi Ltd | Reset processing circuit |
JPH0816507A (en) * | 1994-06-30 | 1996-01-19 | Funai Electric Co Ltd | Peripheral device for ide bus |
JPH08212113A (en) * | 1995-02-01 | 1996-08-20 | Nec Corp | Error information collection test system |
JPH08278867A (en) * | 1995-04-07 | 1996-10-22 | Canon Inc | Information processor and method for starting and controlling information processor |
JPH10232796A (en) * | 1997-02-18 | 1998-09-02 | Sony Corp | Runaway avoiding means |
JP2002082808A (en) * | 2000-09-07 | 2002-03-22 | Seiko Epson Corp | Method for controlling program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8930769B2 (en) | Managing operating system deployment failure | |
TWI386847B (en) | Method of safe and recoverable firmware update and device using the same | |
US8468389B2 (en) | Firmware recovery system and method of baseboard management controller of computing device | |
JP5120664B2 (en) | Server system and crash dump collection method | |
JP2016164785A (en) | Secure recovery apparatus and method | |
US20040158702A1 (en) | Redundancy architecture of computer system using a plurality of BIOS programs | |
US20070174689A1 (en) | Computer platform embedded operating system backup switching handling method and system | |
CN102929747A (en) | Method for treating crash dump of Linux operation system based on loongson server | |
JP5609242B2 (en) | Information processing apparatus and memory dump collection method | |
US20220308963A1 (en) | Method and apparatus for providing recovery from a computing device boot up error | |
CN106775674B (en) | Equipment based on universal boot loader and starting method thereof | |
CN108108198B (en) | Method and system for computer system | |
JP6599725B2 (en) | Information processing apparatus, log management method, and computer program | |
US11030047B2 (en) | Information handling system and method to restore system firmware to a selected restore point | |
CN111078469A (en) | Data processing method and data processing equipment | |
US10824517B2 (en) | Backup and recovery of configuration files in management device | |
JP5561791B2 (en) | Information processing apparatus, information processing method, and information processing program | |
JP6073710B2 (en) | Information processing apparatus, automatic recovery method from startup failure, and automatic recovery program from startup failure | |
CN115176232A (en) | Firmware corruption recovery | |
JP2005222366A (en) | Automatic recovery method, program, program recording medium, processor | |
US10509646B2 (en) | Software update rollbacks using file system volume snapshots | |
JP2010066869A (en) | Information processor, control method thereof and program | |
JP2007094537A (en) | Memory dump device and memory dump collection method | |
JP4635993B2 (en) | Startup diagnostic method, startup diagnostic method and program | |
US10768940B2 (en) | Restoring a processing unit that has become hung during execution of an option ROM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110815 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110920 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121114 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121226 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130129 |