JP2008217191A - Failure processing method, program and information processor - Google Patents
Failure processing method, program and information processor Download PDFInfo
- Publication number
- JP2008217191A JP2008217191A JP2007051045A JP2007051045A JP2008217191A JP 2008217191 A JP2008217191 A JP 2008217191A JP 2007051045 A JP2007051045 A JP 2007051045A JP 2007051045 A JP2007051045 A JP 2007051045A JP 2008217191 A JP2008217191 A JP 2008217191A
- Authority
- JP
- Japan
- Prior art keywords
- hardware resource
- initialization
- information
- time
- mounting position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
Description
本発明は、障害から自動で回復するための障害処理方法、プログラム及び情報処理装置に関する。 The present invention relates to a failure processing method, a program, and an information processing apparatus for automatically recovering from a failure.
従来、情報処理装置の起動時に障害が発生した場合、故障が発生した部位を特定し、その部位を切り離して障害から自動で回復することが行われている。しかし、故障が発生した部位を明確に特定することができない場合、情報処理装置が起動不能となることがある。故障が発生した部位が明確に特定できない場合であっても、起動不能障害から自動で回復するための技術が必要とされている。 Conventionally, when a failure occurs at the time of starting an information processing apparatus, a part where the failure has occurred is identified, and the part is separated and automatically recovered from the failure. However, the information processing apparatus may be unable to start up when the site where the failure has occurred cannot be clearly identified. There is a need for a technique for automatically recovering from an unstartable failure even when the site where the failure has occurred cannot be clearly identified.
特許文献1は、ウオッチドッグタイマを開示している。ウオッチドッグタイマは、CPU(中央演算装置)による初期化が必要なシステムに搭載される。ウオッチドッグタイマは、システムの起動後にCPUから繰り返し入力されるクリア命令が、所定時間経過しても入力されないときに、CPUが暴走したと認識し、異常検知信号を出力する。ウオッチドッグタイマは、システムの起動直後は第1の監視間隔でCPUからのクリア命令を監視し、CPUからクリア命令が入力された後は、第1の監視間隔でCPUからのクリア命令を監視することを特徴としている。ウオッチドッグタイマは、システムの初期化処理に要する時間を考慮する必要がなく、しかも、システム初期化時におけるCPUの暴走を確実に検出することができるという効果を奏する。
特許文献2は、自動預金支払機(ATM)の起動状態を監視する起動監視装置を開示している。起動監視装置は、起動監視手段と、時間計測手段と、再起動制御手段とを備える。起動監視手段は、システム起動時の初期化処理を分割し、分割した初期化処理毎の起動状態を監視する。時間計測手段は、起動監視手段が監視した初期化処理毎の時間を計測する。再起動制御手段は、時間計測手段で計測した時間が設定された起動許容時間を超えたとき、再起動を行う。起動監視装置によれば、システム起動時の初期化処理毎の起動状態を複数段階に分けて時間監視するため、起動不可発生時には直ちに再起動をすることができる。特に、システム構成を考慮した余裕時間を設定する必要がなくなるため、無駄な設定時間を省略して短時間に正確な起動可否を検知することができる。 Patent Document 2 discloses an activation monitoring device that monitors the activation state of an automatic deposit payment machine (ATM). The activation monitoring device includes activation monitoring means, time measurement means, and restart control means. The activation monitoring means divides the initialization process at the time of system activation, and monitors the activation state for each divided initialization process. The time measuring means measures the time for each initialization process monitored by the activation monitoring means. The restart control means restarts when the time measured by the time measuring means exceeds a set allowable start time. According to the activation monitoring device, the activation state for each initialization process at the time of activation of the system is time-divided into a plurality of stages, so that the activation can be immediately restarted when the activation is impossible. In particular, since it is not necessary to set a surplus time in consideration of the system configuration, it is possible to accurately detect whether or not activation is possible in a short time by omitting a useless setting time.
ATMの場合、通常そのハードウエア構成はユーザによって変更されない。一方、パーソナルコンピュータのような情報処理装置の場合、ユーザがハードウエア構成を自由に変更することが可能である。すなわち、起動不能障害から回復するための回復手段を情報処理装置に組み込んだ後に、情報処理装置のハードウエア構成が変更されることが起こり得る。 In the case of ATM, the hardware configuration is usually not changed by the user. On the other hand, in the case of an information processing apparatus such as a personal computer, the user can freely change the hardware configuration. That is, it is possible that the hardware configuration of the information processing apparatus is changed after the recovery means for recovering from the failure to start is incorporated in the information processing apparatus.
本発明の目的は、ハードウエア構成が変更され得る情報処理装置における障害からの自動回復に好適な障害処理方法、プログラム及び情報処理装置を提供することである。 An object of the present invention is to provide a failure processing method, a program, and an information processing device suitable for automatic recovery from a failure in an information processing device whose hardware configuration can be changed.
以下に、(発明を実施するための最良の形態)で使用される番号を用いて、課題を解決するための手段を説明する。これらの番号は、(特許請求の範囲)の記載と(発明を実施するための最良の形態)との対応関係を明らかにするために付加されたものである。ただし、それらの番号を、(特許請求の範囲)に記載されている発明の技術的範囲の解釈に用いてはならない。 Hereinafter, means for solving the problem will be described using the numbers used in (Best Mode for Carrying Out the Invention). These numbers are added to clarify the correspondence between the description of (Claims) and (Best Mode for Carrying Out the Invention). However, these numbers should not be used to interpret the technical scope of the invention described in (Claims).
本発明による障害処理方法は、情報処理装置(1)の障害処理方法である。前記情報処理装置は、第1ハードウエア資源(30−K)と、前記ハードウエア資源を過去に初期化したときにかかった第1初期化時間を示す第1初期化時間情報(26c)を記憶した記憶部(23)とを具備する。本発明による障害処理方法は、(a)前記情報処理装置の起動時に、前記第1ハードウエア資源の初期化を開始するステップ(S4)と、(b)前記第1ハードウエア資源の初期化を開始してからの第1経過時間を測定するステップ(S4)と、(c)前記第1ハードウエア資源の初期化が完了する前に前記第1経過時間が前記第1初期化時間を超えた場合、前記第1ハードウエア資源の異常を検出するステップ(S6)とを具備する。 The failure processing method according to the present invention is a failure processing method of the information processing apparatus (1). The information processing apparatus stores a first hardware resource (30-K) and first initialization time information (26c) indicating a first initialization time taken when the hardware resource was initialized in the past. And a storage unit (23). According to the failure processing method of the present invention, (a) a step (S4) of starting initialization of the first hardware resource when the information processing apparatus is activated, and (b) initialization of the first hardware resource. Measuring a first elapsed time from the start (S4), and (c) the first elapsed time exceeds the first initialization time before the initialization of the first hardware resource is completed. A step (S6) of detecting an abnormality of the first hardware resource.
本発明においては、ハードウエア資源の初期化中の経過時間とハードウエア資源を過去に初期化した際の初期化時間との比較に基づいてハードウエア資源の異常が検出される。したがって、ハードウエア資源が交換された場合であっても、誤って異常が検出されることが防がれる。また、本発明においては、以下に記載するように、ハードウエア資源から受け取った自己情報と、記憶されている識別情報とを比較することが好ましい。自己情報と識別情報とが一致しない場合、経過時間と初期化時間とを比較しなければ、誤って異常が検出されることが防がれる。 In the present invention, the abnormality of the hardware resource is detected based on the comparison between the elapsed time during the initialization of the hardware resource and the initialization time when the hardware resource is initialized in the past. Therefore, even when hardware resources are exchanged, it is possible to prevent an abnormality from being detected by mistake. Further, in the present invention, as described below, it is preferable to compare the self-information received from the hardware resource with the stored identification information. If the self-information and the identification information do not match, it is possible to prevent an abnormality from being detected by mistake unless the elapsed time and the initialization time are compared.
前記第1ハードウエア資源は、第1実装位置(40−K)に実装されていることが好ましい。前記記憶部は、前記第1ハードウエア資源を示す第1識別情報(26b)と前記第1初期化時間情報とを、前記第1実装位置を示す第1実装位置情報(26a)に対応付けて記憶していることが好ましい。本発明による障害処理方法は、(d)前記第1ハードウエア資源が自己を示す第1自己情報を出力するステップ(S1)と、(e)前記第1自己情報と前記第1識別情報とを比較するステップ(S1)とを具備することが好ましい。 The first hardware resource is preferably mounted at the first mounting position (40-K). The storage unit associates the first identification information (26b) indicating the first hardware resource and the first initialization time information with the first mounting position information (26a) indicating the first mounting position. It is preferable to memorize. The failure processing method according to the present invention includes (d) a step (S1) in which the first hardware resource outputs first self information indicating itself, and (e) the first self information and the first identification information. And comparing (S1).
前記(c)ステップにおいて、前記第1ハードウエア資源の初期化が完了する前に前記第1経過時間が前記第1初期化時間に所定のマージンを加えた時間を超えた場合、前記第1ハードウエア資源の異常を検出することが好ましい。 In the step (c), when the first elapsed time exceeds a time obtained by adding a predetermined margin to the first initialization time before the initialization of the first hardware resource is completed, the first hardware It is preferable to detect an abnormality in the wear resource.
本発明による障害処理方法は、(f)前記第1ハードウエア資源を論理的に切り離すステップ(S9、S10)を具備することが好ましい。 The failure processing method according to the present invention preferably includes (f) a step (S9, S10) of logically separating the first hardware resource.
前記情報処理装置は、第2ハードウエア資源(30−L)を具備することが好ましい。前記第1ハードウエア資源は、第1実装位置(40−K)に実装されている。前記第2ハードウエア資源は、第2実装位置(40−L)に実装されている。前記記憶部は、前記第2実装位置を示す第2実装位置情報(29a)と前記第1実装位置を示す第1実装位置情報(29a)とを関連付けて記憶することが好ましい。本発明による障害処理方法は、(g)前記第1ハードウエア資源及び前記第2ハードウエア資源を論理的に切り離すステップを具備することが好ましい。 The information processing apparatus preferably includes a second hardware resource (30-L). The first hardware resource is mounted at a first mounting position (40-K). The second hardware resource is mounted at the second mounting position (40-L). The storage unit preferably stores the second mounting position information (29a) indicating the second mounting position and the first mounting position information (29a) indicating the first mounting position in association with each other. The failure processing method according to the present invention preferably includes (g) a step of logically separating the first hardware resource and the second hardware resource.
前記情報処理装置は、第3実装位置(40−1)に実装された第3ハードウエア資源(30−1’)を具備することが好ましい。前記記憶部は、第3識別情報(26b)及び第3初期化時間を示す第3初期化時間情報(26c)を、前記第3実装位置を示す第3実装位置情報(26a)に対応付けて記憶することが好ましい。本発明による障害処理方法は、(h)前記第3ハードウエア資源が自己を示す第3自己情報を出力するステップ(S1)と、(i)前記第3自己情報と前記第3識別情報とを比較するステップ(S1)と、(j)前記第3ハードウエア資源の初期化を開始するステップ(S4)と、(k)前記第3ハードウエア資源の初期化を開始してからの第3経過時間を測定するステップ(S4)と、(l)前記第3ハードウエア資源の初期化が完了する前に前記第3経過時間が前記第3初期化時間を超えたとき、前記第3自己情報と前記第3識別情報とが一致している場合に前記第3ハードウエア資源の異常を検出し、一致していない場合に前記第3ハードウエア資源の異常を検出しないステップ(S6)と、(m)前記第3ハードウエア資源を示すように前記第3識別情報を更新し、前記第3ハードウエア資源の初期化が完了したときの前記第3経過時間を示すように前記第3初期化時間情報を更新するステップ(S7)とを具備することが好ましい。 The information processing apparatus preferably includes a third hardware resource (30-1 ') mounted at the third mounting position (40-1). The storage unit associates third identification information (26b) and third initialization time information (26c) indicating a third initialization time with third mounting position information (26a) indicating the third mounting position. It is preferable to memorize. The failure processing method according to the present invention includes (h) a step (S1) in which the third hardware resource outputs third self-information indicating itself, and (i) the third self-information and the third identification information. A comparison step (S1), (j) a step (S4) for starting the initialization of the third hardware resource, and (k) a third process after starting the initialization of the third hardware resource. Measuring time (S4), and (l) when the third elapsed time exceeds the third initialization time before the initialization of the third hardware resource is completed, A step of detecting an abnormality of the third hardware resource when the third identification information matches, and a step of not detecting an abnormality of the third hardware resource when the third identification information does not match; ) Indicates the third hardware resource Updating the third identification information, and updating the third initialization time information to indicate the third elapsed time when the initialization of the third hardware resource is completed (S7). It is preferable to do.
本発明によるプログラムは、上記障害処理方法のいずれかをコンピュータ(1)に実行させる。 The program according to the present invention causes the computer (1) to execute any one of the failure handling methods.
本発明による情報処理装置(1)は、制御部(20)と、第1ハードウエア資源(30−K)と、前記制御部が前記第1ハードウエア資源を過去に初期化したときにかかった第1初期化時間を示す第1初期化時間情報(26c)を記憶した記憶部(23)とを具備する。前記制御部は、前記情報処理装置の起動時に、前記第1ハードウエア資源の初期化を開始し、前記第1ハードウエア資源の初期化を開始してからの第1経過時間を測定し、前記第1ハードウエア資源の初期化が完了する前に前記第1経過時間が前記第1初期化時間を超えた場合、前記第1ハードウエア資源の異常を検出する。 The information processing apparatus (1) according to the present invention is activated when the control unit (20), the first hardware resource (30-K), and the control unit initialize the first hardware resource in the past. And a storage unit (23) storing first initialization time information (26c) indicating the first initialization time. The control unit starts initialization of the first hardware resource at the time of starting up the information processing apparatus, measures a first elapsed time after starting initialization of the first hardware resource, and If the first elapsed time exceeds the first initialization time before the initialization of the first hardware resource is completed, an abnormality of the first hardware resource is detected.
本発明によれば、ハードウエア構成が変更され得る情報処理装置における障害からの自動回復に好適な障害処理方法、プログラム及び情報処理装置が提供される。 According to the present invention, there are provided a failure processing method, a program, and an information processing device suitable for automatic recovery from a failure in an information processing device whose hardware configuration can be changed.
添付図面を参照して、本発明による障害処理方法、プログラム及び情報処理装置を実施するための最良の形態を以下に説明する。 With reference to the attached drawings, the best mode for carrying out the fault processing method, program, and information processing apparatus according to the present invention will be described below.
(第1の実施形態)
図1は、本発明の第1の実施形態に係る情報処理装置1のブロック図を示している。情報処理装置1は、制御部20と、記憶部23と、入力部25と、ハードウエア資源30−1乃至30−Nとを具備する。Nは2以上の自然数をあらわす。制御部20は、初期化時間測定部21と、初期化時間比較部22と、障害部位切り離し部24とを備える。障害部位切り離し部24は、切り離しモード設定情報28とブロック設定テーブル29とを記憶している。記憶部23は、初期化時間テーブル26とプログラム27とを記憶している。ハードウエア資源30−1乃至ハードウエア資源30−Nは、実装位置40−1乃至40−Nに実装されている。例えば、ハードウエア資源30−1は実装位置40−1に実装され、ハードウエア資源30−Kは実装位置40−Kに実装され、ハードウエア資源30−Lは実装位置40−Lに実装され、ハードウエア資源30−Nは実装位置40−Nに実装されている。Kは、1からNまでの自然数のいずれかである。Lは、1からNまでの自然数のいずれかである。KとLとは異なる。ハードウエア資源30−1乃至30−Nは、情報処理装置1の構成要素である。
(First embodiment)
FIG. 1 shows a block diagram of an
制御部20は、プログラム27に基づいて、情報処理装置1の起動時に実装位置40−1乃至40−Nに実装されたハードウエア資源、例えばハードウエア資源30−1乃至30−Nを初期化し、障害処理方法を実行する。制御部20は、必要に応じて実装位置40−1乃至40−Nに実装されたハードウエア資源を論理的に切り離すことで、起動時に発生する障害から情報処理装置1を回復させる。
Based on the
図2は、初期化時間テーブル26のデータ構成を示している。初期化時間テーブル26は、実装位置情報26aと、ハードウエア資源識別情報26bと、初期化時間情報26cとを含む。実装位置情報26a「40−K」は実装位置40−Kを示している。ハードウエア資源識別情報26b「SNK」は実装位置40−Kに実装されていたハードウエア資源を示している。ここで、実装位置40−Kに実装されていたハードウエア資源は、ハードウエア資源30−Kの場合もあるし、他のハードウエア資源の場合もある。初期化時間情報26c「TK秒」は制御部20が実装位置40−Kに実装されていたハードウエア資源を前回初期化したときにかかった時間がTK秒であることを示している。ハードウエア資源識別情報26b「SNK」及び初期化時間情報26c「TK秒」は、実装位置情報26a「40−K」に対応付けられている。ここで、「SNK」は、例えば、実装位置40−Kに実装されていたハードウエア資源のシリアル番号である。
FIG. 2 shows the data structure of the initialization time table 26. The initialization time table 26 includes mounting
切り離しモード設定情報28は、切り分け優先モード又は起動優先モードのいずれかを設定している。切り分け優先モードにおいては、起動後の情報処理装置1の能力の高さが情報処理装置1の起動の速さよりも優先されている。起動優先モードにおいては、情報処理装置1の起動の速さが起動後の情報処理装置1の能力の高さよりも優先されている。切り分け優先モードにおいては、制御部20は、ハードウエア資源30−1乃至30−Nのうち異常が検出されたものだけを論理的に切り離す。起動優先モードにおいては、制御部20は、ハードウエア資源30−1乃至30−Nのうち異常が検出されたものとこれと関連付けられたものとを同時に切り離す。ユーザは、入力部25を操作して、切り離しモード設定情報28が切り分け優先モード又は起動優先モードのどちらを設定しているかを変更することが可能である。
The separation
図3は、ブロック設定テーブル29のデータ構成を示している。ブロック設定テーブル29は、実装位置情報29aと、ブロック情報29bとを含む。ブロック情報29b「第1ブロック」が実装位置情報29a「40−K」に対応付けられている。実装位置情報29a「40−K」は、実装位置40−Kを示している。ブロック情報29b「第1ブロック」が実装位置情報29a「40−L」に対応付けられている。実装位置情報29a「40−L」は実装位置40−Lを示している。ブロック設定テーブル29は、実装位置40−K及び実装位置40−Lが第1ブロックに属することを示している。すなわち、ブロック設定テーブル29は、実装位置40−Kと実装位置40−Lとを関連付けている。ユーザは、入力部25を操作して、ブロック設定テーブル29を自由に設定することが可能である。ユーザは、例えば、一の実装位置に実装されたハードウエア資源に異常がある場合に他の実装位置に実装されたハードウエア資源に異常がある確率が高い場合に、一の実装位置と他の実装位置とを同じブロックに属するように設定することが好ましい。また、ユーザは、一の実装位置に実装されたハードウエア資源と他の実装位置に実装されたハードウエア資源とが必ず同時に使用され、各々単独では使用されない場合に、一の実装位置と他の実装位置とを同じブロックに属するように設定することが好ましい。更に、ユーザは、最小単位での起動を優先してブロック設定テーブル29を設定することが好ましい。
FIG. 3 shows the data structure of the block setting table 29. The block setting table 29 includes mounting
次に、情報処理装置1が実行する障害処理方法について図4を参照して説明する。
Next, a failure processing method executed by the
図4は、情報処理装置1の起動時における動作フローを示している。初期状態において、後述する比較フラグはON状態である。
FIG. 4 shows an operation flow when the
ステップS1において、制御部20は、実装位置40−Kに実装されたハードウエア資源30−Kにハードウエア資源識別情報を要求する。ハードウエア資源30−Kは、自己を示すハードウエア資源識別情報「30−K」を制御部20に出力する。制御部20は、ハードウエア資源30−Kが出力したハードウエア資源識別情報「30−K」とハードウエア資源識別情報26b「SNK」とを比較する。ハードウエア資源識別情報「30−K」とハードウエア資源識別情報26b「SNK」とが一致する場合(図4においてNO)ステップS2に進み、一致しない場合(図4においてYES)ステップS3に進む。
In step S1, the control unit 20 requests hardware resource identification information from the hardware resource 30-K mounted at the mounting position 40-K. The hardware resource 30 -K outputs hardware resource identification information “30-K” indicating itself to the control unit 20. The control unit 20 compares the hardware resource identification information “30-K” output from the hardware resource 30-K with the hardware
ステップS2において、制御部20は、初期化時間テーブル26を参照して実装位置情報26a「40−K」に対応付けられた初期化時間情報26cが存在するか否かを確認する。存在する場合(図4においてYES)、ステップS4に進む。存在しない場合(図4においてNO)、ステップS3に進む。
In step S <b> 2, the control unit 20 refers to the initialization time table 26 and confirms whether or not the
ステップS3において、制御部20は、比較フラグをOFF状態にする。次に、ステップS4に進む。 In step S3, the control unit 20 sets the comparison flag to the OFF state. Next, the process proceeds to step S4.
ステップS4において、制御部20は、ハードウエア資源30−Kの初期化を開始する。初期化時間測定部21は、ハードウエア資源30−Kの初期化を開始してからの経過時間の測定を開始する。初期化時間測定部21は、経過時間を初期化時間比較部22にリアルタイムで通知する。次に、ステップS5に進む。
In step S4, the control unit 20 starts to initialize the hardware resource 30-K. The initialization
ステップS5において、制御部20は、ハードウエア資源30−Kの初期化が完了したか否かを確認する。初期化が完了している場合(図4においてYES)、ステップS7に進む。初期化が完了していない場合(図4においてNO)、ステップS6に進む。 In step S5, the control unit 20 confirms whether or not the initialization of the hardware resource 30-K is completed. If initialization has been completed (YES in FIG. 4), the process proceeds to step S7. If initialization has not been completed (NO in FIG. 4), the process proceeds to step S6.
ステップS6において、初期化時間比較部22は、比較フラグがON状態である場合、経過時間と初期化時間情報26cが示す初期化時間(TK秒)に所定のマージンを加えた基準時間とを比較する。経過時間が基準時間より大きい場合、ステップS8に進む。経過時間が基準時間より大きくない場合、ステップS5に戻る。比較フラグがOFF状態である場合、初期化時間比較部22が経過時間と基準時間とを比較しないでステップS5に戻る。
In step S6, when the comparison flag is in the ON state, the initialization
ステップS7において、初期化時間比較部22は、初期化が完了したときの経過時間を示す経過時間情報を記憶部23に出力する。ここでは、初期化にTK1秒かかった場合について説明する。記憶部23は、初期化が完了したときの経過時間(TK1秒)を示すように初期化時間情報26cを更新する。また、記憶部23は、ハードウエア資源識別情報「30−K」を示すようにハードウエア資源識別情報26bを更新する。次に、ステップS11に進む。
In step S <b> 7, the initialization
ステップS8において、障害部位切り離し部24は、切り離しモード設定情報28が切り分け優先モード又は起動優先モードのどちらを設定しているかを確認する。切り分け優先モードに設定されている場合、ステップS9に進む。起動優先モードに設定されている場合、ステップS10に進む。
In step S <b> 8, the failure part separating unit 24 confirms whether the separation
ステップS9において、障害部位切り離し部24は、ハードウエア資源30−Kを論理的に切り離す。次に、ステップS11に進む。 In step S9, the fault site separating unit 24 logically separates the hardware resource 30-K. Next, the process proceeds to step S11.
ステップS10において、障害部位切り離し部24は、ブロック設定テーブル29を参照して実装位置40−Kに関連付けられた実装位置を検出する。障害部位切り離し部24は、実装位置40−Kと実装位置40−Lの両者が第1ブロックに属しているため、実装位置40−Lを検出する。障害部位切り離し部24は、実装位置40−K及び実装位置40−Lに実装されたハードウエア資源30−K及びハードウエア資源30−Lを論理的に切り離す。次に、ステップS11に進む。 In step S <b> 10, the failure part separating unit 24 refers to the block setting table 29 and detects the mounting position associated with the mounting position 40 -K. The failure part separating unit 24 detects the mounting position 40-L because both the mounting position 40-K and the mounting position 40-L belong to the first block. The failure part separating unit 24 logically separates the hardware resource 30-K and the hardware resource 30-L mounted at the mounting position 40-K and the mounting position 40-L. Next, the process proceeds to step S11.
ステップS11において、制御部20は、比較フラグをON状態にする。ステップS11において、全てのハードウエア資源の初期化が完了している場合(図4においてYES)、障害処理方法を終了する。全てのハードウエア資源の初期化が完了していない場合(図4においてNO)、残りのハードウエア資源について、ステップS1〜ステップS10を実行する。 In step S11, the control unit 20 turns on the comparison flag. In step S11, when all the hardware resources have been initialized (YES in FIG. 4), the failure processing method is terminated. When the initialization of all hardware resources is not completed (NO in FIG. 4), Steps S1 to S10 are executed for the remaining hardware resources.
本実施形態においては、ハードウエア資源の初期化中の経過時間とハードウエア資源が正常に初期化された際の初期化時間との比較に基づいてハードウエア資源の異常が検出されている。また、ハードウエア資源から受け取ったハードウエア資源識別情報と、記憶されているハードウエア資源識別情報とが一致しない場合、経過時間と初期化時間(基準時間)とは比較されない。したがって、ハードウエア資源が交換された場合であっても、誤って異常が検出されることが防がれる。 In the present embodiment, the abnormality of the hardware resource is detected based on the comparison between the elapsed time during initialization of the hardware resource and the initialization time when the hardware resource is normally initialized. Further, when the hardware resource identification information received from the hardware resource does not match the stored hardware resource identification information, the elapsed time and the initialization time (reference time) are not compared. Therefore, even when hardware resources are exchanged, it is possible to prevent an abnormality from being detected by mistake.
次に、情報処理装置1が実行する障害処理方法について具体例を用いて説明する。
Next, a failure processing method executed by the
情報処理装置1の起動開始前において、初期化時間テーブル26は図5に示すデータ構成を有している。実装位置情報26a「40−1」は実装位置40−1を示している。ハードウエア資源識別情報26b「30−1」はハードウエア資源30−1を示している。初期化時間情報26c「T1秒」は制御部20が実装位置40−Kに実装されていたハードウエア資源30−1を前回初期化したときにかかった時間がT1秒であることを示している。
Before the start-up of the
ステップS1において、制御部20は、実装位置40−1に実装されたハードウエア資源30−1にハードウエア資源識別情報を要求する。ハードウエア資源30−1は、自己を示すハードウエア資源識別情報「30−1」を制御部20に出力する。制御部20は、ハードウエア資源30−1が出力したハードウエア資源識別情報「30−1」と図5のハードウエア資源識別情報26b「30−1」とを比較する。ハードウエア資源30−1が出力したハードウエア資源識別情報「30−1」とハードウエア資源識別情報26b「30−1」とが一致しているため、ステップS2に進む。
In step S1, the control unit 20 requests hardware resource identification information from the hardware resource 30-1 mounted at the mounting position 40-1. The hardware resource 30-1 outputs hardware resource identification information “30-1” indicating itself to the control unit 20. The control unit 20 compares the hardware resource identification information “30-1” output from the hardware resource 30-1 with the hardware
ステップS2において、制御部20は、図5の初期化時間テーブル26を参照して実装位置情報26a「40−1」に対応付けられた初期化時間情報26cが存在するか否かを確認する。存在するため、ステップS4に進む。
In step S <b> 2, the control unit 20 refers to the initialization time table 26 of FIG. 5 and confirms whether or not the
ステップS4において、制御部20は、ハードウエア資源30−1の初期化を開始する。初期化時間測定部21は、ハードウエア資源30−1の初期化を開始してからの経過時間の測定を開始する。初期化時間測定部21は、経過時間を初期化時間比較部22にリアルタイムで通知する。
In step S4, the control unit 20 starts to initialize the hardware resource 30-1. The initialization
ステップS5において、制御部20は、ハードウエア資源30−1の初期化が完了したか否かを確認する。初期化が完了している場合、ステップS7に進む。初期化が完了していない場合、ステップS6に進む。 In step S5, the control unit 20 confirms whether or not the initialization of the hardware resource 30-1 is completed. If initialization has been completed, the process proceeds to step S7. If the initialization has not been completed, the process proceeds to step S6.
ステップS6において、初期化時間比較部22は、比較フラグがON状態であるため、経過時間と図5の初期化時間情報26cが示す初期化時間T1秒に所定のマージンを加えた基準時間とを比較する。経過時間が基準時間より大きい場合、ステップS8に進む。経過時間が基準時間より大きくない場合、ステップS5に戻る。
In step S6, since the comparison flag is in the ON state, the initialization
以下、経過時間が基準時間を超える前にハードウエア資源30−1の初期化が完了した場合について説明する。 Hereinafter, a case where the initialization of the hardware resource 30-1 is completed before the elapsed time exceeds the reference time will be described.
ステップS5において、制御部20は、ハードウエア資源30−1の初期化が完了したことを検出する。 In step S5, the control unit 20 detects that the initialization of the hardware resource 30-1 has been completed.
ステップS7において、初期化時間比較部22は、初期化が完了したときの経過時間を示す経過時間情報を記憶部23に出力する。ここでは、初期化にT1’秒かかった場合について説明する。記憶部23は、初期化が完了したときの経過時間(T1’秒)を示すように図5の初期化時間情報26cを更新する。記憶部23は、ハードウエア資源30−1が出力したハードウエア資源識別情報「30−1」を示すように図5のハードウエア資源識別情報26bを更新する。なお、ステップS1において「NO」であった場合、ハードウエア資源識別情報26b「30−1」を更新しなくてもよい。図6は、更新後の初期化時間テーブル26を示している。
In step S <b> 7, the initialization
次に、ステップS11に進む。更に、ハードウエア資源30−2〜ハードウエア資源30−NについてステップS1〜ステップS10を実行する。 Next, the process proceeds to step S11. Further, Steps S1 to S10 are executed for the hardware resources 30-2 to 30-N.
その後、ユーザがハードウエア資源30−1を実装位置40−1から取り外し、ハードウエア資源30−1’を実装位置40−1に実装した後に情報処理装置1を起動した場合について以下に説明する。
Thereafter, a case where the user removes the hardware resource 30-1 from the mounting position 40-1 and starts the
図7は、ハードウエア資源30−1がハードウエア資源30−1’で置き換えられた情報処理装置1を示している。
FIG. 7 shows the
ステップS1において、制御部20は、実装位置40−1に実装されたハードウエア資源30−1’にハードウエア資源識別情報を要求する。ハードウエア資源30−1’は、自己を示すハードウエア資源識別情報「30−1’」を制御部20に出力する。制御部20は、ハードウエア資源30−1’が出力したハードウエア資源識別情報「30−1’」と図6のハードウエア資源識別情報26b「30−1」とを比較する。ハードウエア資源識別情報「30−1’」とハードウエア資源識別情報26b「30−1」とが一致しないため、ステップS3に進む。
In step S1, the control unit 20 requests hardware resource identification information from the hardware resource 30-1 'mounted at the mounting position 40-1. The hardware resource 30-1 'outputs the hardware resource identification information "30-1'" indicating itself to the control unit 20. The control unit 20 compares the hardware resource identification information “30-1 ′” output from the hardware resource 30-1 ′ with the hardware
ステップS3において、制御部20は、比較フラグをOFF状態にする。 In step S3, the control unit 20 sets the comparison flag to the OFF state.
ステップS4において、制御部20は、ハードウエア資源30−1’の初期化を開始する。初期化時間測定部21は、ハードウエア資源30−1’の初期化を開始してからの経過時間の測定を開始する。初期化時間測定部21は、経過時間を初期化時間比較部22にリアルタイムで通知する。
In step S4, the control unit 20 starts to initialize the hardware resource 30-1 '. The initialization
ステップS5において、制御装置20は、ハードウエア資源30−1’の初期化が完了したか否かを確認する。初期化が完了している場合、ステップS7に進む。初期化が完了していない場合、ステップS6に進む。 In step S5, the control device 20 confirms whether or not the initialization of the hardware resource 30-1 'is completed. If initialization has been completed, the process proceeds to step S7. If the initialization has not been completed, the process proceeds to step S6.
ステップS6において、比較フラグがOFF状態であるため、初期化時間比較部22が経過時間と基準時間とを比較しないでステップS5に戻る。
In step S6, since the comparison flag is OFF, the initialization
ステップS5において、制御装置20は、ハードウエア資源30−1の初期化が完了したことを検出する。 In step S5, the control device 20 detects that the initialization of the hardware resource 30-1 has been completed.
ステップS7において、初期化時間比較部22は、初期化が完了したときの経過時間を示す経過時間情報を記憶部23に出力する。ここでは、初期化にT1”秒かかった場合について説明する。記憶部23は、初期化が完了したときの経過時間(T1”秒)を示すように図6の初期化時間情報26cを更新する。記憶部23は、ハードウエア資源30−1’が出力したハードウエア資源識別情報「30−1’」を示すように図6のハードウエア資源識別情報26bを更新する。図8は、更新後の初期化時間テーブル26を示している。
In step S <b> 7, the initialization
次に、ステップS11に進む。更に、ハードウエア資源30−2〜ハードウエア資源30−NについてステップS1〜ステップS10を実行する。 Next, the process proceeds to step S11. Further, Steps S1 to S10 are executed for the hardware resources 30-2 to 30-N.
本実施形態においては、簡易な制御機能を制御部20に持たせるだけで、故障発生部位を明確に特定できないような場合でも、故障の発生が疑われる部位の切り離しを自動で行うことが可能である。また、情報処理装置1の起動時にハードウエア資源識別情報が変更されているかどうかの確認を行うため、増設や保守交換によりハードウエア資源の初期化時間が長くなった場合であっても故障の誤検出が防がれる。さらに、ユーザが切り離しモードを変更できるようになっているため、ユーザの要望に柔軟に対応することが可能である。
In the present embodiment, it is possible to automatically detach a part that is suspected of occurrence of a failure even if it is not possible to clearly identify the part where the failure has occurred simply by having the control unit 20 have a simple control function. is there. In addition, since it is checked whether the hardware resource identification information has been changed when the
1…情報処理装置
20…制御部
21…初期化時間測定部
22…初期化時間比較部
23…記憶部
24…障害部位切り離し部
25…入力部
26…初期化時間テーブル
26a…実装位置情報
26b…ハードウエア資源識別情報
26c…初期化時間情報
27…プログラム
28…切り離しモード設定情報
29…ブロック設定テーブル
29a…実装位置情報
29b…ブロック情報
30−1〜30−N、30−1’…ハードウエア資源
40−1〜40−N…実装位置
DESCRIPTION OF
Claims (8)
前記情報処理装置は、
第1ハードウエア資源と、
前記第1ハードウエア資源を過去に初期化したときにかかった第1初期化時間を示す第1初期化時間情報を記憶した記憶部と
を具備し、
(a)前記情報処理装置の起動時に、前記第1ハードウエア資源の初期化を開始するステップと、
(b)前記第1ハードウエア資源の初期化を開始してからの第1経過時間を測定するステップと、
(c)前記第1ハードウエア資源の初期化が完了する前に前記第1経過時間が前記第1初期化時間を超えた場合、前記第1ハードウエア資源の異常を検出するステップと
を具備する
障害処理方法。 A failure processing method for an information processing apparatus,
The information processing apparatus includes:
A first hardware resource;
A storage unit storing first initialization time information indicating a first initialization time taken when the first hardware resource was initialized in the past;
(A) starting the initialization of the first hardware resource when starting up the information processing apparatus;
(B) measuring a first elapsed time from the start of initialization of the first hardware resource;
(C) detecting an abnormality of the first hardware resource when the first elapsed time exceeds the first initialization time before the initialization of the first hardware resource is completed. Failure handling method.
前記記憶部は、前記第1ハードウエア資源を示す第1識別情報と前記第1初期化時間情報とを、前記第1実装位置を示す第1実装位置情報に対応付けて記憶し、
(d)前記第1ハードウエア資源が自己を示す第1自己情報を出力するステップと、
(e)前記第1自己情報と前記第1識別情報とを比較するステップと
を具備する
請求項1の障害処理方法。 The first hardware resource is mounted at a first mounting location;
The storage unit stores first identification information indicating the first hardware resource and the first initialization time information in association with first mounting position information indicating the first mounting position,
(D) the first hardware resource outputting first self-information indicating self;
The failure processing method according to claim 1, further comprising: (e) comparing the first self-information with the first identification information.
請求項1又は2の障害処理方法。 In the step (c), when the first elapsed time exceeds a time obtained by adding a predetermined margin to the first initialization time before the initialization of the first hardware resource is completed, the first hardware The failure processing method according to claim 1, wherein an abnormality of a wear resource is detected.
請求項1乃至3のいずれかに記載の障害処理方法。 The failure processing method according to claim 1, further comprising: (f) logically separating the first hardware resource.
前記第1ハードウエア資源は、第1実装位置に実装され、
前記第2ハードウエア資源は、第2実装位置に実装され、
前記記憶部は、前記第2実装位置を示す第2実装位置情報と前記第1実装位置を示す第1実装位置情報とを関連付けて記憶し、
(g)前記第1ハードウエア資源及び前記第2ハードウエア資源を論理的に切り離すステップを具備する
請求項1の障害処理方法。 The information processing apparatus includes a second hardware resource,
The first hardware resource is mounted at a first mounting location;
The second hardware resource is mounted at a second mounting location;
The storage unit associates and stores second mounting position information indicating the second mounting position and first mounting position information indicating the first mounting position;
The failure processing method according to claim 1, further comprising: (g) logically separating the first hardware resource and the second hardware resource.
前記記憶部は、第3識別情報及び第3初期化時間を示す第3初期化時間情報を、前記第3実装位置を示す第3実装位置情報に対応付けて記憶し、
(h)前記第3ハードウエア資源が自己を示す第3自己情報を出力するステップと、
(i)前記第3自己情報と前記第3識別情報とを比較するステップと、
(j)前記第3ハードウエア資源の初期化を開始するステップと、
(k)前記第3ハードウエア資源の初期化を開始してからの第3経過時間を測定するステップと、
(l)前記第3ハードウエア資源の初期化が完了する前に前記第3経過時間が前記第3初期化時間を超えたとき、前記第3自己情報と前記第3識別情報とが一致している場合に前記第3ハードウエア資源の異常を検出し、一致していない場合に前記第3ハードウエア資源の異常を検出しないステップと、
(m)前記第3ハードウエア資源を示すように前記第3識別情報を更新し、前記第3ハードウエア資源の初期化が完了したときの前記第3経過時間を示すように前記第3初期化時間情報を更新するステップと
を具備する
請求項1乃至5のいずれかに記載の障害処理方法。 The information processing apparatus includes a third hardware resource mounted at a third mounting position,
The storage unit stores third identification information and third initialization time information indicating a third initialization time in association with third mounting position information indicating the third mounting position,
(H) outputting third self-information indicating the self by the third hardware resource;
(I) comparing the third self-information with the third identification information;
(J) starting initialization of the third hardware resource;
(K) measuring a third elapsed time since starting the initialization of the third hardware resource;
(L) When the third elapsed time exceeds the third initialization time before the initialization of the third hardware resource is completed, the third self-information matches the third identification information. Detecting an abnormality in the third hardware resource if not, and not detecting an abnormality in the third hardware resource if they do not match;
(M) updating the third identification information to indicate the third hardware resource, and the third initialization to indicate the third elapsed time when the initialization of the third hardware resource is completed. The failure processing method according to claim 1, further comprising a step of updating time information.
第1ハードウエア資源と、
前記制御部が前記第1ハードウエア資源を過去に初期化したときにかかった第1初期化時間を示す第1初期化時間情報を記憶した記憶部と
を具備し、
前記制御部は、
前記情報処理装置の起動時に、前記第1ハードウエア資源の初期化を開始し、
前記第1ハードウエア資源の初期化を開始してからの第1経過時間を測定し、
前記第1ハードウエア資源の初期化が完了する前に前記第1経過時間が前記第1初期化時間を超えた場合、前記第1ハードウエア資源の異常を検出する
情報処理装置。 A control unit;
A first hardware resource;
A storage unit storing first initialization time information indicating a first initialization time taken when the control unit initialized the first hardware resource in the past;
The controller is
When starting up the information processing device, start initialization of the first hardware resource,
Measuring a first elapsed time from the start of initialization of the first hardware resource;
An information processing apparatus that detects an abnormality of the first hardware resource when the first elapsed time exceeds the first initialization time before the initialization of the first hardware resource is completed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007051045A JP5019252B2 (en) | 2007-03-01 | 2007-03-01 | Fault processing method, program, and information processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007051045A JP5019252B2 (en) | 2007-03-01 | 2007-03-01 | Fault processing method, program, and information processing apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008217191A true JP2008217191A (en) | 2008-09-18 |
JP5019252B2 JP5019252B2 (en) | 2012-09-05 |
Family
ID=39837190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007051045A Expired - Fee Related JP5019252B2 (en) | 2007-03-01 | 2007-03-01 | Fault processing method, program, and information processing apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5019252B2 (en) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04178871A (en) * | 1990-11-14 | 1992-06-25 | Pfu Ltd | Initialization processing device |
JPH04270403A (en) * | 1991-02-26 | 1992-09-25 | Nec Corp | Method and device for ipl management at computer system |
JPH0659701A (en) * | 1992-08-10 | 1994-03-04 | Fujitsu Ltd | Switching control system |
JPH07219913A (en) * | 1994-01-28 | 1995-08-18 | Fujitsu Ltd | Control method and apparatus for multiprocessor system |
JPH07295670A (en) * | 1994-04-27 | 1995-11-10 | Chubu Nippon Denki Software Kk | Starting method for computer system |
JPH10171546A (en) * | 1996-12-12 | 1998-06-26 | Omron Corp | Activation monitoring device |
JP2005122424A (en) * | 2003-10-16 | 2005-05-12 | Canon Inc | Watchdog timer |
-
2007
- 2007-03-01 JP JP2007051045A patent/JP5019252B2/en not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04178871A (en) * | 1990-11-14 | 1992-06-25 | Pfu Ltd | Initialization processing device |
JPH04270403A (en) * | 1991-02-26 | 1992-09-25 | Nec Corp | Method and device for ipl management at computer system |
JPH0659701A (en) * | 1992-08-10 | 1994-03-04 | Fujitsu Ltd | Switching control system |
JPH07219913A (en) * | 1994-01-28 | 1995-08-18 | Fujitsu Ltd | Control method and apparatus for multiprocessor system |
JPH07295670A (en) * | 1994-04-27 | 1995-11-10 | Chubu Nippon Denki Software Kk | Starting method for computer system |
JPH10171546A (en) * | 1996-12-12 | 1998-06-26 | Omron Corp | Activation monitoring device |
JP2005122424A (en) * | 2003-10-16 | 2005-05-12 | Canon Inc | Watchdog timer |
Also Published As
Publication number | Publication date |
---|---|
JP5019252B2 (en) | 2012-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240012706A1 (en) | Method, system and apparatus for fault positioning in starting process of server | |
US9471435B2 (en) | Information processing device, information processing method, and computer program | |
US10068015B2 (en) | Monitoring a monitoring-target process | |
JP4586750B2 (en) | Computer system and start monitoring method | |
CN106776282A (en) | The abnormality eliminating method and device of a kind of bios program | |
WO2016206514A1 (en) | Startup processing method and device | |
CN103970564A (en) | Automatic repairing and upgrading method of embedded operating system and embedded operating system with automatic repairing and upgrading functions | |
US20170132102A1 (en) | Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus | |
JP5212357B2 (en) | Multi-CPU abnormality detection and recovery system, method and program | |
JP4886558B2 (en) | Information processing device | |
US20170242760A1 (en) | Monitoring device, fault-tolerant system, and control method | |
CN109086085B (en) | Operating system start management method and device | |
JP6880961B2 (en) | Information processing device and log recording method | |
US20180081762A1 (en) | Information processing device | |
JP5019252B2 (en) | Fault processing method, program, and information processing apparatus | |
CN105159810B (en) | The method and device that the BIOS of computer system is tested | |
JP5369945B2 (en) | Configuration information setting method and information processing apparatus | |
CN116340957B (en) | Program starting method, device, server and nonvolatile storage medium | |
JP2006065440A (en) | Process management system | |
JP2015106226A (en) | Dual system | |
JP6835423B1 (en) | Information processing system and its initialization method | |
JP6822203B2 (en) | Firmware Execution Device, Driver Execution Device, Driver Management Device, Firmware Management Device, Computer Device, Method and Program | |
US10108499B2 (en) | Information processing device with watchdog timer | |
CN116737396B (en) | Method, device, electronic equipment and storage medium for configuring maintainability of server | |
US20240143474A1 (en) | System and method for dynamic sensors support in ipmi stack |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120309 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120521 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120603 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150622 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |