JP2013061841A - Information processing device and test method for information processing device - Google Patents

Information processing device and test method for information processing device Download PDF

Info

Publication number
JP2013061841A
JP2013061841A JP2011200329A JP2011200329A JP2013061841A JP 2013061841 A JP2013061841 A JP 2013061841A JP 2011200329 A JP2011200329 A JP 2011200329A JP 2011200329 A JP2011200329 A JP 2011200329A JP 2013061841 A JP2013061841 A JP 2013061841A
Authority
JP
Japan
Prior art keywords
test
control unit
unit
identification information
counter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011200329A
Other languages
Japanese (ja)
Other versions
JP5909948B2 (en
Inventor
Takashi Kitamura
孝 喜田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2011200329A priority Critical patent/JP5909948B2/en
Publication of JP2013061841A publication Critical patent/JP2013061841A/en
Application granted granted Critical
Publication of JP5909948B2 publication Critical patent/JP5909948B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stored Programmes (AREA)
  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To restore from hang-up in testing.SOLUTION: An information processing device includes: an identification information storage section 1b2 that stores identification information for identifying a test for a test item executed currently out of a plurality of test items; a control unit 1a including a test execution section 1a1 that executes tests for the test items of a test object and changes the identification information stored in the identification information storage unit 1b2 to identification information of a test for a test item to be executed next, whenever finishing a test for a single test item, and a determination section 1a2 for determining whether the identification information stored in the identification information storage section 1b2 is changed within a predetermined time or not; and a command unit 1c, when the determination section 1a2 determines that the identification information is not changed within the predetermined time, commanding a voltage supply circuit 4 to reboot the control unit 1a.

Description

本発明は情報処理装置および情報処理装置の試験方法に関する。   The present invention relates to an information processing apparatus and an information processing apparatus testing method.

製品の信頼性を保証するために、製品の開発期間中および製造期間中に電圧、温度、クロック周波数等の、製品の選択されたコンポーネントに関連した動作状況の変化に対してマージン試験を行うことが知られている。また、マージン試験を行う製品の動作監視を行うウォッチドッグタイマ回路を製品内に設け、製品内のCPUやメモリが動作不能となった場合には、ウォッチドックタイマが動作し、リセット信号をCPUおよび電源部に出力する技術が知られている。   To ensure product reliability, perform margin testing for changes in operating conditions associated with selected components of the product, such as voltage, temperature, and clock frequency, during product development and manufacturing. It has been known. Also, a watchdog timer circuit that monitors the operation of the product that performs the margin test is provided in the product, and when the CPU or memory in the product becomes inoperable, the watchdog timer operates and the reset signal is sent to the CPU and A technique for outputting to a power supply unit is known.

特開2005−18761号公報JP 2005-18761 A 特開平5−2502号公報JP-A-5-2502

例えば、製品の電圧やクロック周波数を一定時間毎に変更するマージン試験を、試験項目を変えて連続して実行する場合、製品のCPUやメモリがハングアップ(hang-up)する等の理由により、試験項目が変更されなくなる場合がある。この場合、マージン試験自体は停止せずに実行されるため、ウォッチドッグタイマ回路ではエラーが検出できないという問題がある。   For example, when a margin test that changes the voltage or clock frequency of a product at regular intervals is executed continuously by changing test items, the product CPU or memory hangs up. Test items may not be changed. In this case, since the margin test itself is executed without stopping, there is a problem that the watchdog timer circuit cannot detect an error.

本発明はこのような点に鑑みてなされたものであり、試験時にハングアップから復旧する情報処理装置および情報処理装置の試験方法を提供することを目的とする。   The present invention has been made in view of these points, and an object thereof is to provide an information processing apparatus that recovers from a hang-up during a test and a method for testing the information processing apparatus.

上記目的を達成するために、開示の情報処理装置が提供される。この情報処理装置は、識別情報記憶部と、制御部と、指示部とを有している。
識別情報記憶部は、複数の試験項目のうち、現在実行されている試験項目の試験を識別する識別情報を記憶する。
In order to achieve the above object, a disclosed information processing apparatus is provided. The information processing apparatus includes an identification information storage unit, a control unit, and an instruction unit.
The identification information storage unit stores identification information for identifying a test of a test item currently being executed among the plurality of test items.

制御部は、試験対象に複数の試験項目の試験をそれぞれ実行し、1つの試験項目の試験の終了に伴い識別情報記憶部に記憶されている識別情報を、次に実行する試験項目の試験の識別情報に変更する試験実行部と、所定時間以内に識別情報記憶部に記憶されている識別情報が変更されたか否かを判断する判断部とを備える。   The control unit executes tests of a plurality of test items on the test object, and the identification information stored in the identification information storage unit at the end of the test of one test item is used for the test of the test item to be executed next. A test execution unit that changes to identification information, and a determination unit that determines whether or not the identification information stored in the identification information storage unit has been changed within a predetermined time.

指示部は、判断部が、識別情報が所定時間以内に変更されなかったと判断した場合、制御部の再起動を制御部に電圧を供給する回路に指示する。   When the determination unit determines that the identification information has not been changed within a predetermined time, the instruction unit instructs the circuit that supplies a voltage to the control unit to restart the control unit.

試験時にハングアップから復旧することができる。   Can recover from hang-ups during testing.

第1の実施の形態の情報処理装置を示す図である。It is a figure which shows the information processing apparatus of 1st Embodiment. 第2の実施の形態のストレージ装置の全体構成図を示す図である。It is a figure which shows the whole block diagram of the storage apparatus of 2nd Embodiment. ストレージシステム内の制御モジュールのハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of the control module in a storage system. CPUが備える機能を示すブロック図である。It is a block diagram which shows the function with which CPU is provided. 制御モジュールの処理を説明するフローチャートである。It is a flowchart explaining the process of a control module. 制御モジュールの処理を説明するフローチャートである。It is a flowchart explaining the process of a control module. PostPhase監視処理を説明するフローチャートである。It is a flowchart explaining a PostPhase monitoring process. WDT処理を説明するフローチャートである。It is a flowchart explaining a WDT process. WDT監視処理を説明するフローチャートである。It is a flowchart explaining a WDT monitoring process. 試験結果を説明する図である。It is a figure explaining a test result.

以下、実施の形態の情報処理装置を、図面を参照して詳細に説明する。
<第1の実施の形態>
図1は、第1の実施の形態の情報処理装置を示す図である。
Hereinafter, an information processing apparatus according to an embodiment will be described in detail with reference to the drawings.
<First Embodiment>
FIG. 1 is a diagram illustrating the information processing apparatus according to the first embodiment.

第1の実施の形態の情報処理装置(コンピュータ)1は、制御部1aと、記憶部1bと、指示部1cと、制御部1aに伝送路3を介して接続された接続機器2と、制御部1aおよび接続機器2に電圧を供給する電圧供給回路4とを有している。制御部1aは、CPU(Central Processing Unit)が備える機能により実現することができる。記憶部1bは、例えば不揮発性のメモリデバイスが備えるデータ記憶領域により実現することができる。指示部1cは、例えばFPGA(Field Programmable Gate Array)が備える機能により実現することができる。   The information processing apparatus (computer) 1 according to the first embodiment includes a control unit 1a, a storage unit 1b, an instruction unit 1c, a connection device 2 connected to the control unit 1a via a transmission path 3, and a control unit. And a voltage supply circuit 4 for supplying a voltage to the unit 1a and the connection device 2. The control unit 1a can be realized by a function provided in a CPU (Central Processing Unit). The storage unit 1b can be realized by, for example, a data storage area included in a nonvolatile memory device. The instruction unit 1c can be realized by a function provided in, for example, an FPGA (Field Programmable Gate Array).

接続機器2としては、例えば、PCIe(PCI Express)スイッチや、SAS(Serial Attached SCSI)エクスパンダ等のSASデバイスが挙げられる。
制御部1aは、試験実行部1a1と、判断部1a2とを有している。
Examples of the connected device 2 include SAS devices such as a PCIe (PCI Express) switch and a SAS (Serial Attached SCSI) expander.
The control unit 1a includes a test execution unit 1a1 and a determination unit 1a2.

試験実行部1a1は、試験対象である制御部1a自身および接続機器2の電圧、クロック周波数を設計値から±1%、±2%・・・と順に変化させながら、試験項目に従って制御部1a、接続機器2に負荷をかけるマージン試験を実行する。本実施の形態のマージン試験をより具体的に説明すると、マージン試験では情報処理装置1を一定時間(例えば1時間)連続して運転する。運転中に、最初の試験項目である接続機器2のマージン試験を30分間行い、その後、2番目の試験項目である制御部1aのマージン試験を30分行う。そして、情報処理装置1の運転中に制御部1aおよび接続機器2に発生した異常の種別に基づいて、情報処理装置1が電源電圧、クロック周波数の変化に対してどこまでマージンを持っているのかを検証する。   The test execution unit 1a1 changes the voltage and clock frequency of the control unit 1a itself and the connected device 2 to be tested in order of ± 1%, ± 2%,... A margin test for applying a load to the connected device 2 is executed. The margin test of the present embodiment will be described more specifically. In the margin test, the information processing apparatus 1 is continuously operated for a certain time (for example, 1 hour). During operation, the margin test of the connected device 2 that is the first test item is performed for 30 minutes, and then the margin test of the control unit 1a that is the second test item is performed for 30 minutes. Then, based on the type of abnormality that has occurred in the control unit 1a and the connected device 2 during the operation of the information processing apparatus 1, how far the information processing apparatus 1 has a margin for changes in the power supply voltage and the clock frequency. Validate.

記憶部1bは、マージン試験の実行状態を示すフラグを記憶するフラグ記憶部1b1と、現在実行されているマージン試験の試験項目を識別する識別情報を記憶する識別情報記憶部1b2を有する。   The storage unit 1b includes a flag storage unit 1b1 that stores a flag indicating a margin test execution state, and an identification information storage unit 1b2 that stores identification information for identifying a test item of a margin test currently being executed.

フラグ記憶部1b1のフラグは、試験実行部1a1がマージン試験を実行しているときに1(有効)にセットされ、マージン試験を実行していないときに0(無効)にセットされる。また、最初の試験項目である接続機器2のマージン試験を行っている場合の識別情報は「TP1」であり、2番目の試験項目である制御部1aのマージン試験を行っている場合の識別情報は「TP2」である。   The flag in the flag storage unit 1b1 is set to 1 (valid) when the test execution unit 1a1 is executing a margin test, and is set to 0 (invalid) when the margin test is not being performed. The identification information when the margin test of the connected device 2 that is the first test item is performed is “TP1”, and the identification information when the margin test of the control unit 1a that is the second test item is performed. Is “TP2”.

試験実行部1a1は、マージン試験を開始する際に、フラグ記憶部1b1のフラグを1に設定する。また、試験実行部1a1は、接続機器2のマージン試験を行う際に、識別情報として「TP1」を識別情報記憶部1b2に設定する。そして、試験実行部1a1は、接続機器2のマージン試験の終了に伴い識別情報記憶部1b2に記憶されている「TP1」を、次に実行する制御部1aのマージン試験の識別情報である「TP2」に変更する。   The test execution unit 1a1 sets the flag in the flag storage unit 1b1 to 1 when starting the margin test. The test execution unit 1a1 sets “TP1” as identification information in the identification information storage unit 1b2 when performing a margin test of the connected device 2. Then, the test execution unit 1a1 performs “TP1” stored in the identification information storage unit 1b2 upon completion of the margin test of the connected device 2, and “TP2” is the margin test identification information of the control unit 1a that executes next. Change to

判断部1a2は、フラグ記憶部1b1に記憶されているフラグが1であるとき、すなわち、試験実行部1a1がマージン試験を実行しているときに識別情報記憶部1b2に記憶されている識別情報を監視し、識別情報が35分以内に「TP1」から「TP2」に変更されたか否かを判断する。なお、35分は、接続機器2のマージン試験が30分行われることに基づき、識別情報の変更の判断に用いる時間の一例であり、情報処理装置1の管理者が任意の時間に設定することができる。識別情報が35分以内に「TP1」から「TP2」に変更されなかった場合は、制御部1aがハングアップし、接続機器2のマージン試験から制御部1aのマージン試験に移行していないと管理者が判断することができる。   The determination unit 1a2 displays the identification information stored in the identification information storage unit 1b2 when the flag stored in the flag storage unit 1b1 is 1, that is, when the test execution unit 1a1 is executing a margin test. Monitoring is performed to determine whether or not the identification information has been changed from “TP1” to “TP2” within 35 minutes. Note that 35 minutes is an example of a time used to determine whether to change the identification information based on a 30-minute margin test of the connected device 2, and the administrator of the information processing apparatus 1 can set an arbitrary time. it can. If the identification information is not changed from “TP1” to “TP2” within 35 minutes, the control unit 1a hangs up and is managed if the margin test of the connected device 2 is not shifted to the margin test of the control unit 1a. Can judge.

また、判断部1a2は、接続機器2のマージン試験の開始に伴い、指示部1cが備えるカウンタ1c1のカウンタ値を所定値(以下、第1のカウンタ値と言う)にセットする。なお、カウンタ1c1は、アップカウンタでもよいし、ダウンカウンタでもよいが、本実施の形態ではダウンカウンタであるものとして説明する。   The determination unit 1a2 sets the counter value of the counter 1c1 included in the instruction unit 1c to a predetermined value (hereinafter referred to as a first counter value) with the start of the margin test of the connected device 2. The counter 1c1 may be an up-counter or a down-counter, but will be described as being a down-counter in the present embodiment.

指示部1cは、カウンタ1c1が第1のカウンタ値にセットされると、カウンタ1c1のカウントを開始する。指示部1cは、カウンタ1c1のカウンタ値が「0」に達すると、判断部1a2によるカウンタ1c1へのカウンタ値のセットが停止されたと判断する。なお、「0」は、第2のカウンタ値の一例である。   When the counter 1c1 is set to the first counter value, the instruction unit 1c starts counting of the counter 1c1. When the counter value of the counter 1c1 reaches “0”, the instruction unit 1c determines that setting of the counter value to the counter 1c1 by the determination unit 1a2 is stopped. “0” is an example of the second counter value.

判断部1a2は、接続機器2のマージン試験が開始されてから識別情報が「TP1」である間は、カウンタ値が「0」に達しないように、カウンタ1c1を第1のカウンタ値にセットする動作を定期的に繰り返し行う。   The determination unit 1a2 sets the counter 1c1 to the first counter value so that the counter value does not reach “0” while the identification information is “TP1” after the margin test of the connected device 2 is started. Repeat the operation periodically.

判断部1a2は、識別情報が35分以内に「TP1」から「TP2」に変更されなかったと判断した場合、カウンタ1c1への第1のカウンタ値のセットを停止する。第1のカウンタ値のセットが停止されることにより、カウンタ1c1のカウンタ値が、「0」に達する。   If the determination unit 1a2 determines that the identification information has not been changed from “TP1” to “TP2” within 35 minutes, the determination unit 1a2 stops setting the first counter value in the counter 1c1. When the setting of the first counter value is stopped, the counter value of the counter 1c1 reaches “0”.

指示部1cは、カウンタ1c1のカウンタ値が「0」に達すると、制御部1aの再起動を電圧供給回路4に指示する。このように、カウンタ1c1を用いて識別情報の変更を確認することにより、指示部1cは、制御部1aの動作状態にかかわらず、制御部1aのハングアップを認識することができる。   When the counter value of the counter 1c1 reaches “0”, the instruction unit 1c instructs the voltage supply circuit 4 to restart the control unit 1a. Thus, by confirming the change of the identification information using the counter 1c1, the instruction unit 1c can recognize the hang-up of the control unit 1a regardless of the operation state of the control unit 1a.

電圧供給回路4は、指示部1cから制御部1aを再起動する指示を受け付けると、制御部1aを再起動する。すなわち、制御部1aの電源をON状態からOFF状態にし、再度ON状態にする処理を行う。   When the voltage supply circuit 4 receives an instruction to restart the control unit 1a from the instruction unit 1c, the voltage supply circuit 4 restarts the control unit 1a. That is, the process of changing the power of the control unit 1a from the ON state to the OFF state and turning it ON again is performed.

情報処理装置1によれば、マージン試験の試験項目を識別する識別情報の変更の有無を判断し、識別情報が所定時間以内に更新されなかった場合、制御部1aの再起動を行うことにより、ハングアップから復旧する。従って、例えば、制御部1aが再起動された場合、再起動前の試験項目の次の試験項目でマージン試験を続行するよう設定しておけば、マージン試験を継続して行うことができる。なお、本実施の形態では、試験項目が35分以内に更新されなかった場合、制御部1aの再起動を行うようにしたが、制御部1aの再起動を行う前に制御部1aをリセットし、リセット後も試験項目が所定時間以内に更新されなかった場合、制御部1aの再起動を実行するようにしてもよい。   According to the information processing apparatus 1, it is determined whether or not the identification information for identifying the test item of the margin test has been changed, and when the identification information is not updated within a predetermined time, the control unit 1a is restarted, Recover from a hangup. Therefore, for example, when the control unit 1a is restarted, the margin test can be continued if the margin test is set to continue with the test item next to the test item before the restart. In this embodiment, when the test item is not updated within 35 minutes, the control unit 1a is restarted. However, before the control unit 1a is restarted, the control unit 1a is reset. If the test item is not updated within a predetermined time even after resetting, the control unit 1a may be restarted.

以下、第2の実施の形態において、開示の情報処理装置をストレージ装置に適用した場合について説明する。
<第2の実施の形態>
図2は、第2の実施の形態のストレージ装置の全体構成図を示す図である。
Hereinafter, in the second embodiment, a case where the disclosed information processing apparatus is applied to a storage apparatus will be described.
<Second Embodiment>
FIG. 2 is an overall configuration diagram of the storage apparatus according to the second embodiment.

図2に示すストレージ装置100は、複数のHDDを備える。ストレージ装置100内のDE(Drive Enclosure)210、220のそれぞれには、ストレージ装置を構成する複数のHDDが格納されている。また、ストレージ装置100は、DE210、220内のHDDに対するアクセスを制御する2つの制御モジュール(CM:Controller Module)10a、10bを備えている。なお、DE210、220は、例えば、ストレージ装置100の外部に設けられていてもよい。また、ストレージ装置としては、HDDに限らず、例えばSSD(Solid State Drive)等の他の種類のストレージ装置が使用されてもよい。   The storage apparatus 100 illustrated in FIG. 2 includes a plurality of HDDs. Each of DE (Drive Enclosure) 210 and 220 in the storage apparatus 100 stores a plurality of HDDs constituting the storage apparatus. The storage apparatus 100 also includes two control modules (CM: Controller Module) 10a and 10b that control access to the HDDs in the DEs 210 and 220. The DEs 210 and 220 may be provided outside the storage apparatus 100, for example. The storage device is not limited to the HDD, and other types of storage devices such as an SSD (Solid State Drive) may be used.

ストレージ装置100には、ホスト装置110と管理端末装置120とが接続されている。ホスト装置110は、ユーザの操作に応じてストレージ装置100内の制御モジュール10aまたは制御モジュール10bに対して、DE210内のHDDまたはDE220内のHDDへのアクセスを要求する。なお、ホスト装置110と制御モジュール10a、10bとは、例えば、光ファイバを介して接続されている。   A host device 110 and a management terminal device 120 are connected to the storage device 100. The host device 110 requests the control module 10a or the control module 10b in the storage device 100 to access the HDD in the DE 210 or the HDD in the DE 220 in accordance with a user operation. The host device 110 and the control modules 10a and 10b are connected via an optical fiber, for example.

管理端末装置120は、管理者の操作に応じてストレージ装置100の動作を管理する。例えば、管理端末装置120は、管理者の操作に応じてストレージ装置100内の制御モジュール10a、10bのそれぞれの電源をON状態にしたり、OFF状態にしたりすることを要求することができる。なお、管理端末装置120と制御モジュール10a、10bとは、例えば、LAN(Local Area Network)ケーブルを介して接続されている。また、管理端末装置120は、ストレージ装置100に対し後述するマージン試験を行った結果を示すログファイルを管理端末装置120が備える図示しない記憶部に記憶する。   The management terminal device 120 manages the operation of the storage device 100 according to the operation of the administrator. For example, the management terminal device 120 can request that the power of each of the control modules 10a and 10b in the storage device 100 be turned on or turned off according to the operation of the administrator. The management terminal device 120 and the control modules 10a and 10b are connected via, for example, a LAN (Local Area Network) cable. In addition, the management terminal device 120 stores a log file indicating a result of a margin test described later on the storage device 100 in a storage unit (not shown) included in the management terminal device 120.

制御モジュール10a、10bは、それぞれ、ホスト装置110からのアクセス要求に応じてDE210、220内のHDDへのアクセスを制御する。例えば、制御モジュール10a、10bは、それぞれ、HDDに記憶されたデータの読み出し要求をホスト装置110から受け付けると、読み出しを要求されたデータをHDDから読み出し、ホスト装置110に送信する。あるいは、制御モジュール10a、10bは、それぞれ、HDDへのデータの書き込み要求をホスト装置110から受け付けると、書き込みを要求されたデータをHDDに書き込む。   The control modules 10a and 10b respectively control access to the HDDs in the DEs 210 and 220 in response to an access request from the host device 110. For example, when the control module 10 a or 10 b receives a read request for data stored in the HDD from the host device 110, the control module 10 a or 10 b reads the data requested to be read from the HDD and transmits it to the host device 110. Alternatively, when each control module 10a, 10b receives a data write request to the HDD from the host device 110, the control module 10a, 10b writes the data requested to be written to the HDD.

また、制御モジュール10a、10bは、DE210、220内のHDDに記憶されたデータをキャッシュする機能を備える。また、制御モジュール10aと制御モジュール10bとは互いにデータを送受信でき、制御モジュール10a、10bは、例えば、他方のCMが保持するキャッシュデータのバックアップを互いに保持する。また、制御モジュール10a、10bの一方は、制御モジュール10a、10bの他方の電源を制御することも可能になっている。なお、制御モジュール10a、10bは、例えば、DE210、220内のHDDに記憶されたデータをRAID(Redundant Arrays of Inexpensive Disks)によって管理してもよい。   The control modules 10a and 10b have a function of caching data stored in the HDDs in the DEs 210 and 220. The control module 10a and the control module 10b can transmit and receive data to and from each other, and the control modules 10a and 10b hold, for example, backups of cache data held by the other CM. In addition, one of the control modules 10a and 10b can control the other power source of the control modules 10a and 10b. The control modules 10a and 10b may manage the data stored in the HDDs in the DEs 210 and 220, for example, using RAID (Redundant Arrays of Inexpensive Disks).

図3は、ストレージシステム内の制御モジュールのハードウェア構成例を示す図である。
制御モジュール10a、10bは、マージン試験を行う機能を有している。本実施の形態で実行するマージン試験は、制御モジュール10a、10bに電力やクロック信号を供給するデバイスの個体差や、ストレージ装置100の使用環境等によって発生する電源電圧、クロック周波数の設計値からのずれを考慮しても、ストレージ装置100が正常に動作することを確認する試験である。より具体的には、本実施の形態のマージン試験は、ストレージ装置100の制御モジュール10a、10bおよびDE210、220内で使用されている各デバイスの電源電圧、クロック周波数を設計値から±1%、±2%・・・と順に変化させながら、試験対象のデバイスに負荷をかける。負荷をかける試験対象のデバイスおよび負荷をかける箇所は、用意された試験項目により予め決定されている。
FIG. 3 is a diagram illustrating a hardware configuration example of the control module in the storage system.
The control modules 10a and 10b have a function of performing a margin test. The margin test executed in the present embodiment is based on the individual values of devices that supply power and clock signals to the control modules 10a and 10b, the power supply voltage generated by the usage environment of the storage apparatus 100, and the design values of the clock frequency. This is a test for confirming that the storage apparatus 100 operates normally even when the deviation is taken into account. More specifically, in the margin test of the present embodiment, the power supply voltage and clock frequency of each device used in the control modules 10a and 10b and the DEs 210 and 220 of the storage apparatus 100 are ± 1% from the design value, Apply a load to the device under test while changing in order of ± 2%. The test target device to which the load is applied and the location to which the load is applied are determined in advance by the prepared test items.

マージン試験では、ストレージ装置100を一定時間(例えば4時間)連続して運転する。そして運転中に、ストレージ装置100が備える各デバイスに発生した異常の種別に基づいてストレージ装置100が、電源電圧、クロック周波数に対してどこまでマージンを持っているのかを検証する。   In the margin test, the storage apparatus 100 is continuously operated for a certain time (for example, 4 hours). Then, it is verified to what extent the storage apparatus 100 has a margin with respect to the power supply voltage and the clock frequency based on the type of abnormality that has occurred in each device included in the storage apparatus 100 during operation.

制御モジュール10aは、制御部10と、監視部20と、リセット回路30と、電源回路40と、クロック回路50と、MRAM(Magnetoresistive Random Access Memory)60とを有している。   The control module 10 a includes a control unit 10, a monitoring unit 20, a reset circuit 30, a power supply circuit 40, a clock circuit 50, and an MRAM (Magnetoresistive Random Access Memory) 60.

制御部10は、CPU11、RAM(Random Access Memory)12、PCIe(Peripheral Component Interconnect Express)スイッチ13、SASコントローラ14a、14b、SASエクスパンダ15a、15b、PCH(Platform Controller Hub)16、SSD17、トランシーバ18を有している。   The control unit 10 includes a CPU 11, a RAM (Random Access Memory) 12, a PCIe (Peripheral Component Interconnect Express) switch 13, SAS controllers 14 a and 14 b, SAS expanders 15 a and 15 b, a PCH (Platform Controller Hub) 16, an SSD 17, and a transceiver 18. have.

また、制御モジュール10bは、制御モジュール10aと同じハードウェア構成によって実現される。そこで、ここでは基本的に、制御モジュール10aのハードウェア構成について説明し、制御モジュール10bのハードウェア構成の説明については省略する。   The control module 10b is realized by the same hardware configuration as the control module 10a. Therefore, here, the hardware configuration of the control module 10a is basically described, and the description of the hardware configuration of the control module 10b is omitted.

CPU11は、制御モジュール10a全体を統括的に制御する。RAM12は、制御モジュール10aの主記憶装置として使用され、CPU11に実行させるプログラムの少なくとも一部や、このプログラムによる処理に必要な各種データを一時的に記憶する。また、RAM12は、DE210、220内のHDDに記憶されたデータのキャッシュ領域としても使用される。RAM12の一例として、DDR3 SDRAM(Double-Data-Rate3 Synchronous Dynamic Random Access Memory)等が挙げられる。   The CPU 11 comprehensively controls the entire control module 10a. The RAM 12 is used as a main storage device of the control module 10a, and temporarily stores at least part of a program executed by the CPU 11 and various data necessary for processing by this program. The RAM 12 is also used as a cache area for data stored in the HDDs in the DEs 210 and 220. An example of the RAM 12 is a DDR3 SDRAM (Double-Data-Rate 3 Synchronous Dynamic Random Access Memory).

PCIeスイッチ13は、CPU11およびSASコントローラ14a、14bとの間で、PCIeバスを介してデータを送受信する。また、PCIeスイッチ13は、ホスト装置110や、制御モジュール10bが備えるPCIスイッチと接続されている。以下、PCIeスイッチ13と制御モジュール10bが備えるPCIeスイッチとの間の通信経路を「通信経路P1」と呼ぶ。   The PCIe switch 13 transmits / receives data to / from the CPU 11 and the SAS controllers 14a and 14b via the PCIe bus. The PCIe switch 13 is connected to a PCI switch included in the host device 110 and the control module 10b. Hereinafter, the communication path between the PCIe switch 13 and the PCIe switch included in the control module 10b is referred to as “communication path P1”.

CPU11と、制御モジュール10bが備えるCPUとは、通信経路P1を通じて通信できるようになっている。例えば、CPU11は、制御モジュール10bにおいて発生した異常の内容を示す異常検出情報を、制御モジュール10bが備えるCPUから通信経路P1を通じて取得することができる。また、例えば、CPU11および制御モジュール10bが備えるCPUは、RAM12、制御モジュール10bが備えるRAMにそれぞれ記憶されたHDDのキャッシュデータを、通信経路P1を通じて他方の制御モジュールが備えるCPUに送信し、他方の制御モジュール内のRAMにキャッシュデータをバックアップするように依頼することもできる。   The CPU 11 and the CPU provided in the control module 10b can communicate with each other through the communication path P1. For example, the CPU 11 can acquire abnormality detection information indicating the content of the abnormality that has occurred in the control module 10b from the CPU provided in the control module 10b through the communication path P1. Further, for example, the CPU included in the CPU 11 and the control module 10b transmits HDD cache data respectively stored in the RAM 12 and the RAM included in the control module 10b to the CPU included in the other control module via the communication path P1. It is also possible to request the cache data to be backed up to the RAM in the control module.

SASコントローラ14a、14bは、SASデバイスであるDE210、220内のHDDとの間のインタフェース処理を実行する制御回路である。SASコントローラ14aは、制御モジュール10bのSASコントローラに接続されている。また、SASコントローラ14aは、SASエクスパンダ15aを通じてDE210、220に接続されている。また、SASコントローラ14aは、SASエクスパンダ15aを通じてクロック回路50および電源回路40に接続されている。   The SAS controllers 14a and 14b are control circuits that execute interface processing with the HDDs in the DEs 210 and 220, which are SAS devices. The SAS controller 14a is connected to the SAS controller of the control module 10b. The SAS controller 14a is connected to the DEs 210 and 220 through the SAS expander 15a. The SAS controller 14a is connected to the clock circuit 50 and the power supply circuit 40 through the SAS expander 15a.

SASコントローラ14bは、制御モジュール10bのSASコントローラに接続されている。また、SASコントローラ14bは、SASエクスパンダ15bを通じてDE210、220に接続されている。また、SASコントローラ14bは、制御モジュール10b内のSASエクスパンダを通じてDE210、220と接続されている。このように、SASコントローラ14bとDE210、220とが2つのSASエクスパンダを通じて接続されることで、SASコントローラ14bからDE210、220へのアクセス経路が冗長化されている。   The SAS controller 14b is connected to the SAS controller of the control module 10b. The SAS controller 14b is connected to the DEs 210 and 220 through the SAS expander 15b. The SAS controller 14b is connected to the DEs 210 and 220 through the SAS expander in the control module 10b. In this way, the SAS controller 14b and the DEs 210 and 220 are connected through the two SAS expanders, whereby the access path from the SAS controller 14b to the DEs 210 and 220 is made redundant.

SASエクスパンダ15aは、SASコントローラ14aとDE210、220との中継デバイスの機能に加え、制御部10の動作を監視する監視部20側の機能を備えている。なお、SASエクスパンダ15aの監視部20側の機能については後述する。   The SAS expander 15a has a function on the monitoring unit 20 side that monitors the operation of the control unit 10 in addition to the function of a relay device between the SAS controller 14a and the DEs 210 and 220. The function on the monitoring unit 20 side of the SAS expander 15a will be described later.

SASエクスパンダ15bは、SASコントローラとSASデバイスとの間でデータを中継する。なお、SASエクスパンダ15bは、内部にメモリを備え、制御モジュール10aの電源状態を示す情報を内部のメモリに保持する。   The SAS expander 15b relays data between the SAS controller and the SAS device. Note that the SAS expander 15b includes an internal memory, and stores information indicating the power state of the control module 10a in the internal memory.

PCH16は、CPU11と、SSD17、トランシーバ18およびFPGA22との間で、データを送受信する。
SSD17は、制御モジュール10aの二次記憶装置として使用され、CPU11により実行されるプログラムやその実行に必要な各種のデータ等を記憶する。なお、二次記憶装置としては、例えば、HDD等の他の種類の不揮発性記憶装置が使用されてもよい。SSD17には、マージン記憶領域171が設けられている。マージン記憶領域171には、マージン試験に使用する電圧の初期値(電圧初期値)およびクロックの初期値(クロック初期値)が予め記憶されている。また、マージン記憶領域171には、マージン試験に使用する電圧の設定値(電圧マージン設定値)およびクロックの設定値(クロックマージン設定値)が予め複数記憶されている。図3に示す電圧/クロックマージン設定値1、電圧/クロックマージン設定値2、・・・、電圧/クロックマージン設定値Xは、それぞれ電圧マージン設定値およびクロックマージン設定値の異なる組み合わせを示している。
The PCH 16 transmits and receives data between the CPU 11 and the SSD 17, the transceiver 18, and the FPGA 22.
The SSD 17 is used as a secondary storage device of the control module 10a, and stores programs executed by the CPU 11, various data necessary for the execution, and the like. As the secondary storage device, for example, another type of nonvolatile storage device such as an HDD may be used. The SSD 17 is provided with a margin storage area 171. The margin storage area 171 stores in advance an initial voltage value (voltage initial value) and an initial clock value (clock initial value) used in the margin test. In the margin storage area 171, a plurality of voltage setting values (voltage margin setting values) and clock setting values (clock margin setting values) used for the margin test are stored in advance. The voltage / clock margin setting value 1, voltage / clock margin setting value 2,..., Voltage / clock margin setting value X shown in FIG. 3 indicate different combinations of the voltage margin setting value and the clock margin setting value, respectively. .

また、SSD17には、第1カタログ172、第2カタログ173、OS(Operating System)174が記憶されている。
第1カタログ172および第2カタログ173には、マージン試験中にCPU11に実行させるプログラムが記憶されている。
The SSD 17 stores a first catalog 172, a second catalog 173, and an OS (Operating System) 174.
The first catalog 172 and the second catalog 173 store programs to be executed by the CPU 11 during the margin test.

OS174には、CPU11に実行させるプログラムが記憶されている。
トランシーバ18は、RS−232Cケーブルや、LANケーブルを介して管理端末装置120に接続されており、管理端末装置120との間でデータを送受信する。
The OS 174 stores a program to be executed by the CPU 11.
The transceiver 18 is connected to the management terminal device 120 via an RS-232C cable or a LAN cable, and transmits / receives data to / from the management terminal device 120.

監視部20は、SASエクスパンダ15aと、FPGA22とを備えている。SASエクスパンダ15aとFPGA22との間はローカルバスで接続されている。
SASエクスパンダ15aは、監視部20側の機能としてPostPhase監視部211と、電圧マージン制御部212と、クロックマージン制御部213とを備えている。
The monitoring unit 20 includes a SAS expander 15 a and an FPGA 22. The SAS expander 15a and the FPGA 22 are connected by a local bus.
The SAS expander 15a includes a PostPhase monitoring unit 211, a voltage margin control unit 212, and a clock margin control unit 213 as functions on the monitoring unit 20 side.

PostPhase監視部211は、制御部10への電源投入後に起動するBIOSの起動中に、BIOSの各プログラムの実行結果を識別するPostPhaseコードが生成されていることを監視する。PostPhase監視部211は、PostPhaseコードの生成を監視することで、BIOSの起動処理が実行されていることを把握することができる。   The PostPhase monitoring unit 211 monitors that a PostPhase code for identifying the execution result of each program of the BIOS is generated during activation of the BIOS that is activated after the control unit 10 is powered on. The PostPhase monitoring unit 211 can determine that the BIOS activation process is being executed by monitoring the generation of the PostPhase code.

電圧マージン制御部212は、I2Cバスを介して電源回路40に接続されている。電圧マージン制御部212は、MRAM60に記憶されている電圧マージン設定値を電源回路40に設定する。 The voltage margin control unit 212 is connected to the power supply circuit 40 via the I 2 C bus. The voltage margin control unit 212 sets the voltage margin setting value stored in the MRAM 60 in the power supply circuit 40.

クロックマージン制御部213は、I2Cバスを介してクロック回路50に接続されている。クロックマージン制御部213は、MRAM60に記憶されているクロックマージン設定値をクロック回路50に設定する。   The clock margin control unit 213 is connected to the clock circuit 50 via the I2C bus. The clock margin control unit 213 sets the clock margin setting value stored in the MRAM 60 in the clock circuit 50.

FPGA22は、制御モジュール10a内のハードウェアの状態を監視する機能を備える。FPGA22は、制御モジュール10a内のハードウェアの異常を検出すると、検出した異常の内容を示す異常検出情報をCPU11に通知する。また、FPGA22は、異常検出情報をMRAM60に保存する。さらに、FPGA22は、CPU11によってプログラム実行時の異常が検出された場合、検出された異常の内容を示す異常検出情報をCPU11から受信し、受信した異常検出情報をMRAM60に保存する。また、FPGA22は、CPU11からの要求、または制御モジュール10bが備えるFPGAからの要求に応じて、MRAM60に保存した異常検出情報を制御モジュール10bが備えるFPGAに送信することもできる。   The FPGA 22 has a function of monitoring the state of hardware in the control module 10a. When the FPGA 22 detects a hardware abnormality in the control module 10a, the FPGA 22 notifies the CPU 11 of abnormality detection information indicating the content of the detected abnormality. Further, the FPGA 22 stores the abnormality detection information in the MRAM 60. Further, when an abnormality at the time of program execution is detected by the CPU 11, the FPGA 22 receives abnormality detection information indicating the content of the detected abnormality from the CPU 11 and stores the received abnormality detection information in the MRAM 60. The FPGA 22 can also transmit the abnormality detection information stored in the MRAM 60 to the FPGA included in the control module 10b in response to a request from the CPU 11 or a request from the FPGA included in the control module 10b.

また、FPGA22は、制御モジュール10aの電源状態を制御する機能を備える。FPGA22は、CPU11からの要求、または制御モジュール10bが備えるFPGAからの要求に応じて電源回路40を制御し、制御モジュール10aの電源をON状態にしたり、OFF状態にしたりする。   The FPGA 22 has a function of controlling the power supply state of the control module 10a. The FPGA 22 controls the power supply circuit 40 in response to a request from the CPU 11 or a request from the FPGA provided in the control module 10b, and turns on or off the power supply of the control module 10a.

さらに、FPGA22は、制御モジュール10bが備えるFPGAと通信する機能を備える。以下、FPGA22と制御モジュール10bが備えるFPGAとの間の通信経路を、「通信経路P2」と呼ぶ。FPGA22は、例えば、CPU11からの要求に応じて、制御モジュール10bの電源を所定の状態に遷移させるように、通信経路P2を通じて制御モジュール10bが備えるFPGAに要求する。   Further, the FPGA 22 has a function of communicating with the FPGA included in the control module 10b. Hereinafter, the communication path between the FPGA 22 and the FPGA included in the control module 10b is referred to as “communication path P2”. For example, in response to a request from the CPU 11, the FPGA 22 requests the FPGA included in the control module 10 b through the communication path P <b> 2 to shift the power supply of the control module 10 b to a predetermined state.

なお、FPGA22が実行する処理は、例えば、マイクロコンピュータ等の他の種類の制御回路によって実行されてもよい。
FPGA22は、WDT監視処理部221と、リセット制御部222と、電源制御部223とを有している。
Note that the processing executed by the FPGA 22 may be executed by another type of control circuit such as a microcomputer.
The FPGA 22 includes a WDT monitoring processing unit 221, a reset control unit 222, and a power supply control unit 223.

WDT監視処理部221は、制御部10のハングアップを検出し、制御部10を再起動する機能を有する。このWDT監視処理部221は、WDT0カウンタ221a、WDT2カウンタ221b、およびWDT3カウンタ221cを有する。WDT0カウンタ221a、WDT2カウンタ221b、およびWDT3カウンタ221cは、いずれもダウンカウンタである。WDT0カウンタ221a、WDT2カウンタ221b、およびWDT3カウンタ221cのカウンタ値の更新は、CPU11が行う。   The WDT monitoring processing unit 221 has a function of detecting a hang-up of the control unit 10 and restarting the control unit 10. The WDT monitoring processing unit 221 includes a WDT0 counter 221a, a WDT2 counter 221b, and a WDT3 counter 221c. The WDT0 counter 221a, the WDT2 counter 221b, and the WDT3 counter 221c are all down counters. The CPU 11 updates the counter values of the WDT0 counter 221a, WDT2 counter 221b, and WDT3 counter 221c.

CPU11によってWDT0カウンタ221a、WDT2カウンタ221b、およびWDT3カウンタ221cのカウンタ値が更新されるとWDT監視処理部221は、WDT0カウンタ221aのダウンカウントを開始する。WDT0カウンタ221aのカウンタ値が0になると、WDT監視処理部221は、WDT0カウンタ221aのタイムアウトを制御部10に通知する。その後、WDT監視処理部221は、WDT2カウンタ221bのダウンカウントを開始する。   When the CPU 11 updates the counter values of the WDT0 counter 221a, the WDT2 counter 221b, and the WDT3 counter 221c, the WDT monitoring processing unit 221 starts down-counting the WDT0 counter 221a. When the counter value of the WDT0 counter 221a becomes 0, the WDT monitoring processing unit 221 notifies the control unit 10 of the timeout of the WDT0 counter 221a. Thereafter, the WDT monitoring processor 221 starts down-counting the WDT2 counter 221b.

WDT2カウンタ221bのカウンタ値が0になると、WDT監視処理部221は、リセット制御部222に制御部10のリセットを指示する。その後、WDT監視処理部221は、WDT3カウンタ221cのダウンカウントを開始する。   When the counter value of the WDT2 counter 221b becomes 0, the WDT monitoring processing unit 221 instructs the reset control unit 222 to reset the control unit 10. Thereafter, the WDT monitoring processing unit 221 starts down-counting the WDT3 counter 221c.

WDT3カウンタ221cのカウンタ値が0になり、かつ、後述するマージン試験フラグ記憶領域67のフラグが1にセットされている場合、WDT監視処理部221は、制御部10の再起動を電源制御部223に指示する。   When the counter value of the WDT3 counter 221c is 0 and the flag of the margin test flag storage area 67 described later is set to 1, the WDT monitoring processor 221 causes the power controller 223 to restart the controller 10. To instruct.

リセット制御部222は、WDT監視処理部221の指示に基づきリセット回路30を制御し、制御部10をリセットするリセット信号を制御部10に供給する。
電源制御部223は、WDT監視処理部221の指示に基づき電源回路40を制御し、制御部10を再起動する。
The reset control unit 222 controls the reset circuit 30 based on an instruction from the WDT monitoring processing unit 221 and supplies a reset signal for resetting the control unit 10 to the control unit 10.
The power supply control unit 223 controls the power supply circuit 40 based on an instruction from the WDT monitoring processing unit 221 and restarts the control unit 10.

リセット回路30は、リセット制御部222の制御の下で、制御モジュール10aが備える各デバイスにリセット信号を供給する。
電源回路40は、電源制御部223の制御の下で、制御モジュール10aの電源をON状態にしたり、OFF状態にしたりする。また、電源回路40は、電圧マージン制御部212の制御により、制御部10に供給する電圧を変更する。
The reset circuit 30 supplies a reset signal to each device included in the control module 10a under the control of the reset control unit 222.
The power supply circuit 40 turns on or off the power supply of the control module 10 a under the control of the power supply control unit 223. Further, the power supply circuit 40 changes the voltage supplied to the control unit 10 under the control of the voltage margin control unit 212.

クロック回路50は、クロック信号を生成し、ストレージ装置100が備える各デバイスに供給する。また、クロック回路50は、クロックマージン制御部213の制御により、制御部10に供給するクロック周波数を変更する。   The clock circuit 50 generates a clock signal and supplies it to each device included in the storage apparatus 100. Further, the clock circuit 50 changes the clock frequency supplied to the control unit 10 under the control of the clock margin control unit 213.

MRAM60は、FPGA22での処理に用いる各種のデータや、制御モジュール10aにおいて検出された異常の内容を示す異常検出情報を記憶する不揮発性メモリである。 このMRAM60は、リセットフラグ記憶領域61、PostPhaseフラグ記憶領域62、PostPhaseカウンタ63、第1起動カウンタ64、第2起動カウンタ65、実行状態チェックフラグ記憶領域66、マージン試験フラグ記憶領域67、TP種別記憶領域68、電圧マージン設定値記憶領域69、クロックマージン設定値記憶領域70、およびPostPhaseコード記憶領域71を有している。   The MRAM 60 is a non-volatile memory that stores various data used for processing in the FPGA 22 and abnormality detection information indicating the content of the abnormality detected in the control module 10a. The MRAM 60 includes a reset flag storage area 61, a PostPhase flag storage area 62, a PostPhase counter 63, a first activation counter 64, a second activation counter 65, an execution state check flag storage area 66, a margin test flag storage area 67, and a TP type storage. An area 68, a voltage margin set value storage area 69, a clock margin set value storage area 70, and a PostPhase code storage area 71 are provided.

リセットフラグ記憶領域61は、監視部20の指示により制御部10の再起動が実行されたか否かを示すフラグを記憶する領域である。
PostPhaseフラグ記憶領域62は、PostPhase監視部211にPostPhaseコードの生成を監視させるか否かを示すフラグを記憶する領域である。本実施の形態の当該フラグは、PostPhase監視部211にPostPhaseコードの生成を監視させることを示す1にセットされている。
The reset flag storage area 61 is an area for storing a flag indicating whether or not the control unit 10 has been restarted in accordance with an instruction from the monitoring unit 20.
The PostPhase flag storage area 62 is an area for storing a flag indicating whether or not the PostPhase monitoring unit 211 is to monitor the generation of the PostPhase code. The flag of the present embodiment is set to 1 indicating that the PostPhase monitoring unit 211 monitors the generation of the PostPhase code.

PostPhaseカウンタ63は、PostPhaseコードの生成を判断するのに用いるカウンタ値を記憶するダウンカウンタである。PostPhaseカウンタ63のカウンタ値は、制御部10により定期的に所定の値にセットされる。このカウンタ値が0になっても、新たなPostPhaseコードが生成されない場合、PostPhase監視部211は、PostPhaseコードが生成されていないと判断する。   The PostPhase counter 63 is a down counter that stores a counter value used to determine the generation of the PostPhase code. The counter value of the PostPhase counter 63 is periodically set to a predetermined value by the control unit 10. If a new PostPhase code is not generated even when the counter value becomes 0, the PostPhase monitoring unit 211 determines that the PostPhase code has not been generated.

第1起動カウンタ64は、ある電圧/クロックマージン設定値を用いて試験を実行した後に、電圧/クロックマージン設定値を変えて次の試験に遷移させるか否かを判断するのに用いるカウンタ値を記憶するカウンタである。   The first start counter 64 executes a test using a certain voltage / clock margin setting value, and then changes the voltage / clock margin setting value to determine whether to shift to the next test. It is a counter to store.

第2起動カウンタ65は、マージン試験において変更する電圧/クロックマージン設定値の残数を示すカウンタ値を記憶するカウンタである。
実行状態チェックフラグ記憶領域66は、ある試験項目の試験の実行中であることを示すフラグを記憶する領域である。
The second activation counter 65 is a counter that stores a counter value indicating the remaining number of voltage / clock margin setting values to be changed in the margin test.
The execution state check flag storage area 66 is an area for storing a flag indicating that a test for a certain test item is being executed.

マージン試験フラグ記憶領域67は、マージン試験の実行中であることを示すフラグを記憶する領域である。マージン試験フラグ記憶領域67のフラグが1にセットされており、かつ、WDT3カウンタ221cのカウントが満了した場合は、監視部20より制御部10の再起動が実行される。マージン試験フラグ記憶領域67のフラグは、電圧マージンおよびクロックマージンを設定する直前にCPU11によって1にセットされる。   The margin test flag storage area 67 is an area for storing a flag indicating that a margin test is being executed. When the flag in the margin test flag storage area 67 is set to 1 and the count of the WDT3 counter 221c has expired, the monitoring unit 20 restarts the control unit 10. The flag in the margin test flag storage area 67 is set to 1 by the CPU 11 immediately before setting the voltage margin and the clock margin.

TP種別記憶領域68は、試験項目を示す情報を記憶する領域である。試験項目を示す情報としては、例えば、SASコントローラ14a、14bおよびSASエクスパンダ15a、15bに対する負荷試験項目を示す「TPa」や、CPU11の負荷試験項目を示す「TPb」等が挙げられる。   The TP type storage area 68 is an area for storing information indicating test items. Examples of the information indicating the test item include “TPa” indicating the load test item for the SAS controllers 14a and 14b and the SAS expanders 15a and 15b, “TPb” indicating the load test item for the CPU 11, and the like.

電圧マージン設定値記憶領域69には、マージン試験に用いる電圧マージン設定値が記憶される。
クロックマージン設定値記憶領域70には、マージン試験に用いるクロックマージン設定値が記憶される。
The voltage margin setting value storage area 69 stores a voltage margin setting value used for a margin test.
The clock margin setting value storage area 70 stores a clock margin setting value used for a margin test.

PostPhaseコード記憶領域71には、BIOSの各プログラムの実行結果を識別するPostPhaseコードが記憶される。BIOSの起動が停止した場合、管理者は、PostPhaseコード記憶領域71に記憶されているPostPhaseコードを参照することで、BIOSのプログラムがどこまで実行されたのかを知ることができる。   The PostPhase code storage area 71 stores a PostPhase code for identifying the execution result of each program of the BIOS. When the activation of the BIOS is stopped, the administrator can know how far the BIOS program has been executed by referring to the PostPhase code stored in the PostPhase code storage area 71.

次に、CPU11が備える機能を説明する。
図4は、CPUが備える機能を示すブロック図である。
CPU11は、WDT処理部111と、フラグ制御部112と、マージン試験部113と、マージン設定部114とを有している。
Next, functions provided in the CPU 11 will be described.
FIG. 4 is a block diagram illustrating functions of the CPU.
The CPU 11 includes a WDT processing unit 111, a flag control unit 112, a margin test unit 113, and a margin setting unit 114.

WDT処理部111は、実行状態チェックフラグ記憶領域66のフラグが0にセットされている場合、WDT0カウンタ221a、WDT2カウンタ221bおよびWDT3カウンタ221cのカウンタ値を4秒で0になるカウンタ値に定期的(例えば4秒以内)に設定する。   When the flag of the execution state check flag storage area 66 is set to 0, the WDT processing unit 111 periodically sets the counter values of the WDT0 counter 221a, the WDT2 counter 221b, and the WDT3 counter 221c to 0 that become 0 in 4 seconds. (For example, within 4 seconds).

WDT処理部111は、実行状態チェックフラグ記憶領域66のフラグが1にセットされている場合、WDT0カウンタ221a、WDT2カウンタ221bおよびWDT3カウンタ221cの設定に加えて、TP種別記憶領域68のTP種別が35分以内に更新されたかどうかをチェックする。WDT処理部111は、35分以内にTP種別の更新がなかった場合は、マージン試験により制御部10がハングアップしたと判断し、WDT処理を停止する。WDT処理が停止すると、WDT監視処理部221が、WDT3カウンタ221cのカウント満了(カウンタ値0)を検出し、マージン試験フラグ記憶領域67のフラグが1の場合は監視部20より制御部10が再起動される。制御部10の再起動により、制御部10は、ハングアップ状態から復旧する。   When the flag of the execution state check flag storage area 66 is set to 1, the WDT processing unit 111 sets the TP type of the TP type storage area 68 in addition to the settings of the WDT0 counter 221a, the WDT2 counter 221b, and the WDT3 counter 221c. Check if it was updated within 35 minutes. If the TP type is not updated within 35 minutes, the WDT processing unit 111 determines that the control unit 10 has hung up due to the margin test, and stops the WDT processing. When the WDT processing is stopped, the WDT monitoring processing unit 221 detects the count expiration (counter value 0) of the WDT3 counter 221c, and when the flag in the margin test flag storage area 67 is 1, the control unit 10 restarts the monitoring unit 20. It is activated. By restarting the control unit 10, the control unit 10 recovers from the hang-up state.

フラグ制御部112は、MRAM60に設定されている各種フラグを所定の条件下で1または0にセットする。
マージン試験部113は、前述したマージン試験を実行する。マージン試験対象のデバイスは、例えばCPU11自身、制御モジュール10a、10b間の通信を行うPCIeスイッチ13並びに、制御モジュール10a、10bとDE210、220とを接続するSASコントローラ14a、14bおよびSASエクスパンダ15a、15bである。
The flag control unit 112 sets various flags set in the MRAM 60 to 1 or 0 under a predetermined condition.
The margin test unit 113 performs the margin test described above. The margin test target device includes, for example, the CPU 11 itself, the PCIe switch 13 that performs communication between the control modules 10a and 10b, and the SAS controllers 14a and 14b and the SAS expander 15a that connect the control modules 10a and 10b and the DEs 210 and 220. 15b.

マージン設定部114は、SSD17のマージン記憶領域171に記憶されている各種設定値をMRAM60の電圧マージン設定値記憶領域69およびクロックマージン設定値記憶領域70に記憶する。   The margin setting unit 114 stores various setting values stored in the margin storage area 171 of the SSD 17 in the voltage margin setting value storage area 69 and the clock margin setting value storage area 70 of the MRAM 60.

次に、制御モジュール10aの処理を説明する。
図5および図6は、制御モジュールの処理を説明するフローチャートである。
[ステップS1] 制御モジュール10aの電源がON状態になると、監視部20が起動する。なお、制御部10の電源はOFF状態のままである。監視部20が起動すると、ステップS2に遷移する。
Next, the process of the control module 10a will be described.
5 and 6 are flowcharts for explaining the processing of the control module.
[Step S1] When the control module 10a is powered on, the monitoring unit 20 is activated. Note that the power supply of the control unit 10 remains off. When the monitoring unit 20 is activated, the process proceeds to step S2.

[ステップS2] FPGA22は、第2起動カウンタ65のカウンタ値に、マージン記憶領域171に記憶されている電圧/クロックマージン設定値の個数Xを代入する。その後、ステップS3に遷移する。   [Step S2] The FPGA 22 substitutes the number X of voltage / clock margin setting values stored in the margin storage area 171 for the counter value of the second activation counter 65. Thereafter, the process proceeds to step S3.

[ステップS3] 電圧マージン制御部212は、MRAM60の電圧マージン設定値記憶領域69に記憶されている電圧マージン設定値を電源回路40に設定する。その後、ステップS4に遷移する。   [Step S <b> 3] The voltage margin control unit 212 sets the voltage margin setting value stored in the voltage margin setting value storage area 69 of the MRAM 60 in the power supply circuit 40. Thereafter, the process proceeds to step S4.

[ステップS4] 電源制御部223は、電源回路40を制御して制御部10の電源をON状態にする。電源がON状態になることにより、制御部10には、電圧マージン設定値の電圧が供給される。その後、ステップS5に遷移する。   [Step S <b> 4] The power supply control unit 223 controls the power supply circuit 40 to turn on the power supply of the control unit 10. When the power supply is turned on, the voltage of the voltage margin setting value is supplied to the control unit 10. Then, the process proceeds to step S5.

[ステップS5] クロックマージン制御部213は、MRAM60のクロックマージン設定値記憶領域70に記憶されているクロックマージン設定値をクロック回路50に設定する。その後、ステップS6に遷移する。   [Step S <b> 5] The clock margin control unit 213 sets the clock margin setting value stored in the clock margin setting value storage area 70 of the MRAM 60 in the clock circuit 50. Then, the process proceeds to step S6.

[ステップS6] リセット制御部222は、制御部10のリセット信号を解除する。その後、ステップS7に遷移する。
[ステップS7] リセット制御部222は、リセットフラグ記憶領域61のフラグ(図5ではリセットフラグと表記。以下同じ)を0に設定する。その後、ステップS8に遷移する。
[Step S <b> 6] The reset control unit 222 cancels the reset signal of the control unit 10. Then, the process proceeds to step S7.
[Step S7] The reset control unit 222 sets a flag in the reset flag storage area 61 (indicated as a reset flag in FIG. 5; hereinafter the same) to 0. Thereafter, the process proceeds to operation S8.

[ステップS8] CPU11は、BIOSの起動を開始する。その後、ステップS9に遷移する。BIOSは、PostPhaseカウンタ63に所定のカウンタ値を設定し、設定したカウンタ値が0になる前にPostPhaseコードを生成する。PostPhase監視部211は、PostPhaseの監視処理を開始する。なお、PostPhase監視処理については、後に詳述する。   [Step S8] The CPU 11 starts activation of the BIOS. Thereafter, the process proceeds to operation S9. The BIOS sets a predetermined counter value in the PostPhase counter 63, and generates a PostPhase code before the set counter value becomes zero. The PostPhase monitoring unit 211 starts a monitoring process for PostPhase. The PostPhase monitoring process will be described in detail later.

[ステップS9] フラグ制御部112は、リセットフラグ記憶領域61のフラグが0か否かを判断する。フラグが1である場合(ステップS9のNo)、ステップS10に遷移する。フラグが0である場合(ステップS9のYes)、ステップS12に遷移する。   [Step S9] The flag control unit 112 determines whether or not the flag in the reset flag storage area 61 is zero. When the flag is 1 (No in step S9), the process proceeds to step S10. If the flag is 0 (Yes in step S9), the process proceeds to step S12.

[ステップS10] CPU11は、BIOSの起動を停止する。BIOSの起動が停止することにより、PostPhaseコードの生成も停止する。その後、ステップS11に遷移する。   [Step S10] The CPU 11 stops the activation of the BIOS. When the activation of the BIOS is stopped, the generation of the PostPhase code is also stopped. Then, the process proceeds to step S11.

[ステップS11] PostPhase監視部211は、制御部10の再起動を電源制御部223に指示する。その後、制御部10が再起動されると、処理がステップS6に遷移する。   [Step S11] The PostPhase monitoring unit 211 instructs the power supply control unit 223 to restart the control unit 10. Thereafter, when the control unit 10 is restarted, the process transitions to step S6.

[ステップS12] フラグ制御部112は、リセットフラグ記憶領域61のフラグを1に設定する。その後、ステップS13に遷移する。
[ステップS13] 監視部20は、BIOSの起動の完了を確認するとPostPhaseの監視を終了する。また、CPU11によるBIOSの起動が完了すると、OS174が起動する。その後、ステップS14に遷移する。
[Step S12] The flag control unit 112 sets the flag in the reset flag storage area 61 to 1. Thereafter, the process proceeds to operation S13.
[Step S <b> 13] When the monitoring unit 20 confirms the completion of activation of the BIOS, the monitoring of the PostPhase is terminated. When the activation of the BIOS by the CPU 11 is completed, the OS 174 is activated. Thereafter, the process proceeds to operation S14.

[ステップS14] マージン設定部114は、電圧マージン設定値記憶領域69の電圧マージン設定値をマージン記憶領域171に記憶されている電圧初期値に書き換える。また、マージン設定部114は、クロックマージン設定値記憶領域70のクロックマージン設定値をマージン記憶領域171に記憶されているクロック初期値に書き換える。その後、ステップS15に遷移する。   [Step S14] The margin setting unit 114 rewrites the voltage margin setting value in the voltage margin setting value storage area 69 with the voltage initial value stored in the margin storage area 171. In addition, the margin setting unit 114 rewrites the clock margin setting value in the clock margin setting value storage area 70 to the clock initial value stored in the margin storage area 171. Thereafter, the process proceeds to operation S15.

[ステップS15] マージン試験部113は、監視部20によるWDT監視の設定を有効にする。この処理により、WDT監視処理部221がWDT監視処理を開始する。また、WDT処理部111は、WDT処理を開始する。その後、ステップS16に遷移する。なお、WDT監視処理およびWDT処理は、後に詳述する。   [Step S15] The margin test unit 113 validates the setting of WDT monitoring by the monitoring unit 20. With this process, the WDT monitoring processing unit 221 starts the WDT monitoring process. In addition, the WDT processing unit 111 starts WDT processing. Thereafter, the process proceeds to operation S16. The WDT monitoring process and the WDT process will be described in detail later.

[ステップS16] マージン試験部113は、第1起動カウンタ64のカウンタ値をインクリメントする。その後、ステップS17に遷移する。
[ステップS17] マージン試験部113は、第1起動カウンタ64のカウンタ値が1であるか否かを判断する。第1起動カウンタ64のカウンタ値が1である場合(ステップS17のYes)、ステップS18に遷移する。第1起動カウンタ64のカウンタ値が1以外の値である場合(ステップS17のNo)、ステップS28に遷移する。
[Step S16] The margin test unit 113 increments the counter value of the first activation counter 64. Thereafter, the process proceeds to operation S17.
[Step S <b> 17] The margin testing unit 113 determines whether or not the counter value of the first activation counter 64 is “1”. When the counter value of the first activation counter 64 is 1 (Yes in Step S17), the process proceeds to Step S18. When the counter value of the first activation counter 64 is a value other than 1 (No in Step S17), the process proceeds to Step S28.

[ステップS18] 制御部10は、OS174の起動完了時に自動で第2カタログ173が実行される設定を有効にする。その後、ステップS19に遷移する。
[ステップS19] 制御部10は、第2起動カウンタ65のカウンタ値をデクリメントする。その後、ステップS20に遷移する。
[Step S <b> 18] The control unit 10 enables the setting for automatically executing the second catalog 173 when the activation of the OS 174 is completed. Thereafter, the process proceeds to operation S19.
[Step S19] The controller 10 decrements the counter value of the second activation counter 65. Then, the process proceeds to step S20.

[ステップS20] CPU11は、OS174の起動が完了するとステップS21に遷移する。
[ステップS21] フラグ制御部112は、実行状態チェックフラグ記憶領域66のフラグ(図5では実行状態チェックフラグと表記。以下同じ)を1に設定する。その後、ステップS22に遷移する。
[Step S20] When the activation of the OS 174 is completed, the CPU 11 proceeds to step S21.
[Step S21] The flag control unit 112 sets the flag in the execution state check flag storage area 66 (indicated as an execution state check flag in FIG. 5; hereinafter the same) to 1. Thereafter, the process proceeds to operation S22.

[ステップS22] フラグ制御部112は、TP種別記憶領域68のTP種別をTPaに設定する。その後、ステップS23に遷移する。
[ステップS23] マージン試験部113は、ステップS3にて設定された電圧マージン設定値およびステップS5にて設定されたクロックマージン設定値を用いてSASコントローラ14a、14bおよびSASエクスパンダ15a、15bの負荷試験を実行する。SASコントローラ14a、14bおよびSASエクスパンダ15a、15bの負荷試験が終了すると、ステップS24に遷移する。なお、マージン試験部113は、高速伝送路の負荷試験中に何らかのエラーが発生すると、エラーが発生したことを示すメッセージ(以下、「第1のメッセージ」と言う)を作成し、CPU11内のキャッシュに一時記憶する。
[Step S22] The flag control unit 112 sets the TP type in the TP type storage area 68 to TPa. Thereafter, the process proceeds to operation S23.
[Step S23] The margin test unit 113 uses the voltage margin set value set in step S3 and the clock margin set value set in step S5 to load the SAS controllers 14a and 14b and the SAS expanders 15a and 15b. Run the test. When the load test of the SAS controllers 14a and 14b and the SAS expanders 15a and 15b is completed, the process proceeds to step S24. The margin test unit 113 generates a message indicating that an error has occurred (hereinafter referred to as “first message”) when an error occurs during the load test of the high-speed transmission path, and caches the CPU 11. Temporarily store.

[ステップS24] マージン試験部113は、TP種別記憶領域68のTP種別をTPbに設定する。その後、ステップS25に遷移する。
[ステップS25] マージン試験部113は、CPU11の負荷試験を実行する。マージン試験部113は、CPU11の負荷試験中に何らかのエラーが発生すると、第1のメッセージを作成し、CPU11内のキャッシュに一時記憶する。CPU負荷試験が終了すると、マージン試験部113は、マージン試験の結果を示すログファイルを作成する。ログファイルの作成の際、マージン試験部113は、CPU11内のキャッシュを参照し、第1のメッセージが作成されているか否かを確認する。第1のメッセージが作成されていれば、マージン試験部113は、第1のメッセージを含むログファイルを作成する。第1のメッセージが作成されていなければ、マージン試験部113は、マージン試験中にエラーが発生しなかったことを示すメッセージ(以下、「第2のメッセージ」と言う)を含むログファイルを作成する。そして、マージン試験部113は、作成したログファイルを管理端末装置120に転送する。その後、ステップS26に遷移する。
[Step S24] The margin test unit 113 sets the TP type in the TP type storage area 68 to TPb. Thereafter, the process proceeds to operation S25.
[Step S25] The margin test unit 113 executes a load test of the CPU 11. When an error occurs during the load test of the CPU 11, the margin test unit 113 creates a first message and temporarily stores it in the cache in the CPU 11. When the CPU load test ends, the margin test unit 113 creates a log file indicating the result of the margin test. When creating the log file, the margin test unit 113 refers to the cache in the CPU 11 and confirms whether or not the first message has been created. If the first message has been created, the margin test unit 113 creates a log file including the first message. If the first message has not been created, the margin test unit 113 creates a log file including a message indicating that no error has occurred during the margin test (hereinafter referred to as “second message”). . Then, the margin testing unit 113 transfers the created log file to the management terminal device 120. Thereafter, the process proceeds to operation S26.

[ステップS26] フラグ制御部112は、実行状態チェックフラグ記憶領域66のフラグを0に設定する。その後、ステップS27に遷移する。
[ステップS27] CPU11は、制御部10の再起動指示をFPGA22に送る。これにより、電源制御部223が電源回路40を制御して制御部10を再起動する。CPU11が再起動されると、ステップS5以降の処理が引き続き実行される。
[Step S <b> 26] The flag control unit 112 sets the flag in the execution state check flag storage area 66 to 0. Thereafter, the process proceeds to operation S27.
[Step S <b> 27] The CPU 11 sends a restart instruction from the control unit 10 to the FPGA 22. As a result, the power supply control unit 223 controls the power supply circuit 40 to restart the control unit 10. When the CPU 11 is restarted, the processing after step S5 is continued.

[ステップS28] CPU11は、OS174起動完了時に自動で第1カタログ172が実行される設定を有効にする。その後、ステップS29に遷移する。
[ステップS29] CPU11は、OS174の起動が完了するとステップS30に遷移する。
[Step S <b> 28] The CPU 11 enables the setting for automatically executing the first catalog 172 when the OS 174 is started. Thereafter, the process proceeds to operation S29.
[Step S29] When the activation of the OS 174 is completed, the CPU 11 proceeds to step S30.

[ステップS30] フラグ制御部112は、実行状態チェックフラグ記憶領域66のフラグを1に設定し、マージン試験フラグ記憶領域67のフラグを1に設定し、TP種別記憶領域68の値を0に設定し、第1起動カウンタ64のカウンタ値を0に設定する。その後、ステップS31に遷移する。   [Step S30] The flag control unit 112 sets the flag of the execution state check flag storage area 66 to 1, sets the flag of the margin test flag storage area 67 to 1, and sets the value of the TP type storage area 68 to 0. Then, the counter value of the first activation counter 64 is set to zero. Thereafter, the process proceeds to operation S31.

[ステップS31] CPU11は、第2起動カウンタ65のカウンタ値を確認する。具体的には、第2起動カウンタ65のカウンタ値がXか否かを判断する。第2起動カウンタ65のカウンタ値がXではなければ第2起動カウンタ65のカウンタ値がX−1か否かを判断する。このように、第2起動カウンタ65のカウンタ値と対比する値をデクリメントして、第2起動カウンタ65のカウンタ値と一致する値を確認する。そして、値が一致すれば、ステップS32に遷移する。以下、一致した値をnとする。また、一致した値が0であればステップS34に遷移する。   [Step S31] The CPU 11 checks the counter value of the second activation counter 65. Specifically, it is determined whether or not the counter value of the second activation counter 65 is X. If the counter value of the second activation counter 65 is not X, it is determined whether or not the counter value of the second activation counter 65 is X-1. In this way, the value that is compared with the counter value of the second activation counter 65 is decremented, and a value that matches the counter value of the second activation counter 65 is confirmed. If the values match, the process proceeds to step S32. Hereinafter, let the matched value be n. If the matched value is 0, the process proceeds to step S34.

[ステップS32] マージン設定部114は、次回起動時の電圧マージン設定値およびクロックマージン設定値をマージン記憶領域171から読み出し、電圧マージン設定値記憶領域69およびクロックマージン設定値記憶領域70に設定する。例えば、n=2であれば、電圧/クロックマージン設定値2に設定されている電圧マージン設定値およびクロックマージン設定値を読み出す。その後、ステップS33に遷移する。   [Step S32] The margin setting unit 114 reads the voltage margin setting value and the clock margin setting value at the next activation from the margin storage area 171 and sets them in the voltage margin setting value storage area 69 and the clock margin setting value storage area 70. For example, if n = 2, the voltage margin setting value and the clock margin setting value set to the voltage / clock margin setting value 2 are read. Thereafter, the process proceeds to operation S33.

[ステップS33] CPU11は、制御部10の再起動をFPGA22に指示する。この処理により、電源制御部223は、電源回路40を制御して制御部10を再起動する。制御部10が再起動すると、CPU11は、ステップS4以降の処理を実行する。   [Step S <b> 33] The CPU 11 instructs the FPGA 22 to restart the control unit 10. With this process, the power supply control unit 223 controls the power supply circuit 40 to restart the control unit 10. When the control unit 10 is restarted, the CPU 11 executes the processes after step S4.

[ステップS34] CPU11は、制御部10の電源をOFF状態にする指示をFPGA22に送る。この指示により、電源制御部223は、電源回路40を制御して制御部10の電源をOFF状態にする。これにより、図5および図6の処理が終了する。   [Step S <b> 34] The CPU 11 sends an instruction to the FPGA 22 to turn off the power of the control unit 10. In response to this instruction, the power supply control unit 223 controls the power supply circuit 40 to turn off the power supply of the control unit 10. Thereby, the processing of FIGS. 5 and 6 is completed.

次に、図5のステップS8にてPostPhase監視部211が開始するPostPhase監視処理を説明する。
図7は、PostPhase監視処理を説明するフローチャートである。
Next, the PostPhase monitoring process started by the PostPhase monitoring unit 211 in step S8 of FIG. 5 will be described.
FIG. 7 is a flowchart for explaining the PostPhase monitoring process.

[ステップS41] PostPhase監視部211は、PostPhaseカウンタ63のカウント値が0になる前にBIOSがPostPhaseコードを生成したか否かを判断する。PostPhaseカウンタが0になる前にBIOSがPostPhaseコードを生成した場合(ステップS41のYes)、ステップS42に遷移する。PostPhaseカウンタが0になる前にBIOSがPostPhaseコードを生成しなかった場合(ステップS41のNo)、ステップS43に遷移する。   [Step S41] The PostPhase monitoring unit 211 determines whether or not the BIOS has generated the PostPhase code before the count value of the PostPhase counter 63 becomes zero. If the BIOS generates a PostPhase code before the PostPhase counter reaches 0 (Yes in step S41), the process proceeds to step S42. If the BIOS does not generate the PostPhase code before the PostPhase counter reaches 0 (No in step S41), the process proceeds to step S43.

[ステップS42] PostPhase監視部211は、例えばOS174の起動を検出することで、CPU11がBIOSの起動を完了したか否かを判断する。BIOSの起動が完了した場合(ステップS42のYes)、図7の処理を終了する。BIOSの起動が完了していない場合(ステップS42のNo)、ステップS41に遷移する。   [Step S42] The PostPhase monitoring unit 211 detects, for example, the activation of the OS 174 to determine whether the CPU 11 has completed the activation of the BIOS. When the activation of the BIOS is completed (Yes in step S42), the process in FIG. 7 is terminated. When the activation of the BIOS is not completed (No in step S42), the process proceeds to step S41.

[ステップS43] PostPhase監視部211は、マージン試験フラグ記憶領域67のフラグが1か否かを判断する。フラグが1ではない場合、すなわち、フラグが0である場合(ステップS43のNo)、フラグが1になるまで待機する。フラグが1である場合(ステップS43のYes)、ステップS44に遷移する。   [Step S43] The PostPhase monitoring unit 211 determines whether the flag in the margin test flag storage area 67 is “1”. If the flag is not 1, that is, if the flag is 0 (No in step S43), the process waits until the flag becomes 1. When the flag is 1 (Yes in step S43), the process proceeds to step S44.

[ステップS44] PostPhase監視部211は、制御部10の再起動を電源制御部223に指示する。その後、図7の処理を終了する。
次に、図5のステップS15にてWDT処理部111が開始するWDT処理を説明する。
[Step S <b> 44] The PostPhase monitoring unit 211 instructs the power supply control unit 223 to restart the control unit 10. Then, the process of FIG. 7 is complete | finished.
Next, the WDT process started by the WDT processing unit 111 in step S15 in FIG. 5 will be described.

図8は、WDT処理を説明するフローチャートである。
[ステップS51] WDT処理部111は、TP種別記憶領域68のTP種別を変数Aに格納する。その後、ステップS52に遷移する。
FIG. 8 is a flowchart for explaining the WDT processing.
[Step S51] The WDT processing unit 111 stores the TP type in the TP type storage area 68 in the variable A. Thereafter, the process proceeds to operation S52.

[ステップS52] WDT処理部111は、現在時刻を変数T1に設定する。その後、ステップS53に遷移する。
[ステップS53] WDT処理部111は、WDT0カウンタ221a、WDT2カウンタ221b、WDT3カウンタ221cそれぞれのカウンタ値を4秒に更新する。その後、ステップS54に遷移する。
[Step S52] The WDT processing unit 111 sets the current time in a variable T1. Thereafter, the process proceeds to operation S53.
[Step S53] The WDT processing unit 111 updates the counter values of the WDT0 counter 221a, the WDT2 counter 221b, and the WDT3 counter 221c to 4 seconds. Thereafter, the process proceeds to operation S54.

[ステップS54] WDT処理部111は、実行状態チェックフラグ記憶領域66のフラグが1か否かを判断する。フラグが1である場合(ステップS54のYes)、ステップS55に遷移する。フラグが1ではない場合、すなわち、フラグが0である場合(ステップS54のNo)、ステップS53に遷移する。   [Step S54] The WDT processing unit 111 determines whether or not the flag of the execution state check flag storage area 66 is 1. When the flag is 1 (Yes in step S54), the process proceeds to step S55. If the flag is not 1, that is, if the flag is 0 (No in step S54), the process proceeds to step S53.

[ステップS55] WDT処理部111は、TP種別記憶領域68のTP種別が変数Aに等しいか否かを判断する。TP種別が変数Aに等しい場合(ステップS55のYes)、ステップS56に遷移する。TP種別が変数Aに等しくない場合(ステップS55のNo)、ステップS57に遷移する。   [Step S55] The WDT processing unit 111 determines whether or not the TP type in the TP type storage area 68 is equal to the variable A. When the TP type is equal to the variable A (Yes in step S55), the process proceeds to step S56. When the TP type is not equal to the variable A (No in step S55), the process proceeds to step S57.

[ステップS56] WDT処理部111は、現在時刻を変数T2に設定する。その後、ステップS58に遷移する。
[ステップS57] WDT処理部111は、現在時刻を変数T1に設定する。その後、ステップS58に遷移する。
[Step S56] The WDT processing unit 111 sets the current time in a variable T2. Thereafter, the process proceeds to operation S58.
[Step S57] The WDT processing unit 111 sets the current time in a variable T1. Thereafter, the process proceeds to operation S58.

[ステップS58] WDT処理部111は、変数T2から変数T1を引いた時間が35分以上か否かを判断する。変数T2から変数T1を引いた時間が35分以上である場合(ステップS58のYes)、図8の処理を終了する。図8の処理が終了すると、WDT0カウンタ221a、WDT2カウンタ221b、WDT3カウンタ221cそれぞれのカウンタ値の更新が停止する。一方、変数T2から変数T1を引いた時間が35分未満である場合(ステップS58のNo)、ステップS53に遷移する。   [Step S58] The WDT processing unit 111 determines whether or not the time obtained by subtracting the variable T1 from the variable T2 is 35 minutes or more. When the time obtained by subtracting the variable T1 from the variable T2 is 35 minutes or more (Yes in step S58), the processing in FIG. When the processing of FIG. 8 is completed, updating of the counter values of the WDT0 counter 221a, WDT2 counter 221b, and WDT3 counter 221c is stopped. On the other hand, when the time obtained by subtracting the variable T1 from the variable T2 is less than 35 minutes (No in step S58), the process proceeds to step S53.

以上で図8の処理の説明を終了する。なお、ステップS58にて判断基準とした35分は、一例であり、判断基準とする時間は、試験項目に合わせて任意の時間に設定することができる。   This is the end of the description of the processing in FIG. Note that 35 minutes as the determination criterion in step S58 is an example, and the time as the determination criterion can be set to any time according to the test item.

次に、図5のステップS15にてWDT監視処理部221が開始するWDT監視処理を説明する。
図9は、WDT監視処理を説明するフローチャートである。
Next, the WDT monitoring process started by the WDT monitoring processing unit 221 in step S15 in FIG. 5 will be described.
FIG. 9 is a flowchart for explaining the WDT monitoring process.

[ステップS61] WDT監視処理部221は、WDT0カウンタ221aのカウント満了前にWDT0カウンタ221aのカウンタ値の更新があったか否かを判断する。WDT0カウンタ221aのカウント満了前にWDT0カウンタ221aのカウンタ値の更新があった場合(ステップS61のYes)、WDT監視処理部221は、再度、ステップS61以降の処理を行う。WDT0カウンタ221aのカウント満了前にWDT0カウンタ221aのカウンタ値の更新がなかった場合(ステップS61のNo)、ステップS62に遷移する。   [Step S61] The WDT monitoring processor 221 determines whether or not the counter value of the WDT0 counter 221a has been updated before the count of the WDT0 counter 221a expires. If the counter value of the WDT0 counter 221a is updated before the count of the WDT0 counter 221a expires (Yes in step S61), the WDT monitoring processing unit 221 performs the processing from step S61 onward again. If the counter value of the WDT0 counter 221a has not been updated before the count of the WDT0 counter 221a expires (No in step S61), the process proceeds to step S62.

[ステップS62] WDT監視処理部221は、WDT0カウンタ221aのカウント満了によるタイムアウトをCPU11に通知する。CPU11は、タイムアウトの通知を受け取ると、WDT0カウンタ221aのタイムアウトがあった旨のログファイルを作成し、管理端末装置120に転送する。その後、ステップS63に遷移する。   [Step S62] The WDT monitoring processing unit 221 notifies the CPU 11 of a timeout due to the count of the WDT0 counter 221a being expired. When the CPU 11 receives the timeout notification, the CPU 11 creates a log file indicating that the WDT0 counter 221a has timed out and transfers it to the management terminal device 120. Thereafter, the process proceeds to operation S63.

[ステップS63] WDT監視処理部221は、WDT2カウンタ221bのカウント満了前にWDT2カウンタ221bのカウンタ値の更新があったか否かを判断する。WDT2カウンタ221bのカウント満了前にWDT2カウンタ221bのカウンタ値の更新があった場合(ステップS63のYes)、WDT監視処理部221は、再度、ステップS61以降の処理を行う。WDT0カウンタ221aのカウント満了前にWDT0カウンタ221aのカウンタ値の更新がなかった場合(ステップS63のNo)、ステップS64に遷移する。   [Step S63] The WDT monitoring processor 221 determines whether or not the counter value of the WDT2 counter 221b has been updated before the count of the WDT2 counter 221b expires. If the count value of the WDT2 counter 221b is updated before the count of the WDT2 counter 221b expires (Yes in step S63), the WDT monitoring processing unit 221 performs the processing from step S61 onward again. If the counter value of the WDT0 counter 221a has not been updated before the count of the WDT0 counter 221a expires (No in step S63), the process proceeds to step S64.

[ステップS64] WDT監視処理部221は、制御部10のリセットをリセット制御部222に指示する。その後、ステップS65に遷移する。
[ステップS65] WDT監視処理部221は、WDT3カウンタ221cのカウント満了前にWDT3カウンタ221cのカウンタ値の更新があったか否かを判断する。なお、WDT3カウンタ221cのカウント満了は、第2のカウンタ値になることの一例を示している。また、WDT3カウンタ221cのカウンタ値の更新は、第1のカウンタ値に設定されることの一例を示している。WDT3カウンタ221cのカウント満了前にWDT3カウンタ221cのカウンタ値の更新があった場合(ステップS65のYes)、WDT監視処理部221は、再度、ステップS61以降の処理を行う。WDT3カウンタ221cのカウント満了前にWDT3カウンタ221cのカウンタ値の更新がなかった場合(ステップS65のNo)、ステップS66に遷移する。
[Step S64] The WDT monitoring processor 221 instructs the reset controller 222 to reset the controller 10. Thereafter, the process proceeds to operation S65.
[Step S65] The WDT monitoring processor 221 determines whether or not the counter value of the WDT3 counter 221c has been updated before the count of the WDT3 counter 221c expires. Note that the count expiration of the WDT3 counter 221c is an example of the second counter value. In addition, the update of the counter value of the WDT3 counter 221c is an example of being set to the first counter value. If the count value of the WDT3 counter 221c is updated before the count of the WDT3 counter 221c expires (Yes in step S65), the WDT monitoring processing unit 221 performs the processing from step S61 onward again. If the counter value of the WDT3 counter 221c has not been updated before the count of the WDT3 counter 221c expires (No in step S65), the process proceeds to step S66.

[ステップS66] WDT監視処理部221は、マージン試験フラグ記憶領域67のフラグが1にセットされているか否かを判断する。フラグが1にセットされている場合(ステップS66のYes)、ステップS67に遷移する。フラグが1にセットされていない場合(ステップS66のNo)、フラグが1にセットされるまで待機する。   [Step S66] The WDT monitoring processing unit 221 determines whether or not the flag in the margin test flag storage area 67 is set to 1. When the flag is set to 1 (Yes in step S66), the process proceeds to step S67. If the flag is not set to 1 (No in step S66), the process waits until the flag is set to 1.

[ステップS67] WDT監視処理部221は、制御部10の再起動を電源制御部223に指示する。その後、図9の処理を終了する。
図10は、試験結果を説明する図である。
[Step S67] The WDT monitoring processor 221 instructs the power controller 223 to restart the controller 10. Then, the process of FIG. 9 is complete | finished.
FIG. 10 is a diagram for explaining the test results.

図10に示す画面121は、管理端末装置120に接続されたモニタ120aに表示された画面を示している。
マージン記憶領域171に記憶されている全ての電圧/クロックマージン設定値についてのログファイルが生成されていれば、管理者は、全ての電圧/クロックマージン設定値についてマージン試験が終了したと判断することができる。
A screen 121 illustrated in FIG. 10 is a screen displayed on the monitor 120 a connected to the management terminal device 120.
If log files for all voltage / clock margin setting values stored in the margin storage area 171 have been generated, the administrator determines that the margin test has been completed for all voltage / clock margin setting values. Can do.

画面121には、各マージン設定値についてマージン試験を行った結果得られたログファイル121a〜121fが表示されている。例えば、ログファイル121aのファイル名「2011-1-27_043828-V0-C0-CM1-1.txt」は、先頭から2011年1月27日の4時38分28秒に試験を開始し、電圧マージンをV0に設定し、クロックマージンをC0に設定し、制御モジュール10bでマージン試験を行ったことを示している。   On the screen 121, log files 121a to 121f obtained as a result of performing a margin test for each margin setting value are displayed. For example, the file name “2011-1-27_043828-V0-C0-CM1-1.txt” of the log file 121a starts the test at 4:38:28 on January 27, 2011 from the beginning, and the voltage margin Is set to V0, the clock margin is set to C0, and the margin test is performed by the control module 10b.

管理者は、マージン試験が正常に終了したか否かを例えば以下の方法により確認することができる。
ログファイル121a〜121fのうち、第1のメッセージを示す「ERROR MESSAGE」の文言が含まれているログファイルが存在すれば、そのログファイルが作成されたマージン試験中に何らかのエラーが発生していることが分かる。よって、管理者は、第1のメッセージを含むログファイルを用いてエラー解析を実施することができる。
The administrator can confirm whether or not the margin test has been completed normally by, for example, the following method.
If there is a log file including the word “ERROR MESSAGE” indicating the first message among the log files 121a to 121f, an error has occurred during the margin test in which the log file was created. I understand that. Therefore, the administrator can perform error analysis using the log file including the first message.

また、ログファイル121a〜121fのうち、第1のメッセージが含まれておらず、第2のメッセージが含まれているログファイルについては、管理者は、マージン試験中にエラーが発生しなかったと判断することができる。第2のメッセージの一例としては、第2カタログ173の試験項目が、2011年1月27日の0時51分18秒に正常に完了したことを示す「catalog [catalog2_1.cat](TID:0x81d267c) normal end 2011.01.27 00:51:18」等が挙げられる。   In addition, regarding the log files that do not include the first message and include the second message among the log files 121a to 121f, the administrator determines that no error has occurred during the margin test. can do. As an example of the second message, “catalog [catalog2_1.cat] (TID: 0x81d267c) indicating that the test item of the second catalog 173 was successfully completed at 01:51:18 on January 27, 2011. normal end 2011.01.27 00:51:18 "and the like.

また、ログファイル121a〜121f内に第2のメッセージが含まれていないログファイルが存在すれば、管理者は、そのログファイルが作成されたマージン試験中にエラーが発生し、制御部10がハングアップまたは制御部10の異常リセット等が発生し、制御部10が再起動されたと判断することができる。   If there is a log file that does not include the second message in the log files 121a to 121f, the administrator generates an error during the margin test in which the log file is created, and the control unit 10 hangs. It can be determined that the control unit 10 has been restarted due to an up or abnormal reset of the control unit 10 or the like.

以上述べたように、ストレージ装置100によれば、CPU11および監視部20のどちらからもアクセスできるMRAM60にTP種別記憶領域68を用意した。そして、WDT監視処理部221は、マージン試験の実行中にTP種別記憶領域68のTP種別を定期的にチェックし、35分以内にTP種別が更新されなければ、制御部10がハングアップしたと判断し、制御部10を再起動するようにした。これによってストレージ装置100は、ハングアップ状態から復旧され、次のマージン設定での連続運転が実施される。   As described above, according to the storage apparatus 100, the TP type storage area 68 is prepared in the MRAM 60 that can be accessed from either the CPU 11 or the monitoring unit 20. The WDT monitoring processing unit 221 periodically checks the TP type in the TP type storage area 68 during the margin test, and if the TP type is not updated within 35 minutes, the control unit 10 is hung up. Judgment was made and the control unit 10 was restarted. As a result, the storage apparatus 100 is recovered from the hang-up state, and continuous operation is performed with the next margin setting.

また、MRAM60にリセットフラグ記憶領域61を用意し、リセット制御部222は、CPU11のリセット信号を解除する前にこのリセットフラグ記憶領域61のフラグを0に設定する(ステップS9の処理)。またCPU11はBIOSの起動が完了したときにリセットフラグを1に設定する(ステップS14の処理)。さらにCPU11はBIOS起動直後にリセットフラグが1であった場合BIOSの起動を停止する(ステップS15の処理)。また、BIOSの起動中にPostPhase監視部211が定期的にPostPhaseフラグ記憶領域62のフラグを更新し、PostPhase監視部211は、PostPhaseコードが指定時間内に生成されなければ制御部10を再起動する。これにより、PostPhase監視部211からのCPU11のリセット解除以外の、異常なCPU11のリセットによってBIOSが起動された場合は、CPU11が再起動する。従って、マージン試験中に何らかの異常が発生し、CPU11に対し予期せぬリセットがかかった場合においてもマージン試験を継続して行うことができる。   Further, the reset flag storage area 61 is prepared in the MRAM 60, and the reset control unit 222 sets the flag of the reset flag storage area 61 to 0 before canceling the reset signal of the CPU 11 (step S9). Further, the CPU 11 sets a reset flag to 1 when the activation of the BIOS is completed (processing of step S14). Further, if the reset flag is 1 immediately after starting the BIOS, the CPU 11 stops starting the BIOS (processing in step S15). In addition, the PostPhase monitoring unit 211 periodically updates the flag in the PostPhase flag storage area 62 during the activation of the BIOS, and the PostPhase monitoring unit 211 restarts the control unit 10 if the PostPhase code is not generated within the specified time. . Thereby, when BIOS is started by abnormal reset of CPU11 other than reset cancellation of CPU11 from PostPhase monitoring part 211, CPU11 restarts. Therefore, even if some abnormality occurs during the margin test and the CPU 11 is unexpectedly reset, the margin test can be continuously performed.

以上、本発明の情報処理装置および情報処理装置の試験方法を、図示の実施の形態に基づいて説明したが、本発明はこれに限定されるものではなく、各部の構成は、同様の機能を有する任意の構成のものに置換することができる。また、本発明に、他の任意の構成物や工程が付加されていてもよい。   The information processing apparatus and the information processing apparatus testing method of the present invention have been described based on the illustrated embodiment. However, the present invention is not limited to this, and the configuration of each part has the same function. It can be replaced with one having any structure. Moreover, other arbitrary structures and processes may be added to the present invention.

また、本発明は、前述した各実施の形態のうちの、任意の2以上の構成(特徴)を組み合わせたものであってもよい。
なお、本実施の形態では、マージン試験を行う場合を例に制御モジュール10aの処理を説明したが、制御モジュール10aを用いて実行できる試験の種類はマージン試験に限定されない。
Further, the present invention may be a combination of any two or more configurations (features) of the above-described embodiments.
In the present embodiment, the processing of the control module 10a has been described by taking an example of performing a margin test. However, the types of tests that can be executed using the control module 10a are not limited to the margin test.

なお、上記の処理機能は、コンピュータによって実現することができる。その場合、情報処理装置1および制御モジュール10a、10bが有する機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリ等が挙げられる。磁気記憶装置には、ハードディスクドライブ、フレキシブルディスク(FD)、磁気テープ等が挙げられる。光ディスクには、DVD、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)/RW等が挙げられる。光磁気記録媒体には、MO(Magneto-Optical disk)等が挙げられる。   The above processing functions can be realized by a computer. In that case, a program describing the processing contents of the functions of the information processing apparatus 1 and the control modules 10a and 10b is provided. By executing the program on a computer, the above processing functions are realized on the computer. The program describing the processing contents can be recorded on a computer-readable recording medium. Examples of the computer-readable recording medium include a magnetic storage device, an optical disk, a magneto-optical recording medium, and a semiconductor memory. Examples of the magnetic storage device include a hard disk drive, a flexible disk (FD), and a magnetic tape. Examples of the optical disc include a DVD, a DVD-RAM, and a CD-ROM (Compact Disc Read Only Memory) / RW. Examples of the magneto-optical recording medium include an MO (Magneto-Optical disk).

プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROM等の可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。   When distributing the program, for example, a portable recording medium such as a DVD or a CD-ROM in which the program is recorded is sold. It is also possible to store the program in a storage device of a server computer and transfer the program from the server computer to another computer via a network.

プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、ネットワークを介して接続されたサーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。   The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. In addition, each time a program is transferred from a server computer connected via a network, the computer can sequentially execute processing according to the received program.

また、上記の処理機能の少なくとも一部を、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)等の電子回路で実現することもできる。   Further, at least a part of the above processing functions can be realized by an electronic circuit such as a DSP (Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), or a PLD (Programmable Logic Device).

1 情報処理装置
1a、10 制御部
1a1 試験実行部
1a2 判断部
1b 記憶部
1b1 フラグ記憶部
1b2 識別情報記憶部
1c 指示部
1c1 カウンタ
2 接続機器
3 伝送路
4 電圧供給回路
10a、10b 制御モジュール
11 CPU
111 WDT処理部
112 フラグ制御部
113 マージン試験部
114 マージン設定部
20 監視部
22 FPGA
221a WDT0カウンタ
221b WDT2カウンタ
221c WDT3カウンタ
221 WDT監視処理部
222 リセット制御部
223 電源制御部
30 リセット回路
40 電源回路
50 クロック回路
60 MRAM
100 ストレージ装置
211 PostPhase監視部
212 電圧マージン制御部
213 クロックマージン制御部
DESCRIPTION OF SYMBOLS 1 Information processing apparatus 1a, 10 Control part 1a1 Test execution part 1a2 Judgment part 1b Storage part 1b1 Flag storage part 1b2 Identification information storage part 1c Instruction part 1c1 Counter 2 Connection apparatus 3 Transmission path 4 Voltage supply circuit 10a, 10b Control module 11 CPU
111 WDT Processing Unit 112 Flag Control Unit 113 Margin Test Unit 114 Margin Setting Unit 20 Monitoring Unit 22 FPGA
221a WDT0 counter 221b WDT2 counter 221c WDT3 counter 221 WDT monitoring processor 222 Reset controller 223 Power controller 30 Reset circuit 40 Power circuit 50 Clock circuit 60 MRAM
DESCRIPTION OF SYMBOLS 100 Storage apparatus 211 PostPhase monitoring part 212 Voltage margin control part 213 Clock margin control part

Claims (4)

複数の試験項目のうち、現在実行されている試験項目の試験を識別する識別情報を記憶する識別情報記憶部と、
試験対象に前記複数の試験項目の試験をそれぞれ実行し、1つの試験項目の試験の終了に伴い前記識別情報記憶部に記憶されている識別情報を、次に実行する試験項目の試験の識別情報に変更する試験実行部と、所定時間以内に前記識別情報記憶部に記憶されている識別情報が変更されたか否かを判断する判断部とを備える制御部と、
前記判断部が、前記識別情報が前記所定時間以内に変更されなかったと判断した場合、前記制御部の再起動を前記制御部に電圧を供給する回路に指示する指示部と、
を有することを特徴とする情報処理装置。
An identification information storage unit for storing identification information for identifying a test of a currently executed test item among a plurality of test items;
The test information of the test item to be executed next is executed by executing the test of the plurality of test items on the test object, and the identification information stored in the identification information storage unit at the end of the test of one test item. A control unit comprising: a test execution unit to be changed to; and a determination unit that determines whether or not the identification information stored in the identification information storage unit has been changed within a predetermined time;
An instruction unit that instructs a circuit that supplies a voltage to the control unit to restart the control unit when the determination unit determines that the identification information has not been changed within the predetermined time;
An information processing apparatus comprising:
前記指示部は、カウンタを有し、
前記制御部は、前記所定時間以内に前記識別情報が更新された場合は、前記カウンタのカウンタ値を所定のタイミングで第1のカウンタ値に設定する処理を実行し、
前記指示部は、前記カウンタのカウンタ値が第2のカウンタ値になる前に前記制御部により前記第1のカウンタ値に設定されなければ、前記制御部の再起動を指示することを特徴とする請求項1記載の情報処理装置。
The instruction unit has a counter,
The control unit, when the identification information is updated within the predetermined time, executes a process of setting the counter value of the counter to a first counter value at a predetermined timing,
The instruction unit instructs to restart the control unit unless the control unit sets the first counter value before the counter value of the counter reaches the second counter value. The information processing apparatus according to claim 1.
前記制御部のBIOSの起動に伴い実行されるプログラムのコードの生成を監視し、前記BIOSの起動が完了する前に所定時間前記プログラムのコードが生成されなくなった場合、前記制御部の再起動を前記制御部に電力を供給する回路に指示する監視部をさらに有することを特徴とする請求項1記載の情報処理装置。   The generation of the code of the program to be executed as the BIOS of the control unit is monitored, and when the code of the program is not generated for a predetermined time before the startup of the BIOS is completed, the control unit is restarted. The information processing apparatus according to claim 1, further comprising a monitoring unit that instructs a circuit that supplies power to the control unit. 情報処理装置が、
試験対象に複数の試験項目の試験をそれぞれ実行し、1つの試験項目の試験の終了に伴い識別情報記憶部に記憶されている現在実行されている試験項目の試験を識別する識別情報を、次に実行する試験項目の試験の識別情報に変更し、
所定時間以内に前記識別情報記憶部に記憶されている識別情報が変更されたか否かを判断し、
前記識別情報が前記所定時間以内に変更されなかったと判断した場合、前記複数の試験項目の試験をそれぞれ実行する制御部の再起動を前記制御部に電圧を供給する回路に指示する、
ことを特徴とする情報処理装置の試験方法。
Information processing device
The identification information for identifying the test of the currently executed test item stored in the identification information storage unit at the end of the test of one test item is executed next to each test of the plurality of test items on the test target. Change to the test identification information of the test item
Determining whether or not the identification information stored in the identification information storage unit has been changed within a predetermined time;
When it is determined that the identification information has not been changed within the predetermined time, the control unit that performs the test of each of the plurality of test items is instructed to restart a circuit that supplies a voltage to the control unit.
A method for testing an information processing apparatus.
JP2011200329A 2011-09-14 2011-09-14 Information processing apparatus and information processing apparatus testing method Active JP5909948B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011200329A JP5909948B2 (en) 2011-09-14 2011-09-14 Information processing apparatus and information processing apparatus testing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011200329A JP5909948B2 (en) 2011-09-14 2011-09-14 Information processing apparatus and information processing apparatus testing method

Publications (2)

Publication Number Publication Date
JP2013061841A true JP2013061841A (en) 2013-04-04
JP5909948B2 JP5909948B2 (en) 2016-04-27

Family

ID=48186454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011200329A Active JP5909948B2 (en) 2011-09-14 2011-09-14 Information processing apparatus and information processing apparatus testing method

Country Status (1)

Country Link
JP (1) JP5909948B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016188825A (en) * 2015-03-30 2016-11-04 ルネサスエレクトロニクス株式会社 Semiconductor device and system
US9626153B2 (en) 2014-09-16 2017-04-18 Fujitsu Limited Control device and control method
CN110515815A (en) * 2019-08-19 2019-11-29 成都华镭科技有限公司 The monitoring method of board resetting test
CN112948189A (en) * 2021-02-25 2021-06-11 山东英信计算机技术有限公司 Margin test method, margin test system and related device

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185569A (en) * 1997-09-02 1999-03-30 Fujitsu Ltd Processor
JP2001187247A (en) * 1999-12-28 2001-07-10 Sankyo Kk Game machine
JP2001211232A (en) * 2000-01-25 2001-08-03 Ricoh Co Ltd Device management control method and system for remote access
JP2005018462A (en) * 2003-06-26 2005-01-20 Nec Computertechno Ltd System and method for supervising processor stall
JP2006023970A (en) * 2004-07-08 2006-01-26 Oki Electric Ind Co Ltd Device abnormality restoration system
JP2011081566A (en) * 2009-10-06 2011-04-21 Toshiba Tec Corp Electronic apparatus and program
JP2011145872A (en) * 2010-01-14 2011-07-28 Yamatake Corp Operation monitoring device of cpu board

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185569A (en) * 1997-09-02 1999-03-30 Fujitsu Ltd Processor
JP2001187247A (en) * 1999-12-28 2001-07-10 Sankyo Kk Game machine
JP2001211232A (en) * 2000-01-25 2001-08-03 Ricoh Co Ltd Device management control method and system for remote access
JP2005018462A (en) * 2003-06-26 2005-01-20 Nec Computertechno Ltd System and method for supervising processor stall
JP2006023970A (en) * 2004-07-08 2006-01-26 Oki Electric Ind Co Ltd Device abnormality restoration system
JP2011081566A (en) * 2009-10-06 2011-04-21 Toshiba Tec Corp Electronic apparatus and program
JP2011145872A (en) * 2010-01-14 2011-07-28 Yamatake Corp Operation monitoring device of cpu board

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9626153B2 (en) 2014-09-16 2017-04-18 Fujitsu Limited Control device and control method
JP2016188825A (en) * 2015-03-30 2016-11-04 ルネサスエレクトロニクス株式会社 Semiconductor device and system
US10310007B2 (en) 2015-03-30 2019-06-04 Renesas Electronics Corporation Semiconductor apparatus and system
CN110515815A (en) * 2019-08-19 2019-11-29 成都华镭科技有限公司 The monitoring method of board resetting test
CN112948189A (en) * 2021-02-25 2021-06-11 山东英信计算机技术有限公司 Margin test method, margin test system and related device
CN112948189B (en) * 2021-02-25 2022-12-09 山东英信计算机技术有限公司 Margin test method, margin test system and related device

Also Published As

Publication number Publication date
JP5909948B2 (en) 2016-04-27

Similar Documents

Publication Publication Date Title
TWI627527B (en) Method for recovering a baseboard management controller and baseboard management controller
JP5909264B2 (en) Secure recovery apparatus and method
JP6291248B2 (en) Firmware upgrade error detection and automatic rollback
JP4723290B2 (en) Disk array device and control method thereof
JP5183542B2 (en) Computer system and setting management method
US8458510B2 (en) LPAR creation and repair for automated error recovery
TWI632462B (en) Switching device and method for detecting i2c bus
US20180060231A1 (en) Out-of-band data recovery in computing systems
JP4939180B2 (en) Run initialization code to configure connected devices
WO2018095107A1 (en) Bios program abnormal processing method and apparatus
WO2021057795A1 (en) System starting method and apparatus, node device and computer-readable storage medium
EP2798428B1 (en) Apparatus and method for managing operation of a mobile device
JP5909948B2 (en) Information processing apparatus and information processing apparatus testing method
JP2014071668A (en) Information processor, start program, and start method
TW200426571A (en) Policy-based response to system errors occurring during os runtime
US11768672B1 (en) Systems and methods for user-controlled deployment of software updates
JP2007025933A (en) Storage system and its firmware automatic updating method
JP2017091077A (en) Pseudo-fault generation program, generation method, and generator
US7861112B2 (en) Storage apparatus and method for controlling the same
JP4836732B2 (en) Information processing device
WO2017072904A1 (en) Computer system and failure detection method
JP5910413B2 (en) Information processing apparatus, activation program, and activation method
CN113835971A (en) Monitoring method for abnormal lighting of server backboard and related components
JP6911591B2 (en) Information processing device, control device and control method of information processing device
JP6160688B2 (en) Information processing apparatus, information processing method, and information processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140508

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151027

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160314

R150 Certificate of patent or registration of utility model

Ref document number: 5909948

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150