JP6089543B2 - Test method and processing equipment - Google Patents

Test method and processing equipment Download PDF

Info

Publication number
JP6089543B2
JP6089543B2 JP2012216407A JP2012216407A JP6089543B2 JP 6089543 B2 JP6089543 B2 JP 6089543B2 JP 2012216407 A JP2012216407 A JP 2012216407A JP 2012216407 A JP2012216407 A JP 2012216407A JP 6089543 B2 JP6089543 B2 JP 6089543B2
Authority
JP
Japan
Prior art keywords
test
power
control unit
control
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012216407A
Other languages
Japanese (ja)
Other versions
JP2014071601A (en
Inventor
智広 又谷
智広 又谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012216407A priority Critical patent/JP6089543B2/en
Publication of JP2014071601A publication Critical patent/JP2014071601A/en
Application granted granted Critical
Publication of JP6089543B2 publication Critical patent/JP6089543B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

本発明は,電源投入パケットを用いた処理装置の電源投入試験を行う試験方法および処理装置に関するものである。   The present invention relates to a test method and a processing apparatus for performing a power-on test of a processing apparatus using a power-on packet.

コンピュータなどの情報機器の電源を外部から制御する技術がある。例えば,コンピュータなどの情報機器の電源を外部から操作する技術として,Wake−On−LAN(Local Area Network)の技術がある。Wake−On−LANは,LAN等のネットワークに接続されているコンピュータに対して,マジックパケットと呼ばれる電源投入パケットを送ることで,該コンピュータの電源投入を遠隔で操作する技術である。   There is a technology for externally controlling the power supply of information devices such as computers. For example, there is a Wake-On-LAN (Local Area Network) technique as a technique for operating a power source of an information device such as a computer from the outside. Wake-On-LAN is a technique for remotely operating a computer connected to a network such as a LAN by sending a power-on packet called a magic packet.

例えば,Wake−On−LAN機能を備えるストレージ装置があるものとする。このストレージ装置を試験対象として電源投入パケットを用いた電源投入の試験を行う場合,試験対象のストレージ装置にPC(Personal Computer )やサーバをLAN接続する。電源OFF状態のストレージ装置に対して,LAN接続されたPCやサーバなどから電源投入パケットを投入し,ストレージ装置の電源OFF状態が電源ON状態に切り替わることを確認する試験が行われる。   For example, it is assumed that there is a storage apparatus having a Wake-On-LAN function. When performing a power-on test using a power-on packet with this storage device as a test target, a personal computer (PC) or server is connected to the test-target storage device via a LAN. A test is performed to check that the power-off state of the storage device is switched to the power-on state by inputting a power-on packet from a PC or server connected to the LAN to the power-off storage device.

なお,リモート電源装置を制御することにより,該リモート電源装置に電源接続された情報処理装置の電源切断,投入を行う技術が知られている。また,ネットワーク経由での電源切断指示で未通知となった端末について,他端末から別インタフェースを経由して該未通知の端末のネットワーク通信制御部を初期化し,該未通知の端末に対して再度ネットワーク経由での電源切断指示を行う技術が知られている。また,複数のストレージ装置や情報処理装置が接続されているストレージシステムにおいて,ストレージ装置と情報処理装置との電源を連動して制御する技術が知られている。   A technique is known in which a remote power supply is controlled to turn off and turn on an information processing apparatus connected to the remote power supply. In addition, for a terminal that has not been notified by a power-off instruction via a network, the network communication control unit of the unreported terminal is initialized from another terminal via another interface, and the unreported terminal is re-established. A technique for instructing power-off via a network is known. In addition, in a storage system in which a plurality of storage apparatuses and information processing apparatuses are connected, a technique for controlling the power supply of the storage apparatus and the information processing apparatus in conjunction with each other is known.

特開2001−184145号公報JP 2001-184145 A 特開2001−202162号公報JP 2001-202162 A 特開2004−334535号公報JP 2004-334535 A

例えば,上述の試験対象のストレージ装置に対する電源投入パケットを用いた電源投入の試験において,ストレージ装置の電源投入ができなかった場合,LAN接続されたPCやサーバなどはストレージ装置にアクセスできないままなので,容易に故障箇所を特定することはできない。このような電源投入パケットを用いた処理装置の電源投入の試験において,故障箇所を容易に特定したいという要望がある。   For example, in the power-on test using the power-on packet for the above-described test target storage device, if the storage device cannot be turned on, the LAN-connected PC or server remains inaccessible to the storage device. The failure location cannot be easily identified. In such a power-on test of a processing apparatus using a power-on packet, there is a demand for easily identifying a failure location.

一側面では,本発明は,電源投入パケットを用いた処理装置の電源投入の試験において,容易に故障箇所の特定が可能となる技術を提供することを目的とする。   In one aspect, an object of the present invention is to provide a technique capable of easily identifying a failure location in a power-on test of a processing apparatus using a power-on packet.

1態様では,試験方法において,処理装置が備える第1の制御部は,処理装置が備える第2の制御部に対して第1のパスを介して電源投入パケットを送信し,電源投入パケットの送信によって第2の制御部の電源が投入されなかった場合に,互いに通信可能な第1の制御部が備える監視回路と第2の制御部が備える監視回路とを介して第2の制御部の電源制御回路を制御して電源を投入し,第2の制御部の電源投入の後に,第2のパスを介して第2の制御部に対して状態情報の取得要求メッセージを送信する処理を実行する。
In one aspect, in the test method, the first control unit included in the processing device transmits a power-on packet to the second control unit included in the processing device via the first path, and transmits the power-on packet. second when the power supply of the control unit has not been turned in, the power of the second control unit via the monitoring circuit and the second monitor circuit control unit is provided that includes a first control unit capable of communicating with each other by The control circuit is controlled to turn on the power, and after the second control unit is turned on, a process of transmitting a status information acquisition request message to the second control unit via the second path is executed. .

1態様では,電源投入パケットを用いた処理装置の電源投入の試験において,容易に故障箇所の特定が可能となる。   In one aspect, the failure location can be easily identified in the power-on test of the processing apparatus using the power-on packet.

本実施の形態によるWOLを説明する図である。It is a figure explaining WOL by this Embodiment. 本実施の形態によるRAID装置の構成例を示す図である。It is a figure which shows the structural example of the RAID apparatus by this Embodiment. 本実施の形態による試験制御CMと試験対象CMの機能構成例を示す図である。It is a figure which shows the function structural example of the test control CM by this Embodiment, and test object CM. 本実施の形態による故障箇所特定の例を説明する図である。It is a figure explaining the example of a fault location specific by this Embodiment. 本実施の形態による試験管理テーブルの例を示す図である。It is a figure which shows the example of the test management table by this Embodiment. 本実施の形態の試験制御CMによる試験処理フローチャートである。It is a test processing flowchart by test control CM of this Embodiment. 本実施の形態の試験制御CMおよび試験対象CMによるWOL試験処理のシーケンス図である。It is a sequence diagram of a WOL test process by the test control CM and the test object CM of the present embodiment. 本実施の形態の試験制御CMおよび試験対象CMによるWOL試験処理のシーケンス図である。It is a sequence diagram of a WOL test process by the test control CM and the test object CM of the present embodiment. 本実施の形態の試験制御CMおよび試験対象CMによる故障箇所特定処理のシーケンス図である。It is a sequence diagram of the failure location identification process by the test control CM and test object CM of this Embodiment. 本実施の形態の試験制御CMおよび試験対象CMによる故障箇所特定処理のシーケンス図である。It is a sequence diagram of the failure location identification process by the test control CM and test object CM of this Embodiment.

以下,本実施の形態について,図を用いて説明する。なお,本実施の形態の例では,ストレージ装置を試験対象の処理装置とした場合の例を説明する。   Hereinafter, the present embodiment will be described with reference to the drawings. In the example of the present embodiment, an example in which the storage apparatus is a processing apparatus to be tested will be described.

図1は,本実施の形態によるWOLを説明する図である。   FIG. 1 is a diagram for explaining WOL according to the present embodiment.

RAID(Redundant Arrays of Inexpensive Disks )装置1は,複数のディスクを備えるストレージ装置である。図1に示すRAID装置1は,Wake−On−LAN機能を備えており,LAN3で接続されたPC2からの電源投入パケットを受けて,電源投入を行う。以下では,Wake−On−LANを,WOLとも呼ぶ。また,電源投入パケットを,マジックパケットとも呼ぶ。   A RAID (Redundant Array of Inexpensive Disks) device 1 is a storage device having a plurality of disks. The RAID device 1 shown in FIG. 1 has a Wake-On-LAN function, and performs power-on in response to a power-on packet from the PC 2 connected via the LAN 3. Hereinafter, Wake-On-LAN is also referred to as WOL. The power-on packet is also called a magic packet.

図2は,本実施の形態によるRAID装置の構成例を示す図である。   FIG. 2 is a diagram illustrating a configuration example of a RAID device according to the present embodiment.

RAID装置1は,CE(Controller Enclosure)10,DE(Drive Enclosure )40を備える。CE10は,サブシステム内のすべての動作を管理するモジュールであるCM(Controller Module )20を内部に搭載する筐体である。CE10には,複数のCM20が搭載可能である。図2に示す例では,CE10に2つのCM20が搭載されている。DE40は,複数のディスク41を内部に搭載する筐体である。   The RAID device 1 includes a CE (Controller Enclosure) 10 and a DE (Drive Enclosure) 40. The CE 10 is a housing in which a CM (Controller Module) 20 that is a module for managing all operations in the subsystem is mounted. A plurality of CMs 20 can be mounted on the CE 10. In the example shown in FIG. 2, two CMs 20 are mounted on the CE 10. The DE 40 is a casing in which a plurality of disks 41 are mounted.

RAID装置1の制御部となるCM20は,CPU(Central Processing Unit )21,主記憶となるメモリ23,システムボリューム24,PCH(Platform Controller Hub )25,PCI(Peripheral Component Interconnect )バスブリッジ26,CA(Channel Adapter )27,SAS(Serial Attached SCSI)コントローラ28,LANコントローラ29,WAKE信号線30,システム監視回路31,電源制御回路32を備える。また,CPU21は,DMA(Direct Memory Access)コントローラ22を備える。なお,図2では記載が省略されているが,図2に示すRAID装置1が備える複数のCM20は,すべて同じ構成となっているものとする。   The CM 20 serving as a control unit of the RAID device 1 includes a CPU (Central Processing Unit) 21, a memory 23 serving as a main memory, a system volume 24, a PCH (Platform Controller Hub) 25, a PCI (Peripheral Component Interconnect) bus bridge 26, and a CA ( Channel Adapter) 27, SAS (Serial Attached SCSI) controller 28, LAN controller 29, WAKE signal line 30, system monitoring circuit 31, and power supply control circuit 32. The CPU 21 also includes a DMA (Direct Memory Access) controller 22. Although omitted in FIG. 2, it is assumed that the plurality of CMs 20 included in the RAID device 1 shown in FIG. 2 have the same configuration.

DMAコントローラ22は,DMAによるデータ転送を行う。DMAコントローラ22は,CM20間で相互接続され,CM20間のデータ通信に使用される。本実施の形態では,DMAコントローラ22によって,他のCM20にデータ転送を行うことにより,CM20間のデータ転送を実現する。   The DMA controller 22 performs data transfer by DMA. The DMA controller 22 is interconnected between the CMs 20 and used for data communication between the CMs 20. In the present embodiment, data transfer between CMs 20 is realized by transferring data to other CMs 20 by the DMA controller 22.

システムボリューム24は,例えば,HDD(Hard Disk Drive )やSSD(Solid State Drive ),USB(Universal Serial Bus)メモリなどの記憶装置である。本実施の形態では,システムボリューム24は,診断システムモニタのブート先や,CM20が実行する試験プログラムの記憶部としても使用される。   The system volume 24 is a storage device such as an HDD (Hard Disk Drive), an SSD (Solid State Drive), or a USB (Universal Serial Bus) memory. In the present embodiment, the system volume 24 is also used as a boot destination for a diagnostic system monitor and a storage unit for a test program executed by the CM 20.

PCH25は,ノースブリッジとサウスブリッジの機能を統合したチップである。PCH25は,PCI(Peripheral Component Interconnect )Express,シリアルATA(Advanced Technology Attachment),USB,LAN,グラフィックス出力機能などを備える。   The PCH 25 is a chip that integrates the functions of the North Bridge and the South Bridge. The PCH 25 includes PCI (Peripheral Component Interconnect) Express, serial ATA (Advanced Technology Attachment), USB, LAN, graphics output function, and the like.

PCIバスブリッジ26は,CPU21と周辺機器との間の通信を行うためのバスである。CA27は,ホストインタフェースを持つアダプタであり,ホスト(図示省略)と接続し,ホストとRAID装置1との間でのデータ通信に使用される。SASコントローラ28は,DE40と接続して,ディスク41に対するデータのライト/リードに使用されるチップである。   The PCI bus bridge 26 is a bus for performing communication between the CPU 21 and peripheral devices. The CA 27 is an adapter having a host interface, is connected to a host (not shown), and is used for data communication between the host and the RAID device 1. The SAS controller 28 is a chip connected to the DE 40 and used for writing / reading data to / from the disk 41.

LANコントローラ29は,LANによる通信の制御を行うチップである。LANコントローラには,それぞれ固有のMAC(Media Access Control)アドレスが設定されている。   The LAN controller 29 is a chip that controls communication via a LAN. Each LAN controller is set with a unique MAC (Media Access Control) address.

システム監視回路31は,システムの電源制御やエラー監視等を行う回路である。システム監視回路31は,自CM20内の電源制御回路32を操作して各部位への電源供給を行う。システム監視回路31は,例えばFPGA(Field-Programmable Gate Array )などによって実現される。電源制御回路32は,システム監視回路からの操作により自CM20の電源の投入や切断の制御を実行する回路である。   The system monitoring circuit 31 is a circuit that performs system power control, error monitoring, and the like. The system monitoring circuit 31 operates the power control circuit 32 in its own CM 20 to supply power to each part. The system monitoring circuit 31 is realized by, for example, an FPGA (Field-Programmable Gate Array). The power supply control circuit 32 is a circuit that executes power on / off control of the own CM 20 by an operation from the system monitoring circuit.

端末4は,PCH25とシリアルインタフェースによって接続されるコンピュータ端末である。端末4は,ユーザ操作による試験プログラムの起動や,ユーザに対する情報の提示などに使用される。   The terminal 4 is a computer terminal connected to the PCH 25 by a serial interface. The terminal 4 is used for starting a test program by a user operation and presenting information to the user.

本実施の形態のLANコントローラ29は,WOLに対応している。例えば,LANコントローラ29が,LANを介してマジックパケットを受信すると,LANコントローラ29のPMEステータスが“1”になる。その状態は,WAKE信号線30に反映され,WAKE信号がシステム監視回路31に通知される。その後,システム監視回路が電源制御回路を操作し,自CM20の電源をON状態にする。PMEステータスは,LANコントローラ29がWakeupイベント(マジックパケット)を受信したかどうかを示すステータスである。WAKE信号は,LANコントローラ29のPMEステータスの状態を示す信号である。PMEステータスが“1”(ON状態)になったときに,WAKE信号も“1”(ON状態)となる。システム監視回路31は,WAKE信号が“1”になると,電源制御回路32にアクセスし,電源を投入する。なお,CM20の電源がOFF状態であっても,LANコントローラ29や,システム監視回路31,電源制御回路32等には,電源が供給される。   The LAN controller 29 according to the present embodiment is compatible with WOL. For example, when the LAN controller 29 receives a magic packet via the LAN, the PME status of the LAN controller 29 becomes “1”. The state is reflected on the WAKE signal line 30, and the WAKE signal is notified to the system monitoring circuit 31. Thereafter, the system monitoring circuit operates the power supply control circuit to turn on the power supply of the own CM 20. The PME status is a status indicating whether or not the LAN controller 29 has received a Wakeup event (magic packet). The WAKE signal is a signal indicating the state of the PME status of the LAN controller 29. When the PME status is “1” (ON state), the WAKE signal is also “1” (ON state). When the WAKE signal becomes “1”, the system monitoring circuit 31 accesses the power control circuit 32 and turns on the power. Even when the power supply of the CM 20 is OFF, power is supplied to the LAN controller 29, the system monitoring circuit 31, the power supply control circuit 32, and the like.

RAID装置1のあるCM20がマジックパケットを受信した場合,該CM20のシステム監視回路31は,自CM20内の電源制御回路32を操作して各部位への電源供給を行うと同時に,他のCM20のシステム監視回路31に対して,WAKE信号があった旨を通知する。システム監視回路31は,他のCM20と通信を行うことが可能である。マジックパケットを受けたCM20のシステム監視回路31から,WAKE信号があった旨の通知を受けた各CM20のシステム監視回路31は,それぞれ自CM20内の電源制御回路32を操作して,自CM20に対する電源供給を行う。   When the CM 20 with the RAID device 1 receives the magic packet, the system monitoring circuit 31 of the CM 20 operates the power control circuit 32 in the own CM 20 to supply power to each part, and at the same time, the other CM 20 The system monitoring circuit 31 is notified that there is a WAKE signal. The system monitoring circuit 31 can communicate with other CMs 20. The system monitoring circuit 31 of each CM 20 that has received a notification that there is a WAKE signal from the system monitoring circuit 31 of the CM 20 that has received the magic packet, operates the power control circuit 32 in the own CM 20, respectively. Supply power.

以下では,WOL機能を備えるRAID装置1について,本実施の形態によるWOL機能の試験を行う例を説明する。   Hereinafter, an example in which a test of the WOL function according to the present embodiment is performed on the RAID apparatus 1 having the WOL function will be described.

図3は,本実施の形態による試験制御CMと試験対象CMの機能構成例を示す図である。   FIG. 3 is a diagram illustrating a functional configuration example of the test control CM and the test target CM according to the present embodiment.

図3において,CM20aは,WOL試験の制御を行う第1の制御部となるCM20である。以下では,WOL試験を制御するCM20を,試験制御CM20aと呼ぶ。また,CM20bは,WOL試験の対象である第2の制御部となるCM20である。以下では,WOL試験の対象となるCM20を,試験対象CM20bと呼ぶ。なお,本実施の形態では,RAID装置1のWOL試験を行うにあたって,試験制御CM20aの各LANコントローラ29と試験対象CM20bの各LANコントローラ29とが,例えばHUB5を介してLANで接続されているものとする。   In FIG. 3, a CM 20a is the CM 20 serving as a first control unit that controls the WOL test. Hereinafter, the CM 20 that controls the WOL test is referred to as a test control CM 20a. The CM 20b is the CM 20 serving as the second control unit that is the subject of the WOL test. Hereinafter, the CM 20 that is the subject of the WOL test is referred to as a test subject CM 20b. In this embodiment, when the WOL test of the RAID device 1 is performed, each LAN controller 29 of the test control CM 20a and each LAN controller 29 of the test target CM 20b are connected by a LAN via the HUB 5, for example. And

試験制御CM20aは,試験処理部100を備える。試験処理部100は,本実施の形態によるWOL試験において,試験制御CM20a側の処理を実行する機能部である。試験処理部100は,試験実行部110,電源投入制御部120,情報取得部130,試験管理情報記憶部140,出力部150を備える。   The test control CM 20a includes a test processing unit 100. The test processing unit 100 is a functional unit that executes processing on the test control CM 20a side in the WOL test according to the present embodiment. The test processing unit 100 includes a test execution unit 110, a power-on control unit 120, an information acquisition unit 130, a test management information storage unit 140, and an output unit 150.

試験実行部110は,WOL試験を実行する制御を行う。より具体的には,試験実行部110は,試験対象CM20bに対してWOL試験開始の指示を出し,試験対象CM20bの電源をOFF状態にさせる。その後,試験実行部110のパケット送信部111は,試験対象CM20bに対して,第1のパスであるLANを介してマジックパケットを送信する。   The test execution unit 110 performs control to execute the WOL test. More specifically, the test execution unit 110 issues a WOL test start instruction to the test target CM 20b, and turns off the power of the test target CM 20b. Thereafter, the packet transmission unit 111 of the test execution unit 110 transmits a magic packet to the test target CM 20b via the LAN that is the first path.

電源投入制御部120は,マジックパケットの送信によって試験対象CM20bの電源が投入されなかった場合に,両CM20のシステム監視回路31を介して,試験対象CM20bの電源制御回路32を制御し,試験対象CM20bの電源を投入する。   The power-on control unit 120 controls the power control circuit 32 of the test target CM 20b via the system monitoring circuit 31 of both CMs 20 when the power of the test target CM 20b is not turned on due to the transmission of the magic packet. Turn on the power of the CM 20b.

情報取得部130は,マジックパケットの送信によって試験対象CM20bの電源が投入されなかった場合に,試験対象CM20bから故障箇所の情報などの状態情報を取得する。このとき,情報取得部130のメッセージ送信部131は,試験対象CM20bの電源投入の後に,CM20間でのメモリ23へのデータ転送を用いた通信のパスである第2のパスを介して,試験対象CM20bに対して,状態情報の取得要求メッセージを送信する。CM20間でのメモリ23へのデータ転送は,DMAコントローラ22を用いて行われる。   The information acquisition unit 130 acquires status information such as information on a failure location from the test target CM 20b when the power of the test target CM 20b is not turned on by transmitting a magic packet. At this time, the message transmission unit 131 of the information acquisition unit 130 performs the test via the second path which is a communication path using data transfer to the memory 23 between the CMs 20 after the test target CM 20b is powered on. A status information acquisition request message is transmitted to the target CM 20b. Data transfer between the CMs 20 to the memory 23 is performed using the DMA controller 22.

試験管理情報記憶部140は,試験管理情報を記憶する記憶部である。試験管理情報は,WOL試験の結果が記録される情報である。例えば,試験管理情報記憶部140の試験管理情報には,情報取得部130により試験対象CM20bから取得された故障箇所などの情報が記録される。   The test management information storage unit 140 is a storage unit that stores test management information. The test management information is information in which the result of the WOL test is recorded. For example, in the test management information of the test management information storage unit 140, information such as a failure location acquired from the test target CM 20b by the information acquisition unit 130 is recorded.

出力部150は,試験管理情報記憶部140の試験管理情報に記録されたWOL試験の結果を,端末4に出力する。例えば,端末4のディスプレイに,WOL試験の結果が表示される。   The output unit 150 outputs the result of the WOL test recorded in the test management information in the test management information storage unit 140 to the terminal 4. For example, the result of the WOL test is displayed on the display of the terminal 4.

試験対象CM20bは,試験処理部200を備える。試験処理部200は,本実施の形態によるWOL試験において,試験対象CM20b側の処理を実行する機能部である。試験処理部200は,試験準備部210,立ち上げ通知部220,故障箇所特定処理部230を備える。   The test target CM 20b includes a test processing unit 200. The test processing unit 200 is a functional unit that executes processing on the test target CM 20b side in the WOL test according to the present embodiment. The test processing unit 200 includes a test preparation unit 210, a startup notification unit 220, and a failure location specifying processing unit 230.

試験準備部210は,試験制御CM20aからのWOL試験開始の指示を受け,自試験対象CM20bの電源をOFF状態にする。   In response to the instruction to start the WOL test from the test control CM 20a, the test preparation unit 210 turns off the power of the subject test target CM 20b.

立ち上げ通知部220は,自試験対象CM20bが,電源OFF状態から電源ON状態となり,試験処理部200が起動された際に,自試験対象CM20bが立ち上がった旨を,試験制御CM20aに通知する。   The start-up notification unit 220 notifies the test control CM 20a that the self-test target CM 20b has started up when the self-test target CM 20b changes from the power-off state to the power-on state and the test processing unit 200 is activated.

故障箇所特定処理部230は,試験制御CM20aからの状態情報の取得要求メッセージの受信後,LANコントローラ29のレジスタや,システム監視回路31のレジスタなどをチェックし,故障箇所を特定する。故障箇所特定処理部230は,特定した故障箇所の情報を試験制御CM20aに送信する。   After receiving the status information acquisition request message from the test control CM 20a, the failure location identification processing unit 230 checks the register of the LAN controller 29, the register of the system monitoring circuit 31, and the like to identify the failure location. The failure location identification processing unit 230 transmits information on the identified failure location to the test control CM 20a.

図3に示す試験制御CM20a,試験対象CM20bが備える各機能部は,各CM20が備えるCPU21,メモリ23等のハードウェアと,ソフトウェアプログラムとによって実現することが可能である。CM20が実行可能なプログラムは,システムボリューム24に記憶され,その実行時にメモリ23に読み出され,CPU21により実行される。RAID装置1のWOL機能について試験を行う場合,各CM20のシステムボリューム24には,試験プログラムが記憶されている。   Each functional unit included in the test control CM 20a and the test target CM 20b illustrated in FIG. 3 can be realized by hardware such as the CPU 21 and the memory 23 included in each CM 20, and a software program. Programs that can be executed by the CM 20 are stored in the system volume 24, read into the memory 23 at the time of execution, and executed by the CPU 21. When testing the WOL function of the RAID device 1, a test program is stored in the system volume 24 of each CM 20.

各CM20のシステムボリューム24に記憶された試験プログラムは,試験対象のRAID装置1の電源投入後,例えば,以下の手順で起動される。
(1)フラッシュROM(Read Only Memory)(図示省略)のBIOS(Basic Input/Output System )が起動する。
(2)BIOSがシステムボリューム24内の診断システムモニタをメモリ23上にローディングし,制御を渡す。診断システムモニタは,CM20上で試験プログラムを動作させるためのOS(Operating System)である。診断システムモニタの初期化処理を実行する。
(3)IO(Input/Output)ドライバの数だけ,システムボリューム24内のIOドライバモジュールがメモリ23にローディングされ,IOドライバの初期化処理が実行される。
(4)診断システムモニタの立ち上げ処理の完了後,端末4に操作画面が表示される。ユーザは,端末4から試験プログラムの起動操作を実施する。
(5)診断システムモニタは,試験プログラムおよびユーティリティコマンドをシステムボリューム24からメモリ23にローディングし,実行する。
The test program stored in the system volume 24 of each CM 20 is activated, for example, by the following procedure after the RAID device 1 to be tested is turned on.
(1) A BIOS (Basic Input / Output System) of a flash ROM (Read Only Memory) (not shown) is activated.
(2) The BIOS loads the diagnostic system monitor in the system volume 24 onto the memory 23 and passes control. The diagnostic system monitor is an OS (Operating System) for operating a test program on the CM 20. Execute diagnostic system monitor initialization.
(3) The IO driver modules in the system volume 24 are loaded into the memory 23 by the number of IO (Input / Output) drivers, and the initialization process of the IO drivers is executed.
(4) After the startup process of the diagnostic system monitor is completed, an operation screen is displayed on the terminal 4. The user performs an operation for starting the test program from the terminal 4.
(5) The diagnostic system monitor loads the test program and utility commands from the system volume 24 to the memory 23 and executes them.

なお,端末4からの実行文をあらかじめファイルに記載しておくことで,自動運転も可能である。また,RAID装置1が備える複数のCM20のうち,どのCM20が試験制御CM20aとなり,どのCM20が試験対象CM20bとなるかは,例えば,端末4を操作するユーザからの指定によって決定されてもよいし,自動で決定されてもよい。   It should be noted that automatic operation is also possible by previously writing an executable statement from the terminal 4 in a file. Further, among the plurality of CMs 20 included in the RAID device 1, which CM 20 is the test control CM 20a and which CM 20 is the test target CM 20b may be determined by, for example, designation from the user who operates the terminal 4. , May be determined automatically.

このように,RAID装置1が備えるCM20で試験プログラムが実行されることにより,図3に示す試験制御CM20aの試験処理部100や,試験対象CM20bの試験処理部200が実現される。   As described above, the test program is executed by the CM 20 included in the RAID device 1, thereby realizing the test processing unit 100 of the test control CM 20a and the test processing unit 200 of the test target CM 20b illustrated in FIG.

図4は,本実施の形態による故障箇所特定の例を説明する図である。   FIG. 4 is a diagram for explaining an example of identifying a failure location according to the present embodiment.

ここでは,故障箇所の特定でチェックする箇所と,そのチェック結果から特定される故障箇所の候補の一例を説明する。チェックする箇所や,チェック結果から特定される故障箇所などは,試験対象となるRAID装置1の仕様や設計に応じたものとなる。   Here, an example of a location to be checked by specifying a failure location and a failure location candidate specified from the check result will be described. The location to be checked and the failure location identified from the check result correspond to the specifications and design of the RAID device 1 to be tested.

例えば,試験対象CM20bの故障箇所特定処理部230は,LANコントローラ29のレジスタからのリードにより,マジックパケットの受信状態を示すステータスをチェックする。マジックパケットが受信状態でない場合には,試験対象CM20bのLANコントローラ29,試験制御CM20aのLANコントローラ29,LANケーブルなどが,故障箇所の候補として考えられる。   For example, the failure location identification processing unit 230 of the test target CM 20b checks the status indicating the reception state of the magic packet by reading from the register of the LAN controller 29. When the magic packet is not in a reception state, the LAN controller 29 of the test target CM 20b, the LAN controller 29 of the test control CM 20a, the LAN cable, and the like are considered as failure point candidates.

また,例えば,試験対象CM20bの故障箇所特定処理部230は,LANコントローラ29のレジスタからのリードにより,PMEステータスをチェックする。PMEステータスが“0”である場合,試験対象CM20bのLANコントローラ29などが,故障箇所の候補として考えられる。   In addition, for example, the failure location identification processing unit 230 of the test target CM 20 b checks the PME status by reading from the register of the LAN controller 29. When the PME status is “0”, the LAN controller 29 of the test target CM 20b or the like is considered as a failure location candidate.

また,例えば,試験対象CM20bの故障箇所特定処理部230は,システム監視回路31のレジスタをチェックすることにより,WAKE信号状態を判断する。WAKE信号状態が“0”である場合,WAKE信号線30などが,故障箇所の候補として考えられる。   Further, for example, the failure location specifying processing unit 230 of the test target CM 20b checks the register of the system monitoring circuit 31 to determine the WAKE signal state. When the WAKE signal state is “0”, the WAKE signal line 30 or the like is considered as a failure location candidate.

マジックパケットの受信状態,PMEステータス,WAKE信号状態のチェックで異常がない場合,システム監視回路31,電源制御回路32などが,故障箇所の候補として考えられる。   If there is no abnormality in checking the reception state of the magic packet, the PME status, and the WAKE signal state, the system monitoring circuit 31, the power supply control circuit 32, and the like are considered as possible fault locations.

図5は,本実施の形態による試験管理テーブルの例を示す図である。   FIG. 5 is a diagram showing an example of a test management table according to the present embodiment.

図5に示す試験管理テーブル145は,試験制御CM20aの試験管理情報記憶部140に記憶される試験管理情報の一例を示す。図5に示す試験管理テーブル145は,CM番号,LANポート番号,MACアドレス,試験結果,故障箇所の情報を持つ。   The test management table 145 shown in FIG. 5 shows an example of test management information stored in the test management information storage unit 140 of the test control CM 20a. The test management table 145 shown in FIG. 5 has CM number, LAN port number, MAC address, test result, and failure location information.

CM番号は,試験対象のRAID装置1が備えるCM20のスロットIDを示す。LANポート番号は,該当CM20が備えるLANポートの番号を示す。試験管理テーブル145のレコードは,CM番号で示されるCM20における,LANポート番号で示されるLANポートごとのレコードとなる。MACアドレスは,該当LANポートのLANコントローラ29のMACアドレスを示す。   The CM number indicates the slot ID of the CM 20 included in the RAID device 1 to be tested. The LAN port number indicates a LAN port number included in the CM 20. The record of the test management table 145 is a record for each LAN port indicated by the LAN port number in the CM 20 indicated by the CM number. The MAC address indicates the MAC address of the LAN controller 29 of the corresponding LAN port.

試験結果は,該当LANポートに対するWOL試験の試験結果を示す。試験結果において,“0”はWOL試験が未実施であることを示す。試験結果において,“1”は試験結果がOKである場合,すなわち試験対象CM20bの該当LANポートを対象としたWOL試験で試験対象CM20bの電源が投入された場合を示す。試験結果において,“2”は試験結果がNGである場合,すなわち試験対象CM20bの該当LANポートを対象としたWOL試験で試験対象CM20bの電源が投入されなかった場合を示す。   The test result indicates the test result of the WOL test for the corresponding LAN port. In the test results, “0” indicates that the WOL test has not been performed. In the test result, “1” indicates that the test result is OK, that is, the power of the test target CM 20b is turned on in the WOL test for the corresponding LAN port of the test target CM 20b. In the test result, “2” indicates a case where the test result is NG, that is, a case where the power of the test target CM 20b is not turned on in the WOL test for the corresponding LAN port of the test target CM 20b.

故障箇所は,試験結果がNGであった場合に,特定された故障箇所を示す。故障箇所における4つの数値は,左から試験対象CM20bのLANコントローラ29,WAKE信号線30,システム監視回路31or電源制御回路32,試験制御CM20aのLANコントローラ29orLANケーブルの故障を表している。故障箇所において,“0”は該当箇所が故障箇所の候補でないことを示し,“1”は該当箇所が故障箇所の候補であることを示す。   The failure location indicates the identified failure location when the test result is NG. The four numerical values at the failure location represent from the left the failure of the LAN controller 29 of the test target CM 20b, the WAKE signal line 30, the system monitoring circuit 31or power supply control circuit 32, and the LAN controller 29orLAN cable of the test control CM 20a. In the failure location, “0” indicates that the corresponding location is not a failure location candidate, and “1” indicates that the corresponding location is a failure location candidate.

例えば,図4に示すチェック結果において,パケット受信状態でない場合.試験管理テーブル145の故障箇所は,“1001”となる。また,PMEステータスが“0”である場合,試験管理テーブル145の故障箇所は,“1000”となる。また,WAKE信号状態が“0”である場合,試験管理テーブル145の故障箇所は,“0100”となる。また,それら以外である場合,試験管理テーブル145の故障箇所は,“0010”となる。   For example, in the check result shown in FIG. The failure location in the test management table 145 is “1001”. When the PME status is “0”, the failure location in the test management table 145 is “1000”. When the WAKE signal state is “0”, the failure location in the test management table 145 is “0100”. Otherwise, the failure location in the test management table 145 is “0010”.

以下,図6〜図10を用いて,本実施の形態の試験制御CM20aと試験対象CM20bとによる,一連のWOL試験の処理の流れを説明する。   Hereinafter, a flow of processing of a series of WOL tests by the test control CM 20a and the test target CM 20b according to the present embodiment will be described with reference to FIGS.

図6は,本実施の形態の試験制御CMによる試験処理フローチャートである。   FIG. 6 is a test process flowchart according to the test control CM of the present embodiment.

試験制御CM20aにおいて,試験処理部100は,試験対象CM20bのLANポートから,試験対象のLANポートを順に1つ選択する(ステップS10)。試験処理部100は,試験対象のLANポートについて,WOL試験処理を実行する(ステップS11)。WOL試験処理は,電源をOFF状態の試験対象CM20bにおける試験対象LANポートに対して,試験制御CM20aからマジックパケットを送信することにより,試験対象CM20bの電源を投入させる試験の処理である。WOL試験処理の詳細については,後述する。   In the test control CM 20a, the test processing unit 100 selects one LAN port to be tested in order from the LAN port of the CM to be tested 20b (Step S10). The test processing unit 100 executes the WOL test process for the LAN port to be tested (step S11). The WOL test process is a test process in which the test target CM 20b is powered on by transmitting a magic packet from the test control CM 20a to the test target LAN port in the test target CM 20b in the power-off state. Details of the WOL test process will be described later.

試験処理部100は,試験結果がOKであるかを判定する(ステップS12)。WOL試験処理において,試験対象CM20bの電源が投入されれば試験結果はOKとなり,試験対象CM20bの電源が投入されなければ試験結果はNGとなる。試験結果がOKであれば(ステップS12のYES),試験処理部100は,試験管理テーブル145における試験対象CM20bの試験対象LANポートのレコードに,試験結果がOKであった旨を記録する(ステップS14)。   The test processing unit 100 determines whether the test result is OK (step S12). In the WOL test process, the test result is OK if the test target CM 20b is turned on, and the test result is NG if the test target CM 20b is not turned on. If the test result is OK (YES in step S12), the test processing unit 100 records in the record of the test target LAN port of the test target CM 20b in the test management table 145 that the test result is OK (step). S14).

試験結果がOKでなければ(ステップS12のNO),すなわち試験結果がNGであれば,試験処理部100は,故障箇所特定処理を実行する(ステップS13)。故障箇所特定処理は,試験制御CM20aから試験対象CM20bの電源を投入して,故障箇所を特定する処理である。故障箇所特定処理の詳細については,後述する。試験処理部100は,試験管理テーブル145における試験対象CM20bの試験対象LANポートのレコードに,試験結果がNGであった旨や,特定された故障箇所の情報を記録する(ステップS14)。   If the test result is not OK (NO in step S12), that is, if the test result is NG, the test processing unit 100 executes a failure location specifying process (step S13). The failure location identification processing is processing for identifying the failure location by turning on the power of the test target CM 20b from the test control CM 20a. Details of the failure location specifying process will be described later. The test processing unit 100 records information indicating that the test result is NG and information on the specified failure location in the test target LAN port record of the test target CM 20b in the test management table 145 (step S14).

試験処理部100は,試験対象CM20bのすべてのLANポートについて処理が終了したかを判定する(ステップS15)。すべてのLANポートについて処理が終了していなければ(ステップS15のNO),試験処理部100は,ステップS10の処理に戻って,次のLANポートについての処理に移る。すべてのLANポートについて処理が終了していれば(ステップS15のYES),試験処理部100の出力部150は,端末4に対して,試験管理テーブル145に記録された,試験対象CM20bについてのWOL試験の結果を出力する(ステップS16)。   The test processing unit 100 determines whether the processing has been completed for all the LAN ports of the test target CM 20b (step S15). If the processing has not been completed for all LAN ports (NO in step S15), the test processing unit 100 returns to the processing in step S10 and proceeds to the processing for the next LAN port. If the processing has been completed for all the LAN ports (YES in step S15), the output unit 150 of the test processing unit 100 sends the WOL for the test target CM 20b recorded in the test management table 145 to the terminal 4. The test result is output (step S16).

本実施の形態では,図6に示す一連の処理を,RAID装置1が備える各CM20について,試験制御CM20aと試験対象CM20bとを変えながら実行する。本実施の形態の技術によって,RAID装置1のWOL試験を行う場合,容易に故障箇所の特定が可能となる。   In the present embodiment, the series of processing shown in FIG. 6 is executed for each CM 20 included in the RAID device 1 while changing the test control CM 20a and the test target CM 20b. When the WOL test of the RAID device 1 is performed by the technique of the present embodiment, it becomes possible to easily identify the failure location.

図7,図8は,本実施の形態の試験制御CMおよび試験対象CMによるWOL試験処理のシーケンス図である。   7 and 8 are sequence diagrams of the WOL test processing by the test control CM and the test target CM according to the present embodiment.

試験制御CM20aの試験処理部100において,試験実行部110は,試験対象CM20bに対して,試験対象LANポートの指定を含むWOL試験開始指示データを転送する(ステップS20)。ここでは,試験制御CM20aのDMAコントローラ22が,あらかじめ決められた形式のWOL試験開始指示データを,試験対象CM20bのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,試験実行部110は,試験対象CM20bに対して,割り込み通知を行う。割り込み通知によって,試験対象CM20bの試験処理部200に,自試験対象CM20bのメモリ23にデータ転送された旨が伝えられる。なお,DMAコントローラ22の仕様によっては,試験実行部110によって割り込み通知の制御を行わなくても,データ転送後に自動で割り込み通知が行われる場合もある。   In the test processing unit 100 of the test control CM 20a, the test execution unit 110 transfers WOL test start instruction data including designation of the test target LAN port to the test target CM 20b (step S20). Here, the DMA controller 22 of the test control CM 20a transfers WOL test start instruction data in a predetermined format to a predetermined area on the memory 23 of the test target CM 20b. After the data transfer, the test execution unit 110 issues an interrupt notification to the test target CM 20b. The interrupt notification notifies the test processing unit 200 of the test target CM 20b that the data has been transferred to the memory 23 of the self test target CM 20b. Depending on the specifications of the DMA controller 22, even if the test execution unit 110 does not control interrupt notification, the interrupt notification may be automatically performed after data transfer.

試験対象CM20bの試験処理部200において,試験準備部210は,WOL試験開始指示データを受けると,そのデータで指定された試験対象LANポートのLANコントローラ29のMACアドレスのデータを,試験制御CM20aに転送する(ステップS21)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式のMACアドレスデータを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,試験準備部210は,試験制御CM20aに対して,割り込み通知を行う。   In the test processing unit 200 of the test target CM 20b, when the test preparation unit 210 receives the WOL test start instruction data, the MAC address data of the LAN controller 29 of the test target LAN port designated by the data is sent to the test control CM 20a. Transfer (step S21). Here, the DMA controller 22 of the test target CM 20b transfers the MAC address data in a predetermined format to a predetermined area on the memory 23 of the test control CM 20a. After the data transfer, the test preparation unit 210 issues an interrupt notification to the test control CM 20a.

試験制御CM20aの試験実行部110は,試験管理テーブル145における試験対象CM20bの試験対象LANポートのレコードに,MACアドレスを記録する(ステップS22)。試験実行部110は,試験対象CM20bに対して,電源OFF指示データを転送する(ステップS23)。ここでは,試験制御CM20aのDMAコントローラ22が,あらかじめ決められた形式の電源OFF指示データを,試験対象CM20bのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,試験実行部110は,試験対象CM20bに対して,割り込み通知を行う。   The test execution unit 110 of the test control CM 20a records the MAC address in the test target LAN port record of the test target CM 20b in the test management table 145 (step S22). The test execution unit 110 transfers the power OFF instruction data to the test target CM 20b (step S23). Here, the DMA controller 22 of the test control CM 20a transfers power OFF instruction data in a predetermined format to a predetermined area on the memory 23 of the test target CM 20b. After the data transfer, the test execution unit 110 issues an interrupt notification to the test target CM 20b.

試験対象CM20bの試験準備部210は,電源OFF指示データを受けると,試験対象LANポートのWOLを有効にする設定を行う(ステップS24)。試験準備部210は,自試験対象CM20bの電源OFFの処理を開始する(ステップS25)。試験準備部210は,転送するごとに値を+1するカウンタデータを,試験制御CM20aに対して繰り返し転送する(ステップS26)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式のカウンタデータを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。電源OFFの処理は,処理完了までにタイムラグがある。試験対象CM20bは,カウンタデータを試験制御CM20aに送ることで,自試験対象CM20bの電源がON状態であるのかOFF状態となったのかを,試験制御CM20aに通知する。試験対象CM20bの電源がOFF状態となることで,カウンタデータの転送が終了する。   When the test preparation unit 210 of the test target CM 20b receives the power OFF instruction data, the test preparation unit 210 performs setting for enabling the WOL of the test target LAN port (step S24). The test preparation unit 210 starts the process of turning off the power of the subject test subject CM 20b (step S25). The test preparation unit 210 repeatedly transfers counter data, which is incremented by 1 each time it is transferred, to the test control CM 20a (step S26). Here, the DMA controller 22 of the test target CM 20b transfers the counter data in a predetermined format to a predetermined area on the memory 23 of the test control CM 20a. The power-off process has a time lag until the process is completed. The test target CM 20b sends counter data to the test control CM 20a to notify the test control CM 20a whether the power source of the self test target CM 20b is in an ON state or an OFF state. When the test target CM 20b is powered off, the counter data transfer is completed.

試験制御CM20aの試験実行部110は,自試験制御CM20aのメモリ23のカウンタデータが記録される領域を監視し,カウンタデータの値の変化がなくなるまで待機する(ステップS27)。試験実行部110は,カウンタデータの値が変化しなくなったときに,試験対象CM20bの電源がOFF状態になったと判断する。なお,試験実行部110が,タイマを用いて,試験対象CM20bが電源OFF状態になるのに十分と考えられる時間を待機するようにしてもよい。   The test execution unit 110 of the test control CM 20a monitors the area where the counter data of the memory 23 of the self test control CM 20a is recorded, and waits until there is no change in the value of the counter data (step S27). The test execution unit 110 determines that the power of the test target CM 20b is turned off when the value of the counter data no longer changes. Note that the test execution unit 110 may use a timer to wait for a time that is considered sufficient for the test target CM 20b to be in the power-off state.

試験対象CM20bの電源がOFF状態になったと判断すると,試験実行部110は,マジックパケットを生成する(ステップS28)。試験実行部110のパケット送信部111は,試験対象CM20bの試験対象LANポートに対して,マジックパケットを送信する(ステップS29)。ここでは,試験対象CM20bの電源がOFF状態であるので,MACアドレスを用いてマジックパケットの送信が行われる。その後,試験実行部110は,自試験制御CM20aのメモリ23の電源投入通知データが記録される領域を監視し,試験対象CM20bからの電源投入通知データの転送を待機する(ステップS30)。   When determining that the power of the test target CM 20b has been turned off, the test execution unit 110 generates a magic packet (step S28). The packet transmission unit 111 of the test execution unit 110 transmits a magic packet to the test target LAN port of the test target CM 20b (step S29). Here, since the power supply of the test target CM 20b is in the OFF state, the magic packet is transmitted using the MAC address. Thereafter, the test execution unit 110 monitors the area where the power-on notification data is recorded in the memory 23 of the self-test control CM 20a, and waits for the transfer of the power-on notification data from the test target CM 20b (step S30).

試験対象CM20bでは,マジックパケットによる電源の投入に成功した場合,診断システムモニタのブートや,試験プログラムの起動が行われる。試験プログラムの起動後,試験対象CM20bの試験処理部200において,立ち上げ通知部220は,試験制御CM20aに対して,自試験対象CM20bの電源が投入された旨を通知する電源投入通知データを転送する(ステップS31)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式の電源投入通知データを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。   In the test target CM 20b, when the power is successfully turned on by the magic packet, the diagnostic system monitor is booted and the test program is booted. After the test program is started, in the test processing unit 200 of the test target CM 20b, the start-up notification unit 220 transfers power-on notification data that notifies the test control CM 20a that the power of the self-test target CM 20b is turned on. (Step S31). Here, the DMA controller 22 of the test target CM 20b transfers power-on notification data in a predetermined format to a predetermined area on the memory 23 of the test control CM 20a.

試験制御CM20aの試験実行部110は,試験対象CM20bからの電源投入通知データの転送が確認できた場合,試験結果がOKであると判定する(ステップS32)。   The test execution unit 110 of the test control CM 20a determines that the test result is OK when the transfer of the power-on notification data from the test target CM 20b can be confirmed (step S32).

なお,マジックパケットによる試験対象CM20bの電源投入に失敗した場合,試験対象CM20bから試験制御CM20aに対して,電源投入通知データの転送が行われない。試験制御CM20aの試験実行部110は,一定時間以上待機しても試験対象CM20bからの電源投入通知データの転送が確認できない場合,試験結果がNGであると判定する。   Note that, when power-on of the test target CM 20b by the magic packet fails, the power-on notification data is not transferred from the test target CM 20b to the test control CM 20a. The test execution unit 110 of the test control CM 20a determines that the test result is NG if the transfer of the power-on notification data from the test target CM 20b cannot be confirmed even after waiting for a certain time.

図9,図10は,本実施の形態の試験制御CMおよび試験対象CMによる故障箇所特定処理のシーケンス図である。   FIG. 9 and FIG. 10 are sequence diagrams of failure location specifying processing by the test control CM and the test target CM of this embodiment.

試験制御CM20aの試験処理部100において,電源投入制御部120は,各CM20のシステム監視回路31を介した電源制御回路32の制御で全CM20の電源をONにすることにより,試験対象CM20bの電源を強制的に投入する(ステップS40)。その後,情報取得部130は,自試験制御CM20aのメモリ23の電源投入通知データが記録される領域を監視し,試験対象CM20bからの電源投入通知データの転送を待機する(ステップS41)。   In the test processing unit 100 of the test control CM 20a, the power-on control unit 120 turns on the power of all the CMs 20 by controlling the power control circuit 32 via the system monitoring circuit 31 of each CM 20, thereby powering the test target CM 20b. Is forcibly entered (step S40). Thereafter, the information acquisition unit 130 monitors the area where the power-on notification data of the memory 23 of the self-test control CM 20a is recorded, and waits for the transfer of the power-on notification data from the test target CM 20b (step S41).

試験対象CM20bでは,電源の投入後,診断システムモニタのブートや,試験プログラムの起動が行われる。試験プログラムの起動後,試験対象CM20bの試験処理部200において,立ち上げ通知部220は,試験制御CM20aに対して,自試験対象CM20bの電源が投入された旨を通知する電源投入通知データを転送する(ステップS42)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式の電源投入通知データを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。   In the test target CM 20b, after the power is turned on, the diagnostic system monitor is booted and the test program is started. After the test program is started, in the test processing unit 200 of the test target CM 20b, the start-up notification unit 220 transfers power-on notification data that notifies the test control CM 20a that the power of the self-test target CM 20b is turned on. (Step S42). Here, the DMA controller 22 of the test target CM 20b transfers power-on notification data in a predetermined format to a predetermined area on the memory 23 of the test control CM 20a.

試験制御CM20aの情報取得部130において,試験対象CM20bからの電源投入通知データの転送が確認されると,メッセージ送信部131は,試験対象CM20bに対して,試験対象LANポートの指定を含む故障箇所特定処理開始指示データを転送する(ステップS43)。故障箇所特定処理開始指示データは,故障箇所などの状態情報の取得要求メッセージである。ここでは,試験制御CM20aのDMAコントローラ22が,あらかじめ決められた形式の故障箇所特定処理開始指示データを,試験対象CM20bのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,情報取得部130は,試験対象CM20bに対して,割り込み通知を行う。   When the information acquisition unit 130 of the test control CM 20a confirms the transfer of the power-on notification data from the test target CM 20b, the message transmission unit 131 instructs the test target CM 20b to specify the test target LAN port. The specific process start instruction data is transferred (step S43). The failure location specifying process start instruction data is a status information acquisition request message such as a failure location. Here, the DMA controller 22 of the test control CM 20a transfers failure location specifying process start instruction data in a predetermined format to a predetermined area on the memory 23 of the test target CM 20b. After the data transfer, the information acquisition unit 130 issues an interrupt notification to the test target CM 20b.

試験対象CM20bの故障箇所特定処理部230は,試験対象LANポートのWOLを有効にする設定を行う(ステップS44)。故障箇所特定処理部230は,試験対象LANポートのIP(Internet Protocol )アドレスのデータを,試験制御CM20aに転送する(ステップS45)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式のIPアドレスデータを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,故障箇所特定処理部230は,試験制御CM20aに対して,割り込み通知を行う。   The failure location identification processing unit 230 of the test target CM 20b performs setting for enabling the WOL of the test target LAN port (step S44). The failure location identification processing unit 230 transfers the IP (Internet Protocol) address data of the test target LAN port to the test control CM 20a (step S45). Here, the DMA controller 22 of the test target CM 20b transfers the IP address data in a predetermined format to a predetermined area on the memory 23 of the test control CM 20a. After the data transfer, the failure location identification processing unit 230 issues an interrupt notification to the test control CM 20a.

試験制御CM20aの情報取得部130は,IPアドレスデータの転送を受けると,得られたIPアドレスを指定して,試験対象CM20bの試験対象LANポートに対して,マジックパケットを送信する(ステップS46)。ここでは,試験対象CM20bの電源がON状態であるので,IPアドレスを用いてマジックパケットの送信が行われる。   Upon receiving the IP address data transfer, the information acquisition unit 130 of the test control CM 20a designates the obtained IP address and transmits a magic packet to the test target LAN port of the test target CM 20b (step S46). . Here, since the power of the test target CM 20b is in the ON state, the magic packet is transmitted using the IP address.

試験対象CM20bの故障箇所特定処理部230は,マジックパケットを受けると,試験対象LANポートのLANコントローラ29のレジスタで,マジックパケットの受信状態をチェックする(ステップS47)。また,故障箇所特定処理部230は,試験対象LANポートのLANコントローラ29のレジスタで,PMEステータスをチェックする(ステップS48)。また,故障箇所特定処理部230は,試験対象CM20bのシステム監視回路31のレジスタで,WAKE信号状態をチェックする(ステップS49)。   When receiving the magic packet, the failure location specifying unit 230 of the test target CM 20b checks the reception state of the magic packet with the register of the LAN controller 29 of the test target LAN port (step S47). Further, the failure location identification processing unit 230 checks the PME status with the register of the LAN controller 29 of the test target LAN port (step S48). In addition, the failure location identification processing unit 230 checks the WAKE signal status in the register of the system monitoring circuit 31 of the test target CM 20b (step S49).

故障箇所特定処理部230は,ステップS47〜S49のチェック結果から,故障箇所を特定する(ステップS50)。故障箇所特定処理部230は,試験制御CM20aに対して,故障箇所の情報を含む故障箇所データを転送する(ステップS51)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式の故障箇所データを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,故障箇所特定処理部230は,試験制御CM20aに対して,割り込み通知を行う。   The failure location identification processing unit 230 identifies the failure location from the check results of steps S47 to S49 (step S50). The failure location identification processing unit 230 transfers failure location data including failure location information to the test control CM 20a (step S51). Here, the DMA controller 22 of the test target CM 20b transfers failure location data in a predetermined format to a predetermined area on the memory 23 of the test control CM 20a. After the data transfer, the failure location identification processing unit 230 issues an interrupt notification to the test control CM 20a.

試験制御CM20aの情報取得部130は,試験対象CM20bからの故障箇所データの転送により,故障箇所の情報を得ることができる。なお,情報取得部130が,試験対象CM20bからステップS47〜S49のチェック結果のデータを取得して,故障箇所の特定を行うようにしてもよい。   The information acquisition unit 130 of the test control CM 20a can obtain information on the failure location by transferring the failure location data from the test target CM 20b. Note that the information acquisition unit 130 may acquire the check result data of Steps S47 to S49 from the test target CM 20b and specify the failure location.

以上,本実施の形態について説明したが,本発明はその主旨の範囲において種々の変形が可能であることは当然である。   Although the present embodiment has been described above, the present invention can naturally be modified in various ways within the scope of the gist thereof.

例えば,本実施の形態では,試験対象の処理装置としてストレージ装置を用いた例を説明したが,試験対象の処理装置が,必ずしもストレージ装置である必要はない。例えば,試験対象の処理装置が,内部のコントローラ間で通信し合うようなサーバ等の情報処理装置であってもよい。例えば,装置内に複数の制御部を有し,それらの制御部が相互に通信可能であって,共通の電源制御が可能な仕組みになっており,電源投入パケットを用いた電源投入の機能を持つ処理装置であれば,本実施の形態による試験の技術を適用可能である。   For example, in this embodiment, an example in which a storage device is used as a processing device to be tested has been described. However, the processing device to be tested does not necessarily have to be a storage device. For example, the processing apparatus to be tested may be an information processing apparatus such as a server that communicates between internal controllers. For example, the system has a plurality of control units, and these control units can communicate with each other and have a mechanism for common power control. The power-on function using a power-on packet is provided. The testing technique according to the present embodiment can be applied to any processing apparatus having such a processing apparatus.

1 RAID装置
2 PC
3 LAN
4 端末
5 HUB
10 CE
20 CM
20a 試験制御CM
20b 試験対象CM
21 CPU
22 DMAコントローラ
23 メモリ
24 システムボリューム
25 PCH
26 PCIバスブリッジ
27 CA
28 SASコントローラ
29 LANコントローラ
30 WAKE信号線
31 システム監視回路
32 電源制御回路
40 DE
41 ディスク
100 試験処理部
110 試験実行部
111 パケット送信部
120 電源投入制御部
130 情報取得部
131 メッセージ送信部
140 試験管理情報記憶部
150 出力部
200 試験処理部
210 試験準備部
220 立ち上げ通知部
230 故障箇所特定処理部
1 RAID device 2 PC
3 LAN
4 terminal 5 HUB
10 CE
20 CM
20a Test control CM
20b Test CM
21 CPU
22 DMA controller 23 Memory 24 System volume 25 PCH
26 PCI bus bridge 27 CA
28 SAS controller 29 LAN controller 30 WAKE signal line 31 System monitoring circuit 32 Power supply control circuit 40 DE
41 disk 100 test processing unit 110 test execution unit 111 packet transmission unit 120 power-on control unit 130 information acquisition unit 131 message transmission unit 140 test management information storage unit 150 output unit 200 test processing unit 210 test preparation unit 220 startup notification unit 230 Fault location processing unit

Claims (3)

試験対象装置が備える第1の制御部が,
前記試験対象装置が備える第2の制御部に対して,第1のパスを介して電源投入パケットを送信し,
前記電源投入パケットの送信によって前記第2の制御部の電源が投入されなかった場合に,互いに通信可能な前記第1の制御部が備える監視回路と前記第2の制御部が備える監視回路とを介して前記第2の制御部の電源制御回路を制御して電源を投入し,
前記第2の制御部の電源投入の後に,第2のパスを介して前記第2の制御部に対して状態情報の取得要求メッセージを送信する処理を実行する
ことを特徴とする試験方法。
The first control unit provided in the device under test is
A power-on packet is transmitted to the second control unit included in the test target device via the first path,
A monitoring circuit provided in the first control unit and a monitoring circuit provided in the second control unit that can communicate with each other when the power of the second control unit is not turned on by transmission of the power-on packet; The power control circuit of the second control unit is controlled via the power supply ,
A test method comprising: executing a process of transmitting a status information acquisition request message to the second control unit via a second path after the second control unit is powered on.
前記第2のパスは,前記第1の制御部と前記第2の制御部との間での前記第1の制御部が備えるメモリから前記第2の制御部が備えるメモリへのデータ転送を用いた通信のパスである
ことを特徴とする請求項1に記載の試験方法。
The second pass, use the data transfer to the first controller and the second of said first from said memory of the control unit the second control unit comprises a memory between the control unit The test method according to claim 1, wherein the test path is a communication path.
複数のパスにより接続された第1の制御部と第2の制御部とを備えた処理装置において,
前記第1の制御部が,
前記第2の制御部に対して,第1のパスを介して電源投入パケットを送信するパケット送信部と,
前記電源投入パケットの送信によって前記第2の制御部の電源が投入されなかった場合に,互いに通信可能な前記第1の制御部が備える監視回路と前記第2の制御部が備える監視回路とを介して前記第2の制御部の電源制御回路を制御して電源を投入する電源投入制御部と,
前記第2の制御部の電源投入の後に,第2のパスを介して前記第2の制御部に対して状態情報の取得要求メッセージを送信するメッセージ送信部とを備える
ことを特徴とする処理装置。
In a processing apparatus including a first controller and a second controller connected by a plurality of paths,
The first controller is
A packet transmission unit that transmits a power-on packet to the second control unit via a first path;
A monitoring circuit provided in the first control unit and a monitoring circuit provided in the second control unit that can communicate with each other when the power of the second control unit is not turned on by transmission of the power-on packet; A power-on control unit for controlling the power control circuit of the second control unit via the power source ,
And a message transmission unit that transmits a status information acquisition request message to the second control unit via a second path after the second control unit is powered on. .
JP2012216407A 2012-09-28 2012-09-28 Test method and processing equipment Active JP6089543B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012216407A JP6089543B2 (en) 2012-09-28 2012-09-28 Test method and processing equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012216407A JP6089543B2 (en) 2012-09-28 2012-09-28 Test method and processing equipment

Publications (2)

Publication Number Publication Date
JP2014071601A JP2014071601A (en) 2014-04-21
JP6089543B2 true JP6089543B2 (en) 2017-03-08

Family

ID=50746757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012216407A Active JP6089543B2 (en) 2012-09-28 2012-09-28 Test method and processing equipment

Country Status (1)

Country Link
JP (1) JP6089543B2 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07226763A (en) * 1994-02-15 1995-08-22 Hitachi Ltd Automatic restoration method in ring form lan
JP2001184145A (en) * 1999-12-27 2001-07-06 Id Gate Co Ltd Remote power supply management system for information processor or the like

Also Published As

Publication number Publication date
JP2014071601A (en) 2014-04-21

Similar Documents

Publication Publication Date Title
TWI578233B (en) Unified firmware managment system, non-transitory computer-readable storage medium and method for unified firmware managment
TWI551997B (en) Computer-readable medium and multiple-protocol-system-management method and system
US10055296B2 (en) System and method for selective BIOS restoration
JP4558519B2 (en) Information processing apparatus and system bus control method
US9182998B2 (en) Remote bios update in system having multiple computers
US9680712B2 (en) Hardware management and control of computer components through physical layout diagrams
US20150106660A1 (en) Controller access to host memory
US9367510B2 (en) Backplane controller for handling two SES sidebands using one SMBUS controller and handler controls blinking of LEDs of drives installed on backplane
TW201633133A (en) Method and system of automatic debug information collection
US8909910B2 (en) Computer system for selectively accessing bios by a baseboard management controller
US11061837B2 (en) UBM implementation inside BMC
TW201502772A (en) Virtual baseboard management controller
US20140122753A1 (en) Electronic Device, Management Method Thereof, and Rack Serving System
US10789141B2 (en) Information processing device and information processing method
CN102880527B (en) Data recovery method of baseboard management controller
TWI512490B (en) System for retrieving console messages and method thereof and non-transitory computer-readable medium
US20100042710A1 (en) Remote management of computer system
US9009543B2 (en) Computer systems that acquire a plurality of statuses of non-normally operating hard disk drives
CN114600088A (en) Server state monitoring system and method using baseboard management controller
TW201201014A (en) Adapter and debug method using the same
JP2015114873A (en) Information processor and monitoring method
JP2007025933A (en) Storage system and its firmware automatic updating method
CN111949320A (en) Method, system and server for providing system data
CN110769051B (en) Embedded server remote management system and method based on domestic processor
US9749189B2 (en) Generating graphical diagram of physical layout of computer platforms

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160510

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170123

R150 Certificate of patent or registration of utility model

Ref document number: 6089543

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150