JP6089543B2 - Test method and processing equipment - Google Patents
Test method and processing equipment Download PDFInfo
- Publication number
- JP6089543B2 JP6089543B2 JP2012216407A JP2012216407A JP6089543B2 JP 6089543 B2 JP6089543 B2 JP 6089543B2 JP 2012216407 A JP2012216407 A JP 2012216407A JP 2012216407 A JP2012216407 A JP 2012216407A JP 6089543 B2 JP6089543 B2 JP 6089543B2
- Authority
- JP
- Japan
- Prior art keywords
- test
- power
- control unit
- control
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Description
本発明は,電源投入パケットを用いた処理装置の電源投入試験を行う試験方法および処理装置に関するものである。 The present invention relates to a test method and a processing apparatus for performing a power-on test of a processing apparatus using a power-on packet.
コンピュータなどの情報機器の電源を外部から制御する技術がある。例えば,コンピュータなどの情報機器の電源を外部から操作する技術として,Wake−On−LAN(Local Area Network)の技術がある。Wake−On−LANは,LAN等のネットワークに接続されているコンピュータに対して,マジックパケットと呼ばれる電源投入パケットを送ることで,該コンピュータの電源投入を遠隔で操作する技術である。 There is a technology for externally controlling the power supply of information devices such as computers. For example, there is a Wake-On-LAN (Local Area Network) technique as a technique for operating a power source of an information device such as a computer from the outside. Wake-On-LAN is a technique for remotely operating a computer connected to a network such as a LAN by sending a power-on packet called a magic packet.
例えば,Wake−On−LAN機能を備えるストレージ装置があるものとする。このストレージ装置を試験対象として電源投入パケットを用いた電源投入の試験を行う場合,試験対象のストレージ装置にPC(Personal Computer )やサーバをLAN接続する。電源OFF状態のストレージ装置に対して,LAN接続されたPCやサーバなどから電源投入パケットを投入し,ストレージ装置の電源OFF状態が電源ON状態に切り替わることを確認する試験が行われる。 For example, it is assumed that there is a storage apparatus having a Wake-On-LAN function. When performing a power-on test using a power-on packet with this storage device as a test target, a personal computer (PC) or server is connected to the test-target storage device via a LAN. A test is performed to check that the power-off state of the storage device is switched to the power-on state by inputting a power-on packet from a PC or server connected to the LAN to the power-off storage device.
なお,リモート電源装置を制御することにより,該リモート電源装置に電源接続された情報処理装置の電源切断,投入を行う技術が知られている。また,ネットワーク経由での電源切断指示で未通知となった端末について,他端末から別インタフェースを経由して該未通知の端末のネットワーク通信制御部を初期化し,該未通知の端末に対して再度ネットワーク経由での電源切断指示を行う技術が知られている。また,複数のストレージ装置や情報処理装置が接続されているストレージシステムにおいて,ストレージ装置と情報処理装置との電源を連動して制御する技術が知られている。 A technique is known in which a remote power supply is controlled to turn off and turn on an information processing apparatus connected to the remote power supply. In addition, for a terminal that has not been notified by a power-off instruction via a network, the network communication control unit of the unreported terminal is initialized from another terminal via another interface, and the unreported terminal is re-established. A technique for instructing power-off via a network is known. In addition, in a storage system in which a plurality of storage apparatuses and information processing apparatuses are connected, a technique for controlling the power supply of the storage apparatus and the information processing apparatus in conjunction with each other is known.
例えば,上述の試験対象のストレージ装置に対する電源投入パケットを用いた電源投入の試験において,ストレージ装置の電源投入ができなかった場合,LAN接続されたPCやサーバなどはストレージ装置にアクセスできないままなので,容易に故障箇所を特定することはできない。このような電源投入パケットを用いた処理装置の電源投入の試験において,故障箇所を容易に特定したいという要望がある。 For example, in the power-on test using the power-on packet for the above-described test target storage device, if the storage device cannot be turned on, the LAN-connected PC or server remains inaccessible to the storage device. The failure location cannot be easily identified. In such a power-on test of a processing apparatus using a power-on packet, there is a demand for easily identifying a failure location.
一側面では,本発明は,電源投入パケットを用いた処理装置の電源投入の試験において,容易に故障箇所の特定が可能となる技術を提供することを目的とする。 In one aspect, an object of the present invention is to provide a technique capable of easily identifying a failure location in a power-on test of a processing apparatus using a power-on packet.
1態様では,試験方法において,処理装置が備える第1の制御部は,処理装置が備える第2の制御部に対して第1のパスを介して電源投入パケットを送信し,電源投入パケットの送信によって第2の制御部の電源が投入されなかった場合に,互いに通信可能な第1の制御部が備える監視回路と第2の制御部が備える監視回路とを介して第2の制御部の電源制御回路を制御して電源を投入し,第2の制御部の電源投入の後に,第2のパスを介して第2の制御部に対して状態情報の取得要求メッセージを送信する処理を実行する。
In one aspect, in the test method, the first control unit included in the processing device transmits a power-on packet to the second control unit included in the processing device via the first path, and transmits the power-on packet. second when the power supply of the control unit has not been turned in, the power of the second control unit via the monitoring circuit and the second monitor circuit control unit is provided that includes a first control unit capable of communicating with each other by The control circuit is controlled to turn on the power, and after the second control unit is turned on, a process of transmitting a status information acquisition request message to the second control unit via the second path is executed. .
1態様では,電源投入パケットを用いた処理装置の電源投入の試験において,容易に故障箇所の特定が可能となる。 In one aspect, the failure location can be easily identified in the power-on test of the processing apparatus using the power-on packet.
以下,本実施の形態について,図を用いて説明する。なお,本実施の形態の例では,ストレージ装置を試験対象の処理装置とした場合の例を説明する。 Hereinafter, the present embodiment will be described with reference to the drawings. In the example of the present embodiment, an example in which the storage apparatus is a processing apparatus to be tested will be described.
図1は,本実施の形態によるWOLを説明する図である。 FIG. 1 is a diagram for explaining WOL according to the present embodiment.
RAID(Redundant Arrays of Inexpensive Disks )装置1は,複数のディスクを備えるストレージ装置である。図1に示すRAID装置1は,Wake−On−LAN機能を備えており,LAN3で接続されたPC2からの電源投入パケットを受けて,電源投入を行う。以下では,Wake−On−LANを,WOLとも呼ぶ。また,電源投入パケットを,マジックパケットとも呼ぶ。
A RAID (Redundant Array of Inexpensive Disks)
図2は,本実施の形態によるRAID装置の構成例を示す図である。 FIG. 2 is a diagram illustrating a configuration example of a RAID device according to the present embodiment.
RAID装置1は,CE(Controller Enclosure)10,DE(Drive Enclosure )40を備える。CE10は,サブシステム内のすべての動作を管理するモジュールであるCM(Controller Module )20を内部に搭載する筐体である。CE10には,複数のCM20が搭載可能である。図2に示す例では,CE10に2つのCM20が搭載されている。DE40は,複数のディスク41を内部に搭載する筐体である。
The
RAID装置1の制御部となるCM20は,CPU(Central Processing Unit )21,主記憶となるメモリ23,システムボリューム24,PCH(Platform Controller Hub )25,PCI(Peripheral Component Interconnect )バスブリッジ26,CA(Channel Adapter )27,SAS(Serial Attached SCSI)コントローラ28,LANコントローラ29,WAKE信号線30,システム監視回路31,電源制御回路32を備える。また,CPU21は,DMA(Direct Memory Access)コントローラ22を備える。なお,図2では記載が省略されているが,図2に示すRAID装置1が備える複数のCM20は,すべて同じ構成となっているものとする。
The
DMAコントローラ22は,DMAによるデータ転送を行う。DMAコントローラ22は,CM20間で相互接続され,CM20間のデータ通信に使用される。本実施の形態では,DMAコントローラ22によって,他のCM20にデータ転送を行うことにより,CM20間のデータ転送を実現する。
The
システムボリューム24は,例えば,HDD(Hard Disk Drive )やSSD(Solid State Drive ),USB(Universal Serial Bus)メモリなどの記憶装置である。本実施の形態では,システムボリューム24は,診断システムモニタのブート先や,CM20が実行する試験プログラムの記憶部としても使用される。
The
PCH25は,ノースブリッジとサウスブリッジの機能を統合したチップである。PCH25は,PCI(Peripheral Component Interconnect )Express,シリアルATA(Advanced Technology Attachment),USB,LAN,グラフィックス出力機能などを備える。 The PCH 25 is a chip that integrates the functions of the North Bridge and the South Bridge. The PCH 25 includes PCI (Peripheral Component Interconnect) Express, serial ATA (Advanced Technology Attachment), USB, LAN, graphics output function, and the like.
PCIバスブリッジ26は,CPU21と周辺機器との間の通信を行うためのバスである。CA27は,ホストインタフェースを持つアダプタであり,ホスト(図示省略)と接続し,ホストとRAID装置1との間でのデータ通信に使用される。SASコントローラ28は,DE40と接続して,ディスク41に対するデータのライト/リードに使用されるチップである。
The
LANコントローラ29は,LANによる通信の制御を行うチップである。LANコントローラには,それぞれ固有のMAC(Media Access Control)アドレスが設定されている。
The
システム監視回路31は,システムの電源制御やエラー監視等を行う回路である。システム監視回路31は,自CM20内の電源制御回路32を操作して各部位への電源供給を行う。システム監視回路31は,例えばFPGA(Field-Programmable Gate Array )などによって実現される。電源制御回路32は,システム監視回路からの操作により自CM20の電源の投入や切断の制御を実行する回路である。
The system monitoring circuit 31 is a circuit that performs system power control, error monitoring, and the like. The system monitoring circuit 31 operates the
端末4は,PCH25とシリアルインタフェースによって接続されるコンピュータ端末である。端末4は,ユーザ操作による試験プログラムの起動や,ユーザに対する情報の提示などに使用される。 The terminal 4 is a computer terminal connected to the PCH 25 by a serial interface. The terminal 4 is used for starting a test program by a user operation and presenting information to the user.
本実施の形態のLANコントローラ29は,WOLに対応している。例えば,LANコントローラ29が,LANを介してマジックパケットを受信すると,LANコントローラ29のPMEステータスが“1”になる。その状態は,WAKE信号線30に反映され,WAKE信号がシステム監視回路31に通知される。その後,システム監視回路が電源制御回路を操作し,自CM20の電源をON状態にする。PMEステータスは,LANコントローラ29がWakeupイベント(マジックパケット)を受信したかどうかを示すステータスである。WAKE信号は,LANコントローラ29のPMEステータスの状態を示す信号である。PMEステータスが“1”(ON状態)になったときに,WAKE信号も“1”(ON状態)となる。システム監視回路31は,WAKE信号が“1”になると,電源制御回路32にアクセスし,電源を投入する。なお,CM20の電源がOFF状態であっても,LANコントローラ29や,システム監視回路31,電源制御回路32等には,電源が供給される。
The
RAID装置1のあるCM20がマジックパケットを受信した場合,該CM20のシステム監視回路31は,自CM20内の電源制御回路32を操作して各部位への電源供給を行うと同時に,他のCM20のシステム監視回路31に対して,WAKE信号があった旨を通知する。システム監視回路31は,他のCM20と通信を行うことが可能である。マジックパケットを受けたCM20のシステム監視回路31から,WAKE信号があった旨の通知を受けた各CM20のシステム監視回路31は,それぞれ自CM20内の電源制御回路32を操作して,自CM20に対する電源供給を行う。
When the
以下では,WOL機能を備えるRAID装置1について,本実施の形態によるWOL機能の試験を行う例を説明する。
Hereinafter, an example in which a test of the WOL function according to the present embodiment is performed on the
図3は,本実施の形態による試験制御CMと試験対象CMの機能構成例を示す図である。 FIG. 3 is a diagram illustrating a functional configuration example of the test control CM and the test target CM according to the present embodiment.
図3において,CM20aは,WOL試験の制御を行う第1の制御部となるCM20である。以下では,WOL試験を制御するCM20を,試験制御CM20aと呼ぶ。また,CM20bは,WOL試験の対象である第2の制御部となるCM20である。以下では,WOL試験の対象となるCM20を,試験対象CM20bと呼ぶ。なお,本実施の形態では,RAID装置1のWOL試験を行うにあたって,試験制御CM20aの各LANコントローラ29と試験対象CM20bの各LANコントローラ29とが,例えばHUB5を介してLANで接続されているものとする。
In FIG. 3, a
試験制御CM20aは,試験処理部100を備える。試験処理部100は,本実施の形態によるWOL試験において,試験制御CM20a側の処理を実行する機能部である。試験処理部100は,試験実行部110,電源投入制御部120,情報取得部130,試験管理情報記憶部140,出力部150を備える。
The
試験実行部110は,WOL試験を実行する制御を行う。より具体的には,試験実行部110は,試験対象CM20bに対してWOL試験開始の指示を出し,試験対象CM20bの電源をOFF状態にさせる。その後,試験実行部110のパケット送信部111は,試験対象CM20bに対して,第1のパスであるLANを介してマジックパケットを送信する。
The
電源投入制御部120は,マジックパケットの送信によって試験対象CM20bの電源が投入されなかった場合に,両CM20のシステム監視回路31を介して,試験対象CM20bの電源制御回路32を制御し,試験対象CM20bの電源を投入する。
The power-on
情報取得部130は,マジックパケットの送信によって試験対象CM20bの電源が投入されなかった場合に,試験対象CM20bから故障箇所の情報などの状態情報を取得する。このとき,情報取得部130のメッセージ送信部131は,試験対象CM20bの電源投入の後に,CM20間でのメモリ23へのデータ転送を用いた通信のパスである第2のパスを介して,試験対象CM20bに対して,状態情報の取得要求メッセージを送信する。CM20間でのメモリ23へのデータ転送は,DMAコントローラ22を用いて行われる。
The
試験管理情報記憶部140は,試験管理情報を記憶する記憶部である。試験管理情報は,WOL試験の結果が記録される情報である。例えば,試験管理情報記憶部140の試験管理情報には,情報取得部130により試験対象CM20bから取得された故障箇所などの情報が記録される。
The test management
出力部150は,試験管理情報記憶部140の試験管理情報に記録されたWOL試験の結果を,端末4に出力する。例えば,端末4のディスプレイに,WOL試験の結果が表示される。
The
試験対象CM20bは,試験処理部200を備える。試験処理部200は,本実施の形態によるWOL試験において,試験対象CM20b側の処理を実行する機能部である。試験処理部200は,試験準備部210,立ち上げ通知部220,故障箇所特定処理部230を備える。
The
試験準備部210は,試験制御CM20aからのWOL試験開始の指示を受け,自試験対象CM20bの電源をOFF状態にする。
In response to the instruction to start the WOL test from the
立ち上げ通知部220は,自試験対象CM20bが,電源OFF状態から電源ON状態となり,試験処理部200が起動された際に,自試験対象CM20bが立ち上がった旨を,試験制御CM20aに通知する。
The start-up
故障箇所特定処理部230は,試験制御CM20aからの状態情報の取得要求メッセージの受信後,LANコントローラ29のレジスタや,システム監視回路31のレジスタなどをチェックし,故障箇所を特定する。故障箇所特定処理部230は,特定した故障箇所の情報を試験制御CM20aに送信する。
After receiving the status information acquisition request message from the
図3に示す試験制御CM20a,試験対象CM20bが備える各機能部は,各CM20が備えるCPU21,メモリ23等のハードウェアと,ソフトウェアプログラムとによって実現することが可能である。CM20が実行可能なプログラムは,システムボリューム24に記憶され,その実行時にメモリ23に読み出され,CPU21により実行される。RAID装置1のWOL機能について試験を行う場合,各CM20のシステムボリューム24には,試験プログラムが記憶されている。
Each functional unit included in the
各CM20のシステムボリューム24に記憶された試験プログラムは,試験対象のRAID装置1の電源投入後,例えば,以下の手順で起動される。
(1)フラッシュROM(Read Only Memory)(図示省略)のBIOS(Basic Input/Output System )が起動する。
(2)BIOSがシステムボリューム24内の診断システムモニタをメモリ23上にローディングし,制御を渡す。診断システムモニタは,CM20上で試験プログラムを動作させるためのOS(Operating System)である。診断システムモニタの初期化処理を実行する。
(3)IO(Input/Output)ドライバの数だけ,システムボリューム24内のIOドライバモジュールがメモリ23にローディングされ,IOドライバの初期化処理が実行される。
(4)診断システムモニタの立ち上げ処理の完了後,端末4に操作画面が表示される。ユーザは,端末4から試験プログラムの起動操作を実施する。
(5)診断システムモニタは,試験プログラムおよびユーティリティコマンドをシステムボリューム24からメモリ23にローディングし,実行する。
The test program stored in the
(1) A BIOS (Basic Input / Output System) of a flash ROM (Read Only Memory) (not shown) is activated.
(2) The BIOS loads the diagnostic system monitor in the
(3) The IO driver modules in the
(4) After the startup process of the diagnostic system monitor is completed, an operation screen is displayed on the terminal 4. The user performs an operation for starting the test program from the terminal 4.
(5) The diagnostic system monitor loads the test program and utility commands from the
なお,端末4からの実行文をあらかじめファイルに記載しておくことで,自動運転も可能である。また,RAID装置1が備える複数のCM20のうち,どのCM20が試験制御CM20aとなり,どのCM20が試験対象CM20bとなるかは,例えば,端末4を操作するユーザからの指定によって決定されてもよいし,自動で決定されてもよい。
It should be noted that automatic operation is also possible by previously writing an executable statement from the terminal 4 in a file. Further, among the plurality of
このように,RAID装置1が備えるCM20で試験プログラムが実行されることにより,図3に示す試験制御CM20aの試験処理部100や,試験対象CM20bの試験処理部200が実現される。
As described above, the test program is executed by the
図4は,本実施の形態による故障箇所特定の例を説明する図である。 FIG. 4 is a diagram for explaining an example of identifying a failure location according to the present embodiment.
ここでは,故障箇所の特定でチェックする箇所と,そのチェック結果から特定される故障箇所の候補の一例を説明する。チェックする箇所や,チェック結果から特定される故障箇所などは,試験対象となるRAID装置1の仕様や設計に応じたものとなる。
Here, an example of a location to be checked by specifying a failure location and a failure location candidate specified from the check result will be described. The location to be checked and the failure location identified from the check result correspond to the specifications and design of the
例えば,試験対象CM20bの故障箇所特定処理部230は,LANコントローラ29のレジスタからのリードにより,マジックパケットの受信状態を示すステータスをチェックする。マジックパケットが受信状態でない場合には,試験対象CM20bのLANコントローラ29,試験制御CM20aのLANコントローラ29,LANケーブルなどが,故障箇所の候補として考えられる。
For example, the failure location
また,例えば,試験対象CM20bの故障箇所特定処理部230は,LANコントローラ29のレジスタからのリードにより,PMEステータスをチェックする。PMEステータスが“0”である場合,試験対象CM20bのLANコントローラ29などが,故障箇所の候補として考えられる。
In addition, for example, the failure location
また,例えば,試験対象CM20bの故障箇所特定処理部230は,システム監視回路31のレジスタをチェックすることにより,WAKE信号状態を判断する。WAKE信号状態が“0”である場合,WAKE信号線30などが,故障箇所の候補として考えられる。
Further, for example, the failure location specifying processing
マジックパケットの受信状態,PMEステータス,WAKE信号状態のチェックで異常がない場合,システム監視回路31,電源制御回路32などが,故障箇所の候補として考えられる。
If there is no abnormality in checking the reception state of the magic packet, the PME status, and the WAKE signal state, the system monitoring circuit 31, the power
図5は,本実施の形態による試験管理テーブルの例を示す図である。 FIG. 5 is a diagram showing an example of a test management table according to the present embodiment.
図5に示す試験管理テーブル145は,試験制御CM20aの試験管理情報記憶部140に記憶される試験管理情報の一例を示す。図5に示す試験管理テーブル145は,CM番号,LANポート番号,MACアドレス,試験結果,故障箇所の情報を持つ。
The test management table 145 shown in FIG. 5 shows an example of test management information stored in the test management
CM番号は,試験対象のRAID装置1が備えるCM20のスロットIDを示す。LANポート番号は,該当CM20が備えるLANポートの番号を示す。試験管理テーブル145のレコードは,CM番号で示されるCM20における,LANポート番号で示されるLANポートごとのレコードとなる。MACアドレスは,該当LANポートのLANコントローラ29のMACアドレスを示す。
The CM number indicates the slot ID of the
試験結果は,該当LANポートに対するWOL試験の試験結果を示す。試験結果において,“0”はWOL試験が未実施であることを示す。試験結果において,“1”は試験結果がOKである場合,すなわち試験対象CM20bの該当LANポートを対象としたWOL試験で試験対象CM20bの電源が投入された場合を示す。試験結果において,“2”は試験結果がNGである場合,すなわち試験対象CM20bの該当LANポートを対象としたWOL試験で試験対象CM20bの電源が投入されなかった場合を示す。
The test result indicates the test result of the WOL test for the corresponding LAN port. In the test results, “0” indicates that the WOL test has not been performed. In the test result, “1” indicates that the test result is OK, that is, the power of the
故障箇所は,試験結果がNGであった場合に,特定された故障箇所を示す。故障箇所における4つの数値は,左から試験対象CM20bのLANコントローラ29,WAKE信号線30,システム監視回路31or電源制御回路32,試験制御CM20aのLANコントローラ29orLANケーブルの故障を表している。故障箇所において,“0”は該当箇所が故障箇所の候補でないことを示し,“1”は該当箇所が故障箇所の候補であることを示す。
The failure location indicates the identified failure location when the test result is NG. The four numerical values at the failure location represent from the left the failure of the
例えば,図4に示すチェック結果において,パケット受信状態でない場合.試験管理テーブル145の故障箇所は,“1001”となる。また,PMEステータスが“0”である場合,試験管理テーブル145の故障箇所は,“1000”となる。また,WAKE信号状態が“0”である場合,試験管理テーブル145の故障箇所は,“0100”となる。また,それら以外である場合,試験管理テーブル145の故障箇所は,“0010”となる。 For example, in the check result shown in FIG. The failure location in the test management table 145 is “1001”. When the PME status is “0”, the failure location in the test management table 145 is “1000”. When the WAKE signal state is “0”, the failure location in the test management table 145 is “0100”. Otherwise, the failure location in the test management table 145 is “0010”.
以下,図6〜図10を用いて,本実施の形態の試験制御CM20aと試験対象CM20bとによる,一連のWOL試験の処理の流れを説明する。
Hereinafter, a flow of processing of a series of WOL tests by the
図6は,本実施の形態の試験制御CMによる試験処理フローチャートである。 FIG. 6 is a test process flowchart according to the test control CM of the present embodiment.
試験制御CM20aにおいて,試験処理部100は,試験対象CM20bのLANポートから,試験対象のLANポートを順に1つ選択する(ステップS10)。試験処理部100は,試験対象のLANポートについて,WOL試験処理を実行する(ステップS11)。WOL試験処理は,電源をOFF状態の試験対象CM20bにおける試験対象LANポートに対して,試験制御CM20aからマジックパケットを送信することにより,試験対象CM20bの電源を投入させる試験の処理である。WOL試験処理の詳細については,後述する。
In the
試験処理部100は,試験結果がOKであるかを判定する(ステップS12)。WOL試験処理において,試験対象CM20bの電源が投入されれば試験結果はOKとなり,試験対象CM20bの電源が投入されなければ試験結果はNGとなる。試験結果がOKであれば(ステップS12のYES),試験処理部100は,試験管理テーブル145における試験対象CM20bの試験対象LANポートのレコードに,試験結果がOKであった旨を記録する(ステップS14)。
The
試験結果がOKでなければ(ステップS12のNO),すなわち試験結果がNGであれば,試験処理部100は,故障箇所特定処理を実行する(ステップS13)。故障箇所特定処理は,試験制御CM20aから試験対象CM20bの電源を投入して,故障箇所を特定する処理である。故障箇所特定処理の詳細については,後述する。試験処理部100は,試験管理テーブル145における試験対象CM20bの試験対象LANポートのレコードに,試験結果がNGであった旨や,特定された故障箇所の情報を記録する(ステップS14)。
If the test result is not OK (NO in step S12), that is, if the test result is NG, the
試験処理部100は,試験対象CM20bのすべてのLANポートについて処理が終了したかを判定する(ステップS15)。すべてのLANポートについて処理が終了していなければ(ステップS15のNO),試験処理部100は,ステップS10の処理に戻って,次のLANポートについての処理に移る。すべてのLANポートについて処理が終了していれば(ステップS15のYES),試験処理部100の出力部150は,端末4に対して,試験管理テーブル145に記録された,試験対象CM20bについてのWOL試験の結果を出力する(ステップS16)。
The
本実施の形態では,図6に示す一連の処理を,RAID装置1が備える各CM20について,試験制御CM20aと試験対象CM20bとを変えながら実行する。本実施の形態の技術によって,RAID装置1のWOL試験を行う場合,容易に故障箇所の特定が可能となる。
In the present embodiment, the series of processing shown in FIG. 6 is executed for each
図7,図8は,本実施の形態の試験制御CMおよび試験対象CMによるWOL試験処理のシーケンス図である。 7 and 8 are sequence diagrams of the WOL test processing by the test control CM and the test target CM according to the present embodiment.
試験制御CM20aの試験処理部100において,試験実行部110は,試験対象CM20bに対して,試験対象LANポートの指定を含むWOL試験開始指示データを転送する(ステップS20)。ここでは,試験制御CM20aのDMAコントローラ22が,あらかじめ決められた形式のWOL試験開始指示データを,試験対象CM20bのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,試験実行部110は,試験対象CM20bに対して,割り込み通知を行う。割り込み通知によって,試験対象CM20bの試験処理部200に,自試験対象CM20bのメモリ23にデータ転送された旨が伝えられる。なお,DMAコントローラ22の仕様によっては,試験実行部110によって割り込み通知の制御を行わなくても,データ転送後に自動で割り込み通知が行われる場合もある。
In the
試験対象CM20bの試験処理部200において,試験準備部210は,WOL試験開始指示データを受けると,そのデータで指定された試験対象LANポートのLANコントローラ29のMACアドレスのデータを,試験制御CM20aに転送する(ステップS21)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式のMACアドレスデータを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,試験準備部210は,試験制御CM20aに対して,割り込み通知を行う。
In the
試験制御CM20aの試験実行部110は,試験管理テーブル145における試験対象CM20bの試験対象LANポートのレコードに,MACアドレスを記録する(ステップS22)。試験実行部110は,試験対象CM20bに対して,電源OFF指示データを転送する(ステップS23)。ここでは,試験制御CM20aのDMAコントローラ22が,あらかじめ決められた形式の電源OFF指示データを,試験対象CM20bのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,試験実行部110は,試験対象CM20bに対して,割り込み通知を行う。
The
試験対象CM20bの試験準備部210は,電源OFF指示データを受けると,試験対象LANポートのWOLを有効にする設定を行う(ステップS24)。試験準備部210は,自試験対象CM20bの電源OFFの処理を開始する(ステップS25)。試験準備部210は,転送するごとに値を+1するカウンタデータを,試験制御CM20aに対して繰り返し転送する(ステップS26)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式のカウンタデータを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。電源OFFの処理は,処理完了までにタイムラグがある。試験対象CM20bは,カウンタデータを試験制御CM20aに送ることで,自試験対象CM20bの電源がON状態であるのかOFF状態となったのかを,試験制御CM20aに通知する。試験対象CM20bの電源がOFF状態となることで,カウンタデータの転送が終了する。
When the
試験制御CM20aの試験実行部110は,自試験制御CM20aのメモリ23のカウンタデータが記録される領域を監視し,カウンタデータの値の変化がなくなるまで待機する(ステップS27)。試験実行部110は,カウンタデータの値が変化しなくなったときに,試験対象CM20bの電源がOFF状態になったと判断する。なお,試験実行部110が,タイマを用いて,試験対象CM20bが電源OFF状態になるのに十分と考えられる時間を待機するようにしてもよい。
The
試験対象CM20bの電源がOFF状態になったと判断すると,試験実行部110は,マジックパケットを生成する(ステップS28)。試験実行部110のパケット送信部111は,試験対象CM20bの試験対象LANポートに対して,マジックパケットを送信する(ステップS29)。ここでは,試験対象CM20bの電源がOFF状態であるので,MACアドレスを用いてマジックパケットの送信が行われる。その後,試験実行部110は,自試験制御CM20aのメモリ23の電源投入通知データが記録される領域を監視し,試験対象CM20bからの電源投入通知データの転送を待機する(ステップS30)。
When determining that the power of the
試験対象CM20bでは,マジックパケットによる電源の投入に成功した場合,診断システムモニタのブートや,試験プログラムの起動が行われる。試験プログラムの起動後,試験対象CM20bの試験処理部200において,立ち上げ通知部220は,試験制御CM20aに対して,自試験対象CM20bの電源が投入された旨を通知する電源投入通知データを転送する(ステップS31)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式の電源投入通知データを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。
In the
試験制御CM20aの試験実行部110は,試験対象CM20bからの電源投入通知データの転送が確認できた場合,試験結果がOKであると判定する(ステップS32)。
The
なお,マジックパケットによる試験対象CM20bの電源投入に失敗した場合,試験対象CM20bから試験制御CM20aに対して,電源投入通知データの転送が行われない。試験制御CM20aの試験実行部110は,一定時間以上待機しても試験対象CM20bからの電源投入通知データの転送が確認できない場合,試験結果がNGであると判定する。
Note that, when power-on of the
図9,図10は,本実施の形態の試験制御CMおよび試験対象CMによる故障箇所特定処理のシーケンス図である。 FIG. 9 and FIG. 10 are sequence diagrams of failure location specifying processing by the test control CM and the test target CM of this embodiment.
試験制御CM20aの試験処理部100において,電源投入制御部120は,各CM20のシステム監視回路31を介した電源制御回路32の制御で全CM20の電源をONにすることにより,試験対象CM20bの電源を強制的に投入する(ステップS40)。その後,情報取得部130は,自試験制御CM20aのメモリ23の電源投入通知データが記録される領域を監視し,試験対象CM20bからの電源投入通知データの転送を待機する(ステップS41)。
In the
試験対象CM20bでは,電源の投入後,診断システムモニタのブートや,試験プログラムの起動が行われる。試験プログラムの起動後,試験対象CM20bの試験処理部200において,立ち上げ通知部220は,試験制御CM20aに対して,自試験対象CM20bの電源が投入された旨を通知する電源投入通知データを転送する(ステップS42)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式の電源投入通知データを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。
In the
試験制御CM20aの情報取得部130において,試験対象CM20bからの電源投入通知データの転送が確認されると,メッセージ送信部131は,試験対象CM20bに対して,試験対象LANポートの指定を含む故障箇所特定処理開始指示データを転送する(ステップS43)。故障箇所特定処理開始指示データは,故障箇所などの状態情報の取得要求メッセージである。ここでは,試験制御CM20aのDMAコントローラ22が,あらかじめ決められた形式の故障箇所特定処理開始指示データを,試験対象CM20bのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,情報取得部130は,試験対象CM20bに対して,割り込み通知を行う。
When the
試験対象CM20bの故障箇所特定処理部230は,試験対象LANポートのWOLを有効にする設定を行う(ステップS44)。故障箇所特定処理部230は,試験対象LANポートのIP(Internet Protocol )アドレスのデータを,試験制御CM20aに転送する(ステップS45)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式のIPアドレスデータを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,故障箇所特定処理部230は,試験制御CM20aに対して,割り込み通知を行う。
The failure location
試験制御CM20aの情報取得部130は,IPアドレスデータの転送を受けると,得られたIPアドレスを指定して,試験対象CM20bの試験対象LANポートに対して,マジックパケットを送信する(ステップS46)。ここでは,試験対象CM20bの電源がON状態であるので,IPアドレスを用いてマジックパケットの送信が行われる。
Upon receiving the IP address data transfer, the
試験対象CM20bの故障箇所特定処理部230は,マジックパケットを受けると,試験対象LANポートのLANコントローラ29のレジスタで,マジックパケットの受信状態をチェックする(ステップS47)。また,故障箇所特定処理部230は,試験対象LANポートのLANコントローラ29のレジスタで,PMEステータスをチェックする(ステップS48)。また,故障箇所特定処理部230は,試験対象CM20bのシステム監視回路31のレジスタで,WAKE信号状態をチェックする(ステップS49)。
When receiving the magic packet, the failure
故障箇所特定処理部230は,ステップS47〜S49のチェック結果から,故障箇所を特定する(ステップS50)。故障箇所特定処理部230は,試験制御CM20aに対して,故障箇所の情報を含む故障箇所データを転送する(ステップS51)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式の故障箇所データを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,故障箇所特定処理部230は,試験制御CM20aに対して,割り込み通知を行う。
The failure location
試験制御CM20aの情報取得部130は,試験対象CM20bからの故障箇所データの転送により,故障箇所の情報を得ることができる。なお,情報取得部130が,試験対象CM20bからステップS47〜S49のチェック結果のデータを取得して,故障箇所の特定を行うようにしてもよい。
The
以上,本実施の形態について説明したが,本発明はその主旨の範囲において種々の変形が可能であることは当然である。 Although the present embodiment has been described above, the present invention can naturally be modified in various ways within the scope of the gist thereof.
例えば,本実施の形態では,試験対象の処理装置としてストレージ装置を用いた例を説明したが,試験対象の処理装置が,必ずしもストレージ装置である必要はない。例えば,試験対象の処理装置が,内部のコントローラ間で通信し合うようなサーバ等の情報処理装置であってもよい。例えば,装置内に複数の制御部を有し,それらの制御部が相互に通信可能であって,共通の電源制御が可能な仕組みになっており,電源投入パケットを用いた電源投入の機能を持つ処理装置であれば,本実施の形態による試験の技術を適用可能である。 For example, in this embodiment, an example in which a storage device is used as a processing device to be tested has been described. However, the processing device to be tested does not necessarily have to be a storage device. For example, the processing apparatus to be tested may be an information processing apparatus such as a server that communicates between internal controllers. For example, the system has a plurality of control units, and these control units can communicate with each other and have a mechanism for common power control. The power-on function using a power-on packet is provided. The testing technique according to the present embodiment can be applied to any processing apparatus having such a processing apparatus.
1 RAID装置
2 PC
3 LAN
4 端末
5 HUB
10 CE
20 CM
20a 試験制御CM
20b 試験対象CM
21 CPU
22 DMAコントローラ
23 メモリ
24 システムボリューム
25 PCH
26 PCIバスブリッジ
27 CA
28 SASコントローラ
29 LANコントローラ
30 WAKE信号線
31 システム監視回路
32 電源制御回路
40 DE
41 ディスク
100 試験処理部
110 試験実行部
111 パケット送信部
120 電源投入制御部
130 情報取得部
131 メッセージ送信部
140 試験管理情報記憶部
150 出力部
200 試験処理部
210 試験準備部
220 立ち上げ通知部
230 故障箇所特定処理部
1
3 LAN
4 terminal 5 HUB
10 CE
20 CM
20a Test control CM
20b Test CM
21 CPU
22
26
28
41
Claims (3)
前記試験対象装置が備える第2の制御部に対して,第1のパスを介して電源投入パケットを送信し,
前記電源投入パケットの送信によって前記第2の制御部の電源が投入されなかった場合に,互いに通信可能な前記第1の制御部が備える監視回路と前記第2の制御部が備える監視回路とを介して前記第2の制御部の電源制御回路を制御して電源を投入し,
前記第2の制御部の電源投入の後に,第2のパスを介して前記第2の制御部に対して状態情報の取得要求メッセージを送信する処理を実行する
ことを特徴とする試験方法。 The first control unit provided in the device under test is
A power-on packet is transmitted to the second control unit included in the test target device via the first path,
A monitoring circuit provided in the first control unit and a monitoring circuit provided in the second control unit that can communicate with each other when the power of the second control unit is not turned on by transmission of the power-on packet; The power control circuit of the second control unit is controlled via the power supply ,
A test method comprising: executing a process of transmitting a status information acquisition request message to the second control unit via a second path after the second control unit is powered on.
ことを特徴とする請求項1に記載の試験方法。 The second pass, use the data transfer to the first controller and the second of said first from said memory of the control unit the second control unit comprises a memory between the control unit The test method according to claim 1, wherein the test path is a communication path.
前記第1の制御部が,
前記第2の制御部に対して,第1のパスを介して電源投入パケットを送信するパケット送信部と,
前記電源投入パケットの送信によって前記第2の制御部の電源が投入されなかった場合に,互いに通信可能な前記第1の制御部が備える監視回路と前記第2の制御部が備える監視回路とを介して前記第2の制御部の電源制御回路を制御して電源を投入する電源投入制御部と,
前記第2の制御部の電源投入の後に,第2のパスを介して前記第2の制御部に対して状態情報の取得要求メッセージを送信するメッセージ送信部とを備える
ことを特徴とする処理装置。 In a processing apparatus including a first controller and a second controller connected by a plurality of paths,
The first controller is
A packet transmission unit that transmits a power-on packet to the second control unit via a first path;
A monitoring circuit provided in the first control unit and a monitoring circuit provided in the second control unit that can communicate with each other when the power of the second control unit is not turned on by transmission of the power-on packet; A power-on control unit for controlling the power control circuit of the second control unit via the power source ,
And a message transmission unit that transmits a status information acquisition request message to the second control unit via a second path after the second control unit is powered on. .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012216407A JP6089543B2 (en) | 2012-09-28 | 2012-09-28 | Test method and processing equipment |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012216407A JP6089543B2 (en) | 2012-09-28 | 2012-09-28 | Test method and processing equipment |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014071601A JP2014071601A (en) | 2014-04-21 |
JP6089543B2 true JP6089543B2 (en) | 2017-03-08 |
Family
ID=50746757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012216407A Active JP6089543B2 (en) | 2012-09-28 | 2012-09-28 | Test method and processing equipment |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6089543B2 (en) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07226763A (en) * | 1994-02-15 | 1995-08-22 | Hitachi Ltd | Automatic restoration method in ring form lan |
JP2001184145A (en) * | 1999-12-27 | 2001-07-06 | Id Gate Co Ltd | Remote power supply management system for information processor or the like |
-
2012
- 2012-09-28 JP JP2012216407A patent/JP6089543B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014071601A (en) | 2014-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI578233B (en) | Unified firmware managment system, non-transitory computer-readable storage medium and method for unified firmware managment | |
TWI551997B (en) | Computer-readable medium and multiple-protocol-system-management method and system | |
US10055296B2 (en) | System and method for selective BIOS restoration | |
JP4558519B2 (en) | Information processing apparatus and system bus control method | |
US9182998B2 (en) | Remote bios update in system having multiple computers | |
US9680712B2 (en) | Hardware management and control of computer components through physical layout diagrams | |
US20150106660A1 (en) | Controller access to host memory | |
US9367510B2 (en) | Backplane controller for handling two SES sidebands using one SMBUS controller and handler controls blinking of LEDs of drives installed on backplane | |
TW201633133A (en) | Method and system of automatic debug information collection | |
US8909910B2 (en) | Computer system for selectively accessing bios by a baseboard management controller | |
US11061837B2 (en) | UBM implementation inside BMC | |
TW201502772A (en) | Virtual baseboard management controller | |
US20140122753A1 (en) | Electronic Device, Management Method Thereof, and Rack Serving System | |
US10789141B2 (en) | Information processing device and information processing method | |
CN102880527B (en) | Data recovery method of baseboard management controller | |
TWI512490B (en) | System for retrieving console messages and method thereof and non-transitory computer-readable medium | |
US20100042710A1 (en) | Remote management of computer system | |
US9009543B2 (en) | Computer systems that acquire a plurality of statuses of non-normally operating hard disk drives | |
CN114600088A (en) | Server state monitoring system and method using baseboard management controller | |
TW201201014A (en) | Adapter and debug method using the same | |
JP2015114873A (en) | Information processor and monitoring method | |
JP2007025933A (en) | Storage system and its firmware automatic updating method | |
CN111949320A (en) | Method, system and server for providing system data | |
CN110769051B (en) | Embedded server remote management system and method based on domestic processor | |
US9749189B2 (en) | Generating graphical diagram of physical layout of computer platforms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150604 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160510 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160711 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170123 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6089543 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |