JP6089543B2 - 試験方法および処理装置 - Google Patents

試験方法および処理装置 Download PDF

Info

Publication number
JP6089543B2
JP6089543B2 JP2012216407A JP2012216407A JP6089543B2 JP 6089543 B2 JP6089543 B2 JP 6089543B2 JP 2012216407 A JP2012216407 A JP 2012216407A JP 2012216407 A JP2012216407 A JP 2012216407A JP 6089543 B2 JP6089543 B2 JP 6089543B2
Authority
JP
Japan
Prior art keywords
test
power
control unit
control
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012216407A
Other languages
English (en)
Other versions
JP2014071601A (ja
Inventor
智広 又谷
智広 又谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012216407A priority Critical patent/JP6089543B2/ja
Publication of JP2014071601A publication Critical patent/JP2014071601A/ja
Application granted granted Critical
Publication of JP6089543B2 publication Critical patent/JP6089543B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

本発明は,電源投入パケットを用いた処理装置の電源投入試験を行う試験方法および処理装置に関するものである。
コンピュータなどの情報機器の電源を外部から制御する技術がある。例えば,コンピュータなどの情報機器の電源を外部から操作する技術として,Wake−On−LAN(Local Area Network)の技術がある。Wake−On−LANは,LAN等のネットワークに接続されているコンピュータに対して,マジックパケットと呼ばれる電源投入パケットを送ることで,該コンピュータの電源投入を遠隔で操作する技術である。
例えば,Wake−On−LAN機能を備えるストレージ装置があるものとする。このストレージ装置を試験対象として電源投入パケットを用いた電源投入の試験を行う場合,試験対象のストレージ装置にPC(Personal Computer )やサーバをLAN接続する。電源OFF状態のストレージ装置に対して,LAN接続されたPCやサーバなどから電源投入パケットを投入し,ストレージ装置の電源OFF状態が電源ON状態に切り替わることを確認する試験が行われる。
なお,リモート電源装置を制御することにより,該リモート電源装置に電源接続された情報処理装置の電源切断,投入を行う技術が知られている。また,ネットワーク経由での電源切断指示で未通知となった端末について,他端末から別インタフェースを経由して該未通知の端末のネットワーク通信制御部を初期化し,該未通知の端末に対して再度ネットワーク経由での電源切断指示を行う技術が知られている。また,複数のストレージ装置や情報処理装置が接続されているストレージシステムにおいて,ストレージ装置と情報処理装置との電源を連動して制御する技術が知られている。
特開2001−184145号公報 特開2001−202162号公報 特開2004−334535号公報
例えば,上述の試験対象のストレージ装置に対する電源投入パケットを用いた電源投入の試験において,ストレージ装置の電源投入ができなかった場合,LAN接続されたPCやサーバなどはストレージ装置にアクセスできないままなので,容易に故障箇所を特定することはできない。このような電源投入パケットを用いた処理装置の電源投入の試験において,故障箇所を容易に特定したいという要望がある。
一側面では,本発明は,電源投入パケットを用いた処理装置の電源投入の試験において,容易に故障箇所の特定が可能となる技術を提供することを目的とする。
1態様では,試験方法において,処理装置が備える第1の制御部は,処理装置が備える第2の制御部に対して第1のパスを介して電源投入パケットを送信し,電源投入パケットの送信によって第2の制御部の電源が投入されなかった場合に,互いに通信可能な第1の制御部が備える監視回路と第2の制御部が備える監視回路とを介して第2の制御部の電源制御回路を制御して電源を投入し,第2の制御部の電源投入の後に,第2のパスを介して第2の制御部に対して状態情報の取得要求メッセージを送信する処理を実行する。
1態様では,電源投入パケットを用いた処理装置の電源投入の試験において,容易に故障箇所の特定が可能となる。
本実施の形態によるWOLを説明する図である。 本実施の形態によるRAID装置の構成例を示す図である。 本実施の形態による試験制御CMと試験対象CMの機能構成例を示す図である。 本実施の形態による故障箇所特定の例を説明する図である。 本実施の形態による試験管理テーブルの例を示す図である。 本実施の形態の試験制御CMによる試験処理フローチャートである。 本実施の形態の試験制御CMおよび試験対象CMによるWOL試験処理のシーケンス図である。 本実施の形態の試験制御CMおよび試験対象CMによるWOL試験処理のシーケンス図である。 本実施の形態の試験制御CMおよび試験対象CMによる故障箇所特定処理のシーケンス図である。 本実施の形態の試験制御CMおよび試験対象CMによる故障箇所特定処理のシーケンス図である。
以下,本実施の形態について,図を用いて説明する。なお,本実施の形態の例では,ストレージ装置を試験対象の処理装置とした場合の例を説明する。
図1は,本実施の形態によるWOLを説明する図である。
RAID(Redundant Arrays of Inexpensive Disks )装置1は,複数のディスクを備えるストレージ装置である。図1に示すRAID装置1は,Wake−On−LAN機能を備えており,LAN3で接続されたPC2からの電源投入パケットを受けて,電源投入を行う。以下では,Wake−On−LANを,WOLとも呼ぶ。また,電源投入パケットを,マジックパケットとも呼ぶ。
図2は,本実施の形態によるRAID装置の構成例を示す図である。
RAID装置1は,CE(Controller Enclosure)10,DE(Drive Enclosure )40を備える。CE10は,サブシステム内のすべての動作を管理するモジュールであるCM(Controller Module )20を内部に搭載する筐体である。CE10には,複数のCM20が搭載可能である。図2に示す例では,CE10に2つのCM20が搭載されている。DE40は,複数のディスク41を内部に搭載する筐体である。
RAID装置1の制御部となるCM20は,CPU(Central Processing Unit )21,主記憶となるメモリ23,システムボリューム24,PCH(Platform Controller Hub )25,PCI(Peripheral Component Interconnect )バスブリッジ26,CA(Channel Adapter )27,SAS(Serial Attached SCSI)コントローラ28,LANコントローラ29,WAKE信号線30,システム監視回路31,電源制御回路32を備える。また,CPU21は,DMA(Direct Memory Access)コントローラ22を備える。なお,図2では記載が省略されているが,図2に示すRAID装置1が備える複数のCM20は,すべて同じ構成となっているものとする。
DMAコントローラ22は,DMAによるデータ転送を行う。DMAコントローラ22は,CM20間で相互接続され,CM20間のデータ通信に使用される。本実施の形態では,DMAコントローラ22によって,他のCM20にデータ転送を行うことにより,CM20間のデータ転送を実現する。
システムボリューム24は,例えば,HDD(Hard Disk Drive )やSSD(Solid State Drive ),USB(Universal Serial Bus)メモリなどの記憶装置である。本実施の形態では,システムボリューム24は,診断システムモニタのブート先や,CM20が実行する試験プログラムの記憶部としても使用される。
PCH25は,ノースブリッジとサウスブリッジの機能を統合したチップである。PCH25は,PCI(Peripheral Component Interconnect )Express,シリアルATA(Advanced Technology Attachment),USB,LAN,グラフィックス出力機能などを備える。
PCIバスブリッジ26は,CPU21と周辺機器との間の通信を行うためのバスである。CA27は,ホストインタフェースを持つアダプタであり,ホスト(図示省略)と接続し,ホストとRAID装置1との間でのデータ通信に使用される。SASコントローラ28は,DE40と接続して,ディスク41に対するデータのライト/リードに使用されるチップである。
LANコントローラ29は,LANによる通信の制御を行うチップである。LANコントローラには,それぞれ固有のMAC(Media Access Control)アドレスが設定されている。
システム監視回路31は,システムの電源制御やエラー監視等を行う回路である。システム監視回路31は,自CM20内の電源制御回路32を操作して各部位への電源供給を行う。システム監視回路31は,例えばFPGA(Field-Programmable Gate Array )などによって実現される。電源制御回路32は,システム監視回路からの操作により自CM20の電源の投入や切断の制御を実行する回路である。
端末4は,PCH25とシリアルインタフェースによって接続されるコンピュータ端末である。端末4は,ユーザ操作による試験プログラムの起動や,ユーザに対する情報の提示などに使用される。
本実施の形態のLANコントローラ29は,WOLに対応している。例えば,LANコントローラ29が,LANを介してマジックパケットを受信すると,LANコントローラ29のPMEステータスが“1”になる。その状態は,WAKE信号線30に反映され,WAKE信号がシステム監視回路31に通知される。その後,システム監視回路が電源制御回路を操作し,自CM20の電源をON状態にする。PMEステータスは,LANコントローラ29がWakeupイベント(マジックパケット)を受信したかどうかを示すステータスである。WAKE信号は,LANコントローラ29のPMEステータスの状態を示す信号である。PMEステータスが“1”(ON状態)になったときに,WAKE信号も“1”(ON状態)となる。システム監視回路31は,WAKE信号が“1”になると,電源制御回路32にアクセスし,電源を投入する。なお,CM20の電源がOFF状態であっても,LANコントローラ29や,システム監視回路31,電源制御回路32等には,電源が供給される。
RAID装置1のあるCM20がマジックパケットを受信した場合,該CM20のシステム監視回路31は,自CM20内の電源制御回路32を操作して各部位への電源供給を行うと同時に,他のCM20のシステム監視回路31に対して,WAKE信号があった旨を通知する。システム監視回路31は,他のCM20と通信を行うことが可能である。マジックパケットを受けたCM20のシステム監視回路31から,WAKE信号があった旨の通知を受けた各CM20のシステム監視回路31は,それぞれ自CM20内の電源制御回路32を操作して,自CM20に対する電源供給を行う。
以下では,WOL機能を備えるRAID装置1について,本実施の形態によるWOL機能の試験を行う例を説明する。
図3は,本実施の形態による試験制御CMと試験対象CMの機能構成例を示す図である。
図3において,CM20aは,WOL試験の制御を行う第1の制御部となるCM20である。以下では,WOL試験を制御するCM20を,試験制御CM20aと呼ぶ。また,CM20bは,WOL試験の対象である第2の制御部となるCM20である。以下では,WOL試験の対象となるCM20を,試験対象CM20bと呼ぶ。なお,本実施の形態では,RAID装置1のWOL試験を行うにあたって,試験制御CM20aの各LANコントローラ29と試験対象CM20bの各LANコントローラ29とが,例えばHUB5を介してLANで接続されているものとする。
試験制御CM20aは,試験処理部100を備える。試験処理部100は,本実施の形態によるWOL試験において,試験制御CM20a側の処理を実行する機能部である。試験処理部100は,試験実行部110,電源投入制御部120,情報取得部130,試験管理情報記憶部140,出力部150を備える。
試験実行部110は,WOL試験を実行する制御を行う。より具体的には,試験実行部110は,試験対象CM20bに対してWOL試験開始の指示を出し,試験対象CM20bの電源をOFF状態にさせる。その後,試験実行部110のパケット送信部111は,試験対象CM20bに対して,第1のパスであるLANを介してマジックパケットを送信する。
電源投入制御部120は,マジックパケットの送信によって試験対象CM20bの電源が投入されなかった場合に,両CM20のシステム監視回路31を介して,試験対象CM20bの電源制御回路32を制御し,試験対象CM20bの電源を投入する。
情報取得部130は,マジックパケットの送信によって試験対象CM20bの電源が投入されなかった場合に,試験対象CM20bから故障箇所の情報などの状態情報を取得する。このとき,情報取得部130のメッセージ送信部131は,試験対象CM20bの電源投入の後に,CM20間でのメモリ23へのデータ転送を用いた通信のパスである第2のパスを介して,試験対象CM20bに対して,状態情報の取得要求メッセージを送信する。CM20間でのメモリ23へのデータ転送は,DMAコントローラ22を用いて行われる。
試験管理情報記憶部140は,試験管理情報を記憶する記憶部である。試験管理情報は,WOL試験の結果が記録される情報である。例えば,試験管理情報記憶部140の試験管理情報には,情報取得部130により試験対象CM20bから取得された故障箇所などの情報が記録される。
出力部150は,試験管理情報記憶部140の試験管理情報に記録されたWOL試験の結果を,端末4に出力する。例えば,端末4のディスプレイに,WOL試験の結果が表示される。
試験対象CM20bは,試験処理部200を備える。試験処理部200は,本実施の形態によるWOL試験において,試験対象CM20b側の処理を実行する機能部である。試験処理部200は,試験準備部210,立ち上げ通知部220,故障箇所特定処理部230を備える。
試験準備部210は,試験制御CM20aからのWOL試験開始の指示を受け,自試験対象CM20bの電源をOFF状態にする。
立ち上げ通知部220は,自試験対象CM20bが,電源OFF状態から電源ON状態となり,試験処理部200が起動された際に,自試験対象CM20bが立ち上がった旨を,試験制御CM20aに通知する。
故障箇所特定処理部230は,試験制御CM20aからの状態情報の取得要求メッセージの受信後,LANコントローラ29のレジスタや,システム監視回路31のレジスタなどをチェックし,故障箇所を特定する。故障箇所特定処理部230は,特定した故障箇所の情報を試験制御CM20aに送信する。
図3に示す試験制御CM20a,試験対象CM20bが備える各機能部は,各CM20が備えるCPU21,メモリ23等のハードウェアと,ソフトウェアプログラムとによって実現することが可能である。CM20が実行可能なプログラムは,システムボリューム24に記憶され,その実行時にメモリ23に読み出され,CPU21により実行される。RAID装置1のWOL機能について試験を行う場合,各CM20のシステムボリューム24には,試験プログラムが記憶されている。
各CM20のシステムボリューム24に記憶された試験プログラムは,試験対象のRAID装置1の電源投入後,例えば,以下の手順で起動される。
(1)フラッシュROM(Read Only Memory)(図示省略)のBIOS(Basic Input/Output System )が起動する。
(2)BIOSがシステムボリューム24内の診断システムモニタをメモリ23上にローディングし,制御を渡す。診断システムモニタは,CM20上で試験プログラムを動作させるためのOS(Operating System)である。診断システムモニタの初期化処理を実行する。
(3)IO(Input/Output)ドライバの数だけ,システムボリューム24内のIOドライバモジュールがメモリ23にローディングされ,IOドライバの初期化処理が実行される。
(4)診断システムモニタの立ち上げ処理の完了後,端末4に操作画面が表示される。ユーザは,端末4から試験プログラムの起動操作を実施する。
(5)診断システムモニタは,試験プログラムおよびユーティリティコマンドをシステムボリューム24からメモリ23にローディングし,実行する。
なお,端末4からの実行文をあらかじめファイルに記載しておくことで,自動運転も可能である。また,RAID装置1が備える複数のCM20のうち,どのCM20が試験制御CM20aとなり,どのCM20が試験対象CM20bとなるかは,例えば,端末4を操作するユーザからの指定によって決定されてもよいし,自動で決定されてもよい。
このように,RAID装置1が備えるCM20で試験プログラムが実行されることにより,図3に示す試験制御CM20aの試験処理部100や,試験対象CM20bの試験処理部200が実現される。
図4は,本実施の形態による故障箇所特定の例を説明する図である。
ここでは,故障箇所の特定でチェックする箇所と,そのチェック結果から特定される故障箇所の候補の一例を説明する。チェックする箇所や,チェック結果から特定される故障箇所などは,試験対象となるRAID装置1の仕様や設計に応じたものとなる。
例えば,試験対象CM20bの故障箇所特定処理部230は,LANコントローラ29のレジスタからのリードにより,マジックパケットの受信状態を示すステータスをチェックする。マジックパケットが受信状態でない場合には,試験対象CM20bのLANコントローラ29,試験制御CM20aのLANコントローラ29,LANケーブルなどが,故障箇所の候補として考えられる。
また,例えば,試験対象CM20bの故障箇所特定処理部230は,LANコントローラ29のレジスタからのリードにより,PMEステータスをチェックする。PMEステータスが“0”である場合,試験対象CM20bのLANコントローラ29などが,故障箇所の候補として考えられる。
また,例えば,試験対象CM20bの故障箇所特定処理部230は,システム監視回路31のレジスタをチェックすることにより,WAKE信号状態を判断する。WAKE信号状態が“0”である場合,WAKE信号線30などが,故障箇所の候補として考えられる。
マジックパケットの受信状態,PMEステータス,WAKE信号状態のチェックで異常がない場合,システム監視回路31,電源制御回路32などが,故障箇所の候補として考えられる。
図5は,本実施の形態による試験管理テーブルの例を示す図である。
図5に示す試験管理テーブル145は,試験制御CM20aの試験管理情報記憶部140に記憶される試験管理情報の一例を示す。図5に示す試験管理テーブル145は,CM番号,LANポート番号,MACアドレス,試験結果,故障箇所の情報を持つ。
CM番号は,試験対象のRAID装置1が備えるCM20のスロットIDを示す。LANポート番号は,該当CM20が備えるLANポートの番号を示す。試験管理テーブル145のレコードは,CM番号で示されるCM20における,LANポート番号で示されるLANポートごとのレコードとなる。MACアドレスは,該当LANポートのLANコントローラ29のMACアドレスを示す。
試験結果は,該当LANポートに対するWOL試験の試験結果を示す。試験結果において,“0”はWOL試験が未実施であることを示す。試験結果において,“1”は試験結果がOKである場合,すなわち試験対象CM20bの該当LANポートを対象としたWOL試験で試験対象CM20bの電源が投入された場合を示す。試験結果において,“2”は試験結果がNGである場合,すなわち試験対象CM20bの該当LANポートを対象としたWOL試験で試験対象CM20bの電源が投入されなかった場合を示す。
故障箇所は,試験結果がNGであった場合に,特定された故障箇所を示す。故障箇所における4つの数値は,左から試験対象CM20bのLANコントローラ29,WAKE信号線30,システム監視回路31or電源制御回路32,試験制御CM20aのLANコントローラ29orLANケーブルの故障を表している。故障箇所において,“0”は該当箇所が故障箇所の候補でないことを示し,“1”は該当箇所が故障箇所の候補であることを示す。
例えば,図4に示すチェック結果において,パケット受信状態でない場合.試験管理テーブル145の故障箇所は,“1001”となる。また,PMEステータスが“0”である場合,試験管理テーブル145の故障箇所は,“1000”となる。また,WAKE信号状態が“0”である場合,試験管理テーブル145の故障箇所は,“0100”となる。また,それら以外である場合,試験管理テーブル145の故障箇所は,“0010”となる。
以下,図6〜図10を用いて,本実施の形態の試験制御CM20aと試験対象CM20bとによる,一連のWOL試験の処理の流れを説明する。
図6は,本実施の形態の試験制御CMによる試験処理フローチャートである。
試験制御CM20aにおいて,試験処理部100は,試験対象CM20bのLANポートから,試験対象のLANポートを順に1つ選択する(ステップS10)。試験処理部100は,試験対象のLANポートについて,WOL試験処理を実行する(ステップS11)。WOL試験処理は,電源をOFF状態の試験対象CM20bにおける試験対象LANポートに対して,試験制御CM20aからマジックパケットを送信することにより,試験対象CM20bの電源を投入させる試験の処理である。WOL試験処理の詳細については,後述する。
試験処理部100は,試験結果がOKであるかを判定する(ステップS12)。WOL試験処理において,試験対象CM20bの電源が投入されれば試験結果はOKとなり,試験対象CM20bの電源が投入されなければ試験結果はNGとなる。試験結果がOKであれば(ステップS12のYES),試験処理部100は,試験管理テーブル145における試験対象CM20bの試験対象LANポートのレコードに,試験結果がOKであった旨を記録する(ステップS14)。
試験結果がOKでなければ(ステップS12のNO),すなわち試験結果がNGであれば,試験処理部100は,故障箇所特定処理を実行する(ステップS13)。故障箇所特定処理は,試験制御CM20aから試験対象CM20bの電源を投入して,故障箇所を特定する処理である。故障箇所特定処理の詳細については,後述する。試験処理部100は,試験管理テーブル145における試験対象CM20bの試験対象LANポートのレコードに,試験結果がNGであった旨や,特定された故障箇所の情報を記録する(ステップS14)。
試験処理部100は,試験対象CM20bのすべてのLANポートについて処理が終了したかを判定する(ステップS15)。すべてのLANポートについて処理が終了していなければ(ステップS15のNO),試験処理部100は,ステップS10の処理に戻って,次のLANポートについての処理に移る。すべてのLANポートについて処理が終了していれば(ステップS15のYES),試験処理部100の出力部150は,端末4に対して,試験管理テーブル145に記録された,試験対象CM20bについてのWOL試験の結果を出力する(ステップS16)。
本実施の形態では,図6に示す一連の処理を,RAID装置1が備える各CM20について,試験制御CM20aと試験対象CM20bとを変えながら実行する。本実施の形態の技術によって,RAID装置1のWOL試験を行う場合,容易に故障箇所の特定が可能となる。
図7,図8は,本実施の形態の試験制御CMおよび試験対象CMによるWOL試験処理のシーケンス図である。
試験制御CM20aの試験処理部100において,試験実行部110は,試験対象CM20bに対して,試験対象LANポートの指定を含むWOL試験開始指示データを転送する(ステップS20)。ここでは,試験制御CM20aのDMAコントローラ22が,あらかじめ決められた形式のWOL試験開始指示データを,試験対象CM20bのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,試験実行部110は,試験対象CM20bに対して,割り込み通知を行う。割り込み通知によって,試験対象CM20bの試験処理部200に,自試験対象CM20bのメモリ23にデータ転送された旨が伝えられる。なお,DMAコントローラ22の仕様によっては,試験実行部110によって割り込み通知の制御を行わなくても,データ転送後に自動で割り込み通知が行われる場合もある。
試験対象CM20bの試験処理部200において,試験準備部210は,WOL試験開始指示データを受けると,そのデータで指定された試験対象LANポートのLANコントローラ29のMACアドレスのデータを,試験制御CM20aに転送する(ステップS21)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式のMACアドレスデータを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,試験準備部210は,試験制御CM20aに対して,割り込み通知を行う。
試験制御CM20aの試験実行部110は,試験管理テーブル145における試験対象CM20bの試験対象LANポートのレコードに,MACアドレスを記録する(ステップS22)。試験実行部110は,試験対象CM20bに対して,電源OFF指示データを転送する(ステップS23)。ここでは,試験制御CM20aのDMAコントローラ22が,あらかじめ決められた形式の電源OFF指示データを,試験対象CM20bのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,試験実行部110は,試験対象CM20bに対して,割り込み通知を行う。
試験対象CM20bの試験準備部210は,電源OFF指示データを受けると,試験対象LANポートのWOLを有効にする設定を行う(ステップS24)。試験準備部210は,自試験対象CM20bの電源OFFの処理を開始する(ステップS25)。試験準備部210は,転送するごとに値を+1するカウンタデータを,試験制御CM20aに対して繰り返し転送する(ステップS26)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式のカウンタデータを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。電源OFFの処理は,処理完了までにタイムラグがある。試験対象CM20bは,カウンタデータを試験制御CM20aに送ることで,自試験対象CM20bの電源がON状態であるのかOFF状態となったのかを,試験制御CM20aに通知する。試験対象CM20bの電源がOFF状態となることで,カウンタデータの転送が終了する。
試験制御CM20aの試験実行部110は,自試験制御CM20aのメモリ23のカウンタデータが記録される領域を監視し,カウンタデータの値の変化がなくなるまで待機する(ステップS27)。試験実行部110は,カウンタデータの値が変化しなくなったときに,試験対象CM20bの電源がOFF状態になったと判断する。なお,試験実行部110が,タイマを用いて,試験対象CM20bが電源OFF状態になるのに十分と考えられる時間を待機するようにしてもよい。
試験対象CM20bの電源がOFF状態になったと判断すると,試験実行部110は,マジックパケットを生成する(ステップS28)。試験実行部110のパケット送信部111は,試験対象CM20bの試験対象LANポートに対して,マジックパケットを送信する(ステップS29)。ここでは,試験対象CM20bの電源がOFF状態であるので,MACアドレスを用いてマジックパケットの送信が行われる。その後,試験実行部110は,自試験制御CM20aのメモリ23の電源投入通知データが記録される領域を監視し,試験対象CM20bからの電源投入通知データの転送を待機する(ステップS30)。
試験対象CM20bでは,マジックパケットによる電源の投入に成功した場合,診断システムモニタのブートや,試験プログラムの起動が行われる。試験プログラムの起動後,試験対象CM20bの試験処理部200において,立ち上げ通知部220は,試験制御CM20aに対して,自試験対象CM20bの電源が投入された旨を通知する電源投入通知データを転送する(ステップS31)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式の電源投入通知データを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。
試験制御CM20aの試験実行部110は,試験対象CM20bからの電源投入通知データの転送が確認できた場合,試験結果がOKであると判定する(ステップS32)。
なお,マジックパケットによる試験対象CM20bの電源投入に失敗した場合,試験対象CM20bから試験制御CM20aに対して,電源投入通知データの転送が行われない。試験制御CM20aの試験実行部110は,一定時間以上待機しても試験対象CM20bからの電源投入通知データの転送が確認できない場合,試験結果がNGであると判定する。
図9,図10は,本実施の形態の試験制御CMおよび試験対象CMによる故障箇所特定処理のシーケンス図である。
試験制御CM20aの試験処理部100において,電源投入制御部120は,各CM20のシステム監視回路31を介した電源制御回路32の制御で全CM20の電源をONにすることにより,試験対象CM20bの電源を強制的に投入する(ステップS40)。その後,情報取得部130は,自試験制御CM20aのメモリ23の電源投入通知データが記録される領域を監視し,試験対象CM20bからの電源投入通知データの転送を待機する(ステップS41)。
試験対象CM20bでは,電源の投入後,診断システムモニタのブートや,試験プログラムの起動が行われる。試験プログラムの起動後,試験対象CM20bの試験処理部200において,立ち上げ通知部220は,試験制御CM20aに対して,自試験対象CM20bの電源が投入された旨を通知する電源投入通知データを転送する(ステップS42)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式の電源投入通知データを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。
試験制御CM20aの情報取得部130において,試験対象CM20bからの電源投入通知データの転送が確認されると,メッセージ送信部131は,試験対象CM20bに対して,試験対象LANポートの指定を含む故障箇所特定処理開始指示データを転送する(ステップS43)。故障箇所特定処理開始指示データは,故障箇所などの状態情報の取得要求メッセージである。ここでは,試験制御CM20aのDMAコントローラ22が,あらかじめ決められた形式の故障箇所特定処理開始指示データを,試験対象CM20bのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,情報取得部130は,試験対象CM20bに対して,割り込み通知を行う。
試験対象CM20bの故障箇所特定処理部230は,試験対象LANポートのWOLを有効にする設定を行う(ステップS44)。故障箇所特定処理部230は,試験対象LANポートのIP(Internet Protocol )アドレスのデータを,試験制御CM20aに転送する(ステップS45)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式のIPアドレスデータを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,故障箇所特定処理部230は,試験制御CM20aに対して,割り込み通知を行う。
試験制御CM20aの情報取得部130は,IPアドレスデータの転送を受けると,得られたIPアドレスを指定して,試験対象CM20bの試験対象LANポートに対して,マジックパケットを送信する(ステップS46)。ここでは,試験対象CM20bの電源がON状態であるので,IPアドレスを用いてマジックパケットの送信が行われる。
試験対象CM20bの故障箇所特定処理部230は,マジックパケットを受けると,試験対象LANポートのLANコントローラ29のレジスタで,マジックパケットの受信状態をチェックする(ステップS47)。また,故障箇所特定処理部230は,試験対象LANポートのLANコントローラ29のレジスタで,PMEステータスをチェックする(ステップS48)。また,故障箇所特定処理部230は,試験対象CM20bのシステム監視回路31のレジスタで,WAKE信号状態をチェックする(ステップS49)。
故障箇所特定処理部230は,ステップS47〜S49のチェック結果から,故障箇所を特定する(ステップS50)。故障箇所特定処理部230は,試験制御CM20aに対して,故障箇所の情報を含む故障箇所データを転送する(ステップS51)。ここでは,試験対象CM20bのDMAコントローラ22が,あらかじめ決められた形式の故障箇所データを,試験制御CM20aのメモリ23上のあらかじめ決められた領域に転送する。データ転送後に,故障箇所特定処理部230は,試験制御CM20aに対して,割り込み通知を行う。
試験制御CM20aの情報取得部130は,試験対象CM20bからの故障箇所データの転送により,故障箇所の情報を得ることができる。なお,情報取得部130が,試験対象CM20bからステップS47〜S49のチェック結果のデータを取得して,故障箇所の特定を行うようにしてもよい。
以上,本実施の形態について説明したが,本発明はその主旨の範囲において種々の変形が可能であることは当然である。
例えば,本実施の形態では,試験対象の処理装置としてストレージ装置を用いた例を説明したが,試験対象の処理装置が,必ずしもストレージ装置である必要はない。例えば,試験対象の処理装置が,内部のコントローラ間で通信し合うようなサーバ等の情報処理装置であってもよい。例えば,装置内に複数の制御部を有し,それらの制御部が相互に通信可能であって,共通の電源制御が可能な仕組みになっており,電源投入パケットを用いた電源投入の機能を持つ処理装置であれば,本実施の形態による試験の技術を適用可能である。
1 RAID装置
2 PC
3 LAN
4 端末
5 HUB
10 CE
20 CM
20a 試験制御CM
20b 試験対象CM
21 CPU
22 DMAコントローラ
23 メモリ
24 システムボリューム
25 PCH
26 PCIバスブリッジ
27 CA
28 SASコントローラ
29 LANコントローラ
30 WAKE信号線
31 システム監視回路
32 電源制御回路
40 DE
41 ディスク
100 試験処理部
110 試験実行部
111 パケット送信部
120 電源投入制御部
130 情報取得部
131 メッセージ送信部
140 試験管理情報記憶部
150 出力部
200 試験処理部
210 試験準備部
220 立ち上げ通知部
230 故障箇所特定処理部

Claims (3)

  1. 試験対象装置が備える第1の制御部が,
    前記試験対象装置が備える第2の制御部に対して,第1のパスを介して電源投入パケットを送信し,
    前記電源投入パケットの送信によって前記第2の制御部の電源が投入されなかった場合に,互いに通信可能な前記第1の制御部が備える監視回路と前記第2の制御部が備える監視回路とを介して前記第2の制御部の電源制御回路を制御して電源を投入し,
    前記第2の制御部の電源投入の後に,第2のパスを介して前記第2の制御部に対して状態情報の取得要求メッセージを送信する処理を実行する
    ことを特徴とする試験方法。
  2. 前記第2のパスは,前記第1の制御部と前記第2の制御部との間での前記第1の制御部が備えるメモリから前記第2の制御部が備えるメモリへのデータ転送を用いた通信のパスである
    ことを特徴とする請求項1に記載の試験方法。
  3. 複数のパスにより接続された第1の制御部と第2の制御部とを備えた処理装置において,
    前記第1の制御部が,
    前記第2の制御部に対して,第1のパスを介して電源投入パケットを送信するパケット送信部と,
    前記電源投入パケットの送信によって前記第2の制御部の電源が投入されなかった場合に,互いに通信可能な前記第1の制御部が備える監視回路と前記第2の制御部が備える監視回路とを介して前記第2の制御部の電源制御回路を制御して電源を投入する電源投入制御部と,
    前記第2の制御部の電源投入の後に,第2のパスを介して前記第2の制御部に対して状態情報の取得要求メッセージを送信するメッセージ送信部とを備える
    ことを特徴とする処理装置。
JP2012216407A 2012-09-28 2012-09-28 試験方法および処理装置 Active JP6089543B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012216407A JP6089543B2 (ja) 2012-09-28 2012-09-28 試験方法および処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012216407A JP6089543B2 (ja) 2012-09-28 2012-09-28 試験方法および処理装置

Publications (2)

Publication Number Publication Date
JP2014071601A JP2014071601A (ja) 2014-04-21
JP6089543B2 true JP6089543B2 (ja) 2017-03-08

Family

ID=50746757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012216407A Active JP6089543B2 (ja) 2012-09-28 2012-09-28 試験方法および処理装置

Country Status (1)

Country Link
JP (1) JP6089543B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07226763A (ja) * 1994-02-15 1995-08-22 Hitachi Ltd リング型lanにおける自動復旧方法
JP2001184145A (ja) * 1999-12-27 2001-07-06 Id Gate Co Ltd 情報処理装置等のリモート電源管理システム

Also Published As

Publication number Publication date
JP2014071601A (ja) 2014-04-21

Similar Documents

Publication Publication Date Title
TWI578233B (zh) 統一韌體管理系統、非揮發電腦可讀取媒體以及統一韌體管理方法
TWI551997B (zh) 複數協定系統管理方法與系統以及電腦可讀媒體
CN105938450B (zh) 自动除错信息收集的方法及系统
US10055296B2 (en) System and method for selective BIOS restoration
US9182998B2 (en) Remote bios update in system having multiple computers
US9680712B2 (en) Hardware management and control of computer components through physical layout diagrams
US10789141B2 (en) Information processing device and information processing method
US9367510B2 (en) Backplane controller for handling two SES sidebands using one SMBUS controller and handler controls blinking of LEDs of drives installed on backplane
US8909910B2 (en) Computer system for selectively accessing bios by a baseboard management controller
US20140122753A1 (en) Electronic Device, Management Method Thereof, and Rack Serving System
TW201502772A (zh) 虛擬基板管理控制器
CN102880527B (zh) 一种基板管理控制器的数据恢复方法
CN114600088A (zh) 使用基板管理控制器的服务器状态监测系统和方法
JP4558519B2 (ja) 情報処理装置およびシステムバス制御方法
TWI512490B (zh) 擷取控制台訊息的系統及其方法及非暫態電腦可讀媒體
CN101373448B (zh) 具有远程管理的计算机系统
US20100042710A1 (en) Remote management of computer system
WO2025200599A1 (zh) 一种服务器及其硬盘监控方法、装置、设备和介质
JP2015114873A (ja) 情報処理装置および監視方法
US9009543B2 (en) Computer systems that acquire a plurality of statuses of non-normally operating hard disk drives
TW201201014A (en) Adapter and debug method using the same
US9749189B2 (en) Generating graphical diagram of physical layout of computer platforms
CN110769051B (zh) 基于国产处理器的嵌入式服务器远程管理系统及方法
JP2007025933A (ja) ストレージシステム及びそのファームウェア自動更新方法
CN120256373A (zh) 设备控制装置、方法、存储介质及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160510

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170123

R150 Certificate of patent or registration of utility model

Ref document number: 6089543

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150