JP6094070B2 - システムおよび異常箇所特定方法 - Google Patents
システムおよび異常箇所特定方法 Download PDFInfo
- Publication number
- JP6094070B2 JP6094070B2 JP2012147931A JP2012147931A JP6094070B2 JP 6094070 B2 JP6094070 B2 JP 6094070B2 JP 2012147931 A JP2012147931 A JP 2012147931A JP 2012147931 A JP2012147931 A JP 2012147931A JP 6094070 B2 JP6094070 B2 JP 6094070B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- svc
- level
- kill
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0727—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
図1は、実施例1に係るRAIDシステムのハードウェア構成を示す図である。図1に示すように、RAIDシステム9は、RAID装置1と、複数のSVC2、3と、コネクタ4とを有する。RAID装置1は、ハードディスク(HDD:Hard Disk Drive)を管理する。SVC2、3は、冗長化され、ここでは0系のSVC2と1系のSVC3とがコネクタ4を介して接続される。
次に、実施例1に係るRAIDシステム9において、OT_KILL_P信号の回路故障検出のシーケンスを、図2および図3を参照して説明する。図2および図3は、OT_KILL_P信号の回路故障検出のシーケンスを示す図である。なお、図2および図3では、SVC2をSVC#0とし、SVC3をSVC#1として説明するものとする。また、電圧がハイレベルであることを「HIGH」、電圧がローレベルであることを「LOW」と略記して記載するものとする。
次に、実施例1に係るRAIDシステム9において、OT_KILL_N信号の回路故障検出のシーケンスを、図4および図5を参照して説明する。図4および図5は、OT_KILL_N信号の回路故障検出のシーケンスを示す図である。なお、図4および図5では、SVC2をSVC#0とし、SVC3をSVC#1として説明するものとする。また、電圧がハイレベルであることを「HIGH」、電圧がローレベルであることを「LOW」と略記して記載するものとする。
上記実施例1によれば、SVC3では、状態レジスタ311が、SVC2から信号線41を用いて出力される信号の信号レベルを保持する。そして、SVC2では、故障検出部231が、信号線41に所定のレベルの信号を入力し、状態レジスタ311によって保持された信号の信号レベルが、入力したレベルと一致しない場合に、信号の特定のレベルに張り付く回路故障であることを検出する。かかる構成によれば、故障検出部231は、入力した信号レベルとの比較に、同じ信号線41を用いて出力される信号の信号レベルを利用することにより入力した信号レベルとの不一致を検出する。このため、故障検出部231は、信号線41に入力した信号レベルと異なるレベルに張り付くような信号の回路故障を容易に検出できる。
図6は、実施例2に係るRAIDシステムのハードウェア構成を示す図である。なお、図1に示すRAIDシステム9と同一の構成については同一符号を示すことで、その重複する構成および動作の説明については省略する。実施例1と実施例2とが異なるところは、FPGA21の信号線41にループバック状態レジスタ511とバッファ512を追加し、FPGA21の信号線42にループバック状態レジスタ513とバッファ514を追加した点にある。また、実施例1と実施例2とが異なるところは、SVC3のFPGA31に制御レジスタ515を追加した点にある。また、実施例1と実施例2とが異なるところは、MPU23に故障箇所特定部516を追加し、MPU33に故障箇所特定部517を追加した点にある。
次に、実施例2に係るRAIDシステム9Aにおいて、OT_KILL_P信号がハイレベル(以降、「HIGH」と略記)に張り付く回路故障時の故障箇所特定のシーケンスを、図7を参照して説明する。図7は、OT_KILL_P信号がHIGHに張り付く回路故障時の故障箇所特定のシーケンスを示す図である。なお、図7では、SVC2をSVC#0とし、SVC3をSVC#1として説明するものとする。また、SVC#0のSVCファームウェア23aは、OT_KILL_P信号のHIGHに張り付く回路故障を検出したとする。
次に、実施例2に係るRAIDシステム9Aにおいて、OT_KILL_N信号がハイレベル(以降、「HIGH」と略記)に張り付く回路故障時の故障箇所特定のシーケンスを、図8を参照して説明する。図8は、OT_KILL_N信号がHIGHに張り付く回路故障時の故障箇所特定のシーケンスを示す図である。なお、図8では、SVC2をSVC#0とし、SVC3をSVC#1として説明するものとする。また、SVC#0のSVCファームウェア23aは、OT_KILL_N信号のHIGHに張り付く回路故障を検出したとする。
次に、実施例2に係るRAIDシステム9Aにおいて、OT_KILL_P信号がローレベル(以降、「LOW」と略記)に張り付く回路故障時の故障箇所特定のシーケンスを、図9を参照して説明する。図9は、OT_KILL_P信号がLOWに張り付く回路故障時の故障箇所特定のシーケンスを示す図である。なお、図9では、SVC2をSVC#0とし、SVC3をSVC#1として説明するものとする。また、SVC#0のSVCファームウェア23aは、OT_KILL_P信号のLOWに張り付く回路故障を検出したとする。
次に、実施例2に係るRAIDシステム9Aにおいて、OT_KILL_N信号がローレベル(以降、「LOW」と略記)に張り付く回路故障時の故障箇所特定のシーケンスを、図10を参照して説明する。図10は、OT_KILL_N信号がLOWに張り付く回路故障時の故障箇所特定のシーケンスを示す図である。なお、図10では、SVC2をSVC#0とし、SVC3をSVC#1として説明するものとする。また、SVC#0のSVCファームウェア23aは、OT_KILL_N信号のLOWに張り付く回路故障を検出したとする。
上記実施例2によれば、SVC3は、信号線41を流れる信号について、状態レジスタ311に向けての出力をオン/オフするバススイッチ32をさらに有する。そして、SVC2は、信号の信号レベルに張り付く異常であることが検出された場合、バススイッチ32をオフ(切断状態)にする。そして、SVC2は、状態レジスタ311に保持された信号レベルまたはループバック状態レジスタ511に保持された信号レベルを用いて、SVC2およびSVC3のいずれが異常であるのかを特定する。かかる構成によれば、SVC2は、信号の信号レベルに張り付く異常であることが検出された場合に、SVC2およびSVC3のいずれが異常であるのかを特定するので、交換するべきSVCを決定でき、円滑にシステムを運用することが可能となる。
なお、実施例1、2では、RAIDシステム9、9Aが、信号線41、42を対象に、特定の信号レベルに張り付く回路故障を検出し、検出した回路故障の故障箇所を特定した。しかしながら、かかるシステムは、RAIDシステムに限定されず、冗長化された装置間で信号線を用いて相互に通信するシステムであれば良い。
前記第1の装置は、
前記第2の装置から前記信号線を用いて出力される信号の信号レベルを保持する保持部を有し、
前記第2の装置は、
前記信号線に所定のレベルの信号を入力し、前記保持部によって保持された信号の信号レベルが、入力したレベルと一致しない場合に、信号のレベルが特定のレベルから変化しない異常であることを検出する検出部を有する
ことを特徴とするシステム。
前記信号線を流れる信号について、前記保持部に向けての出力をオン/オフするスイッチをさらに有し、
前記第2の装置は、
前記信号線に入力された信号の信号レベルをループバックさせて保持するループバック保持部と、
前記検出部によって信号の信号レベルからレベルが変化しない異常であることが検出された場合、前記スイッチをオフしたうえで、前記保持部に保持された信号レベルまたは前記ループバック保持部に保持された信号レベルを用いて、前記第1の装置および前記第2の装置のいずれが異常であるのかを特定する異常特定部をさらに有する
ことを特徴とする付記1に記載のシステム。
ことを特徴とする付記2に記載のシステム。
ことを特徴とする付記2に記載のシステム。
前記第2の装置が、前記信号線に所定のレベルの信号を入力し、
前記第1の装置が、該入力した信号を前記第2の装置から前記信号線を用いて出力される信号の信号レベルを保持し、
前記第2の装置が、該保持する処理によって保持された信号の信号レベルが、入力したレベルと一致しない場合に、信号のレベルが特定のレベルから変化しない異常を検出する
各処理を実行することを特徴とする異常箇所特定方法。
2、3 SVC
9、9A RAIDシステム
21、31 FPGA
22、32 バススイッチ
23、33 MPU
231 故障検出部
23a、33a SVCファームウェア
211、213 制御レジスタ
212、214 バッファ
311、312 状態レジスタ
41〜44 信号線
511、513 ループバック状態レジスタ
512、514 バッファ
515 制御レジスタ
516、517 故障箇所特定部
Claims (4)
- 信号線を用いて相互に通信する第1の装置および第2の装置を有するシステムにおいて、
前記第1の装置は、
前記信号線を流れる信号の出力をオン/オフするスイッチと、
前記第2の装置から前記信号線を用いて出力される信号の信号レベルを保持し、前記第2の装置の指示により、前記スイッチがオフされると、グラウンドと接続される保持部と、
前記第2の装置の要求により、前記保持部によって保持された信号レベルを前記第2の装置に通知する通知部と、
を有し、
前記第2の装置は、
前記信号線に特定のレベルの信号を入力する入力部と、
前記入力部によって前記信号線に入力された信号の信号レベルをループバックさせて保持するループバック保持部と、
前記入力部によって入力された信号の信号レベルの通知を要求する要求部と、
前記第1の装置から通知された信号レベルが、前記入力部によって入力された特定のレベルと一致しない場合に、信号レベルが前記特定のレベルと異なるレベルから変化しない異常であることを検出する検出部と、
前記検出部によって信号の信号レベルからレベルが変化しない異常であることが検出された場合、前記スイッチをオフするように指示する指示部と、
前記第1の装置から通知された信号レベルおよび変化しない信号レベル、または前記ループバック保持部に保持された信号レベルおよび変化しない信号レベルを用いて、前記第1の装置および前記第2の装置のいずれが異常であるのかを特定する異常特定部と、
を有することを特徴とするシステム。 - 前記保持部は、前記スイッチがオフされると、グラウンドと接続され、
前記異常特定部は、前記検出部によって信号のハイレベルからレベルが変化しない異常が検出された場合、前記スイッチをオフしたうえで、前記保持部によって保持された信号の信号レベルがハイレベルである場合、前記第1の装置が異常であることを特定し、前記保持部によって保持された信号の信号レベルがローレベルである場合、前記第2の装置が異常であることを特定する
ことを特徴とする請求項1に記載のシステム。 - 前記保持部は、前記スイッチがオフされると、グラウンドと接続され、
前記異常特定部は、前記検出部によって信号のローレベルからレベルが変化しない異常が検出された場合、前記信号線にハイレベルの信号を入力し、前記スイッチをオフしたうえで、前記ループバック保持部によって保持された信号の信号レベルが入力した信号レベルと一致しない場合、前記第2の装置が異常であることを特定し、前記ループバック保持部によって保持された信号の信号レベルが入力した信号レベルと一致する場合、前記第1の装置が異常であることを特定する
ことを特徴とする請求項1に記載のシステム。 - 信号線を用いて相互に通信する第1の装置および第2の装置を有するシステムの異常箇所特定方法において、
前記第2の装置が、
前記信号線に特定のレベルの信号を入力し、
前記信号線に入力された信号の信号レベルをループバックさせて第2の記憶部に保持し、
該入力された信号の信号レベルの通知を前記第1の装置に要求し、
前記第1の装置が、
第1の記憶部に向けての出力をオン/オフするスイッチがオンである場合に、該入力された信号を前記第2の装置から前記信号線を用いて出力される信号の信号レベルを前記第1の記憶部に保持し、
前記第2の装置の要求により、前記第1の記憶部に保持された信号レベルを前記第2の装置に通知し、
前記第2の装置が、
前記第1の装置から通知された信号レベルが、該入力された信号の特定のレベルと一致しない場合に、信号レベルが前記特定のレベルと異なるレベルから変化しない異常であることを検出し、前記スイッチをオフするように指示し、
前記第1の装置が、
前記第2の装置の指示により、前記スイッチをオフし、前記第1の記憶部をグラウンドと接続し、
前記第2の装置の要求により、前記第1の記憶部に保持された信号レベルを前記第2の装置に通知し、
前記第2の装置が、
前記第1の装置から通知された信号レベルおよび変化しない信号レベル、または前記第2の記憶部に保持された信号レベルおよび変化しない信号レベルを用いて、前記第1の装置および前記第2の装置のいずれが異常であるのかを特定する
各処理を実行することを特徴とする異常箇所特定方法。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012147931A JP6094070B2 (ja) | 2012-06-29 | 2012-06-29 | システムおよび異常箇所特定方法 |
| US13/929,187 US9086963B2 (en) | 2012-06-29 | 2013-06-27 | System and defect position specifying method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012147931A JP6094070B2 (ja) | 2012-06-29 | 2012-06-29 | システムおよび異常箇所特定方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2014010714A JP2014010714A (ja) | 2014-01-20 |
| JP6094070B2 true JP6094070B2 (ja) | 2017-03-15 |
Family
ID=49779553
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012147931A Expired - Fee Related JP6094070B2 (ja) | 2012-06-29 | 2012-06-29 | システムおよび異常箇所特定方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US9086963B2 (ja) |
| JP (1) | JP6094070B2 (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6221674B2 (ja) * | 2013-11-19 | 2017-11-01 | 富士通株式会社 | 情報処理装置,制御装置及び制御方法 |
| JP6307847B2 (ja) * | 2013-11-19 | 2018-04-11 | 富士通株式会社 | 情報処理装置,制御装置及び制御プログラム |
| CN106201759B (zh) * | 2016-07-14 | 2023-08-01 | 浙江众合科技股份有限公司 | 一种防止fpga寄存器粘连的检测系统及方法 |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01209555A (ja) * | 1988-02-17 | 1989-08-23 | Fuji Electric Co Ltd | バスチェック装置 |
| JPH0425955A (ja) * | 1990-05-22 | 1992-01-29 | Nec Corp | バスインタフェース診断装置 |
| JPH11143783A (ja) | 1997-11-07 | 1999-05-28 | Hitachi Ltd | コンピュータシステムの二重化メモリ診断方法 |
| JP2001005743A (ja) * | 1999-06-17 | 2001-01-12 | Toyo Commun Equip Co Ltd | 伝送装置 |
| JP4707803B2 (ja) * | 2000-07-10 | 2011-06-22 | エルピーダメモリ株式会社 | エラーレート判定方法と半導体集積回路装置 |
| EP1394559A1 (de) * | 2002-08-27 | 2004-03-03 | Siemens Aktiengesellschaft | Verfahren und Anordnung zur Erkennung und Behebung von Leitungsdefekten |
| US8065481B1 (en) * | 2004-04-20 | 2011-11-22 | Seagate Technology Llc | RAID system and method compatible with improved drive select |
| JP2006139634A (ja) * | 2004-11-15 | 2006-06-01 | Hitachi Ltd | 設備管理装置、通信路診断装置及び設備管理方法 |
| JP2007011682A (ja) * | 2005-06-30 | 2007-01-18 | Hitachi Ltd | 記憶制御装置及び記憶制御装置のパス切替方法 |
-
2012
- 2012-06-29 JP JP2012147931A patent/JP6094070B2/ja not_active Expired - Fee Related
-
2013
- 2013-06-27 US US13/929,187 patent/US9086963B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2014010714A (ja) | 2014-01-20 |
| US9086963B2 (en) | 2015-07-21 |
| US20140006873A1 (en) | 2014-01-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7421615B2 (en) | Apparatus, method and system for selectively coupling a LAN controller to a platform management controller | |
| US20050086544A1 (en) | Method and apparatus for correlating system resources to a particular line cord | |
| JP5296878B2 (ja) | 1つまたは複数の交換ユニットのテストを管理するために1つまたは複数の交換可能ユニットを含むコンピュータ化ストレージ・システムで使用するための方法、装置、およびプログラム(交換ユニットのテストを管理するために交換可能ユニットを含むコンピュータ化ストレージ・システム) | |
| US20040039981A1 (en) | Method and apparatus for identifying one or more devices having faults in a communication loop | |
| US7890810B1 (en) | Method and apparatus for deterministic fault injection of storage shelves in a storage subsystem | |
| US12038818B2 (en) | Device and method for verifying a component of a storage device | |
| JP6094070B2 (ja) | システムおよび異常箇所特定方法 | |
| CN113992501A (zh) | 一种故障定位系统、方法及计算装置 | |
| EP2784677A1 (en) | Processing apparatus, program and method for logically separating an abnormal device based on abnormality count and a threshold | |
| CN103176581B (zh) | 电源管理装置及电源管理方法 | |
| CN110469529B (zh) | 服务器风扇控制系统 | |
| US20150098317A1 (en) | Linear protection switching method and apparatus for protecting network segmented into multi-domain | |
| US7436291B2 (en) | Protection of devices in a redundant configuration | |
| KR102018225B1 (ko) | 연결 방법 | |
| JP5104773B2 (ja) | データ転送システム、データ転送装置およびデータ転送方法 | |
| JP6285123B2 (ja) | 電源監視装置、電源装置、情報処理システム及び電源監視方法 | |
| JP2007274153A (ja) | ファイバチャネルスイッチにおける障害装置の切り離し方法 | |
| US7558192B1 (en) | Method to increase system availability of critical hardware components | |
| JP6361202B2 (ja) | 情報処理装置、診断方法、及び、プログラム | |
| JP2014164488A (ja) | 制御装置、制御方法、及び制御プログラム | |
| JP2002319927A (ja) | 伝送路切替装置及び伝送システム | |
| JP2018147510A (ja) | サーバ装置およびサーバシステム | |
| JP2015148973A (ja) | 監視デバイス、管理デバイス、電子装置、状態通知方法、対処方法、およびコンピュータ・プログラム | |
| EP4631226A1 (en) | Smart online link repair and job scheduling in machine learning supercomputers | |
| CN119270041A (zh) | 传输接口电路的故障检测方法以及传输接口电路 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150319 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160316 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160322 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160518 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161011 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161212 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170117 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170130 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6094070 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |