JP6686459B2 - 診断装置、診断方法および診断プログラム - Google Patents

診断装置、診断方法および診断プログラム Download PDF

Info

Publication number
JP6686459B2
JP6686459B2 JP2016007965A JP2016007965A JP6686459B2 JP 6686459 B2 JP6686459 B2 JP 6686459B2 JP 2016007965 A JP2016007965 A JP 2016007965A JP 2016007965 A JP2016007965 A JP 2016007965A JP 6686459 B2 JP6686459 B2 JP 6686459B2
Authority
JP
Japan
Prior art keywords
diagnostic
information
data transmission
diagnosis
cable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016007965A
Other languages
English (en)
Other versions
JP2017129969A (ja
Inventor
小川 純一
純一 小川
宰 金城
宰 金城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2016007965A priority Critical patent/JP6686459B2/ja
Priority to US15/358,180 priority patent/US10142169B2/en
Publication of JP2017129969A publication Critical patent/JP2017129969A/ja
Application granted granted Critical
Publication of JP6686459B2 publication Critical patent/JP6686459B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

本発明は、診断装置、診断方法および診断プログラムに関する。
ストレージシステムにおいて、ディスクコントローラとディスクエンクロージャとをケーブルによって接続することで構成されるものが知られている。
例えば、ディスクコントローラに形成されたメス・コネクタに、ケーブルの一端に形成されたオス・コネクタを挿入し、ディスクエンクロージャに形成されたメス・コネクタに、ケーブルの他端に形成されたオス・コネクタを挿入することで、ディスクコントローラとディスクエンクロージャとがケーブルを介して接続される。
このような従来のストレージシステムにおいては、コネクタの挿抜等によるケーブルの破損や、ケーブルの経時劣化に伴う伝送信号品質劣化が生じ、ケーブルを原因とする故障(以下、ケーブル故障という)が生じる場合がある。
特表2009−540436号公報 特開2004−207878号公報
従来のストレージシステムにおいては、ケーブル故障の発生をデータの転送異常を検出することで判断しており、業務等のシステムの運用に影響を与えることなく経路診断を行なうことができないという課題がある。
1つの側面では、本発明は、システム運用に影響を与えることなく経路診断を行なうことができるようにすることを目的とする。
このため、この診断装置は、診断対象経路上の送受信デバイスからデータ伝送路の特性によって設定されるデータ伝送変数を採取する採取部と、採取された前記データ伝送変数に基づき、データ伝送変数の値と良否判定情報とを対応付けて構成された診断基準情報を参照することで、前記診断対象経路の診断を行なう診断部と、前記送受信デバイスに接続されている通信ケーブルに関するケーブル情報を取得する取得部と、記憶装置に格納された複数の診断基準情報の中から、前記取得部によって取得された前記ケーブル情報に対応する診断基準情報を選択する選択部とを備え、前記診断部が、前記選択部によって選択された前記診断基準情報を用いて前記診断対象経路の診断を行なう
一実施形態によれば、システム運用に影響を与えることなく経路診断を行なうことができる。
実施形態の一例としてのストレージシステムの構成を模式的に示す図である。 実施形態の一例としてのストレージシステムのコントローラおよびIOモジュールのハードウェア構成を示す図である。 実施形態の一例としてのストレージシステムのコントローラおよびIOモジュールの機能構成図である。 実施形態の一例としてのストレージシステムにおいて用いられる診断基準情報を例示する図である。 実施形態の一例としてのストレージシステムのエキスパンダチップにおける通信ケーブルのケーブル情報の取得処理を説明するフローチャートである。 実施形態の一例としてのストレージシステムの診断情報採取部による診断情報採取処理を説明するためのフローチャートである。 実施形態の一例としてのストレージシステムの診断部による経路診断処理を説明するためのフローチャートである。 実施形態の一例としてのストレージシステムにおける診断情報採取処理および経路診断処理の実行タイミングを示すフローチャートである。
以下、図面を参照して本診断装置、診断方法および診断プログラムに係る実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。又、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。
(A)構成
図1は実施形態の一例としてのストレージシステム1の構成を模式的に示す図、図2はそのコントローラ10およびIO(Input Output)モジュール20のハードウェア構成を示す図、図3はその機能構成図である。
図1に示すように、ストレージシステム1は、1つ以上(図1に示す例では2つ)のコントローラ10−1,10−2,1つ以上(図1に示す例では4つ)のIOモジュール20−1〜20−4および1つ以上(図1に示す例では2つ)の記憶装置30を備える。
以下、コントローラを示す符号としては、複数のコントローラのうち1つを特定する必要があるときには符号10−1,10−2を用いるが、任意のコントローラを指すときには符号10を用いる。
同様に、以下、IOモジュールを示す符号としては、複数のIOモジュールのうち1つを特定する必要があるときには符号20−1,20−2,20−3,20−4を用いるが、任意のIOモジュールを指すときには符号20を用いる。
本ストレージシステム1は、記憶装置30を仮想化して、仮想ストレージ環境を形成する。そしてストレージシステム1は、仮想ボリュームを上位装置であるホスト装置(図示省略)に提供する。
そして、本ストレージシステム1は、ホスト装置からボリュームに対して行なわれる入出力要求(例えば、リードコマンドやライトコマンド)に応じて、このボリュームに対応する記憶装置30に対して、データの読み出しや書き込み等の処理を行なう。なお、ホスト装置からの入出力要求のことをIOコマンドもしくはIO要求という場合がある。
記憶装置30は、ハードディスクドライブ(Hard Disk Drive:HDD)、SSD(Solid State Drive)等の記憶装置であって、種々のデータを格納するものである。なお、複数の記憶装置30を用いてRAID(Redundant Arrays of Inexpensive Disks)を構成してもよい。
コントローラ10−1はIOモジュール20−1に接続され、このIOモジュール20−1はIOモジュール20−2に接続されている。また、IOモジュール20−2は2つの記憶装置30のそれぞれに接続されている。すなわち、コントローラ10−1はIOモジュール20−1,20−2および記憶装置30とカスケード接続(多段接続)されている。
同様に、コントローラ10−2はIOモジュール20−3に接続され、このIOモジュール20−3はIOモジュール20−4に接続されている。また、IOモジュール20−4は2つのHDD30のそれぞれに接続されている。すなわち、コントローラ10−2はIOモジュール20−3,20−4およびHDD30とカスケード接続されている。
コントローラ10−1,10−2は互いに同様の構成を有している。
各コントローラ10はエキスパンダチップ14aを備える一方、各IOモジュール20はエキスパンダチップ14bをそれぞれ備え、これらのエキスパンダチップ14aとエキスパンダチップ14bとの間およびエキスパンダチップ14bとエキスパンダチップ14bとの間は、それぞれ通信ケーブル40を介して接続されている。
通信ケーブル40は、例えば、SAS(Serial Attached Small computer system interface)の規格に従って作成されたSAS通信ケーブルである。
通信ケーブル40の両端に形成された図示しないコネクタには、それぞれ同一のケーブル情報が格納されたROM(Read Only Memory)が搭載されている(図示省略)。コントローラ10やIOモジュール20は、このROMから通信ケーブル40のケーブル情報を読み出して確認することができる。
通信ケーブル40のケーブル情報は、様々な種類の通信ケーブルにおいて、同一の機能、仕様の部品型格の中で、個体識別を行なうための識別情報として用いられる固有情報である。ケーブル情報は、通信ケーブル40のケーブル長や太さ,種類,仕様等の伝送特性を特定できる情報(仕様情報,種別情報;固有情報)である。ケーブル情報としては、例えば、シリアルナンバーが用いられる。ケーブル情報を固有情報またはシリアルナンバーと表現してもよい。
(A−1)コントローラ
コントローラ10は、ストレージシステム1内の動作を制御する制御装置(ストレージ制御装置,情報処理装置)であり、図示しないホスト装置から送信されるIOコマンドに従って、記憶装置30のデータアクセス制御等、各種制御を行なう。
コントローラ10は、1つ以上(図1に示す例では2つ)のIOモジュール20を介して記憶装置30とデータの送受信を行なう。従って、コントローラ10はIOモジュール20との間でデータの送受信を行なう。
そして、コントローラ10は、IOモジュール20との間でデータの送受信を行なうデータ伝送路(診断対象経路)を診断する診断機能を備える。すなわち、コントローラ10は、診断対象経路を診断する診断装置として機能する。
図中、同一の符号は同一もしくは略同一の部分を示しているので、以下、その詳細な説明は省略する。
コントローラ10は、図2に示すように、MPU(Micro-processor Unit)11a,メモリ12a,不揮発性メモリ13aおよびエキスパンダチップ14aを備える。
メモリ12aはROM及びRAMを含む記憶メモリである。メモリ12aのROMには、例えば、ストレージ制御やデータ送受信制御に係るソフトウェアプログラムやこのプログラム用のデータ類が書き込まれている。また、ROMにはデータ伝送路の診断機能に係るソフトウェアプログラム(診断プログラム)やこのプログラム用のデータ類も書き込まれている。
メモリ12a上のソフトウェアプログラムは、後述するMPU11aに適宜読み込まれて実行される。又、メモリ12aのRAMは、種々のデータやプログラムを一時的に格納する記憶装置であり、図示しないメモリ領域とキャッシュ領域とをそなえる。キャッシュ領域は、ホスト装置から受信したデータや、ホスト装置に対して送信するデータを一時的に格納する。メモリ領域には、MPU11aがプログラムを実行する際に、データやプログラムを一時的に格納・展開して用いる。
また、RAMには、後述する診断情報採取部113が採取したイコライザ変数の値がイコライザ値121として格納される。
不揮発性メモリ13aは、MPU11aが実行するプログラムや種々のデータ等を格納する記憶装置である。不揮発性メモリ13aには、後述する診断基準情報122が格納されている。
エキスパンダチップ(EXE)14aは、コントローラ10とIOモジュール20とを中継する中継装置であり、ホストIOに基づくデータ転送を行なう。
例えば、エキスパンダチップ14aはSASの規格に従ってデータの送受信を行なう。
エキスパンダチップ14aは、図2に示すように、送受信デバイス16aおよびレジスタ15aを備える。
送受信デバイス16aには、図示しないコネクタに挿入された通信ケーブル40が接続される。送受信デバイス16aは、この通信ケーブル40を介してデータの送受信を行なうものであり、送信(TX)イコライザ17aと受信(RX)イコライザ18aとを備える回路装置として構成される。
本実施形態において、送信イコライザ17aは、例えば、タップ数が3(3tap)のFIR(Finite Impulse Responce)型のデジタルフィルタ(FIRフィルタ)である。
また、受信イコライザ18aは、タップ数n(n-tap)のFIRフィルタである。
コントローラ10は、IOモジュール20に対して、エキスパンダチップ14aを介してアクセスする。コントローラ10に対して、1つ以上のIOモジュール20がこのエキスパンダチップ14aを介して数珠つなぎに接続される。
エキスパンダチップ14aは、コネクタに接続された通信ケーブル40のROMからケーブル情報を読み出す機能を有する。また、エキスパンダチップ14aは、この読み出した通信ケーブル40の固有情報(ケーブル情報)を、後述するMPU11a(ケーブル情報取得部111)に通知する。
例えば、エキスパンダチップ14aは、MPU11aからケーブル情報の送信要求を受信すると、通信ケーブル40のROMから読み出したケーブル情報を、当該コネクタを識別する情報とともに、MPU11aに送信する。なお、エキスパンダチップ14aは、通信ケーブル40のROMから読み出したケーブル情報をレジスタ15a等の記憶装置に格納し、MPU11aからこのケーブル情報を読み出し可能な状態に設定することで、MPU11aにケーブル情報を通知してもよい。
すなわち、エキスパンダチップ14aは、後述するMPU11a(ケーブル情報取得部111)に通信ケーブル40のケーブル情報を通知するケーブル情報通知部141としての機能を有する。
また、エキスパンダチップ14aは、送受信デバイス16aの送信イコライザ17aの変数(イコライザ変数)を、データ伝送路の特性に応じて設定する機能を有する。以下、イコライザ変数の値をイコライザ値という場合がある。また、イコライザ変数を設定する処理を、送信イコライザの変数決定処理という場合がある。イコライザ値は、データ伝送路の特性によって設定されるデータ伝送変数に相当する。
送信イコライザの変数決定処理は、送受信デバイス16aのリンク初期化処理において決定される。リンク初期化処理は、例えば、装置の電源投入時や通信ケーブル40の抜挿時に行なわれる。
以下、送信イコライザの変数決定処理を、リンクトレーニングもしくはイコライザトレーニングという場合がある。
リンクトレーニングは、コントローラ10の送受信デバイス16aと通信先のIOモジュール20の送受信デバイス16bとの間で波形を相互に送信することにより行なわれる。受信側の送受信デバイス16a(16b)は受信した波形形状に応じて、送信側の送受信デバイス16b(16a)へ、波形形状を変化するよう送信イコライザ変数の値の増減を指示する。
これを一定時間継続して実行することで、最終的に送受信デバイス16a,16bの伝送路特性に応じて送信側イコライザ変数が決定される。これにより、送受信デバイス16a,16b間の通信経路において、一定の波形品質を維持した状態での通信が実現される。
なお、受信側の送受信デバイス16a,16bの受信イコライザ18a,18bのイコライザ変数は、受信するデータパターンに応じて決定され、データIO中に常時変動する。
リンクトレーニングにより設定されたイコライザ変数は、エキスパンダチップ14aに備えられたレジスタ15aに格納される。
上述したエキスパンダチップ14aにおけるリンクトレーニングは、既知の手法で実行することができ、その詳細な説明は省略する。
また、エキスパンダチップ14aは、後述するMPU11aの診断情報採取部113からリンクトレーニングの実行指示(トレーニング指示)を受信した場合にもリンクトレーニングを行なう。診断情報採取部113からの指示でリンクトレーニングを行なったエキスパンダチップ14aは、リンクトレーニングにより設定されたイコライザ変数をMPU11a(診断情報採取部113)に応答する。
このように、エキスパンダチップ14aは、送受信デバイス16aの伝送特性に応じたイコライザ変数(データ伝送変数)を設定するデータ伝送変数設定部142としての機能を有する。
MPU11aは、コントローラ10全体を制御する処理装置である。MPU11aは、マルチプロセッサであってもよい。MPU11aに代えて、処理装置として、例えばCPU(Central Processing Unit),DSP(Digital Signal Processor),ASIC(Application Specific Integrated Circuit),PLD(Programmable Logic Device),FPGA(Field Programmable Gate Array)のいずれか一つであってもよい。また、MPU11aに代えて、CPU,MPU,DSP,ASIC,PLD,FPGAのうちの2種類以上の要素の組み合わせであってもよい。
MPU11aは、不揮発性メモリ13aやメモリ12a等に格納されたOSやプログラムを実行することにより、種々の機能を実現する。
MPU11aは、診断プログラムを実行することで、図3に示すように、ケーブル情報取得部111,診断基準選択部112,診断情報採取部113および診断部114として機能する。
ケーブル情報取得部111は、接続された通信ケーブル40の固有情報(ケーブル情報)を取得する。例えば、ケーブル情報取得部111は、エキスパンダチップ14aに対して、接続された通信ケーブル40のケーブル情報を送信するよう要求する。ケーブル情報取得部111は、この送信要求に対してエキスパンダチップ14aから応答されたケーブル情報をメモリ12a等の所定の領域に格納する。
なお、ケーブル情報取得部111は、エキスパンダチップ14aのレジスタ15aの値を直接もしくは間接に読み出すことで通信ケーブル40のケーブル情報を取得してもよく、適宜変形して実施することができる。
診断基準選択部112は、ケーブル情報取得部111によって取得された通信ケーブル40のケーブル情報に基づき、不揮発性メモリ13a等に格納された複数の診断基準情報122の中から、当該通信ケーブル40に対応する診断基準情報122を選択する。
図4は実施形態の一例としてのストレージシステム1において用いられる診断基準情報122を例示する図である。
診断基準情報122は、図4に示すように、2つのイコライザ変数の値を組合せたマトリクス状の各位置に対して“正常状態”,“予防交換要”および“交換要”の3つ種類の状態のうち、いずれかの状態(良否状態情報)を対応付けて構成されている。
上述の如く、本実施形態においては、送信イコライザ17aは、タップ数が3のFIR型のデジタルフィルタであり、3つの変数(V1,V2,V3)の内2つの独立変数(V1,V3)によりイコライザ特性が決定される。
すなわち、図4に例示するように、変数V1,V2,V3のうち、変数V1,V3の組み合わせにより、“正常状態”,“予防交換要”および“交換要”の3つ種類の状態のうち、いずれかの状態(良否状態情報)が表される。これらの状態が診断対象経路の状態を表す。
なお、図4に示す例においては、|V1|+|V2|+|V3|=64,V1≦0,V2≧0,V3≦0であるものとする。
ここで、“正常状態”とは正常な状態であり、保守作業が不要な状態である(良状態)。“交換要”は、何らかの異常が発生しており、保守作業が必要な状態である(故障状態)。“予防交換要”は、異常は発生していないが、経験則により近い将来に故障が発生するおそれがあると判断される(故障予兆)状態である(故障予兆状態)。従って、この“予防交換要”においては、予防保守の観点から、保守作業を行なうことが望ましいと考えられる状態である。
このように、診断基準情報122は、送信イコライザ17aのイコライザ変数V1,V3の組み合わせに対応する各座標位置に、良否判定(良,故障,故障予兆状態)を表すいずれかの情報を規定することにより構成されている。
そして、診断部114は、診断基準情報122において、エキスパンダチップ14aから取得した2つのイコライザ変数V1,V3の組み合わせに対応する位置に設定されている良否状態情報を取得することで、経路診断を行なう。
例えば、図4に示す例において、V1=6,V3=6の場合には良状態であると判断され、V1=3,V3=2の場合には故障予兆状態であると判断される。また、V1=1,V3=0の場合には故障状態であると判断される。
診断基準情報122におけるこれらの良否状態情報は、例えば経験則によって設定されることが望ましい。
また、診断基準情報122は、予め通信ケーブル40の種類毎に用意される。すなわち、不揮発性メモリ13aには、本ストレージシステム1において用いられる可能性がある複数種類の通信ケーブル40のケーブル情報にそれぞれ対応させて複数種類の診断基準情報122が格納されている。
診断基準情報122は、ケーブル情報取得部111によって取得されたケーブル情報に基づいて、不揮発性メモリ13aに格納された複数種類の診断基準情報122の中から、このケーブル情報に対応する診断基準情報122を選択する。
診断情報採取部113は、エキスパンダチップ14aから送信イコライザ17aおよび受信イコライザ18aの各イコライザ変数(イコライザ値)を採取する。
例えば、診断情報採取部113は、エキスパンダチップ14aに対してリンクトレーニングの実行指示を送信する。エキスパンダチップ14aは、このリンクトレーニングの実行指示に従って行なったリンクトレーニングにより設定されたイコライザ変数を診断情報採取部113に応答する。
診断情報採取部113は、エキスパンダチップ14aから採取したイコライザ変数の値を、メモリ12aにイコライザ値121として格納する。
なお、以下、診断情報採取部113がエキスパンダチップ14aから送信イコライザ17aおよび受信イコライザ18aの各イコライザ変数(イコライザ値)を採取することを、診断情報採取処理という場合がある。
診断部114は、診断情報採取部113によってエキスパンダチップ14aから採取されたイコライザ値121(イコライザ変数V1,V3)を用いて、前述した診断基準選択部112によって選択された診断基準情報122を参照する。そして、採取されたイコライザ変数V1,V3の組み合わせが、“正常状態”,“予防交換要”および“交換要”の3つ種類の状態のうち、いずれかの状態に該当するかを判定する。すなわち、診断部114は、診断対象経路を診断する経路診断処理を行なう。
この判定結果は、例えば、図示しない表示装置等に出力される。例えば、判定結果が
“正常状態”である場合には、正常である旨の通知がオペレータに対して行なわれる。
また、判定結果が“交換要”である場合には、故障が発生し保守作業が必要である旨の通知がオペレータに対して行なわれる。この際、故障部位の特定を行ない、特定された故障発生部位を併せて通知することが望ましい。なお、故障部位の特定は既知の種々の手法で実現することができ、その説明は省略する。
判定結果が“予防交換要”である場合には、故障が発生する可能性が高く保守作業を行うことが望ましい旨の通知(故障予兆通知)がオペレータに対して行なわれる。この際、故障が発生する可能性が高い部位の特定を行ない、特定された故障発生予想部位を併せて通知することが望ましい。なお、故障予測部位の特定は既知の種々の手法で実現するこができ、その説明は省略する。
また、オペレータへの各種通知は、例えば、図示しない表示装置にメッセージを表示したり、通知内容に対応する各種音声を出力すること等により行なわれる。
以下、診断部114がイコライザ値121を用いて診断基準情報122を参照し、採取されたイコライザ変数V1,V3の組み合わせが、“正常状態”,“予防交換要”および“交換要”の3つ種類の状態のうち、いずれかの状態に該当するか判定することを、経路診断処理という場合がある。
(A−2)IOモジュール
IOモジュール20は、外部装置を接続して機能拡張を行なうための装置であり、例えば、ストレージ装置やIO機器を内部に搭載するデバイスエンクロージャである。IOモジュール20は、コントローラ10や他のIOモジュール20と通信ケーブル40を介して接続され、これらのコントローラ10や他のIOモジュール20との間でデータの送受信を行なう。
IOモジュール20−1〜20−4は互いに同様の構成を有している。
IOモジュール20は、図1に示すように、MPU11b,メモリ12b,不揮発性メモリ13bおよびエキスパンダチップ14bを備える。
これらのMPU11b,メモリ12b,不揮発性メモリ13bおよびエキスパンダチップ14bは、それぞれコントローラ10のMPU11a,メモリ12a,不揮発性メモリ13aおよびエキスパンダチップ14aと同様の構成を備える。
すなわち、例えば、不揮発性メモリ13bには、不揮発性メモリ13aと同様に診断基準情報122が格納される。
また、エキスパンダチップ14bは、図2に示すように、送受信デバイス16bおよびレジスタ15bを備える。これらの送受信デバイス16bおよびレジスタ15bは、コントローラ10のエキスパンダチップ14aに備えられる送受信デバイス16aおよびレジスタ15aと同様の機能を有する。
すなわち、エキスパンダチップ14aは、リンクトレーニングを実現する機能等を有する他、ケーブル情報通知部141およびデータ伝送変数設定部142としての機能を有する。
また、メモリ12bには、イコライザ値121が格納され、不揮発性メモリ13bには、本ストレージシステム1において用いられる可能性がある複数種類の通信ケーブル40のケーブル情報にそれぞれ対応させて複数種類の診断基準情報122が格納されている。
さらに、MPU11bは、MPU11aと同様に、制御プログラムを実行することで、図3に示すように、ケーブル情報取得部111,診断基準選択部112,診断情報採取部113および診断部114として機能する。
(B)動作
以下においては、コントローラ10においてIOモジュール20との通信経路に対して経路診断処理を行なう例について示す。
先ず、上述の如く構成された実施形態の一例としてのストレージシステム1のエキスパンダチップ14における通信ケーブル40のケーブル情報の取得処理を、図5に示すフローチャート(ステップA1〜A3)に従って説明する。
本処理は、例えば、装置DC−ONによる電源投入や、通信ケーブル40の交換処理に伴う通信ケーブル40のコネクタの抜挿をきっかけに開始される。
ステップA1において、エキスパンダチップ14は送受信デバイス16のコネクタに通信ケーブル40のコネクタが挿入された状態を検出する。
ステップA2において、エキスパンダチップ14は通信ケーブル40のROMからケーブル情報(シリアルナンバー)を読み出すことで取得する。
ステップA3において、エキスパンダチップ14(ケーブル情報通知部141)は、コントローラ10(ケーブル情報取得部111)に、通信ケーブル40のケーブル情報を通知し、処理を終了する。
次に、実施形態の一例としてのストレージシステム1の診断情報採取部113によるイコライザ変数の採取処理(診断情報採取処理)を、図6に示すフローチャート(ステップB1〜B4)に従って説明する。
ステップB1において、診断情報採取部113は、エキスパンダチップ14(データ伝送変数設定部142)に対してリンクトレーニングの実行指示を送信する。
ステップB2において、エキスパンダチップ14(データ伝送変数設定部142)は、リンクトレーニングを行なう。リンクトレーニングにおいて、送信イコライザ17および受信イコライザ18のイコライザ変数を初期化した後、コントローラ10の送受信デバイス16aと通信先のIOモジュール20の送受信デバイス16bとの間で波形を相互に送信することにより、伝送路特性に応じて送信側イコライザ変数が決定される。
ステップB3において、コントローラ10(診断情報採取部113)は、送受信デバイス16の送信イコライザ17および受信イコライザ18のイコライザ変数を取得する。
ステップB4において、診断情報採取部113は、取得したイコライザ変数をメモリ12aの所定の領域にイコライザ値121として格納し、処理を終了する。
このように、診断情報採取部113によって採取されたイコライザ変数は、診断部114による経路診断処理に用いられる。
図7は、実施形態の一例としてのストレージシステム1の診断部114による経路診断処理を説明するためのフローチャート(ステップD1〜D7)である。
ステップD1において、診断部114はメモリ12に格納されたイコライザ値121を読み出す。また、診断部114は、不揮発性メモリ13から、ケーブル情報取得部111によって取得された通信ケーブル40のケーブル情報に対応付けられた診断基準情報122を読み出す。
そして、診断部114は、イコライザ値121の変数V1と変数V2との組み合わせに基づき診断基準情報122を参照し、変数V1と変数V2との組み合わせが、“正常状態”,“予防交換要”および“交換要”のいずれかの状態に相当するかを確認する。
確認の結果、変数V1と変数V2との組み合わせが“正常状態”に相当する場合には(ステップD1の“正常状態”ルート参照)、ステップD2に移行する。
ステップD2においては通信路は正常であると判定され、ステップD3として本ストレージシステム1の動作は継続して動作し、処理を終了する。
また、確認の結果、変数V1と変数V2との組み合わせが“交換要”に相当する場合には(ステップD1の“交換要”ルート参照)、ステップD4に移行する。
ステップD4においては通信路においてなんらかの故障が生じていると判定され、ステップD5として、オペレータに対して故障部位が通知される。その後、処理を終了する。
また、確認の結果、変数V1と変数V2との組み合わせが“予防交換要”に相当する場合には(ステップD1の“予防交換要”ルート参照)、ステップD6に移行する。
ステップD6においては、通信路において異常は発生していないが、経験則により近い将来に故障が発生するおそれがあると判断される(故障予兆)の状態である。ステップD7において、オペレータに対して故障が発生すると考えられる部位が通知される。その後、処理を終了する。
次に、上述した図6に示した診断情報採取処理および図7に示した経路診断処理が、本ストレージシステム1においてどのようなタイミングで行なわれるかを、図8に示すフローチャート(ステップC1〜C6)に従って説明する。
本ストレージシステム1の電源投入が行なわれると(装置パワーオン)、ステップC1において、ケーブル情報取得部111が、エキスパンダチップ14から接続されている通信ケーブル40のケーブル情報を取得する。
そして、ステップC2において、診断情報採取部113は、装置(コントローラ10)とIOモジュール20とが通信ケーブル40により接続された状態(オンライン状態)であるかを確認する。確認の結果、オンライン状態である場合には(ステップC2のYESルート)、ステップC3に移行する。
ステップC3において、診断情報採取部113は、前回、診断部114が経路診断処理を行なってから所定の時間(監視周期)が経過したかを確認する。
監視周期が経過した場合には(ステップC3のYESルート参照)、ステップC4に移行する。
ステップC4においては、診断情報採取部113は、IOモジュール20へのアクセス経路に冗長経路があるかを確認する。
IOモジュール20へのアクセス経路に冗長経路がない場合には(ステップC4のNOルート参照)、ステップC6に移行する。
ステップC6においては、診断対象経路に対するIOコマンドバッファ数が所定の閾値以下であるかを確認する。
確認の結果、診断対象経路に対するIOコマンドバッファ数が所定の閾値以下である場合に(ステップC6のYESルート参照)、診断情報採取処理(図6参照)および経路診断処理(図7参照)が行なわれる。経路診断処理によるIO処理への影響を少なくするためである。
診断対象経路に対するIOコマンドバッファ数が所定の閾値以下でない場合には(ステップC6のNOルート参照)、ステップC2に戻る。
また、ステップC2における確認の結果、オンライン状態でない場合(ステップC2のNOルート)や、ステップC3における確認の結果、監視周期が経過していない場合(ステップC3のNOルート参照)においても、ステップC2に戻る。
ステップC4における確認の結果、IOモジュール20へのアクセス経路に冗長経路がある場合には(ステップC4のYESルート参照)、ステップC5において、コントローラ10は、診断対象経路へのIO処理を、その冗長経路を通過するように切り替える。すなわち、コントローラ10は、IO処理を冗長系を通過させることで、診断対象経路のIO処理を無くす。これにより、IO処理への影響を与えることなく経路診断処理を行なうことができる。
その後、IO処理が無くなった診断対象経路に対して、診断情報採取処理(図6参照)および経路診断処理(図7参照)が行なわれる。
(C)効果
このように、実施形態の一例としてのストレージシステム1によれば、診断情報採取部113が診断対象経路上の送受信デバイス16(エキスパンダチップ14)から送信イコライザ17および受信イコライザ18のイコライザ変数を取得し、診断部114が、この取得したイコライザ変数を用いて経路診断処理を行なう。
これにより、オンライン状態においてIO処理を実行しながら、経路診断を行なうことができる。すなわち、業務等のシステム運用に影響を与えることなく経路診断を行なうことができる。
また、診断部114が、送受信デバイス16から取得したイコライザ変数に基づき、診断基準情報122を参照することで、診断対象経路が“正常状態”,“予防交換要”および“交換要”の3つ種類の状態のうち、いずれかの状態に該当するかを判定することができる。
また、診断部114が、“正常状態”か“交換要”かを判定するだけでなく、“予防交換要”であるかも判定することができる。これにより、故障予兆を判断する、すなわち故障発生を予測することができ、利便性が高い。
故障予兆を判断することで、例えば、故障が実際に発生する前に、所定のタイミングで保守作業を行なうことで、故障の発生を未然に阻止することができ、信頼性を向上させることができる。
また、通信ケーブル40の種類毎に診断基準情報122を用意し、診断基準選択部112が、ケーブル情報取得部111が取得した通信ケーブル40のケーブル情報に基づき、通信ケーブル40に応じた診断基準情報122を選択する。これにより、診断部114が、通信経路に合った最適な診断基準情報122を用いて経路診断を行なうことができ、経路診断の精度を向上させることができる。
(D)その他
そして、本発明は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、上述した実施形態においては、コントローラ10においてIOモジュール20との通信経路に対して経路診断処理を行なう例について示したが、これに限定されるものではない。すなわち、IOモジュール20が、他のIOモジュール20との通信経路に対しても同様に経路診断処理を行なってもよい。
また、コントローラ10やIOモジュール20の数や構成は、図1に示した例に限定されるものではなく、適宜変更して実施することができる。
また、上述した実施形態においては、エキスパンダチップ14aが送信イコライザ17の変数決定処理を行ない、診断部114が送信イコライザ17のイコライザ変数を用いて診断基準情報122を参照することで経路診断処理を行なっているが、これに限定されるものではない。
例えば、エキスパンダチップ14は、リンクトレーニングによって受信イコライザ18のイコライザ変数を設定し、診断部114は、受信イコライザ18のイコライザ変数を用いて経路診断処理を行なってもよい。
受信イコライザ18は、前述の如く、タップ数n(n−tap)のFIRフィルタである。すなわち、受信イコライザ18は、n個(nは整数)の変数を有し、これらの各変数が取りうる値の組み合わせ毎に、良否判定情報を情報テーブルに格納しておく。
上述した実施形態においては、コントローラ10がIOモジュール20と接続されたデータ伝送路を診断する診断装置として機能する例について示しているが、これに限定されるものではない。
すなわち、IOモジュール20が同様の処理を行なうことで、コントローラ10や他のIOモジュール20と接続されたデータ伝送路を診断する診断装置として機能してもよい。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。
診断基準情報122は、図4に例示したイコライザ変数V1,V3の組合せに限定されるものではなく、種々変更して実施することができる。例えば、診断部114は、エキスパンダチップ14a,14bから取得した3つ以上のイコライザ変数を用いて良否判定を行なってもよい。
(E)付記
(付記1)
診断対象経路上の送受信デバイスからデータ伝送路の特性によって設定されるデータ伝送変数を採取する採取部と、
採取された前記データ伝送変数に基づき、データ伝送変数の値と良否判定情報とを対応付けて構成された診断基準情報を参照することで、前記診断対象経路の診断を行なう診断部と
を備えることを特徴とする、診断装置。
(付記2)
前記送受信デバイスに接続されている前記通信ケーブルに関するケーブル情報を取得する取得部と、
記憶装置に格納された複数の診断基準情報の中から、前記取得部によって取得された前記ケーブル情報に対応する診断基準情報を選択する選択部と
を備え、
前記診断部が、前記選択部によって選択された前記診断基準情報を用いて前記診断対象経路の診断を行なう
ことを特徴とする、付記1記載の診断装置。
(付記3)
前記送受信デバイスに対して前記データ伝送変数の設定指示を行なう指示部を備え、
前記採取部が、前記送受信デバイスが前記設定指示に従って設定した前記データ伝送変数を採取する
ことを特徴とする、付記1または2記載の診断装置。
(付記4)
診断対象経路上の送受信デバイスからデータ伝送路の特性によって設定されるデータ伝送変数を採取する処理と、
採取された前記データ伝送変数に基づき、データ伝送変数の値と良否判定情報とを対応付けて構成された診断基準情報を参照することで、前記診断対象経路の診断を行なう処理と
を備えることを特徴とする、診断方法。
(付記5)
前記送受信デバイスに接続されている前記通信ケーブルに関するケーブル情報を取得する処理と、
記憶装置に格納された複数の診断基準情報の中から、取得された前記ケーブル情報に対応する診断基準情報を選択する処理と
を備え、
選択された前記診断基準情報を用いて前記診断対象経路の診断を行なう
ことを特徴とする、付記4記載の診断方法。
(付記6)
前記送受信デバイスに対して前記データ伝送変数の設定指示を行なう処理と、
前記送受信デバイスが前記設定指示に従って設定した前記データ伝送変数を採取する処理と
を備えることを特徴とする、付記4または5記載の診断方法。
(付記7)
診断対象経路上の送受信デバイスからデータ伝送路の特性によって設定されるデータ伝送変数を採取し、
採取された前記データ伝送変数に基づき、データ伝送変数の値と良否判定情報とを対応付けて構成された診断基準情報を参照することで、前記診断対象経路の診断する
処理をコンピュータに実行させる、診断プログラム。
(付記8)
前記送受信デバイスに接続されている前記通信ケーブルに関するケーブル情報を取得し、
記憶装置に格納された複数の診断基準情報の中から、取得された前記ケーブル情報に対応する診断基準情報を選択し、
選択された前記診断基準情報を用いて前記診断対象経路の診断を行なう
処理を、前記コンピュータに実行させる、付記7記載の診断プログラム。
(付記9)
前記送受信デバイスに対して前記データ伝送変数の設定指示を行ない、
前記送受信デバイスが前記設定指示に従って設定した前記データ伝送変数を採取する
処理を前記コンピュータに実行させる、付記7または8記載の診断プログラム。
1 ストレージシステム1
10 コントローラ
11a,11b,11 MPU
111 ケーブル情報取得部
112 診断基準選択部
113 診断情報採取部
114 診断部
12a,12b,12 メモリ
121 イコライザ値
122 診断基準情報
13a,13b,13 不揮発性メモリ
14a,14b,14 エキスパンダチップ
141 ケーブル情報通知部
142 データ伝送変数設定部
15a,15b,15 レジスタ
16a,16b,16 送受信デバイス
17a,17b,17 送信イコライザ
18a,18b,18 受信イコライザ
20 IOモジュール
40 通信ケーブル

Claims (4)

  1. 診断対象経路上の送受信デバイスからデータ伝送路の特性によって設定されるデータ伝送変数を採取する採取部と、
    採取された前記データ伝送変数に基づき、データ伝送変数の値と良否判定情報とを対応付けて構成された診断基準情報を参照することで、前記診断対象経路の診断を行なう診断部と
    前記送受信デバイスに接続されている通信ケーブルに関するケーブル情報を取得する取得部と、
    記憶装置に格納された複数の診断基準情報の中から、前記取得部によって取得された前記ケーブル情報に対応する診断基準情報を選択する選択部と
    を備え
    前記診断部が、前記選択部によって選択された前記診断基準情報を用いて前記診断対象経路の診断を行なう
    ことを特徴とする、診断装置
  2. 前記送受信デバイスに対して前記データ伝送変数の設定指示を行なう指示部を備え、
    前記採取部が、前記送受信デバイスが前記設定指示に従って設定した前記データ伝送変数を採取する
    ことを特徴とする、請求項1記載の診断装置。
  3. プロセッサが、
    診断対象経路上の送受信デバイスからデータ伝送路の特性によって設定されるデータ伝送変数を採取する処理と、
    採取された前記データ伝送変数に基づき、データ伝送変数の値と良否判定情報とを対応付けて構成された診断基準情報を参照することで、前記診断対象経路の診断を行なう処理と、
    前記送受信デバイスに接続されている通信ケーブルに関するケーブル情報を取得する処理と、
    記憶装置に格納された複数の診断基準情報の中から、取得された前記ケーブル情報に対応する診断基準情報を選択する処理と、
    選択された前記診断基準情報を用いて前記診断対象経路の診断を行なう処理と
    を備えることを特徴とする、診断方法。
  4. 診断対象経路上の送受信デバイスからデータ伝送路の特性によって設定されるデータ伝送変数を採取し、
    採取された前記データ伝送変数に基づき、データ伝送変数の値と良否判定情報とを対応付けて構成された診断基準情報を参照することで、前記診断対象経路の診断し、
    前記送受信デバイスに接続されている通信ケーブルに関するケーブル情報を取得し、
    記憶装置に格納された複数の診断基準情報の中から、取得された前記ケーブル情報に対応する診断基準情報を選択し、
    選択された前記診断基準情報を用いて前記診断対象経路の診断を行なう
    処理をコンピュータに実行させる、診断プログラム。
JP2016007965A 2016-01-19 2016-01-19 診断装置、診断方法および診断プログラム Active JP6686459B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016007965A JP6686459B2 (ja) 2016-01-19 2016-01-19 診断装置、診断方法および診断プログラム
US15/358,180 US10142169B2 (en) 2016-01-19 2016-11-22 Diagnosis device, diagnosis method, and non-transitory recording medium storing diagnosis program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016007965A JP6686459B2 (ja) 2016-01-19 2016-01-19 診断装置、診断方法および診断プログラム

Publications (2)

Publication Number Publication Date
JP2017129969A JP2017129969A (ja) 2017-07-27
JP6686459B2 true JP6686459B2 (ja) 2020-04-22

Family

ID=59314264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016007965A Active JP6686459B2 (ja) 2016-01-19 2016-01-19 診断装置、診断方法および診断プログラム

Country Status (2)

Country Link
US (1) US10142169B2 (ja)
JP (1) JP6686459B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017164609A (ja) * 2017-06-30 2017-09-21 株式会社三洋物産 遊技機
JP6904155B2 (ja) * 2017-08-09 2021-07-14 富士通株式会社 情報処理装置、情報処理方法及びプログラム
US11108433B2 (en) * 2018-11-30 2021-08-31 Intel Corporation Single side band transmission over a waveguide
JP7449785B2 (ja) * 2020-06-17 2024-03-14 日立Astemo株式会社 電子制御装置、判定方法
JP7266054B2 (ja) 2021-02-18 2023-04-27 株式会社日立製作所 伝送制御方法、伝送制御システム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004207878A (ja) 2002-12-24 2004-07-22 Fujitsu Ltd 通信装置
JP5006510B2 (ja) * 2004-09-30 2012-08-22 株式会社村田製作所 積層セラミック電子部品の製造方法
US7493532B2 (en) * 2005-10-14 2009-02-17 Lsi Corporation Methods and structure for optimizing SAS domain link quality and performance
WO2007146515A2 (en) 2006-06-08 2007-12-21 Dot Hill Systems Corporation Fault-isolating sas expander
US7673185B2 (en) * 2006-06-08 2010-03-02 Dot Hill Systems Corporation Adaptive SAS PHY configuration
US7536584B2 (en) * 2006-06-08 2009-05-19 Dot Hill Systems Corporation Fault-isolating SAS expander
JP5593596B2 (ja) * 2008-02-04 2014-09-24 ソニー株式会社 映像信号送信装置および映像信号送信方法
US8458527B2 (en) * 2010-02-04 2013-06-04 Dot Hill Systems Corporation Method and apparatus for SAS speed adjustment
US8510606B2 (en) * 2010-02-04 2013-08-13 Randolph Eric Wight Method and apparatus for SAS speed adjustment
JP2012131982A (ja) * 2010-11-30 2012-07-12 Sanyo Chem Ind Ltd 潤滑油用基油および潤滑油組成物
WO2012164610A1 (en) * 2011-05-31 2012-12-06 Hitachi, Ltd. Storage apparatus and method of controlling the same
JP2015019163A (ja) * 2013-07-09 2015-01-29 富士通株式会社 制御装置、および制御方法

Also Published As

Publication number Publication date
US10142169B2 (en) 2018-11-27
US20170207952A1 (en) 2017-07-20
JP2017129969A (ja) 2017-07-27

Similar Documents

Publication Publication Date Title
JP6686459B2 (ja) 診断装置、診断方法および診断プログラム
US7496694B2 (en) Circuit, systems and methods for monitoring storage controller status
CN105389248A (zh) 非易失性内存固态硬盘的灯号控制系统
TW200426593A (en) Integrated circuit capable of communicating using different communication protocols
CN105468484A (zh) 用于在存储系统中确定故障位置的方法和装置
EP1736879A3 (en) DIsk array apparatus and method for controlling the same
EP0403207A2 (en) Diagnostic subsystem
CN105529045A (zh) 非易失性内存固态硬盘的灯号控制系统
JP2009205316A (ja) ディスクアレイ装置、ディスクアレイ制御方法及びディスクアレイ制御装置
CN112825011A (zh) PCIe设备的上下电控制方法以及系统
JP5326673B2 (ja) 制御回路、情報処理装置及び情報処理装置の制御方法
US20140059390A1 (en) Use of service processor to retrieve hardware information
JP5488709B2 (ja) ストレージ制御装置における基準時間設定方法
US20110093625A1 (en) Storage system, control device, and diagnosis method
JP6428048B2 (ja) 通信システム,異常制御装置および異常制御方法
WO2017011277A1 (en) Sideband serial channel for pci express peripheral devices
JP7125602B2 (ja) データ処理装置および診断方法
JP2007299213A (ja) Raid制御装置および障害監視方法
US20060265523A1 (en) Data transfer circuit and data transfer method
US20080126697A1 (en) Apparatus, system, and method for selective cross communications between autonomous storage modules
JP6777848B2 (ja) 制御装置、及びストレージ装置
JP5849491B2 (ja) ディスク制御装置、ディスク装置異常検出方法、及びプログラム
US7146540B2 (en) Disc array device and diagnostic control method thereof
JP6167516B2 (ja) 中継装置、中継方法及び電力制御システム
JP2008186377A (ja) ディスクドライブ診断装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190528

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200316

R150 Certificate of patent or registration of utility model

Ref document number: 6686459

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150