JP5116838B2 - スイッチ・モジュール・システム - Google Patents

スイッチ・モジュール・システム Download PDF

Info

Publication number
JP5116838B2
JP5116838B2 JP2010504609A JP2010504609A JP5116838B2 JP 5116838 B2 JP5116838 B2 JP 5116838B2 JP 2010504609 A JP2010504609 A JP 2010504609A JP 2010504609 A JP2010504609 A JP 2010504609A JP 5116838 B2 JP5116838 B2 JP 5116838B2
Authority
JP
Japan
Prior art keywords
data
switch module
link
links
stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010504609A
Other languages
English (en)
Other versions
JP2010528346A (ja
Inventor
ブリニック、キャスリン、ティルディスレイ
エリオット、ジョン、チャールズ
ルーカス、グレッグ、スティーヴン
メドリン、ロバート、アール
ウォシュバーン、ゴードン、レオン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2010528346A publication Critical patent/JP2010528346A/ja
Application granted granted Critical
Publication of JP5116838B2 publication Critical patent/JP5116838B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/555Error detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/34Signalling channels for network management communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明はストレージ・ネットワーク・システムに関するものであり、特に、順次多重化データ・ストリームを利用した高速ネットワーク・トラフィックの監視システム及び方法に関するものである。
(商標)
IBM(R)及びBladeCenter(R)は、インターナショナル・ビジネス・マシーンズ・コーポレーション(米国ニューヨーク州アーモンク)の登録商標である。本明細書で使用される他の名称もインターナショナル・ビジネス・マシーンズ・コーポレーション又は他の企業の登録商標、商標、又は製品名である可能性がある。
図1に示したような内部化された高速ファブリックを有するストレージ・ネットワーク・システムでは、高速スイッチを使用して個々のサーバと関連するストレージとの間の接続性がもたらされる。また、このようなネットワーク・ストレージ・システムは、複数の高速ファブリック(1X及び4X)を含むことがある。高速差動シグナリングは、中央シリアル・アタッチドSCSI(SAS)スイッチと、他のスイッチや下流又は上流のストレージ・コンポーネントのような他のエンドポイントとの間の高帯域接続を実現するのに使用される。SASは、ファイバ・チャネル、イーサネット(R)、SCSI等のいくつかの構成と、「ワイド(wide)」であることも「ナロー(narrow)」であることもある16外部SASポートのようないくつかのトポロジとを実装することができる。ワイド・ポートは、シングル1Xリンク(例えばPHY)、あるいは4X、8X、12Xワイド・ポート等のマルチ・リンクを含むことができる。
かかるシステムでは、ストレージ・エリア・ネットワーク(SAN)の大部分が内部化され、サーバ・ブレードとスイッチ・モジュールとが内部ファブリックを介して互いに結合される。このような内部化により、問題検出、分析、及び障害分離用の関連データへのアクセスが必要になるという問題が生じる可能性がある。いくつかのSANシステムでは、外部ファイバ・チャネルのような疑わしい高速インターフェースにテスト機器(例えばロジック・アナライザ)を挿入して問題解決用の関連データを収集(capture)することができる。しかしながら、高速ファブリックが内部化されている場合は、問題解決のためにファブリックにアクセスすることが困難となる。ソフトウェア追跡イベントをマイクロコードの形で作成することやエラー・メッセージをデバッグ・ポートに送るといった解決策が施されているが、そのような解決策には、障害の詳細が不正確であること、障害報告が非実時間で行われること、その結果問題を分離するデバッグ・パッチの追加が何度も繰り返されることを含めた様々な欠陥が存在する。より侵襲性の高い他の方法としては、内部プローブを可能にする配線をカードに追加することを挙げることができる。このハードウェア・タイプのアプローチは、分析能力が制限され、監視データの潜在的な破損を引き起こす恐れがあることから、システムにとって侵襲的なアプローチとなる。他の例では、プローブされるファブリック回路が永続的な電気的損傷を受ける恐れがある。これらの多くのアプローチは、制御された実験室設定では実施可能であっても顧客環境には適さない。したがって、内部化された高速ファブリック・ネットワークの問題解決を顧客環境で行うシステム及び方法が必要とされている。
例示的な諸実施形態は、請求項1に記載のスイッチ・モジュール・システムを含む。
他の実施形態は、コンピュータ可読媒体であって、サーバ及びスイッチ・モジュールをサポートするように構成されたマルチ・シャーシ・システムが、前記サーバに関するデータ・ストリームを前記スイッチ・モジュールを介して流すように構成するステップと、前記スイッチ・モジュールと結合された少なくとも1つのデータ・リンク上のデータ障害を検出するステップと、前記スイッチ・モジュールと結合された第2及び第3のデータ・リンクが監視データ・ストリームを受信するように構成するステップと、前記第1のデータ・リンクと第4のデータ・リンクのうちの少なくとも一方が影響を受けていないデータ・ストリームをサポートするように構成するステップと、を含む方法を実行するコンピュータ実行可能な命令を有するコンピュータ可読媒体を含む。
追加的な実施形態は、スイッチ・モジュールのデータ監視方法であって、マルチ・シャーシ・システムが、前記マルチ・シャーシ・システムを相互接続するスイッチ・モジュールを介してデータ・ストリームを流すように構成するステップと、前記スイッチ・モジュールと結合された少なくとも1つのデータ・リンク上のデータ障害を検出するステップと、前記スイッチ・モジュールと結合された第2及び第3のデータ・リンクが監視データ・ストリームを受信するように構成するステップと、前記第1のデータ・リンクと第4のデータ・リンクのうちの少なくとも一方が影響を受けていないデータ・ストリームをサポートするように構成するステップと、前記監視データ・ストリームをロジック・アナライザに経路指定するステップと、を含む方法を含む。
以下の詳細な説明を添付図面と併せて読めば、諸実施形態に係る他のシステム、又は方法、又はコンピュータ・プログラム製品、あるいはそれらのすべてが当業者には明らかとなるだろう。かかる追加的なシステム、又は方法、又はコンピュータ・プログラム製品、あるいはそれらのすべては本明細書の範囲及び本発明の範囲に含まれ、添付の特許請求範囲によって保護されることが本出願人の意図するところである。
本発明を要約すると、すべての外部SASリンクが通常のSAS I/O実行で消費されるシステム構成において、内部高速ファブリックの問題を実時間で追跡し解決することが可能となる。
本明細書に添付される特許請求範囲の各請求項では、本発明と見なされる主題が具体的に指摘され明示される。本発明の上記及び他の目的、特徴、ならびに利点は、以下の詳細な説明を添付図面と併せて読めば明らかとなる。
それぞれ14個のブレード・サーバを有した2つのマルチ・シャーシ・ネットワークを有する従来技術のSASストレージ・ネットワークの一例を示す図である。 例示的な諸実施形態に従って構成されるSASストレージ・ネットワーク・システムの一例を示す図である。 例示的な諸実施形態に従って構成される図2のSASストレージ・ネットワーク・システムの一例を示す図である。 例示的な諸実施形態に従って構成される図2及び図3のSASストレージ・ネットワーク・システムの一例を示す図である。 例示的な諸実施形態に従って構成される図2及び図3のSASストレージ・ネットワーク・システムの一例を示す図である。 例示的な諸代替実施形態に従って構成される図2及び図3のSASストレージ・ネットワーク・システムの一例を示す図である。 例示的な諸代替実施形態に従って構成される図2及び図3のSASストレージ・ネットワーク・システムの一例を示す図である。 同時多重化データ・ストリームを利用して高速ネットワーク・トラフィックを監視する例示的な方法のフローチャートである。
以下の詳細な説明では例示として、添付図面を参照しながら本発明の好ましい諸実施形態をそれらの利点及び特徴と併せて説明する。
例示的な諸実施形態は、順次多重化データ・ストリームを利用した高速ネットワーク・トラフィックの監視システム及び方法を含む。これらの実施形態では、SASスイッチが単一のケーブル内の複数のリンク(例えばPHY)から成る帯域幅を集約するワイド・ポートを提供する。したがって、例示的な諸実施形態によれば、トラフィック障害が検出されたときにすべてのI/Oストリームが共通のデータ・リンク(PHY)に送られ、それによってスイッチが様々なトラフィック・ストリームを多重化するようなスヌーピング(snooping)方法を、高速SASワイド・ポート上で実装することができる。例示的な諸実装形態では、複数のイニシエータが単一のワイド・ポートを介して共通のストレージ・ドメイン(エンクロージャ)にアクセスする。したがって、複数のI/Oトラフィック・ストリームがワイド・ポートを経て多重化される。トラフィック障害が検出されたときにすべてのI/Oストリームが共通のリンクに送られることにより、スイッチは様々なトラフィック・ストリームを多重化する。この構成では、ワイド・ポート内の他のリンクは、問題判定用の外部ロジック・アナライザとのスヌープ・データ接続(snoop data connection)を提供するのに使用可能な状態に保たれる。これらの使用可能なリンクは、スヌープ・ポートとして構成され、それによってI/Oトラフィックを特定のスヌープ・ポートを介してロジック・アナライザに選択的に経路指定することが可能となる。
例示的な諸実施形態によれば、ワイド・ポートが与えられる場合、適応型スヌーピングは、当該ポートに関連するすべてのデータ・リンク間でデータ・ブロックを転送することができる。データ・リンクがエラー閾値限界を超えている場合は、所与の任意のポートの障害を収集しようとする試みが困難となる可能性があることから、該データ・リンクのトラフィックは、上記ワイド・ポートに関連する別のデータ・リンクに経路変更される。ロジック・アナライザが1つのデータ・リンクを追跡するようにセット・アップされている場合は、該当するデータが収集される可能性は低くなる。エキスパンダ内には、増大するデータ・リンク上のハードウェア障害を監視するアルゴリズムが実装される。ワイド・ポートが問題を経験している場合、本システム及び方法は、欠陥が最も少ない単一のデータ・リンク、即ち、以下で詳述するように優先順位が最も高い(安定な)データ・リンクにすべてのデータ・リンク・トラフィックを適応的にリダイレクトすることができる
図2は、例示的な諸実施形態に従って構成されるSASストレージ・ネットワーク・システム200の一例を示している。システム200は、それぞれ(様々な要素の中でもとりわけ)ブレード・コントローラ及びI/Oコントローラを有する複数の独立サーバ215(即ちサーバ・ブレード)を有する第1のシャーシ・ネットワーク205を含むことができる。第1のシャーシ210は、第1のスイッチ・モジュール220と結合され、これと通信する。第1のシャーシ210は、各独立サーバ215と第1のスイッチ・モジュール220の入力との間の単一のリンクA、B、C、D(例えば1X)とすることが可能な内部ファブリック225を介して第1のスイッチ・モジュール220と結合されている。SASスイッチ・モジュールとすることが可能な第1のスイッチ・モジュール220は、他の処理の中でもとりわけ、ネットワーク・データ・トラフィックを、様々なワイド・ポート230a、230b、230c、230d、又はリンクE、F、G、Hのような個別データ・リンク、あるいはその両方を介して外部ファブリック240に経路指定及びスイッチすることができる。図2に示される例では、単一のワイド・ポート230aが4つの個別リンクE、F、G、Hを有し、それによって4Xワイド・ポート、即ちワイド・ポート230aが形成されている。他の実施形態において、外部ファブリック240は、必ずしもそれだけに限定されるわけではないが、複数のシングル1Xリンク、又は(必ずしもそれだけに限定されるわけではないが)8X、12X、16X等を含む他のワイド・ポート構成のようなデータ・リンク及びワイド・ポートの任意の組合せをサポートすることができることが理解され明らかとなるだろう。更に、第1のスイッチ・モジュール220は、独立サーバ215から外部ファブリック240にデータ・ストリーム275a、275b、275c、275dを経路指定することも理解していただきたい。
システム200は更に、ワイド・ポート260a、260b、260c、260d、及びデータ・リンクE、F、G、Hを有し、外部ファブリック240を介して第1のスイッチ・モジュール220と結合される第2のスイッチ・モジュール255を有する第2のシャーシ・ネットワーク250を含む。ファイバ・ケーブル、イーサネット・ケーブル、SCSIケーブル等とすることが可能な外部ファブリック240は、個別リンクE、F、G、Hを介してワイド・ポート230、260を互いに結合させる媒体であることを理解していただきたい。第2のスイッチ・モジュール255は、必ずしもそれだけに限定されるわけではないが、第2のネットワーク・シャーシ、スイッチ・バンチ・オブ・ディスク(switch bunch of disks:SBOD)等、他の内部又は外部ストレージと結合され、それらと通信することができる。更に、任意の数の追加的なシャーシ・ネットワーク又は他のストレージ・ネットワーク・メディアを上流又は下流の第1及び第2のシャーシ・ネットワーク205、250と結合させ、それらと通信させることが可能であることも理解していただきたい。
一般に、高速スイッチ技術は、高速トラフィックを同一のスイッチ上のポート(例えば、ワイド・ポートや個別データ・リンク等)に選択的且つ冗長的にミラーリングする能力を提供する。例えば、第1のスイッチ・モジュール220上のワイド・ポート230a、230b、230c、230(又は個別データ・リンクE、F、G、H)のうちの1つ又は複数は、第1のスイッチ・モジュール220上の他のワイド・ポート230a、230b、230c、230d(又は個別データ・リンクE、F、G、H)を監視するように構成することができる。以下、ワイド・ポート230a、230b、230c、230d、又はデータ・リンクE、F、G、H、あるいはその両方のこのような使用形態について、例示的な諸実施形態に従って説明する。この監視機能は「スヌーピング」としても知られ、即ち、例えば第1のスイッチ・モジュール220内を通過中の高速トラフィックを「スヌーピング」又は監視し、その後当該トラフィックを第1のスイッチ・モジュール220上の別のポート、即ちスヌーピング専用ポートに送ることを可能にする機能である。スヌーピング・ポート又はリンクを設けるために、第1のスイッチ・モジュール220は、スヌーピングに利用可能なポート又はリンクを有することを理解していただきたい。図2に示されるシステム200では、すべての外部スイッチ・ポートをSASI/Oトラフィックに使用することができる。例示的な一実施形態において、ワイド・ポート230aは、そのようなデータ・リンクをいくつか含むことができ、データ・ストリームをサポートすることができる。図2では一例として、4つのサーバ・ブレード215がそれぞれ、本例では第2のスイッチ・モジュール255を介しワイド・ポート230a内の各リンクE、F、G、Hを経て外部ストレージにアクセスする様子が示されている。更に、第1のスイッチ・モジュール220は、ワイド・ポート230aのようなワイド・ポート内のリンクE、F、G、H等すべてのリンクを介してサーバ・トラフィック(データ・ストリーム275a〜275d)を様々な手法で動的に経路指定することができることを理解していただきたい。このように、I/Oストリームがどのリンクを経て経路指定されるかは非決定論的である。したがって、図2は、順次多重化データ・ストリームを利用した高速ネットワーク・トラフィックの例示的な監視システム及び方法の基本構成(pre‐cursor configuration)を示している。
図3は、例示的な諸実施形態に従って構成される図2のSASストレージ・ネットワーク・システム200の一例を示している。システムのI/O問題を解決するときは、I/Oアクティビティの痕跡を実時間で収集する必要がある。したがって、I/Oを監視するロジック・アナライザ270をシステム200と結合させることができる。例示的な一実施形態では、すべてのI/Oトラフィック、即ちすべてのデータ・ストリーム275a〜275dがワイド・ポート230a内の単一のリンクEに経路指定される。他の例示的な実施形態及び実装形態では、I/Oトラフィックが他のリンク及びワイド・ポートに経路指定され得ることを理解していただきたい。すべてのI/Oトラフィックを単一のリンクに経路指定することにより、ワイド・ポート230a内の残りのリンクF、G、Hがデータ・トラフィックから解放される。更に、データ・ストリーム275a〜275dを単一のリンクE上に経路変更することにより、障害のあるI/Oが監視可能な単一のリンクE上に経路指定されることが保証される。例示的な諸実施形態では、3Gb/sや6Gb/sのようないくつかのデータ転送速度がデータ・リンクE、F、G、H上でサポートされることが企図されることを理解していただきたい。したがって、例えばすべてのデータ・ストリーム275a〜275dの転送速度が3Gb/sである場合は、リンクEを3Gb/sに構成し、それによってトラフィックが当該リンク上に順次流れることを可能にすることができる。例えば、データ・ストリーム275aがデータ・リンクE上に転送された後、データ・ストリーム275bが、次にデータ・ストリーム275cが、その後データ・ストリーム275dがデータ・リンクE上に転送される。ここで論じたすべての構成は、デバッグ・ポート291と結合された外部コンピューティング・デバイス290を利用して実現することができる。
図4は、例示的な諸実施形態に従って構成される図2及び図3のSASストレージ・ネットワーク・システム200の一例を示している。3つの不使用リンクF、G、Hのうち2つのリンクF、Gは、以下のようにスヌープ・リンクとして構成することができる。本例では、障害のあるI/Oがデータ・ストリーム275aを有する独立サーバ215に由来するものであることが判定されている。例示的な一実施形態では、問題をデバッグするために、ポートAを介して第1のスイッチ・モジュール220に入るデータ・ストリーム275aと、データ・リンクEを介して第1のスイッチ・モジュール220から出るデータ・ストリーム275aとが監視される。図4に示されるように、これらの2つの経路はそれぞれ、スヌープ・データ・ストリーム280、281としてリンクF、Gに経路指定される。したがって、図4に示される構成において、データ・ストリーム281は、第1のスイッチ・モジュール220に流入する前のデータ・ストリームを表し、データ・ストリーム280は、第1のスイッチ・モジュール220から流出した後のデータ・ストリームを表す。かかる構成において、使用される外部ファブリックは、リンクEがワイド・ポート230aとワイド・ポート260aとの間を流れることが可能となるブレークアウト・ケーブルである。一方、残りのリンクF、G、Hは、分析のためにロジック・アナライザ270に経路指定される。
したがって、ある時点において、リンクAのトラフィックが誤ったデータを転送すると、その結果I/O障害が発生することになる。この問題は、シャーシ210内の独立サーバ215から入力されるデータであることも、リンクE上の第1のスイッチ・モジュール220から出力されるデータであることもある。したがって、第1のスイッチ・モジュール220に入る前のストリーム275aと、第1のスイッチ・モジュール220に入った後のストリーム275aとは、障害を分離するためにロジック・アナライザ270によって収集され、上述のとおり経路指定されるストリームに該当する。更に、リンクA、B、C、Dからのすべてのデータ・トラフィックはリンクEに経路指定されることが理解されるだろう。一方、例えば障害のあるデータがリンクA上に存在することが特定される構成では、残りのすべてのトラフィック275b、275c、275dを以下で論じる通常動作用に経路指定することができる。
図5は、例示的な諸実施形態に従って構成される図2及び図3のSASストレージ・ネットワーク・システム200の一例を示している。上述のとおり、システム200は、外部コンピューティング・デバイス290を使用して、第1のスイッチ・モジュール220内の独立サーバ215からのデータ・ストリーム275b、275c、275dを動的に経路指定するように構成することができる。一般的な例では、各独立サーバ215は特定のリンクに経路指定されるが、リンクに障害がある場合は、そのデータは動作状態にある残りのリンクのうちの1つに経路変更され得る。それ故、いかなる時点においても、どのデータがどのリンク上に送出されるかを知ることはできない。したがって、図4に関して論じたように、すべてのトラフィックを単一のリンクEに集中(funnel)させる必要があり、当該リンクは動作状態のリンクであることが求められる。本例において、リンクA上から第1のスイッチ・モジュール220内を流れ、リンクE上に流出するデータ・ストリーム275aは、第1のスイッチ・モジュール220によって、又は第2のスイッチ・モジュール255上でエラーが検出される。しかしながら、リンクEは依然として動作状態にあり、それ自体の外部にデータを確実に転送することができる。そのため、リンクEを経てリダイレクトされる他のすべてのデータ・ストリーム275b、275c、275dもまた動作状態にあり、リンク経路A→E上の破損したデータ・ストリーム275aの影響を受けない。例示的な一実施形態では、障害のある経路、即ちデータ・ストリーム275aが判定されると、第1のスイッチ・モジュール220は、外部コンピューティング・デバイス290を利用して、データ・トラフィックを特定のリンクを経て第2のスイッチ・モジュール255に静的に経路指定するように、特定の形で構成され得る。影響を受けていないデータ・トラフィックを経路変更することにより、障害のある動作が問題解決用の固定経路に制限される。他の独立サーバ215からの他の既知の良好なデータ転送275b、275c、275dはすべて、既知の良好なリンク、例えばリンクHに集中させることができる。本例ではその後、リンクA上の破損したデータ・ストリーム275aは、リンクEを経て第2のスイッチ・モジュール255に経路指定される。2つのスヌープ・データ・ストリーム280、281は、前述のとおりリンクF、Gに経路指定される。残りのデータ・トラフィック275b、275c、275dはすべてリンクHに経路指定される。上述のとおり、データ・ストリーム275b、275c、275dはデータ・リンクH上に順次転送されることが理解されるだろう。
図4及び図5に関して論じた構成は、外部ファブリック240の外部ブレークアウト・ケーブルを置き換えることにより、システム200の媒介物(intervention)を含むことが理解されるだろう。上述のとおり、データ・トラフィックが必要に応じて経路指定されるように実時間構成を行うことができる。また別の例示的な実施形態では、以下で論じるように、システム200の通常動作中に中断のない実時間構成を行うことができる。
図6は、例示的な諸代替実施形態に従って構成される図2及び図3のSASストレージ・ネットワーク・システム200の一例を示している。図6に示した構成のシステム200では、外部ファブリック240は中断されない。その代わりに、スヌープ・データ・ストリーム280、281は、前述のとおりリンクE、F上に経路指定されるだけでなく、更に第2のスイッチ・モジュール255内にも経路指定される。他のすべてのデータ・ストリーム275a、275b、275c、275dは、前述のとおりリンクE上に経路指定される。デバッグ・ポート29と結合された外部コンピューティング・デバイス290は、リンクF、Gを、ワイド・ポート260aからワイド・ポート260bに経路変更し、更に、ここではワイド・ポート260bと接続されたロジック・アナライザ270へと経路変更されるように構成する。この構成は、システム200の通常動作中に中断なく実時間で実行することができる。
図7は、例示的な諸代替実施形態に従って構成される図2及び図3のSASストレージ・ネットワーク・システム200の一例を示している。上述のとおり、例えばデータ・ストリーム275aが既にデータ障害のあるデータ・ストリームとして特定されている場合は、他のすべてのデータ・ストリーム275b、275c、275dをリンクHに経路変更することができる。この構成も同様に、システム200の通常動作中に中断なく実時間で実行することができる。
図8は、同時多重化データ・ストリームを利用した高速ネットワーク・トラフィックの例示的な監視方法800のフローチャートを示している。例示的な諸実施形態によれば、ステップ805で、システム200の動作構成及び独立サーバ215のI/O構成が行われる。ステップ810で、上述のとおり一般にはデータ欠陥障害に相当する障害が発生しているか否かが判定される。ステップ810で障害が検出されない場合には、ステップ805に進む。ステップ810で障害が発生している場合には、ステップ815で障害のある経路が判定される。特定の経路に沿った欠陥データの存在によって障害が検出され、障害のある経路が判定されることを理解していただきたい。上述のとおり、障害のある経路はデータ・リンクである可能性がある。ステップ820で、ロジック・アナライザ270がシステム200と結合される。上述のとおり、図4及び図5に記載される外部ファブリック240に代えて、スヌープ・ケーブル又はブレークアウト・ケーブルを設置することも可能である。別法として、ロジック・アナライザ270は、図6及び図7に記載されるワイド・ポート260bのような空きワイド・ポートと結合することも可能である。ステップ825で、データ・トラフィック275a、275b、275c、275dは、動作状態のリンクに経路変更される。上述のとおり、トラフィック275a、275b、275c、275dはすべて、図4及び図6に関して論じたリンクEのような単一のリンクに経路変更することができる。別法として、データ・ストリーム275aのような障害のあるデータ経路の特定に成功した場合は、影響を受けていない残りのデータ・ストリーム・トラフィック275b、275c、275dを図5及び図7に関して論じたリンクHのような動作状態のリンクに経路変更することもできる。ステップ830で、不使用ポートがスヌーピング用に構成される。図4乃至図7に関して上述したように、データ・リンクF、Gがスヌーピング用に構成される。また、図6及び図7によれば、ワイド・ポート260bが専用のスヌーピング・ポートとして構成される。ステップ835で、スヌープ・データ・ストリーム280、281は、第2のスイッチ・モジュール255であり得る後続のスイッチ・モジュールによって無視される。方法800は、データの欠陥及び障害の発生とともに継続されることを理解していただきたい。
本発明の機能は、ソフトウェア、ファームウェア、ハードウェア、あるいはその組合せの形で実施することができる。
一例として、本発明の1つ又は複数の態様を、例えばコンピュータ使用可能な媒体を有する製品(例えば、1つ又は複数のコンピュータ・プログラム製品)に含めることができる。上記媒体は、それ自体の内部に例えば本発明の機能を実現し促進するコンピュータに読み込み可能なプログラム・コード手段を含む。上記製品は、コンピュータ・システムの一部として含まれることも、コンピュータ・システムと別個に販売されることもある。
また、本発明の機能を実現するために機械によって実行され得る命令から成る少なくとも1つのプログラムが有形に実装された、機械読取り可能な少なくとも1つのプログラム記憶装置を提供することができる。
本明細書に示されるフロー図は、単なる例示にすぎない。これらの図面及び本明細書に記載される各ステップ(又は動作)には、本発明の趣旨から逸脱しない限り様々な変更を施すことができる。例えば、各ステップを異なる順序で実行することも、ステップの追加、削除、あるいは修正を行うことも可能である。これらの変形形態はすべて添付の特許請求範囲に記載される発明の一部と見なされる。
上述のとおり、各実施形態は、コンピュータ実装処理及びそれらの処理を実行する装置の形で実施することができる。例示的な諸実施形態において、本発明は、1つ又は複数のネットワーク要素によって実行されるコンピュータ・プログラム・コードの形で実施される。各実施形態は、フレキシブル・ディスク、CD‐ROM、ハード・ドライブ、他の任意のコンピュータ読取り可能な記憶媒体等、有形の媒体内で実行される命令を含むコンピュータ・プログラム・コードであって、それらがコンピュータにロードされ実行されたときに当該コンピュータが本発明を実施する装置となる、コンピュータ・プログラム・コードを含む。各実施形態は、例えば記憶媒体に記憶されるものであれ、コンピュータにロード又は実行あるいはその両方が行われるものであれ、あるいは電気配線又は電気ケーブル、光ファイバ、電磁放射等、何らかの伝送媒体を介して伝送されるものであれ、それらがコンピュータにロードされ実行されたときに当該コンピュータが本発明を実施する装置となる、コンピュータ・プログラム・コードを含む。当該コンピュータ・プログラム・コードを汎用マイクロプロセッサに実装した場合、その汎用マイクロプロセッサは、当該コンピュータ・プログラム・コードの各セグメントによって特定の論理回路を形成するように構成される。
以上、本発明について例示的な諸実施形態を参照しながら説明したが、本発明の範囲から逸脱しない限り様々な変更を施すことができ、それらの実施形態の各要素を均等物で置き換えることができることが当業者には理解されるだろう。また、本発明の本質的な範囲から逸脱しなければ、特定の状況又は材料に応じて本発明の教示内容に様々な修正を施すことができる。したがって、本発明は、本発明の最良の実施形態として本明細書に開示される特定の実施形態に限定されるものではなく、特許請求の範囲に含まれるすべての実施形態を包含することが本出願人の意図するところである。また、「第1の」や「第2の」等の用語の使用はいかなる序列関係も重要度も示すものではなく、ある要素と別の要素を区別するのに使用されるものである

Claims (2)

  1. スイッチ・モジュール・システムであって、
    第1のサーバ・シャーシ(210)と結合されるように構成された第1のスイッチ・モジュール(220)と、
    前記第1のスイッチ・モジュール上に配備される第1のデータ・ポート(230a)と、
    前記第1のデータ・ポート内に配備され、それぞれ通常データ・ストリームと監視データ・ストリームのうちの少なくとも一方を流送するように構成可能な1組のデータ・リンク(E、F、G、H)と、
    前記第1のサーバ・シャーシ内に配備される独立サーバ・モジュール(215)と、
    第2のスイッチ・モジュール(255)とを備え、
    前記第1のデータ・ポートは、前記第2のスイッチ・モジュール上に配備される第2のデータ・ポートと結合されるように構成され、
    前記1組のデータ・リンクは、前記第1のスイッチ・モジュールと前記第2のスイッチ・モジュールとの間に配備され且つそれらと結合され、前記第1のスイッチ・モジュールと結合された少なくとも1つのデータ・リンク上のデータ障害が検出されたことに応答して、前記1組のデータ・リンクのうちの第2のデータ・リンク(G)は、前記第1のスイッチ・モジュールに入力される前のデータ・ストリームを第1の監視データ・ストリームとして流送するように構成され、前記1組のデータ・リンクのうちの第3のデータ・リンク(F)は、前記第1のスイッチ・モジュールから出力された後のデータ・ストリームを第2の監視データ・ストリームとして流送するように構成され、前記1組のデータ・リンクのうちの第1のデータ・リンク(E)及び第4のデータ・リンク(H)の一方は、前記第1のサーバ・シャーシ内に配備されるサーバから前記第1のスイッチ・モジュールに経路指定された障害のない通常データ・ストリームを受信してこれを前記第2のスイッチ・モジュールに流送するように構成され、
    前記第1のスイッチ・モジュールと前記第2のスイッチ・モジュールとの間に配備され、前記第1及び第2の監視データ・ストリームを受信して前記障害を追求するように構成されたロジック・アナライザ(270)を更に備える、システム。
  2. 前記第1のデータ・リンク(E)及び前記第4のデータ・リンク(H)の他方は、前記第1のサーバ・シャーシ内に配備されるサーバから前記第1のスイッチ・モジュールに経路指定された障害のある通常データ・ストリームを受信してこれを前記第2のスイッチ・モジュールに流送するように構成される、請求項1に記載のシステム。
JP2010504609A 2007-04-30 2008-04-08 スイッチ・モジュール・システム Expired - Fee Related JP5116838B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/741,798 US7936767B2 (en) 2007-04-30 2007-04-30 Systems and methods for monitoring high speed network traffic via sequentially multiplexed data streams
US11/741,798 2007-04-30
PCT/EP2008/054220 WO2008132027A2 (en) 2007-04-30 2008-04-08 Monitoring high speed network traffic via sequentially multiplexed data streams

Publications (2)

Publication Number Publication Date
JP2010528346A JP2010528346A (ja) 2010-08-19
JP5116838B2 true JP5116838B2 (ja) 2013-01-09

Family

ID=39811554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010504609A Expired - Fee Related JP5116838B2 (ja) 2007-04-30 2008-04-08 スイッチ・モジュール・システム

Country Status (7)

Country Link
US (1) US7936767B2 (ja)
EP (1) EP2151101B1 (ja)
JP (1) JP5116838B2 (ja)
KR (1) KR101013246B1 (ja)
CN (1) CN101669337B (ja)
AT (1) ATE516645T1 (ja)
WO (1) WO2008132027A2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9065742B2 (en) * 2007-12-28 2015-06-23 Emulex Corporation Snooping in SAS expander networks
US8019895B2 (en) * 2008-03-25 2011-09-13 International Business Machines Corporation Serial attached SCSI and serial ATA wide port tunnelling through a fibre channel connection
US7843836B2 (en) * 2008-05-12 2010-11-30 International Business Machines Corporation Systems, methods and computer program products for controlling high speed network traffic in server blade environments
US8656058B2 (en) * 2008-09-05 2014-02-18 Lsi Corporation Back-off retry with priority routing
US8321596B2 (en) * 2008-09-05 2012-11-27 Lsi Corporation SAS paired subtractive routing
US8244948B2 (en) * 2008-09-05 2012-08-14 Lsi Corporation Method and system for combining multiple SAS expanders into a SAS switch
US8077605B2 (en) * 2008-09-05 2011-12-13 Lsi Corporation Method for providing path failover for multiple SAS expanders operating as a single SAS expander
US20100290354A1 (en) * 2009-05-15 2010-11-18 Vss Monitoring, Inc. Method for determining ethernet mode of operation during passive monitoring
CN102201945A (zh) * 2010-03-24 2011-09-28 英业达股份有限公司 模拟储存局域网络的测试系统
CN102025544B (zh) * 2010-12-16 2015-09-16 中兴通讯股份有限公司 流镜像捕获方法及装置
CA3015730C (en) * 2012-01-30 2019-01-08 Aeponyx Inc. Method, topology and point of presence equipment for serving a plurality of users via a multiplex module
US9282004B2 (en) 2013-05-23 2016-03-08 Netapp, Inc. Multi-protocol storage network I/O devices and methods
US9529172B2 (en) * 2014-05-12 2016-12-27 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Breakout cable
US10181975B2 (en) * 2015-09-04 2019-01-15 Intel Corporation Override subsystems for rapid recovery from serial-link errors
US10565041B2 (en) 2017-05-19 2020-02-18 Western Digital Technologies, Inc. Managing phys of a data storage target device
US10771316B1 (en) * 2017-11-30 2020-09-08 Amazon Technologies, Inc. Debugging of a network device through emulation

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4451916A (en) * 1980-05-12 1984-05-29 Harris Corporation Repeatered, multi-channel fiber optic communication network having fault isolation system
US4633473A (en) * 1984-08-02 1986-12-30 United Technologies Corporation Fault tolerant communications interface
US5257393A (en) * 1989-04-19 1993-10-26 Jrm Consultants, Inc. Serially controlled programmable test network
JP3454297B2 (ja) * 1995-04-10 2003-10-06 インターナショナル・ビジネス・マシーンズ・コーポレーション ネットワーク・スイッチ間のリンクをテストするための方法および装置
JPH1093604A (ja) 1996-09-12 1998-04-10 Hitachi Cable Ltd スイッチングハブ
CA2218218A1 (en) 1996-11-08 1998-05-08 At&T Corp. Promiscuous network monitoring utilizing multicasting within a switch
US6311327B1 (en) * 1998-03-02 2001-10-30 Applied Microsystems Corp. Method and apparatus for analyzing software in a language-independent manner
JPH11275128A (ja) 1998-03-19 1999-10-08 Nec Eng Ltd スイッチングハブ回路
US20020016868A1 (en) * 1998-05-13 2002-02-07 Palm, Inc. Method and apparatus for serial port sharing
US6625144B1 (en) * 1998-08-18 2003-09-23 International Business Machines Corporation Dual-use DB9 connector for RS-232 or dual-active controller communication
US6549539B1 (en) * 1998-11-24 2003-04-15 Genesys Telecommunications Laboratories, Inc. Platform-independent DNT intelligent network
US6427132B1 (en) * 1999-08-31 2002-07-30 Accenture Llp System, method and article of manufacture for demonstrating E-commerce capabilities via a simulation on a network
US7010607B1 (en) * 1999-09-15 2006-03-07 Hewlett-Packard Development Company, L.P. Method for training a communication link between ports to correct for errors
WO2001063838A2 (en) 2000-02-22 2001-08-30 Top Layer Networks, Inc. System and method for flow mirroring in a network switch
US6999677B2 (en) * 2000-11-30 2006-02-14 Nortel Networks Limited Protection switching arrangement for an optical switching system
US20030033463A1 (en) * 2001-08-10 2003-02-13 Garnett Paul J. Computer system storage
US7079482B2 (en) * 2001-09-21 2006-07-18 Fujitsu Limited Method and system for test head testing of connections of a SONET element
US7437493B2 (en) * 2001-09-28 2008-10-14 Dot Hill Systems Corp. Modular architecture for a network storage controller
US7752281B2 (en) * 2001-11-20 2010-07-06 Broadcom Corporation Bridges performing remote reads and writes as uncacheable coherent operations
US7047374B2 (en) * 2002-02-25 2006-05-16 Intel Corporation Memory read/write reordering
US7260327B1 (en) * 2002-05-10 2007-08-21 Alcatel Lucent Method and apparatus for supporting operations and maintenance functionality in an optical burst switching network
US7397788B2 (en) * 2002-07-02 2008-07-08 Emulex Design & Manufacturing Corporation Methods and apparatus for device zoning in fibre channel arbitrated loop systems
US7382790B2 (en) * 2002-07-02 2008-06-03 Emulex Design & Manufacturing Corporation Methods and apparatus for switching fibre channel arbitrated loop systems
US7660316B2 (en) * 2002-07-02 2010-02-09 Emulex Design & Manufacturing Corporation Methods and apparatus for device access fairness in fibre channel arbitrated loop systems
JP2004220216A (ja) * 2003-01-14 2004-08-05 Hitachi Ltd San/nas統合型ストレージ装置
US7380163B2 (en) * 2003-04-23 2008-05-27 Dot Hill Systems Corporation Apparatus and method for deterministically performing active-active failover of redundant servers in response to a heartbeat link failure
US7120557B2 (en) * 2003-04-25 2006-10-10 Lsi Logic Corporation Systems and methods for analyzing data of a SAS/SATA device
US7606929B2 (en) * 2003-06-30 2009-10-20 Microsoft Corporation Network load balancing with connection manipulation
US7317722B2 (en) * 2003-08-20 2008-01-08 3Com Corporation System and method for distributed multicast routing
US7474666B2 (en) * 2003-09-03 2009-01-06 Cisco Technology, Inc. Switch port analyzers
US20050053007A1 (en) * 2003-09-09 2005-03-10 Harris Corporation Route selection in mobile ad-hoc networks based on traffic state information
JP4516306B2 (ja) * 2003-11-28 2010-08-04 株式会社日立製作所 ストレージネットワークの性能情報を収集する方法
US7913148B2 (en) * 2004-03-12 2011-03-22 Nvidia Corporation Disk controller methods and apparatus with improved striping, redundancy operations and interfaces
US20060047850A1 (en) * 2004-08-31 2006-03-02 Singh Bhasin Harinder P Multi-chassis, multi-path storage solutions in storage area networks
JP4555029B2 (ja) * 2004-09-01 2010-09-29 株式会社日立製作所 ディスクアレイ装置
US20060061369A1 (en) * 2004-09-20 2006-03-23 Marks Kevin T Information handling system integrated cable tester
US7370128B2 (en) * 2004-10-29 2008-05-06 Intel Corporation Expander device capable of communication protocol translation
US7769831B2 (en) * 2005-03-22 2010-08-03 Lsi Corporation System and method for SAS PHY dynamic configuration
JP4684696B2 (ja) * 2005-03-22 2011-05-18 株式会社日立製作所 記憶制御方法及びシステム
US7711989B2 (en) * 2005-04-01 2010-05-04 Dot Hill Systems Corporation Storage system with automatic redundant code component failure detection, notification, and repair
US7616578B2 (en) * 2005-04-11 2009-11-10 Cisco Technology, Inc. Forwarding traffic flow information using an intelligent line card
US20070081471A1 (en) 2005-10-06 2007-04-12 Alcatel Usa Sourcing, L.P. Apparatus and method for analyzing packet data streams
US20070211640A1 (en) * 2006-03-10 2007-09-13 Mcdata Corporation Switch testing in a communications network

Also Published As

Publication number Publication date
WO2008132027A2 (en) 2008-11-06
CN101669337A (zh) 2010-03-10
JP2010528346A (ja) 2010-08-19
US7936767B2 (en) 2011-05-03
KR101013246B1 (ko) 2011-02-09
EP2151101B1 (en) 2011-07-13
CN101669337B (zh) 2012-12-12
US20080267192A1 (en) 2008-10-30
WO2008132027A3 (en) 2008-12-31
ATE516645T1 (de) 2011-07-15
EP2151101A2 (en) 2010-02-10
KR20090130367A (ko) 2009-12-23

Similar Documents

Publication Publication Date Title
JP5116838B2 (ja) スイッチ・モジュール・システム
US7843836B2 (en) Systems, methods and computer program products for controlling high speed network traffic in server blade environments
Govindan et al. Evolve or die: High-availability design principles drawn from googles network infrastructure
US8204980B1 (en) Storage array network path impact analysis server for path selection in a host-based I/O multi-path system
US11252067B2 (en) Techniques for using frame deep loopback capabilities for extended link diagnostics in fibre channel storage area networks
US8830819B2 (en) Network switch with by-pass tap
TW200907701A (en) Fault recovery on a parallel computer system with a torus network
US9729389B2 (en) Methods and systems for switching network traffic in a communications network
CN112306766A (zh) 用于错误检测的方法、电子设备、存储系统和计算机程序产品
GB2376612A (en) Fault location in a loop network
CA2958590A1 (en) Diagnostic routing system and method for a link access group
JP4724763B2 (ja) パケット処理装置およびインタフェースユニット
US11025518B2 (en) Communicating health status when a management console is unavailable
US20150098317A1 (en) Linear protection switching method and apparatus for protecting network segmented into multi-domain
US20080168161A1 (en) Systems and methods for managing faults within a high speed network employing wide ports
JP4621694B2 (ja) 監視装置及び監視方法
JP5722167B2 (ja) 障害監視判定装置、障害監視判定方法、及びプログラム
KR102018225B1 (ko) 연결 방법
JP7491381B2 (ja) ネットワーク監視装置、ネットワーク監視方法、および、ネットワーク監視プログラム
JP5653947B2 (ja) ネットワーク管理システム、ネットワーク管理装置、ネットワーク管理方法及びネットワーク管理プログラム
US20080270638A1 (en) Systems and methods for monitoring high speed network traffic via simultaneously multiplexed data streams
Aalibagi et al. Low-Overhead Packet Loss Diagnosis for Virtual Private Clouds using P4-Programmable NICs
US20080267060A1 (en) Method, system and computer program product for providing high speed fault tracing within a blade center system
Kendrick Testing the Transport Side of Highly Available Hosts
JP2009267804A (ja) 中継装置、監視装置、異常検知方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100722

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20100722

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20100908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110426

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121016

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151026

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees