JP2014233028A - 通信制御装置、情報処理装置、記憶装置、通信制御方法、及び通信制御プログラム - Google Patents

通信制御装置、情報処理装置、記憶装置、通信制御方法、及び通信制御プログラム Download PDF

Info

Publication number
JP2014233028A
JP2014233028A JP2013113856A JP2013113856A JP2014233028A JP 2014233028 A JP2014233028 A JP 2014233028A JP 2013113856 A JP2013113856 A JP 2013113856A JP 2013113856 A JP2013113856 A JP 2013113856A JP 2014233028 A JP2014233028 A JP 2014233028A
Authority
JP
Japan
Prior art keywords
traffic
iscsi
communication control
storage
dcb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013113856A
Other languages
English (en)
Inventor
豪 梅月
Takeshi Umezuki
豪 梅月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013113856A priority Critical patent/JP2014233028A/ja
Priority to US14/274,869 priority patent/US20140355435A1/en
Priority to EP14168443.1A priority patent/EP2809038B1/en
Publication of JP2014233028A publication Critical patent/JP2014233028A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】DCBネットワークにおいて、iSCSIパケットのフレームロスを阻止する。
【解決手段】ネットワークにおける通信を制御する通信制御装置101は、ネットワークにおける輻輳の発生を判定する判定部102と、当該輻輳の原因となっている装置に通信量を調整するように指示する信号を送信する送信部103と、をそなえる。
【選択図】図6

Description

本件は、通信制御装置、情報処理装置、記憶装置、通信制御方法、及び通信制御プログラムに関する。
イーサネット(登録商標)ネットワーク(NW)は、Internet Small Computer System Interface(iSCSI)やNetwork File System(NFS)を含む一般的なLocal Area Network(LAN)トラフィックを通信可能なネットワークである。
このため、近年iSCSI対応のストレージが増えている。
ここで、LANトラフィックはパケットロスを前提としており、サーバはパケットロスを検出すると、パケットの再送を行なう。一方、iSCSIはLANトラフィックとして扱われるが、ストレージトラフィックはパケットロスを前提としていないため、パケットロスが発生すると、ストレージへのアクセスが行なえなくなることもある。そのため、ストレージアクセスが、業務系トラフィックの影響を受けないようにするために、業務系で使われるイーサネットネットワークとは完全に切り離したストレージ専用のイーサネットネットワークを用意していた。
一方で、Fibre Channel over Ethernet(FCoE)、iSCSI、NFSなどのストレージトラフィックと、LANトラフィックとを混在可能なData Center Bridging(DCB)ネットワークが登場している。
DCBネットワークは、多様なトラフィックが混在するので、多くの帯域を必要とし、10GbEベースで通信される。
DCBネットワークにおいては、1台のスイッチでStorage Area Network(SAN)とLANとを統合する。
DCBネットワークは、イーサネットベースで通信が行なわれるが、FCoEのみパケットロストの発生を防ぐための2つの新しいプロトコルをサポートしており、Fibre Channel(FC)と同レベルの信頼性が担保されている。
このうち、Priority-based Flow Control(PFC;優先度ベースフロー制御)は、一つの物理ポートに論理的な複数の送受信キューを持たせて、複数トラフィックのサービス要求と対応付けを行なう仕組みである。各論理物理ポートは「プライオリティ」と呼ばれ、ストレージ入出力(Input/Output;I/O)やLANなどのトラフィックをいずれかのプライオリティに対応付ける。PFCは、IEEE802.1Qbbとして標準化されている。
他方のEnhanced Transmission Selection(ETS;拡張伝送選択)は、PFCで定義された各プライオリティを「プライオリティグループ(PG)」に対応付け、このPGに対して使用帯域を定義する。ETSは、IEEE802.1Qazとして標準化されている。
特表2005−507201号公報
前述のように、iSCSIはLANトラフィックとして扱われるが、ストレージトラフィックはパケットロスを前提していないため、パケットロスの発生時にストレージへのアクセスが行なえなくなることもある。
図14は、従来の情報処理システム211のシステム構成を示す模式図である。
情報処理システム211は、iSCSIサーバ202、イーサネットスイッチ(SW)203、DBCスイッチ204−1,204−2、iSCSIストレージ205、FCoEサーバ209、及びFCoEストレージ210を有する。
iSCSIサーバ202は、例えば、サーバ機能をそなえたコンピュータであり、iSCSIに対応している。iSCSIサーバ202は、iSCSIストレージ205及びFCoEストレージ210に対してリード/ライト等のディスクアクセスコマンドを送信することにより、iSCSIストレージ205及びFCoEストレージ210が提供する記憶領域にデータの書き込みや読み出しを行なう。
イーサネットスイッチ203は、イーサネットプロトコルに準拠したスイッチであり、イーサネットネットワーク301に接続されている。図14の例では、イーサネットスイッチ203は、iSCSIサーバ202とDCBスイッチ204−1とに接続されている。
DCBスイッチ204−1,204−2は、DCBプロトコルに準拠したスイッチであり、iSCSIトラフィックとFCoEトラフィックとの両方を処理可能である。DCBスイッチ204−1,204−2は、DCBネットワーク401に接続されている。図14の例では、DCBスイッチ204−1はイーサネットスイッチ203とDCBスイッチ204−2とFCoEサーバ209とに接続されている。一方、DCBスイッチ204−2はDCBスイッチ204−1とiSCSIサーバ202と後述するFCoEストレージ210とに接続されている。
iSCSIストレージ205は、iSCSI対応のストレージ装置である。
FCoEサーバ209は、例えば、サーバ機能をそなえたコンピュータであり、FCoEに対応している。FCoEサーバ209は、iSCSIストレージ205及びFCoEストレージ210に対してリード/ライト等のディスクアクセスコマンドを送信することにより、iSCSIストレージ205及びFCoEストレージ210が提供する記憶領域にデータの書き込みや読み出しを行なう。
FCoEストレージ210は、FCoE対応のストレージ装置である。
図1に示すように、iSCSIサーバ202とイーサネットスイッチ203間、イーサネットスイッチ203とDCBスイッチ204−1間、DCBスイッチ204−1,204−2間、及びDCBスイッチ204−2とiSCSIストレージ205間はiSCSIトラフィックが流れる。
一方、FCoEサーバ209とDCBスイッチ204−1間、DCBスイッチ204−1,204−2間、及びDCBスイッチ204−2とFCoEストレージ210間はFCoEトラフィックが流れる。
iSCSIのトラフィックはDCBネットワーク401を通過する際、LANトラフィックとして扱われる。
このため、iSCSIトラフィックには、FCoEと同様のDCBによるQoS(Quality of Service)が適用されず、帯域あふれを起こすと当該iSCSIトラフィックはフレームロストされる。
このため、DCB非対応デバイスの輻輳を制御するコマンドとして、図14の上部に示すフォーマットを有するPause信号が用意されている。Pause信号は、隣接装置に対し、対象の物理ポートの全トラフィックを停止させる。
輻輳が発生した際、このPause信号を発行して、輻輳が発生している物理ポートのトラフィックを全て停止させることが可能である。
しかし、Pause信号は対象物理ポートの全トラフィックを停止させてしまうため、iSCSI以外のトラフィックまで阻害してしまう。
さらに、Pause信号を使用した結果、輻輳が発生している物理ポートに流れ込もうとするトラフィックがバッファからあふれるため、パケットロスが発生する可能性がある。イーサネット環境のアプリケーションはパケットロスを前提としており、iSCSIサーバ202は、ロストパケットを検出すると、ロスしたパケットを再送する。
その際、iSCSIサーバ202は、輻輳を再度発生させないように転送レートを落としてパケットを再送するため、システム全体の性能が低下してしまう。
本発明は、このような課題に鑑み創案されたもので、DCBネットワークにおいて、iSCSIパケットのフレームロスを阻止することを目的とする。
なお、前記目的に限らず、後述する発明を実施するための形態に示す各構成により導かれる作用効果であって、従来の技術によっては得られない作用効果を奏することも本発明の他の目的の1つとして位置付けることができる。
上記の目的を達成するために、本開示の通信制御装置は、ネットワークにおける通信を制御する通信制御装置であって、前記ネットワークにおける輻輳の発生を判定する判定部と、前記輻輳の原因となっている装置に通信量を調整するように指示する信号を送信する送信部と、をそなえる。
又、本開示の情報処理装置は、上記の通信制御装置をそなえる。
又、本開示の記憶装置は、上記の通信制御装置をそなえる。
さらに、本開示の通信制御方法は、ネットワークにおける通信を制御する通信制御方法であって、前記ネットワークにおける輻輳の発生を判定し、前記輻輳の原因となっている装置に通信量を調整するように指示する信号を送信する。
さらに、本開示の通信制御プログラムは、ネットワークにおける通信を制御する通信制御プログラムであって、前記ネットワークにおける輻輳の発生を判定し、前記輻輳の原因となっている装置に通信量を調整するように指示する信号を送信する処理をコンピュータに実行させる。
開示の技術によれば、DCBネットワークにおいて、iSCSIパケットのフレームロスを阻止することができる。
実施形態の一例としての情報処理システムのシステム構成を示す模式図である。 実施形態の一例としての情報処理システムで使用されるL3 Pause信号のフォーマットを例示する模式図である。 (a)は、実施形態の一例としての情報処理システムで使用されるL3 Pause許可要求のフォーマットを例示する模式図であり、(b)は、L3 Pause許可応答のフォーマットを例示する模式図である。 (a)は、実施形態の一例としての情報処理システムで使用される隣接装置確認要求のフォーマットを例示する模式図であり、(b)は、隣接装置確認応答のフォーマットを例示する模式図である。 実施形態の一例としての情報処理システムのシステム構成を示す模式図である。 実施形態の一例としての輻輳制御部の機能構成を示す模式図である。 実施形態の一例としてのトラフィック管理データベースの構成を例示する図である。 実施形態の一例としての情報処理システムにおける処理フローを示すタイムチャートである。 実施形態の一例としての情報処理システムにおける処理の詳細を示すフローチャートである。 実施形態の一例としての情報処理システムにおける処理の詳細を示すフローチャートである。 実施形態の一例としての情報処理システムにおける処理の詳細を示すフローチャートである。 実施形態の一例としての情報処理システムにおける処理の詳細を示すフローチャートである。 実施形態の変形例としての情報処理システムのシステム構成を示す模式図である。 従来の情報処理システムのシステム構成を示す模式図である。
以下、図面を参照して実施の形態を説明する。
(A)構成
最初に、図1〜図5を用いて、実施形態の一例としての情報処理システム1の構成について説明する。
図1,図5は、実施形態の一例としての情報処理システム1のシステム構成を示す模式図である。図2〜図4は、実施形態の一例としての情報処理システムで使用されるL3(Layer 3) Pause関連の信号のフォーマットを例示する模式図である。詳細には、図2は、L3 Pause信号のフォーマットを例示する模式図である。図3(a)は、実施形態の一例としての情報処理システムで使用される隣接装置確認要求のフォーマットを例示する模式図であり、図3(b)は、隣接装置確認応答のフォーマットを例示する模式図である。図4(a)は、実施形態の一例としての情報処理システムで使用されるL3 Pause許可要求のフォーマットを例示する模式図であり、図4(b)は、L3 Pause許可応答のフォーマットを例示する模式図である。
情報処理システム1は、iSCSIサーバ(情報処理装置)2、イーサネットスイッチ3、DBCスイッチ4−1,4−2、iSCSIストレージ(記憶装置)5、FCoEサーバ9、及びFCoEストレージ10を有する。
iSCSIサーバ2は、例えば、サーバ機能をそなえたコンピュータであり、iSCSIに対応している。iSCSIサーバ2は、iSCSIストレージ5及びFCoEストレージ10に対してリード/ライト等のディスクアクセスコマンドを送信することにより、iSCSIストレージ5及びFCoEストレージ10が提供する記憶領域にデータの書き込みや読み出しを行なう。
イーサネットスイッチ3は、イーサネットプロトコルに準拠したスイッチであり、イーサネットネットワーク300に接続されている。図1の例では、イーサネットスイッチ3は、iSCSIサーバ2とDCBスイッチ4−1とに接続されている。
DCBスイッチ4−1,4−2は、DCBプロトコルに準拠したスイッチであり、iSCSIトラフィックとFCoEトラフィックとの両方を処理可能である。DCBスイッチ4−1,4−2は、DCBネットワーク400に接続されている。図1の例では、DCBスイッチ4−1はイーサネットスイッチ3とDCBスイッチ4−2とFCoEサーバ9とに接続されている。一方、DCBスイッチ4−2はDCBスイッチ4−1とiSCSIサーバ2と後述するFCoEストレージ10とに接続されている。
DCBスイッチ4−1,4−2は、後述するように、1つのDCBスイッチ群を構成している。
なお、以下、DCBスイッチを示す符号としては、複数のDCBスイッチのうち1つを特定する必要があるときには符号4−1,4−2を用いるが、任意のDCBスイッチを指すときには符号4を用いる。
iSCSIストレージ5は、iSCSI対応のストレージ装置である。
FCoEサーバ9は、例えば、サーバ機能をそなえたコンピュータであり、FCoEに対応している。FCoEサーバ9は、iSCSIストレージ5及びFCoEストレージ10に対してリード/ライト等のディスクアクセスコマンドを送信することにより、iSCSIストレージ5及びFCoEストレージ10が提供する記憶領域にデータの書き込みや読み出しを行なう。
FCoEストレージ10は、FCoE対応のストレージ装置である。
位で格納する。
以下、iSCSIサーバ2とiSCSIストレージ5とを総称して、iSCSIデバイス2,5とも呼ぶことがある。
又、FCoEサーバ9とFCoEストレージ10とを総称して、FCoEデバイス9,10とも呼ぶことがある。
図1に示すように、iSCSIサーバ2とイーサネットスイッチ3間、イーサネットスイッチ3とDCBスイッチ4−1間、DCBスイッチ4−1,4−2間、及びDCBスイッチ4−2とiSCSIストレージ5間はiSCSIトラフィックが流れる。
一方、FCoEサーバ9とDCBスイッチ4−1間、DCBスイッチ4−1,4−2間、及びDCBスイッチ4−2とFCoEストレージ10間はFCoEトラフィックが流れる。
本情報処理システム1は、FCoEトラフィックとiSCSIトラフィックとを、ストレージトラフィックとして、1つの帯域制御ポリシーを用いて扱い、DCBネットワーク400内でのストレージトラフィックの通信ポリシーを一元化する。
このため、情報処理システム1においては、iSCSIのリンク確立(iSCSI Loginネゴシエーション)が判定され、iSCSIをFCoEと同じ通信ポリシーにグルーピングする。このグルーピング時には、セキュリティを確保するために、後述する認証処理が実行される。
又、本情報処理システム1においては、ネットワークで輻輳が発生してPFCが動作する際に、iSCSIトラフィックの量を制御して輻輳を解消するために、L3 Pause信号(以下、L3 Pauseとも呼ぶ)というフレームが使用される。
L3 Pause信号のフォーマット500の例を図2に示す。
L3 Pause信号は、例えば、操作コード503と中断時間504とを含む。
操作コード503は、L3 Pause信号による操作を示すコードである。操作コード503は、例えば、トラフィックの送信を中断する“一時停止”を示す0×0001や、トラフィックの送信を開始する“開始”を示す0×0002などの値を取る。
中断時間は、トラフィックを中断する時間を、例えばミリ秒(ms)単位で、0〜65535の範囲で指定する。操作コードに“開始”を指定する場合は、例えば、中断時間に“0ms”が設定される。なお、この中断時間は、例えば、ETS/PFCで実装されているものなど、公知の手法を用いて算出することができ、ここではその詳細について説明を省略する。
図14に示したMACレベルのPause信号は隣接装置にしか送信されないため、遅延時間は考慮されないが、L3 Pause信号は、輻輳発生の原因となっているiSCSIトラフィックの送信元のデバイスにまで送信される。このため、遠隔のデバイスの存在も考慮して、L3 Pause信号に設定される中断時間には、当該デバイスへの伝送に要する遅延時間も加味される。
又、特定のデバイスに輻輳が偏らないように、流量/遅延時間に応じてL3 Pauseにより中断を指示するデバイスの中断時間を調整することで、輻輳を分散(ロードバランス)させる。
又、L3 Pause信号が、通信経路上のデバイスではないデバイスから不当に送信されて通信が妨害されることのないように、L3 Pause信号の送信元のデバイスが経路上のデバイスであることを保証するための認証処理が行なわれる。
図1の例では、(1)まず、iSCSIサーバ2がiSCSIストレージ5に対してログイン要求を送信し、iSCSIストレージ5がiSCSIサーバ2にログイン応答を返す。この際、DCBスイッチ4−1が、iSCSIサーバ2とiSCSIストレージ5間でのiSCSIのリンク確立を判別し、iSCSIを、FCoEと同じ通信ポリシーにグルーピングする。
(2)iSCSIサーバ2から送信されるiSCSIトラフィックがDCBスイッチ4−1の1つの物理ポートであふれて輻輳が発生すると、DCBスイッチ4−1においてPFCが動作する。その際、DCBスイッチ4−1は、iSCSIサーバ2に宛ててL3 Pause信号を発行する。
(3)DCBスイッチ4−1から、L3 Pause信号がIP(Internet Protocol)、つまりL3レベルでイーサネットスイッチ3に送信され、イーサネットスイッチ3を経由してiSCSIサーバ2に送信される。
(4)iSCSIサーバ2は、L3 Pause信号を受信すると、iSCSIトラフィックの流量の制御を行なう。
又、実施形態の一例としての情報処理システム1で使用されるL3 Pause許可要求及びL3 Pause許可応答のフォーマット例を図3(a),(b)に示す。
図3(a)に示すL3 Pause許可要求は、IPヘッダ、L3 Pause要求コード、L3 Pause許可要求元情報、認証先デバイス情報、及びDCB−NW IDの各フィールドを含む。
IPヘッダは、当該L3 Pause許可要求メッセージに付与されたIPヘッダである。IPヘッダは当業界において周知であるためその説明を省略する。
L3 Pause要求コードには、当該メッセージがL3 Pause要求であることを示す値が設定される。
L3 Pause許可要求元情報には、L3 Pause許可要求を要求しているデバイスを示す識別子が設定される。
認証先デバイス情報には、認証先のデバイスを示す識別子が設定される。
DCB−NW IDには、輻輳を検知したDCBネットワーク400を識別する一意の識別子(ID)が設定される。この値は後述するように暗号化される。
図3(b)に示すL3 Pause許可応答は、IPヘッダ、L3 Pause応答コード、L3 Pause許可要求元情報、認証先デバイス情報、及びDCB−NW IDの各フィールドを含む。
IPヘッダは、当該L3 Pause許可応答メッセージに付与されたIPヘッダである。
L3 Pause応答コードには、当該メッセージがL3 Pause応答であることを示す値が設定される。
L3 Pause許可要求元情報には、L3 Pause許可要求を要求しているデバイスを示す識別子が設定される。
認証先デバイス情報には、認証先のデバイスを示す識別子が設定される。
DCB−NW IDには、輻輳を検知したDCBネットワーク400を識別する一意の識別子(ID)が設定される。
又、隣接装置確認要求及び隣接装置確認応答のフォーマット例を図4(a),(b)に示す。
図4(a)に示す隣接装置確認要求は、IPヘッダ、L3 Pause認証コード、隣接装置確認要求元情報、認証先デバイス情報、及びDCB−NW IDの各フィールドを含む。
IPヘッダは、当該隣接装置確認要求メッセージに付与されたIPヘッダである。
L3 Pause認証コードには、当該メッセージが隣接装置確認要求であることを示す値が設定される。
隣接装置確認要求元情報には、隣接装置確認要求を要求しているデバイスを示す識別子が設定される。
認証先デバイス情報には、認証先のデバイスを示す識別子が設定される。
DCB−NW IDには、輻輳を検知したDCBネットワーク400を識別する一意の識別子(ID)が設定される。この値は後述するように暗号化される。
図4(b)に示す隣接装置確認応答は、IPヘッダ、L3 Pause認証応答コード、隣接装置確認要求元情報、認証先デバイス情報、及びDCB−NW IDの各フィールドを含む。
IPヘッダは、当該隣接装置確認要求メッセージに付与されたIPヘッダである。
L3 Pause認証応答コードには、当該メッセージが隣接装置確認応答であることを示す値が設定される。
隣接装置確認要求元情報には、隣接装置確認要求を要求しているデバイスを示す識別子が設定される。
認証先デバイス情報には、認証先のデバイスを示す識別子が設定される。
DCB−NW IDには、輻輳を検知したDCBネットワーク400を識別する一意の識別子(ID)が設定される。
図5は、実施形態の一例としての情報処理システム1のシステム構成を示す模式図である。
この図5の例では、DCBスイッチ4が1台しか図示されていないが、DCBスイッチ4は図1に示すように多段(図1の例では2段)で設けられても、図5に示すようにDCBスイッチ4の段数が1段でもよい。
iSCSIサーバ2は、Central Processing Unit(CPU)21、メモリ22、記憶装置23及び媒体リーダ24をそなえる。
CPU21は、種々の制御や演算を行なう処理装置であり、後述する記憶装置23やRead Only Memory(ROM)等に格納されたプログラムを実行することにより、種々の機能を実現する。
メモリ22は、CPU21が実行するプログラムや種々のデータや、CPU21の処理により得られたデータ等を格納する。メモリ22としては、例えば、Random Access Memory(RAM)、ROMなど、既存の種々のメモリを使用することができる。又、複数種類のメモリをそなえていてもよい。
記憶装置23は、iSCSIサーバ2の記憶域を提供しており、例えば、iSCSIサーバ2で実行されている不図示のOperating System(OS)や、後述する輻輳制御プログラム121などの各種プログラムを記憶している。記憶装置23は、例えばHard Disk Drive(HDD)又はSolid State Drive(SSD)である。
媒体リーダ24は、CD(CD−ROM,CD−R,CD−RW等),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RW等)、Blu Rayなどの記録媒体122の読み書きを行なうドライブ装置である。図5では媒体リーダ24がiSCSIサーバ2の外付けのドライブとして表示されているが、媒体リーダ24がiSCSIサーバ2に内蔵されていてもよい。
イーサネットスイッチ3は、CPU31、メモリ32、記憶装置33、及び物理ポート35−1〜35−6をそなえる。
CPU31は、種々の制御や演算を行なう処理装置であり、HDD33や不図示のROM等に格納されたプログラムを実行することにより、各種処理を実行する。
メモリ32は、CPU31が実行するプログラムや種々のデータや、CPU31の処理により得られたデータ等を格納する。メモリ32としては、例えば、RAM、ROMなど、既存の種々のメモリを使用することができる。又、複数種類のメモリをそなえていてもよい。
記憶装置33は、イーサネットスイッチ3の記憶域を提供しており、例えば、イーサネットスイッチ3で実行されている不図示のOSや各種プログラムを記憶している。記憶装置33は、例えばHDD又はSSDである。
物理ポート35−1〜35−6は、イーサネットスイッチ3に接続される機器同士を接続する物理ポートである。
なお、以下、物理ポートを示す符号としては、複数の物理ポートのうち1つを特定する必要があるときには符号35−1〜35−6を用いるが、任意の物理ポートを指すときには符号35を用いる。
イーサネットスイッチ3の物理ポート35−3は、LANケーブル6を介してiSCSIサーバ2に接続されている。
又、イーサネットスイッチ3の物理ポート35−6は、LANケーブル6を介してDCBスイッチ4の物理ポート45−1に接続されている。
DCBスイッチ4は、CPU41、メモリ42、記憶装置43、及び物理ポート45−1〜45−6をそなえる。
CPU41は、種々の制御や演算を行なう処理装置であり、HDD43やROM等に格納されたプログラムを実行することにより、各種処理を実行する。
メモリ42は、CPU41が実行するプログラムや種々のデータや、CPU41の処理により得られたデータ等を格納する。メモリ42としては、例えば、RAM、ROMなど、既存の種々のメモリを使用することができる。又、複数種類のメモリをそなえていてもよい。
記憶装置43は、DCBスイッチ4の記憶域を提供しており、例えば、DCBスイッチ4で実行されている不図示のOS、後述する輻輳制御プログラム121などの各種プログラム、及びトラフィック管理データベース(DB)(記憶部)44を記憶している。記憶装置43は、例えばHDD又はSSDである。
トラフィック管理データベース44は、情報処理システム1においてやり取りされるトラフィックに関する情報を記憶しているデータベースである。トラフィック管理データベース44については、図7を参照して詳述する。
物理ポート45−1〜45−6は、DCBスイッチ4に接続される機器同士を接続する物理ポートである。
なお、以下、物理ポートを示す符号としては、複数の物理ポートのうち1つを特定する必要があるときには符号45−1〜45−6を用いるが、任意の物理ポートを指すときには符号45を用いる。
前述のように、DCBスイッチ4の物理ポート45−1は、LANケーブル7を介してイーサネットスイッチ3の物理ポート35−6に接続されている。
又、DCBスイッチ4の物理ポート45−4は、LANケーブル8を介してiSCSIストレージ5に接続されている。
なお、DCBスイッチ4はiSCSIサーバ2に直接接続されておらず、イーサネットスイッチ3を仲介して接続されている。
iSCSIストレージ5は、iSCSIサーバ2からリード/ライト等のディスクアクセスコマンドを受信して、iSCSIストレージ5の記憶領域に対するデータの書き込みや読み出しを行なう。
iSCSIストレージ5は、CPU51、メモリ52をそなえると共に、輻輳制御プログラム121を格納している。
CPU51は、種々の制御や演算を行なう処理装置であり、不図示のROM等に格納されたプログラムを実行することにより、種々の機能を実現する。
メモリ52は、CPU51が実行するプログラムや種々のデータや、CPU51の処理により得られたデータ等を格納する。メモリ52としては、例えば、RAM、ROMなど、既存の種々のメモリを使用することができる。又、複数種類のメモリをそなえていてもよい。
図6は、実施形態の一例としての輻輳制御部101の機能構成を示す模式図である。
DCBスイッチ4のCPU41は、記憶装置43に格納されている輻輳制御プログラム121を実行することにより、輻輳制御部(通信制御装置)101として機能する。
又、iSCSIサーバ2のCPU21とiSCSIストレージ5のCPU51とも、記憶装置6に格納されている輻輳制御プログラム121を実行することにより、輻輳制御部101として機能する。
輻輳制御部101は、受信部(判定部)102、送信部103、データベース管理部104、負荷分散部105、及びトラフィック調整部106をそなえる。
受信部102は、DCBネットワーク400内を流れているフレーム及びトラフィックを監視して、フレームがiSCSIフレームであるか、FCoEフレームであるかを判定する。又、受信部102は、DCBスイッチ4の物理ポート45でトラフィック流量を求めて、バッファの容量と比較し、トラフィック流量があふれそうかどうかを判定し、あふれそうなときは輻輳が発生していると判定する。
又、受信部102は、輻輳発生時にトラフィック流量を制御するためのIPレベルのコマンドであるL3 Pause信号を受信する。その際、受信部102は、通信経路外のDCBスイッチからのL3 Pause信号を排除するために、受信したL3 Pause信号が、通信経路上の正当な他のDCBスイッチから送信されたものであるかどうかの認証を行なう。例えば、受信部102は、iSCSIのログインシーケンスを検知した際、L3 Pause信号の送信元のDCBスイッチが、iSCSIサーバ2及びiSCSIストレージ5間の経路に存在するかどうかを判定して認証を行なう。
送信部103は、受信部102により輻輳が発生していると判定された場合に、iSCSIサーバ2に対してトラフィック流量を軽減するための指示であるL3 Pauseを生成して、これを送信する。又、後述するトラフィック調整部106は、FCoEデバイスに対しては、PFCを発行することでトラフィック流量を調整する。
負荷分散部105は、受信部102により輻輳が発生していると判定された場合に、各トラフィックの転送量に応じたロードバランスの配分を算出する。詳細には、iSCSIデバイス2,5にL3 Pause信号を指示する際には、ネットワークの遅延時間も考慮して中断時間を配分する。この処理の詳細については後述する。
トラフィック調整部106は、受信部102が受信したL3 Pause信号に従って、トラフィック流量の調整を行なう。この処理の詳細については後述する。
データベース管理部104は、トラフィック管理データベース44へのデータの書き込み及びデータ更新を行なう。
図7は、実施形態の一例としてのトラフィック管理データベース44の構成を例示する図である。
トラフィック管理データベース44は、番号(No)441、送信元IP442、宛先IP443、送信元MAC444、宛先MAC445、DCB−NW ID446、及びDCB−NW入力物理ポート457の各フィールドを有する。又、トラフィック管理データベース44は、DCB−NW出力物理ポート458、L3 Pause449、送信遅延時間450、及び単位時間の転送量451の各フィールドも有する。
番号フィールド441は、トラフィック管理データベース44内でトラフィックデータを一意に識別する識別子(ID)を格納する。
送信元IPフィールド442は、当該トラフィックがIPトラフィックの場合、IPトラフィックの送信元デバイスのIPアドレスを格納する。FCoEトラフィックの場合は、FCoEトラフィックであることを示す情報(例えば、図7の例では“−(FCoE)”)が書き込まれる。
宛先フィールド443は、当該トラフィックがIPトラフィックの場合、IPトラフィックの宛先デバイスのIPアドレスを格納する。FCoEトラフィックの場合は、FCoEトラフィックであることを示す情報が記録される。
送信元MACフィールド444は、当該トラフィックの送信元デバイスのMACアドレスを格納する。
宛先MACフィールド445は、当該トラフィックの宛先デバイスのMACアドレスを格納する。
DCB−NW IDフィールド446は、当該トラフィックを検知したDCBネットワーク400を識別する一意の識別子(ID)を格納する。
DCB−NW入力物理ポートフィールド447は、前述のDCB−NW IDフィールド446の値に対応するDCBネットワーク400に対応するDCBスイッチ4の入力物理ポートのポート番号を格納する。
DCB−NW出力物理ポートフィールド448は、前述のDCB−NW IDフィールド446の値に対応するDCBネットワーク400に対応するDCBスイッチ4の出力物理ポートのポート番号を格納する。
L3 Pauseフィールド449は、そのトラフィックが、L3 Pause信号の使用を許可されているかどうかを示す値を格納する。例えば、図9〜図12の例では、L3 Pause信号の使用を許可されている場合は“○”が、L3 Pause信号の使用を許可されていない場合が“×”が、許可されているかが不明な場合は“?”が、それぞれL3 Pauseフィールド449に記憶される。
送信遅延時間フィールド450は、送信遅延時間の値を、例えばミリ秒(ms)単位で格納する。
単位時間の転送量フィールド451は、単位時間あたりの転送量を、例えばGbps単位で格納する。
なお、上記の実施形態においては、iSCSIサーバ2、DCBスイッチ4、及びiSCSIストレージ5のCPU21,41,51が、輻輳制御部101、受信部102、送信部103、データベース管理部104、負荷分散部105、及びトラフィック調整部106として機能するようになっている。
なお、輻輳制御部101、受信部102、送信部103、データベース管理部104、負荷分散部105、及びトラフィック調整部106としての機能を実現するためのプログラム(輻輳制御プログラム121)は、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RW等),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RW等),磁気ディスク,記憶媒体,光磁気ディスク等の、コンピュータ読取可能な記録媒体122に記録された形態で提供される。そして、コンピュータは媒体リーダ24を介してその記録媒体122からプログラムを読み取って内部記憶装置又は外部記憶装置に転送し格納して用いる。又、そのプログラムを、例えば磁気ディスク,記憶媒体,光磁気ディスク等の記憶装置(本実施形態では記録媒体122)に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。
輻輳制御部101、受信部102、送信部103、データベース管理部104、負荷分散部105、及びトラフィック調整部106としての機能を実現する際には、内部記憶装置(本実施形態ではメモリ22,32,52や記憶装置23,43)に格納されたプログラムがコンピュータのマイクロプロセッサ(本実施形態ではCPU21,41,51)によって実行される。このとき、記録媒体122に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。
なお、本実施形態において、コンピュータとは、ハードウェアとオペレーティングシステムとを含む概念であり、オペレーティングシステムの制御の下で動作するハードウェアを意味している。又、オペレーティングシステムが不要でアプリケーションプログラム単独でハードウェアを動作させる場合には、そのハードウェア自体がコンピュータに相当する。ハードウェアは、少なくとも、CPU等のマイクロプロセッサと、記録媒体に記録されたコンピュータプログラムを読み取るための手段とをそなえており、本実施形態においては、iSCSIサーバ2、DCBスイッチ4、及びiSCSIストレージ5がコンピュータとしての機能を有しているのである。
(B)動作
次に、図8〜図12を用いて、実施形態の一例としての情報処理システム1における輻輳制御処理について説明する。
最初に、図8を用いて、情報処理システム1における輻輳制御処理の概略を説明する。
図8は、実施形態の一例としての情報処理システム1における処理フローを示すタイムチャート(ステップS1〜S10)である。
ここで、DCBスイッチ4−1と4−2とは、ID=10のDCBネットワーク400に接続された1つのスイッチ群を形成しており、このスイッチ群の代表IPアドレスとして“xx.xx.xx.xx”が設定されている。
まず、ステップS1において、DCBスイッチ4−2とiSCSIストレージ5との間でLink Layer Discovery Protocol(LLDP)を用いて、隣接する装置の装置情報が収集される。このとき送信されるLLDPデータには、Type(T)、Length(L)、及びValue(V)の3フィールドから構成される基本要素により、装置情報が送信される。この処理については公知であるため説明は省略する。
その後、ステップS2において、iSCSIサーバ2がiSCSIストレージ5に対し、ログイン要求(LoginReq)を送信する。
iSCSIサーバ2からログイン要求(LoginReq)を受信すると、iSCSIストレージ5はiSCSIストレージ5にログイン応答(LoginRsp)を返信する。ログイン要求及びログイン応答については公知であるため説明は省略する。
iSCSIストレージ5が応答した場合、DCBスイッチ4−1は、ストレージトラフィック(iSCSI/FCoE)をグルーピングする。ここで、グルーピングとは、iSCSI及びFCoEのストレージトラフィックを、トラフィック管理データベース44で一元的に管理することを指す。
一方、iSCSIストレージ5が応答しない場合、ストレージトラフィック(iSCSI/FCoE)のグルーピングが実行されず、以降、iSCSIトラフィックが通常のLANトラフィックとして処理される。
ステップS4において、DCBスイッチ4−1がiSCSIサーバ2にL3 Pause許可要求(L3 Pause Request;図4参照)を送信する。
次に、ステップS5において、iSCSIサーバ2がiSCSIストレージ5に隣接装置確認要求(Check Request;図4参照)を送信する。
ステップS6において、iSCSIサーバ2から隣接装置確認要求(Check Request;図3(a)参照)を受信したiSCSIストレージ5は、隣接装置確認応答(Check Response;図3(b)参照)をiSCSIサーバ2に返信する。
次に、ステップS7において、iSCSIサーバ2は、ステップS4で受信したL3 Pause許可要求(L3 Pause Request)に対する返信として、DCBスイッチ4−1にL3 Pause許可応答(L3 Pause Response)を送信する。
ステップS8において、iSCSIサーバ2がiSCSIストレージ5に対してI/O Read/Writeを行なう。
DCBスイッチ4−1が輻輳を検知すると、iSCSIサーバ2に対してL3 Pause信号を発行する。この処理の詳細については、図12を参照して後述する。
L3 Pause信号が送信されると、輻輳を解消するために帯域制御が行なわれる。この処理の詳細については、図12を参照して後述する。
その後、ステップS10において、iSCSIサーバ2のトラフィック調整部106が帯域を制限し、iSCSIサーバ2がiSCSIストレージ5に対してI/O Read/Writeを行なう。
次に、図9〜図12を参照して、図8の処理をさらに詳細に説明する。
図9〜図12は、実施形態の一例としての情報処理システム1における処理の詳細を示すフローチャート(ステップS11〜S48)である。
図9のステップS11において、DCBスイッチ4の受信部102は、DCBネットワーク400内を流れているフレーム/トラフィック流量の監視を開始する。
FCoEトラフィックの場合(「FCoEトラフィック」ルート参照)、ステップS12において、受信部102は、DCBネットワーク400に接続されたFCoEフレーム(EtherType:0x8906)を検出する。
ステップS13において、データベース管理部104は、ステップS12で検出したフレームの情報を、トラフィック管理データベース44に書き込む。
このとき、DCBスイッチ4のトラフィック管理データベース44には、図9に示すNo.1のエントリのデータが登録される。
No.1のエントリは、FCoEのトラフィックであり、L3 Pause信号の使用が許可されており、伝送遅延時間は0ms、単位時間の転送量は5Gbpsであることを示す。
ここで、FCoEデバイス9,10は、DCBに対応しており、特定のデバイスに対するトラフィックの制御が可能である。そのため、受信部102は、FCoEデバイス9,10については、L3 Pause対応か非対応かを判定する必要はない。
一方、iSCSIトラフィックの場合(「iSCSIトラフィック」ルート参照)、ステップS14において、DCBスイッチ4の受信部102は、DCBネットワーク400内を流れているiSCSIログインシーケンスのフレームを、例えば、ポート3260で検出する。
そして、ステップS15において、データベース管理部104は、ステップS14で検出したフレームの情報を、DCBスイッチ4のトラフィック管理データベース44に書き込む。
このとき、トラフィック管理データベース44には、図9に示すNo.2,3のエントリのデータが登録される。
No.2,3のエントリのトラフィックは、IPトラフィックであり、L3 Pause信号の使用の可否、伝送遅延時間、単位時間の転送量は、未だL3 Pause許可が行なわれていないため未知であるため、対応するフィールドの値に“?”が示されている。
ステップS15において、送信部103は、ステップS14で検出したフレームの送信元のiSCSIサーバ2に対して送信するL3 Pause許可要求(L3 Pause Request;図4参照)フレームを生成する。
このL3 Pause許可要求フレームには、例えば、認証先デバイス情報(非暗号化)、L3 Pause許可要求元情報(非暗号化)、及びDCBネットワークID(暗号化)がそれぞれ記載される。例えば、図9のトラフィック管理データベース44のNo.2のエントリの場合、認証先デバイス情報として、宛先iSCSIストレージ5のIP及びMACアドレスを示す“bb.bb.bb.bb/BBB”が、L3 Pause許可要求元情報として、DCBネットワーク400の代表IPアドレスの“xx.xx.xx.xx”が、暗号化されずに記載される。さらに、DCBネットワークIDとして、DCBネットワーク400のIDである“10”が暗号化されて記載される。
この暗号化は、例えば、DCBネットワーク400で最後にiSCSIトラフィックを転送した物理ポートのMACアドレスを暗号化キーに用いて行なう。つまり、使用される暗号化キーは、DCBネットワーク出力ポートのMACアドレスである。
ステップS16において、送信部103は、生成したL3 Pause許可要求フレームを送信する。
ステップS17において、受信部102は、iSCSIサーバ2からL3 Pause許可応答(L3 Pause Response;図4参照)の受信を所定時間待機する。所定時間が経過しても、L3 Pause許可応答が返されない場合、データベース管理部104は、トラフィック管理データベース44のL3 Pauseフィールド449の値を、“×”に変更する。
次に、図10のステップS19において、iSCSIサーバ2は、図9のステップS16で送信されたDCBネットワーク400からのL3 Pause許可要求を受信する。
iSCSIサーバ2がL3 Pauseに対応していないL3 Pause非対応デバイスの場合、ステップS20において、iSCSIサーバ2は、ステップS19で受信したL3 Pause許可要求のフレームを破棄する。例えば、図9のトラフィック管理データベース44のNo.3のトラフィックの場合、トラフィックがここで破棄されてもよい。
一方、iSCSIサーバ2がL3 Pauseに対応しているL3 Pause対応デバイスの場合、ステップS21において、iSCSIサーバ2の送信部103は、iSCSIストレージ5に隣接装置確認要求(Check Request;図3(a)参照)を送信する。このときの隣接装置確認要求フレームの内容は、図9のトラフィック管理データベース44のNo.2のエントリの例では、DCBスイッチ4から送信された暗号化情報を、隣接装置確認要求としてそのまま転送する。
ステップS22において、iSCSIストレージ5は、隣接装置確認要求を、ステップS21で送信されたDCBネットワーク400からのL3 Pause許可要求として受信する。
iSCSIストレージ5がL3 Pause非対応デバイスの場合、ステップS23において、iSCSIストレージ5は、ステップS22で受信したL3 Pause許可要求フレームを破棄する。例えば、図9のトラフィック管理データベース44のNo.3のトラフィックの場合、トラフィックがここで破棄されてもよい。
一方、iSCSIストレージ5がL3 Pause対応デバイスの場合、ステップS24において、iSCSIストレージ5の受信部102は、DCBスイッチ4から事前にLLDPで受信している隣接MACアドレスを復号キーとして復号する。そして復号した内容を比較して認証処理を行なう。
復号内容が一致しないか、或いは復号に失敗した場合(ステップS24の「不一致or復号失敗」ルート参照)、ステップS25において、受信部102は、不正な要求であると判定し、処理を中断する。
復号内容が一致する場合(ステップS24の「一致」ルート参照)、ステップS26において、受信部102は、正しいネットワーク経路上のデバイスからの要求であると判定する。そして、iSCSIストレージ5の送信部103は、iSCSIサーバ2に隣接装置確認応答(Check Response;図3(b)参照)を返信する。
次に、図11のステップS27において、iSCSIサーバ2の受信部102は、図10のステップS26で送信されたiSCSIストレージ5からの隣接装置確認応答を受信する。
ステップS28において、iSCSIサーバ2の送信部103は、L3 Pause許可要求元であるDCBネットワーク400の代表IPからのL3 Pause信号を以後許可する。
ステップS29において、iSCSIサーバ2送信部103は、L3 Pause許可応答をDCBスイッチ4に送信する。
ステップS30において、DCBスイッチ4の受信部102は、ステップS29でiSCSIサーバ2から送信されたL3 Pause許可応答を受信する。
ステップS31において、DCBスイッチ4のデータベース管理部104は、トラフィック管理データベース44のNo.2のエントリのL3 Pauseフィールドの値を、図11のトラフィック管理データベース44に示すように、“○”に変更する。
その後ステップS32において、DCBスイッチ4の受信部102は、トラフィックの遅延時間及び単位時間の転送量を定期的に測定する。そして、データベース管理部104は、これらの実測値により、トラフィック管理データベース44の遅延時間フィールド450及び単位時間の転送量フィールド451の値を、例えば、図11の状態に更新する。
図12は、本情報処理システム1において輻輳が発生した場合を示す。
図12のステップS40において、DCBスイッチ4の受信部102は、イーサネットトラフィックとストレージトラフィックとの合計が、帯域を上回っていること(帯域あふれ)を検知する。ここでは、例えば、ストレージトラフィックが最大で合計6Gbpsという帯域制御ポリシーが適用されている場合に、10Gbpsの帯域に対し、12Gbpsの要求が発生したとする。
FCoEトラフィック(「FCoEトラフィック」ルート参照)の場合、ステップS41において、DCBスイッチ4の送信部103は、FCoEトラフィックについて、PFCを使用して、FCoEトラフィックの停止信号を送信する。PFC及びFCoEのトラフィック停止信号については、広く用いられているため、ここではその詳細を省略する。
一方、iSCSIトラフィックの場合(「iSCSIトラフィック」ルート参照)、ステップS42において、DCBスイッチ4の負荷分散部105は、トラフィック管理データベース44より、帯域あふれをおこしたポートのトラフィックを抽出し、必要なトラフィック中断時間を算出する。ここで、負荷分散部105は、帯域あふれを起こした物理ポートのストレージトラフィックの合計を8Gbpsと算出したとする。又、負荷分散部105は、8Gbpsのストレージトラフィックを帯域制御ポリシーで許容されている6Gbpsに減らすには、全ストレージトラフィック通信を4ms中断する必要があると算出したとする。
ステップS43において、負荷分散部105は、トラフィックのバランスを変えないようにロードバランスを行なうため、ステップS42で求めた中断時間をトラフィック間で配分する。例えば、トラフィック管理データベース44のL3 Pauseフィールド449の値が“○”である全トラフィックについて、そのトラフィックの単位時間の転送量フィールド451の値に応じて中断時間を配分する。
例えば、図11に示したデータの場合、No.1のエントリのトラフィックは遅延0ms、転送量5Gbpsであるので、No.1のトラフィックの遅延時間=4ms×(8Gbps−5Gbps)/8Gbps=1.5msとなる。
又、No.2のエントリでは、遅延5ms、転送量2Gbpsであるので、No.3のトラフィックの遅延時間=4ms×(8Gbps−2Gbps)/8Gbps=3.0msとなる。
No.3のエントリでは遅延2ms、転送量1Gbpsであるので、No.3のトラフィックの遅延時間=4ms×(8Gbps−1Gbps)/8Gbps=3.5msとなる。
このように、負荷分散部105は、転送量の高いトラフィックは中断時間を短く設定し、転送量の低いトラフィックは転送時間を長く設定する。
ステップS44において、負荷分散部105は、遅延時間を加味して、各デバイスに送信する中断時間を求める。例えば、負荷分散部105は、ステップS43で算出した各トラフィックの中断時間に、送信遅延時間フィールド450の値を加算した値を、各デバイスに送信する中断時間として求める。
例えば、No.1のエントリでは、遅延が0msであるので、中断時間=1.5ms+0ms=1.5msとなる。
又、No.2のエントリでは、遅延が5msであるので、中断時間=3.0ms+5ms=8msとなる。
No.3のエントリでは、遅延が2msであるので、中断時間=3.5ms+2ms=5.5msとなる。
ステップS45において、送信部103は、iSCSIサーバ2のIPアドレスに宛てて、L3 Pause信号を送信し、iSCSIサーバ2にトラフィックの一時中断を指示する。例えば、L3 Pause信号の操作コード503(図2参照)には“一時停止”が、中断時間504(図2参照)には“8ms”が指定される。
帯域あふれが解消されたら、ステップS46において、送信部103は、停止時間の長いトラフィックから優先的に、中断解除を指示するL3 Pauseを送信する。例えば、L3 Pause信号の操作コード503(図2参照)には“開始”が、中断時間504(図2参照)には“0ms”が指定される。
ステップS47において、iSCSIサーバ2の受信部102は、ステップS45で送信された、DCBスイッチ4からのL3 Pause信号を受信する。受信部102は、L3 Pause信号が、L3 Pauseを許可されていないデバイスから送信されたものである場合はこれを破棄する。
ステップS48において、iSCSIサーバ2のトラフィック調整部106は、L3 Pause信号において指定された内容に従って、ストレージトラフィックの転送を中断又は再開して、輻輳制御を実施する。
なお、上記の実施形態の一例を説明するために、iSCSIサーバ2からiSCSIストレージ5にデータが送信される例(例えば、iSCSIストレージ5へのWrite)を例に挙げて説明したが、本実施形態の一例は、ストレージ5からiSCSIサーバ2へのデータの送信(例えば、iSCSIストレージ5からのRead)にも適用される。
このように、本実施形態の一例によれば、L3 Pause信号を用いることにより、DCBネットワーク400においてiSCSIのトラフィックのパケットロスを防止できる。
従来のMACレベルレベルのPause信号とは異なり、本実施形態の一例のL3 Pause信号は、DCBスイッチ4がiSCSIサーバ2と直接接続されておらず、途中にイーサネットネットワーク等が介在している場合でも発行することができる。
上記の如く、本実施形態の一例によれば、DCBネットワーク400において、イーサネットスイッチ3との通信を継続しつつ、iSCSIのパケットロスを低減することができる。
本実施形態の一例によれば、iSCSIパケットのロスが最小化され、iSCSIパケットの再送の頻度を減らすことができ、通信性能を向上させることができる。
さらに、転送量の高いトラフィックは遅延時間を短く設定し、転送量の低いトラフィックは遅延時間を長く設定することにより、遅延を分散させることができる。
(C)変形例
上記の本実施形態の変形例として、iSCSIストレージ5にDCBスイッチ4の機能を持たせることができる。
この場合、iSCSIストレージ5の1つの物理ポートは、FCoE、LAN、iSCSIのトラフィックが流れ込むユニファイド物理ポートとして構成される。
図13は、実施形態の変形例としての情報処理システム1′のシステム構成を示す模式図である。
情報処理システム1′は、iSCSIサーバ2、イーサネットスイッチ3−1,3−2、及びiSCSIストレージ5′を有する。図5に示した実施形態の一例の構成と異なり、DCBスイッチ4が使用されていない。
なお、図13に示す構成要素のうち、図5に対応する構成要素は、図5に示した実施形態の一例のものと同様の機能及び構成を有するため、その説明を省略する。
又、イーサネットスイッチ3−1,3−2は、図5に示した実施形態の一例におけるイーサネットスイッチ3と同様の機能及び構成を有するため、その説明を省略する。
iSCSIストレージ5′は、iSCSIサーバ2からリード/ライト等のディスクアクセスコマンドを受信して、iSCSIストレージ5′の記憶領域に対するデータの書き込みや読み出しを行なう。
iSCSIストレージ5′は、CPU51、メモリ52、トラフィック管理データベース44及び輻輳制御プログラム121をそなえる。
CPU51は、種々の制御や演算を行なう処理装置であり、不図示のROM等に格納されたプログラムを実行することにより、種々の機能を実現する。
メモリ52は、CPU51が実行するプログラムや種々のデータや、CPU51の処理により得られたデータ等を格納する。メモリ52としては、例えば、RAM、ROMなど、既存の種々のメモリを使用することができる。又、複数種類のメモリをそなえていてもよい。
トラフィック管理データベース44は、情報処理システム1′においてやり取りされるトラフィックに関する情報を記憶しているデータベースである。
このトラフィック管理データベース44は、上記の実施形態の一例においてはDCBスイッチ4に設けられていたが、本変形例ではiSCSIストレージ5′に設けられている。
この本実施形態の変形例においては、本実施形態の一例の利点に加え、DCBスイッチ4を使用しない場合であっても、iSCSIストレージ5とiSCSIサーバ2との間で、輻輳制御を直接行なうことができるという利点を有する。
(D)その他
なお、上述した実施形態に関わらず、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、上記の実施形態の第2変形例として、実施形態の一例におけるDCBスイッチ4の機能を、iSCSIサーバ2に持たせてもよい。
或いは、上記の実施形態の一例においては、トラフィックの量と遅延とに基づいて負荷分散部105がロードバランスを行なっていたが、負荷分散部105が他のパラメータに基づいてロードバランスを行なってもよい。
(E)付記
上記の実施形態に関し、更に以下の付記を開示する。
(付記1)
ネットワークにおける通信を制御する通信制御装置であって、
前記ネットワークにおける輻輳の発生を判定する判定部と、
前記輻輳の原因となっている装置に通信量を調整するように指示する信号を送信する送信部と、
をそなえることを特徴とする通信制御装置。
(付記2)
輻輳配分を算出する負荷分散部をさらにそなえることを特徴とする付記1記載の通信制御装置。
(付記3)
前記ネットワークを流れるトラフィックに関する情報を記憶している記憶部をさらにそなえ、
前記負荷分散部は前記記憶部に記録されている各トラフィックの情報に基づいて前記調整する通信量を複数のトラフィックに分散させることを特徴とする付記2記載の通信制御装置。
(付記4)
通信量を調整するように指示する第2の信号を他の装置から受信し、前記他の装置が前記ネットワークの前記通信制御装置と前記他の装置との経路上に存在するかどうかを判定する受信部と、
前記送信部は、前記認証部による前記認証処理に成功した場合に前記第2の信号を該第2の信号の宛先装置に送信することを特徴とする付記1〜3のいずれか1項に記載の通信制御装置。
(付記5)
付記1〜4のいずれか1項に記載の通信制御装置をそなえることを特徴とする情報処理装置。
(付記6)
付記1〜4のいずれか1項に記載の通信制御装置をそなえることを特徴とする記憶装置。
(付記7)
ネットワークにおける通信を制御する通信制御方法であって、
前記ネットワークにおける輻輳の発生を判定し、
前記輻輳の原因となっている装置に通信量を調整するように指示する信号を送信する
ことを特徴とする通信制御方法。
(付記8)
輻輳配分を算出することを特徴とする付記7記載の通信制御方法。
(付記9)
前記ネットワークを流れるトラフィックに関する情報を記憶部に記憶し、
前記記憶部に記録されている各トラフィックの情報に基づいて前記調整する
ことを特徴とする付記8記載の通信制御方法。
(付記10)
通信量を調整するように指示する第2の信号を他の装置から受信し、前記他の装置が前記ネットワークの前記通信制御方法と前記他の装置との経路上に存在するかどうかを判定し、
前記認証部による前記認証処理に成功した場合に前記第2の信号を該第2の信号の宛先装置に送信する
ことを特徴とする付記7〜9のいずれか1項に記載の通信制御方法。
(付記11)
ネットワークにおける通信を制御する通信制御プログラムであって、
前記ネットワークにおける輻輳の発生を判定し、
前記輻輳の原因となっている装置に通信量を調整するように指示する信号を送信する
処理をコンピュータに実行させることを特徴とする通信制御プログラム。
(付記12)
輻輳配分を算出する処理を前記コンピュータに実行させることを特徴とする付記11記載の通信制御プログラム。
(付記13)
前記ネットワークを流れるトラフィックに関する情報を記憶部に記憶し、
前記記憶部に記録されている各トラフィックの情報に基づいて前記調整する
処理を前記コンピュータに実行させることを特徴とする付記12記載の通信制御プログラム。
(付記14)
通信量を調整するように指示する第2の信号を他の装置から受信し、前記他の装置が前記ネットワークの前記通信制御プログラムと前記他の装置との経路上に存在するかどうかを判定し、
前記認証部による前記認証処理に成功した場合に前記第2の信号を該第2の信号の宛先装置に送信する
処理を前記コンピュータに実行させることを特徴とする付記11〜13のいずれか1項に記載の通信制御プログラム。
1 情報処理システム
2 iSCSIサーバ(情報処理装置)
3 イーサネットスイッチ
4−1,4−2 DBCスイッチ
35−1〜35−6 物理ポート
44 トラフィック管理データベース(記憶部)
5 iSCSIストレージ(記憶装置)
9 FCoEサーバ
10 FCoEストレージ
101 輻輳制御部(通信制御装置)
102 受信部(判定部)
103 送信部
104 データベース管理部
105 負荷分散部
106 トラフィック調整部
400 DCBネットワーク

Claims (8)

  1. ネットワークにおける通信を制御する通信制御装置であって、
    前記ネットワークにおける輻輳の発生を判定する判定部と、
    前記輻輳の原因となっている装置に通信量を調整するように指示する信号を送信する送信部と、
    をそなえることを特徴とする通信制御装置。
  2. 輻輳配分を算出する負荷分散部をさらにそなえることを特徴とする請求項1記載の通信制御装置。
  3. 前記ネットワークを流れるトラフィックに関する情報を記憶している記憶部をさらにそなえ、
    前記負荷分散部は前記記憶部に記録されている各トラフィックの情報に基づいて前記調整する通信量を複数のトラフィックに分散させることを特徴とする請求項2記載の通信制御装置。
  4. 通信量を調整するように指示する第2の信号を他の装置から受信し、前記他の装置が前記ネットワークの前記通信制御装置と前記他の装置との経路上に存在するかどうかを判定する受信部と、
    前記送信部は、前記認証部による前記認証処理に成功した場合に前記第2の信号を該第2の信号の宛先装置に送信することを特徴とする請求項1〜3のいずれか1項に記載の通信制御装置。
  5. 請求項1〜4のいずれか1項に記載の通信制御装置をそなえることを特徴とする情報処理装置。
  6. 請求項1〜4のいずれか1項に記載の通信制御装置をそなえることを特徴とする記憶装置。
  7. ネットワークにおける通信を制御する通信制御方法であって、
    前記ネットワークにおける輻輳の発生を判定し、
    前記輻輳の原因となっている装置に通信量を調整するように指示する信号を送信する
    ことを特徴とする通信制御方法。
  8. ネットワークにおける通信を制御する通信制御プログラムであって、
    前記ネットワークにおける輻輳の発生を判定し、
    前記輻輳の原因となっている装置に通信量を調整するように指示する信号を送信する
    処理をコンピュータに実行させることを特徴とする通信制御プログラム。
JP2013113856A 2013-05-30 2013-05-30 通信制御装置、情報処理装置、記憶装置、通信制御方法、及び通信制御プログラム Pending JP2014233028A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013113856A JP2014233028A (ja) 2013-05-30 2013-05-30 通信制御装置、情報処理装置、記憶装置、通信制御方法、及び通信制御プログラム
US14/274,869 US20140355435A1 (en) 2013-05-30 2014-05-12 Communication controller, method of controlling communications, and tangible and non-transient computer-readable storage medium having communication control program stored therein
EP14168443.1A EP2809038B1 (en) 2013-05-30 2014-05-15 Communication controller, method of controlling communications and communication control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013113856A JP2014233028A (ja) 2013-05-30 2013-05-30 通信制御装置、情報処理装置、記憶装置、通信制御方法、及び通信制御プログラム

Publications (1)

Publication Number Publication Date
JP2014233028A true JP2014233028A (ja) 2014-12-11

Family

ID=50771419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013113856A Pending JP2014233028A (ja) 2013-05-30 2013-05-30 通信制御装置、情報処理装置、記憶装置、通信制御方法、及び通信制御プログラム

Country Status (3)

Country Link
US (1) US20140355435A1 (ja)
EP (1) EP2809038B1 (ja)
JP (1) JP2014233028A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018074244A (ja) * 2016-10-25 2018-05-10 住友電気工業株式会社 通信制御装置、スイッチ装置、車外通信装置、通信制御方法および通信制御プログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2907345B1 (en) * 2012-10-12 2019-04-17 Nokia Solutions and Networks Oy Method and apparatus for access network selection
US9531633B2 (en) * 2014-03-20 2016-12-27 Tata Consultancy Services Limited Control plane optimization of communication networks

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000036839A (ja) * 1998-04-03 2000-02-02 Internatl Business Mach Corp <Ibm> フロ―制御方法、一時停止制御システムおよびノ―ド
JP2000106569A (ja) * 1998-09-29 2000-04-11 Nec Shizuoka Ltd Lan間接続装置
JP2005204092A (ja) * 2004-01-16 2005-07-28 Hitachi Ltd 帯域制御機能を有するストレージスイッチ
JP3862003B2 (ja) * 2002-04-23 2006-12-27 日本電気株式会社 帯域制御方法および輻輳制御方法ならびにネットワーク構成装置
JP2008278240A (ja) * 2007-04-27 2008-11-13 Sony Corp 通信システム、通信装置、および通信方法、並びにプログラム
JP2009278262A (ja) * 2008-05-13 2009-11-26 Toshiba Corp 中継装置、および中継方法
JP2011078039A (ja) * 2009-10-02 2011-04-14 Fujitsu Ltd 通信装置および通信制御方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8879390B2 (en) * 2010-03-30 2014-11-04 International Business Machines Corporation Method, communication network and datacenter for traffic management in a communication network
US20110261696A1 (en) * 2010-04-22 2011-10-27 International Business Machines Corporation Network data congestion management probe system
US8767742B2 (en) * 2010-04-22 2014-07-01 International Business Machines Corporation Network data congestion management system
WO2014142971A1 (en) * 2013-03-15 2014-09-18 Hewlett-Packard Development Company , L. P. Traffic control across a layer 2 - layer 3 boundary in a software defined network

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000036839A (ja) * 1998-04-03 2000-02-02 Internatl Business Mach Corp <Ibm> フロ―制御方法、一時停止制御システムおよびノ―ド
JP2000106569A (ja) * 1998-09-29 2000-04-11 Nec Shizuoka Ltd Lan間接続装置
JP3862003B2 (ja) * 2002-04-23 2006-12-27 日本電気株式会社 帯域制御方法および輻輳制御方法ならびにネットワーク構成装置
JP2005204092A (ja) * 2004-01-16 2005-07-28 Hitachi Ltd 帯域制御機能を有するストレージスイッチ
JP2008278240A (ja) * 2007-04-27 2008-11-13 Sony Corp 通信システム、通信装置、および通信方法、並びにプログラム
JP2009278262A (ja) * 2008-05-13 2009-11-26 Toshiba Corp 中継装置、および中継方法
JP2011078039A (ja) * 2009-10-02 2011-04-14 Fujitsu Ltd 通信装置および通信制御方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MIKKEL HAGEN ET AL.: "Performance Evaluation of DCB's Priority-based Flow Control", 2011 IEEE INTERNATIONAL SYMPOSIUM ON NETWORK COMPUTING AND APPLICATIONS, JPN6016048801, 27 August 2011 (2011-08-27), pages 328 - 333, XP032058766, ISSN: 0003464285, DOI: 10.1109/NCA.2011.58 *
本多 泰理: "FCoEにおけるスループット向上技術の一検討", 2008年電子情報通信学会 通信ソサイエティ大会講演論文集2, JPN6017012536, 2 September 2008 (2008-09-02), pages 117, ISSN: 0003536469 *
瀬戸 康一郎: "早わかりイーサネット 最終回 データセンター 統合化と仮想化でクラウドの普及を支える", 日経NETWORK, vol. 第137号, JPN6017012534, 28 August 2011 (2011-08-28), pages 84 - 86, ISSN: 0003536468 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018074244A (ja) * 2016-10-25 2018-05-10 住友電気工業株式会社 通信制御装置、スイッチ装置、車外通信装置、通信制御方法および通信制御プログラム
US11134024B2 (en) 2016-10-25 2021-09-28 Sumitomo Electric Industries, Ltd. Communication control device, switching device, out-of vehicle communication device, communication control method and communication control program

Also Published As

Publication number Publication date
EP2809038B1 (en) 2016-03-02
US20140355435A1 (en) 2014-12-04
EP2809038A1 (en) 2014-12-03

Similar Documents

Publication Publication Date Title
US9331963B2 (en) Wireless host I/O using virtualized I/O controllers
US9007909B2 (en) Link layer reservation of switch queue capacity
JP5175400B2 (ja) アプリケーションおよびサービスにネットワーク通信アソシエーション情報を提供するための方法および装置
US8984088B2 (en) Communication control apparatus, communication system, information processing apparatus, and communication control method
US8942094B2 (en) Credit-based network congestion management
JP2004086512A (ja) 通信品質設定装置、方法及びプログラム
US9571410B2 (en) Credit-based link level flow control and credit exchange using DCBX
WO2019055629A1 (en) INTELLIGENT CHANNEL-BASED CHANNEL-BASED SELECTION ON A MULTI-CHANNEL NETWORK
CN104052684A (zh) 动态适配计算机网络中的最大传输单元大小的方法和系统
EP2833582A1 (en) Computer system and communication path modification means
WO2021166250A1 (ja) ゲートウェイ装置、方法及びプログラム
JP2014233028A (ja) 通信制御装置、情報処理装置、記憶装置、通信制御方法、及び通信制御プログラム
CN103166872A (zh) 网络中流量转发的方法和网络设备
JP7103637B2 (ja) 通信システム及び通信方法
US11812378B2 (en) User management device, BNG, and BNG user internet access method and system
US20060072608A1 (en) Communication band controller
WO2023032128A1 (ja) 通信システム、計算機、通信方法、および、プログラム
JP2019009630A (ja) ネットワーク負荷分散装置および方法
WO2020162185A1 (ja) 負荷分散システム及び負荷分散方法
JP2017046032A (ja) トラフィック制御システムおよびトラフィック制御方法
CN116615898A (zh) 使用安全参数索引值维护分组的服务质量处理

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170411

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180109