JP2021064835A - ネットワーク管理装置及び方法 - Google Patents
ネットワーク管理装置及び方法 Download PDFInfo
- Publication number
- JP2021064835A JP2021064835A JP2019187186A JP2019187186A JP2021064835A JP 2021064835 A JP2021064835 A JP 2021064835A JP 2019187186 A JP2019187186 A JP 2019187186A JP 2019187186 A JP2019187186 A JP 2019187186A JP 2021064835 A JP2021064835 A JP 2021064835A
- Authority
- JP
- Japan
- Prior art keywords
- network
- communication
- route
- port
- tcp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/02—Standardisation; Integration
- H04L41/0213—Standardised network management protocols, e.g. simple network management protocol [SNMP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/04—Network management architectures or arrangements
- H04L41/046—Network management architectures or arrangements comprising network management agents or mobile agents therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/06—Generation of reports
- H04L43/065—Generation of reports related to network devices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/12—Shortest path evaluation
- H04L45/123—Evaluation of link metrics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/70—Routing based on monitoring results
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/11—Identifying congestion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
- H04L47/125—Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/32—Flow control; Congestion control by discarding or delaying data units, e.g. packets or frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
- H04L47/72—Admission control; Resource allocation using reservation actions during connection setup
- H04L47/726—Reserving resources in multiple paths to be used simultaneously
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
- H04L47/80—Actions related to the user profile or the type of traffic
- H04L47/803—Application aware
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
- H04L47/82—Miscellaneous aspects
- H04L47/822—Collecting or measuring resource availability data
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
【課題】ネットワークの性能を一括管理し、ネットワーク全体としての利用効率を向上させながらネットワーク性能の低下を防止し得るネットワーク管理装置及び方法を提供する。【解決手段】方法は、ネットワークの性能及び構成に関する情報を、ネットワークを構成するネットワーク機器及び各ノードから収集し、収集した情報に基づいて、ネットワークを介してノード間で行われている各通信のネットワーク内の経路をそれぞれ推定し、各通信の経路の推定結果に基づいて、ネットワークにおける通信に利用されている経路に偏りがあるか否かを判定すると共に、各ネットワークにおける過負荷の発生の有無を判定し、経路に偏りがあるか否かの判定結果、及び、過負荷の発生の有無の判定結果に基づいて対応するノードに対する制御内容を決定し、決定結果に従ってノードを制御する。【選択図】図12
Description
本発明は、ネットワーク管理装置及び方法に関し、例えば、分散ストレージクラスタ内のネットワーク帯域を管理するネットワーク管理装置に適用して好適なものである。
SDS(Software Defined Storage)技術は、汎用のコンピュータ上でストレージ機能をソフトウェアとして稼動させ、かかるコンピュータ(以下、これをSDSノードと呼ぶ)を増設することにより処理性能及び容量を容易にスケールアウトできるようにした技術である。このようなSDSを適用したストレージシステムでは、SDSノードの追加によってネットワークの利用効率が低下しないように、クラスタ全体のネットワーク性能を管理することが必要となる。
SDSを始めとする近年のデータセンタのネットワークとしては、PCI(Peripheral Component Interconnect)などの高速な内部バス、FC(Fibre Channel)やInfiniabandなどの高信頼なネットワークに代えて、安価で普及したイーサネット(登録商標)を用い、ネットワークのFabricを構築するLeaf-Spineネットワーク又はFat-Treeネットワークと呼ばれるアーキテクチャを構成することが一般的になりつつある。
これらのネットワークアーキテクチャでは、ネットワークの帯域を確保するために、スイッチ間の接続を多重化し、複数のパスに負荷分散をして合計でのネットワーク帯域を向上させている。この負荷分散には、ネットワークスイッチの負荷分散アルゴリズムにはECMP(Equal Cost Multi Path)やLACP(Link Aggregation Control Protocol)などのプロトコルを用いたネットワークを構成することが一般的である。
ECMPやLACPといったプロトコルでは、負荷分散処理の高速化のためにステートレスでの処理が行われ、なおかつ、TCP(Transmission Control Protocol)での順序追い越しなどによる処理の複雑化を避けるためにTCP/UDP(User Datagram Protocol)ヘッダに含まれる送信元、送信先のIP(Internet Protocol)アドレス及び送受信のポート番号を入力値としたハッシュ関数で通信経路が決定される。
実装には、XOR(排他的論理和)やCRC(Cyclic Redundancy Check)などをベースにしたものが用いられる場合が多いが、いずれにせよ、静的な情報をベースに用いるためにハッシュ値が偏り、特定の通信経路にトラフィックが偏る(以下、これを経路の偏りと呼ぶ)ケースが存在する。このような経路の偏りが発生した場合、ネットワーク全体の利用効率が低下し、その結果としてスループットやレイテンシなどのネットワークの通信性能が低下する。
MP−TCP(Multipath-TCP)では、アプリケーションが通信するソケットと、実際にデータを転送するソケットとを分離し、データを複数のソケットに分割して並列にデータ転送を行うことができる。実質的に、同一のSDSノードの組に対して、TCPコネクション数を増やし、負荷分散の機会を増やすと、ハッシュ値の偏りが起こる確率が少なくなり、間接的にネットワークの利用効率を向上させることができる。
このようなSDSノード側による帯域制限の構成は、ネットワーク機器側で帯域制御と比較して、汎用的で機器の種類を問わずに適用可能であるため、幅広い環境で利用されるSDSにおいては求められている。
ところで、MP−TCPなどのTCP通信を多重化する方式において、ネットワークの構成及び負荷を鑑みて、どの通信経路にどの程度トラフィックを多重化させるかを決定することが性能を向上させるためのチューニングとして重要になる。
特許文献1には、Leaf-Spineなどの複数の通信経路をもつネットワークの両端に、経路情報を管理するプロキシサーバを設置し、これらのプロキシサーバがMP−TCPに利用する複数のパス(通信経路)を管理する発明が開示されている。この特許文献1に開示された発明によると、アプリケーション及び通信を行うホストがTCP通信を行うと、ネットワーク上に存在する複数の通信経路に自動的に負荷分散が行われる。
しかしながら、この特許文献1に開示された発明によると、ネットワーク全体が過負荷な状況にある場合にスループットを悪化させるという問題や、ネットワークの通信元(パケットの送信元)の負荷が通信先(パケットの送信先)の負荷を超過すると、ネットワーク機器のバッファオーバーランによるTCP-Incastが発生するという問題がある。
また特許文献1に開示された発明では、通信元及び通信先の2つのノSDSノードの情報及び中間経路の情報のみを取り扱うこととしているものの、実際には中間経路を通る他のネットワーク通信の情報をも参照して、SDSノードに対する制御(例えば、TCPコネクション数の増減や帯域の制限)を行うことができない。
さらに特許文献1に開示された発明では、SDSノード側の負荷の状況を参照した場合も、他のSDSノードにおける通信の状況と比較しない限り、自SDSノードの状態が適正なスループットを維持できているかを判断することができない。このため、ネットワークの性能を一括管理し、ネットワーク全体としての利用効率を向上させながらネットワーク性能の低下を防止できる手法が必要となる。
本発明は以上の点を考慮してなされたもので、ネットワークの性能を一括管理し、ネットワーク全体としての利用効率を向上させながらネットワーク性能の低下を防止し得るネットワーク管理装置及び方法を提案しようとするものである。
かかる課題を解決するため本発明においては、複数のノードを有する分散ストレージシステム内の前記ノード間を接続するネットワークの管理を行うネットワーク管理装置において、前記ネットワークの性能及び構成に関する情報を、当該ネットワークを構成するネットワーク機器及び各前記ノードから収集するネットワーク情報収集部と、前記ネットワーク情報収集部により収集された前記情報に基づいて、前記ネットワークを介して前記ノード間で行われている各通信の当該ネットワーク内の経路をそれぞれ推定する経路推定部と、各前記通信の経路の推定結果に基づいて、前記ネットワークにおける通信に利用されている前記経路に偏りがあるか否かを判定する経路偏り発生判定部と、各前記通信の経路の推定結果に基づいて、前記ネットワークにおける過負荷の発生の有無を判定する過負荷判定部と、前記経路偏り発生判定部の判定結果及び前記過負荷判定部の判定結果に基づいて、対応する前記ノードに対する制御内容を決定し、決定結果に従って当該ノードを制御する制御部とを設けるようにした。
また本発明においては、複数のノードを有する分散ストレージシステム内の前記ノード間を接続するネットワークの管理を行うネットワーク管理装置により実行されるネットワーク管理方法であって、前記ネットワークの性能及び構成に関する情報を、当該ネットワークを構成するネットワーク機器及び各前記ノードから収集する第1のステップと、収集した前記情報に基づいて、前記ネットワークを介して前記ノード間で行われている各通信の当該ネットワーク内の経路をそれぞれ推定する第2のステップと、各前記通信の経路の推定結果に基づいて、前記ネットワークにおける通信に利用されている前記経路に偏りがあるか否かを判定すると共に、各前記ネットワークにおける過負荷の発生の有無を判定する第3のステップと、前記経路に偏りがあるか否かの判定結果、及び、過負荷の発生の有無の判定結果に基づいて対応する前記ノードに対する制御内容を決定し、決定結果に従って当該ノードを制御する第4のステップとを設けるようにした。
本発明のネットワーク管理装置及び方法によれば、ネットワーク全体の状況に応じて各ノードを適正に制御することができる。
本発明によれば、ネットワークの性能を一括管理し、ネットワーク全体としての利用効率を向上させながらネットワーク性能の低下を防止し得るネットワーク管理装置及び方法を実現できる。
以下図面について、本発明の一実施の形態を詳述する。
(1)本実施の形態によるストレージシステムの構成
図1において、1は全体として本実施の形態によるストレージシステムを示す。このストレージシステム1は、分散ストレージシステムでなるクラスタ2と、クラスタ2内のネットワークを管理するネットワーク管理サーバ3とを備えて構成され、これらクラスタ2及びネットワーク管理サーバ3間がネットワーク4を介して接続されている。
図1において、1は全体として本実施の形態によるストレージシステムを示す。このストレージシステム1は、分散ストレージシステムでなるクラスタ2と、クラスタ2内のネットワークを管理するネットワーク管理サーバ3とを備えて構成され、これらクラスタ2及びネットワーク管理サーバ3間がネットワーク4を介して接続されている。
クラスタ2は、1又は複数のアクティブ側のSDSラック12Aと、これらSDSラック12Aとそれぞれ対応させて設けられた1又は複数のスタンバイ側のSDSラック12Bと、複数のルータ13とを備えて構成される。なお、以下においては、アクティブ側及びスタンバイ側のSDSラック12A,12Bを分けて説明する必要がない場合には、これらSDSラック12A,12BをまとめてSDSラック12と呼ぶものとする。
また各SDSラック12には、それぞれ1又は複数のSDSノード10と、複数のスイッチ11とが搭載される。そして、これらの各SDSノード10はそれぞれ通信路を介して各スイッチ11と接続され、各スイッチ11はそれぞれすべてのルータ13と接続されている。これによりアクティブ側のSDSラック12A内の各スイッチ11と、各ルータ13と、スタンバイ側のSDSラック12B内の各スイッチ11とによってクラスタ2内のTCP/IP通信ネットワーク(以下、これをクラスタ内ネットワークと呼ぶ)14が構築される。
そしてクラスタ2内では、図示しないホスト装置からアクティブ側のSDSラック12AのSDSノード10に書き込まれたデータが、SDSノード10への書込みと同期して又は非同期にクラスタ内ネットワーク14を介してスタンバイ側のSDSラック12B内のSDSノード10に転送されてバックアップされる。これによりアクティブ側のSDSラック12A内のSDSノード10に障害が発生した場合にスタンバイ側のSDSラック12B内のSDSノード10をアクティブ側に切り替えることでクラスタ2の運用を継続し得るようになされている。
ネットワーク管理サーバ3は、CPU(Central Processing Unit)20、メモリ21、インタフェース22、記憶装置23及び通信装置24を備えた汎用のサーバ装置から構成される。CPU20は、ネットワーク管理サーバ3全体の動作制御を司るプロセッサであり、メモリ21及びインタフェース20とそれぞれ接続される。またメモリ21は、例えば、揮発性の半導体メモリから構成され、CPU20のワークメモリとして利用される。
記憶装置23は、例えば、ハードディスク装置、SSD(Solid State Drive)及び又はフラッシュメモリなどの大容量の不揮発性の記憶装置から構成され、各種プログラムや必要なデータを長期間保存するために利用される。後述する管理プログラム25もこの記憶装置23に格納されて管理され、ネットワーク管理サーバ3の起動時にメモリ21にロードされてCPU20により実行される。
通信装置24は、例えば、イーサネット(登録商標)ネットワークカードなどから構成され、ネットワーク管理サーバ3がネットワーク4を介してクラスタ2内の各SDSノード10や、スイッチ11及びルータ13と通信を行う際のプロトコル制御を行う。
(2)ネットワーク管理機能
次に、本ネットワーク管理サーバ3に搭載されたネットワーク管理機能について説明する。このネットワーク管理機能は、クラスタ内ネットワーク14の性能及び構成に関する情報をクラスタ2内の各SDSノード10や、各スイッチ11及び各ルータ13などのネットワーク機器(以下、適宜、スイッチ11及びルータ13を纏めてネットワークスイッチと呼ぶ)とからそれぞれ収集し、収集したこれらの情報に基づいてクラスタ内ネットワーク14を介して行われる各TCP通信のTCPコネクション数や帯域を一括管理する機能である。
次に、本ネットワーク管理サーバ3に搭載されたネットワーク管理機能について説明する。このネットワーク管理機能は、クラスタ内ネットワーク14の性能及び構成に関する情報をクラスタ2内の各SDSノード10や、各スイッチ11及び各ルータ13などのネットワーク機器(以下、適宜、スイッチ11及びルータ13を纏めてネットワークスイッチと呼ぶ)とからそれぞれ収集し、収集したこれらの情報に基づいてクラスタ内ネットワーク14を介して行われる各TCP通信のTCPコネクション数や帯域を一括管理する機能である。
このようなネットワーク管理機能を実現するための手段として、ネットワーク管理サーバ3には、図2に示すように、ネットワーク性能情報管理部30、ネットワーク構成情報管理部31、ネットワーク経路推定部32、経路偏り発生判定部33、過負荷判定部34及びクラスタ内通信制御部35が設けられている。なお、これらの機能部は、図1について上述したCPU20が、記憶装置23からメモリ21にロードした管理プログラム25を実行することにより具現化される機能部である。
またネットワーク管理サーバ3の記憶装置23には、かかるネットワーク管理機能を実現するための情報を保持するテーブルとして、ノード側ネットワーク性能情報テーブル36、ネットワーク側ネットワーク性能情報テーブル37、ネットワーク構成情報テーブル群38、TCP通信経路候補情報テーブル39及びクラスタ内通信制御履歴情報テーブル40が格納されている。
ネットワーク性能情報管理部30は、クラスタ内ネットワーク14の性能に関する情報を収集して管理する機能を有する機能部である。
実際上、ネットワーク性能情報管理部30は、クラスタ内ネットワーク14を介してアクティブ側のSDSラック12A内のSDSノード10と、スタンバイ側のSDSラック12B内のSDSノード10との間で行われている各TCP通信に関するクラスタ内ネットワーク14の性能情報を定期的に各SDSノード10からそれぞれ収集し、収集したこれらの性能情報をノード側ネットワーク性能情報テーブル36に格納して管理する。そのための手段として、各SDSノード10にはそれぞれOS(Operating System)から必要な情報を取得可能なエージェント(図示せず)が実装されており、ネットワーク性能情報管理部30は、これらのエージェントからかかる性能情報を収集する。
またネットワーク性能情報管理部30は、各ネットワークスイッチ(スイッチ11及びルータ13)の各ポートにおけるスループットや廃棄パケット数などの情報を例えばSNMP(Simple Network Management Protocol)プロトコルを用いて各ネットワークスイッチからそれぞれ収集し、収集したこれらの情報をネットワーク側ネットワーク性能情報テーブル37に格納して管理する。
ネットワーク構成情報管理部31は、クラスタ内ネットワーク14の構成に関する情報をクラスタ2内の各ネットワークスイッチから定期的に収集する機能を有する機能部である。
実際上、ネットワーク構成情報管理部31は、各ネットワークスイッチから各ポートがどのネットワークスイッチのどのポートに接続されているかといったポートごとの接続情報や、これらポートに割り当てられたIPアドレス、及び、そのネットワークスイッチが保持するルーティングテーブルなどの情報を例えばLLDP(Link Layer Discovery Protocol)プロトコルを用いてそれぞれ収集し、収集したこれらの情報をネットワーク構成情報テーブル群38に登録して管理する。
ネットワーク経路推定部32は、ノード側ネットワーク性能情報テーブル36、ネットワーク側ネットワーク性能情報テーブル37及びネットワーク構成情報テーブル群38に格納された各情報に基づいて、クラスタ内ネットワーク14を介して行われている各TCP通信が経由する通信経路をそれぞれ推定し、推定した各通信経路をそれぞれ対応するTCP通信の最尤経路として特定する機能を有する機能部である。
実際上、ネットワーク経路推定部32は、クラスタ内ネットワーク14を介して行われているTCP通信ごとに、そのTCP通信が利用可能なすべての通信経路がそれぞれTCP通信経路候補として登録されたTCP通信経路候補情報テーブル39を作成する。
またネットワーク経路推定部32は、各TCP通信がそれぞれ対応するTCP通信経路候補を利用した場合の各ネットワークスイッチ(スイッチ11及びルータ13)の各ポートのスループットを、各TCP通信のTCP通信経路候補の組合せ(以下、これをTCP通信経路候補組合せと呼ぶ)ごとにそれぞれシミュレーションする。
そしてネットワーク経路推定部32は、かかるシミュレーション結果と、ネットワーク側ネットワーク性能情報テーブル37に格納されている各ネットワークスイッチの各ポートにおける実際のスループットとを比較することにより、各TCP通信で実際に利用されているであろう通信経路をそれぞれ推定し、推定した各TCP通信の通信経路をそれぞれ最尤経路として特定する。
経路偏り発生判定部33は、ネットワーク経路推定部32により実行されたかかるシミュレーションのシミュレーション結果に基づいて、クラスタ内ネットワーク14におけるデータトラフィックが偏っている通信経路を検出する機能を有するプログラムである。具体的に、経路偏り発生判定部33は、ボトルネックとなっているポート(以下、これをボトルネックポートと呼ぶ)の中から一定の条件を満たすボトルネックポートを、経路偏りが発生している通信経路のポートとして抽出する。
また過負荷判定部34は、かかるシミュレーション結果に基づいて、各TCP通信の最尤経路上のポートのうち、一定レベル以上のパケット破棄が発生している負荷の高いポートを検出する機能を有する機能部である。
クラスタ内通信制御部35は、経路偏り発生判定部33により検出された一定条件を満たすボトルネックポートの情報と、過負荷判定部34により検出された負荷の高いポートの情報とに基づいて、クラスタ内ネットワーク14における通信経路の偏りや過負荷箇所の発生を抑制すべく、必要なSDSノード10に対して各TCP通信のコネクション数を増減させたり、帯域を制限する制御を実行する機能を有する機能部である。クラスタ内通信制御部35は、このとき実行した制御内容を制御履歴情報としてクラスタ内通信制御履歴情報テーブル40に登録して管理する。
一方、ノード側ネットワーク性能情報テーブル36は、ネットワーク性能情報管理部30により収集された、各TCP通信に関するクラスタ内ネットワーク14の性能情報を管理するために利用されるテーブルであり、図3に示すように、ノード名欄36A、通信種類欄36B、宛先アドレス欄36C、要求帯域欄36D、実帯域欄36E、レイテンシ欄36F、廃棄パケット数欄36G及びウインドサイズ(Window Size)欄36Hを備えて構成される。ノード側ネットワーク性能情報テーブル36では、1つの行がそのときクラスタ内ネットワーク14を介して行われている1つのTCP通信に関する情報に相当する。
そしてノード名欄36Aには、対応するTCP通信の通信元(パケットの送信元)のSDSノード10における当該TCP通信の通信元となったポートのIPアドレスが格納され、通信種類欄36Bには、そのTCP通信の種類を表す情報(例えば、そのTCP通信がデータ通信には「Data」、対応するTCP通信が制御情報の送受信の場合には「Control」)が格納される。また宛先アドレス欄36Cには、そのTCP通信における通信先(パケットの送信先)のIPアドレスが格納される。
さらに、要求帯域欄36Dには、そのTCP通信で要求された通信速度(以下、これを要求帯域と呼ぶ)が格納され、実帯域欄36Eには、そのTCP通信の実際の通信速度(以下、これを実帯域と呼ぶ)が格納される。
さらにレイテンシ欄36Fには、対応するTCP通信について計測されたレイテンシ(通信の遅延時間)が格納され、破棄バケット数欄36Gには、そのTCP通信において破棄されたパケットの総数が格納される。さらにウインドサイズ欄36Hには、そのTCP通信におけるウインドサイズが格納される。
またネットワーク側ネットワーク性能情報テーブル37は、ネットワーク性能情報管理部30により収集された、クラスタ2内の各ネットワークスイッチ(スイッチ11及びルータ13)の各ポートにおけるネットワーク性能に関する情報を管理するためのテーブルであり、図4に示すように、ポート名欄37A、受信速度欄37B、送信速度欄37C及び廃棄パケット数欄37Dを備えて構成される。ネットワーク側ネットワーク性能情報テーブル37では、1つの行が対応するネットワークスイッチの対応する1つのポートについての計測値を表す。
そしてポート名欄37Aには、対応するネットワークスイッチの対応するポートのIPアドレスが格納される。また、受信速度欄37Bには、その情報を取得した時点におけるそのポートでのパケットの受信速度が格納され、送信速度欄37Cには、その情報を取得した時点におけるそのポートでのパケットの送信速度が格納される。さらに廃棄パケット数欄37Dには、そのポートを経由して行われているTCP通信についてそのポートで廃棄されたパケット数が格納される。
他方、ネットワーク構成情報テーブル群38は、図5に示すポート接続情報テーブル38A、図6に示すインタフェース−IPアドレス対応付け情報テーブル38B、及び、図7に示すルーティング情報テーブル38Cの3つのテーブルから構成される。
ポート接続情報テーブル38Aは、クラスタ内ネットワーク14内の各ネットワークスイッチ(スイッチ11及びルータ13)のポートと、他のネットワークスイッチ又はSDSノード10のポートとの接続関係を管理するために利用されるテーブルであり、図5に示すように、取得時刻欄38AA、ローカルスイッチID欄38AB、ローカルポート番号欄38AC、リモートシャーシID欄38AD、リモートポート番号欄38AE、リモートスイッチ名欄38AF及び帯域欄38AGを備えて構成される。ポート接続情報テーブル38Aでは、1つの行がネットワークスイッチ間の1つの接続関係に対応する。
そして取得時刻欄38AAには、対応する接続関係の情報を取得した時刻が格納される。また、ローカルスイッチID欄38ABには、対応する接続関係における一方(ローカル側)のネットワークスイッチに付与されたそのネットワークスイッチに固有の識別子(スイッチID)が格納され、ローカルポート番号欄38ACには、そのネットワークスイッチの1つのポートに付与された物理的なポート番号が格納される。
またリモートスイッチ名欄38AFには、かかる接続関係における他方(リモート側)のネットワークスイッチ又はSDSノード10の名称が格納される。さらにリモートポート番号欄38AEには、そのネットワークスイッチ又はSDSノード10における、ローカルポート番号欄38ACにポート番号が格納されたポートと接続されたポートの物理的なポート番号が格納され、リモートシャーシID欄38ADには、当該ポートに付与された論理的な識別子(シャーシID)が格納される。
さらに帯域欄38AGには、かかるローカルポート番号欄38ACにポート番号が格納されたローカル側のポートと、リモートポート番号欄38AEにポート番号が格納されたリモート側のポートとの間を接続する経路の最大帯域が格納される。
またインタフェース−IPアドレス対応付け情報テーブル38Bは、クラスタ内ネットワーク14内のネットワークスイッチの各ポートのポート番号やIPアドレス等を管理するために利用されるテーブルであり、図6に示すように、ローカルスイッチID欄38BA、IPアドレス欄38BB、ポート番号欄38BC及びポート番号名称欄38BDを備えて構成される。インタフェース−IPアドレス対応付け情報テーブル38Bでは、1つの行が1つのネットワークスイッチの1つのポートに対応する。
そしてポート番号欄38BCには、対応するポートに付与されたポート番号が格納され、ローカルスイッチID欄38BAには、そのポートを有するネットワークスイッチの識別子(スイッチID)が格納される。またIPアドレス欄38BBには、そのポートに付与されたIPアドレスが格納され、ポート番号名称欄38BDには、そのポートの名称が格納される。
さらにルーティング情報テーブル38Cは、各ネットワークスイッチからそれぞれ取得したルーティングテーブルの情報を管理するために利用されるテーブルであり、図7に示すように、ローカルスイッチID欄38CA、送信先欄38CB、マスク欄38CC、ToS欄38CD及びネクストホップ欄38CEを備えて構成される。ルーティング情報テーブル38Cでは、1つの行がスイッチ11やルータ13から取得したルーティングテーブルに登録されていた1つのルーティング情報に対応する。
そしてローカルスイッチID欄38CAには、そのルーティング情報を取得したネットワークスイッチの識別子(スイッチID)が格納され、送信先欄38CBには、通信パケットの送信先として指定される可能性があるIPアドレスが格納される。またマスク欄38CCには、ネットマスクの値が格納され、ToS欄38CDには、送信先及びマスクの条件に合致する通信パケットの転送の優先順位などのToS(Type of Service)に関する情報が格納される。さらにネクストホップ欄38CEには、送信先及びネットマスクの条件に合致するパケットの送信先とすべき次段のネットワークスイッチのポートのIPアドレスが格納される。
TCP通信経路候補情報テーブル39は、ネットワーク経路推定部32により抽出された、クラスタ内ネットワーク14を経由して行われている各TCP通信のTCP通信経路候補を管理するために利用されるテーブルであり、図8に示すように、TCP通信ID欄39A、送信元アドレス欄39B、送信先アドレス欄39C及び複数の区間欄39Dと、最尤フラグ欄39Eとを備えて構成される。TCP通信経路候補情報テーブル39では、1つの行が1つのTCP通信に対する1つのTCP通信経路候補に対応する。
そしてTCP通信ID欄39Aには、対応するTCP通信に付与されたそのTCP通信に固有の識別子に対して対応するTCP通信経路候補に固有の枝番を付加した識別子(TCP通信ID)が格納される。また送信元アドレス欄39Bには、そのTCP通信経路候補におけるパケットの送信元のSDSノード10の送信元のポートに付与されたIPアドレスが格納され、送信先アドレス欄39Cには、そのTCP通信経路候補における送信先のSDSノード10の送信先のポートに付与されたIPアドレスが格納される。
区間欄39Dは、図9に示すように、クラスタ内ネットワーク14のネットワークスイッチ(スイッチ11又はルータ13)から次段のネットワークスイッチまでの区間を1区間として、各区間にそれぞれ対応させて設けられる。
そして各区間欄39Dは、それぞれ送信ポート欄39DA及び受信ポート欄39DBに区分されており、対応するTCP通信経路候補において対応する区間でTCP通信の送信側となるネットワークスイッチの対応するポートの識別子(ポートID)が送信ポート欄39DAに格納され、当該TCP通信経路候補においてそのTCP通信の受信側となるネットワークスイッチの対応するポートの識別子(ポートID)が受信ポート欄39DBに格納される。
さらに、クラスタ内ネットワーク14を介して行われているTCP通信ごとに、そのTCP通信において実際に利用された可能性が最も高いTCP通信経路候補(最尤経路)に対応する最尤フラグ欄39Eに、これを表すフラグ(以下、これを最尤フラグと呼ぶ)が格納される。
クラスタ内通信制御履歴情報テーブル40は、クラスタ内ネットワーク14においてボトルネックポートや過負荷ポートの発生を抑制すべく、クラスタ内通信制御部35(図1)により過去に実行されたコネクション数の増減や帯域制限といった各SDSノード10に対する制御内容を管理するために利用されるテーブルであり、図10に示すように、取得時刻欄40A、ノード名欄40B、通信種類欄40C、宛先アドレス欄40D、要求帯域欄40E、実帯域欄40F、TCPコネクション数/ノード欄40G及び帯域抑制制御欄40Hを備えて構成される。クラスタ内通信制御履歴情報テーブル40では、1つの行が1つのSDSノード10に対して実行した制御に対応する。
そしてノード名欄40B、通信種類欄40C、宛先アドレス欄40D、要求帯域欄40E及び実帯域欄40Fには、それぞれ図3について上述したノード側ネットワーク性能情報テーブル36の対応するノード名欄36A、通信種類欄36B、宛先アドレス欄36C、要求帯域欄36D又は実帯域欄36Eに格納された情報と同じ情報が格納され、取得時刻欄40Aには、これらの情報を取得した時刻が格納される。
またTCPコネクション数/ノード欄40Gには、対応するTCP通信におけるTCPコネクションの個数(多重度)が格納され、帯域抑制制御欄40Hには、そのTCP通信について帯域抑制制御を行ったか否かを表す情報(例えば、帯域抑制制御を行った場合には「○」、行っていない場合には「−」)が格納される。
(3)ネットワーク管理機能に関する各種処理
次に、上述したネットワーク管理機能に関連してネットワーク管理サーバ3において実行される各種処理の具体的な処理内容について説明する。なお、以下においては、各種処理の処理主体を図2について上述した機能部(ネットワーク性能情報管理部30、ネットワーク構成情報管理部31、ネットワーク経路推定部32、経路偏り発生判定部33、過負荷判定部34又はクラスタ内通信制御部35)として説明するが、実際上は、ネットワーク管理サーバ3のCPU20(図1)が記憶装置23(図1)からメモリ21(図1)にロードした管理プログラム25に基づいてその処理を実行することは言うまでもない。
次に、上述したネットワーク管理機能に関連してネットワーク管理サーバ3において実行される各種処理の具体的な処理内容について説明する。なお、以下においては、各種処理の処理主体を図2について上述した機能部(ネットワーク性能情報管理部30、ネットワーク構成情報管理部31、ネットワーク経路推定部32、経路偏り発生判定部33、過負荷判定部34又はクラスタ内通信制御部35)として説明するが、実際上は、ネットワーク管理サーバ3のCPU20(図1)が記憶装置23(図1)からメモリ21(図1)にロードした管理プログラム25に基づいてその処理を実行することは言うまでもない。
(3−1)ネットワーク情報取得処理
図11は、ネットワーク管理サーバ3がクラスタ内ネットワーク14の性能及び構成に関する情報を取得するために実行するネットワーク情報取得処理の処理手順を示す。
図11は、ネットワーク管理サーバ3がクラスタ内ネットワーク14の性能及び構成に関する情報を取得するために実行するネットワーク情報取得処理の処理手順を示す。
このネットワーク情報取得処理は、定期的に開始され、まず、ネットワーク性能情報管理部30(図2)が、クラスタ2内の各SDSノード10から、そのSDSノード10が実行しているTCP通信の要求帯域及び実帯域、レイテンシ、廃棄パケット数及びウインドサイズなどの情報をそれぞれ取得し、取得したこれらの性能情報をノード側ネットワーク性能情報テーブル36(図3)にそれぞれ格納する(S1)。
またネットワーク性能情報管理部30は、クラスタ内ネットワーク14を構成する各ネットワークスイッチ(スイッチ11及びルータ13)から、そのネットワークスイッチの各ポートにおける現在の単位時間当たりの送受信パケット数や廃棄パケット数などの情報を取得し、取得したこれらの性能情報をネットワーク側ネットワーク性能情報テーブル37(図4)に格納する(S2)。
次いで、ネットワーク構成情報管理部31(図2)が、クラスタ内ネットワーク14を構成する各ネットワークスイッチから、そのネットワークスイッチの各ポートの接続先や対応する通信経路に許容される通信帯域などに関する情報、並びに、そのネットワークスイッチが保持するルーティングテーブルなどのネットワークの構成に関する情報をそれぞれ取得し、取得したこれらの情報をネットワーク構成情報テーブル群38の対応するテーブル(ポート接続情報テーブル38A、インタフェース−IPアドレス対応付け情報テーブル38B又はルーティング情報テーブル38C)にそれぞれ格納する(S3)。以上によりこのネットワークパス情報取得処理が終了する。
(3−2)ネットワーク管理処理
図12は、図10の処理の終了後にネットワーク管理サーバ3において実行されるネットワーク管理処理の処理手順を示す。ネットワーク管理サーバ3は、この図11に示す処理手順に従って、クラスタ内ネットワーク14を介したSDSノード10間のTCP通信におけるTCPコネクション数や帯域を制御する。
図12は、図10の処理の終了後にネットワーク管理サーバ3において実行されるネットワーク管理処理の処理手順を示す。ネットワーク管理サーバ3は、この図11に示す処理手順に従って、クラスタ内ネットワーク14を介したSDSノード10間のTCP通信におけるTCPコネクション数や帯域を制御する。
実際上、このネットワーク管理処理が開始されると、まず、ネットワーク経路推定部32(図2)が、ノード側ネットワーク性能情報テーブル36に格納されているSDSノード10ごとの実帯域を比較して、他のSDSノード10の通信性能と比べて通信性能(実帯域)が低いSDSノード10が存在するか否かを判断する(S10)。そしてネットワーク経路推定部32は、この判断で否定結果を得ると、処理を終了する。これにより今回のネットワーク管理処理が終了する。
これに対して、ネットワーク経路推定部32は、ステップS10の判断で否定結果を得ると、ノード側ネットワーク性能情報テーブル36に格納されている今回取得したSDSノード10ごとの要求帯域を比較して、他のSDSノード10に比べて通信性能が低いSDSノード10が要求する帯域(要求帯域)が他のSDSノード10の要求帯域と比べて多いか否かを判断する(S11)。
この判断で肯定結果を得ることは、通信性能が低いSDSノード10に通信負荷が集中していることを意味する。かくして、このときネットワーク経路推定部32は、その旨をクラスタ内通信制御部35(図2)に通知する。
そしてクラスタ内通信制御部35は、この通知を受けると、通信性能が低いSDSノード10が利用する通信帯域を制限すべく、その制限量(帯域)を決定する(S12)。なお、このように通信性能が低いSDSノード10が利用する通信帯域を制限するのは、TCP通信の通信元(パケットの送信元)のSDSノード10の負荷が通信先(パケットの送信先)のSDSノード10の負荷を超過すると、スイッチ11のバッファオーバーランによるTCP-Incastが発生するおそれがあるため、これを抑制するためである。
次いで、クラスタ内通信制御部35は、かかるSDSノード10に対してステップS12で決定した制限量を通知する(S13)。かくして、この通知を受信したSDSノード10は、そのとき実行しているTCP通信の帯域が通知された帯域内に収まるように当該TCP通信の帯域を抑制する。そしてクラスタ内通信制御部35は、この後、処理を終了する。これにより今回のネットワーク管理処理が終了する。
これに対して、ステップS11の判断で否定結果を得ることは、クラスタ内ネットワーク14全体が過負荷な状態にあり、このためクラスタ内ネットワーク14全体のスループットが低下していることを意味する。かくして、このときネットワーク管理サーバ3では、必要なSDSノード10に対するTCP通信のコネクションの増減又は帯域制限の制御を行うべく、以下のステップS14〜ステップS19の処理を実行する。
具体的に、まず、ネットワーク経路推定部32が、そのときクラスタ内ネットワーク14を介して行われているTCP通信ごとにすべてのTCP通信経路候補をそれぞれ算出し、算出した各TCP通信経路候補の情報をTCP通信経路候補情報テーブル39(図8)にそれぞれ格納する(S14)。
続いて、ネットワーク経路推定部32が、TCP通信ごとのTCP通信経路候補の全組合せ(以下、これらの組合せをそれぞれTCP通信経路候補組合せと呼ぶ)の中から、実際に各TCP通信のデータトラフィックがそれぞれ通ったであろうと推定されるTCP通信経路候補組合せを1つ抽出し、このTCP通信経路候補組合せを構成する各TCP通信経路候補をそれぞれ対応するTCP通信の最尤経路として特定する(S15)。
具体的に、ネットワーク経路推定部32は、すべてのTCP通信経路候補組合せについて、各TCP通信のデータトラフィックがそれぞれそのTCP通信経路候補組合せを構成する対応するTCP通信経路候補を通った場合における各ネットワークスイッチ(スイッチ11及びルータ13)のポートごとの送信速度及び受信速度の想定値をシミュレーションによりそれぞれ算出する。またネットワーク経路推定部32は、これらの算出結果をネットワーク側ネットワーク性能情報テーブル37(図4)に格納されている実際に計測された各ネットワークスイッチのポートごとの送信速度及び受信速度とそれぞれ比較し、これらの差分の総和が最も小さいTCP通信経路候補組合せを構成する各TCP通信経路候補を、それぞれ対応するTCP通信の最尤経路として特定する。
次いで、経路偏り発生判定部33(図2)が、かかる最尤経路についてのシミュレーション結果に基づいて、クラスタ内ネットワーク14を構成する各ネットワークスイッチの各ポートのうち、ボトルネックとなっているポート(ボトルネックポート)があるか否かを判定する(S16)。また、この後、過負荷判定部34(図2)が、かかる最尤経路についてのシミュレーション結果に基づいて、いずれかのネットワークスイッチのいずれかのポートが過負荷となっているか否かを判定する(S17)。
この後、クラスタ内通信制御部35が、経路偏り発生判定部33の判定結果と、過負荷判定部34の判定結果とに基づいて、そのときTCP通信を行っているアクティブ側のSDSラック12A(図1)に搭載されている各SDSノード10(以下、これらを単にアクティブ側のSDSノード10と呼ぶ)に対する制御内容(TCPコネクション数の増減又はTCPコネクションの帯域制限)を決定する制御内容決定処理を実行する(S18)。
例えば、クラスタ内通信制御部35は、例えば図13Aのように特定経路にのみデータトラフィックの偏りがある場合、より詳しくは、宛先が異なるTCP通信のデータトラフィック同士が共通のボトルネックポートをもち、かつボトルネックの発生が負荷分散可能な一部のポートのみの場合には、これらTCP通信のTCPコネクション数を増加させる(多重度を上げる)ことを制御内容として決定する。
またクラスタ内通信制御部35は、例えば図13Bのように負荷分散ができない経路部分にTCP通信のデータトラフィックの偏りが発生しており、当該経路部分の帯域が最大限利用され、かつ当該経路部分の特定のポートのみでパケットの廃棄が発生している場合には、代替経路にコネクションを張ってTCP通信のTCPコネクション数を増加させる(多重度を上げる)ことを制御内容として決定する。
さらにクラスタ内通信制御部35は、例えば図13Cのように負荷分散ができない経路部分にTCP通信のデータトラフィックの偏りが発生しており、当該経路部分の帯域に空があるものの、当該経路部分の特定のポートのみでパケットの廃棄が発生している場合には、これらTCP通信のTCPコネクション数を削減させる(多重度を下げる)と共に、必要に応じてこれらTCP通信の帯域を制限することを制御内容として決定する。
さらにクラスタ内通信制御部35は、例えば図13Dのように宛先が異なるTCP通信のデータトラフィック同士が共通のボトルネックポートをもたず、負荷分散可能などの経路も最大帯域を越えてパケットの廃棄が発生している場合には、全TCP通信の帯域を制限することを制御内容として決定する。
さらにクラスタ内通信制御部35は、例えば図13Eのように宛先が異なるTCP通信のデータトラフィック同士が共通のボトルネックポートをもたず、負荷分散可能などの経路も最大帯域を越えはいないもののパケットの廃棄が発生している場合には、これらTCP通信のTCPコネクション数を削減する(多重度を下げる)ことを制御内容として決定する。
そしてクラスタ内通信制御部35は、この後、ステップS18の決定結果に従って、必要なSDSノード10に対して、TCPコネクション数を増加若しくは減少させ、又は、TCPコネクションの帯域を制限するための指示を与える(S19)。そして、このステップS19の処理が終了すると、このネットワーク管理処理が終了する。
(3−3)TCP通信経路候補検出処理
図14は、図12について上述したネットワーク管理処理のステップS14においてネットワーク経路推定部32により実行されるTCP通信経路候補検出処理の処理手順を示す。ネットワーク経路推定部32は、この図14に示す処理手順に従って、そのときクラスタ内ネットワーク14を経由して行われているTCP通信ごとのTCP通信経路候補をすべて検出する。
図14は、図12について上述したネットワーク管理処理のステップS14においてネットワーク経路推定部32により実行されるTCP通信経路候補検出処理の処理手順を示す。ネットワーク経路推定部32は、この図14に示す処理手順に従って、そのときクラスタ内ネットワーク14を経由して行われているTCP通信ごとのTCP通信経路候補をすべて検出する。
実際上、ネットワーク経路推定部32は、ネットワーク管理処理がステップS14に進むとこの図14に示す処理手順を開始し、まず、クラスタ2内のSDSノード10の中からそのときTCP通信を行っているSDSノード(以下、これを対象SDSノードと呼ぶ)10を1つ選択する(S20)。
続いて、ネットワーク経路推定部32は、ポート接続情報テーブルを38A(図5)参照して、ステップS20で選択したSDSノード(以下、これを選択SDSノードと呼ぶ)10が接続されているネットワークスイッチ(ここではスイッチ11)のポート(X)をすべて抽出する(S21)。
次いで、ネットワーク経路推定部32は、ルーティング情報テーブル38C(図7)を参照して、ステップS21で抽出した各ポート(X)から通信先のSDSノード10にそれぞれ到達するためのネクストホップをすべて特定する(S22)。
この後、ネットワーク経路推定部32は、インタフェース−IPアドレス対応付け情報テーブル38B(図6)を参照して、ステップS22で特定したネクストホップごとに、そのネクストホップが備えるすべてのポート(Y)のポート番号やIPアドレスをそれぞれ取得する(S23)。またネットワーク経路推定部32は、ステップS23でポート番号等を取得した各ポート(Y)の中から選択SDSノード10と繋がっているポート(X´)をすべて特定する(S24)。
そしてネットワーク経路推定部32は、ポート接続情報テーブル38Aを参照して、ステップS24で特定した各ポート(X´)が通信先のSDSノード10と他のネクストホップを経由することなく直接接続されているか否かをポート(X´)ごとにそれぞれ判断する(S25)。
ネットワーク経路推定部32は、この判断で否定結果を得たポート(X´)が存在する場合、そのポート(X´)をポート(X)に設定した後(S26)、ステップS22に戻り、この後、ステップS25ですべてのポート(X´)について肯定結果を得るまでステップS22〜ステップS25の処理を繰り返す。
そしてネットワーク経路推定部32は、やがてステップS25ですべてのポート(X´)について肯定結果を得ると、それまでにステップS25で肯定結果が得られた各ポート(X´)について、そのポート(X´)に到達するまでにポート(X)とした各ポートを順番に並べたものを選択SDSノード10が実行しているTCP通信のTCP通信経路候補としてTCP通信経路候補情報テーブル39に必要な情報をそれぞれ登録する(S27)。
続いて、ネットワーク経路推定部32は、すべての対象SDSノード10についてステップS21以降の処理を実行し終えた否かを判断する(S28)。そしてネットワーク経路推定部32は、この判断で否定結果を得るとステップS20に戻り、この後、ステップS20で選択するSDSノード10を、ステップS21以降が未処理の他の対象SDSノード10に順次切り替えながらステップS20〜ステップS28の処理を繰り返す。
そしてネットワーク経路推定部32は、やがてすべての対象SDSノード10についてTCP通信経路候補の検出を完了することによりステップS28で肯定結果を得ると、このTCP通信経路候補検出処理を終了する。
(3−4)最尤経路検出処理
図15は、図12について上述したネットワーク管理処理のステップS15においてネットワーク経路推定部32により実行される最尤経路検出処理の具体的な処理内容を示す。ネットワーク経路推定部32は、この図15に示す処理手順に従って、そのときクラスタ内ネットワーク14を介して行われている各TCP通信の最尤経路をそれぞれ検出する。
図15は、図12について上述したネットワーク管理処理のステップS15においてネットワーク経路推定部32により実行される最尤経路検出処理の具体的な処理内容を示す。ネットワーク経路推定部32は、この図15に示す処理手順に従って、そのときクラスタ内ネットワーク14を介して行われている各TCP通信の最尤経路をそれぞれ検出する。
実際上、ネットワーク経路推定部32は、図12について上述した一連の処理がステップS15に進むと、この図15に示す最尤経路検出処理を開始し、まず、ノード側ネットワーク性能情報テーブル36(図3)を参照し、クラスタ2内のすべてのSDSノード10のネットワーク性能情報に基づいて、そのときクラスタ内ネットワーク14を介して行われているTCP通信ごとに、そのTCP通信が利用可能なすべての通信経路をそれぞれそのTCP通信のTCP通信経路候補として算出する(S30)。
続いて、ネットワーク経路推定部32は、各TCP通信のTCP通信経路候補をそれぞれ1つずつ組合せたTCP通信経路候補組合せをすべて作成し(S31)、作成したTCP通信経路候補組合せの中からステップS33以降が未処理のTCP通信経路候補組合せを1つ選択する(S32)。
次いで、ネットワーク経路推定部32は、ステップS32で選択したTCP通信経路候補組合せ(以下、これを選択TCP通信経路候補組合せと呼ぶ)を構成する各TCP通信経路候補に、それぞれ対応するTCP通信の実帯域分のデータトラフィックが通ったと仮定したシミュレーションにより、各ネットワークスイッチの各ポートのスループットの想定値をそれぞれ算出する(S33)。
さらにネットワーク経路推定部32は、各ネットワークスイッチのポートごとに、ネットワーク側ネットワーク性能情報テーブル37(図4)に格納されている各ポートで実際に測定されたスループットの値と、ステップS33で算出した各ポートのスループットの想定値との差分をそれぞれ算出し、算出した差分の合計値をその選択TCP通信経路候補組合せの差分総和として算出する(S34)。
続いて、ネットワーク経路推定部32は、すべてのTCP通信経路候補組合せについてステップS33及びステップS34の処理を実行し終えたか否かを判断する(S35)。そしてネットワーク経路推定部32は、この判断で否定結果を得るとステップS32に戻り、この後、ステップS32で選択するTCP通信経路候補組合せをステップS33以降が未処理の他のTCP通信経路候補組合せに順次切り替えながら、ステップS32〜ステップS35の処理を繰り返す。
そしてネットワーク経路推定部32は、やがてすべてのTCP通信経路候補組合せについてステップS33及びステップS34の処理を実行し終えることによりステップS35で肯定結果を得ると、上述のようにして算出した差分総和の値が最も小さいTCP通信経路候補組合せを構成する各TCP通信経路候補をそれぞれ対応するTCP通信の最尤経路に決定する(S36)。そしてネットワーク経路推定部32は、この後、この最尤経路検出処理を終了する。
(3−5)経路偏り発生判定処理
図16は、図12について上述したネットワーク管理処理のステップS16において経路偏り発生判定部33により実行される経路偏り発生判定処理の具体的な処理内容を示す。経路偏り発生判定部33は、この図16に示す処理手順に従って、そのときクラスタ内ネットワーク14を介して行われている各TCP通信の通信経路に偏りが発生したか否かを判定する。
図16は、図12について上述したネットワーク管理処理のステップS16において経路偏り発生判定部33により実行される経路偏り発生判定処理の具体的な処理内容を示す。経路偏り発生判定部33は、この図16に示す処理手順に従って、そのときクラスタ内ネットワーク14を介して行われている各TCP通信の通信経路に偏りが発生したか否かを判定する。
実際上、経路偏り発生判定部33は、図12について上述した一連の処理がステップS16に進むと、この図に示す経路偏り発生判定処理を開始し、まず、各ネットワークスイッチ(スイッチ11及びルータ13)の各ポートの中からボトルネックポートをすべて抽出する(S40)。
具体的に、経路偏り発生判定部は33、各ネットワークスイッチのポートごとに、そのポートが接続された通信経路の最大帯域をポート接続情報テーブル38A(図5)から取得すると共に、そのポートの実際のスループット(以下、これを実帯域と呼ぶ)をネットワーク側ネットワーク性能情報テーブル37(図4)から取得し、これら最大帯域及実帯域が次式
を満たすポートをボトルネックポートとしてすべて抽出する。なお、(1)式において、「第1の閾値」は、予め設定された0に近い小さい値である。
続いて、経路偏り発生判定部33は、ネットワーク経路推定部32により推定された最尤経路がステップS30で抽出したいずれかのボトルネックポートを経由するTCP通信をすべて抽出し、これらTCP通信のTCPコネクションの実帯域(I)及び要求帯域(I)をノード側ネットワーク性能情報テーブル36(図3)から抽出する(S41)。
また経路偏り発生判定部33は、ネットワーク経路推定部32により推定された最尤経路がステップS40で抽出したいずれのボトルネックポートをも経由しない各TCP通信のTCPコネクションの実帯域(J)及び要求帯域(J)をノード側ネットワーク性能情報テーブル36から抽出する(S42)。
この後、経路偏り発生判定部33は、現在、クラスタ内ネットワーク14を介して行われているすべてのTCP通信を、ステップS40で検出したいずれかのボトルネックポートを経由するTCP通信のグループと、これらのボトルネックポートを経由しないTCP通信のグループとに分け、グループごとに、そのグループ内の各TCP通信の実帯域(I又はJ)の偏差及び平均値をそれぞれ算出する(S43)。
続いて、経路偏り発生判定部33は、ステップS43で算出したグループごとの実帯域(I又はJ)の偏差及び平均値が以下の(A)〜(C)の3つの条件をすべて満たすか否かを判断する(S44)。
(A)実帯域(I)の偏差及び実帯域(J)の偏差がいずれも予め設定された第2の閾値以内。
(B)実帯域(I)の平均値(I)が次式
を満たす。なお(2)式において「第2の閾値」は予め設定された固定値である。
(C)要求帯域の平均値(J)が次式
を満たす。なお(3)式において「第3の閾値」は予め設定された固定値である。
(A)実帯域(I)の偏差及び実帯域(J)の偏差がいずれも予め設定された第2の閾値以内。
(B)実帯域(I)の平均値(I)が次式
(C)要求帯域の平均値(J)が次式
そして経路偏り発生判定部33は、この判断で否定結果を得ると、そのときクラスタ内ネットワーク14を介して行われている各TCP通信の通信経路の偏りがないと判断して、この経路偏り発生判定処理を終了する。
これに対して、経路偏り発生判定部33は、ステップS44の判断で肯定結果を得ると、該当するTCP通信の最尤経路上のステップS30で抽出されたボトルネックポートの部分に経路偏りフラグをセットし(S45)、この後、この経路偏り発生判定処理を終了する。
(3−6)過負荷判定処理
図17は、図12について上述したネットワーク管理処理のステップS17において過負荷判定部34により実行される過負荷判定処理の具体的な処理内容を示す。過負荷判定部34は、この図17に示す処理手順に従って、そのときクラスタ内ネットワーク14の一部又は全部が過負荷状態にあるか否かを判定する。
図17は、図12について上述したネットワーク管理処理のステップS17において過負荷判定部34により実行される過負荷判定処理の具体的な処理内容を示す。過負荷判定部34は、この図17に示す処理手順に従って、そのときクラスタ内ネットワーク14の一部又は全部が過負荷状態にあるか否かを判定する。
実際上、過負荷判定部34は、図12について上述した一連の処理がステップS17に進むと、この図17に示す過負荷判定処理を開始し、まず、ネットワーク経路推定部32により特定された各TCP通信の最尤経路が通過する各ネットワークスイッチ(スイッチ11及びルータ13)の各ポートをTCP通信経路候補情報テーブル39(図8)を参照して特定し、特定したこれらの各ポートにおける通信多重度(そのポートを経由するTCPセクション数)と、各ポートでの廃棄パケット数とをそれぞれ算出する(S50)。
続いて、過負荷判定部34は、ノード側ネットワーク性能情報テーブル36(図3)を参照して、いずれかのTCP通信の最尤経路上のポートであって、パケット廃棄数が閾値多いポートをすべて抽出する(S51)。具体的に、過負荷判定部34は、いずれかのTCP通信の最尤経路上のポートであって、パケット廃棄数が予め設定された第4の閾値よりも多いポートを抽出する。
そして過負荷判定部34は、この後、ステップS41で少なくとも1つのポートを抽出できたか否かを判断する(S52)。
この判断で否定結果を得た場合、過負荷のために一定レベル以上のバッファオーバフローを起こしているネットワークスイッチがクラスタ内ネットワーク14内には存在しないことを意味する。かくして、このとき過負荷判定部34は、この過負荷判定処理を終了する。
これに対して、ステップS52の判断で肯定結果を得ることは、過負荷のために一定レベル以上のバッファオーバフローを起こしているネットワークスイッチがクラスタ内ネットワーク14内に存在することを意味する。かくして、このとき過負荷判定部34は、ステップS51で抽出したポートの中から1つのポートを選択する(S53)。
また過負荷判定部34は、ノード側ネットワーク性能情報テーブル36(図3)と、ポート接続情報テーブル38A(図5)とを参照して、ステップS53で選択したポート(以下、これを選択ポートと呼ぶ)の実送信帯域がそのポートの最大帯域未満であるか否かを判断する(S54)。
この判定で否定結果を得た場合、選択ポートが過負荷の状態となっていると考えられる。かくして、このとき過負荷判定部34は、選択ポートを経由するすべてのTCP通信の要求帯域の総和を算出し(S55)、算出した総和が次式
を満たすか否かを判断する(S56)。なお(4)式において、「第5の閾値」は、0に近い小さい値である。
この判断で肯定結果を得ることは、選択ポートの最大帯域に対してかかる要求帯域が多過ぎであり、このため定常的に過負荷状態が発生していると推測することができる。かくして、このとき過負荷判定部34は、TCP通信経路候補情報テーブル39(図8)における、選択ポートを経由する各TCP通信の最尤経路に対応する各行の選択ポートに対応する送信ポート欄39DA(図8)や受信ポート欄39DB(図8)に過負荷フラグをそれぞれ設定する(S57)。この過負荷フラグは、対応するポートが定常的な過負荷状態にあることを表すフラグである。
これに対して、ステップS56の判断で否定結果を得ることは、選択ポートの最大帯域に対してかかる要求帯域が僅かに多く、このためパケット廃棄に伴う選択ポートに対するパケットの再送が多発していると推測することができる。かくして、このとき過負荷判定部34は、TCP通信経路候補情報テーブル39における、選択ポートを経由する各TCP通信の最尤経路に対応する各行の選択ポートに対応する送信ポート欄39DAや受信ポート欄39DBに再送多発フラグをそれぞれ設定する(S58)。この再送多発フラグは、対応するポートに対する再送が多発していることを表すフラグである。
一方、ステップS54の判断で肯定結果を得た場合、選択ポートにおける廃棄パケット数は多いものの選択ポートには利用可能な帯域が残存していることから、瞬間的に過負荷になっただけであるものと考えられる。かくして、このとき過負荷判定部34は、選択ポートを経由する各TCP通信の最尤経路に対応する各行の選択ポートに対応する送信ポート欄39DAや受信ポート欄39DBに再送多発フラグをそれぞれ設定し(S58)、この後、この過負荷判定処理を終了する。
この後、過負荷判定部34は、ステップS52で抽出したすべてのポートについてステップS54以降の処理を実行し終えたか否かを判断する。そして過負荷判定部34は、この判断で否定結果を得るとステップS53に戻り、この後、ステップS53で選択するポートをステップS52で抽出したポートのうちのステップS54以降が未処理の他のポートに順次切り替えながら、ステップS53〜ステップS59の処理を繰り返す。
そして過負荷判定部34は、やがてステップS52で抽出したすべてのポートについて過負荷フラグ又は再送多発フラグを設定し終えることによりステップS59で肯定結果を得ると、この過負荷判定処理を終了する。
(3−7)制御内容決定処理
図18A〜図18Cは、図12について上述したネットワーク管理処理のステップS18においてクラスタ内通信制御部35により実行される制御内容決定処理の具体的な処理内容を示す。クラスタ内通信制御部35は、この図18A〜図18Cに示す処理手順に従って、アクション側のSDSラック12Aに搭載された各SDSノード10に対して実行すべき制御内容を決定する。
図18A〜図18Cは、図12について上述したネットワーク管理処理のステップS18においてクラスタ内通信制御部35により実行される制御内容決定処理の具体的な処理内容を示す。クラスタ内通信制御部35は、この図18A〜図18Cに示す処理手順に従って、アクション側のSDSラック12Aに搭載された各SDSノード10に対して実行すべき制御内容を決定する。
実際上、クラスタ内通信制御部35は、図12について上述した一連の処理がステップS18に進むと、この図18A〜図18Cに示す制御内容決定処理を開始し、まず、図12のステップS15で検出された各TCP通信の最尤経路のうち、その最尤経路上のいずれかのネットワークスイッチのポートについて再送多発フラグが設定されているTCP通信をすべて抽出する(S60)。
続いて、クラスタ内通信制御部35は、ステップS60で抽出したTCP通信の中から、同一のボトルネックポート(X)において「同一種類のフラグ」(再送多発フラグ又は過負荷フラグ)が設定されたTCP通信の集合体をすべて抽出する(S61)。
次いで、クラスタ内通信制御部35は、ステップS61で抽出したTCP通信の各集合体について、ボトルネックポート(X)と接続され、当該ボトルネックポート(X)にパケットを転送する転送元のポート(以下、これを転送元ポートと呼ぶ)がボトルネックポート(X)以外の負荷を分散可能なポートであるか否か(つまりその転送元ポートがボトルネックポート(X)以外のポート(X´)と接続されていて、当該ポート(X´)を介してパケットをその宛先に送信可能なポートであるか否か)をそれぞれ判断する(S62)。
そしてクラスタ内通信制御部35は、この判断で肯定結果を得たTCP通信の集合体が存在する場合には、かかるすべてのポート(X´)が最尤経路上に存在し、ボトルネックポート(X)と同一種類のフラグ(再送多発フラグ、過負荷フラグ又は経路偏りフラグ)が設定されているTCP通信(Z´)が存在するか否かを判断する(S63)。
クラスタ内通信制御部35は、この判断で否定結果を得ると、ステップS63における上述の「同一種類のフラグ」が経路偏り判定フラグであるか否かを判断する(S64)。
そしてクラスタ内通信制御部35は、この判断で否定結果を得ると、各ボトルネックポート(X)をそれぞれ経由して行われている各TCP通信の帯域を抑制するようアクティブ側の対応するSDSノード10(かかる各TCP通信の通信元のSDSノード10であり、以下も同様。)をそれぞれ制御することを制御内容として決定し(S65)、この後、この制御内容決定処理を終了する。
またクラスタ内通信制御部35は、ステップS64の判断で肯定結果を得ると、図13Aについて上述したように、各ボトルネックポート(X)をそれぞれ経由して行われている各TCP通信のTCPコネクション数をそれぞれ増加させるようアクティブ側の対応するSDSノード10を制御することを制御内容として決定し(S66)、この後、この制御内容決定処理を終了する。
一方、クラスタ内通信制御部35は、ステップS63の判断で肯定結果を得ると、ステップS63における上述の「同一種類のフラグ」が再送多発フラグであるか否かを判断する(S67)。
そしてクラスタ内通信制御部35は、この判断で否定結果を得ると、図13Eについて上述したように、クラスタ内ネットワーク14を介して行われている全TCP通信のTCPコネクション数をそれぞれ削減するようアクティブ側の各SDSノード10を制御することを制御内容として決定し(S68)、この後、この制御内容決定処理を終了する。
これに対して、クラスタ内通信制御部35は、ステップS67の判断で肯定結果を得ると、図13Dについて上述したように、クラスタ内ネットワーク14を介して行われている全TCP通信の帯域を抑制するようアクティブ側の各SDSノード10を制御することを制御内容として決定し(S69)、この後、この制御内容決定処理を終了する。
他方、クラスタ内通信制御部35は、ステップS62の判断で否定結果を得たTCP通信の集合体が存在する場合には、当該集合体を構成する各TCP通信の宛先がすべて同じSDSノード10であるか否かを判断する(S70)。
またクラスタ内通信制御部35は、ステップS70の判断で肯定結果を得た場合には、ステップS61における上述の「同一種類のフラグ」が再送多発フラグであるか否かを判断する(S71)。
そしてクラスタ内通信制御部35は、この判断で否定結果を得ると、図13Cについて上述したように、各ボトルネックポート(X)をそれぞれ経由して行われている各TCP通信のTCPコネクション数をそれぞれ削減する(S72)と共に、ボトルネックポート(X)を経由するTCPコネクションの帯域を抑制するようアクティブ側の対応するSDSノード10を制御することを制御内容として決定し(S79)、この制御内容決定処理を終了する。
これに対して、クラスタ内通信制御部35は、ステップS71の判断で肯定結果を得ると、図13Bについて上述したように、各ボトルネックポート(X)をそれぞれ経由して行われている各TCP通信のTCPコネクション数をそれぞれ増加させるようアクティブ側の対応するSDSノード10を制御することを制御内容として決定し(S73)、この後、この制御内容決定処理を終了する。
さらにクラスタ内通信制御部35は、ステップS70の判断で否定結果を得ると、ステップS61における上述の「同一種類のフラグ」が再送多発フラグであるか否かを判断する(S74)。
そしてクラスタ内通信制御部35は、この判断で肯定結果を得ると、そのボトルネックポート(X)を備えるネットワークスイッチの動作を一時的に停止することを決定し(S75)、この後、この制御内容決定処理を終了する。
これに対して、クラスタ内通信制御部35は、ステップS74の判断で否定結果を得ると、ステップS61で抽出したTCP通信の集合体を構成する各TCP通信に代替経路がそれぞれ存在するか否かを判断する(S76)。
そしてクラスタ内通信制御部35は、この判断で否定結果を得ると、各ボトルネックポート(X)をそれぞれ経由して行われている各TCP通信の帯域を抑制するようアクティブ側の対応するSDSノード10をそれぞれ制御することを制御内容として決定し(S77)、この後、この制御内容決定処理を終了する。
またクラスタ内通信制御部35は、ステップS76の判断で肯定結果を得ると、各ボトルネックポート(X)をそれぞれ経由して行われている各TCP通信のTCPコネクション数をそれぞれ増加させるようアクティブ側の対応するSDSノード10をそれぞれ制御することを制御内容として決定し(S78)、この後、この制御内容決定処理を終了する。
(4)本実施の形態の効果
以上のように本実施の形態のストレージシステム1では、ネットワーク管理サーバ3が、クラスタ2内のクラスタ内ネットワーク14の性能及び構成に関する情報をクラスタ2内の各SDSノード10及び各ネットワークスイッチ(各スイッチ11及び各ルータ13)からそれぞれ収集し、収集したこれらの情報に基づいて通信経路の偏りや過負荷の発生を検出し、これらを抑制するよう必要なTCP通信のコネクション数を増減し又は通信帯域を制限する。従って、本ストレージシステム1によれば、ネットワークの性能を一括管理し、ネットワーク全体としての利用効率を向上させながらネットワーク性能の低下を防止することができる。
以上のように本実施の形態のストレージシステム1では、ネットワーク管理サーバ3が、クラスタ2内のクラスタ内ネットワーク14の性能及び構成に関する情報をクラスタ2内の各SDSノード10及び各ネットワークスイッチ(各スイッチ11及び各ルータ13)からそれぞれ収集し、収集したこれらの情報に基づいて通信経路の偏りや過負荷の発生を検出し、これらを抑制するよう必要なTCP通信のコネクション数を増減し又は通信帯域を制限する。従って、本ストレージシステム1によれば、ネットワークの性能を一括管理し、ネットワーク全体としての利用効率を向上させながらネットワーク性能の低下を防止することができる。
(5)他の実施の形態
なお上述の実施の形態においては、本発明を図1のように構成されたクラスタ内ネットワーク14を管理するネットワーク管理サーバ3に本発明を適用するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成を有するネットワークを管理するネットワーク管理装置に広く本発明を適用することができる。
なお上述の実施の形態においては、本発明を図1のように構成されたクラスタ内ネットワーク14を管理するネットワーク管理サーバ3に本発明を適用するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成を有するネットワークを管理するネットワーク管理装置に広く本発明を適用することができる。
また上述の実施の形態においては、図14について上述したTCP通信経路候補検出処理の処理方法として一般的なダイクストラのアルゴリズムによる経路探索問題を適用した場合について述べたが、本発明はこれに限らず、要は、ルーティグテーブルに従いパケットを転送した場合に負荷分散区間を含めて起こり得る通信経路を全探索するという目的を達成できる方法であれば、この他種々の方法を広く適用することができる。
本発明はネットワークを管理する種々のネットワーク管理装置に広く適用することができる。
1……ストレージシステム、2……クラスタ、3……ネットワーク管理サーバ、10……SDSノード、11……スイッチ、12,12A,12B……SDSラック、13……ルータ、14……クラスタ内ネットワーク、20……CPU、25……管理プログラム、30……ネットワーク性能情報管理部、31……ネットワーク構成情報管理部、32……ネットワーク経路推定部、33……経路偏り発生判定部、34……過負荷判定部、35……クラスタ内通信制御部、36……ノード側ネットワーク性能情報テーブル、37……ネットワーク側ネットワーク性能情報テーブル、38……ネットワーク構成情報テーブル軍、38A……ポート接続情報テーブル、38B……インタフェース−IPアドレス対応付け情報テーブル、38C……ルーティング情報テーブル、39……TCP通信経路候補情報テーブル、40……クラスタ内通信制御履歴情報テーブル。
Claims (12)
- 複数のノードを有する分散ストレージシステム内の前記ノード間を接続するネットワークの管理を行うネットワーク管理装置において、
前記ネットワークの性能及び構成に関する情報を、当該ネットワークを構成するネットワーク機器及び各前記ノードから収集するネットワーク情報収集部と、
前記ネットワーク情報収集部により収集された前記情報に基づいて、前記ネットワークを介して前記ノード間で行われている各通信の当該ネットワーク内の経路をそれぞれ推定する経路推定部と、
各前記通信の経路の推定結果に基づいて、前記ネットワークにおける通信に利用されている前記経路に偏りがあるか否かを判定する経路偏り発生判定部と、
各前記通信の経路の推定結果に基づいて、前記ネットワークにおける過負荷の発生の有無を判定する過負荷判定部と、
前記経路偏り発生判定部の判定結果及び前記過負荷判定部の判定結果に基づいて、対応する前記ノードに対する制御内容を決定し、決定結果に従って当該ノードを制御する制御部と
を備えることを特徴とするネットワーク管理装置。 - 前記制御部は、
宛先が異なる前記通信のデータトラフィック同士が共通のボトルネックのポートをもち、かつ前記ボトルネックのポートが負荷分散が可能な前記経路上のポートである場合には、各当該通信の多重度を上げることを制御内容として決定する
ことを特徴とする請求項1に記載のネットワーク管理装置。 - 前記制御部は、
負荷分散ができない経路部分に前記通信のデータトラフィックの偏りが発生しており、当該経路部分の帯域が最大限利用され、かつ当該経路部分の特定のポートでパケットの廃棄が発生している場合には、当該ポートを経由する各前記通信の多重度を上げることを制御内容として決定する
ことを特徴とする請求項1に記載のネットワーク管理装置。 - 前記制御部は、
負荷分散ができない経路部分に前記通信のデータトラフィックの偏りが発生しており、当該経路部分の帯域に空があるものの、当該経路部分の特定のポートのみでパケットの廃棄が発生している場合には、当該ポートを経由する各前記通信の多重度を下げることを制御内容として決定する
ことを特徴とする請求項1に記載のネットワーク管理装置。 - 前記制御部は、
宛先が異なる前記通信のデータトラフィック同士が共通のボトルネックのポートをもたず、負荷分散が可能などの前記経路も最大帯域を越えてパケットの廃棄が発生している場合には、前記ネットワークを介して行われているすべての前記通信の帯域を制限することを制御内容として決定する。
ことを特徴とする請求項1に記載のネットワーク管理装置。 - 前記制御部は、
宛先が異なる前記通信のデータトラフィック同士が共通のボトルネックのポートをもたず、負荷分散可能などの経路も最大帯域を越えはいないもののパケットの廃棄が発生している場合には、前記ネットワークを介して行われているすべての前記通信の多重度を下げることを制御内容として決定する
ことを特徴とする請求項1に記載のネットワーク管理装置。 - 複数のノードを有する分散ストレージシステム内の前記ノード間を接続するネットワークの管理を行うネットワーク管理装置により実行されるネットワーク管理方法であって、
前記ネットワークの性能及び構成に関する情報を、当該ネットワークを構成するネットワーク機器及び各前記ノードから収集する第1のステップと、
収集した前記情報に基づいて、前記ネットワークを介して前記ノード間で行われている各通信の当該ネットワーク内の経路をそれぞれ推定する第2のステップと、
各前記通信の経路の推定結果に基づいて、前記ネットワークにおける通信に利用されている前記経路に偏りがあるか否かを判定すると共に、各前記ネットワークにおける過負荷の発生の有無を判定する第3のステップと、
前記経路に偏りがあるか否かの判定結果、及び、過負荷の発生の有無の判定結果に基づいて対応する前記ノードに対する制御内容を決定し、決定結果に従って当該ノードを制御する第4のステップと
を備えることを特徴とするネットワーク管理方法。 - 前記第4のステップでは、
宛先が異なる前記通信のデータトラフィック同士が共通のボトルネックのポートをもち、かつ前記ボトルネックのポートが負荷分散が可能な前記経路上のポートである場合には、各当該通信の多重度を上げることを制御内容として決定する
ことを特徴とする請求項7に記載のネットワーク管理方法。 - 前記第4のステップでは、
負荷分散ができない経路部分に前記通信のデータトラフィックの偏りが発生しており、当該経路部分の帯域が最大限利用され、かつ当該経路部分の特定のポートでパケットの廃棄が発生している場合には、当該ポートを経由する各前記通信の多重度を上げることを制御内容として決定する
ことを特徴とする請求項7に記載のネットワーク管理方法。 - 前記第4のステップでは、
負荷分散ができない経路部分に前記通信のデータトラフィックの偏りが発生しており、当該経路部分の帯域に空があるものの、当該経路部分の特定のポートのみでパケットの廃棄が発生している場合には、当該ポートを経由する各前記通信の多重度を下げることを制御内容として決定する
ことを特徴とする請求項7に記載のネットワーク管理方法。 - 前記第4のステップでは、
宛先が異なる前記通信のデータトラフィック同士が共通のボトルネックのポートをもたず、負荷分散が可能などの前記経路も最大帯域を越えてパケットの廃棄が発生している場合には、前記ネットワークを介して行われているすべての前記通信の帯域を制限することを制御内容として決定する。
ことを特徴とする請求項7に記載のネットワーク管理方法。 - 前記第4のステップでは、
宛先が異なる前記通信のデータトラフィック同士が共通のボトルネックのポートをもたず、負荷分散可能などの経路も最大帯域を越えはいないもののパケットの廃棄が発生している場合には、前記ネットワークを介して行われているすべての前記通信の多重度を下げることを制御内容として決定する
ことを特徴とする請求項7に記載のネットワーク管理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019187186A JP2021064835A (ja) | 2019-10-10 | 2019-10-10 | ネットワーク管理装置及び方法 |
US16/824,445 US20210112009A1 (en) | 2019-10-10 | 2020-03-19 | Network management apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019187186A JP2021064835A (ja) | 2019-10-10 | 2019-10-10 | ネットワーク管理装置及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021064835A true JP2021064835A (ja) | 2021-04-22 |
Family
ID=75383408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019187186A Pending JP2021064835A (ja) | 2019-10-10 | 2019-10-10 | ネットワーク管理装置及び方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20210112009A1 (ja) |
JP (1) | JP2021064835A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11362991B1 (en) | 2021-07-06 | 2022-06-14 | Nile Global, Inc. | Methods and systems for sharing internet protocol (IP) address with multiple appliances for redundancy support |
US11894997B2 (en) | 2021-07-13 | 2024-02-06 | Nile Global, Inc. | Methods and systems for network diagnostic |
US20230108213A1 (en) * | 2021-10-05 | 2023-04-06 | Softiron Limited | Ceph Failure and Verification |
US11968081B2 (en) | 2022-01-19 | 2024-04-23 | Nile Global, Inc. | Methods and systems for network device management using a neighboring network device as a proxy |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040203825A1 (en) * | 2002-08-16 | 2004-10-14 | Cellglide Technologies Corp. | Traffic control in cellular networks |
-
2019
- 2019-10-10 JP JP2019187186A patent/JP2021064835A/ja active Pending
-
2020
- 2020-03-19 US US16/824,445 patent/US20210112009A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20210112009A1 (en) | 2021-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11588737B2 (en) | Flow-based load balancing | |
US10673741B2 (en) | Control device discovery in networks having separate control and forwarding devices | |
JP2021064835A (ja) | ネットワーク管理装置及び方法 | |
US10534601B1 (en) | In-service software upgrade of virtual router with reduced packet loss | |
US7430164B2 (en) | Path recovery on failure in load balancing switch protocols | |
US6865160B1 (en) | Broadcast tree determination in load balancing switch protocols | |
US6947384B2 (en) | MAC address learning and propagation in load balancing switch protocols | |
JP3452466B2 (ja) | 着信メッセージを経路指定する方法及びシステム | |
US8537669B2 (en) | Priority queue level optimization for a network flow | |
US20150372911A1 (en) | Communication path management method | |
US20030142685A1 (en) | Identity negotiation switch protocols | |
US10153964B2 (en) | Network routing using dynamic virtual paths in an overlay network | |
Muthumanikandan et al. | Link failure recovery using shortest path fast rerouting technique in SDN | |
US10135736B1 (en) | Dynamic trunk distribution on egress | |
JP7313480B2 (ja) | スライスベースネットワークにおける輻輳回避 | |
Ye et al. | PTP: Path-specified transport protocol for concurrent multipath transmission in named data networks | |
US9197545B2 (en) | Highly scalable modular system with high reliability and low latency | |
CN112087382B (zh) | 一种服务路由方法及装置 | |
Turkovic et al. | Elastic Slicing in Programmable Networks | |
CN107113244B (zh) | 一种数据转发的方法、装置和系统 | |
Nguyen et al. | Saco: A service chain aware SDN controller-switch mapping framework | |
US11502941B2 (en) | Techniques for routing data in a network | |
CN114793215A (zh) | 一种基于负载均衡模式异步代理的分布式系统 | |
CN117201381A (zh) | 算力路由方法和网关 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221227 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230627 |