JP2018148382A - Network resource management device, method, and program - Google Patents
Network resource management device, method, and program Download PDFInfo
- Publication number
- JP2018148382A JP2018148382A JP2017041235A JP2017041235A JP2018148382A JP 2018148382 A JP2018148382 A JP 2018148382A JP 2017041235 A JP2017041235 A JP 2017041235A JP 2017041235 A JP2017041235 A JP 2017041235A JP 2018148382 A JP2018148382 A JP 2018148382A
- Authority
- JP
- Japan
- Prior art keywords
- switch
- load
- network
- configuration
- resource management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、複数のスイッチを含むネットワークのリソースを管理するネットワークリソース管理装置、ネットワークリソース管理方法およびネットワークリソース管理プログラムに関する。 The present invention relates to a network resource management apparatus, a network resource management method, and a network resource management program that manage network resources including a plurality of switches.
あるシステムにおいて、ハードウェアリソースの枯渇や、偏りの発生を回避することは困難である。そこで、通常、システム管理者がリソース状況を把握し、メンテナンス期間を設けて構成の変更やハードウェアリソースの増強などを行っている。 In some systems, it is difficult to avoid hardware resource depletion and bias. Therefore, the system administrator usually grasps the resource status, sets a maintenance period, changes the configuration, and increases hardware resources.
これに対し、仮想環境の場合、CPU(Central Processing Unit )やメモリのリソースに応じてVM(Virtual Machine )を移動させる技術が存在する。そのため、特定のVMが高負荷になっていたとしても、ある程度フレキシブルに構成を変更し、高負荷状態を解決することができる。 On the other hand, in the case of a virtual environment, there is a technique for moving a VM (Virtual Machine) according to CPU (Central Processing Unit) and memory resources. Therefore, even if a specific VM has a high load, the configuration can be changed flexibly to some extent to solve the high load state.
特許文献1には、仮想マシン間の通信品質を保証するように、各仮想マシンを物理サーバに配置する仮想マシン配置装置が記載されている。特許文献1に記載された仮想マシン配置装置は、各仮想マシン間の通信が通過するスイッチが扱う通信量の総和をスイッチごとに収集し、その総和がスイッチの通信容量を超過しないように、仮想マシンの配置先となる物理サーバを決定する。 Patent Document 1 describes a virtual machine placement device that places each virtual machine on a physical server so as to guarantee the communication quality between the virtual machines. The virtual machine placement apparatus described in Patent Document 1 collects the total amount of communication handled by the switch through which communication between each virtual machine passes for each switch, so that the total does not exceed the communication capacity of the switch. Determine the physical server where the machine will be placed.
一方、ネットワークリソースに関しては、CPUやメモリリソースと異なり、VMを動作させているVMM(Virtual Machine Monitor )のリソースのみを監視してもリソースの枯渇を解決できないケースが多々存在する。CPUやメモリは、VMMに完全に依存するが、ネットワークリソースは、様々な機器を通る、いわば通路のようなものである。そのため、ある特定の機器に限定した局所的な判断を行っても、本当の原因になっているポイントがわからず、誤った判断を行ってしまうことがある。 On the other hand, with respect to network resources, unlike CPU and memory resources, there are many cases where resource depletion cannot be solved by monitoring only the resources of a VMM (Virtual Machine Monitor) that operates a VM. The CPU and memory completely depend on the VMM, but the network resource is like a passage through various devices. For this reason, even when a local determination is limited to a specific device, the point causing the true cause is not known, and an erroneous determination may be made.
そのため、ネットワーク全体を把握したうえでリソースの判断を行い、動的に設定の変更を行う必要がある。しかし、ネットワークを繋ぐスイッチの性能は一定ではない。そのため、スイッチのハードウェアリソースの使用率(すなわち、負荷率)を把握できても、ネットワークの構成を変更した場合に、どのようにリソースが配分されるか把握することは難しい。 Therefore, it is necessary to determine the resource after understanding the entire network and dynamically change the settings. However, the performance of switches connecting networks is not constant. Therefore, even if the usage rate (that is, the load factor) of the hardware resource of the switch can be grasped, it is difficult to grasp how the resources are allocated when the network configuration is changed.
例えば、あるシステムにおいて、ネットワークを管理するコアスイッチ、及びコアスイッチに接続されるエッジスイッチが存在し、エッジスイッチにはサービスを提供するサーバ及び業務用PC(Personal computer )が接続されて動作している場面を想定する。ここで、サーバ及び業務用PCは、FAT−PC、またはVMとして存在しているとする。 For example, in a certain system, there are a core switch for managing a network and an edge switch connected to the core switch, and a server for providing a service and a business computer (Personal computer) are connected to the edge switch to operate. Suppose you are in a situation. Here, it is assumed that the server and the business PC exist as a FAT-PC or a VM.
一般に、スイッチの性能は同一ではなく、各スイッチの間には性能差が存在している。また、スイッチに接続されているサーバ、及び業務用PCの数も一定ではない。さらに、スイッチを流れるトラフィック量も同一ではなく、偏りが存在する。 In general, the performance of the switches is not the same, and there is a performance difference between the switches. The number of servers and business PCs connected to the switch is not constant. Furthermore, the amount of traffic flowing through the switch is not the same, and there is a bias.
このため、ネットワーク全体のトラフィック量が全スイッチの収容能力を超えるほどではないが、局所的な観点では、特定のスイッチに負荷が偏ることにより、サービス及び業務に影響を及ぼすことがある。 For this reason, although the traffic amount of the entire network does not exceed the capacity of all the switches, from a local viewpoint, the load may be biased to a specific switch, which may affect services and operations.
このような状況が発生すると、サービス利用者もしくはネットワーク内のユーザからの通知、または、ネットワーク監視ソフトウェアなどの通知により、ネットワーク負荷の偏りが発生していることが認識される。この状況を解消するため、ネットワーク管理者は、手動でネットワークの構成を変える、または、ネットワークリソースを大量に使用している端末を別のスイッチに接続するなどの対処が必要になる。 When such a situation occurs, it is recognized that an imbalance in network load has occurred due to a notification from a service user or a user in the network or a notification from network monitoring software or the like. In order to solve this situation, the network administrator needs to take measures such as manually changing the network configuration or connecting a terminal that uses a large amount of network resources to another switch.
この場合の問題点は、大きくわけて2つ存在する。1つ目は、ネットワーク構成の見直しに対する設計および評価が必要になるため、即時性が求められる緊急事態であっても対応が困難なことである。2つ目は、スイッチの構成の変更に必要なダウンタイムが発生するため、ユーザへの影響が発生することである。対応が特に困難なのは1つ目の問題点である。例えば、複雑なネットワーク構成の場合、局所的な視点での設定変更では問題を解決できない可能性が高い。 There are two main problems in this case. First, since it is necessary to design and evaluate the review of the network configuration, it is difficult to deal with an emergency situation that requires immediateness. Second, the downtime required for changing the configuration of the switch occurs, which affects the user. The first problem is particularly difficult to deal with. For example, in the case of a complicated network configuration, there is a high possibility that the problem cannot be solved by changing the setting from a local viewpoint.
具体的には、ネットワークが大きくなればなるほど確認すべき範囲が増大し、複雑な設計が必要になる。例えば、あるスイッチの影響を把握するためには、エッジスイッチから上位のスイッチを辿り、そのスイッチに接続される下位のスイッチ及びその下位のスイッチを辿らなければならない、という現象が起こり得る。 Specifically, the larger the network, the greater the range to be confirmed, necessitating a complicated design. For example, in order to grasp the influence of a certain switch, a phenomenon may occur in which an upper switch is traced from an edge switch and a lower switch connected to the switch and a lower switch must be traced.
全てのスイッチが同一機種であれば、単純にハードウェアリソースの使用率(負荷率)を確認して、ネットワーク構成を変更する、すなわち、負荷率を加算したり減算したりすれば、リソースの問題を解決できる。しかし、実際のネットワークでは、スイッチごとに性能の異なる場合がほとんどである。その場合、リソースの配分は、それぞれのスイッチの性能差を考慮して計算される必要があるため、問題を解決するためには、膨大な計算が必要になる。 If all switches are of the same model, simply check the usage rate (load factor) of the hardware resource, change the network configuration, that is, add or subtract the load factor, and the resource problem Can be solved. However, in an actual network, the performance is often different for each switch. In that case, since the resource allocation needs to be calculated in consideration of the performance difference between the switches, enormous calculation is required to solve the problem.
現実的には、特定のサーバ及びそのサーバが接続されているエッジスイッチまたはそのエッジスイッチより上位のスイッチを1つ確認するのが精一杯と言える。そのため、例えば、エッジスイッチから上位のスイッチ、さらに上位のスイッチ、と範囲を広げながらネットワークの負荷率を計算して、ネットワーク構成をスポット的に変更するといった運用は行われていないのが実情である。 In reality, it can be said that it is full to confirm a specific server and an edge switch to which the server is connected or one switch higher than the edge switch. For this reason, for example, there is no actual operation of changing the network configuration in a spot manner by calculating the load factor of the network while expanding the range from the edge switch to the higher level switch and further higher level switch. .
また、特許文献1に記載された仮想マシン配置装置は、各スイッチの通信容量を把握しておかなければならない。また、上述するように、ネットワーク上には異なる性能のスイッチが廃止されることが一般的である。そのため、特許文献1に記載されているように、通信容量を超過しないようにリソースを配分するだけでは、性能の異なる各スイッチのリソースを適切に配分することは困難である。そのため、作業負荷を低減し適切にリソースを配分するためには、自律的にネットワークリソースを平準化できることが好ましい。 Further, the virtual machine placement device described in Patent Document 1 must grasp the communication capacity of each switch. Further, as described above, it is general that switches having different performances are abolished on the network. For this reason, as described in Patent Document 1, it is difficult to appropriately allocate resources of switches having different performances simply by allocating resources so as not to exceed the communication capacity. Therefore, in order to reduce workload and appropriately allocate resources, it is preferable that network resources can be leveled autonomously.
そこで、本発明は、異なる性能のスイッチを含むネットワークのリソースを平準化できるネットワークリソース管理装置、ネットワークリソース管理方法およびネットワークリソース管理プログラムを提供することを目的とする。 Accordingly, an object of the present invention is to provide a network resource management device, a network resource management method, and a network resource management program that can level network resources including switches having different performances.
本発明によるネットワークリソース管理装置は、ネットワーク内に配置された各スイッチのリソースを管理するネットワークリソース管理装置であって、各スイッチの使用率および各スイッチを流れるフローからその各スイッチの性能を推定する性能推定部と、各スイッチの第一の負荷を算出する第一負荷算出部と、算出された第一の負荷が予め定めた閾値よりも高いスイッチである対象スイッチが接続されるネットワークの構成を変更するための候補を決定する構成変更候補決定部と、候補として決定された変更後のネットワークの構成に基づいて、推定された性能での各スイッチの第二の負荷を算出する第二負荷算出部とを備えたことを特徴とする。 The network resource management apparatus according to the present invention is a network resource management apparatus that manages the resources of each switch arranged in the network, and estimates the performance of each switch from the usage rate of each switch and the flow that flows through each switch. A network configuration to which a performance estimation unit, a first load calculation unit that calculates a first load of each switch, and a target switch that is a switch in which the calculated first load is higher than a predetermined threshold is connected. A configuration change candidate determination unit that determines candidates for change, and a second load calculation that calculates the second load of each switch with the estimated performance based on the configuration of the changed network determined as a candidate And a section.
本発明によるネットワークリソース管理方法は、ネットワーク内に配置された各スイッチのリソースを管理するネットワークリソース管理方法であって、各スイッチの使用率および各スイッチを流れるフローからその各スイッチの性能を推定し、各スイッチの第一の負荷を算出し、算出された負荷が予め定めた閾値よりも高いスイッチである対象スイッチが接続されるネットワークの構成を変更するための候補を決定し、候補として決定された変更後のネットワークの構成に基づいて、推定された性能での各スイッチの第二の負荷を算出することを特徴とする。 The network resource management method according to the present invention is a network resource management method for managing the resources of each switch arranged in the network, and estimates the performance of each switch from the usage rate of each switch and the flow flowing through each switch. The first load of each switch is calculated, and a candidate for changing the configuration of the network to which the target switch that is a switch whose calculated load is higher than a predetermined threshold is connected is determined as a candidate. The second load of each switch at the estimated performance is calculated based on the changed network configuration.
本発明によるネットワークリソース管理プログラムは、ネットワーク内に配置された各スイッチのリソースを管理するコンピュータに適用されるネットワークリソース管理プログラムであって、コンピュータに、各スイッチの使用率および各スイッチを流れるフローからその各スイッチの性能を推定する性能推定処理、各スイッチの第一の負荷を算出する第一負荷算出処理、算出された第一の負荷が予め定めた閾値よりも高いスイッチである対象スイッチが接続されるネットワークの構成を変更するための候補を決定する構成変更候補決定処理、および、候補として決定された変更後のネットワークの構成に基づいて、推定された性能での各スイッチの第二の負荷を算出する第二負荷算出処理を実行させることを特徴とする。 A network resource management program according to the present invention is a network resource management program applied to a computer that manages the resources of each switch arranged in a network, and is based on the usage rate of each switch and the flow that flows through each switch. A performance estimation process for estimating the performance of each switch, a first load calculation process for calculating the first load of each switch, and a target switch that is a switch in which the calculated first load is higher than a predetermined threshold is connected Configuration change candidate determination process for determining candidates for changing the network configuration to be changed, and the second load of each switch at the estimated performance based on the changed network configuration determined as a candidate The second load calculation process is performed to calculate.
本発明によれば、異なる性能のスイッチを含むネットワークのリソースを平準化できる。 According to the present invention, network resources including switches having different performances can be leveled.
以下、本発明の実施形態を図面を参照して説明する。本実施形態のネットワークリソース管理装置は、ネットワーク内に配置された各スイッチのリソースを管理する。なお、本実施形態で管理されるスイッチは、SNMP(Simple Network Management Protocol)を実装しており、かつ、sFlowまたはNetFlowといった、統計情報をフローとして送信できるプロトコルを実装しているものとする。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. The network resource management apparatus of this embodiment manages the resources of each switch arranged in the network. It is assumed that the switch managed in the present embodiment implements SNMP (Simple Network Management Protocol) and implements a protocol capable of transmitting statistical information as a flow, such as sFlow or NetFlow.
図1は、本発明によるネットワークリソース管理装置の一実施形態を示すブロック図である。本実施形態のネットワークリソース管理装置100は、性能推定部10と、第一負荷算出部20と、構成変更候補決定部30と、第二負荷算出部40とを備えている。
FIG. 1 is a block diagram showing an embodiment of a network resource management apparatus according to the present invention. The network
また、図2は、本実施形態で想定するネットワーク構成の例を示す説明図である。図2に例示するネットワークには、基幹となる幾つかのコアスイッチと、コアスイッチに接続されたエッジスイッチ、及びエッジスイッチに接続されたFAT−PCまたはVMが存在する。FAT−PCまたはVMは、様々な用途のものが混在しており、ネットワーク内のみと通信を行うものや、外部サーバへ接続するもの、またはサーバとして外部へ公開しているものも含まれる。以降、これらを総称してノードと呼ぶ。 FIG. 2 is an explanatory diagram showing an example of a network configuration assumed in this embodiment. In the network illustrated in FIG. 2, there are several core switches that are backbones, edge switches connected to the core switches, and FAT-PCs or VMs connected to the edge switches. FAT-PC or VM has various uses, and includes those that communicate only within the network, those that are connected to an external server, and those that are open to the public as a server. Hereinafter, these are collectively referred to as a node.
ノード間には、暗黙的な優先度が存在している。例えば、自社製品の修正パッチを外部へ提供しているサーバなどは、他のノードよりも優先的にリソースを割り当てたいと考えられるため、高い優先度が設定される。ネットワーク内には、ネットワーク全体の監視を行うマネージャ(MGR)が存在する。このMGRが本実施形態のネットワークリソース管理装置100に対応する。
There is an implicit priority between the nodes. For example, a server or the like that provides a correction patch for its product to the outside wants to allocate resources more preferentially than other nodes, so a high priority is set. Within the network, there is a manager (MGR) that monitors the entire network. This MGR corresponds to the network
MGRは、ネットワーク全体の負荷を監視し、ネットワーク負荷が発生しているエリアが存在する場合、本実施形態で示す処理に基づき、各スイッチをスコア付けして、評価および構成の変更を行う。なお、外部および外部と最も近いスイッチの間には、ファイアウォール(FW)が存在する。 The MGR monitors the load of the entire network, and when there is an area where the network load occurs, the MGR scores each switch based on the processing shown in the present embodiment, and performs evaluation and configuration change. A firewall (FW) exists between the outside and the switch closest to the outside.
図2に例示するスイッチ間の線および破線は、ネットワーク上の経路を示す。上位と下位のスイッチの間には物理的な配線が存在し、ネットワークの負荷に応じてフレキシブルにネットワークの経路を変更できる。MGRは、これらの物理的な配線の情報を定期的に取得し、内部的な情報として管理している。この情報は、ネットワークの構成を変更する候補を決定するための情報として利用される。 A line and a broken line between the switches illustrated in FIG. 2 indicate routes on the network. Physical wiring exists between the upper and lower switches, and the network path can be flexibly changed according to the network load. The MGR periodically acquires information on these physical wirings and manages the information as internal information. This information is used as information for determining candidates for changing the network configuration.
なお、このように、異なる性能のスイッチを含むネットワークのリソースを平準化するためには、まず、各スイッチの性能差を考慮する必要がある。すなわち、全てのスイッチが同一機種であれば、単純にCPU利用率やバックプレーンの使用率を取得することで、リソースを平準化することが可能である。 In this way, in order to equalize network resources including switches having different performances, it is first necessary to consider the performance difference between the switches. That is, if all the switches are of the same model, it is possible to level the resources by simply acquiring the CPU usage rate and the backplane usage rate.
しかし、上述するように、システムの要求に応じてスイッチが選定されていることがほとんどである。また、構成変更や増設に伴ってスイッチを追加することがあるため、スイッチの性能が全て同じということは、現実的にはほぼありえない。そのため、スイッチの性能差を何らかの方法により把握する必要がある。しかし、例えば、スイッチの機種ごとにカタログスペックを確認して、性能差を実際の使用率から計算することは難しい。 However, as described above, in most cases, switches are selected in accordance with system requirements. In addition, since switches may be added due to configuration changes or additions, it is practically impossible that the performance of all switches is the same. Therefore, it is necessary to grasp the performance difference of the switch by some method. However, for example, it is difficult to check the catalog specifications for each switch model and calculate the performance difference from the actual usage rate.
そこで、本実施形態の性能推定部10は、各スイッチの使用率および各スイッチを流れるフローから、各スイッチの性能を推定する。これにより、各スイッチの絶対的な性能が動的に算出される。スイッチの性能として、スイッチング容量(1秒当たり処理可能なデータ量)や、スイッチング能力(1秒当たり処理可能なフレーム数)が挙げられる。
Therefore, the
各スイッチのCPU使用率や、スイッチ全体のトラフィック使用率は、管理情報ベース(MIB:Management Information Base )により取得できる。これは、MIBを実装しているスイッチであれば、外部から情報を取得することができるため、各スイッチに情報を取得するためのエージェントなどの配置は不要である。また、各スイッチに流れるフロー(トラフィックやフレーム数)は、sFlowやnetflowといった、トラフィックを監視する技術を使用することにより取得できる。 The CPU usage rate of each switch and the traffic usage rate of the entire switch can be acquired from a management information base (MIB). This is because a switch in which MIB is mounted can acquire information from the outside, and therefore an arrangement of an agent or the like for acquiring information in each switch is unnecessary. In addition, the flow (traffic and the number of frames) flowing through each switch can be acquired by using a technology for monitoring traffic such as sFlow or netflow.
そこで、性能推定部10は、スイッチを流れるフローの量をスイッチの使用率で割ることにより、各スイッチの性能の限界値の概算を算出する。例えば、単位時間当たりに流れるトラフィックが10Gbps、スイッチのトラフィック使用率が20%の場合、性能推定部10は、そのスイッチの性能としてスイッチング容量の限界が、おおよそ50Gbpsと見積もることができる。同様に、性能推定部10は、スイッチのスイッチング能力に関しても、単位時間当たりのCPU使用率およびスイッチを流れたフレーム数の総計により推定することができる。
Therefore, the
例えば、ある時点でスイッチが処理した総フレーム数F1、ある時点からt経過した時点でスイッチが処理した総フレーム数F2のとき、期間tのCPU使用率の平均値は、以下の式1で算出できる。式1において、Tは期間tにCPU使用率を測定した回数であり、Cpは、測定した時点のCPU使用率である。 For example, when the total number of frames F 1 processed by the switch at a certain point in time and the total number of frames F 2 processed by the switch after a lapse of t from a certain point in time, the average value of the CPU usage rate during the period t is It can be calculated by In Equation 1, T is the number of times the CPU usage rate is measured in the period t, and Cp is the CPU usage rate at the time of measurement.
また、この場合、このスイッチのスイッチング容量は、以下の式2で算出できる。 In this case, the switching capacity of the switch can be calculated by the following equation 2.
スイッチング能力についても、上記式1および式2と同様に算出できる。 The switching ability can also be calculated in the same manner as the above formulas 1 and 2.
第一負荷算出部20は、各スイッチの負荷(第一の負荷)を算出する。第一負荷算出部20は、取得したCPU使用率をそのまま各スイッチの負荷率としてもよい。ただし、実際の運用を考慮した場合、リソースの割り当てを単純にスイッチの負荷だけで判断できない場合も存在する。例えば、社内ネットワークを利用する業務PCよりも、外部に公開しているパッチ配信サーバに対し優先的にネットワークリソースを割り当てたい場合などがこれに該当する。
The first
そこで、優先的にリソースを割り当てるべき度合い(優先度)を示すパラメータをスイッチおよび端末に対してそれぞれ設定しておいてもよい。例えば、優先度としてスイッチに設定されるパラメータをα、端末に設定されるパラメータをβとし、各スイッチから取得された負荷率をγとする。このとき、第一負荷算出部20は、各スイッチの優先度付き負荷率を、以下の式3で算出してもよい。なお、nは、端末の数である。式3に示すように、第一負荷算出部20は、優先度が高いほど負荷を高く算出してもよい。このようにして、ネットワーク全体を考慮したリソース状況の分析が行われる。
Therefore, a parameter indicating the degree (priority) to which resources should be preferentially allocated may be set for each switch and terminal. For example, α is a parameter set for a switch as a priority, β is a parameter set for a terminal, and γ is a load factor acquired from each switch. At this time, the first
構成変更候補決定部30は、算出された負荷が予め定めた閾値よりも高いスイッチが接続されるネットワークの構成を変更する候補を決定する。構成変更候補決定部30は、現在接続されているノードへの経路が確保可能な構成の候補一覧を自動で決定してもよい。また、構成変更候補決定部30は、ユーザの指示に応じて、対象とするスイッチに接続されたネットワークの構成の候補を決定してもよい。
The configuration change
第二負荷算出部40は、候補として決定された変更後のネットワークの構成に基づいて、推定された性能での各スイッチの負荷(第二の負荷)を算出する。すなわち、第二負荷算出部40は、構成変更を行った場合のリソース状況の評価を行う。この評価に基づいて、構成の変更が実施される。
The second
具体的には、第二負荷算出部40は、性能推定部10が推定した各スイッチの性能に基づいて、構成を変更した場合に流れるフローから、各スイッチの負荷率を算出する。例えば、構成の変更により、対象のスイッチにトラフィック(フレーム数)F3が発生するとする。この場合、第二負荷算出部40は、リソース分配後の負荷率γを、例えば、以下に示す式4で算出する。
Specifically, the second
第二負荷算出部40は、算出した負荷率γが、予め定めた負荷率を下回っているか否か判断してもよい。算出した負荷率γが予め定めた負荷率以上であれば、別の構成変更を検討することが可能である。
The second
性能推定部10と、第一負荷算出部20と、構成変更候補決定部30と、第二負荷算出部40とは、プログラム(ネットワークリソース管理プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、ネットワークリソース管理装置の記憶部(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、性能推定部10、第一負荷算出部20、構成変更候補決定部30および第二負荷算出部40として動作してもよい。また、性能推定部10と、第一負荷算出部20と、構成変更候補決定部30と、第二負荷算出部40とは、それぞれが専用のハードウェアで実現されていてもよい。
The
次に、本実施形態のリソース管理装置の動作を説明する。図3は、本実施形態のリソース管理装置の動作例を示すフローチャートである。まず、ネットワーク上にMGR(すなわち、本実施形態のネットワークリソース管理装置100)を配置する。さらに、優先的にリソースを割り当てたいノード(具体的には、端末、スイッチ)に予め優先度が設定され(ステップS11)。優先度は、ネットワーク内に配置されたMGRにより管理される。なお、優先度が全てフラットな(すなわち、優先度に偏りがない)ネットワークの場合、優先度を設定する工程は省略されても良い。
Next, the operation of the resource management apparatus of this embodiment will be described. FIG. 3 is a flowchart illustrating an operation example of the resource management apparatus according to the present embodiment. First, MGR (that is, the network
MGR(例えば、性能推定部10)は、定常的にノードの情報を収集する(ステップS12)。MGRが収集する情報は、主にCPU使用率、トラフィック情報などである。なお、MGRは、その他指標になる値をさらに収集してもよい。各スイッチは、スイッチを通過したパケット数などの統計情報をフローとして定期的にMGRに送信する。 The MGR (for example, the performance estimation unit 10) regularly collects node information (step S12). Information collected by the MGR is mainly CPU usage rate, traffic information, and the like. Note that MGR may further collect values that serve as other indices. Each switch periodically transmits statistical information such as the number of packets that have passed through the switch to the MGR as a flow.
MGR(例えば、性能推定部10)は、取得したこれらの情報を分析し、高負荷のノードが存在するか否か判断する(ステップS13)。高負荷のノードが存在する場合(ステップS13におけるYes)、MGR(例えば、第一負荷算出部20)は、機種ごとの性能差を考慮した負荷率を計算する(ステップS14)。一方、高負荷のノードが存在しない場合(ステップS13におけるNo)、MGRは、ノードの情報を収集する処理を繰り返す。 The MGR (for example, the performance estimation unit 10) analyzes the acquired information and determines whether there is a high-load node (step S13). When a high-load node exists (Yes in step S13), the MGR (for example, the first load calculation unit 20) calculates a load factor considering the performance difference for each model (step S14). On the other hand, when there is no highly loaded node (No in step S13), the MGR repeats the process of collecting node information.
MGR(例えば、構成変更候補決定部30)は、構成変更可能な範囲で、リソース枯渇を解消するための候補を決定する。そして、MGR(例えば、第二負荷算出部40)は、決定された候補に従って、ネットワークの構成を変更した場合の負荷率を計算する(ステップS15)。具体的には、MGRは、負荷が発生しているノードを中心に下位全てのスイッチ及び上位のスイッチを選択して負荷率を計算する。 The MGR (for example, the configuration change candidate determination unit 30) determines candidates for eliminating resource depletion within a range in which the configuration can be changed. And MGR (for example, the 2nd load calculation part 40) calculates the load factor at the time of changing the structure of a network according to the determined candidate (step S15). Specifically, the MGR calculates a load factor by selecting all lower switches and upper switches around a node where a load is generated.
MGR(例えば、第二負荷算出部40)は、候補内のパスの切り替えでリソース不足を解消できるか否か判断する(ステップS16)。すべての候補を適用しても高負荷状態が解消できない場合、すなわち、候補内のパスの切り替えでリソース不足を解消できない場合(ステップS16におけるNo)、MGRは、さらに上位のスイッチが存在するか否か判断する(ステップS17)。 The MGR (for example, the second load calculation unit 40) determines whether or not the resource shortage can be resolved by switching the paths in the candidates (step S16). If the high load state cannot be resolved even if all candidates are applied, that is, if the resource shortage cannot be resolved by switching the paths in the candidates (No in step S16), MGR determines whether there is a higher-level switch. (Step S17).
さらに上位のスイッチが存在する場合(ステップS17におけるYes)、MGR(例えば、第二負荷算出部40)は、上位スイッチを選択して候補のエリアに含める(ステップS18)。そして、リソース枯渇を解消するための候補の決定を行うステップS15以降の処理を繰り返す。すなわち、MGRは、更に上位のスイッチ及びそのスイッチ配下に存在するスイッチを選択して負荷率を計算する。すなわち、この処理は、高負荷状態が解消されるまでエリアを拡大し繰り返されることになる。 If a higher switch exists (Yes in step S17), the MGR (for example, the second load calculation unit 40) selects the upper switch and includes it in the candidate area (step S18). And the process after step S15 which determines the candidate for eliminating resource exhaustion is repeated. In other words, the MGR calculates a load factor by selecting a higher-order switch and a switch existing under the switch. That is, this process is repeated by expanding the area until the high load state is resolved.
一方、ステップS16において、候補内のパスの切り替えでリソース不足を解消できる場合(ステップS16におけるYes)、MGRは、最適な候補が見つかったと判断し、ネットワークの経路の変更を実施することにより(ステップS19)、ネットワーク高負荷状態を解消する。 On the other hand, if the resource shortage can be resolved by switching the path in the candidate in Step S16 (Yes in Step S16), the MGR determines that the optimum candidate has been found, and changes the network path (Step S16). S19) The network high load state is eliminated.
次に、本実施形態の具体例を説明する。図4および図5は、本実施形態のネットワークリソース管理装置を用いた管理方法の具体例を示す説明図である。 Next, a specific example of this embodiment will be described. 4 and 5 are explanatory diagrams showing a specific example of a management method using the network resource management apparatus of this embodiment.
図4に例示するように、外部へ最も近いスイッチ301(以下、SW1)と、SW1に接続されたスイッチ310(以下、スイッチSW10)およびスイッチ311(以下、スイッチSW11)が存在する。また、MGR300は、SW1に接続される。また、SW10には、スイッチ320(以下、SW100)およびスイッチ321(以下、SW101)が接続されている。一方、SW10には、スイッチ322(以下、スイッチSW102)が物理的には接続されているが、SW10の設定により、経路は遮断されている。
As illustrated in FIG. 4, there is a switch 301 (hereinafter referred to as SW1) closest to the outside, and a switch 310 (hereinafter referred to as switch SW10) and a switch 311 (hereinafter referred to as switch SW11) connected to SW1. The
SW11には、SW102が接続されている。一方、SW11には、SW100およびSW101が物理的には接続されているが、SW11の設定により、経路は遮断されている。 SW102 is connected to SW11. On the other hand, SW100 and SW101 are physically connected to SW11, but the path is blocked by the setting of SW11.
SW101には、スイッチ330(以下、SW1001)、スイッチ331(以下、SW1002)および、スイッチ332(以下、SW1003)が接続されている。また、SW1001、SW1002およびSW1003は、SW100およびSW102とそれぞれ物理的には接続されているが、各スイッチの設定により経路は遮断されている。 A switch 330 (hereinafter, SW1001), a switch 331 (hereinafter, SW1002), and a switch 332 (hereinafter, SW1003) are connected to the SW101. Further, SW1001, SW1002, and SW1003 are physically connected to SW100 and SW102, respectively, but the path is blocked by the setting of each switch.
なお、SW100およびSW102に接続されている下位のSWは省略されている。SW1001、SW1002およびSW1003は、エッジスイッチになり、配下に複数のFAT−PC340またはVM341が接続されている。
Note that lower SWs connected to SW100 and SW102 are omitted. SW1001, SW1002, and SW1003 are edge switches, and a plurality of FAT-
本具体例では、SW101のネットワーク負荷が93%で、高負荷状態になっているとする。SW101の上位のSW10、並びに、下位のSW1001、SW1002及び1003は、ネットワーク負荷が全て60%以下になっている。そのため、本具体例では、SW101配下の構成変更により、負荷状態を解消できると考えられる。
In this specific example, it is assumed that the network load of the SW 101 is 93% and is in a high load state. The network load of the
MGR300は、次に、SW101の下位のスイッチに、物理的に接続されている上位のスイッチを確認する。SW1001、SW1002およびSW1003には、SW101以外に、SW100およびSW102の2台のスイッチが物理的に接続されており、それぞれの負荷率は、60%以下である。
Next, the
SW100の負荷率は60%であり、SW102の負荷率は50%になっている。そのため、一見するとSW102への経路を増やすことが有効とも考えられる。しかし、実際には、SW100とSW102との間には性能差が存在する。 The load factor of SW100 is 60%, and the load factor of SW102 is 50%. Therefore, at first glance, it may be effective to increase the number of routes to SW102. However, in practice, there is a performance difference between SW100 and SW102.
本具体例では、各スイッチは、図4の各スイッチに記載された「推定スイッチング容量」を性能として有しているとする。各スイッチの性能差を考慮すると、SW102よりも、SW100の方がリソースの空きが大きいと言える。そこで、MGR300は、図5に例示するように、SW101配下のスイッチであるSW1003の経路をSW100へ変更する。その結果、SW101の負荷が低減し、SW100、SW101およびSW102の負荷が平準化されている。
In this specific example, it is assumed that each switch has “estimated switching capacity” described in each switch in FIG. 4 as performance. Considering the performance difference between the switches, it can be said that the resource of the
仮に、ネットワーク負荷(使用率)のみで判断し、SW1003の経路をSW102に切り替えた場合、SW102の使用率は100%になってしまうため、経路変更により、リソース配分が悪化してしまうことになる。しかし、本実施形態では、性能推定部10が各スイッチの性能を推定し、推定された性能に基づいて、第二負荷算出部40が適切に負荷率を算出する。そのため、異なる性能のスイッチを含むネットワークのリソースを平準化できる
If it is determined only by the network load (usage rate) and the route of SW1003 is switched to SW102, the usage rate of SW102 will be 100%, and resource allocation will deteriorate due to the route change. . However, in the present embodiment, the
以上のように、本実施形態では、性能推定部10が、各スイッチの使用率および各スイッチを流れるフローから各スイッチの性能を推定し、第一負荷算出部20が、各スイッチの第一の負荷を算出する。構成変更候補決定部30が、算出された負荷が予め定めた閾値よりも高いスイッチが接続されるネットワークの構成を変更するための候補を決定し、第二負荷算出部40が、候補として決定された変更後のネットワークの構成に基づいて、推定された性能での各スイッチの第二の負荷を算出する。よって、上述するように、異なる性能のスイッチを含むネットワークのリソースを平準化できる。
As described above, in this embodiment, the
また、本実施形態のネットワークリソース管理装置100を用いることで、性能が異なる様々なスイッチが存在するネットワークであっても、各スイッチの性能を意識することなく動的にネットワークの経路を変更し、ネットワーク負荷を平準化することができる。また、本実施形態のネットワークリソース管理装置100は、SNMPやsFlow、NetFlowといった、スイッチに標準的に実装されている技術を利用できる。そのため、スイッチの機種を限定せず、広範な環境で動作させることが可能になる。
Further, by using the network
次に、本発明の概要を図1を参照して説明する。本発明によるネットワークリソース管理装置は、ネットワーク内に配置された各スイッチのリソースを管理するネットワークリソース管理装置100であって、各スイッチの使用率および各スイッチを流れるフローからその各スイッチの性能を推定する性能推定部10と、各スイッチの第一の負荷を算出する第一負荷算出部20と、算出された第一の負荷が予め定めた閾値よりも高いスイッチである対象スイッチが接続されるネットワークの構成を変更するための候補を決定する構成変更候補決定部30と、候補として決定された変更後のネットワークの構成に基づいて、推定された性能での各スイッチの第二の負荷を算出する第二負荷算出部40とを備えている。
Next, the outline of the present invention will be described with reference to FIG. A network resource management apparatus according to the present invention is a network
そのような構成により、異なる性能のスイッチを含むネットワークのリソースを平準化できる。 With such a configuration, network resources including switches having different performances can be leveled.
また、各スイッチおよびそのスイッチに接続されるノード(例えば、FAT−PC、VM)に優先度が定められ、第一負荷算出部20は、優先度が高いほど、第一の負荷を高く算出してもよい。
In addition, priority is determined for each switch and a node (for example, FAT-PC, VM) connected to the switch, and the first
また、構成変更候補決定部30は、ネットワークの構成を変更する候補として、対象スイッチの下位全てのスイッチおよびその対象スイッチの上位のスイッチを選択し、第二負荷算出部40は、選択されたネットワークの構成に基づいて算出された第二の負荷が予め定めた負荷を下回るか否か判断してもよい。
Further, the configuration change
さらに、構成変更候補決定部30は、第二負荷算出部40が算出した各スイッチの第二の負荷が予め定めた負荷を下回る構成が存在しない場合、ネットワークの構成を変更する候補として、さらに上位のスイッチおよびそのスイッチ配下のスイッチを選択してもよい。
Further, the configuration change
また、第一負荷算出部20は、管理情報ベース(MIB)により取得した負荷を、各スイッチの第一の負荷として使用してもよい。
The first
10 性能推定部
20 第一負荷算出部
30 構成変更候補決定部
40 第二負荷算出部
100 ネットワークリソース管理装置
DESCRIPTION OF
Claims (9)
前記各スイッチの使用率および各スイッチを流れるフローから当該各スイッチの性能を推定する性能推定部と、
前記各スイッチの第一の負荷を算出する第一負荷算出部と、
算出された第一の負荷が予め定めた閾値よりも高いスイッチである対象スイッチが接続されるネットワークの構成を変更するための候補を決定する構成変更候補決定部と、
前記候補として決定された変更後のネットワークの構成に基づいて、推定された前記性能での各スイッチの第二の負荷を算出する第二負荷算出部とを備えた
ことを特徴とするネットワークリソース管理装置。 A network resource management device that manages resources of each switch arranged in a network,
A performance estimation unit that estimates the performance of each switch from the usage rate of each switch and the flow flowing through each switch;
A first load calculation unit for calculating a first load of each switch;
A configuration change candidate determination unit that determines a candidate for changing the configuration of a network to which a target switch that is a switch in which the calculated first load is higher than a predetermined threshold;
A network resource management comprising: a second load calculating unit that calculates a second load of each switch with the estimated performance based on the network configuration after the change determined as the candidate apparatus.
第一負荷算出部は、前記優先度が高いほど、第一の負荷を高く算出する
請求項1記載のネットワークリソース管理装置。 Priorities are established for each switch and the node connected to that switch,
The network resource management device according to claim 1, wherein the first load calculation unit calculates the first load higher as the priority is higher.
第二負荷算出部は、選択されたネットワークの構成に基づいて算出された第二の負荷が予め定めた負荷を下回るか否か判断する
請求項1または請求項2記載のネットワークリソース管理装置。 The configuration change candidate determination unit selects all lower switches of the target switch and higher switches of the target switch as candidates for changing the network configuration,
The network resource management device according to claim 1, wherein the second load calculation unit determines whether or not the second load calculated based on the configuration of the selected network is lower than a predetermined load.
請求項3記載のネットワークリソース管理装置。 When there is no configuration in which the second load of each switch calculated by the second load calculation unit is lower than a predetermined load, the configuration change candidate determination unit further selects a higher-level switch and the relevant switch as candidates for changing the network configuration. The network resource management device according to claim 3, wherein a switch under the switch is selected.
請求項1から請求項4のうちのいずれか1項に記載のネットワークリソース管理装置。 The network resource management device according to any one of claims 1 to 4, wherein the first load calculation unit uses a load acquired from the management information base as a first load of each switch.
前記各スイッチの使用率および各スイッチを流れるフローから当該各スイッチの性能を推定し、
前記各スイッチの第一の負荷を算出し、
算出された負荷が予め定めた閾値よりも高いスイッチである対象スイッチが接続されるネットワークの構成を変更するための候補を決定し、
前記候補として決定された変更後のネットワークの構成に基づいて、推定された前記性能での各スイッチの第二の負荷を算出する
ことを特徴とするネットワークリソース管理方法。 A network resource management method for managing resources of each switch arranged in a network,
Estimating the performance of each switch from the usage rate of each switch and the flow flowing through each switch,
Calculating the first load of each switch;
Determining a candidate for changing the configuration of the network to which the target switch, which is a switch whose calculated load is higher than a predetermined threshold, is connected;
A network resource management method, comprising: calculating a second load of each switch with the estimated performance based on a network configuration after change determined as the candidate.
前記優先度が高いほど、第一の負荷を高く算出する
請求項6記載のネットワークリソース管理方法。 Priorities are established for each switch and the node connected to that switch,
The network resource management method according to claim 6, wherein the higher the priority is, the higher the first load is calculated.
前記コンピュータに、
前記各スイッチの使用率および各スイッチを流れるフローから当該各スイッチの性能を推定する性能推定処理、
前記各スイッチの第一の負荷を算出する第一負荷算出処理、
算出された第一の負荷が予め定めた閾値よりも高いスイッチである対象スイッチが接続されるネットワークの構成を変更するための候補を決定する構成変更候補決定処理、および、
前記候補として決定された変更後のネットワークの構成に基づいて、推定された前記性能での各スイッチの第二の負荷を算出する第二負荷算出処理
を実行させるためのネットワークリソース管理プログラム。 A network resource management program applied to a computer for managing resources of each switch arranged in a network,
In the computer,
A performance estimation process for estimating the performance of each switch from the usage rate of each switch and the flow flowing through each switch;
A first load calculation process for calculating a first load of each switch;
A configuration change candidate determination process for determining a candidate for changing the configuration of a network to which a target switch that is a switch in which the calculated first load is higher than a predetermined threshold; and
A network resource management program for executing a second load calculation process for calculating a second load of each switch with the estimated performance based on the changed network configuration determined as the candidate.
コンピュータに、
第一負荷算出処理で、前記優先度が高いほど、第一の負荷を高く算出させる
請求項8記載のネットワークリソース管理プログラム。 Priorities are established for each switch and the node connected to that switch,
On the computer,
The network resource management program according to claim 8, wherein in the first load calculation process, the higher the priority, the higher the first load is calculated.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017041235A JP6834604B2 (en) | 2017-03-06 | 2017-03-06 | Network resource management equipment, methods and programs |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017041235A JP6834604B2 (en) | 2017-03-06 | 2017-03-06 | Network resource management equipment, methods and programs |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018148382A true JP2018148382A (en) | 2018-09-20 |
JP6834604B2 JP6834604B2 (en) | 2021-02-24 |
Family
ID=63591544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017041235A Active JP6834604B2 (en) | 2017-03-06 | 2017-03-06 | Network resource management equipment, methods and programs |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6834604B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007189615A (en) * | 2006-01-16 | 2007-07-26 | Mitsubishi Electric Corp | Network monitoring support device, network monitoring support method, and network monitoring support program |
JP2007208633A (en) * | 2006-02-01 | 2007-08-16 | Mitsubishi Electric Corp | Device, method and program for designing network |
US20130346603A1 (en) * | 2011-04-19 | 2013-12-26 | Yordanos Beyene | Computing a Performance Characteristic of a Network Device |
JP2015149532A (en) * | 2014-02-05 | 2015-08-20 | 富士通株式会社 | Management device, management method, and management program |
-
2017
- 2017-03-06 JP JP2017041235A patent/JP6834604B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007189615A (en) * | 2006-01-16 | 2007-07-26 | Mitsubishi Electric Corp | Network monitoring support device, network monitoring support method, and network monitoring support program |
JP2007208633A (en) * | 2006-02-01 | 2007-08-16 | Mitsubishi Electric Corp | Device, method and program for designing network |
US20130346603A1 (en) * | 2011-04-19 | 2013-12-26 | Yordanos Beyene | Computing a Performance Characteristic of a Network Device |
JP2015149532A (en) * | 2014-02-05 | 2015-08-20 | 富士通株式会社 | Management device, management method, and management program |
Also Published As
Publication number | Publication date |
---|---|
JP6834604B2 (en) | 2021-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11165631B1 (en) | Identifying a root cause of alerts within virtualized computing environment monitoring system | |
Yu et al. | Stochastic load balancing for virtual resource management in datacenters | |
EP3053041B1 (en) | Method, system, computer program and computer program product for monitoring data packet flows between virtual machines, vms, within a data centre | |
KR101782345B1 (en) | End-to-end datacenter performance control | |
US10445117B2 (en) | Predictive analytics for virtual network functions | |
JP5557590B2 (en) | Load balancing apparatus and system | |
US10979491B2 (en) | Determining load state of remote systems using delay and packet loss rate | |
EP3033860B1 (en) | Transparent software-defined network management | |
LaCurts et al. | Cicada: Introducing predictive guarantees for cloud networks | |
KR101941282B1 (en) | Method of allocating a virtual machine for virtual desktop service | |
US10528378B2 (en) | System and method for load estimation of virtual machines in a cloud environment and serving node | |
KR20150132774A (en) | Method and appratus for allocating network resource based on application | |
CN109039933B (en) | Cluster network optimization method, device, equipment and medium | |
KR101256918B1 (en) | Method for enhancing scalability and availability of cloud services and the system thereby | |
KR101448413B1 (en) | Method and apparatus for scheduling communication traffic in atca-based equipment | |
JP2018148382A (en) | Network resource management device, method, and program | |
EP2775400A1 (en) | Ressource management system and method | |
Gouareb et al. | Placement and routing of vnfs for horizontal scaling | |
Inoue et al. | Noise-induced VNE method for software-defined infrastructure with uncertain delay behaviors | |
JP7148596B2 (en) | Network-aware elements and how to use them | |
Ri et al. | Hybrid load balancing method with failover capability in server cluster using SDN | |
JP6597324B2 (en) | Autoscale method, autoscale program, information processing apparatus, and information processing system | |
WO2023218664A1 (en) | Replacement system and replacement method | |
WO2023218663A1 (en) | Execution platform determination system and execution platform determination method | |
Dakshayini et al. | Effective resource monitoring and management system for cloud environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201223 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6834604 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |