JP5300938B2 - 輻輳検出方法及び輻輳制御方法 - Google Patents

輻輳検出方法及び輻輳制御方法 Download PDF

Info

Publication number
JP5300938B2
JP5300938B2 JP2011182301A JP2011182301A JP5300938B2 JP 5300938 B2 JP5300938 B2 JP 5300938B2 JP 2011182301 A JP2011182301 A JP 2011182301A JP 2011182301 A JP2011182301 A JP 2011182301A JP 5300938 B2 JP5300938 B2 JP 5300938B2
Authority
JP
Japan
Prior art keywords
group
congestion
belonging
processes
congestion control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011182301A
Other languages
English (en)
Other versions
JP2013046193A (ja
Inventor
広幸 徐
健 福元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011182301A priority Critical patent/JP5300938B2/ja
Publication of JP2013046193A publication Critical patent/JP2013046193A/ja
Application granted granted Critical
Publication of JP5300938B2 publication Critical patent/JP5300938B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、コンピュータシステムの輻輳を検出し制御する技術に関する。
交換機などの通信システム・セッション制御システムでは、システムがその処理能力以上の呼を受けると呼の接続完了率が低下する輻輳状態に陥る。輻輳状態になるとサーバの処理能力低下やサーバダウンによるサービスの劣化や停止が起きるため、通信システム・セッション制御システムでは輻輳検出機能と輻輳検出時にサービスやシステムを保護することを目的とした輻輳制御機能を備えている。
輻輳時にはシステムのCPUリソースが不足するため、各々の処理へのCPUリソースの配分が重要になる。これを適切に行わなければ、処理の遅延やサーバダウンにつながる可能性がある。従来の交換機では、専用OS機能によりCPUリソースをタイムスライスで静的に分割し、呼処理系プロセス用、保守系プロセス用などと適切にCPUリソースを割り当てることができた。
特開2005−167769号公報
従来の輻輳制御技術は、例えばTRONなどの専用OSの機能として具備されていた。しかしながら、Linuxなどの汎用OSでは具備されていない。そのため、汎用OSによりシステムを構築した場合、輻輳時のCPUリソース配分をアプリケーションで行わなければならない。汎用OSにもプロセスに優先度があり、優先度に応じてCPUリソースを分配する機能があるが、アプリケーションの各プロセスの特徴や連携を考慮したCPUリソース配分をコントロールすることはできない。
一方、専用OSでは、CPUリソースを静的に分割して各プロセスに割り当てていたため、分割された片方のCPUリソースに余裕があっても別のプロセスでそのCPUリソースを使用することができないという問題があった。
本発明は、上記に鑑みてなされたものであり、プロセスの優先度を考慮した輻輳検出、輻輳制御を行うことを目的とする。
第1の本発明に係る輻輳検出方法は、優先度を付けた複数のグループにプロセスを分類し、前記グループ毎に輻輳を検出する輻輳検出方法であって、前記複数のグループのそれぞれに、自グループ以上の優先度を持つグループに属するプロセスのリソース使用率の合計の上限を閾値として設定しておき、自グループ以上の優先度のグループに属するプロセスのリソース使用率を合計した累積値を求めるステップと、前記累積値と自グループに設定された前記閾値を比較し、前記累積値が前記閾値を超えていたときに、当該自グループを輻輳と判定するステップと、を有することを特徴とする。
第2の本発明に係る輻輳制御方法は、優先度を付けた複数のグループにプロセスを分類し、前記グループ毎に輻輳を検出し、輻輳と判定されたグループに属するプロセスに対する輻輳制御方法であって、前記複数のグループのそれぞれに、自グループ以上の優先度を持つグループに属するプロセスのリソース使用率の合計の上限を閾値として設定しておき、自グループ以上の優先度のグループに属するプロセスのリソース使用率を合計した累積値を求めるステップと、前記累積値と自グループに設定された前記閾値を比較し、前記累積値が前記閾値を超えていたときに、当該自グループを輻輳と判定するステップと、前記判定するステップで輻輳と判定されたグループに属するプロセスに対して、プロセス毎に予め決められた方法により輻輳制御するステップと、を有することを特徴とする。
上記輻輳制御方法において、前記輻輳制御するステップは、前記判定するステップで輻輳と判定されたグループの優先度以下のグループに属するプロセスに対して輻輳制御することを特徴とする。
本発明によれば、プロセスの優先度を考慮した輻輳検出、輻輳制御を行うことができる。
本実施の形態におけるセッション制御サーバの構成を示す機能ブロック図である。 輻輳を検出する動作の流れを示すフローチャートである。 輻輳の検出を具体的に説明する図である。
以下、本発明の実施の形態について図面を用いて説明する。
図1は、本実施の形態におけるセッション制御サーバの構成を示す機能ブロック図である。図1では、セッション制御サーバ1の輻輳検出、輻輳制御に関する部分のみを図示している。図1に示すように、本実施の形態におけるセッション制御サーバ1は、CPU使用率算出部11、輻輳判定部12、および輻輳制御部13を備える。セッション制御サーバ1が備える各部は、演算処理装置、記憶装置等を備えたコンピュータにより構成して、各部の処理がプログラムによって実行されるものとしてもよい。このプログラムはセッション制御サーバ1が備える記憶装置に記憶されており、磁気ディスク、光ディスク、半導体メモリ等の記録媒体に記録することも、ネットワークを通して提供することも可能である。なお、ここではセッション制御サーバについての輻輳検出方法、輻輳制御方法を説明するが、これに限るものではなく、他のアプリケーションサーバについても同様に適用可能である。
セッション制御サーバ1では、プロセス(またはスレッド)をOSが管理するプロセス優先度ではなく、サービス観点での優先度で複数グループに分類しておき、各グループに対して、自グループ以上の優先度を持つグループに属するプロセスのCPU使用率の合計の上限を閾値として設定する。プロセスとグループの対応関係、各グループの閾値は、セッション制御サーバ1が備える記憶装置に記憶される。
CPU使用率算出部11は、同じグループに属するプロセスのCPU使用率を合計し、グループ毎のCPU使用率を算出する。
輻輳判定部12は、グループ毎に、そのグループ以上の優先度のグループのCPU使用率を合計した累積値とCPU使用率の上限を示す閾値とを比較してそのグループの輻輳を判定する。具体的には、各グループについて、自グループ以上の優先度のグループに属するプロセスのCPU使用率を合計した累積値を求め、求めた累積値とグループ毎に設定された閾値とを比較し、累積値が閾値を超えていたときに、そのグループを輻輳と判定する。
輻輳制御部13は、輻輳と判定されたグループに属するプロセスに対してプロセス毎に予め決められた輻輳制御を行う。輻輳制御対象のプロセスは、輻輳と判定されたグループに属する全てのプロセスである。複数のグループが輻輳と判定された場合、輻輳制御は輻輳と判定されたグループそれぞれに属する全てのプロセスに対して行われる。輻輳制御方法は、プロセス毎に設定、実装しておく。例えば、バックアッププロセスは強制的に一定時間スリープさせる、コマンドプロセスは強制終了して新規コマンド投入を制限する等がある。表1に、プロセス別の制御方法の例を示す。なお、表1に示すプロセス別輻輳制御方法は一例であり、輻輳制御方法を限定するものではない。
Figure 0005300938
次に、セッション制御サーバ1が輻輳を検出する処理について説明する。
図2は、セッション制御サーバ1が輻輳を検出する処理の流れを示すフローチャートである。
まず、CPU使用率算出部11がグループ毎に属するプロセスのCPU使用率を合計し、各グループのCPU使用率を求める(ステップS11)。
続いて、輻輳判定部12が各グループについて、自グループ以上の優先度のグループのCPU使用率を合計し、グループ毎の累積値を求める(ステップS12)。
そして、輻輳判定部12が各グループについて、ステップS12で求めた累積値と予め設定された閾値とを比較し(ステップS13)、累積値が閾値を超えたグループを輻輳と判定する(ステップS14)。その後、輻輳制御部13が、輻輳と判定されたグループに属するプロセスに対して、プロセス毎に予め決められた方法により輻輳制御する。
次に、具体例を用いて輻輳の検出について説明する。
図3は、輻輳の検出を具体的に説明する図である。図3の例では、各プロセスを優先度が高い順に、OS・ミドルプロセス、系間同期プロセスが属する「最高」、呼処理系プロセスが属する「高」、保守コマンドプロセスが属する「中」、定期バックアッププロセスが属する「低」の4つのグループに分け、それぞれのグループのCPU使用率の上限を示す閾値を30%,70%,80%,85%と設定した。
グループ毎のプロセスのCPU使用率を合計した値が、「最高」は15%、「高」は40%、「中」は26%、「低」は3%であったとすると、各グループについての自グループ以上の優先度のグループのCPU使用率の累積値は、図3に示すように、「最高」は15%、「高」は55%、「中」は81%、「低」は84%となる。各グループについて、累積値と閾値を比較すると、「中」は累積値が閾値よりも高く、輻輳と判定される。その結果、「中」に属する保守コマンドプロセスに対して輻輳制御が行われる。
なお、図3に示す例では、「低」は累積値が閾値よりも低く輻輳と判定されないが、輻輳と判定されたグループよりも優先度が低いグループに属するプロセスも輻輳制御対象とし、「低」に属する定期バックアッププロセスを輻輳制御してもよい。
以上説明したように、本実施の形態によれば、優先度を付けた複数のグループにプロセスを分類し、各グループに対して、自グループ以上の優先度を持つグループに属するプロセスのCPU使用率の合計の上限を閾値として設定しておき、グループ毎にそのグループに属するプロセスのCPU使用率の合計を求め、各グループについて、自グループ以上の優先度のグループに属するプロセスのCPU使用率を合計した累積値を求め、求めた累積値とグループ毎に設定された閾値とを比較し、累積値が閾値を超えていたときに、そのグループを輻輳と判定することにより、各グループの優先度に基づき一定のCPUリソースを配分しつつ、使われていないCPUリソースを考慮した輻輳検出を行うことができる。
本実施の形態によれば、輻輳と判定されたグループに属するプロセスそれぞれについて、予め設定された方法により輻輳制御を行うことで、きめ細やかで無駄の少ない輻輳制御が可能となる。
1…セッション制御サーバ1
11…CPU使用率算出部
12…輻輳判定部
13…輻輳制御部

Claims (3)

  1. 優先度を付けた複数のグループにプロセスを分類し、前記グループ毎に輻輳を検出する輻輳検出方法であって、
    前記複数のグループのそれぞれに、自グループ以上の優先度を持つグループに属するプロセスのリソース使用率の合計の上限を閾値として設定しておき、
    自グループ以上の優先度のグループに属するプロセスのリソース使用率を合計した累積値を求めるステップと、
    前記累積値と自グループに設定された前記閾値を比較し、前記累積値が前記閾値を超えていたときに、当該自グループを輻輳と判定するステップと、
    を有することを特徴とする輻輳検出方法。
  2. 優先度を付けた複数のグループにプロセスを分類し、前記グループ毎に輻輳を検出し、輻輳と判定されたグループに属するプロセスに対する輻輳制御方法であって、
    前記複数のグループのそれぞれに、自グループ以上の優先度を持つグループに属するプロセスのリソース使用率の合計の上限を閾値として設定しておき、
    自グループ以上の優先度のグループに属するプロセスのリソース使用率を合計した累積値を求めるステップと、
    前記累積値と自グループに設定された前記閾値を比較し、前記累積値が前記閾値を超えていたときに、当該自グループを輻輳と判定するステップと、
    前記判定するステップで輻輳と判定されたグループに属するプロセスに対して、プロセス毎に予め決められた方法により輻輳制御するステップと、
    を有することを特徴とする輻輳制御方法。
  3. 前記輻輳制御するステップは、前記判定するステップで輻輳と判定されたグループの優先度以下のグループに属するプロセスに対して輻輳制御することを特徴とする請求項2記載の輻輳制御方法。
JP2011182301A 2011-08-24 2011-08-24 輻輳検出方法及び輻輳制御方法 Active JP5300938B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011182301A JP5300938B2 (ja) 2011-08-24 2011-08-24 輻輳検出方法及び輻輳制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011182301A JP5300938B2 (ja) 2011-08-24 2011-08-24 輻輳検出方法及び輻輳制御方法

Publications (2)

Publication Number Publication Date
JP2013046193A JP2013046193A (ja) 2013-03-04
JP5300938B2 true JP5300938B2 (ja) 2013-09-25

Family

ID=48009775

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011182301A Active JP5300938B2 (ja) 2011-08-24 2011-08-24 輻輳検出方法及び輻輳制御方法

Country Status (1)

Country Link
JP (1) JP5300938B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117858262B (zh) * 2024-03-07 2024-05-14 成都爱瑞无线科技有限公司 基站资源调度优化方法、装置、基站、设备、介质及产品

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000268012A (ja) * 1999-03-12 2000-09-29 Nec Corp クライアントサーバシステムにおけるサーバ負荷の分散方法ならびに装置
JP5252352B2 (ja) * 2009-11-05 2013-07-31 クラリオン株式会社 情報端末装置、情報端末管理システム及びプログラム

Also Published As

Publication number Publication date
JP2013046193A (ja) 2013-03-04

Similar Documents

Publication Publication Date Title
US11546644B2 (en) Bandwidth control method and apparatus, and device
CA2780231C (en) Goal oriented performance management of workload utilizing accelerators
US20170155560A1 (en) Management systems for managing resources of servers and management methods thereof
US20170201574A1 (en) Method, system, and device for allocating resources in a server
US10440136B2 (en) Method and system for resource scheduling
CN110196767B (zh) 服务资源控制方法、装置、设备和存储介质
US20160170791A1 (en) Device for controlling migration in a distributed cloud environment and method for controlling migration using the same
EP2725862A1 (en) Resource allocation method and resource management platform
US20120221730A1 (en) Resource control system and resource control method
WO2015101091A1 (zh) 一种分布式资源调度方法及装置
US9535749B2 (en) Methods for managing work load bursts and devices thereof
US10305974B2 (en) Ranking system
JP6031462B2 (ja) 仮想マシン配置装置及び方法及びプログラム
CN106598740A (zh) 一种限制多线程程序占用cpu利用率的系统及限制方法
WO2017151510A1 (en) A method and device for scheduling resources
CN111176833A (zh) 一种多处理节点的任务分配方法及系统
US9135064B2 (en) Fine grained adaptive throttling of background processes
EP2940600A1 (en) Data scanning method and device
JP5300938B2 (ja) 輻輳検出方法及び輻輳制御方法
US9213575B2 (en) Methods and systems for energy management in a virtualized data center
CN110290210B (zh) 接口调用系统中不同接口流量比例自动调配方法及装置
EP3641260B1 (en) Method and device for improving data storage security
US9742687B2 (en) Management system and method for execution of virtual machines
US20180167288A1 (en) Service system and control method of the same
US10540341B1 (en) System and method for dedupe aware storage quality of service

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130618

R150 Certificate of patent or registration of utility model

Ref document number: 5300938

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350