JP2016151794A - 分散処理装置と分散処理方法 - Google Patents

分散処理装置と分散処理方法 Download PDF

Info

Publication number
JP2016151794A
JP2016151794A JP2015027396A JP2015027396A JP2016151794A JP 2016151794 A JP2016151794 A JP 2016151794A JP 2015027396 A JP2015027396 A JP 2015027396A JP 2015027396 A JP2015027396 A JP 2015027396A JP 2016151794 A JP2016151794 A JP 2016151794A
Authority
JP
Japan
Prior art keywords
unit
processing
pid control
distributed processing
proportional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015027396A
Other languages
English (en)
Inventor
徹生 中溝
Tetsuo Nakamizo
徹生 中溝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015027396A priority Critical patent/JP2016151794A/ja
Publication of JP2016151794A publication Critical patent/JP2016151794A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】想定外の故障が発生してトラヒック異常が想定外の状況になった場合の処理要求に、少ないパラメータで迅速に追従できる分散処理装置を提供する。【解決手段】冗長化された分散サーバシステムを構成する分散処理装置であって、他の分散処理装置又はクライアント端末からの処理要求を処理する処理部10と、他の分散処理装置の故障情報と処理要求とを入力として、処理部が前記処理を実行するのに使用するリソースを、処理部10からのフィードバック量の比例成分と積分成分と微分成分との3つの要素から成るPID制御量で配分するリソース配分部20とを具備する。【選択図】図2

Description

本発明は、冗長化された分散サーバシステムのトラヒックの品質制御を行う分散処理装置と分散処理方法に関する。
図1に、冗長化されたデータベース(以降、DB)サーバシステムのシステム構成例を示す。DBサーバシステム1と2は、それぞれ1台のマスタと2台のスレイブで冗長化されている。クライアント端末11,12,13は、システムの違い及びマスタとスレイブの違いを意識しないで要求データを取得する。
各装置(サーバ)は、機能分散が可能で、要求受付、DB参照、DB登録、要求返却機能を分散保持している。また、DBサーバシステム1と2は、それぞれ異なる利用者情報を持っており、互いにデータ取得要求を行う。
例えば、DBサーバシステム1のマスタ#1とスレイブ#1−1が故障するトラヒック異常が発生したと仮定すると、スレイブ#1−2がマスタとなってDBサーバシステム1に対する処理要求を処理する。この場合、DBサーバシステム1に対する処理要求は、全てスレイブ#1−2が担うことになる。スレイブ#1−2は、その装置の諸元や仕様を越えた呼処理要求に対応するため、要求処理遅延や呼損等、サービス品質に悪影響を与える事象が発生する可能性がある。
その事象の発生を回避する目的で、従来からDBサーバシステム内に動的優先制御機能を導入して、与えられた扱い方(ポリシー)にしたがって、データ取得要求をクラスに分け、クラスに応じた処理順で処理を行う方法が提案されている(例えば非特許文献1)。また、過負荷状態を回避する目的で、各タスクに割り当てるリソースを動的に変化させるフィードバック形の制御方法が例えば非特許文献2に記載されている。
原田史子ほか2名、「QoSの公平性を考慮したマルチソースの適応配分制御」、電子情報通信学会、信学技報(実時間処理ワークショップ)、2004年、pp.13-18 植田和憲ほか2名、「IPv6ネットワークにおけるフィードバック制御を用いた高品質なリアルタイムDV転送システムの設計及び実装」、電子情報通信学会、技術研究報告(IA2001-50)、2002年2月、pp.57-64
しかしながら、従来の優先順位を付ける方法は、優先順位を制御するためのパラメータが多数あり、そのパラメータ設計が困難である。また、トラヒック異常が想定外の状況になった場合には、予め決めた優先順位で正しく動作せず期待した結果が得られない課題がある。
また、従来のフィードバック制御法は、処理要求に対する目標値を線形関数で与える線形化システムであり、線形関数以外の関数で表される様な外乱(想定外のトラヒック異常時の処理要求)には対処できない課題がある。
この発明は、このような課題に鑑みてなされたものであり、分散サーバシステムの一部に故障が発生してトラヒック異常になった場合の処理要求に、少ないパラメータで迅速に追従できる分散処理装置と分散処理方法とを提供することを目的とする。
本発明の分散処理装置は、冗長化された分散サーバシステムを構成する分散処理装置であって、他の分散処理装置又はクライアント端末からの処理要求を処理する処理部と、前記他の分散処理装置の故障情報と前記処理要求とを入力として、前記処理部が前記処理を実行するのに使用するリソースを、前記処理部の出力を計測した計測値の比例成分と積分成分と微分成分との3つの要素を含むPID制御量で配分するリソース配分部とを具備することを要旨とする。
また、本発明の分散処理方法は、分散処理装置が行う分散処理方法であって、他の分散処理装置又はクライアント端末からの処理要求を処理する処理ステップと、前記他の分散処理装置の故障情報と前記処理要求とを入力として、前記処理ステップが前記処理を実行するのに使用するリソースを、前記処理ステップの出力を計測した計測値の比例成分と積分成分と微分成分との3つの要素を含むPID制御量で配分するリソース配分ステップとを行うことを要旨とする。
この発明の分散処理装置と分散処理方法によれば、分散サーバシステムの一部に故障が発生してトラヒック異常になった場合の処理要求に、少ないパラメータで迅速に追従することができる。
冗長化されたデータベースサーバシステムのシステム構成例を示す図である。 第1実施形態の分散処理装置100の機能構成例を示す図である。 リソース配分部20の機能構成例を示す図である。 リソース配分部20の動作フローを示す図である。 PID制御を説明する図である。 第2実施形態の分散処理装置200の機能構成例を示す図である。
以下、本発明の実施の形態について図面を用いて説明する。複数の図面中同一のものに
は同じ参照符号を付し、説明は繰り返さない。
〔第1実施形態〕
図2に、本発明の第1実施形態の分散処理装置100の機能構成例を示す。本実施形態の分散処理装置100は、上記のDBサーバシステム1のマスタ#1、スレイブ#1−1、又はスレイブ#1−2の何れかに置き換わるものである。分散処理装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されることとしてもよい。以降で説明する他の装置についても同じである。
本実施形態では、DBサーバシステム1のマスタ#1とスレイブ#1−1とが故障したと仮定して、スレイブ#1−2である分散処理装置100が動作する場合を例に説明する。マスタ#1とスレイブ#1−1とが故障すると冗長化構成のため、今までスレイブ#1−2として機能していた分散処理装置100はマスタ#1−2として動作する。
分散処理装置100は、処理部10と、リソース配分部20とを具備する。処理部10は、他の分散処理装置又はクライアント端末からの処理要求を処理する。リソース配分部20は、他の分散処理装置の故障情報と処理要求とを入力として、処理部10が処理を実行するのに使用するリソースを、処理部10の出力を計測した計測値の比例成分と積分成分と微分成分との3つの要素を含むPID制御量で配分する。
PID(Proportional-Integral-Derivative)制御量とは、処理部10が処理要求を処理する際に使用するリソースの大きさを決める情報である。リソースとは、例えば分散処理装置100のCPUパワーや、帯域幅のことである。CPUパワーとは、例えば処理に用いるCPUの数である。また、帯域幅とはbit/秒の大きさである。
リソース配分部20は、PID制御量としてCPUパワーを制御してもよいし、CPUパワーと帯域幅の両方を制御してもよい。また、他のPID制御量を用いてもよい。
処理部10は、リソース配分部20が配分したリソースで処理要求を処理する。処理要求とは、例えば利用者情報の取得要求である。また、分散処理装置100が例えば呼制御を行う装置であれば、呼接続要求が処理要求である。
本実施形態の分散処理装置100によれば、他の分散処理装置が故障した後の処理要求に対して自装置のリソースをPID制御で配分するので、想定外の故障が発生した場合の処理要求に、少ないパラメータで迅速に追従することができる。なお、破線で示すマーキング24については後述する。
図2と図3を参照して更に詳しく分散処理装置100の動作を説明する。リソース配分部20は、目標設定部21と、PID制御部22と、計測部23とを具備する。
目標設定部21は、他の分散処理装置の故障情報と処理要求とを入力として、自装置のリソースを制御する目標操作量を設定する。故障情報とは、例えばマスタ#1とスレイブ#1−1とから受信する情報である。分散処理装置100は、故障情報によって同じシステム内の他の分散処理装置の稼働状況を把握する。
目標設定部21は、他の分散処理装置が故障したトラヒック異常時に動作する(ステップS1のYES)ものであり、トラヒック異常時の処理要求に対して分散処理装置100のリソースを、どの位割り当てるかを決める目標操作量を設定する(ステップS2)。
目標操作量とは、処理要求に対して分散処理装置100のリソースを、どの位割り当てるかを決める目標値である。目標値は、例えばパケット損失率や、TAT(Turn Around Time)の値である。この目標値は、トラヒック異常時に要求処理遅延や呼損を生じさせたいために設定する。
例えば、分散処理装置100が保存している利用者情報の取得要求の処理要求に対しては、最優先で処理するように短いTATを目標操作量として設定する。また、分散処理装置100が呼制御装置の場合の緊急呼に対しては、例えば少ないパケット損失率を目標操作量として設定する。
計測部23は、処理要求を処理する処理部10の出力を計測して計測値を出力する(ステップS3)。計測部23は、処理部10の出力を常に計測してフィードバック量である計測値をPID制御部22に出力する。
計測値は、上記の目標値に対応する制御対象を計測した値である。目標値がTATであれば、計測部23はTATを測定する。パケット損失率やTATは、通信パケットのシーケンス番号や時刻情報から容易に計測することができる(参考:非特許文献2)。
PID制御部22は、目標設定部21が設定した目標操作量と、計測部23が計測した計測値とを入力としてPID制御量u(t)を計算する(ステップS4)。PID制御量u(t)について詳しくは後述する。
処理部10は、PID制御部22で計算されたPID制御量u(t)に対応する割り当てられたリソースで処理要求を処理する(ステップS5)。計測部23は、処理要求を処理する間の処理部10の出力を計測した計測値を、PID制御部22に出力する(ステップS6)。
よって、PID制御部22は、目標操作量と逐次入力される計測値とによって、処理部10をフィードバック制御する。次に、PID制御部22について詳しく説明する。
〔PID制御部〕
図4に、PID制御部22の機能構成例を示す。PID制御部22は、減算部230と、比例部231と、積分部232と、微分部233と、加算部234とを具備する。
減算部230は、目標設定部21が設定した目標操作量と、計測部23で計測した計測値との差分e(t)を計算する。目標操作量をr(t)、計測値をy(t)とすると差分e(t)は、e(t)=r(t)-y(t)である。
図5に、比例部231、積分部232、及び微分部233が計算する計算の特徴を、温度制御の例で示す。温度制御を例にするのは分かり易くするためである。
比例部231は、差分e(t)に比例定数Kを乗じた制御量u(t)を計算する(式(1))。式(1)に示すように、この制御量u(t)は、目標温度との差が大きいほど制御量(P制御)が大きくなるので、即応性が高い特徴がある。図5に、P制御で示すグラフの実線が制御量u(t)である。破線が処理部10の出力である。
積分部232は、差分e(t)を時間積分した値に比例定数Kを乗じた制御量を計算する(式(2))。この制御量u(t)の特徴は、時間経過につれて差が徐々に無くなるように変化するので、状態保持性が高い特徴がある。図5に、PI制御で示すグラフの実線が制御量u(t)であり、この制御量u(t)は比例部231と積分部232との制御量の和である。
微分部233は、差分e(t)の微分値に比例定数Kを乗じた制御量を計算する(式(3))。この制御量u(t)の特徴は、差分e(t)の大きな変化に対して大きな制御量になるので、安定性が高い特徴がある。図5に、PID制御で示すグラフの実線が制御量u(t)であり、この制御量u(t)は比例部231と積分部232と微分部233との制御量の和である。
Figure 2016151794
加算部234は、比例部231の出力と積分部232と微分部233との出力を加算する(式(4))。
Figure 2016151794
加算部234が出力するPID制御量u(t)は、比例部231が出力する制御量の特徴と、積分部232が出力する制御量の特徴と、微分部233が出力する制御量とのそれぞれの特徴を併せ持った制御量となる。このPID制御量は、分散処理装置100のリソースを配分する値であるので、処理部10に即応性と状態保持性と安定性とが高い処理を行わせることができる。
つまり、本実施形態の分散処理装置100によれば、想定外の故障が発生してトラヒック異常が生じた場合の処理要求の変化に、例えばパケット損失率に関するPID制御量とTATに関するPID制御量の2個のパラメータだけで迅速に追従することができる。
〔第2実施形態〕
図6に、本発明の第2実施形態の分散処理装置200の機能構成例を示す。本実施形態の分散処理装置200は、PID制御部222の比例部231、積分部232、及び微分部233の比例定数K,K,Kを自動的に設定できるようにしたものである。
分散処理装置200は、分散処理装置100(図2)に対して学習部201を具備する点で異なる。学習部201は、計測部23が出力する計測値と、PID制御部22が出力するPID制御量とを入力として、比例部231の比例定数Kと積分部232の比例定数Kと微分部233の比例定数Kを学習して求める。
学習とは一般的な機械学習のことであり、教師なし学習、教師あり学習、及び強化学習の何れの手法を適用してもよい。本実施形態の分散処理装置200によれば、PID制御の比例定数を自動的に得ることができる。
以上説明した本実施形態の分散処理装置100と200によれば、冗長化された分散サーバシステムに想定外の故障が発生してトラヒック異常が生じた場合の処理要求の変化に、少ないパラメータで迅速に追従することができる。なお、図2と図6に破線で示すように、マーキング部14を具備するようにしてもよい。
マーキング部14は、目標設定部21で設定した目標操作量に優先順位を付ける。目標設定部21は、例えばTATの目標操作量を短い時間に設定することで処理の優先度を決めることができる。しかし、時系列で入力される処理要求の順番を変更することはできない。
マーキング部14は、処理要求の要求元の識別子を利用して処理要求に優先順位を付ける。例えば、要求元の識別子や緊急度を表す指標に基づいて、マーキング部14は処理要求を処理する順番を入れ替える。マーキング部14を具備することで、処理要求をより柔軟に処理できるようになる。つまり、トラヒック異常が生じた際に、システム管理者の意向をより反映させた処理を行うことができる。
このように本発明は、上記した実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
1 :DBサーバシステム
2 :DBサーバシステム
10 :処理部
11 :目標設定部
12 :計測部
13 :PID制御部
14 :マーキング部
20 :リソース配分部
100:分散処理装置

Claims (6)

  1. 冗長化された分散サーバシステムを構成する分散処理装置であって、
    他の分散処理装置又はクライアント端末からの処理要求を処理する処理部と、
    前記他の分散処理装置の故障情報と前記処理要求とを入力として、前記処理部が前記処理を実行するのに使用するリソースを、前記処理部の出力を計測した計測値の比例成分と積分成分と微分成分との3つの要素を含むPID制御量で配分するリソース配分部と
    を具備することを特徴とする分散処理装置。
  2. 請求項1に記載した分散処理装置において、
    前記リソース配分部は、
    前記故障情報と前記処理要求とを入力として前記リソースを制御する目標操作量を設定する目標設定部と、
    前記計測値を計測する計測部と、
    前記目標操作量と前記計測値とを入力として、前記PID制御量を計算するPID制御部と
    を具備することを特徴とする分散処理装置。
  3. 請求項2に記載した分散処理装置において、
    前記PID制御部は、
    前記目標操作量と前記計測値との差分に比例した前記PID制御量を計算する比例部と、
    前記差分の時間積分値に比例した前記PID制御量を計算する積分部と、
    前記差分の微分値に比例した前記PID制御量を計算する微分部と、
    前記比例部の出力と前記積分部の出力と前記微分部との出力を加算する加算部と
    を具備することを特徴とする分散処理装置。
  4. 分散処理装置が行う分散処理方法であって、
    他の分散処理装置又はクライアント端末からの処理要求を処理する処理ステップと、
    前記他の分散処理装置の故障情報と前記処理要求とを入力として、前記処理ステップが前記処理を実行するのに使用するリソースを、前記処理ステップの出力を計測した計測値の比例成分と積分成分と微分成分との3つの要素を含むPID制御量で配分するリソース配分ステップとを行うことを特徴とする分散処理方法。
  5. 請求項4に記載した分散処理方法であって、
    前記リソース配分ステップは、
    前記故障情報と前記処理要求とを入力として前記リソースを制御する目標操作量を設定する目標設定ステップと、
    前記計測値を計測する計測ステップと、
    前記目標操作量と前記計測値とを入力として、前記PID制御量を計算するPID制御ステップと
    を含むことを特徴とする分散処理方法。
  6. 請求項5に記載した分散処理方法であって、
    前記PID制御ステップは、
    前記目標操作量と前記計測値との差分に比例した前記PID制御量を計算する比例ステップと、
    前記差分の時間積分値に比例した前記PID制御量を計算する積分ステップと、
    前記差分の微分値に比例した前記PID制御量を計算する微分ステップと、
    前記比例ステップの出力と前記積分ステップの出力と前記微分ステップとの出力を加算する加算ステップと
    を含むことを特徴とする分散処理方法。
JP2015027396A 2015-02-16 2015-02-16 分散処理装置と分散処理方法 Pending JP2016151794A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015027396A JP2016151794A (ja) 2015-02-16 2015-02-16 分散処理装置と分散処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015027396A JP2016151794A (ja) 2015-02-16 2015-02-16 分散処理装置と分散処理方法

Publications (1)

Publication Number Publication Date
JP2016151794A true JP2016151794A (ja) 2016-08-22

Family

ID=56696536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015027396A Pending JP2016151794A (ja) 2015-02-16 2015-02-16 分散処理装置と分散処理方法

Country Status (1)

Country Link
JP (1) JP2016151794A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0934730A (ja) * 1995-07-18 1997-02-07 Fujitsu Ltd 分散処理方法およびそのための分散処理装置
JP2004078729A (ja) * 2002-08-21 2004-03-11 Toshiba Mach Co Ltd Pid内部演算値のモニタリング機能を有するシーケンス制御装置
JP2006155525A (ja) * 2004-12-01 2006-06-15 Internatl Business Mach Corp <Ibm> 制御装置、情報処理システム、制御方法、及びプログラム
WO2011105001A1 (ja) * 2010-02-23 2011-09-01 日本電気株式会社 スループット維持支援システム、装置、方法、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0934730A (ja) * 1995-07-18 1997-02-07 Fujitsu Ltd 分散処理方法およびそのための分散処理装置
JP2004078729A (ja) * 2002-08-21 2004-03-11 Toshiba Mach Co Ltd Pid内部演算値のモニタリング機能を有するシーケンス制御装置
JP2006155525A (ja) * 2004-12-01 2006-06-15 Internatl Business Mach Corp <Ibm> 制御装置、情報処理システム、制御方法、及びプログラム
WO2011105001A1 (ja) * 2010-02-23 2011-09-01 日本電気株式会社 スループット維持支援システム、装置、方法、及びプログラム

Similar Documents

Publication Publication Date Title
CN105940377B (zh) 用于基于云的虚拟化编排器的方法、系统和计算机可读介质
EP3072260B1 (en) Methods, systems, and computer readable media for a network function virtualization information concentrator
EP2608029A1 (en) Method and system for managing resources among different clients for an exclusive use
TWI517202B (zh) 處方及元件控制模組及其方法
CN108449286A (zh) 网络带宽资源分配方法及装置
JP6116072B2 (ja) ネットワークフローを処理リソースにアライメントするための技術
JP6558374B2 (ja) スケール数推定装置、スケール数管理システム、スケール数推定方法、スケール数管理方法、および、コンピュータ・プログラム
EP3291592B1 (en) Monitoring management method and apparatus
EP2996382B1 (en) Physical resource adjustment method, device and controller
US9843506B2 (en) Distributed control system and control method thereof
JP6176390B2 (ja) 情報処理装置、解析方法、及び、プログラム記録媒体
US20170123941A1 (en) Distributed processing system
CN114051716A (zh) 配置优先级的方法、云平台、系统、计算设备和介质
CN111555987B (zh) 限流配置方法、装置、设备及计算机存储介质
JP2016151794A (ja) 分散処理装置と分散処理方法
JP6186287B2 (ja) システムの管理サーバ及び制御方法
CN108880860B (zh) 一种策略管理方法及装置
CN113472591B (zh) 一种业务性能的确定方法及装置
US10079777B2 (en) Apparatus, systems, and methods of allocating heterogeneous resources
US20150120793A1 (en) Managing device of distributed file system, distributed computing system therewith, and operating method of distributed file system
WO2014102996A1 (ja) 情報処理システム
CN115242718A (zh) 集群限流方法、装置、设备及介质
CN110609744A (zh) 处理计算任务的方法、设备和计算机程序产品
KR101813165B1 (ko) 소프트웨어 정의 네트워크를 위한 적응적 제어 평면 관리 방법 및 장치
JP6554011B2 (ja) タイムアウト時間設定装置とタイムアウト時間設定方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180208

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180626