JP6547387B2 - 情報処理システム、測定方法及びそのためのプログラム - Google Patents

情報処理システム、測定方法及びそのためのプログラム Download PDF

Info

Publication number
JP6547387B2
JP6547387B2 JP2015086949A JP2015086949A JP6547387B2 JP 6547387 B2 JP6547387 B2 JP 6547387B2 JP 2015086949 A JP2015086949 A JP 2015086949A JP 2015086949 A JP2015086949 A JP 2015086949A JP 6547387 B2 JP6547387 B2 JP 6547387B2
Authority
JP
Japan
Prior art keywords
measurement frequency
monitoring
resource
processing
monitoring process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015086949A
Other languages
English (en)
Other versions
JP2016206899A (ja
Inventor
秀一 狩野
秀一 狩野
智義 菅原
智義 菅原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2015086949A priority Critical patent/JP6547387B2/ja
Publication of JP2016206899A publication Critical patent/JP2016206899A/ja
Application granted granted Critical
Publication of JP6547387B2 publication Critical patent/JP6547387B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、情報処理装置における処理の負荷や性能などを測定する技術に関する。
計算機(情報処理装置とも呼ばれる)及び計算機を中核として構成されるシステム上で実行される処理が、所望の性能を達成できるよう、処理資源の割り当てを制御する技術の開発が行われてきた。
そのような技術の一例として特許文献1がある。特許文献1は、プロセスの性能を処理時間として定義し、同処理時間内に完了しなかったプロセスを、その実行に必要な計算資源を有する計算機に移動させることで性能を担保する技術を開示する。
また、そのような技術の他の一例として特許文献2がある。特許文献2は、プロセスの性能を実行所要時間として定義し、同時間が要件に合致するように必要な計算資源を予約することにより性能を担保する技術を開示する。
特開2007−226587号公報 特開2010−277589号公報
しかしながら、上述した先行技術文献に記載された技術においては、その性能の測定処理の負荷により測定対象処理の性能が低下するという問題点がある。その理由を、以下に説明する。
上述した先行技術文献に記載された技術においては、以下の特徴が共通する。処理の性能(performance)及び計算機資源の消費の双方またはいずれかが測定される。次に、測定された結果に基づいて、性能達成に必要な資源が算出され、資源割り当て制御に反映される。
ここで上記測定は、典型的には測定のための処理(測定処理)により実行される。この測定処理は、計算機がハードウェアとして備える機能により実行される場合もあるが、多くの用途では、測定処理の全部または一部が、計算機上で動作するプログラムにより実現される。
一例として、アプリケーションの応答時間を性能指標として、それを測定するプログラムを考えることができる。応答時間として、アプリケーションがある入力に対して応答を送出するまでの時間を、そのアプリケーションの入出力を捕捉するプログラムにより測定することができる。
測定方法は、アプリケーションの構造や入出力のインタフェースにより異なる。例えば、ネットワークを介してメッセージ交換を行うアプリケーションは、第1に、ネットワークインタフェースを通過するメッセージやパケットを取得する。第2に、そのアプリケーションは、測定対象のメッセージを識別して、入力メッセージと応答メッセージが各々観測された時刻の差を取る。こうすることで、そのアプリケーションは、応答時間を算出することができる。
また、他の一例として、アプリケーションの処理レートを性能指標として、それを測定するプログラムを考えることができる。処理レートとして、アプリケーションが一定時間内に所定の処理を何回実行したかを、実行記録などを読み出して計数するプログラムにより測定することができる。
計数方法はアプリケーションの構造や処理の内容により異なる。例えば、ファイル中に記載された一連の数値の統計値を計算して別のファイルに書き込むアプリケーションは、書き込み先のファイルを所定の間隔を置いて読み出す。そして、そのアプリケーションは、増加した計算結果の数を調べることで処理レートを算出することができる。
更に、他の一例として、アプリケーションのCPU(Central Processing Unit)消費量を資源消費の指標として、それを測定するプログラムを考えることができる。CPU消費量として、一定時間の間にアプリケーションの処理に費やされたCPUサイクル数、または、アプリケーションの処理がCPUを占有していた時間を測定することができる。システムソフトウエアによりアプリケーションプログラムの実行が開始される時点と停止した時点との、CPUが備えるクロックサイクルカウンタの値、または時刻の差を取ることで、これらを算出することができる。
これらのような測定処理は、典型的には、測定対象の処理(測定対象処理)が実行されていない時間に実行されるか、測定対象処理を中断して実行される。或いは、複数のCPUを搭載する計算機では、その測定処理は、測定対象処理が実行されるのとは異なるプロセッサで実行されるのが典型的である。測定処理が継続的に行われると、測定対象処理や他の処理に割り当てられる資源が減少するため、通常は間欠的に測定が行われる。例えば、応答時間の測定では、一定時間経過する毎に1回、測定が行われる。
一方で、性能や負荷などを測定し、資源割り当て制御を実行して所望の性能を達成し続けるには、性能や負荷などの変化を迅速に検出し、その結果を資源割り当て制御に反映させる必要がある。例えば、性能や負荷などの測定が遅れると、制御に遅れが伝搬し、性能未達の可能性が高くなる。特に、性能や負荷などの変動が急激である場合には、その傾向は顕著になる。
その性能未達の可能性が高くなるという問題点に対しては、性能測定の頻度を高めることで対処できる。しかしながら、前述の通り、測定処理自体がプログラムの動作による、計算樹の資源を用いて実行される処理であることから、測定処理の実行間隔を短くすると、測定処理自体が負荷の発生源となり、所望の処理の性能の達成を阻害する可能性がある。
これは、所望の処理の性能の達成のために測定処理の精度を高める場合、その測定処理自身の資源の消費を無視することができないことを意味する。即ち、性能を達成すべき処理自体への資源の割り当てに加え、測定処理への資源の割り当てを適切に行う必要があるという課題がある。
ここで、測定対象処理が複数存在する場合がある。例えば、複数のプログラムが計算機内の複数のCPUで実行される場合に、それらのプログラムについて測定すべき性能指標が異なっている場合がある。この場合、複数の測定処理が並行して実行される。そして、測定精度の向上のためにそれらの測定間隔が一様に短くされると、前述の問題点はより顕著になる。
上述の課題についての具体的な状況の一例を、図26、図27及び図28を用いて更に説明する。図26は、関連技術における計算機の構成を示すブロック図である。図27は、図26に示す計算機上での、処理の経過に伴う性能の変化を示すグラフである。図27に示すグラフにおいて、横軸は時刻(ミリ秒)を示し、縦軸は処理毎の性能を示す。図28は、図26に示す計算機上での、処理の経過に伴う資源消費の変化を示すグラフである。図28に示すグラフにおいて、横軸は図27と同じ時刻を示し、縦軸はCPU使用率とその処理毎の内訳を示している。
本例では、性能に影響ある資源としてCPU1個を備える計算機上で、2つのプログラムSIP(Session Initiation Protocol) ProxyとSIP IM(Instant Message)が動作している場合を考える。また、各々の性能を測定する測定処理としてProxy応答監視処理とIMスループット監視処理とが動作しているものとする。
SIP Proxyの性能指標は、入力に対する応答時間(ミリ秒)である。SIP IMの性能指標は、メッセージ処理レート(メッセージ/秒)である。Proxy応答監視処理及びIMスループット監視処理のそれぞれの性能は、前述の各性能指標の測定頻度(測定/秒)である。また、各処理の資源消費は、CPU使用比率で表される。
図27及び図28に示すように、時刻400から900の間では、SIP ProxyはCPU使用率とSIP Proxy応答時間とが共に上昇している。一方、SIP IMについては、メッセージ処理レートの性能はやや変化しているが、CPU使用率には大きな変化はない。
Proxy応答監視処理については、SIP Proxyの性能低下を反映して測定頻度を大きくしたことで、時刻700からCPU使用率が上昇している。IMスループット監視処理についてはSIP IMの性能を反映して、CPU使用率には変化はない。そして、時刻1300において、CPU使用率は、総計として100%に達している。
このような過負荷への対策は、(1)一部の処理を他の計算機に移す、(2)現時点の過負荷への対策を断念して次回の過負荷に備えて資源を予約する、或いは(3)一部の処理の性能を低下させることを許容して資源の割り当てを変更する、ことである。特許文献1では上記(1)の方式、特許文献2では上記(2)の方式が採用されている。
しかし、本例のように、1秒未満のような期間で急激に負荷が変動するため、処理を移動させる時間的余裕がない場合、その処理の性能を維持するには、上記(3)の方式を選択せざるを得ない。
先行技術文献のいずれにも、上記(3)の方式を実現するための手段は開示されておらず、またそのような関連技術は存在していない。
本発明の目的は、測定処理の負荷により測定対象処理の性能が低下するという問題点を解決する情報処理装置、測定方法及びそのためのプログラムを提供することである。
本発明の一様態における情報処理システムは、実行処理の性能及び資源消費の少なくともいずれかを測定する時間間隔を示す測定頻度に基づく契機において、前記性能及び前記資源消費の少なくともいずれかに関して、所定の例外が発生したことを検出する監視処理手段と、前記実行処理及び前記監視処理手段のそれぞれが利用する資源と前記実行処理及び前記監視処理手段の相互間の依存関係とを示す資源利用構造と、前記所定の例外とに基づいて、前記所定の例外が発生したことを検出した前記監視処理手段に対応する前記測定頻度より高い値を含む増加測定頻度と、前記所定の例外が発生したことを検出した前記監視処理手段以外の前記監視処理手段に対応する前記測定頻度より低い値を含む減少測定頻度と、を算出する判定手段と、前記増加測定頻度及び前記減少測定頻度のそれぞれに基づいて、前記所定の例外が発生したことを検出した前記監視処理手段、及び、前記所定の例外が発生したことを検出した前記監視処理手段以外の前記監視処理手段、のそれぞれに対応する前記測定頻度を更新する測定頻度変更手段と、を含む。
本発明の一様態における測定方法は、実行処理の性能及び資源消費の少なくともいずれかを測定する時間間隔を示す測定頻度に基づく契機において、前記性能及び前記資源消費の少なくともいずれかに関して、所定の例外が発生したことを検出し、前記実行処理及び前記所定の例外の発生を検出する処理のそれぞれが利用する資源と前記実行処理及び前記所定の例外の発生を検出する処理の相互間の依存関係とを示す資源利用構造と、前記所定の例外とに基づいて、前記所定の例外が発生したことを検出した処理に対応する前記測定頻度より高い値を含む増加測定頻度と、前記所定の例外が発生したことを検出した処理以外の前記所定の例外の発生を検出する処理に対応する前記測定頻度より低い値を含む減少測定頻度と、を算出し、前記増加測定頻度及び前記減少測定頻度のそれぞれに基づいて、前記所定の例外が発生したことを検出した処理、及び、前記所定の例外が発生したことを検出した処理以外の前記所定の例外の発生を検出する処理、のそれぞれに対応する前記測定頻度を更新する。
本発明の一様態におけるプログラムは、実行処理の性能及び資源消費の少なくともいずれかを測定する時間間隔を示す測定頻度に基づく契機において、前記性能及び前記資源消費の少なくともいずれかに関して、所定の例外が発生したことを検出する処理と、前記実行処理及び前記所定の例外の発生を検出する処理のそれぞれが利用する資源と前記実行処理及び前記所定の例外の発生を検出する処理の相互間の依存関係とを示す資源利用構造と、前記所定の例外とに基づいて、前記所定の例外が発生したことを検出した処理に対応する前記測定頻度より高い値を含む増加測定頻度と、前記所定の例外が発生したことを検出した処理以外の前記所定の例外の発生を検出する処理に対応する前記測定頻度より低い値を含む減少測定頻度と、を算出する処理と、前記増加測定頻度及び前記減少測定頻度のそれぞれに基づいて、前記所定の例外が発生したことを検出した処理、及び、前記所定の例外が発生したことを検出した処理以外の前記所定の例外の発生を検出する処理、のそれぞれに対応する前記測定頻度を更新する処理と、をコンピュータに実行させる。
本発明は、測定処理の負荷により測定対象処理の性能が低下することをより好適に防止することが可能になるという効果がある。
本発明の第1の実施形態に係る計算機の構成の一例を示すブロック図である。 第1の実施形態に係る計算機の具体的な構成の一例を示すブロック図である。 第1の実施形態における監視処理部の構成の一例を示すブロック図である。 第1の実施形態における例外条件の一例を示す図である。 第1の実施形態における例外情報の一例を示す図である。 第1の実施形態における判定部の構成の一例を示すブロック図である。 第1の実施形態における測定頻度制御情報の表現の一例とその具体例を示す図である。 第1の実施形態における資源利用構造の表現の一例とその具体例を示す図である。 第1の実施形態における制御部の構成の一例を示すブロック図である。 第1の実施形態における動作の概要を示すフローチャートである。 第1の実施形態における監視処理部の動作を示すフローチャートである。 第1の実施形態における判定部の動作を示すフローチャートである。 第1の実施形態における測定頻度制御情報の一例を示す図である。 第1の実施形態における制御部の動作を示すフローチャートである。 本発明の第2の実施形態における資源利用構造の一例を示す図である。 第2の実施形態における判定部の動作を示すフローチャートである。 第2の実施形態における制御部の構成一例を示すブロック図である。 本発明の第3の実施形態における測定頻度制御情報の表現の一例とその具体例を示す図である。 本発明の第4の実施形態に係る計算機の具体的な構成の一例を示すブロック図である。 第4の実施形態における測定頻度制御情報の一例を示す図である。 本発明の第5の実施形態における測定頻度制御情報の一例を示す図である。 第5の実施形態における例外情報の一例を示す図である。 本発明の第6の実施形態に係る情報処理装置の構成を示すブロック図である。 第6の実施形態に係る情報処理装置を実現するコンピュータのハードウェア構成を示すブロック図である。 第6の実施形態における変形例の構成を示すブロック図である。 関連技術の一例の構成を示すブロック図である。 関連技術の動作の一例を示すシーケンス図である。 関連技術の動作の一例を示すシーケンス図である。
次に、本発明を実施するための形態について図面を参照して詳細に説明する。尚、各図面及び明細書記載の各実施形態において、同様の構成要素には同一の符号を付与し、説明を適宜省略する。
[第1の実施形態]
[構成の説明]
図1は、本発明の第1の実施形態に係る計算機100(情報処理システムとも呼ばれる)の構成を示すブロック図である。
図1に示すように、本実施形態に係る計算機100は、資源110と、処理部120と、監視処理部130と、判定部140と、制御部150とを含む。尚、図1に示す例に係わらず、計算機100は、任意の数の処理部120及び任意の数の監視処理部130を含んでよい。
図2は、資源110に含まれる資源、処理部120及び監視処理部130の具体例を示すブロック図である。
===資源110===
資源110は、処理部120や監視処理部130の動作に必要で、かつ処理部120の性能の維持や監視処理部130の実行に影響を及ぼす計算機100内の共有部分である。資源110は、例えば、CPUサイクルや、メモリの一部、ディスクの読み書き操作などの任意の資源を含んでよい。
図2に示すように、資源110は、CPU#1、CPU#2、ディスク#1、及びディスク#2を含む。図2に示す例に係わらず、計算機100は、任意の資源を計算機100として含んでよい。
===処理部120===
処理部120は、資源110上で動作するプログラムであって、典型的にはアプリケーションプログラムである。この資源110上で動作するプログラムは、「実行処理」とも呼ばれる。また、性能や資源消費を測定される対象の実行処理を測定対象処理と呼ぶ。 図2に示すように、計算機100は、処理部120としてSIP Proxy1201及びSIP IM1202を含む。図2に示す例に係わらず、計算機100は、任意の種類と数の、処理部120を含んでよい。SIP Proxy1201及びSIP IM1202は、「実行処理」であり「測定対象処理」である。
===監視処理部130===
監視処理部130は、資源110上で動作する、例えば所定の測定対象処理の性能や、資源110の消費状況などを測定するプログラムである。この資源110上で動作するプログラムは、「監視処理」とも呼ばれる。尚、実行処理と監視処理とを総称して、単に「処理」とも呼ぶ。
監視処理部130は、測定頻度に基づく契機において、測定対象処理の性能及び資源消費の少なくともいずれかに関して、所定の例外が発生したことを検出する。ここで、測定頻度は、その測定対象処理の性能及び資源消費の少なくともいずれかを測定する時間間隔を示す。
図2に示すように、計算機100は、監視処理部130として、Proxy応答監視処理1301及びIMスループット監視処理1302を含む。図2に示す例に係わらず、計算機100は、任意の種類と数の、監視処理部130を含んでよい。Proxy応答監視処理1301及びIMスループット監視処理1302は、「監視処理」である。
図3は、監視処理部130の構成の一例を示すブロック図である。図3に示すように、監視処理部130は、内部に情報抽出部132、例外条件134、例外検出部133、インターバルタイマ131を含む。例外条件134は、計算機100の図示しない記憶手段に保持されてよい。
情報抽出部132は、測定対象処理の性能と、その測定対象処理の資源110の消費とのいずれか、または両方を、測定する。具体的には、情報抽出部132は、その測定対象処理の入出力データや管理情報などの、計算機100内で取得可能な情報源から、その性能やその消費を、測定値として取得する。
一例として、監視処理は、アプリケーション(測定対象処理)の応答時間とCPU使用率を取得する。例えば、監視処理は、応答時間を、そのアプリケーションの入出力の捕捉によって取得する。また、監視処理は、CPU使用率を、システムソフトウエアの管理情報の読み出しによって取得する。
例外検出部133は、所定の条件が満たされた場合、例外が発生したと判断して判定部140にその例外に関する情報(以後、例外情報と呼ぶ)を送信する。
所定の条件は、典型的には測定値が所定の閾値を超過するか下回る場合が当てはまり、例外条件134に予め格納されている。ここで、測定値は、監視処理部130により測定された値である。
例外条件134は、典型的には測定値と比較可能な定数が閾値として設定される。またその他に、例外条件134は、測定値の変化量や累積値、直前の所定の数の測定値のうちで、所定の値を超過した測定値の個数などに対して設定された閾値であってもよい。
判定部140が受信する例外情報は、例えば、例外を検出した監視処理の名称、その例外の発生例外条件及び測定値を少なくとも含む。
例外条件134の一例を図4に、例外情報の一例を図5に示す。図4の例外条件134は、Proxy応答監視処理1301の例外条件として設定された2件の、応答時間とCPU使用率の組み合わせによる例外条件を示す。また、図5は、Proxy応答監視処理1301が送信する例外情報の一例を示す図である。図5に示すように、例外情報は、例外を検出した監視処理の監視処理名称、検出した例外の発生例外条件及び実際の測定値を含む。
インターバルタイマ131は、所定の間隔で監視処理部130の情報抽出部132を起動する。インターバルタイマ131は、監視処理部130のそれぞれが個別に含んでもよいし、任意の監視処理部130によって共通に利用されてもよい。
===判定部140===
判定部140は、監視処理部130が検出した例外を契機として、その例外に対応する監視処理の測定頻度を調整するための判定を行う。図6は、判定部140の構成の一例を示すブロック図である。図6に示すように、判定部140は、測定頻度見積部141と、資源利用構造144と、測定頻度制御情報142と、負荷均衡見積部143とを含む。
測定頻度見積部141は、例外を送信した監視処理の所要測定頻度より高い見積値(増加測定頻度とも呼ばれる)を算出する。
例えば、測定頻度見積部141は、測定対象処理の応答時間や、スループット、資源消費などの指標のいずれかが増大して例外条件134が示す閾値を超えたとき、その測定対象処理に対応する測定頻度を高める(増加させる)ための見積値を算出する。
計算機100は、この見積値に基づいて測定頻度を高めることで、増大する指標の変化動向を、より細粒度で検出でき、資源割り当て調整の機会をより早くできる。尚、測定対象処理に対する資源割り当ての方法は、本発明の特徴となる要素ではないため、ここでは説明しない。
測定頻度制御情報142は、各監視処理の個々の測定頻度と、その測定頻度を調整する場合の調整操作を含む。測定頻度制御情報142は、判定部140内の図示しない記憶手段(第1の記憶手段)に記憶されてよい。
測定頻度制御情報142の表現の一例を図7の(A)に示す。また、図7の(A)に示す表現で表された、測定頻度制御情報142の具体的な一例を図7の(B)に示す。図7に示すように、測定頻度制御情報142は、監視処理毎に、監視処理名、測定対象処理名、指標、測定頻度、頻度更新量を含む。
図7の(B)は、図2に示す計算機100に対応する、測定頻度制御情報142の一例を示す。この測定頻度制御情報142は、SIP Proxy1201とSIP IM1202を測定対象処理とし、Proxyの応答時間(平均応答時間)及びIMのメッセージスループット(メッセージ処理レート)を指標として監視する監視処理に関する。そして、この測定頻度制御情報142は、2つの監視処理(Proxy応答監視処理1301及びIMスループット監視処理1302)が、合わせて5つの指標の測定を行うことを示す。そして、この測定頻度制御情報142は、各測定頻度を毎秒の回数、測定更新量を、測定頻度の増減率で指定する場合の一例である。
例えば、図7の(B)の先頭行はProxy応答監視処理1301の、平均応答時間の測定項目であって、同項目の現在の測定頻度は毎秒10回、測定頻度を調整する場合は、増減いずれも50%ずつ変化させることを示す。
測定頻度は、平均応答時間に限るものでなく、例えば、CPU使用率や、メッセージのサンプルレート(何個のメッセージ毎に1個を測定対象とするか)などでもよい。また頻度更新量は、より複雑な、頻度更新量を算出するための関数であっても良い。
資源利用構造144は、監視処理と測定対象処理とのそれぞれが利用する資源110及び、監視処理及び測定対象処理の相互間の依存関係の情報を、少なくとも含む。資源利用構造144は、判定部140内の図示しない記憶手段(第2の記憶手段)に記憶されてよい。
資源利用構造144の表現の一例を図8の(A)に示す。また、図8の(A)に示す表現で表された、資源利用構造144の具体的な一例を図8の(B)に示す。
図8の(B)は、図2に示す計算機100に対応する、資源利用構造144の一例を示す。この資源利用構造144は、測定対象処理と監視処理とを合計した4個の処理に関する。例えば、この資源利用構造144は、SIP Proxy1201がCPU#1とディスク#1を使って実行されることを示す。また、この資源利用構造144は、Proxy応答監視処理1301がCPU#2とディスク#1を使って実行され、SIP Proxy1201の応答性能を監視するためにSIP Proxy1201に依存していることを示す。尚、図8の(B)において空欄は、その処理名の処理に依存先の処理が存在しないこと、或いは、その欄に対応する資源をその処理名の処理が使用しないことを示す。
ここでは簡易的に表現する表形式の資源利用構造144を説明したが、このような依存関係は抽象的には有向グラフとして表現、保持されてもよい。
負荷均衡見積部143は、特定の監視処理の測定頻度を高める上で、資源利用構造144が含む依存関係に基づいて、他の監視処理の測定頻度より低い見積値(減少測定頻度とも呼ばれる)を算出する。その他の監視処理は、前述の増大する指標の変化動向への影響がないか、或いはその影響が小さい、一つ以上の監視処理である。また、その見積値(減少測定頻度)は、その他の監視処理にとって許容可能な測定頻度の見積値である。
具体的には、負荷均衡見積部143は、このような負荷の均衡を図るために、資源利用構造144を参照して、その特定の監視処理と資源110を共有しており、かつその特定の監視処理との依存関係がない、他の監視処理を選択する。計算機100は、そのような他の監視処理への資源割り当てを減らすことで、計算機100内の全処理の資源110の消費を均衡させる。
===制御部150===
制御部150は、判定部140が算出する増加測定頻度及び減少測定頻度に基づいて、監視処理の測定頻度を調整する。図9は、制御部150の構成の一例を示すブロック図である。図9に示すように、制御部150は、測定頻度変更部151を含む。
測定頻度変更部151は、増大測定頻度に基づいて、所定の例外が発生したことを検出した監視処理の測定頻度を更新する。また、測定頻度変更部151は、減少測定頻度のそれぞれに基づいて、その所定の例外が発生したことを検出した監視処理以外の、他の監視処理の測定頻度を変更する。具体的には、測定頻度変更部151は、各監視処理のインターバルタイマ131を用いた待機時間の設定値を変更する。
[動作の説明]
次に本実施形態の動作について、図面を参照して詳細に説明する。
図10は、本実施形態における計算機100全体の動作を示すフローチャートである。
図10に示すように、最初に、計算機100は、インターバルタイマ131を起動する(ステップS010)。次に、計算機100は、監視処理130が例外を検出し(ステップS110)、判定部140が測定頻度の調整を決定し(ステップS120)、制御部150がその調整を反映する(ステップS130)、という動作を繰り返す。
尚、計算機100は、例えば、計算機100の電源が投入され、初期設定が完了したことを契機に、図10に示す動作を開始する。また、計算機100は、後述する図27に示す入力部704を介して操作者から指示を受けたことを契機に、図10に示すフローチャートの動作を開始してもよい。或いは、計算機100は、後述する図27に示す通信部706を介して、外部から要求を受信したことを契機に、図10に示すフローチャートの動作を開始してもよい。
次に、ステップS110、ステップS120及びステップS130のそれぞれの動作について、詳細に説明する。尚、本実施形態の動作には処理部120の動作は直接には含まれないため、処理部120の動作の説明を省略する。
図11は、ステップS110における、一つの監視処理部130の動作を示すフローチャートである。
監視処理部130は、インターバルタイマ131の割り込みを契機として、図11に示す動作を開始する。
監視処理部130は、予め設定されている待機時間が経過したか否かを判定する(ステップS111)。例えば、監視処理部130は、動作を開始した回数を計数し、インターバルタイマ131の割り込みの間隔にその回数を乗じた時間を、その待機時間と比較することにより、その待機時間が経過したか否かを判定する。また、監視処理部130は、その経過時間が経過したときの時刻を前回動作時刻として記憶し、動作を開始したときの時刻と比較して、その待機時間が経過したか否かを判定してもよい。監視処理部130は、これらの例に係わらず、任意の手法でその経過時間が経過したか否かを判定してよい。
待機時間が経過した場合(ステップS111でYES)、監視処理部130の情報抽出部132が、測定対象処理の性能または資源消費の情報を、測定対象処理から測定値として取得する(ステップS112)。
待機時間が経過していない場合(ステップS111でNO)、監視処理部130は、動作を終了する。
次に、例外検出部133が、例外条件134に含まれる条件が、その測定値により満たされるか否かに基づいて、例外の発生を検出する(ステップS113)。
例外の発生が検出された場合(ステップS114でYES)、例外検出部133は、その例外に対応する例外情報を判定部140へ送信する(ステップS115)。そして、監視処理部130は、動作を終了する。
例外の発生が検出されなかった場合(ステップS114でNO)、監視処理部130は、動作を終了する。
尚、測定対象処理、即ち性能または資源消費の情報の抽出対象の処理、が複数ある場合には、各々の測定対象処理についての監視処理の間隔が異なっていてもよい。その場合、例えば、インターバルタイマ131をその間隔の公約数となる時間に設定し、待機が完了した時点で、前回の測定時刻からの経過時間を調べ、必要な監視処理を選択するようにする。
或いは、各測定対象処理に対応する監視処理のそれぞれが、インターバルタイマ131を持ち、それらのインターバルタイマ131のそれぞれにその監視処理の間隔の時間が設定されてもよい。この場合、測定頻度変更部151は、増大測定頻度及び減少測定頻度のそれぞれに基づいて、各監視処理のインターバルタイマ131のタイムアウト時間を再設定するようにしてよい。
次に、判定部140の動作を、図12を用いて説明する。
判定部140は、監視処理部130からの例外情報の受信を契機に、図12に示す動作を開始する。ここでは、監視処理部130のProxy応答監視処理1301(図12においては、監視処理M1と記載する)により例外情報が送信されたものとして、説明する。
判定部140は、例外を検出したProxy応答監視処理1301と指標とを、その例外情報に基づいて特定する。続けて、判定部140は、測定頻度制御情報142のProxy応答監視処理1301のその指標に対応する測定頻度と頻度更新量とに基づいて、新たな測定頻度(図12においては、所要測定頻度F1と記載する)を算出する。更に、判定部140は、その新たな測定頻度で測定頻度制御情報142のProxy応答監視処理1301のその指標に対応する測定頻度を更新する(ステップS122)。
例えば、測定頻度制御情報142が図7に示す測定頻度制御情報142であり、例外情報が図5に示す例外情報である場合、判定部140は、以下のように動作する。第1に、判定部140は、例外を検出した監視処理がProxy応答監視処理1301であることと、その指標が平均応答時間であることを特定する。第2に、判定部140は、測定頻度制御情報142に基づいて、現在の測定頻度「毎秒20回」を50%増加させた、本指標の新たな測定頻度「毎秒30回」を算出する。第3に、判定部140は、図13に示す測定頻度制御情報142のように、Proxy応答監視処理1301の指標「平均応答時間」に対する測定頻度を「毎秒30回」に更新する。
次に、負荷均衡見積部143は、以下のステップS123、ステップS124及びステップS125において、計算機100の負荷を均衡させるために、負荷を低減させる処理を選定する。即ち、Proxy応答監視処理1301の測定頻度を高めることにより計算機100の負荷が増加することが予想されるので、負荷均衡見積部143は、例えば、測定頻度を減少させる他の監視処理を選定する。
負荷均衡見積部143は、資源利用構造144を参照して、資源110の内の、Proxy応答監視処理1301が利用する資源(説明の便宜上、資源R1と呼ぶ)を特定する。次に、負荷均衡見積部143は、資源R1を利用する他の処理の集合S1を求める(ステップS123)。
ここで、資源R1に不足を来さないようにするためには、集合S1のいずれかの処理の資源消費を減らす必要がある。但し、その処理の資源消費を減らした結果、Proxy応答監視処理1301或いはProxy応答監視処理1301が監視対象とするSIP Proxy1201自身の性能が低下すると、Proxy応答監視処理1301による監視自体の意味が失われる。このため、Proxy応答監視処理1301、SIP Proxy1201及びSIP Proxy1201が性能面で依存する処理は、資源消費を減らす対象から除外する。
負荷均衡見積部143は、集合S1から「資源消費を減らす対象から除外する処理」を除いて、残った処理の集合を集合S2とする(ステップS124)。本実施形態では、負荷均衡見積部143は監視処理の資源消費を減らす、ものとする。そのため、負荷均衡見積部143は、集合S2からIMスループット監視処理1302(図12においては、監視処理M2と記載する)を選択する(ステップS125)。
次に、負荷均衡見積部143は、測定頻度制御情報142のIMスループット監視処理1302の測定間隔と変更量とに基づいて、IMスループット監視処理1302の新たな測定頻度(図12においては、測定頻度F2と記載する)を算出する。更に、負荷均衡見積部143は、そのIMスループット監視処理1302の新たな測定頻度で、測定頻度制御情報142を更新する(ステップS126)。
具体的には、負荷均衡見積部143は、ステップS123からS26において、以下のように動作する。
例外情報が図4に示す例外情報の場合、ステップS122において、Proxy応答監視処理1301の測定頻度が高められる。資源利用構造144が図8の(B)に示す資源利用構造144である場合、Proxy応答監視処理1301に割り当てられている資源110はCPU♯2、ディスク#2である。従って、ステップS123において、負荷均衡見積部143は、SIP IM1202、Proxy応答監視処理1301、IMスループット監視処理1302を集合S1に含める。
次に、ステップS124において、資源利用構造144の処理名と依存先処理名の列とに基づいて、負荷均衡見積部143は、SIP IM1202とIMスループット監視処理1302とを集合S2に含める。
次に、ステップS125において、負荷均衡見積部143は、集合S2から、監視処理であるSIP IM1202を選択する。
次に、ステップS126において、測定頻度制御情報142が図7の(B)に示す測定頻度制御情報142である場合、負荷均衡見積部143は、SIP IM1202の変更後の測定頻度を「毎秒5回」と算出する。そして、判定部140は、図13に示す測定頻度制御情報142のようにIMスループット監視処理1302の指標「メッセージ処理レート」に対する測定頻度を「毎秒5回」に更新する。
次に、負荷均衡見積部143は、更新した測定頻度のそれぞれを制御部150に送信する(ステップS127)。
これにより、IMスループット監視処理1302が消費する資源110が減少するため、Proxy応答監視処理1301の測定頻度を安定的に高めることができる資源配分がなされると期待できる。
以上、本実施形態における、測定頻度制御情報142による単一の監視処理の測定頻度の変更、及び、負荷均衡見積部143による単一の処理の資源割り当ての変更について説明した。しかし、前述の例に係わらず、本実施形態の計算機100は、候補となる処理が複数ある場合、その複数の処理(監視処理も含む)に対して、測定頻度制御情報142及び負荷均衡見積部143による制御を実行してよい。
図14は、制御部150の動作を示すフローチャートである。
制御部150は、判定部140から、測定頻度を受信したことを契機に、図14に示す動作を開始する。
制御部150は、受信した測定頻度のそれぞれに基づいて、監視処理部130の測定頻度を調整する(ステップS131)。
具体的には、制御部150は、各監視処理のインターバルタイマ131を用いた待機時間の設定値を変更することで、各監視処理の測定頻度を変更する。
以上で、本実施形態の一連の動作が完了する。
尚、以上説明した動作は必ずしも1回で終了する必要はない。例えば、測定頻度制御情報142に記載された測定頻度の変更量が大きいと、測定頻度の変動が大きくなり、計算機100の動作が不安定になる可能性がある。そこで、1回の変更量を小さくすることが考えられる。こうした場合、次回の監視処理の動作でも例外が発生する可能性が高くなる。そのため、小さい変更量の変更によって再度上記の動作を行い、変更動作を早期に開始しつつ、安定的に目標とする資源配分に近づけることができる。
このような方法は、装置の制御では一般的に行われているものであるが、本実施形態にもまた適用可能である。
ここで、監視処理部130に設定する例外条件134、判定部140に設定する測定頻度の変化量、及び資源利用構造144の作成は、各監視処理の性能設計者が行うことを想定しており、本実施形態では、その値の決定方法は特に説明しない。
以上により、本実施形態の計算機100は、図27に示すように、特定の処理の負荷が高まったために、その処理に対する監視処理の測定頻度を高める場合に、計算機100全体の資源110が不足しないように他の処理の資源割り当てを調整する。
[効果の説明]
上述した本実施形態における効果は、監視処理部130(測定処理)の負荷により測定対象処理の性能が低下することをより好適に防止することが可能になる点である。換言すると、その効果は、処理性能や資源消費の変動に際して監視処理の測定頻度を高めても、測定対象処理の性能を維持できることである。
その理由は、以下のような構成を含むからである。即ち、第1に、監視処理部130が測定頻度に基づいて、処理の性能及び資源消費の少なくともいずれかに関して、例外が発生したことを検出する。第2に、判定部140が、資源利用構造144に基づいて、例外が発生した処理に対応する監視処理の増大測定頻度と、その処理の性能の維持に影響のない他の監視処理の減少測定頻度を算出する。第3に、制御部150がその増大測定頻度とその減少測定頻度とを監視処理部130に設定する。
換言すると、計算機100が、資源利用構造144に基づいて例外が発生した処理の性能の維持に影響のない他の監視処理の測定頻度を小さくするからである。こうすることにより、その監視処理の資源使用量を減らして、測定頻度を高めた監視処理がその資源を利用できるようにすることで、測定対象の処理への影響を抑制できるためである。
[第2の実施形態]
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
第1の実施形態では、監視処理の測定頻度を調整することで、特定の処理の負荷の変動を吸収したが、本実施形態では、処理の資源割り当ても変更の対象とする。
第1の実施形態の判定部140の動作において、集合S1から集合S2を作成するときに図12のステップS125、集合S2が空であった場合(すなわち、測定頻度を下げられる監視処理がない場合)は、負荷の調整を別の手段で行う必要がある。
この場合、本実施形態では、監視処理以外の処理(即ち、実行処理)の資源割り当てを減らすことで、負荷の調整を図るものとする。
本実施形態は、第1の実施形態と比べて、判定部140及び制御部150の動作が第1の実施形態と異なる。
まず判定部140について、図15、図16を用いて説明する。
図15は、本実施形態における資源利用構造144の一例を示す図である。図15に示すように、本実施形態の資源利用構造144は、図8に示す資源利用構造144に比べて、各処理に割り当てられた資源110の割り当て量(割り当ての割合)、及び各資源110の割り当て量の増減方法を示す割り当て更新量を含む。尚、図15において、空欄は、その処理名の処理に依存先の処理が存在しないこと、或いは、その欄に対応する資源をその処理名の処理が使用しないことを示す。
判定部140の負荷均衡見積部143は、資源利用構造144に基づいて、実行処理のいずれかに対応する資源の割り当て量より少ない値を含む、その資源の割り当て量である、減少割り当て量を算出する。次に、負荷均衡見積部143は、算出した減少割り当て量を制御部150へ送信する。
図16は、本実施形態における、判定部140の動作を示すフローチャートである。
ステップS122からステップS124までは、図12に示すステップS122からステップS124と同様である。
次に、負荷均衡見積部143は、処理の集合S2に監視処理が含まれているか否かを確認する(ステップS125)。集合S2に監視処理が含まれている場合(ステップS125でYES)、負荷均衡見積部143は、図12に示すS26と同様の動作を実行する(ステップS126)。
監視処理が集合S2に一つも含まれない場合(ステップS125でNO)は、負荷均衡見積部143は、実行処理であるSIP IM1202(図16においては、処理P2と記載する)を選択する。続けて、負荷均衡見積部143は、資源R1に含まれる資源のうちSIP IM1202への割り当て量より少ない値を含む、その資源の割り当て量である、減少割り当て量を算出する(ステップS128)。
次に、負荷均衡見積部143は、ステップS122及びステップS126で更新した測定頻度、及びステップS128で算出した減少割り当て量を、制御部150へ送信する(ステップS129)。
次に本実施形態の制御部150について図17を用いて説明する。
図17は、本実施形態の制御部150の構成の一例を示すブロック図である。本実施形態の制御部150は、図9に示す第1の実施形態の制御部150に比べて、資源割り当て変更部152を更に含む。
資源割り当て変更部152は、判定部140が選択した一つ以上の実行処理の資源割り当てを変更する。具体的には、資源割り当て変更部152は、各処理部に割り当てられる資源量を、システムソフトウエアなどの資源割り当て管理情報を操作することで変更する。資源割り当て管理情報は、典型的には、アプリケーションプロセスの優先度、CPU利用時間の上限などの変更が該当する。
[効果の説明]
上述した本実施形態における効果は、第1の実施形態の効果に加えて、監視処理の測定頻度の調整によらない負荷の調整を実現することが可能になる点である。
その理由は、負荷均衡見積部143が資源利用構造144に基づいて、減少割り当て量を算出し、制御部150が、その減少割り当て量に基づいて実行処理の資源割り当てを変更するからである。
換言すると、資源利用構造144に基づいて、例外が発生した処理の性能の維持に影響が小さい実行処理を判定し、その実行処理への資源割り当てを減らし、監視処理への資源の割り当てを増加することで、測定対象の処理への影響を抑制できるためである。
[第3の実施形態]
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
本実施形態は、第1の実施形態と比べて、判定部140の動作が異なる。
具体的には、本実施形態では、負荷の調整のために測定頻度を低下させる監視処理の選択に明示的な優先度が導入される。本実施形態の判定部140を、図18を用いて説明する。
図18は、本実施形態における測定頻度制御情報142の一例を示す図である。図18の(A)は、本実施形態における測定頻度制御情報142の表現の一例を示す。図18の(B)は、本実施形態における測定頻度制御情報142の具体的な一例を示す。図18に示すように、測定頻度制御情報142は、指標毎の優先度の情報を含む。本実施形態では、優先度は全順序で予め与えられているものとする。
本実施形態の判定部140の負荷均衡見積部143は、集合S2から監視処理を選択するさいに、優先度がもっとも低い監視処理を選択する。
[効果の説明]
上述した本実施形態における効果は、測定頻度を小さくする監視処理を意図的に制御することが可能になる点である。
その理由は、測定頻度制御情報142が指標毎の優先度の情報を含み、負荷均衡見積部143がその優先度に基づいて集合S2から監視処理を選択するからである。
[第4の実施形態]
次に本発明の第4の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
本実施形態は、第1の実施形態に対して、計算機100内の資源110の利用動向により負荷均衡見積の振る舞いを変える動作を追加したものである。
図19は、本実施形態に係る計算機400の構成を示すブロック図である。本実施形態の計算機400は、図1に示す第1の実施形態の計算機100と比べて、監視処理部130として、資源消費量監視処理1303を更に含む点が異なる。
資源消費量監視処理1303は、特定の処理の性能及び資源110の消費ではなく、全処理による資源110の消費量を指標として監視する。資源消費量監視処理1303は、例外の発生の有無にかかわらず、測定結果を判定部140へ送信する。尚、判定部140は、その測定結果をシステム負荷情報として、図示しない記憶手段に保持してよい。
図20は、本実施形態における測定頻度制御情報142の具体例を示す図である。図20に示すように、本実施形態における測定頻度制御情報142は、CPU使用率の合計が80%以上の場合に測定頻度を減少させる更新を行うことを示す、条件を頻度更新量の定義に含む。
判定部140の負荷均衡見積部143は、その頻度更新量の定義に含まれる条件が満たされた場合に、減少測定頻度を算出する。
[効果の説明]
上述した本実施形態における効果は、第1の実施形態の効果に加えて、システム全体の負荷が低ければ、他の指標の測定頻度の減少を行うことなく、所望の指標の測定頻度を高めることが可能になる点である。
その理由は、測定頻度制御情報142が頻度更新量の定義に条件を含み、資源消費量監視処理1303が全処理による資源110の消費量の測定結果を示し、判定部140が測定頻度制御情報142とその測定結果とに基づいて、減少測定頻度を算出するからである。
[第5の実施形態]
次に、本発明の第5の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
本実施形態は、第1の実施形態において、監視処理自身についても測定対象処理とする実施形態である。
図21は、本実施形態における測定頻度制御情報142の具体例を示す図である。図21に示すように、本実施形態の測定頻度制御情報142は、Proxy応答監視処理1301の測定対象処理にProxy応答監視処理1301自身を含む。そして、図21に示す測定頻度制御情報142は、その指標としてProxy応答監視処理1301の平均TAT(Turn Around Time)及びCPU使用率を含む。
これらの指標で発生する例外の例外情報の一例を図22に示す。図22は、Proxy応答監視処理1301の平均TATの増大かつCPU使用率の減少により資源割り当ての不足によるProxy応答監視処理1301の停滞を示唆する、例外情報を示す。
このような例外が発生した場合、Proxy応答監視処理1301の測定頻度増による間接的な資源割り当ての増加、または、資源割り当ての直接的な増加を行うことでProxy応答監視処理1301の性能を維持する。
[効果の説明]
上述した本実施形態における効果は、第1の実施形態の効果に加えて、監視処理自身を測定対象処理として扱うことが可能になる点である。
その理由は、測定頻度制御情報142が監視処理の測定対象処理にその監視処理自身を含むようにしたからである。
<<<第6の実施形態>>>
次に、本発明の第6の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図23は、本発明の第6の実施形態に係る情報処理システム600の構成を示すブロック図である。
図23に示すように、本実施形態における情報処理システム600は、監視処理部130と判定部140と測定頻度変更部151とを含む。図23に示す例に係わらず、情報処理システム600は、任意の数の監視処理部130を含んでよい。
===監視処理部130===
監視処理部130は、測定頻度に基づく契機において、実行処理の性能及びその実行処理の資源消費の少なくともいずれかに関して、所定の例外が発生したことを検出する。その測定頻度は、その実行処理の性能及び資源消費の少なくともいずれかを測定するための、時間間隔を示す。
===判定部140===
判定部140は、例えば図8に示すような資源利用構造144と、その所定の例外とに基づいて、増加測定頻度と減少測定頻度と、を算出する。
その資源利用構造144は、その実行処理及び監視処理部130のそれぞれが利用する資源と、その実行処理及び監視処理部130の依存関係と、を示す。
増加測定頻度は、その所定の例外が発生したことを検出した監視処理部130に対応する測定頻度より高い値を含む、測定頻度である。減少測定頻度は、その所定の例外が発生したことを検出した監視処理部130以外の、監視処理部130に対応する測定頻度より低い値を含む測定頻度である。
===測定頻度変更部151===
測定頻度変更部151は、増加測定頻度に基づいて、その所定の例外が発生したことを検出した監視処理部130に対応する測定頻度を更新する。また、測定頻度変更部151は、減少測定頻度に基づいて、その所定の例外が発生したことを検出した監視処理部130以外の監視処理部130に対応する測定頻度を更新する。
次に、本実施形態をコンピュータで実現する場合のハードウェア単位の構成要素について、説明する。この場合、図23に示す構成要素は、コンピュータ装置の機能単位に分割された構成要素である。
図24は、本実施形態における情報処理システム600を実現するコンピュータ700のハードウェア構成を示す図である。
図24に示すように、コンピュータ700は、プロセッサ701、メモリ702、記憶装置703、入力部704、出力部705及び通信部706を含む。更に、コンピュータ700は、外部から供給される記録媒体(または記憶媒体)707を含む。例えば、記録媒体707は、情報を非一時的に記憶する不揮発性記録媒体(非一時的記録媒体)である。また、記録媒体707は、情報を信号として保持する、一時的記録媒体であってもよい。
プロセッサ701は、オペレーティングシステム(不図示)を動作させて、コンピュータ700の全体の動作を制御する。例えば、プロセッサ701は、記憶装置703に装着された記録媒体707から、そのプログラムやデータを読み込み、読み込んだそのプログラムやそのデータをメモリ702に書き込む。ここで、そのプログラムは、例えば、後述の図11、図12、図14及び図16などに示すフローチャートの動作をコンピュータ700に実行させるためのプログラムである。
そして、プロセッサ701は、その読み込んだプログラムに従って、またその読み込んだデータに基づいて、図23に示す監視処理部130、判定部140及び測定頻度変更部151して各種の機能を実現する。
尚、プロセッサ701は、通信網(不図示)に接続される外部コンピュータ(不図示)から、メモリ702にそのプログラムやそのデータをダウンロードしてもよい。
メモリ702は、そのプログラムやそのデータを記憶する。メモリ702は、例外条件134、測定頻度制御情報142及び資源利用構造144を記憶してよい。メモリ702は、監視処理部130、判定部140及び測定頻度変更部151の一部として含まれてよい。即ち、メモリ702は、測定頻度制御情報142を記憶する第1の記憶手段、及び資源利用構造144を記憶する第2の記憶手段であってよい。
記憶装置703は、例えば、媒体を含む、ハードディスクドライブ、光ディスクドライブ、フレキシブルディスクドライブ及び磁気光ディスクドライブや、フラッシュメモリなどの半導体記憶装置、などである。記憶装置703は、そのプログラムをコンピュータ読み取り可能に記憶する。記憶装置703は、例外条件134、測定頻度制御情報142及び資源利用構造144を記憶してよい。記憶装置703は、監視処理部130、判定部140及び測定頻度変更部151の一部として含まれてよい。即ち、記憶装置703は、測定頻度制御情報142を記憶する第1の記憶手段、及び資源利用構造144を記憶する第2の記憶手段であってよい。
入力部704は、オペレータによる操作の入力や外部からの情報の入力を受け付ける。入力操作に用いられるデバイスは、例えば、マウスや、キーボード、内蔵のキーボタン及びタッチパネルなどである。入力部704は、監視処理部130、判定部140及び測定頻度変更部151の一部として含まれてよい。
出力部705は、例えばディスプレイで実現される。出力部705は、例えばGUI(GRAPHICAL User Interface)によるオペレータへの入力要求や、オペレータに対する出力提示などのために用いられる。出力部705は、監視処理部130、判定部140及び測定頻度変更部151の一部として含まれてよい。
通信部706は、外部とのインタフェースを実現する。通信部706は、監視処理部130、判定部140及び制御部150の一部として含まれてよい。
以上説明したように、図23に示す情報処理システム600の機能単位の各構成要素は、図24に示すハードウェア構成のコンピュータ700によって実現される。但し、コンピュータ700が備える各部の実現手段は、上記に限定されない。すなわち、コンピュータ700は、物理的に結合した1つの装置により実現されてもよいし、物理的に分離した2つ以上の装置を有線または無線で接続し、これら複数の装置により実現されてもよい。
尚、上述のプログラムのコードを記録した記録媒体707が、コンピュータ700に供給される場合、プロセッサ701は、記録媒体707に格納されたそのプログラムのコードを読み出して実行してもよい。或いは、プロセッサ701は、記録媒体707に格納されたそのプログラムのコードを、メモリ702、記憶装置703またはその両方に格納してもよい。すなわち、本実施形態は、コンピュータ700(プロセッサ701)が実行するそのプログラム(ソフトウェア)を、一時的にまたは非一時的に、記憶する記録媒体707の実施形態を含む。尚、情報を非一時的に記憶する記録媒体は、不揮発性記録媒体とも呼ばれる。
以上が、本実施形態における情報処理システム600を実現するコンピュータ700の、ハードウェア単位の各構成要素についての説明である。
図1に示す計算機100及び図19に示す計算機400のそれぞれは、コンピュータ700であってよい。
また、図23に示す判定部140及び測定頻度変更部151は、ハードウェア単位の回路でも、マイクロチップに含まれるモジュールでも、コンピュータ装置の機能単位に分割された構成要素でもよい。尚、図23に示す情報処理システム600は、あるサーバに実装され、ネットワークを介して利用可能にされてよいし、図23に示す各構成要素がネットワーク上に分散して設置されて利用可能にされてもよい。
また、図1に示す計算機100に含まれる資源110及び図19に示す計算機400に含まれる資源110のそれぞれが、コンピュータ700であってもよい。この場合、判定部140及び測定頻度変更部151は、コンピュータ700である資源110上で動作するプログラムで実現されてよいし、コンピュータ700以外のハードウェアで実現されてもよい。
[効果の説明]
上述した本実施形態における効果は、第1の実施形態と同様に、監視処理の負荷により測定対象処理の性能が低下することをより好適に防止することが可能になる点である。
その理由は、以下のような構成を含むからである。即ち、第1に、監視処理部130が測定頻度に基づいて、実行処理の性能及び資源消費の少なくともいずれかに関して、例外が発生したことを検出する。第2に、判定部140が、資源利用構造144に基づいて、例外が発生した実行処理に対応する監視処理の増大測定頻度と、その実行処理の性能の維持に影響のない他の監視処理の減少測定頻度を算出する。第3に、測定頻度変更部151がその増大測定頻度とその減少測定頻度とを監視処理部130に設定する。
<<<第6の実施形態の変形例>>>
図25は、第6の実施形態の変形例である情報処理システム601を示す図である。図に示すように、情報処理システム601は、図23に示す情報処理システム600の判定部140及び制御部150と、資源110と記憶装置603と、を含む。資源110上では、処理部120(図25では不図示)及び監視処理部130(図25では不図示)が動作する。
判定部140、制御部150、資源110及び記憶装置603は、ネットワーク609を介して接続されている。尚、判定部140、制御部150、資源110及び記憶装置603の任意の組み合わせは、1台の図24に示すようなコンピュータ700であってよい。また、判定部140、制御部150、資源110及び記憶装置603の任意のいずれかどうしは、ネットワークを介することなく直接接続されてもよい。即ち、判定部140、制御部150、資源110及び記憶装置603は、任意に、ネットワーク609を介して接続されてよい。
===記憶装置603===
記憶装置603は、例外条件134、測定頻度制御情報142及び資源利用構造144を記憶する。
上述した本実施形態における変形例の効果は、情報処理システム601の構築を柔軟に実現することが可能になる点である。
その理由は、判定部140、測定頻度変更部151、資源110及び記憶装置603を、任意に、ネットワーク609を介して接続するからである。
以上、各実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
本発明は、動向を予測することが困難な入力や負荷を短時間で緻密に把握した上で、適切に制御することが必要とされる装置を汎用計算機とプログラムとを用いて実現する場合などに、好適である。その装置は、典型的には、通信網に設置されるメッセージ中継装置や制御信号の処理装置などである。本発明は、上述の装置に係わらず、利用可能な任意の装置やシステムなどに適用されてよい。
100 計算機
110 資源
120 処理部
1201 SIP Proxy
1202 SIP IM
130 監視処理部
1301 Proxy応答監視処理
1302 IMスループット監視処理
1303 資源消費量監視処理
131 インターバルタイマ
132 情報抽出部
133 例外検出部
134 例外条件
140 判定部
141 測定頻度見積部
142 測定頻度制御情報
143 負荷均衡見積部
144 資源利用構造
150 制御部
151 測定頻度変更部
152 資源割り当て変更部
400 計算機
600 情報処理システム
601 情報処理システム
603 記憶装置
609 ネットワーク
700 コンピュータ
701 プロセッサ
702 メモリ
703 記憶装置
704 入力部
705 出力部
706 通信部
707 記録媒体

Claims (9)

  1. 実行処理の性能及び資源消費の少なくとも一方をある測定頻度で測定し、前記性能及び前記資源消費の少なくとも一方に関して、所定の例外の発生の有無を検出する処理を監視処理として、前記実行処理ごとに実行する監視処理手段と、
    前記実行処理及び前記監視処理のそれぞれが利用する資源と前記実行処理及び前記監視処理の相互間の依存関係とを示す資源利用構造と、前記所定の例外の発生の有無とに基づいて、前記監視処理ごとの前記測定頻度を変更するための見積値を算出する判定手段と、
    前記見積値に基づいて前記監視処理ごとの前記測定頻度を更新する測定頻度変更手段と、
    を含み、
    前記判定手段は、
    前記所定の例外が発生したことを検出した前記監視処理について、対応する前記測定頻度より高い測定頻度の見積値である増加測定頻度を算出し、
    前記監視処理と資源を共有しており、かつ前記監視処理との依存関係がない、前記所定の例外を検出しない前記監視処理について、対応する前記測定頻度より低い測定頻度の見積値である減少測定頻度を算出する、情報処理システム。
  2. 前記監視処理手段は、前記監視処理を起動するインターバルタイマを含み、
    前記測定頻度変更手段は、前記増加測定頻度及び前記減少測定頻度のそれぞれに基づいて、前記インターバルタイマを利用して待機する時間の設定値を変更する
    請求項1記載の情報処理システム。
  3. 前記判定手段は、
    前記測定頻度の値及び前記測定頻度の値の更新量を示す測定頻度制御情報と、前記資源利用構造と、前記所定の例外の発生の有無と、に基づいて、前記増加測定頻度を算出する測定頻度見積手段と、
    前記測定頻度制御情報と、前記資源利用構造と、前記所定の例外の発生の有無と、に基づいて、前記減少測定頻度を算出する負荷均衡見積手段と、を含む請求項1または2記載の情報処理システム。
  4. すべての前記実行処理及び前記監視処理による資源消費を監視する資源消費監視処理手段を更に含み、
    前記測定頻度制御情報は、前記資源消費に関する条件を含み、
    前記判定手段は、前記資源消費に更に基づいて、前記減少測定頻度を算出する
    請求項に記載の情報処理システム。
  5. 前記測定頻度制御情報を記憶する第1の記憶手段を更に含む
    請求項3または4に記載の情報処理システム。
  6. 前記資源利用構造は、前記実行処理及び前記監視処理のそれぞれに対する前記資源の割り当て量と、前記割り当て量の更新量とを更に含み、
    前記負荷均衡見積手段は、更に、前記減少測定頻度を算出する対象の前記監視処理を検出できない場合に、前記監視処理に基づいて、前記実行処理のいずれかに対応する前記資源の割り当て量より少ない値を含む前記資源の割り当て量である減少割り当て量を算出し、
    前記減少割り当て量に基づいて、前記実行処理のへの前記資源の割り当てを変更する資源割り当て変更手段を更に含む
    請求項3乃至のいずれか1項に記載の情報処理システム。
  7. 前記資源利用構造を記憶する第2の記憶手段を更に含む
    請求項1乃至のいずれか1項に記載の情報処理システム。
  8. 実行処理の性能及び資源消費の少なくとも一方をある測定頻度で測定し、前記性能及び前記資源消費の少なくとも一方に関して、所定の例外の発生の有無を検出する処理を監視処理として、前記実行処理ごとに実行し、
    前記実行処理及び前記監視処理のそれぞれが利用する資源と前記実行処理及び前記監視処理の相互間の依存関係とを示す資源利用構造と、前記所定の例外の発生の有無とに基づいて、前記監視処理ごとの前記測定頻度を変更するための見積値を算出し、
    前記見積値に基づいて前記監視処理ごとの前記測定頻度を更新し、
    前記見積値の算出は、
    前記所定の例外が発生したことを検出した前記監視処理について、対応する前記測定頻度より高い測定頻度の見積値である増加測定頻度を算出し、
    前記監視処理と資源を共有しており、かつ前記監視処理との依存関係がない、前記所定の例外を検出しない前記監視処理について、対応する前記測定頻度より低い測定頻度の見積値である減少測定頻度を算出する、
    測定方法。
  9. 実行処理の性能及び資源消費の少なくとも一方をある測定頻度で測定し、前記性能及び前記資源消費の少なくとも一方に関して、所定の例外の発生の有無を検出する処理を監視処理として、前記実行処理ごとに実行する処理と、
    前記実行処理及び前記監視処理のそれぞれが利用する資源と前記実行処理及び前記監視処理の相互間の依存関係とを示す資源利用構造と、前記所定の例外の発生の有無とに基づいて、前記監視処理ごとの前記測定頻度を変更するための見積値を算出する処理と、
    前記見積値に基づいて前記監視処理ごとの前記測定頻度を更新する処理と、をコンピュータに実行させ、
    前記見積値を算出する処理は、
    前記所定の例外が発生したことを検出した前記監視処理について、対応する前記測定頻度より高い測定頻度の見積値である増加測定頻度を算出し、
    前記監視処理と資源を共有しており、かつ前記監視処理との依存関係がない、前記所定の例外を検出しない前記監視処理について、対応する前記測定頻度より低い測定頻度の見積値である減少測定頻度を算出する、
    プログラム。
JP2015086949A 2015-04-21 2015-04-21 情報処理システム、測定方法及びそのためのプログラム Active JP6547387B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015086949A JP6547387B2 (ja) 2015-04-21 2015-04-21 情報処理システム、測定方法及びそのためのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015086949A JP6547387B2 (ja) 2015-04-21 2015-04-21 情報処理システム、測定方法及びそのためのプログラム

Publications (2)

Publication Number Publication Date
JP2016206899A JP2016206899A (ja) 2016-12-08
JP6547387B2 true JP6547387B2 (ja) 2019-07-24

Family

ID=57487762

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015086949A Active JP6547387B2 (ja) 2015-04-21 2015-04-21 情報処理システム、測定方法及びそのためのプログラム

Country Status (1)

Country Link
JP (1) JP6547387B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4123914B2 (ja) * 2002-11-26 2008-07-23 株式会社日立製作所 プログラムの動作状態の監視方法及び監視プログラム
WO2014054274A1 (ja) * 2012-10-02 2014-04-10 パナソニック株式会社 監視装置及び監視方法

Also Published As

Publication number Publication date
JP2016206899A (ja) 2016-12-08

Similar Documents

Publication Publication Date Title
US10225333B2 (en) Management method and apparatus
JP6241300B2 (ja) ジョブスケジューリング装置、ジョブスケジューリング方法、およびジョブスケジューリングプログラム
US8645185B2 (en) Load balanced profiling
JP6447217B2 (ja) 実行情報通知プログラム、情報処理装置および情報処理システム
JP6191691B2 (ja) 異常検出装置、制御方法、及びプログラム
US20160378557A1 (en) Task allocation determination apparatus, control method, and program
JP4747307B2 (ja) ネットワーク処理制御装置,プログラムおよび方法
JP2011118525A (ja) サーバ管理装置とサーバ管理方法およびサーバ管理プログラム
JP5609730B2 (ja) 情報処理プログラム及び方法、転送処理装置
KR20170054485A (ko) 운영체제에서의 휴리스틱 프로세서 전력 관리
US9992301B2 (en) Prioritized throttling in a multiusage environment
JP2008108120A (ja) エージェントを使用して性能を監視する計算機システム及びその方法
JP2009237859A (ja) 仮想マシン管理システム
JP2017041191A (ja) リソース管理装置、リソース管理プログラム、及びリソース管理方法
JP2016224883A (ja) 異常検出方法、情報処理装置および異常検出プログラム
US20180217875A1 (en) Data processing system and data processing method
JP5935505B2 (ja) 情報処理装置、仮想マシン制御方法、仮想マシン制御プログラム
JP6547387B2 (ja) 情報処理システム、測定方法及びそのためのプログラム
JP2006344091A (ja) システム再構成自動化装置
WO2013129061A1 (ja) 同時接続数制御システム、同時接続数制御サーバ、同時接続数制御方法および同時接続数制御プログラム
JP2012113380A (ja) サービス提供装置、サービス提供方法、及び、プログラム
JP2011233057A (ja) マルチプロセッサシステム、マルチプロセッサの制御方法およびマルチプロセッサの制御方法のプログラム
US20140101672A1 (en) Load Balanced Profiling
JP6259547B2 (ja) 管理システム、及び、管理方法
JP2020201524A (ja) 決定方法、決定プログラム及び情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180315

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190402

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190516

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190610

R150 Certificate of patent or registration of utility model

Ref document number: 6547387

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150