JP2014178865A - Bottleneck analysis device, method, and program - Google Patents
Bottleneck analysis device, method, and program Download PDFInfo
- Publication number
- JP2014178865A JP2014178865A JP2013052200A JP2013052200A JP2014178865A JP 2014178865 A JP2014178865 A JP 2014178865A JP 2013052200 A JP2013052200 A JP 2013052200A JP 2013052200 A JP2013052200 A JP 2013052200A JP 2014178865 A JP2014178865 A JP 2014178865A
- Authority
- JP
- Japan
- Prior art keywords
- server
- score
- factor score
- bottleneck
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、分散処理システムにおけるボトルネック分析装置、ボトルネック分析方法、および、プログラムに関する。 The present invention relates to a bottleneck analysis device, a bottleneck analysis method, and a program in a distributed processing system.
従来、クライアントからのリクエストを複数のサーバ(ワーカ)に分散させて処理する分散処理システムがある。このような分散処理システムにおいて、処理のボトルネックとなる要因を発見し、その要因のシステムへの影響度を把握することはシステムを円滑に運用する上で非常に重要である。 Conventionally, there is a distributed processing system that processes a request from a client by distributing it to a plurality of servers (workers). In such a distributed processing system, it is very important to find a factor that becomes a bottleneck of processing and grasp the influence of the factor on the system in order to smoothly operate the system.
ここで、分散処理システムはそれぞれのサーバが連携して処理する。このため、分散処理システムにおけるボトルネックは、分散処理システムを構成するサーバそれぞれの処理能力の低下や故障等のみならず、サーバ間における処理の偏りによっても発生する。しかし、前記した従来技術(特許文献1、特許文献2参照)は、サーバそれぞれの処理能力の低下や故障等、各サーバを個別にみた際のボトルネックしか特定できず、ボトルネックの要因特定としては不十分であった。そこで、本発明は、分散処理システムにおけるサーバ間における処理の偏りを考慮し、ボトルネックの要因特定を十分に行うことを目的とする。
Here, the distributed processing system performs processing in cooperation with each server. For this reason, the bottleneck in the distributed processing system occurs not only due to a decrease in processing capacity or failure of each server constituting the distributed processing system, but also due to processing bias among servers. However, the above-described prior art (see
前記した課題を解決するため、本発明は、分散処理システムを構成するサーバのサーバリソース情報、前記サーバへのリクエスト数、および、前記サーバでリクエストを受け付けたクライアント数を、前記サーバごとに対応付けて示したサーバ情報を記憶するサーバ情報記憶部と、前記サーバリソース情報もしくは前記サーバリソース情報と前記サーバの故障情報を用いて、前記サーバごとに、当該サーバの前記分散処理システムにおける処理のボトルネックの各要因スコアを計算する要因スコア計算部と、前記サーバ情報に示される、前記サーバへのリクエスト数、および、前記サーバでリクエストを受け付けたクライアント数の少なくとも一方を用いて、前記サーバごとに、前記分散処理システムにおける当該サーバのリクエストの集中の度合いを示すサーバ影響度を計算する影響度計算部と、前記サーバごとに、前記各要因スコアの合計値を、前記サーバ影響度で重み付けをした値であるボトルネックスコアを計算するスコア統合部とを備え、前記要因スコア計算部は、前記サーバリソース情報を用いて、前記サーバごとに、当該サーバの前記分散処理システムにおける処理の偏りの度合いを示す偏りの要因スコアを計算する偏り要因スコア計算部と、前記故障情報を用いて、前記サーバごとに、前記サーバで発生している故障の度合いを示す故障の要因スコアの計算を行う故障要因スコア計算部、および、前記サーバリソース情報を用いて、前記サーバごとに、所定の閾値を用いた条件判定式により条件判定を行い、その判定結果により閾値の要因スコアの計算する閾値要因スコア計算部の少なくとも一方とを備えることを特徴とするボトルネック分析装置とした。 In order to solve the above-described problems, the present invention associates the server resource information of the servers that constitute the distributed processing system, the number of requests to the server, and the number of clients that have received the request with the server for each server. A server bottleneck of processing in the distributed processing system of the server for each server by using the server information storage unit that stores the server information shown in the above, and the server resource information or the server resource information and the server failure information. For each server, using at least one of the number of requests to the server indicated in the server information and the number of clients that received a request at the server, Concentration of requests of the server in the distributed processing system An impact calculation unit that calculates a server influence degree indicating a degree; and a score integration unit that calculates a bottleneck score that is a value obtained by weighting the total value of each factor score for each server with the server influence degree; The factor score calculation unit calculates a bias factor score indicating a degree of processing bias in the distributed processing system of the server for each server using the server resource information. And, using the failure information, for each server, a failure factor score calculation unit that calculates a failure factor score indicating the degree of failure occurring in the server, and using the server resource information, For each of the servers, a threshold is required for performing a condition determination using a condition determination formula using a predetermined threshold, and calculating a threshold factor score based on the determination result. And a bottleneck analysis apparatus, characterized in that it comprises at least one of the score calculation unit.
このようなボトルネック分析装置によれば、分散処理システムにおける各サーバ間の処理の偏りを考慮したボトルネック分析を行うことができる。さらに、ボトルネック分析装置は、当該サーバのボトルネックスコアを計算するにあたり、サーバごとに、前記分散処理システムにおける当該サーバのリクエストの集中の度合いを示す値であるサーバ影響度も用いる。これにより、ボトルネックスコアの値は、分散処理システムにおいて、当該サーバがボトルネックになった場合の影響度を反映した値とすることができる。これにより、ボトルネック分析装置のユーザは、このボトルネックスコアの値を確認することで、分散処理システムのどのサーバがボトルネックとなっているか、またそのサーバがボトルネックになることの影響度はどの程度かを把握しやすくなる。これにより、ボトルネック分析装置のユーザは、分散処理システムにおけるボトルネックの要因特定を十分に行うことができる。 According to such a bottleneck analysis apparatus, it is possible to perform a bottleneck analysis in consideration of processing bias among servers in a distributed processing system. Further, when calculating the bottleneck score of the server, the bottleneck analysis apparatus also uses a server influence degree that is a value indicating the degree of concentration of requests of the server in the distributed processing system for each server. Thus, the value of the bottleneck score can be a value reflecting the degree of influence when the server becomes a bottleneck in the distributed processing system. As a result, the user of the bottleneck analysis device confirms the value of this bottleneck score to determine which server of the distributed processing system is the bottleneck and the degree of influence of that server becoming the bottleneck. It becomes easy to grasp how much. Thereby, the user of the bottleneck analysis apparatus can sufficiently specify the cause of the bottleneck in the distributed processing system.
本発明によれば、分散処理システムにおけるボトルネックの要因特定を十分に行うことができる。 According to the present invention, it is possible to sufficiently identify the cause of the bottleneck in the distributed processing system.
以下、図面を参照しながら、本発明の実施の形態を説明する。まず、本実施の形態のボトルネック分析装置10の分析対象である分散処理システムについて説明する。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. First, a distributed processing system that is an analysis target of the
図1に示すように、分散処理システムは、複数のサーバ20から構成され、例えば、マスタのサーバ20と、ワーカのサーバ20とを備える。マスタのサーバ20は、リクエストの送信元のクライアント30に対し、どのサーバ20(どのワーカのサーバ20)にアクセスすればよいかをネットワークを介して指示する。そして、この指示を受信したクライアント30は、この指示されたサーバ20(ワーカ)にアクセスする。その後、ワーカのサーバ20は、クライアント30からのリクエストに基づき所定の処理を実行し、その実行結果をリクエストの送信元のクライアント30へ返す。ここで、ボトルネック分析装置10は、分散処理システムのボトルネックの分析に必要な情報、例えば、各サーバ20の故障情報、サーバリソース情報、システムが提供する各種情報等(以上まとめて「サーバ情報」という)を、ネットワークを介して取得し、サーバ情報記憶部131に格納する。そして、ボトルネック分析装置10は、このサーバ情報を参照して、分散処理システムにおける各サーバ20の処理の偏りを考慮したボトルネックの分析を行う。
As illustrated in FIG. 1, the distributed processing system includes a plurality of
このボトルネック分析装置10の構成例を説明する。図2に示すように、ボトルネック分析装置10は、記憶部13、制御部12、および、入出力部(入力部および出力部)11を備える。
A configuration example of the
記憶部13は、サーバ情報記憶部131と、スコア記憶部132とを備える。サーバ情報記憶部131は、前記したとおり、サーバ情報を記憶する。このサーバ情報は、各サーバ20の故障情報、サーバリソース(リソース)情報、システムが提供する各種情報等を含み、このサーバ情報は、制御部12がボトルネックスコアや、サーバ影響度を計算する際に参照される。スコア記憶部132は、制御部12により計算されたサーバ20それぞれのボトルネックスコアや、当該サーバ20がボトルネックになったときの影響度等(詳細は後記)を記憶する。入出力部11は、外部装置からボトルネックスコアや、サーバ影響度を計算するときに用いる各種情報の入力を受け付けたり、制御部12による処理結果を外部装置へ出力したりする。
The
制御部12は、データ収集部120、データ統合部121、データ選択部122、要因スコア計算部123、影響度計算部127、スコア統合部128および表示処理部129を備え、これらにより、サーバ20それぞれのボトルネックスコアや、当該サーバ20がボトルネックになったときの影響度等を計算する。また、この計算結果を表示画面上に表示させる。
The control unit 12 includes a data collection unit 120, a data integration unit 121, a
次に、図3を用いて、図2のボトルネック分析装置10の処理手順を説明する。まず、ボトルネック分析装置10のデータ収集部120は、システム(分散処理システム)の各サーバ20の各種ログ、統計情報等を取得する。また、各サーバ20の故障情報、リソース情報も取得する。そして、データ収集部120は、取得した情報をサーバ情報記憶部131に格納する(S1:各種情報取得、格納)。
Next, the processing procedure of the
次に、データ選択部122は、入出力部11経由でボトルネックの分析対象とする時間帯の指示入力を受け付けると、サーバ情報記憶部131に格納されるサーバ情報のうち、分析対象の時間帯の情報を取得する(S2:分析対象の時間帯の情報取得)。
Next, when the
そして、要因スコア計算部123は、S2で取得した各情報に関して、所定の閾値や各サーバ20における偏りを考慮し、各サーバ20がボトルネック要因となる可能性を示すスコアを計算する(S3:ボトルネック要因となる可能性の計算)。そして、要因スコア計算部123は、計算結果を、スコア記憶部132に格納する。
Then, the factor score calculation unit 123 calculates a score indicating that each
また、影響度計算部127は、S2で取得した情報のうち、各種ログに含まれるリクエスト情報(各クライアント30からサーバ20へのリクエスト数等)を元に、各サーバ20におけるボトルネック要因の影響度(サーバ影響度)を表すスコアを計算する(S4:ボトルネック要因の影響度の計算)。つまり、当該サーバ20がボトルネックとなることで、リクエストの送信元のクライアント30にどの程度影響を及ぼすかを計算する。影響度計算部127は、計算したサーバ影響度を、スコア記憶部132に格納する。
In addition, the
その後、スコア統合部128は、S3,S4で計算された情報を統合し、サーバ20ごとに、当該サーバ20がボトルネック箇所である可能性を表すスコア(ボトルネックスコア)を計算する(S5:各スコアの統合)。そして、スコア統合部128は、計算したボトルネックスコアをスコア記憶部132に格納する。
Thereafter, the score integration unit 128 integrates the information calculated in S3 and S4, and calculates, for each
そして、表示処理部129は、データ選択部122等からの指示に基づき、S3〜S5で計算したスコア値を示す表示情報を作成する(S6:表示情報の作成)。例えば、表示処理部129は、S3〜S5で計算した値を示す表示情報(表示画面)をHTML(HyperText Markup Language)等により作成する。
And the
その後、表示処理部129は、S6で作成された表示情報を要求に応じて表示する(S7:出力)。
Thereafter, the
図2に戻って、ボトルネック分析装置10の各構成要素を詳細に説明する。
Returning to FIG. 2, each component of the
記憶部13のサーバ情報記憶部131は、分散処理システムを構成するサーバ20の故障情報、サーバ20のサーバリソース情報(リソース情報)、システムが提供するサーバ20に関する各種情報を、サーバ20ごとに対応付けて示したサーバ情報を記憶する。この故障情報は、例えば、/var/log/messagesやmcelog等の故障情報を示すログファイルや、smartctl等の故障を診断するコマンドにより得られた出力結果等である。リソース情報は、例えば、vmstat、netstat等のリソース情報を出力するコマンドにより得られた出力結果や、/proc/net/dev、/proc/meminfo等のOS標準で出力される統計情報である。システムが提供する各種情報は、各サーバ20におけるリクエスト数、リクエストを受け付けたクライアント数、各種レスポンス等の性能情報や、保持データ量、キャッシュヒット率等である。このシステムが提供する各種情報は、ボトルネック分析装置10が各サーバ20へシステムログや統計情報の取得コマンドを送信することにより取得される。
The server
なお、このサーバ情報は、各サーバ20に接続されるスイッチ(図示省略)の情報を含んでいてもよい。この場合、スイッチのリソース情報は、当該スイッチを経由するネットワークトラフィック、当該スイッチからのエラーパケット数等であり、故障情報はポートの状態(up/down)等の情報である。これらの情報は、SNMP(Simple Network Management Protocol)等により取得される。
The server information may include information on a switch (not shown) connected to each
このサーバ情報の例を、図4に示す。ここでは、サーバAのサーバ情報をテーブル形式にまとめたものを示している。例えば、情報ごとに、当該情報の種別、その情報の項目、その情報の示す値、その情報の作成時刻等が示される。ここでの「種別」とは情報の収集元を表す属性であり、例えば属性値には、サーバリソース、スイッチ、故障情報、システムログ、システム統計情報等がある。また「項目」とは、「種別」が示すデータの収集元に対し、収集されるデータの種類を一意に区別するための属性である。例えば、「種別」の属性値がサーバリソースの場合、当該属性値に対する「項目」の属性値としては、ロードアベレージ、iowait、ディスクのwriteスループット等であり、「種別」の属性値がシステムログの場合、当該属性値に対する「項目」の属性値は、クライアント数、write件数等である。 An example of this server information is shown in FIG. Here, the server information of the server A is shown in a table format. For example, for each information, the type of the information, the item of the information, the value indicated by the information, the creation time of the information, and the like are indicated. Here, the “type” is an attribute representing the information collection source. For example, the attribute value includes a server resource, a switch, failure information, a system log, system statistical information, and the like. The “item” is an attribute for uniquely identifying the type of data collected from the data collection source indicated by the “type”. For example, when the attribute value of “type” is a server resource, the attribute value of “item” for the attribute value is load average, iowait, disk write throughput, etc., and the attribute value of “type” is the system log In this case, the attribute value of “item” for the attribute value is the number of clients, the number of writes, and the like.
また、このサーバ情報記憶部131は、ラベル情報も格納する。このラベル情報は、サーバ情報に示される各情報の分析方法を示した情報であり、例えば、図5に示すように、サーバ情報に示される情報の種別、項目ごとに、その情報の分析方法をラベル値で示した情報である。このラベル情報は、その情報の分析方法が閾値を用いた条件判定である場合、その条件判定で用いる閾値も含む。また、図示を省略しているが、各分析方法で用いる式を含んでいてもよい。さらに、このサーバ情報記憶部131は、各サーバ20が格納されるラックの情報(格納ラック情報)も含んでいてもよい(図5のラック情報参照)。このラベル情報および格納ラック情報は、例えば、入出力部11経由で、ボトルネック分析装置10のユーザにより入力される。
The server
図2のスコア記憶部132は、制御部12により計算されたサーバ20それぞれの、偏りの要因スコア、閾値の要因スコア、故障の要因スコア、サーバ影響度、ボトルネックスコア等を記憶する。スコア記憶部132に記憶される情報の詳細は、図面を用いて後記する。
The
制御部12は、データ収集部120、データ統合部121、データ選択部122、要因スコア計算部123、影響度計算部127、スコア統合部128および表示処理部129を備える。
The control unit 12 includes a data collection unit 120, a data integration unit 121, a
データ収集部120は、サーバ20それぞれから、サーバ情報(故障情報、サーバリソース情報等)を取得し、サーバ情報記憶部131に格納する。
The data collection unit 120 acquires server information (failure information, server resource information, etc.) from each
データ統合部121は、サーバ情報記憶部131から、データ選択部122により指示された時間帯のサーバ情報を取得する。また、データ統合部121は、ラベル情報(図5参照)を参照して、取得したサーバ情報の各情報の分析方法(図5におけるラベルの項目の値)を取得する。そして、データ統合部121は、これら取得した情報を統合してスコア計算用情報を作成する。すなわち、データ統合部121は、サーバ情報記憶部131から取得したサーバ情報に対し、サーバ情報の各情報の項目について、ラベル情報(図5参照)を参照して、偏り/閾値/故障のデータの種別を示すいずれかのラベルを付与する(図6の「種別1」)。また、ラベルが「閾値」を含む場合は当該閾値の値を付与する(図6の「閾値」)。さらに、データ統合部121は、サーバ情報の収集元のサーバ20の識別情報(例えば、IPアドレス等)を付与する(図6の「サーバ」)。なお、データ統合部121は、ラベル情報がサーバ情報の各情報の分析方法(「偏り」や「閾値」)に用いる式の情報が含まれていれば、スコア計算用情報に、その式の情報も付与してもよい。さらに、前記したラック情報(図5参照)があれば、データ統合部121は、スコア計算用情報に、各サーバ20の格納ラックの情報を付与してもよい(図6の「所属ラック」)。このスコア計算用情報は、サーバ情報記憶部131の所定領域に格納され、要因スコア計算部123や影響度計算部127、スコア統合部128が、各スコアやサーバ影響度を計算するときに参照される。
The data integration unit 121 acquires server information in the time period designated by the
図2のデータ選択部122は、ボトルネック分析の対象とするサーバ情報の範囲の指示や、表示処理部129により表示させる表示情報の指示を受け付ける。例えば、データ選択部122は、入出力部11経由で、サーバ情報記憶部131に格納されるサーバ情報のうち、どの時間帯の情報を取得すべきかの指示入力を受け付けると、この指示入力をデータ統合部121へ出力し、データ統合部121は、サーバ情報記憶部131から、データ選択部122により指示された範囲のサーバ情報を取得する。
The
(要因スコア計算)
要因スコア計算部123は、サーバ情報記憶部131に格納されたスコア計算用情報(図6参照)を読み出し、サーバ20ごとにボトルネックの要因となりうる各要因のスコアを計算する。要因スコア計算部123は、偏りの要因スコアを計算する偏り要因スコア計算部124、閾値要因スコアを計算する閾値要因スコア計算部125、および、故障要因スコアを計算する故障要因スコア計算部126を備える。つまり、分散処理システムにおけるボトルネック要因としては、大きく、サーバ20間での処理の偏り、サーバ20の故障、サーバ20における処理量やリソース使用量が所定の閾値以上(あるいは閾値未満)となっていることのいずれかに分類されるので、要因スコア計算部123は、それぞれの要因についてスコアを計算する。
(Factor score calculation)
The factor score calculation unit 123 reads the score calculation information (see FIG. 6) stored in the server
(偏り要因スコア)
偏り要因スコア計算部124は、スコア計算用情報(図6参照)に示される情報のうち、分析方法が偏りである各項目の情報(つまり、スコア計算用情報における「種別1」の値が「偏り」である情報)について、所定の計算式により、各サーバ20の偏りの要因スコアを計算する。例えば、偏り要因スコア計算部124は、以下の式(1)により、分散処理システムのサーバM(サーバ20)の偏りの要因スコアを計算する。
(Bias factor score)
The bias factor score calculation unit 124 has information of each item whose analysis method is biased among the information shown in the score calculation information (see FIG. 6) (that is, the value of “
偏りの要因スコア=|サーバMにおける項目Nの全時間の平均値−全サーバにおける項目Nの全時間の平均値|÷各サーバにおける項目Nの平均値の最大値…式(1) Bias factor score = | Average value of item N for all time on server M−Average value of item N for all time on all servers | ÷ Maximum value of item N on each server (1)
以下に、式(1)を用いた偏りの要因スコアの計算例を説明する。ここでは、図7に例示するスコア計算用情報を用いて計算する場合を例に説明する。図7は、図6に例示したスコア計算用情報のうち、「種別1」が「偏り」であり、項目が「ロードアベレージ」である情報を抜き出したものである。ここで、式(1)におけるサーバMが「サーバB」、項目Nが「ロードアベレージ」であるとすると、サーバA(図7の範囲(1))のロードアベレージの値の平均は、(11+13+6+10+11)÷5=10.2である。同様にサーバB(図7の範囲(2))のロードアベレージの値の平均は5.2、サーバC(図7の範囲(3))のロードアベレージの値の平均は5.4である。また、全サーバ(図7の範囲(4))のロードアベレージの値の平均は(10.2+5.2+5.4)÷3=6.9である。よって、サーバBのロードアベレージの偏りの要因スコアは、以下に示すように0.12となる。
Hereinafter, an example of calculation of the bias factor score using Expression (1) will be described. Here, a case where calculation is performed using the score calculation information illustrated in FIG. 7 will be described as an example. FIG. 7 shows information extracted from the score calculation information illustrated in FIG. 6 with “
サーバBの偏りの要因スコア=|範囲(2)の値の平均−範囲(4)の値の平均|÷範囲(1)の値の平均の最大値
=|5.2−6.9|÷max(10.2,5.2,5.4)
=1.2÷10.2=0.12
Server B bias factor score = | average of values in range (2) −average of values in range (4) | ÷ maximum average of values in range (1) = | 5.2−6.9 | ÷ max (10.2, 5.2, 5.4)
= 1.2 ÷ 10.2 = 0.12
(閾値の要因スコア)
閾値要因スコア計算部125は、スコア計算用情報(図6参照)に示される情報のうち、閾値を用いて分析する(つまり、スコア計算用情報における「種別1」の値が「閾値」である)情報について、閾値の要因スコアを決定(計算)する。すなわち、閾値要因スコア計算部125は、スコア計算用情報(図6参照)に示される値のうち閾値を用いた条件判定を行うものについては、その閾値を用いた条件判定の結果により、閾値の要因スコア(0または1)を決定する。閾値要因スコア計算部125は、例えば、以下の式(2)により、分散処理システムのサーバM(サーバ20)の閾値の要因スコアを計算する。
(Threshold factor score)
The threshold factor score calculation unit 125 analyzes using the threshold among the information shown in the score calculation information (see FIG. 6) (that is, the value of “
if(サーバMにおける項目Nの値の平均値≧閾値)
then 閾値の要因スコア=1
else 閾値の要因スコア=0…式(2)
if (mean value of item N in server M ≧ threshold)
then threshold factor score = 1
else Threshold factor score = 0 (2)
つまり、サーバMの項目Nの値の平均値が、スコア計算用情報(図6参照)に示される閾値以上であった場合、この項目Nに関する閾値の要因スコアを1とし、閾値未満であった場合は0とする。なお、閾値を用いた条件判定の内容およびその判定結果により付与する閾値の要因スコアの値は、前記の内容や値に限定されない。 That is, when the average value of the item N of the server M is equal to or greater than the threshold value indicated in the score calculation information (see FIG. 6), the threshold factor score for this item N is set to 1 and is less than the threshold value. In this case, 0 is set. Note that the content of the condition determination using the threshold and the value of the threshold factor score given by the determination result are not limited to the above-described content and value.
(故障の要因スコア)
故障要因スコア計算部126は、スコア計算用情報(図6参照)に示される情報のうち、分析方法が故障を用いた分析である情報(つまり、スコア計算用情報における「種別1」の値が「故障」である)値について、故障の要因スコア(故障要因スコア)を決定(計算)する。この故障の要因スコアは、サーバ20で発生している故障の度合いを示す値であり、例えば、故障要因スコア計算部126は、以下の式(3)により、故障の要因スコアを計算する。
(Failure factor score)
The failure factor score calculation unit 126 includes information indicating that the analysis method is analysis using failure among the information shown in the score calculation information (see FIG. 6) (that is, the value of “
if(サーバMにおける項目Nの故障がいずれかの時間で発生)
then 故障の要因スコア=1
else 故障の要因スコア=0…式(3)
if (failure of item N on server M occurs at any time)
then Failure factor score = 1
else Failure factor score = 0 ... Formula (3)
つまり、サーバMの項目Nに関する故障がいずれかの時間で発生していた場合、この項目Nに関する故障の要因スコアを1とし、故障が発生していなかった場合は0とする。 That is, if a failure relating to item N of server M has occurred at any time, the failure factor score relating to this item N is set to 1, and 0 if no failure has occurred.
ただし、スイッチ間のネットワークのスループット等、ラック単位で値が決まるものに関しては、要因スコア計算部123は、式(1)〜式(3)におけるサーバ20をラック(図5の格納ラック情報参照)に置き換えて計算する。
However, for factors such as network throughput between switches whose values are determined in rack units, the factor score calculation unit 123 racks the
ここで計算された各サーバ20の各項目に関する、偏りの要因スコア、閾値の要因スコア、および、故障の要因スコアの値(図8参照)は、スコア記憶部132の所定領域に記憶される。
The bias factor score, threshold factor score, and failure factor score values (see FIG. 8) for each item of each
影響度計算部127は、スコア計算用情報(図6参照)に示される、各サーバ20へのリクエスト数、および、各サーバ20でリクエストを受け付けたクライアント数の少なくともいずれかを参照し、サーバ20ごとに、分散処理システムにおける当該サーバ20のリクエストの集中の度合いを示すサーバ影響度を計算する。例えば、影響度計算部127は、以下の式(4)に基づき、分散処理システムのサーバM(サーバ20)のサーバ影響度を計算する。ここでのリクエスト数は、例えば、システムログにおけるwrite件数(図6参照)や、read件数等、サーバ20に対するすべてのリクエストに関する処理件数を用いる。
The influence
サーバMのサーバ影響度=(サーバMへのリクエスト数÷分散処理システム全体へのリクエスト数)+(サーバMでリクエストを受け付けたクライアント数÷全クライアント数)…式(4) Server influence degree of server M = (number of requests to server M ÷ number of requests to the entire distributed processing system) + (number of clients that received requests on server M ÷ number of all clients) (4)
なお、サーバMが分散処理システムにおけるマスタである場合、マスタには常にリクエスト処理が集中するので、影響度計算部127は、このサーバ20のサーバ影響度を1とする。
When the server M is the master in the distributed processing system, the request processing always concentrates on the master, so the
影響度計算部127により計算された各サーバ20のサーバ影響度の値(図9参照)は、スコア記憶部132の所定領域に記憶される。
The server influence value (see FIG. 9) of each
スコア統合部128は、各サーバ20のサーバ影響度、および、各要因スコアの合計値を用いて、各サーバ20のボトルネックスコア(分散処理システムにおいて各サーバ20がどの程度ボトルネックとなっているかを示すスコア)を計算する。ここでのボトルネックスコアの計算は、スコア統合部128が、サーバ20ごとに、このサーバ20の各要因スコアの合計値に対し、このサーバ20のサーバ影響度で重み付けをすることで行う。スコア統合部128は、例えば、以下の式(5)に示すように、分散処理システムのサーバM(サーバ20)の各要因スコアの値の合計値に、サーバMのサーバ影響度を掛けた値を計算することにより、サーバMのボトルネックスコアを求める。
The score integration unit 128 uses the server influence degree of each
サーバMのボトルネックスコア=サーバMのサーバ影響度×(α×サーバMの偏り要因スコアの合計値+β×サーバMの故障要因スコアの合計値+γ×サーバMの閾値要因スコア)…式(5) Server M bottleneck score = server influence degree of server M × (α × total value of bias factor score of server M + β × total value of failure factor score of server M + γ × threshold factor score of server M) Expression ( 5)
なお、式(5)における、α、β、γは各要因スコアの総和におけるスケールを合わせるために用いる係数であり、例えば、αは(1÷各サーバ20の偏りの要因スコアの総和の最大値)、βは(1÷各サーバ20の閾値の要因スコアの総和の最大値)、γは(1÷各サーバ20の故障の要因スコアの総和の最大値)である。 In Equation (5), α, β, and γ are coefficients used to adjust the scale of the sum of each factor score. For example, α is (1 ÷ maximum sum of factor scores of bias of each server 20). ), Β is (1 ÷ maximum sum of threshold factor scores of each server 20), and γ is (1 ÷ maximum sum of failure factor scores of each server 20).
また、スコア統合部128は、式(5)における各要因スコアの合計値を計算するとき、複数のサーバ20に影響する可能性がある値(例えば、スイッチ間のネットワークのスループット等)に関しては、影響する可能性のあるサーバ20すべての各要因スコアの値を加えるものとする。
In addition, when the score integration unit 128 calculates the total value of each factor score in Expression (5), with respect to values that may affect the plurality of servers 20 (for example, network throughput between switches), The value of each factor score of all the
なお、スコア統合部128は、マスタのサーバ20(サーバL)のボトルネックスコアについては、以下の式(6)によって計算する。 The score integration unit 128 calculates the bottleneck score of the master server 20 (server L) by the following equation (6).
サーバLのボトルネックスコア=サーバLのサーバ影響度×(サーバLの閾値の要因スコアの総和+サーバLの故障の要因スコアの総和)…式(6) Server L bottleneck score = Server impact level of server L × (Total sum of server L threshold factor scores + Total sum of server L failure factor scores) (6)
このようにスコア統合部128は、ボトルネックスコアを計算する際、サーバ20の偏り要因スコアおよびサーバ影響度を用いるので、当該サーバ20が他のサーバ20に比べて処理負荷が大きい場合(処理の偏りが大きい場合)や、多数のリクエスト、または、多数のクライアントからのリクエストを受け付けるサーバ20である場合に、そのことをボトルネックスコアに反映させることができる。
As described above, the score integration unit 128 uses the bias factor score and the server influence degree of the
スコア統合部128は、計算した各サーバ20のボトルネックスコアと、要因スコア計算部123により計算された各サーバ20の各要因スコアとを合わせて、例えば、図10に示すような情報を作成し、スコア記憶部132に格納する。
The score integration unit 128 combines the calculated bottleneck score of each
図2の表示処理部129は、データ選択部122からの指示入力に基づき、スコア記憶部132に格納された各スコア(ボトルネックスコア、サーバ影響度、各要因スコア)を外部装置(表示装置等。図示省略)へ表示させる。例えば、ボトルネック分析装置10のユーザは、図10に例示した各サーバ20のボトルネックスコアを閲覧することで、分散処理システムのどのサーバ20がボトルネックになっている可能性が高いかを判断することができる。さらに、表示処理部129は、データ選択部122からの指示入力に基づき、所定のサーバ20(例えば、ボトルネックスコアが高いサーバ20等)について、そのサーバ20のボトルネックスコアの計算に用いた各要因スコアや、サーバ影響度も表示させるようにしてもよい。このようにすることで、ボトルネック分析装置10のユーザは、ボトルネックの特定を行いやすくなる。
2 displays each score (bottleneck score, server influence degree, each factor score) stored in the
例えば、表示処理部129が、図10に例示した各スコアやサーバ影響度を示す表示情報を作成することで、ボトルネック分析装置10のユーザは、サーバBが最もボトルネックスコアが高く、分散処理システムにおいてボトルネックになっている可能性が最も高いこと(サーバBのボトルネックスコア「1.33」)や、サーバBがボトルネックになることで大きな影響を及ぼす可能性が高いこと(サーバ影響度「1.10」)を推測できる。また、このサーバBのボトルネックの要因のうち、偏りの要因スコアは「0.54」であり、閾値の要因スコアは「0.67」あり、故障の要因スコア「0.00」であることから、サーバBにおけるボトルネックは、処理の偏りや、サーバBにおける処理能力の低下が原因である可能性が高いことがわかる。
For example, the
なお、ボトルネック分析装置10は、分散処理システムにおけるボトルネック要因を、(1)サーバ20間での処理の偏り、(2)サーバ20の故障、(3)サーバ20における処理量やリソース使用量が所定の閾値以上(あるいは閾値未満)となっていることの三種に分類し、それぞれの要因についてスコアを計算することとしたが、これ以外に分類し、スコアを計算するようにしてももちろんよい。また、ボトルネック分析装置10のスコア統合部128は、ボトルネックスコアの計算にあたり、偏りの要因スコアと、閾値の要因スコアと、故障の要因スコアとを用いることとしたが、偏りの要因スコアと、閾値の要因スコアおよび故障の要因スコアのいずれか一方とを用いるようにしてもよい。つまり、要因スコア計算部123は、偏り要因スコア計算部124と、閾値要因スコア計算部125および故障要因スコア計算部126の少なくともいずれか一方とを備えていればよい。
The
また、表示処理部129が作成する表示画面は、図11〜図16に示す画面であってもよい。以下に説明する表示画面例は、表示処理部129が、データ選択部122からの指示に基づき、スコア記憶部132に格納された各サーバ20のボトルネックスコア、サーバ影響度、各要因スコアの値、および、サーバ情報記憶部131に格納されたサーバ情報をもとに作成される。
In addition, the display screen created by the
例えば、図11に示す画面例は、どのサーバ20がボトルネックとなっているかを示した画面であり、サーバ20ごとにボトルネックスコア、サーバ影響度、要因スコア(閾値/故障/偏り)を示す。各サーバ20の並び順としては、ボトルネックスコアが高い順に並べることで、ユーザは、どのサーバ20にボトルネックが発生している可能性が高いかを把握しやすくなる。また、表示処理部129は、各サーバ20のサーバ影響度や各要因スコアを併せて画面上に表示することで、何がボトルネック要因となっているかを把握しやすくなる。また、表示処理部129は、画面上にボトルネックスコアの最大/平均/最小を表示することで、ユーザは、個別のサーバ20にボトルネック要因があるのか、もしくは、分散処理システム全体にボトルネックとなっている要因があるのかを把握しやすくなる。
For example, the screen example shown in FIG. 11 is a screen showing which
また、サーバ20がマスタである場合、表示内容は図11とほぼ同様であるが、表示処理部129は、サーバ影響度や偏りの要因スコアを表示しないようにする(図12参照)。
When the
また、表示処理部129は、図13〜図16に例示するように、要因スコアごとにその要因スコアの詳細情報を表示するようにしてもよい。表示処理部129が、このような表示画面を表示することで、例えば、ユーザが図11や図12に示す表示画面上でボトルネックとなっているサーバ20の見当をつけた後、詳細を分析しやすくなる。
Further, as illustrated in FIGS. 13 to 16, the
図13は、サーバ20におけるサーバ情報について、要因スコアの種別ごとに、その要因スコアの計算の元となった各項目の値の一覧を示した表示画面例である。このような表示画面によれば、ユーザは、要因スコアの種別ごとに、その要因スコアの元となった値を確認することができる。なお、図13の閾値の要因スコアおよび故障の要因スコアにおける「発生台数」は、例えば、分散処理システム全体においてスコアが1となったサーバ20の台数である。また、偏りの要因スコアに関しては、システム全体の平均値を併せて表示する。このような表示画面によれば、ユーザは要因スコアごとに他のサーバ20の状況との比較をしやすくなる。
FIG. 13 is an example of a display screen showing a list of values of each item that is a source of calculation of the factor score for each type of factor score for the server information in the
図14は、ボトルネック箇所となっている可能性が高いサーバ20における各処理(処理1〜処理5)のレスポンス時間を示した表示画面例である。表示処理部129は、図14に例示するように、表示画面上に、クライアント30等における上位アプリ(AP)からのリクエスト間隔(APリクエスト間隔)の設定値および実測値に加え、分散処理システム全体における各処理(処理1〜処理5)のレスポンス時間の平均値を併せて表示することで、ユーザは、ボトルネックとなっている可能性が高いサーバ20においてボトルネックとなっている処理がどの処理であるかを把握しやすくなる。
FIG. 14 is an example of a display screen showing the response time of each process (
図15は、サーバ情報記憶部131に格納される各サーバ20のサーバ情報のうち、所定の項目に関する値(各要因スコアの元になった値)を、他のサーバ20における値や、分散処理システム全体の平均値とともに表示した表示画面例である。このような表示画面によれば、ユーザは、ある要因スコアの元となった値について、他のサーバ20の値と比較して高い値なのか否かや、分散処理システム全体の平均に比べて高い値なのか否かを把握しやすくなる。
FIG. 15 shows a value related to a predetermined item (a value based on each factor score) in the server information of each
図16は、所定のサーバ20へのリクエスト状況を示した表示画面例である。図16では、APがクライアント等の上位アプリを示し、Pa、Pbが分散処理システムのプロセスを表し、それぞれをつなぐ線の太さが各プロセスへのリクエスト量を表している。また、Pa、Pbを囲む線は、それぞれのプロセスがどのサーバ20で実行されるかを示している。例えば、Pa_3およびPb_3は、サーバAで実行されるプロセスである。このような表示画面によれば、ユーザは、例えば、サーバ影響度の高いサーバ20やボトルネックになっている可能性が高いサーバ20がどの上位アプリからどの程度の量のリクエスト量を受け付けているかを把握しやすくなる。
FIG. 16 is an example of a display screen showing a request status to a
また、前記した実施の形態において説明したボトルネック分析装置10が実行する処理をコンピュータが実行可能な言語で記述したプログラムで実現してもよい。この場合、コンピュータがプログラムを実行することにより、実施の形態と同様の効果を得ることができる。さらに、かかるプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませて実行することにより前記した実施の形態と同様の処理を実現してもよい。以下に、図1に示したボトルネック分析装置10と同様の機能を実現するプログラムを実行するコンピュータの一例を説明する。
Further, the processing executed by the
図17に例示するように、コンピュータ1000は、例えば、メモリ1010と、CPU1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、シリアルポートインタフェース1050と、ビデオアダプタ1060と、ネットワークインタフェース1070とを有し、これらの各部はバス1080によって接続される。
As illustrated in FIG. 17, the
メモリ1010は、図17に例示するように、ROM(Read Only Memory)1011及びRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、図17に例示するように、ハードディスクドライブ1031に接続される。ディスクドライブインタフェース1040は、図17に例示するように、ディスクドライブ1041に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブに挿入される。シリアルポートインタフェース1050は、図17に例示するように、例えばマウス1051、キーボード1052に接続される。ビデオアダプタ1060は、図17に例示するように、例えばディスプレイ1061に接続される。
The
ここで、図17に例示するように、ハードディスクドライブ1031は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、プログラムは、コンピュータ1000によって実行される指令が記述されたプログラムモジュールとして、例えばハードディスクドライブ1031に記憶される。
Here, as illustrated in FIG. 17, the hard disk drive 1031 stores, for example, an
また、上記実施形態で説明した各種データは、プログラムデータとして、例えばメモリ1010やハードディスクドライブ1031に記憶される。そして、CPU1020が、メモリ1010やハードディスクドライブ1031に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出し、アクセス監視手順、アクセス制御手順、プロセス監視手順、プロセス制御手順を実行する。
The various data described in the above embodiment is stored as program data, for example, in the
なお、プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1031に記憶される場合に限られず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ等を介してCPU1020によって読み出されてもよい。あるいは、監視プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ネットワーク(LAN、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
Note that the
10 ボトルネック分析装置
11 入出力部
12 制御部
13 記憶部
20 サーバ
30 クライアント
120 データ収集部
121 データ統合部
122 データ選択部
123 要因スコア計算部
124 偏り要因スコア計算部
125 閾値要因スコア計算部
126 故障要因スコア計算部
127 影響度計算部
128 スコア統合部
129 表示処理部
131 サーバ情報記憶部
132 スコア記憶部
DESCRIPTION OF
Claims (8)
前記サーバリソース情報もしくは前記サーバリソース情報と前記サーバの故障情報を用いて、前記サーバごとに、当該サーバの前記分散処理システムにおける処理のボトルネックの各要因スコアを計算する要因スコア計算部と、
前記サーバ情報に示される、前記サーバへのリクエスト数、および、前記サーバでリクエストを受け付けたクライアント数の少なくとも一方を用いて、前記サーバごとに、前記分散処理システムにおける当該サーバのリクエストの集中の度合いを示すサーバ影響度を計算する影響度計算部と、
前記サーバごとに、前記各要因スコアの合計値を、前記サーバ影響度で重み付けをした値であるボトルネックスコアを計算するスコア統合部とを備え、
前記要因スコア計算部は、
前記サーバリソース情報を用いて、前記サーバごとに、当該サーバの前記分散処理システムにおける処理の偏りの度合いを示す偏りの要因スコアを計算する偏り要因スコア計算部と、
前記故障情報を用いて、前記サーバごとに、前記サーバで発生している故障の度合いを示す故障の要因スコアの計算を行う故障要因スコア計算部、および、前記サーバリソース情報を用いて、前記サーバごとに、所定の閾値を用いた条件判定式により条件判定を行い、その判定結果により閾値の要因スコアの計算する閾値要因スコア計算部の少なくとも一方と、
を備えることを特徴とするボトルネック分析装置。 Server information storage unit for storing server information indicating the server resource information of servers constituting the distributed processing system, the number of requests to the server, and the number of clients that have received requests at the server in association with each server When,
Using the server resource information or the server resource information and the failure information of the server, for each server, a factor score calculation unit that calculates each factor score of a bottleneck of processing in the distributed processing system of the server,
The degree of concentration of requests of the server in the distributed processing system for each server, using at least one of the number of requests to the server and the number of clients that received the request at the server indicated in the server information An impact calculation unit for calculating the server impact indicating
A score integration unit that calculates a bottleneck score that is a value obtained by weighting the total value of each factor score for each server with the server influence degree;
The factor score calculator
Using the server resource information, for each of the servers, a bias factor score calculation unit that calculates a bias factor score indicating a degree of processing bias in the distributed processing system of the server,
Using the failure information, for each server, a failure factor score calculation unit that calculates a failure factor score indicating a degree of failure occurring in the server, and using the server resource information, the server For each condition determination by a condition determination formula using a predetermined threshold, and at least one of the threshold factor score calculation unit for calculating the factor score of the threshold according to the determination result,
A bottleneck analysis apparatus comprising:
前記サーバごとに、
{(前記サーバへのリクエスト数÷前記分散処理システム全体へのリクエスト数)+(前記サーバでリクエストを受け付けたクライアント数÷全クライアント数)}
を示した値であること
を特徴とする請求項1に記載のボトルネック分析装置。 The server impact is
For each server,
{(Number of requests to the server / number of requests to the entire distributed processing system) + (number of clients that received requests on the server / number of all clients)}
The bottleneck analysis apparatus according to claim 1, wherein the bottleneck analysis apparatus is a value indicating
前記サーバごとに、
{前記サーバのサーバ影響度×(前記各要因スコアの合計値)}
を示した値であること
を特徴とする請求項1または請求項2に記載のボトルネック分析装置。 The bottleneck score is
For each server,
{Server influence level of the server x (total value of the factor scores)}
The bottleneck analysis apparatus according to claim 1, wherein the bottleneck analysis apparatus is a value indicating
前記サーバリソース情報の種別ごとに、前記種別のサーバリソース情報の分析方法として、前記処理の偏りを用いるか、閾値を用いた条件判定を用いるか、または、その両方を用いるのかを示す識別情報を示したラベル情報をさらに格納し、
前記偏り要因スコア計算部は、
前記サーバリソース情報のうち、前記ラベル情報において、前記分析方法として、少なくとも前記処理の偏りを用いると指定されているサーバリソース情報については、前記偏りの要因スコアを計算し、
前記閾値要因スコア計算部は、
前記サーバリソース情報のうち、前記ラベル情報において、前記分析方法として、少なくとも前記閾値を用いた条件判定を用いると指定されているサーバリソース情報については、前記閾値の要因スコアを計算すること
を特徴とする請求項1ないし請求項3のいずれか1項に記載のボトルネック分析装置。 The server information storage unit
For each type of the server resource information, identification information indicating whether to use the processing bias, condition determination using a threshold, or both as an analysis method of the server resource information of the type Further store the label information shown,
The bias factor score calculation unit
Among the server resource information, in the label information, for the server resource information specified as using at least the processing bias as the analysis method, the factor score of the bias is calculated.
The threshold factor score calculation unit
Among the server resource information, in the label information, for the server resource information specified to use at least a condition determination using the threshold as the analysis method, a factor score of the threshold is calculated. The bottleneck analyzer according to any one of claims 1 to 3.
前記サーバそれぞれの前記偏りの要因スコア、前記閾値の要因スコア、前記故障の要因スコア、前記サーバ影響度、および、前記ボトルネックスコアを記憶するスコア記憶部と、
入力部からの指示入力に基づき、前記サーバそれぞれの、前記偏りの要因スコア、前記閾値の要因スコア、前記故障の要因スコア、前記サーバ影響度、および、前記ボトルネックスコアのうち少なくともいずれかを表示する表示処理部と
をさらに備えることを特徴とする請求項4に記載のボトルネック分析装置。 The bottleneck analyzer further includes:
A score storage unit for storing the bias factor score of each of the servers, the threshold factor score, the failure factor score, the server influence level, and the bottleneck score;
Based on the instruction input from the input unit, at least one of the bias factor score, the threshold factor score, the failure factor score, the server influence level, and the bottleneck score of each of the servers is displayed. The bottleneck analysis device according to claim 4, further comprising: a display processing unit that performs:
前記入力部からの指示入力に基づき、前記偏りの要因スコア、前記閾値の要因スコア、前記故障の要因スコア、前記サーバ影響度、および、前記ボトルネックスコアの計算の元となったサーバ情報を表示すること
を特徴とする請求項5に記載のボトルネック分析装置。 The display processing unit further includes:
Based on the instruction input from the input unit, the server information from which the bias factor score, the threshold factor score, the failure factor score, the server influence level, and the bottleneck score are calculated is displayed. The bottleneck analyzer according to claim 5, wherein:
分散処理システムを構成するサーバのサーバリソース情報もしくは前記サーバリソース情報と前記サーバの故障情報を用いて、前記サーバごとに、当該サーバの前記分散処理システムにおける処理のボトルネックの各要因スコアを計算する要因スコア計算ステップと、
前記サーバへのリクエスト数、および、前記サーバでリクエストを受け付けたクライアント数の少なくとも一方を用いて、前記サーバごとに、前記分散処理システムにおける当該サーバのリクエストの集中の度合いを示すサーバ影響度を計算する影響度計算ステップと、
前記サーバごとに、前記各要因スコアの合計値を、前記サーバ影響度で重み付けをした値であるボトルネックスコアを計算するスコア統合ステップとを実行し、
前記要因スコア計算ステップは、
前記サーバリソース情報を用いて、前記サーバごとに、当該サーバの前記分散処理システムにおける処理の偏りの度合いを示す偏りの要因スコアを計算する偏り要因スコア計算ステップと、
前記故障情報を用いて、前記サーバごとに、前記サーバで発生している故障の度合いを示す故障の要因スコアの計算を行う故障要因スコア計算ステップ、および、前記サーバリソース情報を用いて、前記サーバごとに、所定の閾値を用いた条件判定式により条件判定を行い、その判定結果により閾値の要因スコアの計算する閾値要因スコア計算ステップの少なくとも一方とを含むこと
を特徴とするボトルネック分析方法。 Bottleneck analyzer
Using the server resource information of the server constituting the distributed processing system or the server resource information and the failure information of the server, each factor score of processing bottleneck in the distributed processing system of the server is calculated for each server Factor score calculation step;
Using at least one of the number of requests to the server and the number of clients that received the request at the server, a server influence degree indicating the degree of concentration of requests of the server in the distributed processing system is calculated for each server. An impact calculation step to perform,
A score integration step of calculating a bottleneck score that is a value obtained by weighting the total value of each factor score with the server influence degree for each server,
The factor score calculating step includes:
Using the server resource information, for each server, a bias factor score calculating step for calculating a bias factor score indicating a degree of processing bias in the distributed processing system of the server;
A failure factor score calculation step of calculating a failure factor score indicating the degree of failure occurring in the server for each server using the failure information, and the server resource information A bottleneck analysis method characterized by including at least one of a threshold factor score calculation step of performing a condition determination by a condition determination formula using a predetermined threshold and calculating a threshold factor score based on the determination result.
分散処理システムを構成するサーバのサーバリソース情報もしくは前記サーバリソース情報と前記サーバの故障情報を用いて、前記サーバごとに、当該サーバの前記分散処理システムにおける処理のボトルネックの各要因スコアを計算する要因スコア計算ステップと、
前記サーバへのリクエスト数、および、前記サーバでリクエストを受け付けたクライアント数の少なくとも一方を用いて、前記サーバごとに、前記分散処理システムにおける当該サーバのリクエストの集中の度合いを示すサーバ影響度を計算する影響度計算ステップと、
前記サーバごとに、前記各要因スコアの合計値を、前記サーバ影響度で重み付けをした値であるボトルネックスコアを計算するスコア統合ステップとを実行させ、
前記要因スコア計算ステップは、
前記サーバリソース情報を用いて、前記サーバごとに、当該サーバの前記分散処理システムにおける処理の偏りの度合いを示す偏りの要因スコアを計算する偏り要因スコア計算ステップと、
前記故障情報を用いて、前記サーバごとに、前記サーバで発生している故障の度合いを示す故障の要因スコアの計算を行う故障要因スコア計算ステップ、および、前記サーバリソース情報を用いて、前記サーバごとに、所定の閾値を用いた条件判定式により条件判定を行い、その判定結果により閾値の要因スコアの計算する閾値要因スコア計算ステップの少なくとも一方とを含む
プログラム。 Bottleneck analyzer
Using the server resource information of the server constituting the distributed processing system or the server resource information and the failure information of the server, each factor score of processing bottleneck in the distributed processing system of the server is calculated for each server Factor score calculation step;
Using at least one of the number of requests to the server and the number of clients that received the request at the server, a server influence degree indicating the degree of concentration of requests of the server in the distributed processing system is calculated for each server. An impact calculation step to perform,
A score integration step of calculating a bottleneck score that is a value obtained by weighting the total value of each factor score for each server with the server influence degree,
The factor score calculating step includes:
Using the server resource information, for each server, a bias factor score calculating step for calculating a bias factor score indicating a degree of processing bias in the distributed processing system of the server;
A failure factor score calculation step of calculating a failure factor score indicating the degree of failure occurring in the server for each server using the failure information, and the server resource information A program including at least one threshold factor score calculation step of performing a condition determination using a condition determination formula using a predetermined threshold and calculating a threshold factor score based on the determination result.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013052200A JP2014178865A (en) | 2013-03-14 | 2013-03-14 | Bottleneck analysis device, method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013052200A JP2014178865A (en) | 2013-03-14 | 2013-03-14 | Bottleneck analysis device, method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014178865A true JP2014178865A (en) | 2014-09-25 |
Family
ID=51698753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013052200A Pending JP2014178865A (en) | 2013-03-14 | 2013-03-14 | Bottleneck analysis device, method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014178865A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017110996A1 (en) * | 2015-12-25 | 2017-06-29 | 日本電気株式会社 | Log analysis system, log analysis method, and recording medium storing program |
US20180351840A1 (en) * | 2017-05-30 | 2018-12-06 | Fujitsu Limited | Influence range identification method and influence range identification apparatus |
CN111143179A (en) * | 2019-12-24 | 2020-05-12 | 中信银行股份有限公司 | Method, device, storage medium and electronic equipment for positioning performance bottleneck |
-
2013
- 2013-03-14 JP JP2013052200A patent/JP2014178865A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017110996A1 (en) * | 2015-12-25 | 2017-06-29 | 日本電気株式会社 | Log analysis system, log analysis method, and recording medium storing program |
US20180351840A1 (en) * | 2017-05-30 | 2018-12-06 | Fujitsu Limited | Influence range identification method and influence range identification apparatus |
US10868744B2 (en) * | 2017-05-30 | 2020-12-15 | Fujitsu Limited | Influence range identification method and influence range identification apparatus |
CN111143179A (en) * | 2019-12-24 | 2020-05-12 | 中信银行股份有限公司 | Method, device, storage medium and electronic equipment for positioning performance bottleneck |
CN111143179B (en) * | 2019-12-24 | 2023-06-13 | 中信银行股份有限公司 | Method and device for positioning performance bottleneck, storage medium and electronic equipment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6373482B2 (en) | Interface for controlling and analyzing computer environments | |
JP5719974B2 (en) | Management system for managing a computer system having a plurality of devices to be monitored | |
US11144556B2 (en) | Dynamic streaming of query responses | |
US8024613B2 (en) | Method and system for managing apparatus performance | |
US10452463B2 (en) | Predictive analytics on database wait events | |
US8275581B2 (en) | Managing statistical profile data | |
US9929926B1 (en) | Capacity management system and method for a computing resource | |
CA2948700A1 (en) | Systems and methods for websphere mq performance metrics analysis | |
US20180095819A1 (en) | Incident analysis program, incident analysis method, information processing device, service identification program, service identification method, and service identification device | |
JP2014178865A (en) | Bottleneck analysis device, method, and program | |
CN109800124B (en) | CPU utilization monitoring method and device, electronic equipment and storage medium | |
WO2020202433A1 (en) | Information processing device and api usage history display program | |
US10644971B2 (en) | Graph search in structured query language style query | |
US10706108B2 (en) | Field name recommendation | |
CN111459815B (en) | Real-time computing engine testing method and system | |
JP2019121863A (en) | Impact range identifying program, impact range identifying method, and impact range identifying device | |
CN110928750B (en) | Data processing method, device and equipment | |
Semeraro et al. | It takes a village: Monitoring the blue waters supercomputer | |
US20220222164A1 (en) | Computer-readable recording medium storing information collection program, information collection method, and information processing apparatus | |
JP2007265244A (en) | Performance monitoring device for web system | |
JP5974905B2 (en) | Response time monitoring program, method, and response time monitoring apparatus | |
JPWO2013114911A1 (en) | Risk assessment system, risk assessment method, and program | |
CN114860563A (en) | Application program testing method and device, computer readable storage medium and equipment | |
JP5668836B2 (en) | Information processing apparatus, information acquisition method, and information acquisition program | |
US10726590B2 (en) | Correlate application performance with hardware performance via heatmap |