JP6709689B2 - 計算機システム及び計算機システムの制御方法 - Google Patents

計算機システム及び計算機システムの制御方法 Download PDF

Info

Publication number
JP6709689B2
JP6709689B2 JP2016119654A JP2016119654A JP6709689B2 JP 6709689 B2 JP6709689 B2 JP 6709689B2 JP 2016119654 A JP2016119654 A JP 2016119654A JP 2016119654 A JP2016119654 A JP 2016119654A JP 6709689 B2 JP6709689 B2 JP 6709689B2
Authority
JP
Japan
Prior art keywords
computer
point
evaluation value
value
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016119654A
Other languages
English (en)
Other versions
JP2017224187A (ja
Inventor
三浦 誓士
誓士 三浦
純一 宮越
純一 宮越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2016119654A priority Critical patent/JP6709689B2/ja
Priority to US15/593,731 priority patent/US10237159B2/en
Publication of JP2017224187A publication Critical patent/JP2017224187A/ja
Application granted granted Critical
Publication of JP6709689B2 publication Critical patent/JP6709689B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)

Description

本発明は、複数のノードから構成される計算機システムの制御方法に関する。
近年、メール、SNS、Web、及びセンサ等から取得した大量のデータを収集し、当該データを解析し、有用な知見を得るビッグデータ解析が注目されている。ビッグデータ解析において、有用な知見を得るためには、大量のデータを高速に解析する必要がある。
ビッグデータ解析を実行するデータセンタは、大量のデータを格納するストレージ装置、及び多数のサーバから構築される。多数のサーバを含むことによって、大量のデータを高速に解析できる。また、高速なデータへのアクセスを実現するために、SSD(Solid State Drive)を搭載したストレージ装置が用いられる。
データ量の増加に伴い、データ解析の速度の向上、及びサービスの継続するためのストレージ装置の信頼性の向上が求められる。また、データセンタの消費電力を抑えながら、データ解析の速度を向上させる必要がある。また、SSD等の不揮発性の記憶装置の書込寿命を考慮する必要がある。すなわち、各種目的を達成できるように、データセンタ(システム)を制御する必要がある。
多数の計算機を含む計算機システムにおいて、処理性能の最適化及び負荷分散等を実現する技術として、特許文献1及び特許文献2に記載されている技術が知られている。
特許文献1には、「任意の3階層(n〜n+2階層)において、第n+1階層の一つのノードは、第n+2階層の一つ以上のノードからそれぞれの負荷情報を取得し、取得した負荷情報と自ノードの負荷情報とに基づき、自ノードの空きリソース量を算出し、算出した自ノードの空きリソース量を、第n階層のノードへ送信し、第n階層のノードは、第n+1階層の各ノードから取得した空きリソース量に基づき、重み値を算出し、算出した重み値に基づき、受信した処理要求を、第n+1階層のいずれかのノードへ分配する。」ことが記載されている。
また、特許文献2には、「不揮発性メモリを含むメモリモジュールを複数備えた記憶装置システムにおいて、信頼性の向上や長寿命化等を実現する。このため、複数のメモリモジュール(STG)は、実際にその内部の不揮発性メモリに書き込んだライトデータ量(Wstg)を制御回路DKCTL0へ通達する。制御回路DKCTL0は、当該ライトデータ量(Wstg)と、複数のメモリモジュールに向けて既に発行済みの書き込み命令に伴うライトデータ量(Wh2d)と、次の書き込み命令に伴うライトデータ量(ntW)とから、各メモリモジュール毎の予測ライトデータ量(eWd)を求める。そして、この予測ライトデータ量が最小のメモリモジュールへ次の書き込み命令を発行する。」ことが記載されている。
特開2014−35717号公報 国際公開番号第2014/038073号
IoTの時代では、データセンタが処理するデータ量が飛躍的に増加する。処理能力の飛躍的な向上させるためは、データセンタ内のサーバの数及びSSDの数を大幅に増やす必要がある。
特許文献1及び特許文献2に記載の方法は、空きリソース情報及びライトデータ量等、システムの制御に必要な情報を全ての要素(サーバ、SSD)から収集し、一カ所に集約する必要がある。そのため、サーバの数及びSSDの数が増加すると、以下のような問題がある。
一つの問題は、データを収集するための時間が長くなるため、リアルタイムな対応が困難であることである。もう一つの問題は、データの収集に伴う通信負荷、及び演算処理の負荷が増大することである。
本願発明は、上記のような課題に鑑みてなされたものである。本発明は、収集するデータ量が増加した場合でも、低コストで、リアルタイムに、処理性能等の向上等を目的としてシステムの制御を実現する方法、システムを提供する。
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、ネットワークを介して接続される複数の計算機を有する計算機システムであって、前記複数の計算機の各々は、プロセッサ、前記プロセッサに接続される記憶装置、前記プロセッサに接続されるネットワークインタフェースを有し、前記プロセッサは、計算機が実行する処理を制御するための制御値を算出する契機を検知し、前記制御値を算出するために用いる評価値を取得する対象の計算機を特定し、自計算機の評価値を算出し、前記自計算機の評価値を前記記憶装置に格納し、前記対象の計算機から評価値を取得し、前記対象の計算機の評価値を前記記憶装置に格納し、前記自計算機の評価値及び前記対象の計算機の評価値の少なくともいずれかを用いて、前記計算機システムにおける前記自計算機の相対的な性能を示す第1ポイントを算出し、前記第1ポイントを前記記憶装置に格納し、前記自計算機の評価値及び前記対象の計算機の評価値を用いた比較処理に基づいて、前記計算機システムにおける前記対象の計算機の相対的な性能を示す第2ポイントを算出し、前記第2ポイントを前記対象の計算機に送信し、前記対象の計算機から前記第2ポイントを取得し、前記対象の計算機から取得した前記第2ポイントを前記記憶装置に格納し、前記記憶装置に格納される前記第1ポイント及び前記第2ポイントを用いて前記制御値を算出し、前記記憶装置に前記算出された制御値を格納し、前記制御値に基づいて前記計算機が実行する処理を制御することを特徴とする。
本発明によれば、低コストで、かつ、リアルタイムに、処理性能等の向上等を目的として計算機システムの制御を実現できる。前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。
実施例1の計算機システムの構成例を示す図である。 実施例1の計算機システムに含まれるノードの具体的な構成例を示す図である。 実施例1の計算機システムに含まれるノードの具体的な構成例を示す図である。 実施例1の接続情報の一例を示す図である。 実施例1の接続情報の一例を示す図である。 実施例1の接続情報の一例を示す図である。 実施例1の接続情報の一例を示す図である。 実施例1の指標情報の一例を示す図である。 実施例1の定義式情報の一例を示す図である。 実施例1の制御部が実行する制御内容決定処理を説明するフローチャートである。 実施例5の制御部が実行する制御内容決定処理を説明するフローチャートである。
以下、添付図面を参照して本発明の実施形態を説明する。本実施形態は本発明を実現するための一例にすぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。各図において共通の構成については、同一の参照符号が付されている。
実施例1では、本発明の基本となる構成及び処理について説明する。具体的な制御方法については、他の実施例にて説明する。
図1は、実施例1の計算機システムの構成例を示す図である。図2A及び図2Bは、実施例1の計算機システムに含まれるノードの具体的な構成例を示す図である。
計算機システム100は、複数のノード101を含む。複数のノード101の各々は、ネットワークを介して互いに接続される。ネットワークは、LAN(Local Area Network)及びWAN(Wide Area Network)等が考えられる。なお、本実施例は、ネットワークの種別に限定されない。また、ネットワークの接続方式は、無線及び有線のいずれであってもよい。
図1では、各ノード101は、格子状に接続されている。なお、本実施例はノード101の接続状態に限定されない。例えば、トーラス構造の接続でもよい。
本実施例の処理の概要について説明する。計算機システム100に含まれる各ノード101は、所定の評価範囲110に含まれるノード101から評価値を取得する。各ノード101は、評価値に基づいて、制御値を決定するためのポイントを算出し、ポイントに基づいて処理を制御するための制御値を決定する。
ここで、制御値は、ノード101が実行する処理を制御するための値である。また、ポイントは、各ノード101の相対的な性能等を表す値である。
ノード101は、所定の処理を実行する装置である。ここで、図2A及び図2Bを用いてノード101の具体例について説明する。図2Aは、ビッグデータ解析等に使用されるシステムに含まれるサーバ装置200の構成を示す。図2Bは、ストレージシステムに含まれるストレージ装置250の構成を示す。
まず、図2Aを用いてサーバ装置200の構成を説明する。サーバ装置200は、CPU201、主記憶装置202、及び送受信装置203を有する。各構成は内部バス等を介して互いに接続される。
CPU201は、主記憶装置202に格納されるプログラムを実行する。CPU201がプログラムを実行することによって、サーバ装置200が有する機能を実現できる。以下の説明では、モジュールを主語に説明する場合、CPU201が当該モジュールを実現するプログラムを実行していることを示す。
主記憶装置202は、CPU201が実行するプログラム及びプログラムによって使用される情報を格納する。本実施例の主記憶装置202は、制御部210を実現するプログラムを格納する。主記憶装置202は、制御部210によって算出された各種値を格納する記憶領域である記憶部211を含む。また、主記憶装置202は、接続情報220、指標情報221、及び定義式情報222を格納する。
制御部210は、ノード101の制御値を決定し、当該制御値に基づいてノード101を制御する。制御部210は、図示しないOS(Operating System)に含まれるモジュールでもよいし、OS上で稼働するアプリケーションでもよい。
接続情報220は、ノード101の接続関係を管理するための情報である。接続情報220の詳細は、図3を用いて説明する。指標情報221は、制御値を算出するために使用する指標を管理する情報である。指標情報221の詳細は、図4を用いて説明する。定義式情報222は、制御値を算出するための定義式を管理する情報である。定義式情報222の詳細は、図5を用いて説明する。
記憶部211は、自己ポイント230及び隣接ポイント231を格納する。自己ポイント230及び隣接ポイント231は、制御値を決定するために使用するポイントである。
また、隣接ポイントには、ノード101が送受信装置203を介して他のノード101へ送信する送信隣接ポイントと、ノード101が送受信装置203を介して他のノード101から受信する受信隣接ポイントが含まれる。
なお、記憶部211には、自己ポイント230及び隣接ポイント231以外のデータが格納されてもよい。例えば、記憶部211は、評価範囲110に含まれるノード101を検索するためのホップ数を格納する。以下の説明では、評価範囲110に含まれるノード101を隣接ノード101とも記載する。
送受信装置203は、ノード101又は外部装置からリクエスト及びデータを受信し、また、ノード101又は外部装置にリクエスト及びデータを送信する。なお、サーバ装置200は、複数の送受信装置203を有してもよい。例えば、サーバ装置200は、一つの送受信装置203を用いて自己評価値及び隣接ポイント等を送受信し、一つの送受信装置203を用いてリクエスト等を送受信する。これによって、処理の性能等を向上できる。
また、本実施例では送受信装置203により、各ノード101が接続されネットワークを構成する。また、ネットワークの接続方式は、無線及び有線のいずれであってもよい。
次に、図2Bを用いてストレージ装置250の構成を説明する。ストレージ装置250は、CPU251、主記憶装置252、送受信装置253、及び副記憶装置254を有する。各構成は内部バス等を介して互いに接続される。
CPU251、主記憶装置252、及び送受信装置253は、CPU201、主記憶装置202、及び送受信装置203と同様のハードウェアである。副記憶装置254は、書込み可能なデータ量が有限である不揮発性の記憶媒体である。例えば、副記憶装置254は、不揮発性メモリ利用した記憶装置であるSSD(Solid State Drive)、光ディスクを利用した記憶装置であるODD(Optical Disc Drive)、及びアーカイブ装置等が考えられる。
主記憶装置252に格納されるプログラム及び情報は、サーバ装置200に格納されるプログラム及び情報と同一である。なお、プログラムコード及びデータ形式等は異なっていてもよい。
なお、計算機システム100は、図示しない外部システムに接続されてもよい。
図3A、図3B、図3C、及び図3Dは、実施例1の接続情報220の一例を示す図である。
図3Aは、識別情報がV1であるノード101が保持する接続情報220である。図3Bは、識別情報がV2であるノード101が保持する接続情報220である。図3Cは、識別情報がV3であるノード101が保持する接続情報220である。図3A、図3B及び図3Cでは、各ノード101は、接続情報220を用いて、ホップ数が1であるノード101との接続関係を管理する。
図3Dは、識別情報がV1であるノードが保持する接続情報220である。図3Dでは、ノード101は、接続情報220を用いて、ホップ数が2であるノード101との接続関係を管理する。
なお、図示しないが、他のノード101も同様の接続情報220を保持する。各ノード101は、接続情報220を参照することによって評価範囲110に含まれるノード101を検索できる。
接続情報220は、ノードID301、接続ノードID302、及び状態303から構成される複数のエントリを含む。
ノードID301は、ノード101の識別情報である。接続ノードID302は、ノードID301に対応するノード101が接続関係を管理するノード101の識別情報である。接続ノードID302には、ノードID301に対応するノード101が管理するノード101の数だけ行が存在する。
状態303は、接続ノードID302に対応するノード101の稼働状態である。状態303には、ノード101が正常に稼働することを示す「正常」又はノード101が正常に稼働していないことを示す「異常」のいずれかが格納される。
本実施例では、制御部210が、ハートビート等を用いて、周期的に接続ノードID302に対応するノード101の稼働状態を監視し、又は、ノードID301に対応するノード101から接続ノードID302に対応するノード101に送信した要求に対する応答時間を監視するものとする。制御部210は、監視結果に基づいて、状態303の値を更新する。
なお、ノード101間の接続関係が変化した場合、接続情報220も更新される。例えば、あるノード101に接続されるノード101が追加される場合、追加されたノード101は、隣接するノード101に自ノード101の識別情報の登録要求を送信する。隣接するノード101は、接続情報220に新たに追加されたノード101に対応するエントリを追加する。隣接するノード101は、必要に応じて、他のノード101に更新された接続情報220を送信する。
例えば、ノード101が削除される場合、削除対象のノード101は、隣接するノード101に自ノード101の識別情報の削除要求を送信する。隣接するノード101は、接続情報220から削除対象のノード101に対応するエントリを削除する。隣接するノード101は、他のノード101に更新された接続情報220を送信する。これによって、計算機システム100に含まれる全てのノード101が保持する接続情報220が更新される。
図4は、実施例1の指標情報221の一例を示す図である。
指標情報221は、制御ID401、制御値種別402、取得指標403、及びタイミング404から構成される複数のエントリを含む。
制御ID401は、指標情報221のエントリの識別情報である。制御値種別402は、算出される制御値の種別である。取得指標403は、評価値を算出するために取得する指標の種別である。タイミング404は、エントリに対応する制御内容決定処理の実行契機である。
図4の一番目のエントリの制御値種別402は、処理性能を向上させるための(負荷分散するための)リクエストの処理数が制御値として算出されることを示す。図4の二番目のエントリの制御値種別402は、消費電力当たりの処理性能を向上させるためのリクエストの処理数が制御値として算出されることを示す。図4の三番目のエントリの制御値種別402は、副記憶装置254へのデータの書込量を平準化させるためのデータ書込量が制御値として算出されることを示す。図4の四番目のエントリの制御値種別402は、処理負荷の低減させるための他ノード101へのリクエストの転送数が制御値として算出されることを示す。
図5は、実施例1の定義式情報222の一例を示す図である。
定義式情報222は、制御ID501、値種別502、定義式503、及び算出値504から構成される複数のエントリを含む。
制御ID501は、制御ID401と同一のものである。値種別502は、算出する値の種別である。定義式503は、値種別502に対応する値を算出するための定義式である。算出値504は、定義式503に設定された定義式を用いて算出された値である。値が算出されていない場合、算出値504は空欄である。また、算出値504には、値が算出された時刻等を格納してもよい。
本実施例では、一つの制御IDに対して、自己評価値、送信隣接ポイント、受信隣接ポイント、自己ポイント、及び制御値の五つの値と、これら五つの値を算出するための定義式が設定される。なお、一つの制御値を算出するための定義式の数に限定されない。
図6は、実施例1の制御部210が実行する制御内容決定処理を説明するフローチャートである。
制御部210は、タイミング404に格納される実行契機を検知した場合、以下で説明する制御内容決定処理を実行する。このとき、制御部210は、検知した実行契機に対応するエントリの制御ID401を参照IDとして記憶部211に一時的に格納する。
制御部210は、接続情報220を参照して、隣接ノード101を特定する(ステップS601)。次に、制御部210は、自ノード101の評価値を算出する(ステップS602)。具体的には、以下のような処理を実行する。
制御部210は、制御ID401が参照IDに一致するエントリの取得指標403を参照し、取得する指標を特定する。制御部210は、自ノード101から特定された指標の値を取得する。
制御部210は、制御ID501が参照IDに一致し、かつ、値種別502が自己評価値であるエントリを検索する。制御部210は、検索されたエントリの定義式503から自ノード101の評価値(自己評価値)を算出するための定義式を取得する。
制御部210は、指標の値及び自己評価値の定義式に基づいて自ノード101の評価値を算出する。制御部210は、検索されたエントリの算出値504に、算出された自己評価値を格納する。以上がステップS602の処理の説明である。
次に、制御部210は、隣接ノード101から評価値を取得する(ステップS603)。具体的には、以下のような処理が実行される。
制御部210は、接続情報220の各エントリの状態303を参照し、隣接ノード101が正常に稼働しているか否かを判定する。制御部210は、正常に稼働していない隣接ノード101を評価値の取得対象から除外する。
制御部210は、取得対象の隣接ノード101に対する評価値の取得リクエストの送信を送受信装置203、253に指示する。送受信装置203、253は、当該指示にしたがって、隣接ノード101に評価値の取得リクエストを送信する。なお、当該取得リクエストには参照IDが含まれる。
隣接ノード101の制御部210は、評価値の取得リクエストを受信した場合、制御ID501が当該取得リクエストに含まれる参照IDに一致し、かつ、値種別502が自己評価値であるエントリを検索する。隣接ノード101の制御部210は、検索されたエントリの算出値504に値が格納されているか否かを判定する。
検索されたエントリの算出値504に値が格納されている場合、隣接ノード101の制御部210は、当該値を取得する。検索されたエントリの算出値504に値が格納されていない場合、隣接ノード101の制御部210は、ステップS602と同様の処理を実行することによって自己評価値を算出する。
なお、隣接ノード101の制御部210は、検索されたエントリの算出値504に値が格納されている場合に、再度、自己評価値を算出する必要があるか否かを判定してもよい。例えば、隣接ノード101の制御部210は、自己評価値が算出されてから一定期間経過している場合、自己評価値を算出する必要があると判定する。
隣接ノード101の制御部210は、取得リクエストの送信元であるノード101へ自己評価値を含むレスポンスを送信する。
取得リクエストを送信した制御部210は、隣接ノード101から受信したレスポンスに含まれる評価値を隣接評価値として記憶部211に一時的に格納する。なお、隣接評価値は隣接ノード101の識別情報と対応付けられている。以上がステップS603の処理の説明である。
次に、制御部210は、評価値に基づいて送信隣接ポイントを算出し、当該送信隣接ポイントを隣接ノード101に送信する(ステップS604)。具体的には、以下のような処理が実行される。
制御部210は、制御ID501が参照IDに一致し、かつ、値種別502が送信隣接ポイントであるエントリを検索する。送信隣接ポイントを算出するための定義式は、ステップS602で算出した自己評価値と、ステップS603で取得した隣接評価値を用いた比較演算を含む。制御部210は、検索されたエントリの定義式503から送信隣接ポイントを算出するための定義式を取得する。制御部210は、自己評価値及び隣接評価値を用いた送信隣接ポイントの定義式に基づいて、送信隣接ポイントを算出する。制御部210は、検索されたエントリの算出値504に算出された送信隣接ポイントを格納する。
制御部210は、算出された送信隣接ポイントの送信を送受信装置203、253に指示する。送受信装置203、253は、当該指示にしたがって、隣接ノード101に送信隣接ポイントを送信する。
制御部210は、各隣接ノード101から送信隣接ポイントを取得し、受信隣接ポイントを算出する(ステップS605)。具体的には、以下のような処理が実行される。
制御部210は、接続情報220の各エントリの状態303を参照し、隣接ノード101が正常に稼働しているか否かを判定する。制御部210は、正常に稼働していない隣接ノード101を送信隣接ポイントの取得対象から除外する。なお、当該判定処理は、ステップS603の判定結果を流用してもよい。
制御部210は、正常に稼働していない隣接ノード101の隣接ポイントを「0」に設定し、当該隣接ポイントと隣接ノード101の識別情報とを対応付けて記憶部211に一時的に格納する。
制御部210は、取得対象の隣接ノード101に対する送信隣接ポイントの取得リクエストの送信を送受信装置203、253に指示する。送受信装置203、253は、当該指示にしたがって、隣接ノード101に送信隣接ポイントの取得リクエストを送信する。なお、当該取得リクエストには参照IDが含まれる。
隣接ノード101の制御部210は、送信隣接ポイントの取得リクエストを受信した場合、制御ID501が取得リクエストに含まれる参照IDに一致し、かつ、値種別502が送信隣接ポイントであるエントリを検索する。隣接ノード101の制御部210は、検索されたエントリの算出値504に値が格納されているか否かを判定する。
検索されたエントリの算出値504に値が格納されている場合、隣接ノード101の制御部210は、当該値を取得する。検索されたエントリの算出値504に値が格納されていない場合、隣接ノード101の制御部210は、ステップS604と同様の処理を実行することによって送信隣接ポイントを算出する。
なお、隣接ノード101の制御部210は、検索されたエントリの算出値504に値が格納されている場合に、再度、送信隣接ポイントを算出する必要があるか否かを判定してもよい。例えば、隣接ノード101の制御部210は、送信隣接ポイントが算出されてから一定期間経過している場合、送信隣接ポイントを算出する必要があると判定する。
隣接ノード101の制御部210は、取得リクエストの送信元であるノード101へ送信隣接ポイントを含むレスポンスを送信する。
なお、隣接ノード101の制御部210は、評価値の取得リクエストの受信を契機として、送信隣接ポイントを算出してもよい。
取得リクエストを送信した制御部210は、隣接ノード101から受信したレスポンスに含まれる送信隣接ポイントを記憶部211に一時的に格納する。なお、送信隣接ポイントは隣接ノード101の識別情報と対応付けられている。
制御部210は、全ての隣接ノード101から送信隣接ポイントを取得した場合、制御ID501が参照IDに一致し、かつ、値種別502が受信隣接ポイントであるエントリを検索する。制御部210は、検索されたエントリの定義式503から受信隣接ポイントを算出するための定義式を取得する。制御部210は、隣接ノード101の送信隣接ポイント及び受信隣接ポイントの定義式に基づいて、受信隣接ポイントを算出する。制御部210は、検索されたエントリの算出値504に算出された受信隣接ポイントを格納する。以上が、ステップS605の処理の説明である。
次に、制御部210は、自己ポイントを算出する(ステップS606)。
具体的には、制御部210は、定義式情報222を参照し、制御ID501が参照IDに一致し、かつ、値種別502が自己ポイントであるエントリを検索する。制御部210は、検索されたエントリの定義式503から自己ポイントを算出するための定義式を取得する。制御部210は、自己ポイントの定義式に基づいて自己ポイントを算出し、検索されたエントリの算出値504に算出された自己ポイントを格納する。
次に、制御部210は、自己ポイント及び受信隣接ポイントに基づいて制御値を算出する(ステップS607)。
具体的には、制御部210は、定義式情報222を参照し、制御ID501が参照IDに一致し、かつ、値種別502が制御値であるエントリを検索する。制御部210は、検索されたエントリの定義式503から制御値を算出するための定義式を取得する。制御部210は、自己ポイント及び受信隣接ポイントを用いた制御値の定義式に基づいて制御値を算出し、検索されたエントリの算出値504に算出された制御値を格納する。制御部210は、当該制御値に基づいて、ノード101が実行する処理を制御する。
なお、図6に示す処理の順番は整合性を保つことができれば、どのような順番でもよい。例えば、制御部210は、自己ポイントを算出した後に、送信隣接ポイントを算出してもよい。処理の順番は定義式に応じて変更することもできる。
以上で説明したように、計算機システム100に含まれる各ノード101は、自ノード101及び隣接ノード101から、ノード101の相対的な性能を示すポイントを取得し、当該ポイントに基づいてノード101が実行する処理を制御するための制御値を決定する。ノード101は、隣接ノード101からのみ必要なデータを取得するため、通信負荷及び演算処理の負荷が低い。また、全てのノード101が自律的に制御値を決定できるため、リアルタイムに、大規模な計算機システムの処理性能等を向上させることができる。
実施例2では、複数のサーバ装置200を含む計算機システム100の処理性能を向上させるための制御を例に本発明の適応例を説明する。実施例2では、ノード101が処理可能なリクエストの数が制御値として算出される。ここで、実施例2で使用される定義式について説明する。なお、以下に示す定義式は一例であってこれに限定されない。
自己評価値は、式(1)を用いて算出される。Yは、識別情報が「i」であるノード101の自己評価値を表す。本実施例の自己評価値は、規格化された処理可能能力を表す値である。Brateは、識別情報が「i」であるノード101の処理稼働率を表し、式(2)で与えられる。Ymaxは、識別情報が「i」であるノード101の規格化された最大処理能力を表し、式(3)で与えられる。
Figure 0006709689
Figure 0006709689
Figure 0006709689
(実効CPUコア数)は、識別情報が「i」であるノード101が実際に使用しているCPUコアの数を表し、(実効動作周波数)は、識別情報が「i」であるノード101が使用しているCPUコアの実効的な動作周波数を表す。(最大CPUコア数)は、識別情報が「i」であるノード101が有するCPU201に含まれるCPUコアの合計値を表し、(最大動作周波数)は、識別情報が「i」であるノード101が有するCPU201の最大動作周波数を表す。また、標準CPUコア数及び標準動作周波数は、各値を規格化するための基準となるCPUのコア数及び動作周波数である。
送信隣接ポイントは、式(4)を用いて算出される。PNjiは、識別情報が「i」である自ノード101から識別情報が「j」である隣接ノード101へ送信される送信隣接ポイントを表す。YNは、識別情報が「j」であるノード101の隣接評価値を表す。P及びPはポイントを表す。P及びPは、式(5)に示すように0より大きい任意の定数Pで与えられる。Avg_Yは、識別情報が「i」であるノード101によって算出された評価値の平均値を表す。Avg_Yは、自己評価値Y及び隣接評価値YNから算出される。
Figure 0006709689
Figure 0006709689
式(4)に示すように、隣接評価値YNが評価値の平均値Avg_Yより大きい場合、正のポイント「+P」が隣接ノード101に送信される。隣接評価値YNが評価値の平均値Avg_Yより小さい場合、負のポイント「−P」が隣接ノード101に送信される。また、隣接評価値YNが評価値の平均値Avg_Yと同一である場合、ポイント「0」が隣接ノード101に送信される。
自己ポイントは、式(6)を用いて算出される。POは、識別情報が「i」であるノード101の自己ポイントを表す。PMは任意の定数である。
Figure 0006709689
リクエストの処理数は、式(7)を用いて算出される。Xは、識別情報が「i」であるノード101に設定されるリクエストの処理数を表す。Xmaxは、識別情報が「i」であるノード101が処理可能なリクエストの処理数の最大値を表し、式(8)で与えられる。Xは任意の定数である。Total_Pは、識別情報が「i」であるノード101が算出した集計ポイントを表し、式(9)で与えられる。PGは、識別情報が「i」であるノード101が算出した受信隣接ポイントを表し、式(10)で与えられる。なお、PNijは、識別情報が「j」である隣接ノード101から識別情報が「i」である自ノード101へ送信される送信隣接ポイントを表す。
Figure 0006709689
Figure 0006709689
Figure 0006709689
Figure 0006709689
PSmaxは、ポイントの合計値の最大値を表し、式(11)を用いて算出される。式(11)の隣接ノード数は、ステップS601において特定された隣接ノード101の数を表す。
Figure 0006709689
集計ポイントは、計算機システム100に含まれるサーバ装置200のCPU201の相対的な処理性能を示す。したがって、集計ポイントが大きい場合、サーバ装置200の処理性能が高いことを示す。
制御部210は、式(7)に基づいて算出されたリクエストの処理数を送受信装置203に設定する。送受信装置203は、当該値に基づいて処理するリクエストの数を制御する。
なお、隣接ポイント、自己ポイント、及びポイントの合計値の最大値は、式(12)、式(13)、及び(14)を用いて算出されてもよい。
Figure 0006709689
Figure 0006709689
Figure 0006709689
また、自己ポイントは式(15)を用いて算出されてもよい。PMは、式(16)で与えられ、また、PMは、式(17)で与えられる。PMは、0より大きい任意の定数である。
Figure 0006709689
Figure 0006709689
Figure 0006709689
また、識別情報が「i」であるノード101に設定されるリクエストの処理数は、式(18)を用いて算出されてもよい。X(N)は、識別情報が「i」であるノード101が現時刻において算出したリクエストの処理数を表し、X(N−1)は、識別情報が「i」であるノード101が前回算出したリクエストの処理数を表す。Xは任意の定数である。
Figure 0006709689
なお、評価値の平均値を算出する場合、隣接ポイントが「0」である隣接ノード101の隣接評価値は除外してもよい。隣接ポイントが「0」である隣接ノード101には影響を与えないようにするためである。
(変形例)
あるノード101が受け付けたリクエストの数が、式(7)に基づいて算出された制御値より大きい場合、制御部210は、自ノード101の空きリソース量及び隣接ノード101の空きリソース量を評価値として取得し、各ノード101の空きリソース量からポイントを算出する。制御部210は、当ポイントに基づいて、リクエストを転送するノード101及び転送するリクエストの数を制御値として算出する。例えば、制御部210は、ポイントが所定の閾値以上の隣接ノード101を特定し、特定された隣接ノード101のポイントの比率に基づいて、転送するリクエスト数を算出する。
なお、識別情報が「j」である隣接ノード101の空きリソース量は、例えば、式(19)で与えられる。Rは、識別情報が「j」である隣接ノード101の空きリソース量を表す。Xは、識別情報が「j」である隣接ノード101に設定された制御値を表す。(受信リクエスト数)は、識別情報が「j」である隣接ノード101が既に受信したリクエストの数を表す。
Figure 0006709689
なお、数式に含まれる定数は目的、システム構成等に応じて適宜変更することができる。
実施例2によれば、各ノード101は、自ノード101のポイント及び隣接ノード101から取得したポイントに基づいて、システム内の相対的な処理性能を把握し、システムの処理性能を向上させるための制御値を設定することができる。
実施例3では、電力効率を考慮して、複数のサーバ装置200を含む計算機システム100の処理性能を向上させるための制御を例に本発明の適応例を説明する。実施例3では、ノード101が処理可能なリクエストの数が制御値として算出される。ここで、実施例3で使用される定義式について説明する。なお、以下に示す定義式は一例であってこれに限定されない。
自己評価値は、式(20)を用いて算出される。Zは、識別情報が「i」であるノード101の自己評価値を表す。本実施例の自己評価値は、規格化された単位消費電力当たりの処理能力を表す値である。CPEは識別情報が「i」であるノード101のCPU201の実効的な電力効率を表し、式(21)で与えられる。また、SPEは、標準CPUの標準電力効率を表し、式(22)で与えられる。SPEは、各値を規格化するための基準となるCPUの電力効率である。(実CPU消費電力)は、識別情報が「i」であるノード101が実際に使用しているCPUの消費電力を表す。(最大CPU消費電力)は、識別情報が「i」であるノード101が有するCPU201が、全てのCPUコアを最大動作周波数で動作させた時のCPUの消費電力を表す。
Figure 0006709689
Figure 0006709689
Figure 0006709689
実施例3では、規格化された最大単位消費電力当たりの処理能力に基づいて、送信隣接ポイントが算出される。当該値は式(23)を用いて算出される。Zmaxは、識別情報が「i」であるノード101の規格化された最大単位消費電力当たりの処理能力を表す。CPMは、識別情報が「i」であるノード101のCPU201の電力効率の最大値を表し、式(24)で与えられる。
Figure 0006709689
Figure 0006709689
以下で説明する実施例3のPNji、PO、X、PSmaxは、実施例2のPNji、PO、X、PSmaxと同様の数式として与えられる。
送信隣接ポイントは、式(25)を用いて算出される。ZNは、識別情報が「j」であるノード101の隣接評価値を表す。P及びPは、式(26)に示すように0より大きい任意の定数PPで与えられる。Avg_Zは、識別情報が「i」であるノード101によって算出された評価値の平均値を表す。Avg_Zは、自己評価値Z及び隣接評価値ZNから算出される。
Figure 0006709689
Figure 0006709689
自己ポイントは式(27)を用いて算出される。PPMは任意の定数である。リクエストの処理数は式(29)から式(31)を用いて算出される。また、ポイントの合計値は、式(32)を用いて算出される。式(27)から式(32)までの数式は、式(6)から式(11)に対応する。
Figure 0006709689
Figure 0006709689
Figure 0006709689
Figure 0006709689
Figure 0006709689
Figure 0006709689
式(30)に示すように、集計ポイントは、計算機システム100に含まれるサーバ装置200のCPU201の相対的な単位消費電力当たりの処理性能を示す。したがって、集計ポイントが大きい場合、サーバ装置200の単位消費電力当たりの処理性能が高いことを示す。
実施例3の制御部210は、実施例2の制御部210と同様に、式(28)に基づいて算出されたリクエストの処理数Xを送受信装置203に設定する。送受信装置203は、当該値に基づいて処理するリクエストの数を制御する。
なお、数式に含まれる定数は目的、システム構成等に応じて適宜変更することができる。
実施例3によれば、各ノード101は、自ノード101のポイント及び隣接ノード101から取得したポイントに基づいて、システム内の相対的な単位消費電力あたりの処理性能を把握し、単位消費電力当たりの処理性能を向上させるための制御値を設定することができる。
実施例4では、複数のストレージ装置250を含む計算機システム100におけるデータ書込量の平準化を例に本発明の適応例を説明する。実施例4では、ノード101の副記憶装置254へ書込み可能なデータ量(データ書込可能量)が制御値として算出される。ここで、実施例4で使用される定義式について説明する。なお、以下に示す定義式は一例であってこれに限定されない。
実施例4では、各ストレージ装置250の実効最大データ書込量が評価値として算出される。
自己評価値は、式(33)を用いて算出される。LEは、識別情報が「i」であるノード101の自己評価値を表す。本実施例の自己評価値は、規格化された実効最大データ書込量を表す値であり、当該値はストレージ装置250の寿命を示す。Lmaxは、識別情報が「i」であるノード101の規格化された最大データ書込量を表し、式(34)で与えられる。(最大データ書込量)は、識別情報が「i」であるノード101が有する副記憶装置254に書込み可能なデータ量の最大値を表す。基準データ書込量は、規格化するための基準となるデータ書込量である。LAは、識別情報が「i」であるノード101の規格化された実データ書込量を表し、式(35)で与えられる。(実データ書込量)は、識別情報が「i」であるノード101が有する副記憶装置254に書き込まれたデータ量を表す。
Figure 0006709689
Figure 0006709689
Figure 0006709689
送信隣接ポイントは、式(36)を用いて算出される。LENは、識別情報が「j」であるノード101の隣接評価値を表す。P及びPは、式(37)に示すように0より大きい任意の定数PLで与えられる。Avg_LEは、識別情報が「i」であるノード101によって算出された評価値の平均値を表す。Avg_LEは、自己評価値LE及び隣接評価値LENから算出される。
Figure 0006709689
Figure 0006709689
自己ポイントは、式(38)を用いて算出される。PLMは任意の定数である。データ書込可能量は式(39)から式(42)を用いて算出される。また、ポイントの合計値は、式(43)を用いて算出される。式(38)から式(43)までの数式は、式(6)から式(11)に対応する。WEは、識別情報が「i」であるノード101のデータ書込可能量を表す。LBmaxは、識別情報が「i」であるノード101のブロックサイズを表す。なお、ブロックサイズは、副記憶装置254の物理ブロックサイズでもよいし、複数の物理ブロックサイズをまとめたブロックサイズでもよい。PBmaxは、識別情報が「i」であるノード101の物理ブロックサイズを表す。ブロックサイズは、副記憶装置254の物理ブロックサイズでもよいし、複数の物理ブロックサイズをまとめたブロックサイズでもよい。LNPは任意の定数である。
Figure 0006709689
Figure 0006709689
Figure 0006709689
Figure 0006709689
Figure 0006709689
Figure 0006709689
制御部210は、式(39)に基づいて算出されたデータ書込可能量WEを送受信装置253に設定する。送受信装置253は、当該値に基づいてデータ書込量を制御する。
なお、送信隣接ポイントは、式(12)のY及びYNをLE及びLENに置き換えた式を用いて算出することもできる。
この場合、式(13)のPM、Y、及びAvg_Yは、PLM、LE、及びAvg_LEに置き換えられる。また、式(14)のPM、Ymax、Avg_Y、及びPは、PLM、Lmax、Avg_LE、及びPLに置き換えられる。
なお、自己ポイントは、式(15)のY及びAvg_YをLE及びAvg_LEに置き換えた式を用いて算出することもできる。
この場合、式(16)及び式(17)のPM、Y、及びAvg_Yは、PLM、LE、及びAvg_LEに置き換えられる。PLMは任意の定数である。
なお、データ書込可能量は、式(18)のX及びXを、WE及びWEに置き換えた式を用いて算出することもできる。WE(N)は、識別情報が「i」であるノード101が現時刻において算出したデータ書込可能量を表し、WE(N−1)は、識別情報が「i」であるノード101が前回算出したデータ書込可能量を表す。WEは、任意の定数である。なお、Total_Pは、式(41)で与えられる。
なお、数式に含まれる定数は目的、システム構成等に応じて適宜変更することができる。
実施例4によれば、各ノード101は、自ノード101のポイント及び隣接ノード101から取得したポイントに基づいて、計算機システム100内の各ストレージ装置250の相対的な実効最大データ書込量、つまり、寿命を把握する。各ストレージ装置250は、寿命に応じてデータ書込量(制御値)を制御することによって、計算機システム100内の各ストレージ装置250間のデータ書込量を平準化できる。これによって、システムの寿命を延ばすことができる。
実施例5では、制御部210は、隣接ノード101以外のノード101をランダムに選択し、選択されたノード101と間でポイントを送受信する点が実施例1と異なる。以下、実施例1との差異を中心に実施例5について説明する。
実施例5の計算機システム100の構成は、実施例1と同一である。また、実施例5のノード101のハードウェア構成及びソフトウェア構成は実施例1と同一である。なお、実施例5の定義式情報222には、補正送信隣接ポイント及び補正自己ポイントのエントリが新たに追加される。
図7は、実施例5の制御部210が実行する制御内容決定処理を説明するフローチャートである。
制御部210は、所定のエントリのタイミング404に格納される実行契機を検知した場合、以下で説明する制御内容決定処理を実行する。このとき、制御部210は、検知された実行契機に対応するエントリの制御ID401を参照IDとして記憶部211に一時的に格納する。
制御部210は、ステップS601の処理を実行した後、ノード101を選択する(ステップS701)。
具体的には、制御部210は、接続情報220を参照し、隣接ノード101を除くノード101の中から一つ以上のノード101を選択する。例えば、制御部210は、乱数を発生させることによってノード101を選択する。なお、選択するノード101の数は、あらかじめ設定されているものとする。
以下の説明では、ステップS701において選択されたノード101をランダムノード101と記載する。
ステップS602からステップS604の処理は実施例1の処理と同一である。制御部210は、ランダムノード101から評価値の平均値を取得する(ステップS702)。なお、制御部210は、ランダムノード101から評価値を取得してもよい。
次に、制御部210は、ランダムノード101から取得した評価値の平均値、自己評価値、隣接評価値、及び定義式を用いて、補正送信隣接ポイントを算出し、隣接ノード101に補正送信隣接ポイントを送信する(ステップS703)。
実施例5の場合、例えば、式(44)を用いて補正送信隣接ポイントが算出される。PRNjiは、識別情報が「i」である自ノード101から識別情報が「j」であるランダムノード101へ送信される補正送信隣接ポイントを表す。YNは、識別情報が「j」であるノード101の隣接評価値を表す。PR及びPRは、ポイントを表す。PR及びPRは、式(45)に示すように0より大きい任意の定数PRで与えられる。Avg_YRは、識別情報が「k」であるランダムノード101から取得した評価値の平均値を表す。
Figure 0006709689
Figure 0006709689
式(44)に示すように、隣接評価値YNが評価値の平均値Avg_YRより大きい場合、正のポイント「+PR」が隣接ノード101に送信される。隣接評価値YNが評価値の平均値Avg_YRより小さい場合、負のポイント「−PR」が隣接ノード101に送信される。また、隣接評価値YNが評価値の平均値Avg_YRと同一である場合、ポイント「0」が隣接ノード101に送信される。
なお、算出された補正送信隣接ポイントは、ステップS604の処理と同様に、定義式情報222の所定のエントリの算出値504に格納される。
次に、制御部210は、隣接ノード101から送信隣接ポイント及び補正送信隣接ポイントを取得し、受信隣接ポイントを算出する(ステップS704)。
隣接ノード101からポイントを取得する方法は、ステップS605と同様の方法であるため説明を省略する。制御部210は、例えば、式(46)を用いて補正受信隣接ポイントを算出する。
Figure 0006709689
次に、制御部210は、ステップS606の処理を実行する。ステップS606の処理は実施例1と同一の処理である。次に、制御部210は、自己評価値、隣接ノード101から取得した評価値、ランダムノード101から取得した評価値の平均値、及び定義式を用いて、補正自己ポイントを算出する(ステップS705)。
実施例5の場合、例えば、以下のような式(47)に基づいて補正自己ポイントが算出される。PORは、識別情報が「i」であるノード101の補正自己ポイントを表す。PMR及びPMRは、ポイントを表す。PMRは式(48)で与えられ、PMRは式(49)で与えられる。PMRは任意の定数である。
Figure 0006709689
Figure 0006709689
Figure 0006709689
式(47)に示すように、自己評価値Yが評価値の平均値Avg_YRより大きい場合、正のポイント「+PMR」が自己補整ポイントとして算出される。自己評価値Yが評価値の平均値Avg_YRより小さい場合、負のポイント「−PMR」が自己補整ポイントとして算出される。また、自己評価値Yが評価値の平均値Avg_YRと同一である場合、ポイント「0」が自己補整ポイントとして算出される。なお、算出された補正自己ポイントは、ステップS605の処理と同様に、定義式情報222の所定のエントリの算出値504に格納される。
ステップS607では、制御部210は、自己ポイントPO、補正自己ポイントPOR、及び受信隣接ポイントPGに基づいて、制御値を算出する。例えば、制御部210は、式(50)を用いて制御値を算出する。Xmaxは、式(51)で与えられる。Xは任意の定数である。Total_Pは、式(52)で与えられる。また、PSmaxは、式(53)で与えられる。ランダムノード数は、ステップS701において特定されたランダムノード101の数を表す。
Figure 0006709689
Figure 0006709689
Figure 0006709689
Figure 0006709689
実施例5によれば、隣接ノード101以外のノード101から取得された補助的な情報(補正値)を用いることによって、より計算機システム100全体の状態を反映された制御値を算出することができる。これによって、より正確に計算機システム100を制御することが可能となる。
本発明によれば、一つのノード101は、計算機システム100に含まれる全てのノード101からデータを取得することなく、最適な処理を実現するための設定が可能となる。
例えば、負荷分散、消費電力当たりの処理性能の最適化、及びデータ書込量の平準化等が可能となる。また、システム構成の変更に柔軟に対応でき、また、さまざまな種類の制御値を調整することができる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるCPUが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、コンピュータが備えるCPUが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。
上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
100 計算機システム
101 ノード
110 評価範囲
200 サーバ装置
201 CPU
202 主記憶装置
203 送受信装置
210 制御部
211 記憶部
220 接続情報
221 指標情報
222 定義式情報
250 ストレージ装置
251 CPU
252 主記憶装置
253 送受信装置
254 副記憶装置

Claims (12)

  1. ネットワークを介して接続される複数の計算機を有する計算機システムであって、
    前記複数の計算機の各々は、プロセッサ、前記プロセッサに接続される記憶装置、前記プロセッサに接続されるネットワークインタフェースを有し、
    前記プロセッサは、
    計算機が実行する処理を制御するための制御値を算出する契機を検知し、
    前記制御値を算出するために用いる評価値を取得する対象の計算機を特定し、
    自計算機の評価値を算出し、前記自計算機の評価値を前記記憶装置に格納し、
    前記対象の計算機から評価値を取得し、前記対象の計算機の評価値を前記記憶装置に格納し、
    前記自計算機の評価値及び前記対象の計算機の評価値の少なくともいずれかを用いて、前記計算機システムにおける前記自計算機の相対的な性能を示す第1ポイントを算出し、前記第1ポイントを前記記憶装置に格納し、
    前記自計算機の評価値及び前記対象の計算機の評価値を用いた比較処理に基づいて、前記計算機システムにおける前記対象の計算機の相対的な性能を示す第2ポイントを算出し、前記第2ポイントを前記対象の計算機に送信し、
    前記対象の計算機から前記第2ポイントを取得し、前記対象の計算機から取得した前記第2ポイントを前記記憶装置に格納し、
    前記記憶装置に格納される前記第1ポイント及び前記第2ポイントを用いて前記制御値を算出し、前記記憶装置に前記算出された制御値を格納し、
    前記制御値に基づいて前記計算機が実行する処理を制御することを特徴とする計算機システム。
  2. 請求項1に記載の計算機システムであって、
    前記記憶装置は、前記制御値の種別と、前記第1ポイント及び前記第2ポイントを算出するための定義式とが対応付けられたエントリを含む定義式情報を格納し、
    前記プロセッサは、
    算出する前記制御値の種別を特定し、
    前記自計算機の評価値を取得した後に、前記制御値の種別を含む評価値の取得要求を前記対象の計算機に送信することによって、前記対象の計算機の評価値を取得し、
    前記定義式情報に基づいて前記第1ポイントを算出する第1定義式を特定し、前記第1定義式に基づいて前記第1ポイントを算出することを特徴とする計算機システム。
  3. 請求項2に記載の計算機システムであって、
    前記プロセッサは、
    前記評価値の取得要求を受信した場合、前記自計算機の評価値を算出し、
    前記評価値の取得要求の送信元の前記計算機に前記算出された評価値を送信し、
    前記制御値の種別を含む前記第2ポイントの取得要求を前記対象の計算機に送信することによって、前記対象の計算機から前記第2ポイントを取得し、
    前記第2ポイントの取得要求を受信した場合、前記第2ポイントの取得要求に含まれる前記制御値の種別に基づいて前記定義式情報を参照して、前記第2ポイントを算出する第2定義式を特定し、
    前記自計算機の評価値、前記対象の計算機の評価値、及び前記第2定義式に基づいて前記第2ポイントを算出し、
    前記第2ポイントの取得要求の送信元の前記計算機に前記算出された第2ポイントを送信することを特徴とする計算機システム。
  4. 請求項3に記載の計算機システムであって、
    前記第2定義式は、前記自計算機の評価値及び前記対象の計算機の評価値から算出された平均値と、前記対象の計算機のうちの前記第2ポイントの算出対象となる前記対象の計算機の評価値との比較結果に基づいて、前記第2ポイントの算出対象となる対象の計算機の前記第2ポイントを算出する式であることを特徴とする計算機システム。
  5. 請求項4に記載の計算機システムであって、
    前記記憶装置は、前記複数の計算機の接続関係を管理する接続情報を格納し、
    前記プロセッサは、前記接続情報を参照して、前記ネットワーク上の所定の範囲に含まれる前記計算機を前記対象の計算機として選択することを特徴とする計算機システム。
  6. 請求項5に記載の計算機システムであって、
    前記プロセッサは、前記所定の範囲に含まれない前記複数の計算機の中から、少なくとも一つの補正用計算機を選択し、
    前記補正用計算機から評価値に関連する補正値を取得し、前記補正用計算機から取得した前記補正値を前記記憶装置に格納し、
    前記対象の計算機の評価値及び前記補正値に基づいて第3ポイントを算出し、前記第3ポイントを前記対象の計算機に送信し、
    前記対象の計算機から前記第3ポイントを取得し、前記対象の計算機から取得した前記第3ポイントを前記記憶装置に格納し、
    前記自計算機の評価値及び前記補正値に基づいて第4ポイントを算出し、前記第4ポイントを前記記憶装置に格納し、
    前記記憶装置に格納される前記第1ポイント、前記第2ポイント、前記第3ポイント、及び前記第4ポイントに基づいて前記制御値を算出することを特徴とする計算機システム。
  7. ネットワークを介して接続される複数の計算機を有する計算機システムの制御方法であって、
    前記複数の計算機の各々は、プロセッサ、前記プロセッサに接続される記憶装置、前記プロセッサに接続されるネットワークインタフェースを有し、
    前記計算機システムの制御方法は、
    前記プロセッサが、計算機が実行する処理を制御するための制御値を算出する契機を検知する第1のステップと、
    前記プロセッサが、前記制御値を算出するために用いる評価値を取得する対象の計算機を特定する第2のステップと、
    前記プロセッサが、自計算機の評価値を算出し、前記自計算機の評価値を前記記憶装置に格納する第3のステップと、
    前記プロセッサが、前記対象の計算機から評価値を取得し、前記対象の計算機の評価値を前記記憶装置に格納する第4のステップと、
    前記プロセッサが、前記自計算機の評価値及び前記対象の計算機の評価値の少なくともいずれかを用いて、前記計算機システムにおける前記自計算機の相対的な性能を示す第1ポイントを算出し、前記第1ポイントを前記記憶装置に格納する第5のステップと、
    前記プロセッサが、前記自計算機の評価値及び前記対象の計算機の評価値を用いた比較処理に基づいて、前記計算機システムにおける前記対象の計算機の相対的な性能を示す第2ポイントを算出し、前記第2ポイントを前記対象の計算機に送信する第6のステップと、
    前記プロセッサが、前記対象の計算機から前記第2ポイントを取得し、前記対象の計算機から取得した前記第2ポイントを前記記憶装置に格納する第7のステップと、
    前記プロセッサが、前記記憶装置に格納される前記第1ポイント及び前記第2ポイントを用いて前記制御値を算出し、前記記憶装置に前記算出された制御値を格納する第8のステップと、
    前記プロセッサが、前記制御値に基づいて前記計算機が実行する処理を制御する第9のステップと、を含むことを特徴とする計算機システムの制御方法。
  8. 請求項7に記載の計算機システムの制御方法であって、
    前記記憶装置は、前記制御値の種別と、前記第1ポイント及び前記第2ポイントを算出するための定義式とが対応付けられたエントリを含む定義式情報を格納し、
    前記第3のステップは、前記プロセッサが、算出する前記制御値の種別を特定するステップを含み、
    前記第4のステップは、前記プロセッサが、前記制御値の種別を含む評価値の取得要求を前記対象の計算機に送信することによって、前記対象の計算機の評価値を取得するステップを含み、
    前記第5のステップは、前記プロセッサが、前記定義式情報に基づいて前記第1ポイントを算出する第1定義式を特定し、前記第1定義式に基づいて前記第1ポイントを算出するステップを含むことを特徴とする計算機システムの制御方法。
  9. 請求項8に記載の計算機システムの制御方法であって、
    前記第7のステップは、前記プロセッサが、前記制御値の種別を含む前記第2ポイントの取得要求を前記対象の計算機に送信することによって、前記対象の計算機から前記第2ポイントを取得するステップを含み、
    前記計算機システムの制御方法は、
    前記プロセッサが、前記評価値の取得要求を受信した場合、前記自計算機の評価値を算出するステップと、
    前記プロセッサが、前記評価値の取得要求の送信元の前記計算機に前記算出された評価値を送信するステップと、
    前記プロセッサが、前記第2ポイントの取得要求を受信した場合、前記第2ポイントの取得要求に含まれる前記制御値の種別に基づいて前記定義式情報を参照して、前記第2ポイントを算出する第2定義式を特定するステップと、
    前記プロセッサが、前記自計算機の評価値、前記対象の計算機の評価値、及び前記第2定義式に基づいて前記第2ポイントを算出するステップと、
    前記プロセッサが、前記第2ポイントの取得要求の送信元の前記計算機に前記算出された第2ポイントを送信するステップと、を含むことを特徴とする計算機システムの制御方法。
  10. 請求項9に記載の計算機システムの制御方法であって、
    前記第2定義式は、前記自計算機の評価値及び前記対象の計算機の評価値から算出された平均値と、前記対象の計算機のうちの前記第2ポイントの算出対象となる前記対象の計算機の評価値との比較結果に基づいて、前記第2ポイントの算出対象となる前記対象の計算機の前記第2ポイントを算出する式であることを特徴とする計算機システムの制御方法。
  11. 請求項10に記載の計算機システムの制御方法であって、
    前記記憶装置は、前記複数の計算機の接続関係を管理する接続情報を格納し、
    前記第2のステップは、前記プロセッサが、前記接続情報を参照して、前記ネットワーク上の所定の範囲に含まれる前記計算機を前記対象の計算機として選択するステップを含むことを特徴とする計算機システムの制御方法。
  12. 請求項11に記載の計算機システムの制御方法であって、
    前記第2のステップは、前記プロセッサが、前記所定の範囲に含まれない前記複数の計算機の中から、少なくとも一つの補正用計算機を選択するステップを含み、
    前記計算機システムの制御方法は、
    前記プロセッサが、前記補正用計算機から評価値に関連する補正値を取得し、前記補正用計算機から取得した前記補正値を前記記憶装置に格納するステップと、
    前記プロセッサが、前記対象の計算機の評価値及び前記補正値に基づいて第3ポイントを算出し、前記第3ポイントを前記対象の計算機に送信するステップと、
    前記プロセッサが、前記対象の計算機から前記第3ポイントを取得し、前記対象の計算機から取得した前記第3ポイントを前記記憶装置に格納するステップと、
    前記プロセッサが、前記自計算機の評価値及び前記補正値に基づいて第4ポイントを算出し、前記第4ポイントを前記記憶装置に格納するステップを含み、
    前記第8のステップは、前記プロセッサが、前記記憶装置に格納される前記第1ポイント、前記第2ポイント、前記第3ポイント、及び前記第4ポイントに基づいて前記制御値を算出するステップを含むことを特徴とする計算機システムの制御方法。
JP2016119654A 2016-06-16 2016-06-16 計算機システム及び計算機システムの制御方法 Expired - Fee Related JP6709689B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016119654A JP6709689B2 (ja) 2016-06-16 2016-06-16 計算機システム及び計算機システムの制御方法
US15/593,731 US10237159B2 (en) 2016-06-16 2017-05-12 Computer system and method of controlling computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016119654A JP6709689B2 (ja) 2016-06-16 2016-06-16 計算機システム及び計算機システムの制御方法

Publications (2)

Publication Number Publication Date
JP2017224187A JP2017224187A (ja) 2017-12-21
JP6709689B2 true JP6709689B2 (ja) 2020-06-17

Family

ID=60661444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016119654A Expired - Fee Related JP6709689B2 (ja) 2016-06-16 2016-06-16 計算機システム及び計算機システムの制御方法

Country Status (2)

Country Link
US (1) US10237159B2 (ja)
JP (1) JP6709689B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019178714A1 (zh) * 2018-03-19 2019-09-26 华为技术有限公司 一种故障检测的方法、装置及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8774100B2 (en) * 2006-09-18 2014-07-08 Nokia Corporation Resource management techniques for wireless networks
US8774147B2 (en) * 2012-02-23 2014-07-08 Dahrwin Llc Asynchronous wireless dynamic ad-hoc network
JP5914245B2 (ja) 2012-08-10 2016-05-11 株式会社日立製作所 多階層の各ノードを考慮した負荷分散方法
JP5820078B2 (ja) 2012-09-07 2015-11-24 株式会社日立製作所 記憶装置システム
US10001293B2 (en) * 2014-11-10 2018-06-19 Belimo Holding Ag Method for controlling operation of an HVAC system
US9818405B2 (en) * 2016-03-15 2017-11-14 SAESTEK Ses ve Iletisim Bilgisayar Tekn. San. Ve Tic. A.S. Dialog management system

Also Published As

Publication number Publication date
US20170366436A1 (en) 2017-12-21
US10237159B2 (en) 2019-03-19
JP2017224187A (ja) 2017-12-21

Similar Documents

Publication Publication Date Title
JP5218390B2 (ja) 自律制御サーバ、仮想サーバの制御方法及びプログラム
CN108205541B (zh) 分布式网络爬虫任务的调度方法及装置
US9805140B2 (en) Striping of directed graphs and nodes with improved functionality
US8935501B2 (en) Apparatus, method, and recording medium storing a program for selecting a destination storage based on a buffer size
CN107659974B (zh) 无线传感网路由方法、装置、设备及计算机可读存储介质
US20170262196A1 (en) Load monitoring method and information processing apparatus
JP6272190B2 (ja) 計算機システム、計算機、負荷分散方法及びそのプログラム
JP5845877B2 (ja) 情報処理装置、データ制御方法およびデータ制御プログラム
US20190303210A1 (en) Distribution process system and distribution process method
US9781023B2 (en) Information processing device, information processing method, and recording medium
WO2017207049A1 (en) A node of a network and a method of operating the same for resource distribution
US7962650B2 (en) Dynamic component placement in an event-driven component-oriented network data processing system
US20180260463A1 (en) Computer system and method of assigning processing
CN102480502A (zh) 一种i/o负载均衡方法及i/o服务器
CN105635285B (zh) 一种基于状态感知的vm迁移调度方法
JP6709689B2 (ja) 計算機システム及び計算機システムの制御方法
US20150378856A1 (en) Storage system, storage device, control method and control program of storage device, management device, and control method and storage medium
JP2019153189A (ja) セッション情報セットをキャッシュするサーバ、及び、セッション情報セットのキャッシュ制御方法
EP3685567B1 (en) Load shedding of traffic based on current load state of target capacity
JP6963465B2 (ja) 計算機システム及びデータ処理の制御方法
JP6015660B2 (ja) データ配置システム、分散アクセスノード、データ配置方法およびプログラム
US11720397B2 (en) Information processing method and apparatus to migrate tasks between resources
US11283876B2 (en) Systems and methods for end-to-end request-response flow routing for geographically distributed client devices
US20140365681A1 (en) Data management method, data management system, and data management apparatus
JP2021141622A (ja) 管理サーバ、ネットワークシステム、ルータの管理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181023

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200430

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200519

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200525

R150 Certificate of patent or registration of utility model

Ref document number: 6709689

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees