JP3817541B2 - プログラムに基づいた応答時間ベースの作業負荷分配技法 - Google Patents

プログラムに基づいた応答時間ベースの作業負荷分配技法 Download PDF

Info

Publication number
JP3817541B2
JP3817541B2 JP2003396290A JP2003396290A JP3817541B2 JP 3817541 B2 JP3817541 B2 JP 3817541B2 JP 2003396290 A JP2003396290 A JP 2003396290A JP 2003396290 A JP2003396290 A JP 2003396290A JP 3817541 B2 JP3817541 B2 JP 3817541B2
Authority
JP
Japan
Prior art keywords
request
execution time
server
average execution
pool
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003396290A
Other languages
English (en)
Other versions
JP2004213625A (ja
Inventor
クリストファー・ジェイムズ・ブライス
ジェンナーロ・エー・クオモ
エリック・エー・ドートレイ
マット・アール・ホグストロム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2004213625A publication Critical patent/JP2004213625A/ja
Application granted granted Critical
Publication of JP3817541B2 publication Critical patent/JP3817541B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5018Thread allocation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Public Health (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明はコンピュータ・ソフトウェアに関し、より詳細には、実行リソース・セット全体にわたって(および具体的には、マルチスレッドのサーバ環境における実行スレッド全体にわたって)プログラムに基づいて作業負荷を分配することによる、方法、システム、コンピュータ・プログラム製品、およびビジネスを行う方法に関する。
クライアント/サーバ・コンピューティングの普及が近年急速に進んでいるが、これは、公衆インターネットおよび「World Wide Web」(または単に「Web」)として知られるそのサブセットの、ビジネスおよび家庭での利用が増えたことに大きく起因している。企業イントラネットおよびエクストラネットなどの他のタイプのクライアント/サーバ・コンピューティング環境も、ますます普及しつつある。その解決策として、プロバイダは高度なWebベースのコンピューティングを配信することに焦点を当て、開発されるソリューションの多くは他のクライアント/サーバ・コンピューティング環境に適応可能なものである。したがって、本明細書でインターネットおよびWebに言及するのは、例示のためであって限定するためではない。(さらに本明細書では、「インターネット」、「Web」、および「World Wide Web」という用語は区別なく使用される。)
毎日、何百万人もの人々が、個人の楽しみやビジネスあるいはその両方に、インターネットを使用している。電子情報およびビジネス・サービスの消費者として、今や人々は地球規模のレベルでソースに簡単にアクセスすることができる。人間のユーザがインターネットを介してソフトウェア・アプリケーションと対話し、コンテンツを要求する場合、応答を返す際の遅延または効率の悪さは、ユーザの満足感にかなりの悪影響を与える可能性があり、ユーザが別のソースに切替えてしまうことすらある。したがって、要求されたコンテンツを即時に効率良く送達することは、ユーザを満足させる上で不可欠であり、ネットワークのサーバ側にあるシステムができる限り効率良く動作するよう保証することが重要である。
これまでの経験によれば、この種の環境で様々なクライアントに関する要求を処理するアプリケーション・サーバでは、受け取られる様々な要求全体わたって最高のスループットおよび応答時間を提供するために、通常、リソースの使用量に制約を与えることが必要である。関心の対象である主なリソースの1つが実行スレッド(以下、同様の意味で単に「スレッド」と呼ぶ)である。スレッドを制約なしに作成、使用、および廃棄すると、当分野で知られた様々な理由で応答時間およびスループットの両方を損なう可能性がある。たとえば、スレッドをあまり多く作成しすぎると、スレッドを管理するためのシステム・オーバヘッドが許容できないほどに高くなることがあり、またこれらのスレッドに関するシステムの状態および他の情報を格納するために必要なメモリ量が多くなりすぎることがある。さらに、限られたリソースに対して多くのスレッドが待ち行列に入ると、通常はそれらのリソースにスラッシングを生じさせるため、共用リソースの競合が使用可能なスレッドの数を制限する主な理由である。ただし他方では、使用可能なスレッド数が少なすぎると、入ってくる要求がスレッドに割り当てられるまでに長い時間待機し、それによってエンド・ユーザへの応答時間が長くなる可能性がある。
したがって、システム内のスレッド数を調整することが有用である。本明細書では、作成されたが廃棄されていないスレッド・セットのことを「スレッド・プール」と呼ぶ。特定のクライアント/サーバ環境でスレッド・プールに対して作成されるスレッド数は、サーバを初期設定する際に、しばしばユーザ(たとえばシステム管理者)によって構成パラメータとして指定される。通常、アプリケーションが適度以上に酷使される環境では、所与のアプリケーション・セットに対するスレッド・プールの調整は反復オペレーションであり、その結果、スループットおよび応答時間を向上させる試みにおいてスレッド・プールがサイズ変更される。
均一の作業負荷では、要求の有する全システム応答時間がほぼ同じである場合が多く、スレッド・プールを繰り返しサイズ変更することが、システムの性能を向上させるために良好に働く。同様に、作業負荷に様々なタイプがミックスされた要求が含まれていても、その様々な要求が同様の応答時間を有する場合には、この種のオペレーションのサイズ変更もかなり良好に働く。ただし、様々な応答時間がミックスされている作業負荷の場合、問題はさらに複雑である。
様々な平均応答時間を有する要求タイプからなる作業負荷を伴う、スレッド数の制約された単一のスレッド・プールが使用される場合、要求が(平均して)適正な時間内に処理される、スレッド・プールの「最適サイズ」を見つけることが可能である。ただし、このようにミックスされた作業負荷に対して単一のスレッド・プールを使用することは、次善策となる傾向がある。具体的に言えば、この方法は、より短い実行時間を有する要求の応答時間を不均衡に長くする。
この現象が生じる理由は、上記のように、アプリケーション・サーバの単一のスレッド・プールに制約を与えることは、そのアプリケーション・サーバ内でのリソース利用率を制御するために極めて重要ではあるが、単一のスレッド・プールは、より長い実行時間を有する要求で一杯になる傾向もあり、したがって、より短い実行時間を有する要求は事実上締め出されることになる。実行時間の長い要求が爆発的に増えると、本質的に、実行時間の短い要求が単一の制約されたスレッド・プールからスレッドに割り当てられるのを妨げることになる。さらに、スレッドがスレッド・プールから割り当てられたときに、たとえそのスレッドが特定の要求をきわめて迅速に処理できるとしても、要求はスレッドが割り当てられるまでかなり長い間待機しなければならない可能性がある。したがって、こうした要求に関してエンド・ユーザ(または、より一般には要求者)が知覚する応答時間は、極端に長い可能性がある。
これら従来技術の問題を克服する技法が求められている。
US5,664,106 US6,427,161 「データベース・システムに関する目標指向の動的バッファ・プール管理」("Goal-oriented dynamic buffer pool management for data basesystem"), IEEE,08/1995:191-198, チェン・ヤオ・チャン等(Jen-YaoChung, et al.)
本発明の一目的は、クライアント/サーバ・ネットワークでの性能を向上させることである。
本発明の他の目的は、マルチスレッド・サーバの性能を向上させることである。
本発明の他の目的は、スレッド・プールからスレッドへの要求をスケジューリングするための高度な技法を提供することである。
本発明の他の目的は、マルチスレッド・サーバ環境で動的に作業負荷のバランスをとるための技法を定義することである。
本発明の他の目的は、様々な平均応答時間を有する作業負荷に対するサーバの性能を向上させるために、スレッド・プールを動的に調整するための技法を定義することである。
本発明の他の目的は、実行のための待機時間を減らすために、要求が必要とする実行時間を短くすることのできる技法を定義することである。
本発明の他の目的は、実行時間の短い要求に関する応答時間を短くするために、実行リソース・セット全体にわたり、作業負荷をプログラムに基づいて分配するための技法を定義することである。
本発明の他の目的および利点は、一部は以下の説明および図面に記載され、一部は説明から明らかになるか、または本発明の実施によって習得することができる。
上記の目的を達成するため、および本明細書におおまかに記載された本発明の目的に従って、本発明は、実行リソース・セット全体にわたり、作業負荷をプログラムに基づいて分配するための方法、システム、およびコンピュータ・プログラム製品を提供する。好ましい実施形態では、この技法には、いくつかの使用可能な複数のスレッド・プールを用意すること、サーバ上にある作業負荷の履歴統計から、サーバで処理された要求ごとの平均実行時間を複数取得すること、および複数の平均実行時間に基づいて、使用可能な複数のスレッド・プールの各々に対し、割り当てられる要求の平均実行時間の異なる上限値を決定することが含まれる。実行時に、インバウンド要求がサーバで受け取られると、次にそれらを、平均実行時間の上限値に基づい、使用可能な複数のスレッド・プールのいずれかにに割り当てることができる。好ましくは、スレッド・プールは論理スレッド・プールである。
好ましくは、上限値を決定するステップは複数の平均実行時間を配列内にコピーすること配列をその値に従ってソートすること、およびソートされた配列を(たとえば均等に)使用可能なスレッド・プール数にわたって割り振ることをさらに含む。ソートされた配列の総数を決定することが可能であり、この場合、好ましくは割振りが値「N」を見つけるために、ソートされた配列の総数を使用可能なスレッド・プール数で割ること、ならびに、索引として「N」の整数倍を使用してアクセスされる配列の値を、各スレッド・プールの平均実行時間の異なる上限値とすることをさらに含む。
インバウンド要求がサーバで受け取られると、好ましい実施形態は、受け取った要求の分類キーを決定し、決定された分類キーを使用して受け取った要求の平均実行時間を突き止め、および、(好ましくは、突き止められた平均実行時間と決定された各スレッド・プールの平均実行時間の上限値とを、比較された平均実行時間の上限値が突き止められた平均実行時間よりも大きいかまたは等しくなるまで、繰り返し比較することによって)受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止める。
好ましい実施形態は、インバウンド要求がサーバ側で実行されるときの実行時間を追跡し、追跡された実行時間を反映するように作業負荷の実行時間を更新する。好ましくは、更新された実行時間を反映するように、各スレッド・プールの異なる平均実行時間の上限値は定期的に再計算される。
本発明は、ビジネスを行う方法としても提供することができる。たとえば、顧客にサービスを提供することが可能であり、それによってクライアント/サーバ・ネットワーク・トラフィックの動作特徴が監視され、実行リソースへの調整が観察に基づきプログラムに基づいて実行される。このサービスは、利用回数制課金、毎月または他の定期的な課金などの、様々な収益モデルの下で提供することができる。
次に、同じ参照番号が全体を通じて同じ要素を示す下記の図面を参照しながら、本発明について説明する。
本発明は、クライアント/サーバ・ネットワーキング環境のマルチスレッド・サーバにおける実行リソースのセット全体にわたり、インバウンド要求を動的かつプログラムに基づいて分配する。好ましい実施形態では、実行リソースはスレッドであり、これらのスレッドは論理的には複数のスレッド・プールに編成される。(使用可能なスレッドのセットは、単一の物理プールから生じるものとみなすことが可能であり、これがさらに論理的に複数のプールに分けられる。以下の、図1の要素135、140、145、および150に関する考察も参照されたい。参照しやすくするために、本明細書では、論理的に編成されたプールを単にスレッド・プールと呼び、単一の物理プールを「グローバル」スレッド・プールと呼ぶ。)
好ましくは、プログラムに基づいた要求分配プロセスは、どのインバウンド要求をどのプールに割り当てるべきか(要求は、必要であればそのプールに関する待ち行列に入る)をプログラムに基づいて決定することを含み、オプションの拡張機能では、使用中のスレッド・プールの数および/またはサイズもプログラムに基づいて調整することができる。プログラムに基づいた分配プロセスの好ましい実施形態では、本発明は、要求が実行されるときに要求を追跡し、要求タイプごとの平均実行時間および待機時間を決定し、ならびに、(好ましくは、各プールで処理される要求の平均実行時間の上限を決定することにより)特定プールに対する要求の割振りを動的に調整する。スレッド・プールの数および/またはプール内のスレッドの数も動的に調整する好ましい実施形態では、一度にこれら変数(プールごとの平均実行時間の上限、スレッド・プール数、およびプール内のスレッド数)のうちの1つだけが調整され、その効果が肯定的であったか否定的であったかを判定するためにスナップショットが取られる。
従来技術に従って単一の制約されたスレッド・プールを使用することに関連付けられた問題について、上記で説明した。当分野で知られるこれらの問題に対する1つの解決策は、少数のスレッド・プール(この数は静的に事前に定義される)をセットアップすること、および各プールに入ることのできる要求のタイプを手動で構成することである。その後、他のすべての要求は、「他のすべての」プールで処理することができる。この方法には、どのタイプの要求がこの機構から恩恵を受けることになるかを判別するためにシステムをプロファイリングすること、およびプールへの要求タイプのマッピングを記述したサイドテーブル情報を手動で構築することが必要である。
この方法には長所と欠点がある。長所の1つは、要求セットが、どの要求の待ち行列時間が異常に長くなっているか、およびどの要求の実行時間が他のすべての要求タイプに比べて十分短いかを識別できる場合、識別されたセットはおそらく、識別されたときに、この情報を適切に使用して、これらの要求を特定のスレッド・プールの方向へ向ける(すなわちこれに向けて送る)ことのできる実行時間に対して、より良好な応答時間を達成することになる、ということである。
ただし、この方法では長所よりも欠点の方が多い。その1つが、この方法は要求ストリームの(Webアプリケーションで遭遇するような)変化する性質を考慮しないことである。要求タイプのマッピングを含むハードコードされたテーブルが最初から悪いか、あるいは、当初測定されたコードの特徴が変化したかまたは新しいコードがシステムの力学を変化させたかのいずれかにより、経時的に変える必要があるかのいずれかである可能性が高い。いずれの場合も、たとえ最初から悪いわけではなくとも、情報は即時に時代遅れとなる可能性が高いのは明らかであろう。
本発明の適切な解決策、および好ましい実施形態によって使用される解決策は、所与のタイプの要求に関する平均実行時間および待機時間を追跡し、その後、それらの実行時間に従って、各タイプの要求をスレッド・プールに割り当てることである。
アプリケーション・サーバによって処理される様々な要求タイプに関する平均実行時間を追跡することによって、これらの要求タイプをいくつかの同じ実行時間カテゴリのグループに分けることができる。1つの方法では、実行時間帯域の周波数分布を構築することによって、カテゴリを決定することができる。好ましい実施形態で使用される単純な実施は、使用可能なスレッド・プールの(所定の)数を入手し、集められた実行時間を使用して要求タイプをこの数のスレッド・プールに分けることによって、帯域を計算することができる。これは、統計タイルの計算とも呼ばれ、タイル値(すなわち各特定帯域の上限)は各プールに可能な最大実行時間となる。タイル値を計算し、その後、どの実行時間が各タイルに対応するかを識別するマッピング・テーブル(または同様の関連)を作成するプロセスを、本明細書では「分配計算」または「プール・ターゲット計算」と呼ぶ。この情報を使用して、新しく到着したインバウンド要求がどこに向かって送られるべきかを決定するプロセスを、本明細書では要求の「分類」と呼ぶ。実行時間の上限を決定する際に使用される集められたデータを、本明細書では一般に「分類データ」と呼び、各要求タイプの平均実行時間ならびに以下でより詳細に説明する他の情報が含まれる。
たとえば、分類データの実行時間が10,000時間であり、10のスレッド・プールが使用される場合、1,000時間の最短実行時間をもつ要求タイプは、第1のプールからのスレッドによって処理され、1,000時間の最長実行時間をもつ要求タイプは、最後(10番目)のプールによって処理されることができる。本発明の発明者は、分配計算は、各実行時間帯域内にある要求の履歴周波数を自動的に考慮に入れるため、この方法が既知のプール・サイズに対して良好に働くと判断した。分類、またはスレッド・プールへの要求の実行時方向付け(vectoring)を、好ましい実施形態に従ってどのように実行することができるかについての詳細は、図1(以下で論じる)を参照されたい。
実験を通じて、複数の論理スレッド・プールの可用性が全体の応答時間およびスループットを助けることがわかった。前述のように、従来技術の方法は、要求を複数のプールに静的に割り振る。静的割当ての欠点についてはこれまでに述べたが、本発明の動的分類および分配計算技法はこれらの欠点を回避する。本明細書で開示された技法は、所与の作業負荷に対してプール・サイズおよび/またはプール数を動的に調整できるようにするものでもある。(この調整がどのように実施できるかについての詳細な考察を、図5〜8を参照しながら以下で行う。)
スレッド・プール数を動的に調整するための技法が使用されない場合、好ましい実施形態のオペレーション中に使用するプールの数は、好ましくは所定の数(構成可能な値であってよい)に割り振られる。プールの数がシステムの挙動を調べることによって動的に決定される場合、本明細書に記載されるように、好ましくは反復方法が使用される。後者の場合、最初に使用されるプールの数(ならびにプール・サイズ)は、以前の知識(たとえば、動的に決定された可能性のある、最も新しく使用された値に関する保存された状態情報)によって、または初期のデフォルト構成から始めることによって、決定できる。
プールへの要求タイプの分配を動的に再計算することに加えて、プールの数およびプールのサイズを動的に調整する場合、このタイプの実行時調整には、3次元的な問題として取り組むことができる。1つの次元は、要求タイプの関連付けられた実行時間についてタイルを計算すること、もう1つの次元はプールの数を調整すること、およびもう1つの次元はプールのサイズを調整することである。このプロセスは、これらの調整面の間の相互作用により、さらに複雑になる。(プログラムに基づいて要求を分配するためにタイル値を計算することは、それ自体が調整の1タイプであるため、本明細書で使用される「調整」という用語は、参照のコンテキストがそれ以外のものを示す場合を除き、プール数およびプール・サイズの調整プロセスのみを指すことを意図するものではない。)たとえばプール・サイズの変更またはプール数の変更は、プールに向けて送られる要求の実行時間に影響を与えることが多い。次にこれが、様々な要求タイプを異なる帯域に押し込むことがある。これについて例示するために、4つの帯域を有する構成があり、第3の帯域(次に最も長い実行要求が処理される)がいくつかのスレッド「T」を有すると想定する。さらに、この数のスレッドを使用して、帯域3内の要求が、なんらかの低帯域「LB(3)」からなんらかの高帯域「UB(3)」までの範囲の時間間隔で、それらの実行を完了すると想定する。帯域3のスレッド数Tが変更されると、帯域3に向けて送られるいくつかの要求タイプの実行時間が範囲[LB(3)...UB(3)]から外れる可能性がある。これは、本明細書で使用される方法によれば、これらの要求タイプがもはや帯域3内に属さないことを意味する。ただし、これらを他の帯域に移動させると、それによってその帯域内の要求の実行時間が変更される、という連鎖反応を起こす可能性がある(追加の要求タイプが他の帯域に移動する必要がある可能性があることを示す)。この反応を制御するために、好ましい実施形態は、プール・サイズ調整プロセス中に、実行時間(および、したがってその時間内に実行される傾向がある要求タイプ)を特定の実行帯域に拘束し、後続の分配計算(すなわち、後続の実行データ分析およびそこから導出されたマッピングの改訂)が発生するときにのみそれらの拘束を解く。分配計算は、一般に、プール・サイズ調整と同時に発生すること(および、好ましくはその間には実行時間が拘束されていない、プール・カウント調整とも同時に発生すること)に留意されたい。好ましい実施形態では、この拘束は要求タイプの分類データ内のフラグを使用することで実行され、拘束フラグはプール・サイズ調整が完了した後に消去される。
マルチスレッド・サーバ環境では、以下のようないくつかの動的要素が観察できる。
DE1:所与の要求タイプの実行時間は、それが使用し、コード・パスが取得されるリソースに依存して変更可能である。
DE2:新しい要求がシステムに入り、それらの実行時間に従って分類されなければならない。
DE3:プール・サイズは変更可能であり、プールに向けられた要求の実行時間に影響を与えることになる。
DE4:実行時間の分配は再計算可能であり、その結果、様々な要求タイプが帯域を変更する可能性がある。
DE5:帯域の数および対応するプールの数は変更可能である。
上記に列挙した動的要素を参照し、DE1およびDE2は調整プロセスから独立していることに留意されたい。実際、それらが動的調整機能を必要とする主な理由である。そうでなければ、要求タイプの帯域への分配は1回計算してそのままにしておくことができる。(同様に、DE1およびDE2がなければ、プール・サイズまたはプール数を動的に調整することによって得られる利点はわずかであるか、またはまったくない可能性がある。)また、動的要素DE3、DE4、およびDE5は、調整プロセスに直接起因することにも留意されたい。これらの観察は、調整プロセスを首尾よく推進するために、本明細書に開示された調整技法によって使用される。
したがって、本明細書に開示された動的分配および調整技法は、動的要素のセット全体にわたってバランスがとれるように設計される。好ましくは、発生するオーバヘッドをできる限り少なくするために、調整の経路長さ、競合、および周波数は最低限にされる。調整時の相互作用および連鎖反応を避けるために、好ましい実施形態では、1つを変更し、システムが何らかの時間間隔についてこの状態で実行できるようにし、変更の効果を測定する。(この方法は、変更の肯定的または否定的な影響を分離するためには有益であるが、調整プロセス全体の持続時間を長引かせる可能性がある。したがって、絶対に必要でない限り、帯域の最大数を、はじめに比較的少ない数に設定することが有益である。好ましくは、システムが大きくなるほど、この最大数が大きくなる。)
本発明の調整方法には、以下のように3つの主要な目標がある。
G1:定常作業負荷ミックスの準定常状態に、できる限り迅速に達するように試行する。
G2:過度の制御によって生じる可能性のある、実行時間の激しい変動を避ける。
G3:入ってくる要求の使用可能なスレッド・リソースと実行時間とのバランスがとれるようにする。
これらの目標を達成するために、システムによって処理された要求に関して実行時間および待機または待ち行列時間の履歴統計を保管する必要がある。したがって本発明は、上記で述べたようにこの情報を追跡する。調整中に行った決定は、これらの要素に関して判明した現在の値と過去に判明した値との比較に基づいて、その後評価することができる。(好ましくは、実行した変更の値の修正は、新しいタイプの要求、およびレート0を含む現在の要求のレート変更に関して、システムの動的性質も考慮に入れる。新しく遭遇した要求タイプは、図2〜3を参照しながら以下で説明するように、本発明の分類プロセスの実施形態によって自動的に処理される。特定の要求タイプに関する着信レートの変更には分配計算が自動的に対処し、実行時間対プール・マッピングの上限が修正される場合がある。着信レートの変更は、結果的に、それらの要求タイプを処理するスレッド・プール・サイズをプログラムに基づいて調整することにもなる。)
動的な作業負荷の分配およびプールの調整を考えるときに、それ自体を直接表す難題の1つが、ほとんどの実際のアプリケーション・サーバが閉じたシステムでないという事実である。すなわち、要求によって提示される実行時間および待ち行列時間は、実行される作業のタイプに応じて、ダウンストリームおよびアップストリームの力に影響されることが多い。たとえば、特定の要求タイプが(データベース呼出しなどの)リモート呼出しを実行し、その実行時間がそれら呼び出されたリソースの可用性、またはそれらの競合に応じて、変動する場合がある。
この影響に対処するために、好ましくは本発明の実施形態は、複雑なフィードバック・システムを構築しようと試みる代わりに、フィルタリング機構を適用し、このフィルタリング機構には、プールごとの実行時間上限、プール数、およびプールごとのスレッド数を変更することなしに、実行時間および待機時間の2つまたはそれ以上のスナップショットを取ることが含まれる。これらのスナップショットから集められたデータは、調整とは無関係に変動する要求、すなわち通常の変動をする要求を検出する試みにおいて比較される。要求が変動しない場合、このプロセスで「フィルタリング」することができる。(すなわち、要求がその標準偏差内にある場合は、この要求に関して性能を向上させるためにシステムを調整しようとする試みは有用でない可能性がある。)好ましくは、フィルタリング機構は統計的方法を適用し、要求タイプが変動したかどうかを判別する基準として、要求タイプごとの標準偏差を使用する。その後、調整変更なしで標準偏差が比較的大きい実行時間パターンを有するいずれの要求タイプも、通常変動要求タイプとして処理することができる。たとえば、1つまたは複数の要求タイプに関する実行時間データは、調整変更が実施されなかったサンプリング間隔に続いて分析することができる。これらの各要求タイプに関する標準偏差は、この「変更なし」間隔に関して計算することができる。その間隔中に調整変更がアクティブであった他の間隔中に集められたデータは、調整変更が存在する要求タイプに関して標準偏差を決定する場合と同じ方法で分析することができる。変化なし間隔中の特定要求タイプに関する標準偏差と、調整変更間隔中のその標準偏差とを比較することによって、この要求タイプの実行時間に与える調整変更の影響に関して予測を立てることができる。(このプロセスでは、通常の変動ではないと判定された要求タイプに焦点を当てることが有用な場合がある。)
変動は内部競合ならびに外部待機時間(幅広く変動する可能性がある)によって生じる場合があることに留意されたい。多くの場合、これらの問題を提示する要求に関してスレッド・プール・サイズに制約を与えることで、全体のスループットを助けることができる。したがって、標準偏差は、要求タイプの実行時間が変動しているかどうかの指示として使用するだけでなく、プール・サイズまたはプール数の変更の有効性に関する指示としても使用することができる。
これらすべての要素を考慮することにより、実行時間および待機/待ち行列時間の追跡に基づいて、複数のスレッド・プールに作業を効果的に分配するための、自己調整型および高スループットの機構を構築することができる。本明細書に開示された技法は、作業負荷全体にわたって動的にバランスをとることができるようにし、さらに、作業負荷が経時的に特徴を変更しながら、依然として最適なスループットおよび応答時間を達成し続けることもできるようにするものである。
次に図1を参照すると、本明細書に開示されたように動作するシステム100の抽象図が示されている。作業要求105(たとえばインバウンド・クライアント要求)がシステムに入ると、好ましい実施形態に従って、こうした要求それぞれについて待機待ち行列要素(「WQE」)110が作成される。WQEは、要求が処理されるときにシステムを「通過するフロー」としてみなすことが可能であり、要求およびその現在の処理に関係する情報を集めるために使用される。オブジェクト指向のプログラミング条件では、WQEは好ましくはインバウンド要求のための「ラッパー(wrapper)」として実施される。各ラッパーは、要求のタイプなどの、それに関連付けられた要求を識別するための情報を含む。この識別情報は、インバウンド要求を特定のスレッド・プールに向けるためにそれらを分類する際に使用される、あらかじめ格納された履歴統計の位置を突き止めるために使用することができることから、「分類キー」とも呼ばれる場合がある。この分類キーに加えて、WQEは、要求の現在の実行時間および現在の待ち行列時間も格納する。好ましいことに、WQEは、この要求のタイプに関する分類データへの参照も保持しており、その結果、WQEに格納された分類キーを使用して分類データを取り出すことができる。好ましい実施形態では、この分類データは、好ましくは移動平均として格納される実行時間、好ましくは移動平均として格納される待ち行列時間、およびオプションで、要求タイプの履歴実行時間および待ち行列時間の値に関する標準偏差値を含む。好ましくは、これらの標準偏差値も移動値である。WQEと共に分類データを格納することによって、(要素155および160を参照してより詳細に説明するように)要求の現在の実行時間および待機時間が履歴統計に繰り込まれると、統計計算スレッドのより効率的なオペレーションが可能になる。移動平均および移動標準偏差値、すなわちそれぞれの新しい実行で更新される値を使用することによって、本発明の実施形態は、実行時間および/または待ち行列時間における過去の異常の影響を弱める。
インバウンド要求(そのWQEと共に)は、分類オペレーション115に入力される。この分類には、この要求をどのスレッド・プールに割り当てるべきかを決定することが含まれる。好ましい実施形態では、この要求タイプに関するあらかじめ計算された分類データ(すなわち履歴統計)を使用して、このタイプ(あるいは、ワイルドカードまたは同様の突合せ方法がサポートされている場合は同様のタイプ)を有する要求の平均実行時間が決定される。平均実行時間を使用して、この要求に似た要求、またはこの要求と挙動が同様の要求を処理するプールを識別することができる。したがって、実行時間の長い要求が、普通であれば実行時間の短い要求をブロックするという、従来技術の問題が回避される。
代替の実施形態では、要求タイプを分類キーとして使用するのではなく、追加または異なる情報をインデックスとして使用して、分類オペレーション115中に適切な履歴統計の位置を突き止めることができる。たとえば、要求タイプは、それらのパラメータの入力値(およびオプションでパラメータ名)を使用することによってさらに制限することが可能であり、この要求タイプとパラメータとの組合せを、(好ましくは、このより粗いレベルでも記録される)分類データのインデックス付けに使用することができる。Uniform Resource Locator(「URL」)のUniform Resource Identifier(「URI」)部分が使用可能であり、URIと共にパラメータ名/値も使用可能である。また、Web環境では「要求タイプ」が要求の有用なカテゴリ分類であるが、他の環境では他の情報が適切な可能性のあることにも留意されたい。たとえば、エンタプライズJavaBeans(登録商標)環境では、要求名の代わりに方法名(それらのクラスまたは配布名を含む)を使用することができる。方法名と共に、所望であれば、他の修飾子としてパラメータ名/値を使用することができる。(「エンタプライズJavaBeans」は、Sun Microsystems, Incの登録商標である。)したがって本明細書では、限定ではなく例示のために、「要求タイプ」に言及している。
次に図2を参照し、分類オペレーション115についてより詳細に説明する。ブロック200では、新しいインバウンド要求が入力待ち行列から受け取られる。ブロック205はこの要求を分析して、その分類キー(またはより一般的には、その識別情報)を決定する。本発明の特定の実施が、インバウンド要求の中で分類キーの位置を突き止める方法は、要求タイプ、または要求タイプにパラメータ値などを加えたものが、その特定の環境において要求を分類する際に関心の対象であるかどうかに依存する。分類キーが決定されると、これがマッピング・テーブルまたは履歴統計が記録された他のリポジトリのインデックスとして使用される(ブロック210)。
ブロック215は、この分類キーについて、以前に記録された分類データ(および具体的には、平均実行時間)の位置が突き止められたかどうかをチェックする。突き止められなかった場合、このインバウンド要求は「新しく着信した」要求タイプであるとみなされる。(要求タイプはこのシステムによって以前に処理されたが、最後の処理に関する統計データがすでに古くなってしまった可能性があることは、明らかであろう。好ましくは、実施特有の「妥当な」レベルで、履歴統計データに消費された記憶域量を保持するために、最後に使用された、すなわち「LRU」方法が使用される。)ブロック220および225は、新しく着信した要求タイプに対して追加の処理を実行する。ブロック220の処理には、この新しい要求タイプの統計を格納するために、分類データ内に新しいエントリを作成することが含まれ、この新しいエントリには現在の要求の分類キーでインデックス付けされる。次にブロック225は、好ましくは、平均実行時間をマイナス1(「−1」)などの特殊値に設定することによって、この新しいエントリを初期設定する。この特殊値は、図3を参照しながらさらに論じるように、プール割当てプロセスで検出される。(あるいは、値が単にゼロに設定される場合がある。)
要求の統計データの位置を突き止めた後(すなわち、ブロック215が肯定的な結果を有する場合)、または新しい統計エントリを作成および初期設定した後(ブロック215が否定的な結果を有する場合)、制御はブロック230に達し、現在のインバウンド要求をどのプールに割り当てるべきかを決定し、その割当てを実行する、プール割当てプロセスを呼び出す。このプロセスは、図3に詳細に記載されている。現在のインバウンド要求の処理を完了すると、制御をブロック200に戻すことによって、図2の論理は後続の要求に対して繰り返し実行される。
図3は、好ましい実施形態が、図2のブロック230から呼び出されたプール割当てプロセスをどのように実施できるかについて、さらに詳細に示した図である。このプロセスは、図中で「poolNdx」と呼ばれるプール・カウンタまたはインデックスを初期設定することによって始まる(ブロック300)。このpoolNdx値は、プール・セットの中をループして、現在のインバウンド要求が割り当てられるべきプールをチェックするために使用される。プールは、段々に実行時間がより長い作業へと受け入れていくため、最も実行時間の長い作業が最後のプールに割り当てられる。
ブロック305は、この現在のインバウンド要求の平均実行時間が、poolNdxの値でインデックス付けされたプールのターゲット上限より少ないかまたは等しいかどうかを調べるためにテストする。好ましいことに、要求の平均実行時間は、この要求のタイプに関連付けられた履歴統計から取得されるか、またはこの要求タイプの履歴統計が使用できない場合は、マイナス1に初期設定されている可能性がある(図2のブロック225)。後者の場合、ブロック305のテストは、図3の論理を介した第1の反復で真となり、好ましい実施形態は、新しく着信した要求タイプを、最も短い実行時間を有する要求を処理するプールに割り当てる。(新しく着信した要求タイプを処理するためのプールを選択する他の方法を、代替の実施形態で使用することができる。)
ブロック305のテストが肯定的な結果となった場合、この要求を処理するためのプールが見つかっている。したがって、制御はブロック320に移り、ここで作業要素はpoolNdxとインデックス付けされたプールに向けられる(すなわち、実行用に割り当てられる)。次に図3の処理は完了し、制御は図2の論理呼出しに戻る。そうでない場合、ブロック305のテストが否定的な結果になると、ブロック310でプール・インデックスは増分され、ブロック315は、ターゲット上限がチェック可能なプールがまだほかにもあるかどうかをチェックする。このチェック・プロセスは、poolNdx内の現在のプール・インデックス値とプールの合計数よりも1少ない値とを比較する。(変数「#pools」は、現在使用中のプール数を格納する。)この方法では、結果として常に、実行時間が最後のタイル値よりも長い要求タイプを、最後のプールに割り当てることになる。チェック可能なプールがまだある場合、制御はブロック305に戻り、ない場合、処理はブロック320に進んで、現在のインバウンド要求が現在の(この場合は最終の)プールに向けられることになる。
図3がどのように動作するかの一例として、実施が3つのプールを使用しており、これらのプールのタイル値(すなわち実行時間の上限)が10時間単位および20時間単位に設定されるものと想定する。図3に示された方法を使用すると、10またはそれより少ない時間単位を使用して実行するいずれの要求タイプも、新しく着信した要求タイプと共に第1のプールに向けられ、10より多く20を超えない時間単位を必要とする要求タイプは第2のプールに向けられる。20より多くの時間単位を必要とする要求タイプは、第3のプールに向けられる。インバウンド要求のタイプに関する履歴統計が、このタイプが平均して50の実行時間単位を必要とすることを示すものと想定する。poolNdx値が0の場合、ブロック305で50が10と比較され、このテストは否定的な結果となるため、ブロック310はpoolNdxを1に増分する。ブロック305を通過する次の反復では、50が20と比較されることになる。このテストも否定的な結果となり、ブロック310はpoolNdxを2に増分する。次にブロック315のテストでは、2(poolNdx値)を2(プール数よりも1少ない値)と比較することになり、テストは否定的な結果となるため、要求は第3のプール(すなわち、ゼロ・ベースのインデックス付けを使用してインデックス値2を有するプール)に向けられる。
図4は、好ましい実施形態が、異種の動的に変更可能な作業負荷の実行時間および待機時間の特徴を分析することによって、タイル値またはプールごとの実行時間の上限をどのように決定するかを示す論理を提供するものである。このプロセスは、本明細書では、分配計算またはプール・ターゲット計算プロセスと呼ばれる。好ましくは、図4の論理は、図1の要素160を参照しながら以下で説明するように、上限を改定するために定期的に呼び出される。
ブロック400は、現在の分類の集まり(すなわち履歴統計の集まり)を、それらの平均実行時間によってソートする。前述のように、好ましくはこの平均実行時間値は、いくつかの最近の間隔全体にわたる移動平均を表す。この方法では、過去に発生した問題状態または他の異常(結果的に過度に長い実行時間を生じさせたタイムアウト状況、または異常に短い実行時間を発生させた例外条件など)が、将来の決定を曲げることはない。好ましい実施形態は、実行時間を配列内にコピーし、この配列をソートする。(このアレイの記憶域がいったん割り振られると、好ましいことに、アレイ・サイズを増やすために再割振りが必要とならない限り、図4の後続の反復についてもこれが維持される。)
ブロック405は、値「etas」(「実行時間アレイ・サイズ(execution time array size)」を表す)を、このソートされた実行時間の集まりのサイズに設定する。次にこの「eats」値は、プールのセット間で実行時間が適切に分配されるように、どれだけの実行時間があるかのカウンタとして機能する。ブロック410は、プール・インデックス値poolNdxをゼロに初期設定する。
ブロック415では、ターゲット上限を割り当てる必要のあるプールがまだほかにもあるかどうかを調べるためにテストが実行される。このチェック・プロセスは、poolNdx内の現在のプール・インデックス値とプールの合計数よりも1少ない値とを比較する(この合計数は変数「#pools」に格納されている)。この方法は、結果的に、実行時間が最後の上限よりも長いすべての要求タイプが最後のプールに向けられるように(図3を参照しながら論じたように)、そこにあるプールよりも1つ少ない上限を割り当てることになる。ブロック415のテストが肯定的な結果になった場合、処理はブロック420に進み、否定的な結果になった場合は、割り当てられる上限がないため、制御は論理呼出しに戻る。
ブロック420では、現在のプール(すなわち、poolNdxとインデックス付けされたプール)に向けられる実行時間の上限が計算されて割り当てられる。好ましい実施形態では、これには、使用可能なプール全体にわたって実行時間統計(および、それらの関連付けられた要求タイプ)の合計数を等しく分配することが含まれる。したがって、ソートされた実行時間から「N番目」の要素が突き止められ、その要素からの実行時間が、現在のプールの上限(図中では「ターゲット」属性と呼ばれる)として割り当てられる。N番目の要素は、ブロック420に示されるように、第1に、ソートされたアレイ内にある要素の総数(値「etas」で表される)を使用可能なプール数(#pools内にある)で割り、次にこれにpoolNdx値+1を掛けて、最後にその値から1を引くことで決定される。
上限を設定した後、ブロック425はプール・インデックス値を増分し、割り当てられる上限がほかにもあるかどうかを判別するために、制御をブロック415に戻す。
図4の論理がどのように動作するかの一例として、現在の集まりに12の分類があるものと想定する。(実際には、何百、何千という分類のある可能性があることは明らかであろう。)さらに、4つの使用可能なプールがあると想定する。第1の反復では、ブロック420での処理により、プール(0)の上限が計算される。この例で「etas」の値は12であるため、(etas/#pools)は12/4、すなわち3である。この値に1を掛けると3となり、さらに1を引くと、プール(0)の上限は、sortedExecTimes[2]から取得した実行時間である。その後の反復では、プール(1)の上限がsortedExecTimes[5]からの実行時間にセットされる、という具合になる。
図4に示された方法では、結果として上限を、最近観察された実行時間の分配に基づいた値に設定することになる。上限を割り当てなければならないプール数は、プール数が調整されるときに動的に変更可能であることに留意されたい。(プール数の調整方法に関する詳細な情報は、図5〜7の考察を参照されたい。)図4に示された論理は、プール数の変化に自動的に適合する。
次に、図1に示された処理全体の考察に戻ると、各インバウンド要求が115で分類され、次にこれが適切なスレッド・プール(すなわち、図2および3の処理を使用して識別されたスレッド・プール)に向けて送られる。要求は待機待ち行列に入り、スレッドが使用可能になるまで待機しなければならない。したがって、図1では、要求は「N」個の待機待ち行列120、125、130のうちの1つに向けて送られるように示されており、ここでは各待機待ち行列が、現在システム100で使用されているN個の論理スレッド・プール135、140、145のうちの1つに対応する。(システム100内のプール数が、その後の何らかの地点で増えるかまたは減った場合、それに応じて待機待ち行列の数も調整しなければならないことは明らかであろう。また、待機待ち行列のサイズは待ち行列に入っている要素の数と共に変化し、本明細書で開示された動的な調整は、待ち行列サイズを修正するためのものではない。)
何らかの地点で、待ち行列に入った要求は、そのために待ち行列に入ったスレッド・プールからのスレッドに割り当てられることになる。好ましい実施形態によれば、要求が待機待ち行列内で費やした時間は、そのWQE内に記録される。(要求が分類オペレーションを完了したときにスレッドが使用可能な場合、要求は待機待ち行列を迂回することも起こり得る。その場合、待機待ち行列はゼロとして記録される。ただし、こうした要求は実際には待ち行列に提出される可能性があり、待ち行列に入った状態でかなり短い時間を費やすだけとなる。本明細書の以下の考察では、実施は、分類されたすべての要求を待ち行列に送るものと想定する。)
図1は、待機待ち行列から「ラン可能(runnable)プール」135、140、145へと横切る、インバウンド要求を示す図である。これらのラン可能プールは、本明細書に記載された論理スレッド・プールに対応し、さらに図1に示されるように、これら論理プール内のスレッドは実際にはグローバル・スレッド・プール150内で定義される。好ましい実施形態では、ラン可能プールはいくつかの限定数の実行可能ラッパー・オブジェクトを含み(本発明をオブジェクト指向言語で実施する場合)、各ラッパー・オブジェクトは、論理スレッド・プールに割り当てられたスレッドのうちの1つを表す。(実行可能ラッパー・オブジェクトは、スレッドにインターフェース機構も提供する。)したがって、スレッド数と同様に、実行可能ラッパー・オブジェクトの数も1つのプール135、140、145から他のプールまでいろいろ変化する可能性がある。(特定のラン可能プール内では、実行可能ラッパー・オブジェクトの数は、本明細書に開示されたプール・サイズ調整オペレーションの実行により、変化する可能性がある。)したがって、インバウンド要求およびそのWQEは、その待機待ち行列に関連付けられたラン可能プール内の実行可能ラッパー・オブジェクトのうちの1つが使用可能になるまで、待機待ち行列内に残る。(実行可能ラッパー・オブジェクトの可用性は、定義上、スレッドが使用可能であることを暗に示す。)この方法では、実行可能ラッパー・オブジェクトは、プールごとのスレッド数に制限を課すための効率的かつ信頼できる方法を提供するが、依然としてスレッドが実際に定義された単一のグローバル・スレッド・プールを使用する。(単一のグローバル・スレッド・プールを使用すると、結果的に、別の物理スレッド・プールを維持するよりもかなりオーバヘッドが少なくなる。これは、プールあたりのスレッド数が変更される調整オペレーション中に特にあてはまり、好ましい実施形態は、別の物理スレッド・プールが使用された場合に実行されるように、スレッドを作成および破壊するのではなく、論理プール内で使用できる実行可能ラッパー・オブジェクトの数を変更することによって、単にある程度のスレッドを論理プールに割り振る。)
好ましくは、各スレッド・プール135、140、145のサイズは、そのプールに向けて送られるタイプの作業がどの程度同時に実行されるべきかに応じて変化する。オプションのプール・サイズ調整が実施される場合(図5、6、および8を参照しながら以下で説明するように)、プールのサイズは自己調整となる。たとえば、1つのプールがデータベース・アクセスを必要とする要求を処理している場合、および要求を最適に実行するためにデータベース・システムへの接続数が制約されていなければならない場合、そのプールのサイズは、その要求の性能を低下させることになるサイズを超えないように、それ自体で調整する傾向がある。
各要求は、ある程度の実行時間を費やし、その実行が完了すると、要求のスレッドがそのラン可能プールに戻され(すなわち、実行可能なラッパー・オブジェクトを戻すことまたは解放することによって)、要求のWQEはその実行時間を記録するために更新される。従来技術を使用して、クライアントによって要求されたコンテンツが戻される(図1には図示せず)。WQEは、統計処理のために待ち行列に入り(統計待ち行列155を参照)、その後、最終的に統計計算スレッドは、要素160で示されるように、WQEを待ち行列から外してそのデータを処理する。
本発明では、160で実行される処理が、待ち行列に入れられたWQEからの待機時間および実行時間を処理すること、最後に使用された(「LRU」)トリミング・プロセスを実行すること、および/またはプール・ターゲット計算を実行することを含む。統計計算スレッドは、好ましくは背景プロセスとして実行するように実施され、好ましくはタイマ駆動方式で呼び出される。好ましい実施形態では、時間間隔は構成可能であり、システム性能を低下させないような最低値(20秒など)を有する。
好ましい実施形態によれば、統計計算スレッドが実行中の場合、統計待ち行列上にエントリがあれば、それらのエントリは待ち行列から外されて処理される。他のオペレーションも、発生したタイムアウトに応じて実行可能である。好ましくは、統計計算スレッドを1回呼び出すごとにタイムアウトが1つだけ処理され、待ち行列155からの統計処理に基本設定が与えられる。(この待ち行列に入ってくる統計が分類を更新するため、分類が時宜を得た方法で実際の状態を表すように、即時に処理されなければならない。LRUおよびプール・ターゲット計算は集合体情報に依存するため、たびたび実行する必要はない。)
統計待ち行列を処理する場合、統計計算スレッドはエントリを待ち行列から外し、現在の実行時間および待機時間情報を含むように履歴統計を改定する。前述のように、好ましくは履歴統計への参照は、値が効率的な方法で容易に使用できるように、待ち行列に入ったWQE内で保持される。後者の場合、統計計算スレッドは、第1に、待ち行列から外されたエントリから識別情報(たとえば要求タイプ、および代替実施形態ではパラメータ値などの追加または異なる情報)を取得し、識別情報を、事前に計算された履歴統計にアクセスするための分類キーとして使用する。次に、履歴統計で維持されている待機時間および実行データは、待ち行列から外されたエントリからの情報を反映するように改訂され、標準偏差情報は、この情報が特定の実施で使用される場合には改訂することもできる。好ましくは、統計計算スレッドはイベント駆動型であり、入ってきた統計が受け取られると起動される。好ましくは、ウェイクアップ・イベントもタイムアウト時に起動される。(好ましくは、LRUおよびプール・ターゲット計算は、それらの関連付けられたタイマが満了すると無条件で実行される。)
LRUトリミング・プロセスおよびプール・ターゲット計算の処理を起動するために、異なるタイマ間隔を使用することができる。LRUトリミング・プロセスが起動されると、好ましくは最近使用されていなかった分類データが廃棄され、好ましくはそのデータ用に使用された記憶リソースが解放される。(たとえば、エンド・ユーザは異なるWebページに移動し、事前に受け取られたある要求タイプをサーバの現在の作業負荷とは無関係にすることができる。この場合、それらの要求タイプの統計を考慮することは、もはや有用ではない。さらに、統計はエンド・ユーザの集まりに関する集合情報を表し、これらユーザの一部は自分のセッションを終了している可能性がある。この場合、集められたデータの一部は、もはやシステムの現在の動作状態に関係していない可能性がある。)プール・ターゲット計算が起動されると、図4の処理(上記で説明)が呼び出される。これまでに説明した異なるタイプの処理に別々のスレッドを使用するのではなく、160で複数の目的に単一のスレッドを使用することで、オーバヘッドが最小限となり、分類データなどの共用リソースに関する競合も減少する。
情報が待ち行列から外されたWQEから抽出され、160で処理された後、WQEはその後使用するために解放リスト165に戻すことができる。(または、WQEに使用した記憶域を解放することができる。好ましい実施形態は、オーバヘッドを減らす試みで、WQEを再使用する。)図1の処理は、インバウンド要求ごとにこの方法で繰り返される。
図5は、本明細書で開示されたプール調整プロセスの実施形態で使用することのできる、状態の移行を示す状態図である。これらの移行は、図6〜8に示された論理と組み合わせて、プールの数および各プールのサイズを調整する場合の変更を分離するために使用することができる。
図5に示されるように、初期状態「S0」では、プール数またはプール・サイズには何の変更も行われていない。次に、プール数は次の状態「S1」で調整される。最後に、プール・サイズは状態「S2」で個々に調整することができる。好ましくは、1つの状態から別の状態への移行はタイマ駆動であり、その結果、システムはある程度の期間特定の状態のままであり、実行に与える状態の影響を記録および分析することができる。好ましい実施形態では、図6の論理(ブロック620が、次の状態移行が可能になる前に「スリープ」オペレーションを実施する)で示されるように、タイマは調整プロセスに組み込まれる。代替実施形態は、移行が、イベント駆動方式を使用するなどの他の方法で起動されるように設計することができる。(たとえばこの代替方法では、図8がすべてのプールについてプール・サイズの調整を完了すると、状態S2から状態S0への移行を起動することができる。)
代替実施形態では、状態S1およびS2の順序を反対にすることができる。他の実施形態では、プール数調整プロセスおよびプール・サイズ調整プロセスを呼び出すための技法が、状態移行図によって起動される必要はない。
図6〜8は、プール・サイズおよび/またはプール数を所与の作業負荷に調整するために使用することのできる論理の流れ図である。図6は、次の調整状態を(図5に示された状態図を参照しながら)取得することによって始まる(ブロック600)。次の状態が「変化なし」の場合(ブロック615)、制御はブロック620に移り、そうでない場合、処理はブロック625へ進む。
処理がブロック620に達すると、好ましくは「TUNING_SETTLE_TIME」として図中に示されている構成済みインターバル、すなわち、システムを定常状態に落ち着かせることができるだけの十分な時間に対して、スリープまたは遅延が実行される。次にブロック605は、現在の統計を取得し、それらを使用して基準線を設定した後、ブロック600に戻ることによって次の調整オペレーションが実行される。
制御がブロック625に移ると、次の調整状態がプール数を調整するためのものであるかどうかを調べるテストが行われる。そうであれば、図7でより詳細に示されるように、ブロック630でプール数調整プロセスが実行される。そのプロセスが完了すると、次に制御はブロック620に移る。
ブロック625のテストが否定的な結果になると、次にブロック635は、次の調整状態がプール・サイズを調整するためのものであるかどうかをチェックする。そうであれば、図8でより詳細に示されるように、ブロック640で、プール・サイズ調整プロセスが実行される。そのプロセスが完了すると、次に制御はブロック620に移る。
ブロック635のテストが否定的な結果になると、これはエラーである。このエラーは、ブロック610に示されるように、図6の調整プロセスをTUNING_SETTLE_TIMEインターバルの間スリープ状態にできるようにすることで対処することが可能であり、その後制御はブロック600に戻る。あるいは、調整プロセスが停止される場合がある(および、好ましくはこの場合、システム管理者にエラー・メッセージが表示される)。
次に図6の論理が繰り返され、プール調整プロセスは反復的に実行される。
図7の論理は、プール数が調整されるときに図6のブロック630から呼び出される。ブロック700は、明白な変更が必要かどうかをチェックする。たとえば、分類データ内にある別個のエントリよりも多くのプールがあるものと想定する。この場合、様々なタイルの上限を2倍にすることができるか、または単に、マッピング要求タイプよりも多くのプールがあるようにすることができる。これは、首尾よく調整され適切に実行しているシステムでは発生するべきではないが、このタイプのエラーが発生する場合がある。一般的な意味では、ブロック700は、このタイプの明らかな問題の「すべての状況に対応できるもの」とみなすことができる。したがって、このテストが肯定的な値になる場合は、制御は、プール数調整の計算を実行する代わりに直接ブロック705に移り、変更が実行される。次に制御は図6の論理呼出しに戻る(システムは、この変更に続いて定常状態に落ち着くための時間を有することになる)。
明白な変更が必要でない場合、ブロック710で、システムの現在の作業負荷によって実行されている要求タイプの現在の統計が獲得される。好ましくは、これには、実行時間および待機時間の情報(および、オプションで標準偏差情報)が更新された、分類データの現在のスナップショットを入手することが含まれる。追加のプールが追加される(ブロック715)。
次にブロック720は、「SETTLE_TIME」と呼ばれる時間間隔中、スリープまたは待機プロセスを実施し、このプール数の変更がインバウンド要求の実行時間および待機時間(ならびに、オプションで標準偏差)にどのように影響を与えたかに関する情報を反映するように、分類データを更新できるようにする。好ましくは、このSETTLE_TIME値は構成可能であり、図6で使用されるTUNING_SETTLE_TIME値と同一かまたは異なる場合がある。好ましくは、SETTLE_TIME値は、図4の分配計算プロセスがスリープ状態である時間間隔よりも長く、その結果、分配計算はSETTLE_TIMEスリープ中に自動的に起動されることになり、それによって、ブロック715で追加されたプールを反映するように、それ全体にわたって実行時間が分配されるプールの数が増える。あるいは分配計算を、ブロック720のスリープの前に明示的に呼び出すことができる。分配計算が動作すると、プールの上限値は改訂される。したがって、たとえばシステムが以前は4つのプールを使用していたが、現在5つのプールを使用しようとしている場合、分配計算は、実行時間を4つではなく5つのグループに分けることになる。
待機が完了すると、ブロック725は分類データのスナップショットを獲得し、ブロック730は、ブロック725からのスナップショットの統計がブロック710からのものよりも良いかどうか、すなわち、変更して良かったかどうかを調べるためのテストを行う。良かった場合、次にこの追加されたプールが保持され、制御は論理呼出し(ブロック735)に戻る。そうでなければ、追加されたプールがインバウンド要求の実行時間および待機時間を改善しなかった場合に、プールは除去される(ブロック775)。さらに好ましくは、各プールの上限がこの少ない方のプール数に基づくように、実行時間の分配が再度計算される。(ブロック715および720を参照しながら上記で述べたように、別法として、スリープ・オペレーションを実行する前に分配計算を明示的に呼び出してもよく、あるいは、スリープ・インターバルが分配計算インターバルよりも長い場合、新しい分配計算がスリープ中に自動的に発生することになる。他の別法として、ブロック715でプール数を変更する前に上限を保存してもよく、ブロック775に達したときに、これらの保存した値を単に復元することができる。)
ブロック770で開始される処理は、プール数を(増やすのではなく)減らすことが、実行時間および待機時間を改善するのかどうかを調べるように設計されている。ブロック770は、SETTLE_TIMEインターバル中スリープを実施し、これによってシステムは、追加されたプールの除去に続いて定常状態に戻ることができる。次にブロック765は、現在実行中の要求についての統計のスナップショットを獲得する。次にブロック760はプール数を減分し、好ましくは、減らされたプール数を反映するようにプールあたりの実行時間の上限が再計算される。次にブロック750で、他のスリープが実行される。(ブロック775を参照しながら述べたように、上限は、ブロック750のスリープ中に適切なスリープ・インターバルを選択するか、またはスリープの前の明示的な呼出しによって、再計算することができる。)このスリープ・インターバルが満了すると、ブロック740は新しいスナップショットを獲得し、ブロック745はこのスナップショットとブロック765で取得したものとを比較する。新しい統計の方が良い場合、システムは論理呼出しへ戻る(ブロック735)ことによって、減らされたプール数で続行する。そうでなければ、プールを除去した後、インバウンド要求の実行時間および待機時間が良くなかった場合、プールが再度追加され(ブロック755)、論理呼出しに戻る前に、より多いプール数を使用するためにスレッド・プールへの実行時間の分配が復元(または再計算)される。
図8の論理は、プール・サイズ調整が実行されているときに呼び出される。ブロック800は、変数「PoolCtr」(すなわち、プール・カウンタ・インデックス)を、図中では「NumPools」と示されている、現在アクティブな論理スレッド・プール数に設定する。第1にブロック805は、ゼロ・ベースのインデックス付けを使用するために、このプール・カウンタ・インデックスを減分し、次にブロック810は、インデックスがゼロより大きいかまたは等しいことを調べる。そうでなければ、プール・サイズ調整オペレーションはすべてのプールについて試行したことになり、図6の論理呼出しに戻る(ブロック815)。
代替の実施形態では、各プール・サイズの調整を試みる必要はない。たとえば、現在いくつのプールを使用しているかに関係なく、反復カウンタを使用して、図8の論理を通る反復回数を制限することができる。他の代替実施形態では、プール・サイズ調整を、最上位の番号ではなく最下位の番号が付けられたプールから開始することができる。当分野の通常の技術者であれば、代替方法を提供するために図8の論理がどのように修正できるか、およびこうした方法が本発明の範囲内であることが明らかになろう。
プール・カウンタ・インデックス値が、評価するプールがまだほかにもあることを示す場合、制御はブロック820に達し、プール内のスレッド数を減分するために「現在の調整量」が負の値に設定される。好ましくは、構成可能値(図中では「POOL_DELTA」と示される)が調整量として使用される。この値は、パーセンテージ、または無名数(単にスレッド数を1つずつ変更していくなど)として表すことができる。特定の実施でどの方法が最も有利であるかは、スレッド・プールの相対的サイズなどの要素に依存し、どちらの方法も本発明の範囲内である。
図8に示された方法は、最も長い実行要求を有するプールを第1に調整し、次に、最も短い実行要求を有するプールに向かって後進することに留意されたい。通常は、最も長い実行要求を有するプールが、最も多くの特典をプール・サイズ調整から得るものと考えられる。
ブロック825は、このプール(すなわち、プール・カウンタによってインデックス付けされたプール)からのスレッドによって現在処理されている要求タイプについて、実行統計のスナップショットが取得されることを示す。こうしたスナップショットに関する詳細は、上記のブロック710の考察を参照されたい。(ブロック825では、好ましい実施形態では統計のサブセットが取得され、現在のプールからのスレッドによって処理されている要求タイプのみが関心の対象であることに留意されたい。あるいは、作業負荷全体の統計を使用することができる。)ブロック830は、これらの要求タイプが、プール・サイズ調整手続きの持続期間中、このプールに結び付けられていることを示す。次にブロック835は、このプールのサイズを調整し、POOL_DELTAにパーセンテージを使用する場合は、そのプールに割り当てられたスレッド数をPOOL_DELTAパーセント値だけ減らすことが含まれる。(プール内のスレッド数を減らすかまたは増やす場合、プールあたりの実行時間に使用される上限値を改訂する必要はないことに留意されたい。ただしこれは、背景で実行するために分配計算を続行する場合は、必然的に発生する可能性がある。新しい要求タイプおよびLRU処理によって廃棄されている要求タイプは、プール・サイズ調整インターバル中に、ターゲット時間に影響を与える可能性がある。)
次にブロック840は、「POOL_ADJUSTMENT_INTERVAL」と呼ばれるタイマ・インターバルに対してスリープまたは待機プロセスを実施し、これによってシステムは、一定時間、現在のプールの新しく変更されたサイズの下で動作できるようになる。好ましくは、このPOOL_ADJUSTMENT_INTERVAL値は構成可能であり、図7で使用されたSETTLE_TIME値と同一かまたは異なる場合がある。待機が完了すると、ブロック825を参照しながら上記で述べたように、ブロック845はこのプールのスレッドによって実行されている要求タイプのスナップショットを獲得し、ブロック850は、ブロック845からの統計がブロック825からのものよりも良いかどうか、すなわち、変更して良かったかどうかを調べるためのテストを行う。良かった場合、次にこの減分されたプール・サイズが維持され、調整するプールがほかにあるかどうかを判定するために制御はブロック805に戻る。
そうでなければ、減分されたプール・サイズがインバウンド要求の実行時間および待機時間を改善しなかった(すなわち、ブロック850の結果が否定的であった)場合に、プール・サイズはその前のサイズに復元される(ブロック855)。ブロック860から始まる処理は、このプールのサイズを減らすのではなく増やすことによって、実行時間および待機時間が改善されるのかどうかを調べるように設計されている。ブロック860は、POOL_ADJUSTMENT_INTERVAL中にスリープを実施し、これによってシステムは、プール・サイズの復元に続いて定常状態に戻ることができる。
スリープ・インターバルが満了した後、ブロック865は、プール・サイズをPOOL_DELTAパーセンテージだけ増やすように現在の調整量を設定する。次にブロック870は、このスレッド・プール内のスレッドによって処理されている現在実行中の要求についての統計のスナップショットを獲得する。ブロック875に示されているように、要求タイプはこの手続きに関してこのプールに結び付けられているため、追加のスレッドがこれらの要求の処理に与える影響を評価することができる。次にブロック880は、このプールのプール・サイズを(正の)調整量で調整し、その結果プールは、より多くのスレッドを有することになる。(代替の実施形態では、パーセンテージを増やすのではなく、単なる増分方法を使用することができる。この代替方法では、好ましくは、スレッド・プール・サイズを調整する場合にスレッド数が1つだけ増やされるが、本発明の範囲を逸脱することなく他の増分も使用することができる。)
次に、ブロック885で他のスリープが実行される。このスリープ・インターバルが満了すると、ブロック890は新しいスナップショットを獲得し、ブロック895はこのスナップショットとブロック870で入手したものとを比較する。新しい統計の方が良ければ、システムは増やされたスレッド数で続行して制御をブロック805に戻し、ここで、調整するスレッド・プールがほかにもあるかどうかを調べるテストが行われる。そうでなければ、プール・サイズを増やした後でインバウンド要求の実行時間および待機時間が良くなかった(すなわち、ブロック895で否定的な結果)場合、プール・サイズは復元される(ブロック900)。次に他のスリープが開始され(ブロック905)、その後制御はブロック805に戻る。
従来技術の技法を使用して、何らかの理由でスレッド・プールに制約を与えることが、システム性能にとって有益となるかどうかを実験的に判別することができる。たとえば、データベース・アクセスを必要とする要求を参照すると、一度にオープンすることのできる最大数のデータベース接続が存在する場合がある。スレッドが制限されていなければ、データベースにアクセスしようとする要求でプールは「閉塞状態」となる可能性がある。このシナリオでスレッド・プールを制限すれば目的は果たせるが、望ましくない副作用は、どんなデータベース・アクセスもまったく必要としない可能性のあるシステム内の他の要求にも影響を与えてしまうことである。本明細書に開示された自己調整型の動的プロセスは、システム管理者の介入なしに、この種の影響を自動的に取り除く。
これまで実証してきたように、本発明は、作業負荷の応答時間特徴(および具体的には、その応答時間の実行時間および待機時間構成要素)に基づいて、実行リソースのセット全体にわたって作業負荷をプログラムに基づいて分配するための、有利な技法を提供する。これにより、マルチスレッド・サーバ全体の性能が向上し、エンド・ユーザは、多くの要求の応答時間が減少することによって恩恵を受けることができる。このプログラムに基づいた分配は、本明細書で開示されたプール調整技法とは無関係に使用することが可能であり、プール数および/またはそれらプールのサイズがたとえ固定されたまま(少なくとも一時的に)であっても、性能の向上を実現することができる。あるいは、いずれかまたは両方のプール調整技法が同様に実施可能であり、他の性能の向上を提供すると予測される。開示された技法は、入ってくる様々な作業負荷タイプで有利に使用することができる。好ましい実施形態について、特定のデータ・タイプを使用したインバウンド要求の分類を参照しながら説明してきたが、これは例示を目的とするものであって、限定的なものではない。一般に、メッセージ待ち行列作業負荷は、メッセージ・タイプおよび/またはメッセージに含まれるデータ(メッセージの処理宛先を含むがこれに限定されるものではなく、たとえば処理宛先は、インバウンド作業の第1のレベルのハンドラを定義し、パラメータは、待ち行列に入れられたメッセージによって使用されるコード・パスおよびリソースが異なる追加の論理を駆動することができる)によって分類することができる。
本発明は、ビジネスを実行する方法としても提供することができる。たとえば、サービスが顧客に提供され、それによって顧客のクライアント/サーバ・ネットワーク・トラフィックの動作特徴が監視され、実行リソースへの調整が観察に基づきプログラムに基づいて実行される。これまでに述べてきた技法は、このサービスを実行するためのソフトウェアを実施する際に使用可能である。このサービスは、利用回数制課金、毎月または他の定期的な課金などの、様々な収益モデルの下で提供することができる。
当分野の技術者であれば理解されるように、本発明の実施形態は、方法、システム、またはコンピュータ・プログラムとして提供することができる。したがって、本発明は、全体的なハードウェア実施、全体的なソフトウェア実施、またはソフトウェア面とハードウェア面を組み合わせた実施の形を取ることができる。さらに本発明は、コンピュータ使用可能プログラム・コードを内部で実施する1つまたは複数のコンピュータ使用可能記憶媒体(ディスク記憶装置、CD−ROM、光記憶装置などを含むが、これらに限定されるものではない)上で実施される、コンピュータ・プログラム内で実施することができる。
以上、本発明について、流れ図、および/または、本発明の実施形態に従った方法、装置(システム)、およびコンピュータ・プログラムの構成図を参照しながら説明してきた。流れ図および/または構成図の各ブロック、ならびに流れ図および/または構成図のブロックの組合せは、コンピュータ/プログラム命令によって実施可能であることを理解されよう。これらのコンピュータ・プログラム命令は、汎用コンピュータ、特定用途向けコンピュータ、埋込み型プロセッサ、または他のプログラム可能データ処理装置のプロセッサに、マシンを生成するために提供することが可能であり、その結果、命令(コンピュータまたは他のプログラム可能データ処理装置のプロセッサを介して実行する)は、流れ図および/または構成図のブロックに指定された機能を実施するための手段を作成する。
これらのコンピュータ・プログラム命令は、1つまたは複数のコンピュータ読取り可能メモリ内に格納することも可能であり、ここではこうしたメモリがそれぞれ、コンピュータまたは他のプログラム可能データ処理装置に対して、特定の方法で機能するように命令することが可能であり、その結果、コンピュータ読取り可能メモリ内に格納された命令は、流れ図および/または構成図のブロックに指定された機能を実施する命令手段を含む製品を生成する。
コンピュータ・プログラム命令は、デバイス上で実行する命令が、流れ図および/または構成図のブロック内に指定された機能を実施するためのステップを提供するように、こうした各デバイス上でコンピュータ実施プロセスを生成するために、コンピュータまたは他のプログラム可能装置上で一連の動作ステップを実行させるように、1つまたは複数のコンピュータ、あるいは他のプログラム可能データ処理装置上にロードすることも可能である。
以上、本発明の好ましい実施形態について説明してきたが、当分野の技術者が基本的な発明の概念を習得すれば、これらの実施形態の追加の変形形態および修正形態も思いつくであろう。したがって、添付の特許請求の範囲は、好ましい実施形態ならびに本発明の精神および範囲内に含まれるすべてのこうした変形形態および修正形態を含むものと解釈されるものであることが意図される。
まとめとして、本発明の構成に関して以下の事項を開示する。
(1) サーバのリソース全体にわたってプログラムに基づいて作業負荷を分配する方法であって、
使用可能なスレッド・プール数を決定するステップと、
サーバ上の作業負荷の履歴統計から実行時間を取得するステップと、
取得された前記実行時間を、前記使用可能なスレッド・プール数全体にわたって、プログラムに基づいて分配するステップとを含む方法。
(2) 前記プログラムに基づいて分配するステップは、
前記実行時間をソートするステップと、
前記ソートされた実行時間を前記使用可能なスレッド・プール数全体にわたって割り振るステップとをさらに含む、請求項1に記載の方法。
(3) 前記ソートされた実行時間は前記使用可能なスレッド・プール数全体に均一に割り振られる、請求項2に記載の方法。
(4) 前記ソートされた実行時間の総数を決定するステップをさらに含み、前記割振りステップは、
ソートされた実行時間の前記総数を前記使用可能なスレッド・プール数で割り値「N」を見つけるステップと、
索引として「N」の整数倍を使用してアクセスされるときの前記ソートされた実行時間に従って、使用可能な各スレッド・プールの実行時間についての上限を割り当てるステップとをさらに含む、請求項2に記載の方法。
(5) 実行時に、インバウンド要求をサーバで受け取るステップと、
前記プログラムに基づいて分配された実行時間に従って、前記インバウンド要求を、前記使用可能なスレッド・プールに割り当てるステップとをさらに含む、請求項1に記載の方法。
(6) 前記インバウンド要求が前記サーバで実行されるときの実行時間を追跡するステップと、
前記追跡された実行時間を反映するように、前記サーバ上の作業負荷の前記実行時間を改訂するステップとをさらに含む、請求項5に記載の方法。
(7) 前記プログラムに基づいた分配を、改訂された前記実行時間を反映するように定期的に再計算するステップをさらに含む、請求項6に記載の方法。
(8) ソートされた実行時間は移動平均実行時間である、請求項1に記載の方法。
(9) 前記実行時間は要求タイプごとに維持される、請求項1に記載の方法。
(10) 前記実行時間は要求タイプおよびパラメータ値ごとに維持される、請求項1に記載の方法。
(11) 前記実行時間は方法名ごとに維持される、請求項1に記載の方法。
(12) 前記実行時間は方法名およびパラメータ値ごとに維持される、請求項1に記載の方法。
(13) 前記実行時間は方法名ならびにパラメータ名およびパラメータ値ごとに維持される、請求項1に記載の方法。
(14) 前記実行時間はUniform Resource Identifier(「URI」)名およびパラメータ値ごとに維持される、請求項1に記載の方法。
(15) 前記実行時間は処理宛先ごとに維持される、請求項1に記載の方法。
(16) 前記サーバでインバウンド要求を受け取るステップと、
前記受け取った要求の分類キーを決定するステップと、
前記決定された分類キーを使用して、前記受け取った要求の平均実行時間を突き止めるステップと、
前記突き止められた平均実行時間と前記割り当てられたそれぞれの上限とを、前記比較された割り当てられた上限が前記突き止められた平均実行時間よりも大きいかまたは等しくなるまで繰り返し比較することによって、前記受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止めるステップとをさらに含む、請求項4に記載の方法。
(17) 前記スレッド・プールは論理スレッド・プールである、請求項1に記載の方法。
(18) マルチスレッド・サーバ内のスレッド・プール全体にわたって、インバウンド要求をプログラムに基づいて分配するためのシステムであって、
使用可能なスレッド・プール数を決定するための手段と、
サーバ上の作業負荷の履歴統計から実行時間を取得するための手段と、
前記取得された実行時間を、前記使用可能なスレッド・プール数全体にわたって、プログラムに基づいて分配するための手段と、
実行時に、インバウンド要求を前記サーバで受け取るための手段と、
前記プログラムに基づいて分配された実行時間に従って、前記インバウンド要求を、前記使用可能なスレッド・プールに割り当てるための手段とを含むシステム。
(19) 前記プログラムに基づいて分配するための手段は、
前記実行時間をソートするための手段と、
前記ソートされた実行時間を前記使用可能なスレッド・プール数全体にわたって割り振るための手段とをさらに含む、請求項18に記載のシステム。
(20) 前記ソートされた実行時間の総数を決定するための手段をさらに含み、前記割り振るための手段は、
前記ソートされた実行時間の総数を前記使用可能なスレッド・プール数で割り値「N」を見つけるための手段と、
索引として「N」の整数倍を使用してアクセスされるときの前記ソートされた実行時間に従って、使用可能な各スレッド・プールの実行時間についての上限を割り当てるための手段とをさらに含む、請求項19に記載のシステム。
(21) 前記インバウンド要求が前記サーバで実行されるときの実行時間を追跡するための手段と、
前記追跡された実行時間を反映するように、前記サーバ上の前記作業負荷の前記実行時間を改訂するための手段とをさらに含む、請求項18に記載のシステム。
(22) 前記プログラムに基づいた分配を、改訂された前記実行時間を反映するように定期的に再計算するための手段をさらに含む、請求項21に記載のシステム。
(23) 前記ソートされた実行時間は移動平均実行時間である、請求項18に記載のシステム。
(24) 前記実行時間は要求タイプごとに維持される、請求項18に記載のシステム。
(25) 前記実行時間は方法名ごとに維持される、請求項18に記載のシステム。
(26) 前記実行時間はUniform Resource Identifier(「URI」)名ごとに維持される、請求項18に記載のシステム。
(27) 前記実行時間は処理宛先ごとに維持される、請求項18に記載のシステム。
(28) 前記上限を割り当てるための手段は、
前記受け取った要求の分類キーを決定するための手段と、
前記決定された分類キーを使用して、前記受け取った要求の平均実行時間を突き止めるための手段と、
前記突き止められた平均実行時間と前記割り当てられたそれぞれの上限とを、前記比較された割り当てられた上限が前記突き止められた平均実行時間よりも大きいかまたは等しくなるまで繰り返し比較することによって、前記受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止めるための手段とをさらに含む、請求項20に記載のシステム。
(29) サーバのリソース全体にわたって作業負荷をプログラムに基づいて分配するためのコンピュータ・プログラム製品であって、コンピュータ・プログラム製品は、コンピューティング環境内のコンピューティング・システムによって読取り可能な1つまたは複数のコンピュータ読取り可能媒体上で実施され、
使用可能なスレッド・プール数を決定するためのコンピュータ読取り可能プログラム・コード手段と、
サーバ上の作業負荷の履歴統計から実行時間を取得するためのコンピュータ読取り可能プログラム・コード手段と、
前記取得された実行時間を、前記使用可能なスレッド・プール数全体にわたって、プログラムに基づいて分配するためのコンピュータ読取り可能プログラム・コード手段とを含む、コンピュータ・プログラム製品。
(30) 前記プログラムに基づいて分配するためのコンピュータ読取り可能プログラム・コード手段は、
実行時間をソートするためのコンピュータ読取り可能プログラム・コード手段と、
前記ソートされた実行時間を前記使用可能なスレッド・プール数全体にわたって均一に割り振るためのコンピュータ読取り可能プログラム・コード手段とをさらに含む、請求項29に記載のコンピュータ・プログラム製品。
(31) 前記ソートされた実行時間の総数を決定するためのコンピュータ読取り可能プログラム・コード手段をさらに含み、割り振るためのコンピュータ読取り可能プログラム・コード手段は、
ソートされた実行時間の前記総数を前記使用可能なスレッド・プール数で割り値「N」を見つけるためのコンピュータ読取り可能プログラム・コード手段と、
索引として「N」の整数倍を使用してアクセスされるときの前記ソートされた実行時間に従って、使用可能な各スレッド・プールの実行時間についての上限を割り当てるためのコンピュータ読取り可能プログラム・コード手段とをさらに含む、請求項30に記載のコンピュータ・プログラム製品。
(32) 実行時に、インバウンド要求を前記サーバで受け取るためのコンピュータ読取り可能プログラム・コード手段と、
前記プログラムに基づいて分配された実行時間に従って、前記インバウンド要求を、使用可能なスレッド・プールに割り当てるためのコンピュータ読取り可能プログラム・コード手段とをさらに含む、請求項29に記載のコンピュータ・プログラム製品。
(33) 前記インバウンド要求が前記サーバで実行されるときの実行時間を追跡するためのコンピュータ読取り可能プログラム・コード手段と、
前記追跡された実行時間を反映するように、前記サーバ上の作業負荷の前記実行時間を改訂するためのコンピュータ読取り可能プログラム・コード手段とをさらに含む、請求項32に記載のコンピュータ・プログラム製品。
(34) 前記プログラムに基づいた分配を、改訂された前記実行時間を反映するように定期的に再計算するためのコンピュータ読取り可能プログラム・コード手段をさらに含む、請求項33に記載のコンピュータ・プログラム製品。
(35) 前記実行時間は要求タイプ、パラメータ名、およびパラメータ値ごとに維持される、請求項29に記載のコンピュータ・プログラム製品。
(36) 前記実行時間は方法名およびパラメータ値ごとに維持される、請求項29に記載のコンピュータ・プログラム製品。
(37) 前記実行時間はUniform Resource Identifier(「URI」)名およびパラメータ値ごとに維持される、請求項29に記載のコンピュータ・プログラム製品。
(38) 前記実行時間は処理宛先ごとに維持される、請求項29に記載のコンピュータ・プログラム製品。
(39) 前記サーバでインバウンド要求を受け取るためのコンピュータ読取り可能プログラム・コード手段と、
前記受け取った要求の分類キーを決定するためのコンピュータ読取り可能プログラム・コード手段と、
前記決定された分類キーを使用して、前記受け取った要求の平均実行時間を突き止めるためのコンピュータ読取り可能プログラム・コード手段と、
前記突き止められた平均実行時間と前記割り当てられたそれぞれの上限とを、前記比較された割り当てられた上限が前記突き止められた平均実行時間よりも大きいかまたは等しくなるまで繰り返し比較することによって、前記受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止めるためのコンピュータ読取り可能プログラム・コード手段とをさらに含む、請求項31に記載のコンピュータ・プログラム製品。
(40) サーバのリソース全体にわたって作業負荷をプログラムに基づいて分配することにより、ビジネスを実行する方法であって、
前記サーバでの作業負荷の動作特徴をプログラムに基づいて監視するステップと、
前記サーバのリソース全体にわたって前記作業負荷をプログラムに基づいて分配するステップとを含み、このステップは、
使用可能なスレッド・プール数を決定するステップと、
前記作業負荷の履歴統計から実行時間を取得するステップと、
前記取得された実行時間を、前記使用可能なスレッド・プール数全体にわたって、プログラムに基づいて分配するステップと、
実行時に、インバウンド要求を前記サーバで受け取るステップと、
前記プログラムに基づいて分配された実行時間に従って、前記インバウンド要求を、前記使用可能なスレッド・プールに割り当てるステップとをさらに含み、
さらに前記方法は、前記プログラムに基づいて監視するステップおよび前記プログラムに基づいて分配するステップとを実行するための料金を課金するステップをさらに含む方法。
本発明に従って動作するシステムの抽象図を示す図である。 本発明の好ましい実施形態がどの要求タイプをどのスレッド・プールに割り当てるべきかを決定できる方法を示す、流れ図である。 本発明の好ましい実施形態がどの要求タイプをどのスレッド・プールに割り当てるべきかを決定できる方法を示す、流れ図である。 本発明の好ましい実施形態がプールごとの実行時間の上限をどのように決定するかを示す、流れ図である。 本発明の実施形態で使用可能な状態の移行を示す状態図であり、これらの移行は、図6〜8に示された論理と組み合わせて使用することが可能である。 好ましい実施形態に従ってプールの数および各プールのサイズを調整する場合の変更を分離するための論理を示す図である。 好ましい実施形態に従ってプールの数を調整するための論理を示す図である。 好ましい実施形態に従って各プールのサイズを調整するための論理を示す図である。
符号の説明
105 作業要求
110 待機待ち行列要素
115 分類
120 待機待ち行列1
125 待機待ち行列2
130 待機待ち行列N
135 ラン可能プール
140 ラン可能プール
145 ラン可能プール
150 グローバル・スレッド・プール
155 統計待ち行列
160 統計/LRU/プール・ターゲット計算
165 解放リスト

Claims (34)

  1. サーバのリソース全体にわたってプログラムに基づいて作業負荷を分配する方法であって、
    使用可能な複数のスレッド・プールを用意するステップと、
    サーバ上の作業負荷の履歴統計から、前記サーバで処理された要求ごとの平均実行時間を複数取得するステップと、
    前記複数の平均実行時間に基づいて、前記使用可能な複数のスレッド・プールの各々に対し、割り当てられる要求の平均実行時間の異なる上限値を決定するステップとを含み
    前記平均実行時間の上限値は、前記サーバにおいて受信される要求を前記複数のスレッド・プールのうちいずれのスレッド・プールに割当てるかを決定するために使用される
    方法。
  2. 前記上限値を決定するステップは
    前記複数の平均実行時間を配列内にコピーするステップと
    前記配列をその値に従ってソートするステップと、
    前記配列の総数を前記使用可能な複数のスレッド・プール数で割り値「N」を見つけるステップと、
    索引として「N」の整数倍を使用してアクセスされる前記配列の値を、前記各スレッド・プールの平均実行時間の異なる上限値とするステップとを含む、請求項に記載の方法。
  3. 前記サーバにおいて受信される前記要求が前記サーバで実行されるときの実行時間を追跡するステップと、
    前記追跡された実行時間を反映するように、前記複数の平均実行時間を更新するステップとをさらに含む、
    請求項に記載の方法。
  4. 前記更新された前記複数の平均実行時間を反映するように、前記各スレッド・プールの前記平均実行時間の異なる上限値を定期的に再計算するステップをさらに含む、請求項に記載の方法。
  5. 前記サーバで処理された前記要求ごとの平均実行時間は、最近の所定間隔にわたって計算された、各要求の実行時間の移動平均値である、請求項1に記載の方法。
  6. 前記サーバで処理された要求はそのタイプによって識別され、前記複数の平均実行時間は前記要求タイプごとに取得される、請求項1に記載の方法。
  7. 前記サーバで処理された要求はそのタイプ及び当該要求に含まれるパラメータ値によって識別され、前記複数の平均実行時間は前記要求タイプおよび前記パラメータ値ごとに取得される、請求項1に記載の方法。
  8. 前記サーバで処理された要求は当該要求に基づいて呼び出される方法名によって識別され、前記複数の平均実行時間は方法名ごとに取得される、請求項1に記載の方法。
  9. 前記サーバで処理された要求は当該要求に基づいて呼び出される方法名及び当該方法に渡されるパラメータ値によって識別され、前記複数の平均実行時間は前記方法名および前記パラメータ値ごとに取得される、請求項1に記載の方法。
  10. 前記サーバで処理された要求は当該要求に基づいて呼び出される方法名、当該方法に渡されるパラメータ値および当該パラメータの名によって識別され、前記複数の平均実行時間は前記方法名、前記パラメータ名および前記パラメータ値ごとに取得される、請求項1に記載の方法。
  11. 前記サーバで処理された要求は当該要求に含まれるUniform Resource Identifier(「URI」)およびURIの一部としてのパラメータ値によって各々識別され、前記複数の平均実行時間は前記URIよび前記パラメータ値ごとに取得される、請求項1に記載の方法。
  12. 前記サーバで処理された要求はその処理宛先によって識別され、前記複数の平均実行時間は処理宛先ごとに取得される、請求項1に記載の方法。
  13. 前記サーバでインバウンド要求を受け取るステップと、
    前記受け取った要求の分類キーを決定するステップと、
    前記決定された分類キーを使用して、前記受け取った要求の平均実行時間を突き止めるステップと、
    前記突き止められた平均実行時間と前記決定された各スレッド・プールの平均実行時間の上限値とを、前記比較された平均実行時間の上限値が前記突き止められた平均実行時間よりも大きいかまたは等しくなるまで繰り返し比較することによって、前記受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止めるステップとをさらに含む、
    請求項に記載の方法。
  14. 前記スレッド・プールは論理スレッド・プールである、請求項1に記載の方法。
  15. マルチスレッド・サーバ内のスレッド・プール全体にわたって、インバウンド要求をプログラムに基づいて分配するためのシステムであって、
    使用可能な複数のスレッド・プール
    サーバ上の作業負荷の履歴統計から、前記サーバで処理された要求ごとの平均実行時間を複数取得するための手段と、
    前記複数の平均実行時間に基づいて、前記使用可能な複数のスレッド・プールの各々に対し、割り当てられる要求の平均実行時間の異なる上限値を決定するための手段と
    実行時に、インバウンド要求を前記サーバで受け取るための手段と、
    前記平均実行時間の上限値に基づいて、前記インバウンド要求を、前記使用可能なスレッド・プールいずれかに割り当てるための手段とを含むシステム。
  16. 前記上限値を決定するための手段は
    前記複数の平均実行時間を配列内にコピーする手段と
    前記配列をその値に従ってソートする手段と、
    前記配列の総数を前記使用可能な複数のスレッド・プール数で割り値「N」を見つけるための手段と、
    索引として「N」の整数倍を使用してアクセスされる前記配列の値を、前記各スレッド・プールの平均実行時間の異なる上限値とするための手段とを含む、請求項15に記載のシステム。
  17. 前記サーバにおいて受信される前記要求が前記サーバで実行されるときの実行時間を追跡するための手段と、
    前記追跡された実行時間を反映するように、前記複数の平均実行時間を更新するための手段とをさらに含む、請求項15に記載のシステム。
  18. 前記更新された前記複数の平均実行時間を反映するように、前記各スレッド・プールの前記平均実行時間の異なる上限値を定期的に再計算するための手段をさらに含む、請求項17に記載のシステム。
  19. 前記サーバで処理された前記要求ごとの平均実行時間は、最近の所定間隔にわたって計算された、各要求の実行時間の移動平均値である、請求項15に記載のシステム。
  20. 前記サーバで処理された要求はそのタイプによって識別され、前記複数の平均実行時間は前記要求タイプごとに取得される、請求項15に記載のシステム。
  21. 前記サーバで処理された要求は当該要求に基づいて呼び出される方法名によって識別され、前記複数の平均実行時間は方法名ごとに取得される、請求項15に記載のシステム。
  22. 前記サーバで処理された要求は当該要求に含まれるUniform Resource Identifier(「URI」)によって各々識別され、前記複数の平均実行時間は前記URIとに取得される、請求項15に記載のシステム。
  23. 前記サーバで処理された要求はその処理宛先によって識別され、前記複数の平均実行時間は処理宛先ごとに取得される、請求項15に記載のシステム。
  24. 前記り当てるための手段は、
    前記受け取った要求の分類キーを決定するための手段と、
    前記決定された分類キーを使用して、前記受け取った要求の平均実行時間を突き止めるための手段と、
    前記突き止められた平均実行時間と前記決定された各スレッド・プールの平均実行時間の上限値とを、前記比較された平均実行時間の上限値が前記突き止められた平均実行時間よりも大きいかまたは等しくなるまで繰り返し比較することによって、前記受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止めるための手段とをさらに含む、請求項15に記載のシステム。
  25. サーバのリソース全体にわたって作業負荷をプログラムに基づいて分配するためのコンピュータ・プログラムであって、コンピュータを
    使用可能な複数のスレッド・プールを用意する手段と、
    サーバ上の作業負荷の履歴統計から、前記サーバで処理された要求ごとの平均実行時間を複数取得する手段と、
    前記複数の平均実行時間に基づいて、前記使用可能な複数のスレッド・プールの各々に対し、割当てられる要求の平均実行時間の異なる上限値を決定する手段として機能させるためのコンピュータ・プログラムであって
    前記平均実行時間の上限値は、前記サーバにおいて受信される要求を前記複数のスレッド・プールのうちいずれのスレッド・プールに割当てるかを決定するために使用される
    コンピュータ・プログラ
  26. 前記上限値を決定する手段は
    前記複数の平均実行時間を配列内にコピーする手段と
    前記配列をその値に従ってソートする手段と、
    前記配列の総数を前記使用可能な複数のスレッド・プール数で割り値「N」を見つける手段と、
    索引として「N」の整数倍を使用してアクセスされる前記配列の値を、前記各スレッド・プールの実行時間の異なる上限値とする手段とを含む、請求項25に記載のコンピュータ・プログラ
  27. コンピュータを、さらに
    前記サーバにおいて受信される前記要求が前記サーバで実行されるときの実行時間を追跡する段と、
    前記追跡された実行時間を反映するように、前記複数の平均実行時間を更新する手段として機能させる、請求項25に記載のコンピュータ・プログラ
  28. コンピュータを、さらに
    前記更新された前記複数の平均実行時間を反映するように、前記各スレッド・プールの前記平均実行時間の異なる上限値を定期的に再計算する手段として機能させる、請求項25に記載のコンピュータ・プログラ
  29. 前記サーバで処理された要求はそのタイプ、当該要求に含まれるパラメータ名、およびパラメータ値によって識別され、前記複数の平均実行時間は前記要求タイプ、前記パラメータ名、および前記パラメータ値ごとに取得される、請求項25に記載のコンピュータ・プログラ
  30. 前記サーバで処理された要求は当該要求に基づいて呼び出される方法名および当該方法に渡されるパラメータ値によって識別され、前記複数の実行時間は前記方法名および前記パラメータ値ごとに取得される、請求項25に記載のコンピュータ・プログラ
  31. 前記サーバで処理された要求は当該要求に含まれるUniform Resource Identifier(「URI」)およびURIの一部としてのパラメータ値によって各々識別され、前記複数の平均実行時間は前記URIよび前記パラメータ値ごとに取得される、請求項25に記載のコンピュータ・プログラ
  32. 前記サーバで処理された要求は処理宛先によって識別され、前記複数の平均実行時間は前記処理宛先ごとに取得される、請求項25に記載のコンピュータ・プログラ
  33. コンピュータを、さらに
    前記サーバでインバウンド要求を受け取るための段と、
    前記受け取った要求の分類キーを決定するための段と、
    前記決定された分類キーを使用して、前記受け取った要求の平均実行時間を突き止めるための段と、
    前記突き止められた平均実行時間と前記決定された各スレッド・プールの平均実行時間の上限値とを、前記比較された平均実行時間の上限値が前記突き止められた平均実行時間よりも大きいかまたは等しくなるまで繰り返し比較することによって、前記受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止めるための手段として機能させる、請求項25に記載のコンピュータ・プログラ
  34. サーバのリソース全体にわたって作業負荷をプログラムに基づいて分配することにより、ビジネスを実行する方法であって、
    前記サーバでの作業負荷の動作特徴をプログラムに基づいて監視するステップと、
    前記サーバのリソース全体にわたって前記作業負荷をプログラムに基づいて分配するステップとを含み、当該分配するステップは、
    使用可能な複数のスレッド・プール数を決定するステップと、
    前記作業負荷の履歴統計から、前記サーバで処理された要求ごとの平均実行時間を複数取得するステップと、
    前記複数の平均実行時間に基づいて、前記使用可能な複数のスレッド・プールの各々に対し、割当てられる要求の平均実行時間の異なる上限値を決定するステップと
    実行時に、インバウンド要求を前記サーバで受け取るステップと、
    前記平均実行時間の上限値に基づい、前記インバウンド要求を、前記複数の使用可能なスレッド・プールのいずれかにに割り当てるステップとをみ、
    記方法は、前記プログラムに基づいて監視するステップおよび前記プログラムに基づいて分配するステップとを実行するための料金を課金するステップをさらに含む方法。
JP2003396290A 2002-12-31 2003-11-26 プログラムに基づいた応答時間ベースの作業負荷分配技法 Expired - Fee Related JP3817541B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/334,262 US7207043B2 (en) 2002-12-31 2002-12-31 Programmatic response-time based workload distribution techniques

Publications (2)

Publication Number Publication Date
JP2004213625A JP2004213625A (ja) 2004-07-29
JP3817541B2 true JP3817541B2 (ja) 2006-09-06

Family

ID=32710874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003396290A Expired - Fee Related JP3817541B2 (ja) 2002-12-31 2003-11-26 プログラムに基づいた応答時間ベースの作業負荷分配技法

Country Status (3)

Country Link
US (1) US7207043B2 (ja)
JP (1) JP3817541B2 (ja)
KR (1) KR100628821B1 (ja)

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7051070B2 (en) * 2000-12-18 2006-05-23 Timothy Tuttle Asynchronous messaging using a node specialization architecture in the dynamic routing network
US8505024B2 (en) 2000-12-18 2013-08-06 Shaw Parsing Llc Storing state in a dynamic content routing network
US7454425B2 (en) * 2003-07-01 2008-11-18 Oracle International Corporation System and method for assembling timing data in a multi-layer server environment
US7395527B2 (en) 2003-09-30 2008-07-01 International Business Machines Corporation Method and apparatus for counting instruction execution and data accesses
US8381037B2 (en) * 2003-10-09 2013-02-19 International Business Machines Corporation Method and system for autonomic execution path selection in an application
US7458078B2 (en) * 2003-11-06 2008-11-25 International Business Machines Corporation Apparatus and method for autonomic hardware assisted thread stack tracking
US7447710B2 (en) * 2003-12-11 2008-11-04 Sybase, Inc. Database system providing self-tuned parallel database recovery
US7448037B2 (en) * 2004-01-13 2008-11-04 International Business Machines Corporation Method and data processing system having dynamic profile-directed feedback at runtime
US7415705B2 (en) 2004-01-14 2008-08-19 International Business Machines Corporation Autonomic method and apparatus for hardware assist for patching code
US7895382B2 (en) 2004-01-14 2011-02-22 International Business Machines Corporation Method and apparatus for qualifying collection of performance monitoring events by types of interrupt when interrupt occurs
US7703101B2 (en) * 2004-02-13 2010-04-20 International Business Machines Corporation Autonomic workload classification using predictive assertion for wait queue and thread pool selection
US7987453B2 (en) * 2004-03-18 2011-07-26 International Business Machines Corporation Method and apparatus for determining computer program flows autonomically using hardware assisted thread stack tracking and cataloged symbolic data
US7574439B2 (en) * 2004-05-20 2009-08-11 International Business Machines Corporation Managing a nested request
US20050278381A1 (en) 2004-05-26 2005-12-15 Yixin Diao Method and apparatus for online sample interval determination
CN101189852B (zh) * 2004-08-17 2012-10-03 肖分析有限公司 用于上游故障检测和故障恢复的技术
WO2006023506A1 (en) * 2004-08-17 2006-03-02 Shaw Parsing Llc Modular event-driven processing
WO2006023459A1 (en) * 2004-08-17 2006-03-02 Shaw Parsing Llc Techniques for delivering personalized content with a real-time routing network
US7533139B2 (en) * 2004-09-27 2009-05-12 Microsoft Corporation Method and system for multithread processing of spreadsheet chain calculations
US7383470B2 (en) * 2004-09-30 2008-06-03 Microsoft Corporation Method, system, and apparatus for identifying unresponsive portions of a computer program
JP4791846B2 (ja) * 2005-02-21 2011-10-12 財団法人電力中央研究所 モバイルエージェント移動の高速化方法、モバイルエージェントの移動の高速化システム
DE102005008975A1 (de) * 2005-02-28 2006-08-31 Robert Bosch Gmbh Verfahren und Vorrichtung zur Überwachung einer Prozessausführung
US7908606B2 (en) * 2005-05-20 2011-03-15 Unisys Corporation Usage metering system
US20070239718A1 (en) * 2006-03-31 2007-10-11 Baxter Robert A Configuring communication systems based on performance metrics
US20070233693A1 (en) * 2006-03-31 2007-10-04 Baxter Robert A Configuring a communication protocol of an interactive media system
US20070245028A1 (en) * 2006-03-31 2007-10-18 Baxter Robert A Configuring content in an interactive media system
US8136114B1 (en) * 2006-04-21 2012-03-13 Sprint Communications Company L.P. Business process management system having dynamic task assignment
US20070266391A1 (en) * 2006-04-27 2007-11-15 Hoffman Philip M System and method for separating multi-workload processor utilization on a metered computer system
US8032821B2 (en) 2006-05-08 2011-10-04 Microsoft Corporation Multi-thread spreadsheet processing with dependency levels
US8799918B2 (en) * 2006-09-11 2014-08-05 Microsoft Corporation Dynamic network load balancing using roundtrip heuristic
KR101286700B1 (ko) 2006-11-06 2013-07-16 삼성전자주식회사 멀티 코어 프로세서 시스템에서 로드 밸런싱을 위한 장치및 방법
US8356284B2 (en) * 2006-12-28 2013-01-15 International Business Machines Corporation Threading model analysis system and method
US8219845B2 (en) * 2007-05-09 2012-07-10 Microsoft Corporation Timer service uses a single timer function to perform timing services for both relative and absolute timers
US8611378B2 (en) 2007-05-29 2013-12-17 Red Hat, Inc. Message handling multiplexer
US7921227B2 (en) * 2007-05-30 2011-04-05 Red Hat, Inc. Concurrent stack
US8505028B2 (en) * 2007-05-30 2013-08-06 Red Hat, Inc. Flow control protocol
US7992153B2 (en) * 2007-05-30 2011-08-02 Red Hat, Inc. Queuing for thread pools using number of bytes
US7733863B2 (en) * 2007-05-30 2010-06-08 Red Hat, Inc. Out of band messages
KR100883517B1 (ko) * 2007-06-13 2009-02-11 성균관대학교산학협력단 예측 기반 동적 쓰레드 풀 조정방법 및 이를 사용하는에이전트 플랫폼
KR100959898B1 (ko) 2007-12-27 2010-05-27 주식회사 케이티 인터넷 서비스를 위한 부하 분산형 스케줄링 구조를 가지는서비스 서버 및 그 서비스 방법
US20090217280A1 (en) * 2008-02-21 2009-08-27 Honeywell International Inc. Shared-Resource Time Partitioning in a Multi-Core System
US7783797B2 (en) * 2008-04-23 2010-08-24 Autodesk, Inc. Adaptive bandwidth distribution system for high-performance input/output devices with variable throughput
US8024615B2 (en) * 2008-04-28 2011-09-20 Microsoft Corporation Steady state computer testing
KR101572879B1 (ko) * 2009-04-29 2015-12-01 삼성전자주식회사 병렬 응용 프로그램을 동적으로 병렬처리 하는 시스템 및 방법
US8352953B2 (en) * 2009-12-03 2013-01-08 International Business Machines Corporation Dynamically provisioning virtual machines
US9378503B2 (en) * 2010-06-30 2016-06-28 Alcatel Lucent Methods of routing for networks with feedback
US8595732B2 (en) * 2010-11-15 2013-11-26 International Business Machines Corporation Reducing the response time of flexible highly data parallel task by assigning task sets using dynamic combined longest processing time scheme
US8954968B1 (en) * 2011-08-03 2015-02-10 Juniper Networks, Inc. Measuring by the kernel the amount of time a monitored thread spends in a queue in order to monitor scheduler delays in a computing device
US9092270B2 (en) 2012-09-25 2015-07-28 Oracle International Corporation Method of SOA performance tuning
KR101638797B1 (ko) * 2013-05-15 2016-07-13 울산과학기술원 질의 할당 방법
CN103605568B (zh) * 2013-10-29 2017-10-31 北京奇虎科技有限公司 一种多线程管理方法及装置
GB2528318A (en) 2014-07-18 2016-01-20 Ibm Measuring delay
JP6447217B2 (ja) * 2015-02-17 2019-01-09 富士通株式会社 実行情報通知プログラム、情報処理装置および情報処理システム
US9639286B2 (en) 2015-05-14 2017-05-02 Commvault Systems, Inc. Restore of secondary data using thread pooling
US9710305B2 (en) * 2015-11-12 2017-07-18 International Business Machines Corporation Virtual machine migration management
US10140066B2 (en) * 2016-02-01 2018-11-27 International Business Machines Corporation Smart partitioning of storage access paths in shared storage services
US10210020B2 (en) 2016-06-29 2019-02-19 International Business Machines Corporation Scheduling requests in an execution environment
US10318450B2 (en) * 2016-07-01 2019-06-11 Intel Corporation Efficient context based input/output (I/O) classification
DE102016222375A1 (de) * 2016-11-15 2018-05-17 Robert Bosch Gmbh Vorrichtung und Verfahren zum Bearbeiten von Aufträgen
US10620996B2 (en) * 2017-04-26 2020-04-14 Servicenow, Inc. Batching asynchronous web requests
CN109086194A (zh) * 2018-06-11 2018-12-25 山东中创软件商用中间件股份有限公司 一种线程池容量调整方法、装置、设备及可读存储介质
KR101916799B1 (ko) 2018-06-18 2018-11-08 주식회사 에프아이티 빅데이터 서버 부하 분산 제어 장치 및 방법
US11061896B2 (en) * 2018-06-19 2021-07-13 Salesforce.Com, Inc. Maximizing operator parallelism
CN109240878B (zh) * 2018-08-20 2021-01-26 京东数字科技控股有限公司 数据处理方法和装置
US11422856B2 (en) 2019-06-28 2022-08-23 Paypal, Inc. Adaptive program task scheduling to blocking and non-blocking queues
US11151150B2 (en) * 2019-09-13 2021-10-19 Salesforce.Com, Inc. Adjustable connection pool mechanism
US11165857B2 (en) 2019-10-23 2021-11-02 Salesforce.Com, Inc. Connection pool anomaly detection mechanism
CN110737534B (zh) * 2019-10-29 2021-05-25 京东数字科技控股有限公司 任务的处理方法、装置和服务器
US11265227B2 (en) * 2019-12-26 2022-03-01 Paypal, Inc. System and method for dynamic time estimates
JP7421165B2 (ja) 2020-03-25 2024-01-24 京セラドキュメントソリューションズ株式会社 データ連携システムおよびapiプラットフォーム
US11886916B2 (en) 2020-06-30 2024-01-30 Microsoft Technology Licensing, Llc System for adaptive multithreaded recalculation operations
US20230116810A1 (en) * 2021-09-30 2023-04-13 Dell Products L.P. Automated predictive infrastructure scaling

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5664106A (en) * 1993-06-04 1997-09-02 Digital Equipment Corporation Phase-space surface representation of server computer performance in a computer network
US5745778A (en) * 1994-01-26 1998-04-28 Data General Corporation Apparatus and method for improved CPU affinity in a multiprocessor system
JP3946275B2 (ja) * 1995-01-10 2007-07-18 富士通株式会社 リモートインストールシステムおよび方法
US5675739A (en) * 1995-02-03 1997-10-07 International Business Machines Corporation Apparatus and method for managing a distributed data processing system workload according to a plurality of distinct processing goal types
US6105053A (en) * 1995-06-23 2000-08-15 Emc Corporation Operating system for a non-uniform memory access multiprocessor system
US6182109B1 (en) * 1996-03-08 2001-01-30 International Business Machines Corporation Dynamic execution unit management for high performance user level network server system
US6535878B1 (en) * 1997-05-02 2003-03-18 Roxio, Inc. Method and system for providing on-line interactivity over a server-client network
US6397252B1 (en) * 1997-12-19 2002-05-28 Electronic Data Systems Corporation Method and system for load balancing in a distributed object system
US6477561B1 (en) * 1998-06-11 2002-11-05 Microsoft Corporation Thread optimization
US6427161B1 (en) * 1998-06-12 2002-07-30 International Business Machines Corporation Thread scheduling techniques for multithreaded servers
US6879995B1 (en) * 1999-08-13 2005-04-12 Sun Microsystems, Inc. Application server message logging
US6542920B1 (en) * 1999-09-24 2003-04-01 Sun Microsystems, Inc. Mechanism for implementing multiple thread pools in a computer system to optimize system performance
US6629142B1 (en) * 1999-09-24 2003-09-30 Sun Microsystems, Inc. Mechanism for optimizing processing of client requests
US6898617B2 (en) * 1999-11-18 2005-05-24 International Business Machines Corporation Method, system and program products for managing thread pools of a computing environment to avoid deadlock situations by dynamically altering eligible thread pools
US20020194251A1 (en) * 2000-03-03 2002-12-19 Richter Roger K. Systems and methods for resource usage accounting in information management environments
US7376729B2 (en) * 2000-03-23 2008-05-20 Freebit Co., Ltd. System for internet connections, method for calculating connection fees for network connection services, billing system for network connection services, and system for network connection management
US6816882B1 (en) * 2000-05-31 2004-11-09 International Business Machines Corporation System and method for automatically negotiating license agreements and installing arbitrary user-specified applications on application service providers
US7051330B1 (en) * 2000-11-21 2006-05-23 Microsoft Corporation Generic application server and method of operation therefor
US7177857B2 (en) * 2000-11-24 2007-02-13 Matsushita Electric Industrial Co., Ltd. Apparatus and method for creating distribution content
US20020147693A1 (en) * 2001-04-05 2002-10-10 International Business Machines Corporation Method and system for dynamic accounting of service and equipment usage
US7127716B2 (en) * 2002-02-13 2006-10-24 Hewlett-Packard Development Company, L.P. Method of load balancing a distributed workflow management system
US7080378B1 (en) 2002-05-17 2006-07-18 Storage Technology Corporation Workload balancing using dynamically allocated virtual servers

Also Published As

Publication number Publication date
KR20040062410A (ko) 2004-07-07
US7207043B2 (en) 2007-04-17
KR100628821B1 (ko) 2006-09-27
JP2004213625A (ja) 2004-07-29
US20040139433A1 (en) 2004-07-15

Similar Documents

Publication Publication Date Title
JP3817541B2 (ja) プログラムに基づいた応答時間ベースの作業負荷分配技法
JP3944154B2 (ja) マルチスレッド・サーバ内のスレッド・プールを動的に調整する方法およびシステム
Gu et al. Tiresias: A {GPU} cluster manager for distributed deep learning
Hadary et al. Protean:{VM} allocation service at scale
US10713088B2 (en) Event-driven scheduling using directed acyclic graphs
US11593404B2 (en) Multi-cluster warehouse
US8015564B1 (en) Method of dispatching tasks in multi-processor computing environment with dispatching rules and monitoring of system status
EP3468121B1 (en) Adaptive resource allocation method and apparatus
US10430218B2 (en) Management of demand for virtual computing resources
US20190347137A1 (en) Task assignment in virtual gpu enabled systems
US20110119680A1 (en) Policy-driven schema and system for managing data system pipelines in multi-tenant model
US20110023044A1 (en) Scheduling highly parallel jobs having global interdependencies
Liu et al. A survey of scheduling frameworks in big data systems
Jonathan et al. Awan: Locality-aware resource manager for geo-distributed data-intensive applications
Zaouch et al. Load balancing for improved quality of service in the cloud
Keerthika et al. An efficient grid scheduling algorithm with fault tolerance and user satisfaction
EP2840513B1 (en) Dynamic task prioritization for in-memory databases
Choi et al. Gpsf: general-purpose scheduling framework for container based on cloud environment
Lin et al. Two-tier project and job scheduling for SaaS cloud service providers
Ghazali et al. CLQLMRS: improving cache locality in MapReduce job scheduling using Q-learning
Thamsen et al. Hugo: a cluster scheduler that efficiently learns to select complementary data-parallel jobs
Hu et al. Low latency big data processing without prior information
Khalil et al. Multi-agent model for job scheduling in cloud computing
Hanif et al. Jargon of Hadoop MapReduce scheduling techniques: a scientific categorization
US20230195743A1 (en) Balancing time-constrained data transformation workflows

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060612

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100616

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110616

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110616

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120616

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120616

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130616

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees