JP3817541B2

JP3817541B2 - プログラムに基づいた応答時間ベースの作業負荷分配技法

Info

Publication number: JP3817541B2
Application number: JP2003396290A
Authority: JP
Inventors: クリストファー・ジェイムズ・ブライス; ジェンナーロ・エー・クオモ; エリック・エー・ドートレイ; マット・アール・ホグストロム
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2002-12-31
Filing date: 2003-11-26
Publication date: 2006-09-06
Anticipated expiration: 2023-11-26
Also published as: KR20040062410A; US7207043B2; KR100628821B1; JP2004213625A; US20040139433A1

Description

本発明はコンピュータ・ソフトウェアに関し、より詳細には、実行リソース・セット全体にわたって（および具体的には、マルチスレッドのサーバ環境における実行スレッド全体にわたって）プログラムに基づいて作業負荷を分配することによる、方法、システム、コンピュータ・プログラム製品、およびビジネスを行う方法に関する。

クライアント／サーバ・コンピューティングの普及が近年急速に進んでいるが、これは、公衆インターネットおよび「ＷｏｒｌｄＷｉｄｅＷｅｂ」（または単に「Ｗｅｂ」）として知られるそのサブセットの、ビジネスおよび家庭での利用が増えたことに大きく起因している。企業イントラネットおよびエクストラネットなどの他のタイプのクライアント／サーバ・コンピューティング環境も、ますます普及しつつある。その解決策として、プロバイダは高度なＷｅｂベースのコンピューティングを配信することに焦点を当て、開発されるソリューションの多くは他のクライアント／サーバ・コンピューティング環境に適応可能なものである。したがって、本明細書でインターネットおよびＷｅｂに言及するのは、例示のためであって限定するためではない。（さらに本明細書では、「インターネット」、「Ｗｅｂ」、および「ＷｏｒｌｄＷｉｄｅＷｅｂ」という用語は区別なく使用される。）

毎日、何百万人もの人々が、個人の楽しみやビジネスあるいはその両方に、インターネットを使用している。電子情報およびビジネス・サービスの消費者として、今や人々は地球規模のレベルでソースに簡単にアクセスすることができる。人間のユーザがインターネットを介してソフトウェア・アプリケーションと対話し、コンテンツを要求する場合、応答を返す際の遅延または効率の悪さは、ユーザの満足感にかなりの悪影響を与える可能性があり、ユーザが別のソースに切替えてしまうことすらある。したがって、要求されたコンテンツを即時に効率良く送達することは、ユーザを満足させる上で不可欠であり、ネットワークのサーバ側にあるシステムができる限り効率良く動作するよう保証することが重要である。

これまでの経験によれば、この種の環境で様々なクライアントに関する要求を処理するアプリケーション・サーバでは、受け取られる様々な要求全体わたって最高のスループットおよび応答時間を提供するために、通常、リソースの使用量に制約を与えることが必要である。関心の対象である主なリソースの１つが実行スレッド（以下、同様の意味で単に「スレッド」と呼ぶ）である。スレッドを制約なしに作成、使用、および廃棄すると、当分野で知られた様々な理由で応答時間およびスループットの両方を損なう可能性がある。たとえば、スレッドをあまり多く作成しすぎると、スレッドを管理するためのシステム・オーバヘッドが許容できないほどに高くなることがあり、またこれらのスレッドに関するシステムの状態および他の情報を格納するために必要なメモリ量が多くなりすぎることがある。さらに、限られたリソースに対して多くのスレッドが待ち行列に入ると、通常はそれらのリソースにスラッシングを生じさせるため、共用リソースの競合が使用可能なスレッドの数を制限する主な理由である。ただし他方では、使用可能なスレッド数が少なすぎると、入ってくる要求がスレッドに割り当てられるまでに長い時間待機し、それによってエンド・ユーザへの応答時間が長くなる可能性がある。

したがって、システム内のスレッド数を調整することが有用である。本明細書では、作成されたが廃棄されていないスレッド・セットのことを「スレッド・プール」と呼ぶ。特定のクライアント／サーバ環境でスレッド・プールに対して作成されるスレッド数は、サーバを初期設定する際に、しばしばユーザ（たとえばシステム管理者）によって構成パラメータとして指定される。通常、アプリケーションが適度以上に酷使される環境では、所与のアプリケーション・セットに対するスレッド・プールの調整は反復オペレーションであり、その結果、スループットおよび応答時間を向上させる試みにおいてスレッド・プールがサイズ変更される。

均一の作業負荷では、要求の有する全システム応答時間がほぼ同じである場合が多く、スレッド・プールを繰り返しサイズ変更することが、システムの性能を向上させるために良好に働く。同様に、作業負荷に様々なタイプがミックスされた要求が含まれていても、その様々な要求が同様の応答時間を有する場合には、この種のオペレーションのサイズ変更もかなり良好に働く。ただし、様々な応答時間がミックスされている作業負荷の場合、問題はさらに複雑である。

様々な平均応答時間を有する要求タイプからなる作業負荷を伴う、スレッド数の制約された単一のスレッド・プールが使用される場合、要求が（平均して）適正な時間内に処理される、スレッド・プールの「最適サイズ」を見つけることが可能である。ただし、このようにミックスされた作業負荷に対して単一のスレッド・プールを使用することは、次善策となる傾向がある。具体的に言えば、この方法は、より短い実行時間を有する要求の応答時間を不均衡に長くする。

この現象が生じる理由は、上記のように、アプリケーション・サーバの単一のスレッド・プールに制約を与えることは、そのアプリケーション・サーバ内でのリソース利用率を制御するために極めて重要ではあるが、単一のスレッド・プールは、より長い実行時間を有する要求で一杯になる傾向もあり、したがって、より短い実行時間を有する要求は事実上締め出されることになる。実行時間の長い要求が爆発的に増えると、本質的に、実行時間の短い要求が単一の制約されたスレッド・プールからスレッドに割り当てられるのを妨げることになる。さらに、スレッドがスレッド・プールから割り当てられたときに、たとえそのスレッドが特定の要求をきわめて迅速に処理できるとしても、要求はスレッドが割り当てられるまでかなり長い間待機しなければならない可能性がある。したがって、こうした要求に関してエンド・ユーザ（または、より一般には要求者）が知覚する応答時間は、極端に長い可能性がある。

これら従来技術の問題を克服する技法が求められている。
ＵＳ５，６６４，１０６ＵＳ６，４２７，１６１「データベース・システムに関する目標指向の動的バッファ・プール管理」（"Goal-oriented dynamic buffer pool management for data basesystem"）, IEEE,08/1995:191-198, チェン・ヤオ・チャン等(Jen-YaoChung, et al.)

本発明の一目的は、クライアント／サーバ・ネットワークでの性能を向上させることである。

本発明の他の目的は、マルチスレッド・サーバの性能を向上させることである。

本発明の他の目的は、スレッド・プールからスレッドへの要求をスケジューリングするための高度な技法を提供することである。

本発明の他の目的は、マルチスレッド・サーバ環境で動的に作業負荷のバランスをとるための技法を定義することである。

本発明の他の目的は、様々な平均応答時間を有する作業負荷に対するサーバの性能を向上させるために、スレッド・プールを動的に調整するための技法を定義することである。

本発明の他の目的は、実行のための待機時間を減らすために、要求が必要とする実行時間を短くすることのできる技法を定義することである。

本発明の他の目的は、実行時間の短い要求に関する応答時間を短くするために、実行リソース・セット全体にわたり、作業負荷をプログラムに基づいて分配するための技法を定義することである。

本発明の他の目的および利点は、一部は以下の説明および図面に記載され、一部は説明から明らかになるか、または本発明の実施によって習得することができる。

上記の目的を達成するため、および本明細書におおまかに記載された本発明の目的に従って、本発明は、実行リソース・セット全体にわたり、作業負荷をプログラムに基づいて分配するための方法、システム、およびコンピュータ・プログラム製品を提供する。好ましい実施形態では、この技法には、いくつかの使用可能な複数のスレッド・プールを用意すること、サーバ上にある作業負荷の履歴統計から、サーバで処理された要求ごとの平均実行時間を複数取得すること、および複数の平均実行時間に基づいて、使用可能な複数のスレッド・プールの各々に対し、割り当てられる要求の平均実行時間の異なる上限値を決定することが含まれる。実行時に、インバウンド要求がサーバで受け取られると、次にそれらを、平均実行時間の上限値に基づいて、使用可能な複数のスレッド・プールのいずれかにに割り当てることができる。好ましくは、スレッド・プールは論理スレッド・プールである。

好ましくは、上限値を決定するステップは、複数の平均実行時間を配列内にコピーすること、配列をその値に従ってソートすること、およびソートされた配列を（たとえば均等に）使用可能なスレッド・プール数にわたって割り振ることをさらに含む。ソートされた配列の総数を決定することが可能であり、この場合、好ましくは割振りが値「Ｎ」を見つけるために、ソートされた配列の総数を使用可能なスレッド・プール数で割ること、ならびに、索引として「Ｎ」の整数倍を使用してアクセスされる配列の値を、各スレッド・プールの平均実行時間の異なる上限値とすることをさらに含む。

インバウンド要求がサーバで受け取られると、好ましい実施形態は、受け取った要求の分類キーを決定し、決定された分類キーを使用して受け取った要求の平均実行時間を突き止め、および、（好ましくは、突き止められた平均実行時間と決定された各スレッド・プールの平均実行時間の上限値とを、比較された平均実行時間の上限値が突き止められた平均実行時間よりも大きいかまたは等しくなるまで、繰り返し比較することによって）受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止める。

好ましい実施形態は、インバウンド要求がサーバ側で実行されるときの実行時間を追跡し、追跡された実行時間を反映するように作業負荷の実行時間を更新する。好ましくは、更新された実行時間を反映するように、各スレッド・プールの異なる平均実行時間の上限値は定期的に再計算される。

本発明は、ビジネスを行う方法としても提供することができる。たとえば、顧客にサービスを提供することが可能であり、それによってクライアント／サーバ・ネットワーク・トラフィックの動作特徴が監視され、実行リソースへの調整が観察に基づきプログラムに基づいて実行される。このサービスは、利用回数制課金、毎月または他の定期的な課金などの、様々な収益モデルの下で提供することができる。

次に、同じ参照番号が全体を通じて同じ要素を示す下記の図面を参照しながら、本発明について説明する。

本発明は、クライアント／サーバ・ネットワーキング環境のマルチスレッド・サーバにおける実行リソースのセット全体にわたり、インバウンド要求を動的かつプログラムに基づいて分配する。好ましい実施形態では、実行リソースはスレッドであり、これらのスレッドは論理的には複数のスレッド・プールに編成される。（使用可能なスレッドのセットは、単一の物理プールから生じるものとみなすことが可能であり、これがさらに論理的に複数のプールに分けられる。以下の、図１の要素１３５、１４０、１４５、および１５０に関する考察も参照されたい。参照しやすくするために、本明細書では、論理的に編成されたプールを単にスレッド・プールと呼び、単一の物理プールを「グローバル」スレッド・プールと呼ぶ。）

好ましくは、プログラムに基づいた要求分配プロセスは、どのインバウンド要求をどのプールに割り当てるべきか（要求は、必要であればそのプールに関する待ち行列に入る）をプログラムに基づいて決定することを含み、オプションの拡張機能では、使用中のスレッド・プールの数および／またはサイズもプログラムに基づいて調整することができる。プログラムに基づいた分配プロセスの好ましい実施形態では、本発明は、要求が実行されるときに要求を追跡し、要求タイプごとの平均実行時間および待機時間を決定し、ならびに、（好ましくは、各プールで処理される要求の平均実行時間の上限を決定することにより）特定プールに対する要求の割振りを動的に調整する。スレッド・プールの数および／またはプール内のスレッドの数も動的に調整する好ましい実施形態では、一度にこれら変数（プールごとの平均実行時間の上限、スレッド・プール数、およびプール内のスレッド数）のうちの１つだけが調整され、その効果が肯定的であったか否定的であったかを判定するためにスナップショットが取られる。

従来技術に従って単一の制約されたスレッド・プールを使用することに関連付けられた問題について、上記で説明した。当分野で知られるこれらの問題に対する１つの解決策は、少数のスレッド・プール（この数は静的に事前に定義される）をセットアップすること、および各プールに入ることのできる要求のタイプを手動で構成することである。その後、他のすべての要求は、「他のすべての」プールで処理することができる。この方法には、どのタイプの要求がこの機構から恩恵を受けることになるかを判別するためにシステムをプロファイリングすること、およびプールへの要求タイプのマッピングを記述したサイドテーブル情報を手動で構築することが必要である。

この方法には長所と欠点がある。長所の１つは、要求セットが、どの要求の待ち行列時間が異常に長くなっているか、およびどの要求の実行時間が他のすべての要求タイプに比べて十分短いかを識別できる場合、識別されたセットはおそらく、識別されたときに、この情報を適切に使用して、これらの要求を特定のスレッド・プールの方向へ向ける（すなわちこれに向けて送る）ことのできる実行時間に対して、より良好な応答時間を達成することになる、ということである。

ただし、この方法では長所よりも欠点の方が多い。その１つが、この方法は要求ストリームの（Ｗｅｂアプリケーションで遭遇するような）変化する性質を考慮しないことである。要求タイプのマッピングを含むハードコードされたテーブルが最初から悪いか、あるいは、当初測定されたコードの特徴が変化したかまたは新しいコードがシステムの力学を変化させたかのいずれかにより、経時的に変える必要があるかのいずれかである可能性が高い。いずれの場合も、たとえ最初から悪いわけではなくとも、情報は即時に時代遅れとなる可能性が高いのは明らかであろう。

本発明の適切な解決策、および好ましい実施形態によって使用される解決策は、所与のタイプの要求に関する平均実行時間および待機時間を追跡し、その後、それらの実行時間に従って、各タイプの要求をスレッド・プールに割り当てることである。

アプリケーション・サーバによって処理される様々な要求タイプに関する平均実行時間を追跡することによって、これらの要求タイプをいくつかの同じ実行時間カテゴリのグループに分けることができる。１つの方法では、実行時間帯域の周波数分布を構築することによって、カテゴリを決定することができる。好ましい実施形態で使用される単純な実施は、使用可能なスレッド・プールの（所定の）数を入手し、集められた実行時間を使用して要求タイプをこの数のスレッド・プールに分けることによって、帯域を計算することができる。これは、統計タイルの計算とも呼ばれ、タイル値（すなわち各特定帯域の上限）は各プールに可能な最大実行時間となる。タイル値を計算し、その後、どの実行時間が各タイルに対応するかを識別するマッピング・テーブル（または同様の関連）を作成するプロセスを、本明細書では「分配計算」または「プール・ターゲット計算」と呼ぶ。この情報を使用して、新しく到着したインバウンド要求がどこに向かって送られるべきかを決定するプロセスを、本明細書では要求の「分類」と呼ぶ。実行時間の上限を決定する際に使用される集められたデータを、本明細書では一般に「分類データ」と呼び、各要求タイプの平均実行時間ならびに以下でより詳細に説明する他の情報が含まれる。

たとえば、分類データの実行時間が１０，０００時間であり、１０のスレッド・プールが使用される場合、１，０００時間の最短実行時間をもつ要求タイプは、第１のプールからのスレッドによって処理され、１，０００時間の最長実行時間をもつ要求タイプは、最後（１０番目）のプールによって処理されることができる。本発明の発明者は、分配計算は、各実行時間帯域内にある要求の履歴周波数を自動的に考慮に入れるため、この方法が既知のプール・サイズに対して良好に働くと判断した。分類、またはスレッド・プールへの要求の実行時方向付け（ｖｅｃｔｏｒｉｎｇ）を、好ましい実施形態に従ってどのように実行することができるかについての詳細は、図１（以下で論じる）を参照されたい。

実験を通じて、複数の論理スレッド・プールの可用性が全体の応答時間およびスループットを助けることがわかった。前述のように、従来技術の方法は、要求を複数のプールに静的に割り振る。静的割当ての欠点についてはこれまでに述べたが、本発明の動的分類および分配計算技法はこれらの欠点を回避する。本明細書で開示された技法は、所与の作業負荷に対してプール・サイズおよび／またはプール数を動的に調整できるようにするものでもある。（この調整がどのように実施できるかについての詳細な考察を、図５〜８を参照しながら以下で行う。）

スレッド・プール数を動的に調整するための技法が使用されない場合、好ましい実施形態のオペレーション中に使用するプールの数は、好ましくは所定の数（構成可能な値であってよい）に割り振られる。プールの数がシステムの挙動を調べることによって動的に決定される場合、本明細書に記載されるように、好ましくは反復方法が使用される。後者の場合、最初に使用されるプールの数（ならびにプール・サイズ）は、以前の知識（たとえば、動的に決定された可能性のある、最も新しく使用された値に関する保存された状態情報）によって、または初期のデフォルト構成から始めることによって、決定できる。

プールへの要求タイプの分配を動的に再計算することに加えて、プールの数およびプールのサイズを動的に調整する場合、このタイプの実行時調整には、３次元的な問題として取り組むことができる。１つの次元は、要求タイプの関連付けられた実行時間についてタイルを計算すること、もう１つの次元はプールの数を調整すること、およびもう１つの次元はプールのサイズを調整することである。このプロセスは、これらの調整面の間の相互作用により、さらに複雑になる。（プログラムに基づいて要求を分配するためにタイル値を計算することは、それ自体が調整の１タイプであるため、本明細書で使用される「調整」という用語は、参照のコンテキストがそれ以外のものを示す場合を除き、プール数およびプール・サイズの調整プロセスのみを指すことを意図するものではない。）たとえばプール・サイズの変更またはプール数の変更は、プールに向けて送られる要求の実行時間に影響を与えることが多い。次にこれが、様々な要求タイプを異なる帯域に押し込むことがある。これについて例示するために、４つの帯域を有する構成があり、第３の帯域（次に最も長い実行要求が処理される）がいくつかのスレッド「Ｔ」を有すると想定する。さらに、この数のスレッドを使用して、帯域３内の要求が、なんらかの低帯域「ＬＢ（３）」からなんらかの高帯域「ＵＢ（３）」までの範囲の時間間隔で、それらの実行を完了すると想定する。帯域３のスレッド数Ｔが変更されると、帯域３に向けて送られるいくつかの要求タイプの実行時間が範囲［ＬＢ（３）．．．ＵＢ（３）］から外れる可能性がある。これは、本明細書で使用される方法によれば、これらの要求タイプがもはや帯域３内に属さないことを意味する。ただし、これらを他の帯域に移動させると、それによってその帯域内の要求の実行時間が変更される、という連鎖反応を起こす可能性がある（追加の要求タイプが他の帯域に移動する必要がある可能性があることを示す）。この反応を制御するために、好ましい実施形態は、プール・サイズ調整プロセス中に、実行時間（および、したがってその時間内に実行される傾向がある要求タイプ）を特定の実行帯域に拘束し、後続の分配計算（すなわち、後続の実行データ分析およびそこから導出されたマッピングの改訂）が発生するときにのみそれらの拘束を解く。分配計算は、一般に、プール・サイズ調整と同時に発生すること（および、好ましくはその間には実行時間が拘束されていない、プール・カウント調整とも同時に発生すること）に留意されたい。好ましい実施形態では、この拘束は要求タイプの分類データ内のフラグを使用することで実行され、拘束フラグはプール・サイズ調整が完了した後に消去される。

マルチスレッド・サーバ環境では、以下のようないくつかの動的要素が観察できる。
ＤＥ１：所与の要求タイプの実行時間は、それが使用し、コード・パスが取得されるリソースに依存して変更可能である。
ＤＥ２：新しい要求がシステムに入り、それらの実行時間に従って分類されなければならない。
ＤＥ３：プール・サイズは変更可能であり、プールに向けられた要求の実行時間に影響を与えることになる。
ＤＥ４：実行時間の分配は再計算可能であり、その結果、様々な要求タイプが帯域を変更する可能性がある。
ＤＥ５：帯域の数および対応するプールの数は変更可能である。

上記に列挙した動的要素を参照し、ＤＥ１およびＤＥ２は調整プロセスから独立していることに留意されたい。実際、それらが動的調整機能を必要とする主な理由である。そうでなければ、要求タイプの帯域への分配は１回計算してそのままにしておくことができる。（同様に、ＤＥ１およびＤＥ２がなければ、プール・サイズまたはプール数を動的に調整することによって得られる利点はわずかであるか、またはまったくない可能性がある。）また、動的要素ＤＥ３、ＤＥ４、およびＤＥ５は、調整プロセスに直接起因することにも留意されたい。これらの観察は、調整プロセスを首尾よく推進するために、本明細書に開示された調整技法によって使用される。

したがって、本明細書に開示された動的分配および調整技法は、動的要素のセット全体にわたってバランスがとれるように設計される。好ましくは、発生するオーバヘッドをできる限り少なくするために、調整の経路長さ、競合、および周波数は最低限にされる。調整時の相互作用および連鎖反応を避けるために、好ましい実施形態では、１つを変更し、システムが何らかの時間間隔についてこの状態で実行できるようにし、変更の効果を測定する。（この方法は、変更の肯定的または否定的な影響を分離するためには有益であるが、調整プロセス全体の持続時間を長引かせる可能性がある。したがって、絶対に必要でない限り、帯域の最大数を、はじめに比較的少ない数に設定することが有益である。好ましくは、システムが大きくなるほど、この最大数が大きくなる。）

本発明の調整方法には、以下のように３つの主要な目標がある。
Ｇ１：定常作業負荷ミックスの準定常状態に、できる限り迅速に達するように試行する。
Ｇ２：過度の制御によって生じる可能性のある、実行時間の激しい変動を避ける。
Ｇ３：入ってくる要求の使用可能なスレッド・リソースと実行時間とのバランスがとれるようにする。

これらの目標を達成するために、システムによって処理された要求に関して実行時間および待機または待ち行列時間の履歴統計を保管する必要がある。したがって本発明は、上記で述べたようにこの情報を追跡する。調整中に行った決定は、これらの要素に関して判明した現在の値と過去に判明した値との比較に基づいて、その後評価することができる。（好ましくは、実行した変更の値の修正は、新しいタイプの要求、およびレート０を含む現在の要求のレート変更に関して、システムの動的性質も考慮に入れる。新しく遭遇した要求タイプは、図２〜３を参照しながら以下で説明するように、本発明の分類プロセスの実施形態によって自動的に処理される。特定の要求タイプに関する着信レートの変更には分配計算が自動的に対処し、実行時間対プール・マッピングの上限が修正される場合がある。着信レートの変更は、結果的に、それらの要求タイプを処理するスレッド・プール・サイズをプログラムに基づいて調整することにもなる。）

動的な作業負荷の分配およびプールの調整を考えるときに、それ自体を直接表す難題の１つが、ほとんどの実際のアプリケーション・サーバが閉じたシステムでないという事実である。すなわち、要求によって提示される実行時間および待ち行列時間は、実行される作業のタイプに応じて、ダウンストリームおよびアップストリームの力に影響されることが多い。たとえば、特定の要求タイプが（データベース呼出しなどの）リモート呼出しを実行し、その実行時間がそれら呼び出されたリソースの可用性、またはそれらの競合に応じて、変動する場合がある。

この影響に対処するために、好ましくは本発明の実施形態は、複雑なフィードバック・システムを構築しようと試みる代わりに、フィルタリング機構を適用し、このフィルタリング機構には、プールごとの実行時間上限、プール数、およびプールごとのスレッド数を変更することなしに、実行時間および待機時間の２つまたはそれ以上のスナップショットを取ることが含まれる。これらのスナップショットから集められたデータは、調整とは無関係に変動する要求、すなわち通常の変動をする要求を検出する試みにおいて比較される。要求が変動しない場合、このプロセスで「フィルタリング」することができる。（すなわち、要求がその標準偏差内にある場合は、この要求に関して性能を向上させるためにシステムを調整しようとする試みは有用でない可能性がある。）好ましくは、フィルタリング機構は統計的方法を適用し、要求タイプが変動したかどうかを判別する基準として、要求タイプごとの標準偏差を使用する。その後、調整変更なしで標準偏差が比較的大きい実行時間パターンを有するいずれの要求タイプも、通常変動要求タイプとして処理することができる。たとえば、１つまたは複数の要求タイプに関する実行時間データは、調整変更が実施されなかったサンプリング間隔に続いて分析することができる。これらの各要求タイプに関する標準偏差は、この「変更なし」間隔に関して計算することができる。その間隔中に調整変更がアクティブであった他の間隔中に集められたデータは、調整変更が存在する要求タイプに関して標準偏差を決定する場合と同じ方法で分析することができる。変化なし間隔中の特定要求タイプに関する標準偏差と、調整変更間隔中のその標準偏差とを比較することによって、この要求タイプの実行時間に与える調整変更の影響に関して予測を立てることができる。（このプロセスでは、通常の変動ではないと判定された要求タイプに焦点を当てることが有用な場合がある。）

変動は内部競合ならびに外部待機時間（幅広く変動する可能性がある）によって生じる場合があることに留意されたい。多くの場合、これらの問題を提示する要求に関してスレッド・プール・サイズに制約を与えることで、全体のスループットを助けることができる。したがって、標準偏差は、要求タイプの実行時間が変動しているかどうかの指示として使用するだけでなく、プール・サイズまたはプール数の変更の有効性に関する指示としても使用することができる。

これらすべての要素を考慮することにより、実行時間および待機／待ち行列時間の追跡に基づいて、複数のスレッド・プールに作業を効果的に分配するための、自己調整型および高スループットの機構を構築することができる。本明細書に開示された技法は、作業負荷全体にわたって動的にバランスをとることができるようにし、さらに、作業負荷が経時的に特徴を変更しながら、依然として最適なスループットおよび応答時間を達成し続けることもできるようにするものである。

次に図１を参照すると、本明細書に開示されたように動作するシステム１００の抽象図が示されている。作業要求１０５（たとえばインバウンド・クライアント要求）がシステムに入ると、好ましい実施形態に従って、こうした要求それぞれについて待機待ち行列要素（「ＷＱＥ」）１１０が作成される。ＷＱＥは、要求が処理されるときにシステムを「通過するフロー」としてみなすことが可能であり、要求およびその現在の処理に関係する情報を集めるために使用される。オブジェクト指向のプログラミング条件では、ＷＱＥは好ましくはインバウンド要求のための「ラッパー（ｗｒａｐｐｅｒ）」として実施される。各ラッパーは、要求のタイプなどの、それに関連付けられた要求を識別するための情報を含む。この識別情報は、インバウンド要求を特定のスレッド・プールに向けるためにそれらを分類する際に使用される、あらかじめ格納された履歴統計の位置を突き止めるために使用することができることから、「分類キー」とも呼ばれる場合がある。この分類キーに加えて、ＷＱＥは、要求の現在の実行時間および現在の待ち行列時間も格納する。好ましいことに、ＷＱＥは、この要求のタイプに関する分類データへの参照も保持しており、その結果、ＷＱＥに格納された分類キーを使用して分類データを取り出すことができる。好ましい実施形態では、この分類データは、好ましくは移動平均として格納される実行時間、好ましくは移動平均として格納される待ち行列時間、およびオプションで、要求タイプの履歴実行時間および待ち行列時間の値に関する標準偏差値を含む。好ましくは、これらの標準偏差値も移動値である。ＷＱＥと共に分類データを格納することによって、（要素１５５および１６０を参照してより詳細に説明するように）要求の現在の実行時間および待機時間が履歴統計に繰り込まれると、統計計算スレッドのより効率的なオペレーションが可能になる。移動平均および移動標準偏差値、すなわちそれぞれの新しい実行で更新される値を使用することによって、本発明の実施形態は、実行時間および／または待ち行列時間における過去の異常の影響を弱める。

インバウンド要求（そのＷＱＥと共に）は、分類オペレーション１１５に入力される。この分類には、この要求をどのスレッド・プールに割り当てるべきかを決定することが含まれる。好ましい実施形態では、この要求タイプに関するあらかじめ計算された分類データ（すなわち履歴統計）を使用して、このタイプ（あるいは、ワイルドカードまたは同様の突合せ方法がサポートされている場合は同様のタイプ）を有する要求の平均実行時間が決定される。平均実行時間を使用して、この要求に似た要求、またはこの要求と挙動が同様の要求を処理するプールを識別することができる。したがって、実行時間の長い要求が、普通であれば実行時間の短い要求をブロックするという、従来技術の問題が回避される。

代替の実施形態では、要求タイプを分類キーとして使用するのではなく、追加または異なる情報をインデックスとして使用して、分類オペレーション１１５中に適切な履歴統計の位置を突き止めることができる。たとえば、要求タイプは、それらのパラメータの入力値（およびオプションでパラメータ名）を使用することによってさらに制限することが可能であり、この要求タイプとパラメータとの組合せを、（好ましくは、このより粗いレベルでも記録される）分類データのインデックス付けに使用することができる。ＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＬｏｃａｔｏｒ（「ＵＲＬ」）のＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＩｄｅｎｔｉｆｉｅｒ（「ＵＲＩ」）部分が使用可能であり、ＵＲＩと共にパラメータ名／値も使用可能である。また、Ｗｅｂ環境では「要求タイプ」が要求の有用なカテゴリ分類であるが、他の環境では他の情報が適切な可能性のあることにも留意されたい。たとえば、エンタプライズＪａｖａＢｅａｎｓ（登録商標）環境では、要求名の代わりに方法名（それらのクラスまたは配布名を含む）を使用することができる。方法名と共に、所望であれば、他の修飾子としてパラメータ名／値を使用することができる。（「エンタプライズＪａｖａＢｅａｎｓ」は、ＳｕｎＭｉｃｒｏｓｙｓｔｅｍｓ，Ｉｎｃの登録商標である。）したがって本明細書では、限定ではなく例示のために、「要求タイプ」に言及している。

次に図２を参照し、分類オペレーション１１５についてより詳細に説明する。ブロック２００では、新しいインバウンド要求が入力待ち行列から受け取られる。ブロック２０５はこの要求を分析して、その分類キー（またはより一般的には、その識別情報）を決定する。本発明の特定の実施が、インバウンド要求の中で分類キーの位置を突き止める方法は、要求タイプ、または要求タイプにパラメータ値などを加えたものが、その特定の環境において要求を分類する際に関心の対象であるかどうかに依存する。分類キーが決定されると、これがマッピング・テーブルまたは履歴統計が記録された他のリポジトリのインデックスとして使用される（ブロック２１０）。

ブロック２１５は、この分類キーについて、以前に記録された分類データ（および具体的には、平均実行時間）の位置が突き止められたかどうかをチェックする。突き止められなかった場合、このインバウンド要求は「新しく着信した」要求タイプであるとみなされる。（要求タイプはこのシステムによって以前に処理されたが、最後の処理に関する統計データがすでに古くなってしまった可能性があることは、明らかであろう。好ましくは、実施特有の「妥当な」レベルで、履歴統計データに消費された記憶域量を保持するために、最後に使用された、すなわち「ＬＲＵ」方法が使用される。）ブロック２２０および２２５は、新しく着信した要求タイプに対して追加の処理を実行する。ブロック２２０の処理には、この新しい要求タイプの統計を格納するために、分類データ内に新しいエントリを作成することが含まれ、この新しいエントリには現在の要求の分類キーでインデックス付けされる。次にブロック２２５は、好ましくは、平均実行時間をマイナス１（「−１」）などの特殊値に設定することによって、この新しいエントリを初期設定する。この特殊値は、図３を参照しながらさらに論じるように、プール割当てプロセスで検出される。（あるいは、値が単にゼロに設定される場合がある。）

要求の統計データの位置を突き止めた後（すなわち、ブロック２１５が肯定的な結果を有する場合）、または新しい統計エントリを作成および初期設定した後（ブロック２１５が否定的な結果を有する場合）、制御はブロック２３０に達し、現在のインバウンド要求をどのプールに割り当てるべきかを決定し、その割当てを実行する、プール割当てプロセスを呼び出す。このプロセスは、図３に詳細に記載されている。現在のインバウンド要求の処理を完了すると、制御をブロック２００に戻すことによって、図２の論理は後続の要求に対して繰り返し実行される。

図３は、好ましい実施形態が、図２のブロック２３０から呼び出されたプール割当てプロセスをどのように実施できるかについて、さらに詳細に示した図である。このプロセスは、図中で「ｐｏｏｌＮｄｘ」と呼ばれるプール・カウンタまたはインデックスを初期設定することによって始まる（ブロック３００）。このｐｏｏｌＮｄｘ値は、プール・セットの中をループして、現在のインバウンド要求が割り当てられるべきプールをチェックするために使用される。プールは、段々に実行時間がより長い作業へと受け入れていくため、最も実行時間の長い作業が最後のプールに割り当てられる。

ブロック３０５は、この現在のインバウンド要求の平均実行時間が、ｐｏｏｌＮｄｘの値でインデックス付けされたプールのターゲット上限より少ないかまたは等しいかどうかを調べるためにテストする。好ましいことに、要求の平均実行時間は、この要求のタイプに関連付けられた履歴統計から取得されるか、またはこの要求タイプの履歴統計が使用できない場合は、マイナス１に初期設定されている可能性がある（図２のブロック２２５）。後者の場合、ブロック３０５のテストは、図３の論理を介した第１の反復で真となり、好ましい実施形態は、新しく着信した要求タイプを、最も短い実行時間を有する要求を処理するプールに割り当てる。（新しく着信した要求タイプを処理するためのプールを選択する他の方法を、代替の実施形態で使用することができる。）

ブロック３０５のテストが肯定的な結果となった場合、この要求を処理するためのプールが見つかっている。したがって、制御はブロック３２０に移り、ここで作業要素はｐｏｏｌＮｄｘとインデックス付けされたプールに向けられる（すなわち、実行用に割り当てられる）。次に図３の処理は完了し、制御は図２の論理呼出しに戻る。そうでない場合、ブロック３０５のテストが否定的な結果になると、ブロック３１０でプール・インデックスは増分され、ブロック３１５は、ターゲット上限がチェック可能なプールがまだほかにもあるかどうかをチェックする。このチェック・プロセスは、ｐｏｏｌＮｄｘ内の現在のプール・インデックス値とプールの合計数よりも１少ない値とを比較する。（変数「＃ｐｏｏｌｓ」は、現在使用中のプール数を格納する。）この方法では、結果として常に、実行時間が最後のタイル値よりも長い要求タイプを、最後のプールに割り当てることになる。チェック可能なプールがまだある場合、制御はブロック３０５に戻り、ない場合、処理はブロック３２０に進んで、現在のインバウンド要求が現在の（この場合は最終の）プールに向けられることになる。

図３がどのように動作するかの一例として、実施が３つのプールを使用しており、これらのプールのタイル値（すなわち実行時間の上限）が１０時間単位および２０時間単位に設定されるものと想定する。図３に示された方法を使用すると、１０またはそれより少ない時間単位を使用して実行するいずれの要求タイプも、新しく着信した要求タイプと共に第１のプールに向けられ、１０より多く２０を超えない時間単位を必要とする要求タイプは第２のプールに向けられる。２０より多くの時間単位を必要とする要求タイプは、第３のプールに向けられる。インバウンド要求のタイプに関する履歴統計が、このタイプが平均して５０の実行時間単位を必要とすることを示すものと想定する。ｐｏｏｌＮｄｘ値が０の場合、ブロック３０５で５０が１０と比較され、このテストは否定的な結果となるため、ブロック３１０はｐｏｏｌＮｄｘを１に増分する。ブロック３０５を通過する次の反復では、５０が２０と比較されることになる。このテストも否定的な結果となり、ブロック３１０はｐｏｏｌＮｄｘを２に増分する。次にブロック３１５のテストでは、２（ｐｏｏｌＮｄｘ値）を２（プール数よりも１少ない値）と比較することになり、テストは否定的な結果となるため、要求は第３のプール（すなわち、ゼロ・ベースのインデックス付けを使用してインデックス値２を有するプール）に向けられる。

図４は、好ましい実施形態が、異種の動的に変更可能な作業負荷の実行時間および待機時間の特徴を分析することによって、タイル値またはプールごとの実行時間の上限をどのように決定するかを示す論理を提供するものである。このプロセスは、本明細書では、分配計算またはプール・ターゲット計算プロセスと呼ばれる。好ましくは、図４の論理は、図１の要素１６０を参照しながら以下で説明するように、上限を改定するために定期的に呼び出される。

ブロック４００は、現在の分類の集まり（すなわち履歴統計の集まり）を、それらの平均実行時間によってソートする。前述のように、好ましくはこの平均実行時間値は、いくつかの最近の間隔全体にわたる移動平均を表す。この方法では、過去に発生した問題状態または他の異常（結果的に過度に長い実行時間を生じさせたタイムアウト状況、または異常に短い実行時間を発生させた例外条件など）が、将来の決定を曲げることはない。好ましい実施形態は、実行時間を配列内にコピーし、この配列をソートする。（このアレイの記憶域がいったん割り振られると、好ましいことに、アレイ・サイズを増やすために再割振りが必要とならない限り、図４の後続の反復についてもこれが維持される。）

ブロック４０５は、値「ｅｔａｓ」（「実行時間アレイ・サイズ（ｅｘｅｃｕｔｉｏｎｔｉｍｅａｒｒａｙｓｉｚｅ）」を表す）を、このソートされた実行時間の集まりのサイズに設定する。次にこの「ｅａｔｓ」値は、プールのセット間で実行時間が適切に分配されるように、どれだけの実行時間があるかのカウンタとして機能する。ブロック４１０は、プール・インデックス値ｐｏｏｌＮｄｘをゼロに初期設定する。

ブロック４１５では、ターゲット上限を割り当てる必要のあるプールがまだほかにもあるかどうかを調べるためにテストが実行される。このチェック・プロセスは、ｐｏｏｌＮｄｘ内の現在のプール・インデックス値とプールの合計数よりも１少ない値とを比較する（この合計数は変数「＃ｐｏｏｌｓ」に格納されている）。この方法は、結果的に、実行時間が最後の上限よりも長いすべての要求タイプが最後のプールに向けられるように（図３を参照しながら論じたように）、そこにあるプールよりも１つ少ない上限を割り当てることになる。ブロック４１５のテストが肯定的な結果になった場合、処理はブロック４２０に進み、否定的な結果になった場合は、割り当てられる上限がないため、制御は論理呼出しに戻る。

ブロック４２０では、現在のプール（すなわち、ｐｏｏｌＮｄｘとインデックス付けされたプール）に向けられる実行時間の上限が計算されて割り当てられる。好ましい実施形態では、これには、使用可能なプール全体にわたって実行時間統計（および、それらの関連付けられた要求タイプ）の合計数を等しく分配することが含まれる。したがって、ソートされた実行時間から「Ｎ番目」の要素が突き止められ、その要素からの実行時間が、現在のプールの上限（図中では「ターゲット」属性と呼ばれる）として割り当てられる。Ｎ番目の要素は、ブロック４２０に示されるように、第１に、ソートされたアレイ内にある要素の総数（値「ｅｔａｓ」で表される）を使用可能なプール数（＃ｐｏｏｌｓ内にある）で割り、次にこれにｐｏｏｌＮｄｘ値＋１を掛けて、最後にその値から１を引くことで決定される。

上限を設定した後、ブロック４２５はプール・インデックス値を増分し、割り当てられる上限がほかにもあるかどうかを判別するために、制御をブロック４１５に戻す。

図４の論理がどのように動作するかの一例として、現在の集まりに１２の分類があるものと想定する。（実際には、何百、何千という分類のある可能性があることは明らかであろう。）さらに、４つの使用可能なプールがあると想定する。第１の反復では、ブロック４２０での処理により、プール（０）の上限が計算される。この例で「ｅｔａｓ」の値は１２であるため、（ｅｔａｓ／＃ｐｏｏｌｓ）は１２／４、すなわち３である。この値に１を掛けると３となり、さらに１を引くと、プール（０）の上限は、ｓｏｒｔｅｄＥｘｅｃＴｉｍｅｓ［２］から取得した実行時間である。その後の反復では、プール（１）の上限がｓｏｒｔｅｄＥｘｅｃＴｉｍｅｓ［５］からの実行時間にセットされる、という具合になる。

図４に示された方法では、結果として上限を、最近観察された実行時間の分配に基づいた値に設定することになる。上限を割り当てなければならないプール数は、プール数が調整されるときに動的に変更可能であることに留意されたい。（プール数の調整方法に関する詳細な情報は、図５〜７の考察を参照されたい。）図４に示された論理は、プール数の変化に自動的に適合する。

次に、図１に示された処理全体の考察に戻ると、各インバウンド要求が１１５で分類され、次にこれが適切なスレッド・プール（すなわち、図２および３の処理を使用して識別されたスレッド・プール）に向けて送られる。要求は待機待ち行列に入り、スレッドが使用可能になるまで待機しなければならない。したがって、図１では、要求は「Ｎ」個の待機待ち行列１２０、１２５、１３０のうちの１つに向けて送られるように示されており、ここでは各待機待ち行列が、現在システム１００で使用されているＮ個の論理スレッド・プール１３５、１４０、１４５のうちの１つに対応する。（システム１００内のプール数が、その後の何らかの地点で増えるかまたは減った場合、それに応じて待機待ち行列の数も調整しなければならないことは明らかであろう。また、待機待ち行列のサイズは待ち行列に入っている要素の数と共に変化し、本明細書で開示された動的な調整は、待ち行列サイズを修正するためのものではない。）

何らかの地点で、待ち行列に入った要求は、そのために待ち行列に入ったスレッド・プールからのスレッドに割り当てられることになる。好ましい実施形態によれば、要求が待機待ち行列内で費やした時間は、そのＷＱＥ内に記録される。（要求が分類オペレーションを完了したときにスレッドが使用可能な場合、要求は待機待ち行列を迂回することも起こり得る。その場合、待機待ち行列はゼロとして記録される。ただし、こうした要求は実際には待ち行列に提出される可能性があり、待ち行列に入った状態でかなり短い時間を費やすだけとなる。本明細書の以下の考察では、実施は、分類されたすべての要求を待ち行列に送るものと想定する。）

図１は、待機待ち行列から「ラン可能（ｒｕｎｎａｂｌｅ）プール」１３５、１４０、１４５へと横切る、インバウンド要求を示す図である。これらのラン可能プールは、本明細書に記載された論理スレッド・プールに対応し、さらに図１に示されるように、これら論理プール内のスレッドは実際にはグローバル・スレッド・プール１５０内で定義される。好ましい実施形態では、ラン可能プールはいくつかの限定数の実行可能ラッパー・オブジェクトを含み（本発明をオブジェクト指向言語で実施する場合）、各ラッパー・オブジェクトは、論理スレッド・プールに割り当てられたスレッドのうちの１つを表す。（実行可能ラッパー・オブジェクトは、スレッドにインターフェース機構も提供する。）したがって、スレッド数と同様に、実行可能ラッパー・オブジェクトの数も１つのプール１３５、１４０、１４５から他のプールまでいろいろ変化する可能性がある。（特定のラン可能プール内では、実行可能ラッパー・オブジェクトの数は、本明細書に開示されたプール・サイズ調整オペレーションの実行により、変化する可能性がある。）したがって、インバウンド要求およびそのＷＱＥは、その待機待ち行列に関連付けられたラン可能プール内の実行可能ラッパー・オブジェクトのうちの１つが使用可能になるまで、待機待ち行列内に残る。（実行可能ラッパー・オブジェクトの可用性は、定義上、スレッドが使用可能であることを暗に示す。）この方法では、実行可能ラッパー・オブジェクトは、プールごとのスレッド数に制限を課すための効率的かつ信頼できる方法を提供するが、依然としてスレッドが実際に定義された単一のグローバル・スレッド・プールを使用する。（単一のグローバル・スレッド・プールを使用すると、結果的に、別の物理スレッド・プールを維持するよりもかなりオーバヘッドが少なくなる。これは、プールあたりのスレッド数が変更される調整オペレーション中に特にあてはまり、好ましい実施形態は、別の物理スレッド・プールが使用された場合に実行されるように、スレッドを作成および破壊するのではなく、論理プール内で使用できる実行可能ラッパー・オブジェクトの数を変更することによって、単にある程度のスレッドを論理プールに割り振る。）

好ましくは、各スレッド・プール１３５、１４０、１４５のサイズは、そのプールに向けて送られるタイプの作業がどの程度同時に実行されるべきかに応じて変化する。オプションのプール・サイズ調整が実施される場合（図５、６、および８を参照しながら以下で説明するように）、プールのサイズは自己調整となる。たとえば、１つのプールがデータベース・アクセスを必要とする要求を処理している場合、および要求を最適に実行するためにデータベース・システムへの接続数が制約されていなければならない場合、そのプールのサイズは、その要求の性能を低下させることになるサイズを超えないように、それ自体で調整する傾向がある。

各要求は、ある程度の実行時間を費やし、その実行が完了すると、要求のスレッドがそのラン可能プールに戻され（すなわち、実行可能なラッパー・オブジェクトを戻すことまたは解放することによって）、要求のＷＱＥはその実行時間を記録するために更新される。従来技術を使用して、クライアントによって要求されたコンテンツが戻される（図１には図示せず）。ＷＱＥは、統計処理のために待ち行列に入り（統計待ち行列１５５を参照）、その後、最終的に統計計算スレッドは、要素１６０で示されるように、ＷＱＥを待ち行列から外してそのデータを処理する。

本発明では、１６０で実行される処理が、待ち行列に入れられたＷＱＥからの待機時間および実行時間を処理すること、最後に使用された（「ＬＲＵ」）トリミング・プロセスを実行すること、および／またはプール・ターゲット計算を実行することを含む。統計計算スレッドは、好ましくは背景プロセスとして実行するように実施され、好ましくはタイマ駆動方式で呼び出される。好ましい実施形態では、時間間隔は構成可能であり、システム性能を低下させないような最低値（２０秒など）を有する。

好ましい実施形態によれば、統計計算スレッドが実行中の場合、統計待ち行列上にエントリがあれば、それらのエントリは待ち行列から外されて処理される。他のオペレーションも、発生したタイムアウトに応じて実行可能である。好ましくは、統計計算スレッドを１回呼び出すごとにタイムアウトが１つだけ処理され、待ち行列１５５からの統計処理に基本設定が与えられる。（この待ち行列に入ってくる統計が分類を更新するため、分類が時宜を得た方法で実際の状態を表すように、即時に処理されなければならない。ＬＲＵおよびプール・ターゲット計算は集合体情報に依存するため、たびたび実行する必要はない。）

統計待ち行列を処理する場合、統計計算スレッドはエントリを待ち行列から外し、現在の実行時間および待機時間情報を含むように履歴統計を改定する。前述のように、好ましくは履歴統計への参照は、値が効率的な方法で容易に使用できるように、待ち行列に入ったＷＱＥ内で保持される。後者の場合、統計計算スレッドは、第１に、待ち行列から外されたエントリから識別情報（たとえば要求タイプ、および代替実施形態ではパラメータ値などの追加または異なる情報）を取得し、識別情報を、事前に計算された履歴統計にアクセスするための分類キーとして使用する。次に、履歴統計で維持されている待機時間および実行データは、待ち行列から外されたエントリからの情報を反映するように改訂され、標準偏差情報は、この情報が特定の実施で使用される場合には改訂することもできる。好ましくは、統計計算スレッドはイベント駆動型であり、入ってきた統計が受け取られると起動される。好ましくは、ウェイクアップ・イベントもタイムアウト時に起動される。（好ましくは、ＬＲＵおよびプール・ターゲット計算は、それらの関連付けられたタイマが満了すると無条件で実行される。）

ＬＲＵトリミング・プロセスおよびプール・ターゲット計算の処理を起動するために、異なるタイマ間隔を使用することができる。ＬＲＵトリミング・プロセスが起動されると、好ましくは最近使用されていなかった分類データが廃棄され、好ましくはそのデータ用に使用された記憶リソースが解放される。（たとえば、エンド・ユーザは異なるＷｅｂページに移動し、事前に受け取られたある要求タイプをサーバの現在の作業負荷とは無関係にすることができる。この場合、それらの要求タイプの統計を考慮することは、もはや有用ではない。さらに、統計はエンド・ユーザの集まりに関する集合情報を表し、これらユーザの一部は自分のセッションを終了している可能性がある。この場合、集められたデータの一部は、もはやシステムの現在の動作状態に関係していない可能性がある。）プール・ターゲット計算が起動されると、図４の処理（上記で説明）が呼び出される。これまでに説明した異なるタイプの処理に別々のスレッドを使用するのではなく、１６０で複数の目的に単一のスレッドを使用することで、オーバヘッドが最小限となり、分類データなどの共用リソースに関する競合も減少する。

情報が待ち行列から外されたＷＱＥから抽出され、１６０で処理された後、ＷＱＥはその後使用するために解放リスト１６５に戻すことができる。（または、ＷＱＥに使用した記憶域を解放することができる。好ましい実施形態は、オーバヘッドを減らす試みで、ＷＱＥを再使用する。）図１の処理は、インバウンド要求ごとにこの方法で繰り返される。

図５は、本明細書で開示されたプール調整プロセスの実施形態で使用することのできる、状態の移行を示す状態図である。これらの移行は、図６〜８に示された論理と組み合わせて、プールの数および各プールのサイズを調整する場合の変更を分離するために使用することができる。

図５に示されるように、初期状態「Ｓ０」では、プール数またはプール・サイズには何の変更も行われていない。次に、プール数は次の状態「Ｓ１」で調整される。最後に、プール・サイズは状態「Ｓ２」で個々に調整することができる。好ましくは、１つの状態から別の状態への移行はタイマ駆動であり、その結果、システムはある程度の期間特定の状態のままであり、実行に与える状態の影響を記録および分析することができる。好ましい実施形態では、図６の論理（ブロック６２０が、次の状態移行が可能になる前に「スリープ」オペレーションを実施する）で示されるように、タイマは調整プロセスに組み込まれる。代替実施形態は、移行が、イベント駆動方式を使用するなどの他の方法で起動されるように設計することができる。（たとえばこの代替方法では、図８がすべてのプールについてプール・サイズの調整を完了すると、状態Ｓ２から状態Ｓ０への移行を起動することができる。）

代替実施形態では、状態Ｓ１およびＳ２の順序を反対にすることができる。他の実施形態では、プール数調整プロセスおよびプール・サイズ調整プロセスを呼び出すための技法が、状態移行図によって起動される必要はない。

図６〜８は、プール・サイズおよび／またはプール数を所与の作業負荷に調整するために使用することのできる論理の流れ図である。図６は、次の調整状態を（図５に示された状態図を参照しながら）取得することによって始まる（ブロック６００）。次の状態が「変化なし」の場合（ブロック６１５）、制御はブロック６２０に移り、そうでない場合、処理はブロック６２５へ進む。

処理がブロック６２０に達すると、好ましくは「ＴＵＮＩＮＧ＿ＳＥＴＴＬＥ＿ＴＩＭＥ」として図中に示されている構成済みインターバル、すなわち、システムを定常状態に落ち着かせることができるだけの十分な時間に対して、スリープまたは遅延が実行される。次にブロック６０５は、現在の統計を取得し、それらを使用して基準線を設定した後、ブロック６００に戻ることによって次の調整オペレーションが実行される。

制御がブロック６２５に移ると、次の調整状態がプール数を調整するためのものであるかどうかを調べるテストが行われる。そうであれば、図７でより詳細に示されるように、ブロック６３０でプール数調整プロセスが実行される。そのプロセスが完了すると、次に制御はブロック６２０に移る。

ブロック６２５のテストが否定的な結果になると、次にブロック６３５は、次の調整状態がプール・サイズを調整するためのものであるかどうかをチェックする。そうであれば、図８でより詳細に示されるように、ブロック６４０で、プール・サイズ調整プロセスが実行される。そのプロセスが完了すると、次に制御はブロック６２０に移る。

ブロック６３５のテストが否定的な結果になると、これはエラーである。このエラーは、ブロック６１０に示されるように、図６の調整プロセスをＴＵＮＩＮＧ＿ＳＥＴＴＬＥ＿ＴＩＭＥインターバルの間スリープ状態にできるようにすることで対処することが可能であり、その後制御はブロック６００に戻る。あるいは、調整プロセスが停止される場合がある（および、好ましくはこの場合、システム管理者にエラー・メッセージが表示される）。

次に図６の論理が繰り返され、プール調整プロセスは反復的に実行される。

図７の論理は、プール数が調整されるときに図６のブロック６３０から呼び出される。ブロック７００は、明白な変更が必要かどうかをチェックする。たとえば、分類データ内にある別個のエントリよりも多くのプールがあるものと想定する。この場合、様々なタイルの上限を２倍にすることができるか、または単に、マッピング要求タイプよりも多くのプールがあるようにすることができる。これは、首尾よく調整され適切に実行しているシステムでは発生するべきではないが、このタイプのエラーが発生する場合がある。一般的な意味では、ブロック７００は、このタイプの明らかな問題の「すべての状況に対応できるもの」とみなすことができる。したがって、このテストが肯定的な値になる場合は、制御は、プール数調整の計算を実行する代わりに直接ブロック７０５に移り、変更が実行される。次に制御は図６の論理呼出しに戻る（システムは、この変更に続いて定常状態に落ち着くための時間を有することになる）。

明白な変更が必要でない場合、ブロック７１０で、システムの現在の作業負荷によって実行されている要求タイプの現在の統計が獲得される。好ましくは、これには、実行時間および待機時間の情報（および、オプションで標準偏差情報）が更新された、分類データの現在のスナップショットを入手することが含まれる。追加のプールが追加される（ブロック７１５）。

次にブロック７２０は、「ＳＥＴＴＬＥ＿ＴＩＭＥ」と呼ばれる時間間隔中、スリープまたは待機プロセスを実施し、このプール数の変更がインバウンド要求の実行時間および待機時間（ならびに、オプションで標準偏差）にどのように影響を与えたかに関する情報を反映するように、分類データを更新できるようにする。好ましくは、このＳＥＴＴＬＥ＿ＴＩＭＥ値は構成可能であり、図６で使用されるＴＵＮＩＮＧ＿ＳＥＴＴＬＥ＿ＴＩＭＥ値と同一かまたは異なる場合がある。好ましくは、ＳＥＴＴＬＥ＿ＴＩＭＥ値は、図４の分配計算プロセスがスリープ状態である時間間隔よりも長く、その結果、分配計算はＳＥＴＴＬＥ＿ＴＩＭＥスリープ中に自動的に起動されることになり、それによって、ブロック７１５で追加されたプールを反映するように、それ全体にわたって実行時間が分配されるプールの数が増える。あるいは分配計算を、ブロック７２０のスリープの前に明示的に呼び出すことができる。分配計算が動作すると、プールの上限値は改訂される。したがって、たとえばシステムが以前は４つのプールを使用していたが、現在５つのプールを使用しようとしている場合、分配計算は、実行時間を４つではなく５つのグループに分けることになる。

待機が完了すると、ブロック７２５は分類データのスナップショットを獲得し、ブロック７３０は、ブロック７２５からのスナップショットの統計がブロック７１０からのものよりも良いかどうか、すなわち、変更して良かったかどうかを調べるためのテストを行う。良かった場合、次にこの追加されたプールが保持され、制御は論理呼出し（ブロック７３５）に戻る。そうでなければ、追加されたプールがインバウンド要求の実行時間および待機時間を改善しなかった場合に、プールは除去される（ブロック７７５）。さらに好ましくは、各プールの上限がこの少ない方のプール数に基づくように、実行時間の分配が再度計算される。（ブロック７１５および７２０を参照しながら上記で述べたように、別法として、スリープ・オペレーションを実行する前に分配計算を明示的に呼び出してもよく、あるいは、スリープ・インターバルが分配計算インターバルよりも長い場合、新しい分配計算がスリープ中に自動的に発生することになる。他の別法として、ブロック７１５でプール数を変更する前に上限を保存してもよく、ブロック７７５に達したときに、これらの保存した値を単に復元することができる。）

ブロック７７０で開始される処理は、プール数を（増やすのではなく）減らすことが、実行時間および待機時間を改善するのかどうかを調べるように設計されている。ブロック７７０は、ＳＥＴＴＬＥ＿ＴＩＭＥインターバル中スリープを実施し、これによってシステムは、追加されたプールの除去に続いて定常状態に戻ることができる。次にブロック７６５は、現在実行中の要求についての統計のスナップショットを獲得する。次にブロック７６０はプール数を減分し、好ましくは、減らされたプール数を反映するようにプールあたりの実行時間の上限が再計算される。次にブロック７５０で、他のスリープが実行される。（ブロック７７５を参照しながら述べたように、上限は、ブロック７５０のスリープ中に適切なスリープ・インターバルを選択するか、またはスリープの前の明示的な呼出しによって、再計算することができる。）このスリープ・インターバルが満了すると、ブロック７４０は新しいスナップショットを獲得し、ブロック７４５はこのスナップショットとブロック７６５で取得したものとを比較する。新しい統計の方が良い場合、システムは論理呼出しへ戻る（ブロック７３５）ことによって、減らされたプール数で続行する。そうでなければ、プールを除去した後、インバウンド要求の実行時間および待機時間が良くなかった場合、プールが再度追加され（ブロック７５５）、論理呼出しに戻る前に、より多いプール数を使用するためにスレッド・プールへの実行時間の分配が復元（または再計算）される。

図８の論理は、プール・サイズ調整が実行されているときに呼び出される。ブロック８００は、変数「ＰｏｏｌＣｔｒ」（すなわち、プール・カウンタ・インデックス）を、図中では「ＮｕｍＰｏｏｌｓ」と示されている、現在アクティブな論理スレッド・プール数に設定する。第１にブロック８０５は、ゼロ・ベースのインデックス付けを使用するために、このプール・カウンタ・インデックスを減分し、次にブロック８１０は、インデックスがゼロより大きいかまたは等しいことを調べる。そうでなければ、プール・サイズ調整オペレーションはすべてのプールについて試行したことになり、図６の論理呼出しに戻る（ブロック８１５）。

代替の実施形態では、各プール・サイズの調整を試みる必要はない。たとえば、現在いくつのプールを使用しているかに関係なく、反復カウンタを使用して、図８の論理を通る反復回数を制限することができる。他の代替実施形態では、プール・サイズ調整を、最上位の番号ではなく最下位の番号が付けられたプールから開始することができる。当分野の通常の技術者であれば、代替方法を提供するために図８の論理がどのように修正できるか、およびこうした方法が本発明の範囲内であることが明らかになろう。

プール・カウンタ・インデックス値が、評価するプールがまだほかにもあることを示す場合、制御はブロック８２０に達し、プール内のスレッド数を減分するために「現在の調整量」が負の値に設定される。好ましくは、構成可能値（図中では「ＰＯＯＬ＿ＤＥＬＴＡ」と示される）が調整量として使用される。この値は、パーセンテージ、または無名数（単にスレッド数を１つずつ変更していくなど）として表すことができる。特定の実施でどの方法が最も有利であるかは、スレッド・プールの相対的サイズなどの要素に依存し、どちらの方法も本発明の範囲内である。

図８に示された方法は、最も長い実行要求を有するプールを第１に調整し、次に、最も短い実行要求を有するプールに向かって後進することに留意されたい。通常は、最も長い実行要求を有するプールが、最も多くの特典をプール・サイズ調整から得るものと考えられる。

ブロック８２５は、このプール（すなわち、プール・カウンタによってインデックス付けされたプール）からのスレッドによって現在処理されている要求タイプについて、実行統計のスナップショットが取得されることを示す。こうしたスナップショットに関する詳細は、上記のブロック７１０の考察を参照されたい。（ブロック８２５では、好ましい実施形態では統計のサブセットが取得され、現在のプールからのスレッドによって処理されている要求タイプのみが関心の対象であることに留意されたい。あるいは、作業負荷全体の統計を使用することができる。）ブロック８３０は、これらの要求タイプが、プール・サイズ調整手続きの持続期間中、このプールに結び付けられていることを示す。次にブロック８３５は、このプールのサイズを調整し、ＰＯＯＬ＿ＤＥＬＴＡにパーセンテージを使用する場合は、そのプールに割り当てられたスレッド数をＰＯＯＬ＿ＤＥＬＴＡパーセント値だけ減らすことが含まれる。（プール内のスレッド数を減らすかまたは増やす場合、プールあたりの実行時間に使用される上限値を改訂する必要はないことに留意されたい。ただしこれは、背景で実行するために分配計算を続行する場合は、必然的に発生する可能性がある。新しい要求タイプおよびＬＲＵ処理によって廃棄されている要求タイプは、プール・サイズ調整インターバル中に、ターゲット時間に影響を与える可能性がある。）

次にブロック８４０は、「ＰＯＯＬ＿ＡＤＪＵＳＴＭＥＮＴ＿ＩＮＴＥＲＶＡＬ」と呼ばれるタイマ・インターバルに対してスリープまたは待機プロセスを実施し、これによってシステムは、一定時間、現在のプールの新しく変更されたサイズの下で動作できるようになる。好ましくは、このＰＯＯＬ＿ＡＤＪＵＳＴＭＥＮＴ＿ＩＮＴＥＲＶＡＬ値は構成可能であり、図７で使用されたＳＥＴＴＬＥ＿ＴＩＭＥ値と同一かまたは異なる場合がある。待機が完了すると、ブロック８２５を参照しながら上記で述べたように、ブロック８４５はこのプールのスレッドによって実行されている要求タイプのスナップショットを獲得し、ブロック８５０は、ブロック８４５からの統計がブロック８２５からのものよりも良いかどうか、すなわち、変更して良かったかどうかを調べるためのテストを行う。良かった場合、次にこの減分されたプール・サイズが維持され、調整するプールがほかにあるかどうかを判定するために制御はブロック８０５に戻る。

そうでなければ、減分されたプール・サイズがインバウンド要求の実行時間および待機時間を改善しなかった（すなわち、ブロック８５０の結果が否定的であった）場合に、プール・サイズはその前のサイズに復元される（ブロック８５５）。ブロック８６０から始まる処理は、このプールのサイズを減らすのではなく増やすことによって、実行時間および待機時間が改善されるのかどうかを調べるように設計されている。ブロック８６０は、ＰＯＯＬ＿ＡＤＪＵＳＴＭＥＮＴ＿ＩＮＴＥＲＶＡＬ中にスリープを実施し、これによってシステムは、プール・サイズの復元に続いて定常状態に戻ることができる。

スリープ・インターバルが満了した後、ブロック８６５は、プール・サイズをＰＯＯＬ＿ＤＥＬＴＡパーセンテージだけ増やすように現在の調整量を設定する。次にブロック８７０は、このスレッド・プール内のスレッドによって処理されている現在実行中の要求についての統計のスナップショットを獲得する。ブロック８７５に示されているように、要求タイプはこの手続きに関してこのプールに結び付けられているため、追加のスレッドがこれらの要求の処理に与える影響を評価することができる。次にブロック８８０は、このプールのプール・サイズを（正の）調整量で調整し、その結果プールは、より多くのスレッドを有することになる。（代替の実施形態では、パーセンテージを増やすのではなく、単なる増分方法を使用することができる。この代替方法では、好ましくは、スレッド・プール・サイズを調整する場合にスレッド数が１つだけ増やされるが、本発明の範囲を逸脱することなく他の増分も使用することができる。）

次に、ブロック８８５で他のスリープが実行される。このスリープ・インターバルが満了すると、ブロック８９０は新しいスナップショットを獲得し、ブロック８９５はこのスナップショットとブロック８７０で入手したものとを比較する。新しい統計の方が良ければ、システムは増やされたスレッド数で続行して制御をブロック８０５に戻し、ここで、調整するスレッド・プールがほかにもあるかどうかを調べるテストが行われる。そうでなければ、プール・サイズを増やした後でインバウンド要求の実行時間および待機時間が良くなかった（すなわち、ブロック８９５で否定的な結果）場合、プール・サイズは復元される（ブロック９００）。次に他のスリープが開始され（ブロック９０５）、その後制御はブロック８０５に戻る。

従来技術の技法を使用して、何らかの理由でスレッド・プールに制約を与えることが、システム性能にとって有益となるかどうかを実験的に判別することができる。たとえば、データベース・アクセスを必要とする要求を参照すると、一度にオープンすることのできる最大数のデータベース接続が存在する場合がある。スレッドが制限されていなければ、データベースにアクセスしようとする要求でプールは「閉塞状態」となる可能性がある。このシナリオでスレッド・プールを制限すれば目的は果たせるが、望ましくない副作用は、どんなデータベース・アクセスもまったく必要としない可能性のあるシステム内の他の要求にも影響を与えてしまうことである。本明細書に開示された自己調整型の動的プロセスは、システム管理者の介入なしに、この種の影響を自動的に取り除く。

これまで実証してきたように、本発明は、作業負荷の応答時間特徴（および具体的には、その応答時間の実行時間および待機時間構成要素）に基づいて、実行リソースのセット全体にわたって作業負荷をプログラムに基づいて分配するための、有利な技法を提供する。これにより、マルチスレッド・サーバ全体の性能が向上し、エンド・ユーザは、多くの要求の応答時間が減少することによって恩恵を受けることができる。このプログラムに基づいた分配は、本明細書で開示されたプール調整技法とは無関係に使用することが可能であり、プール数および／またはそれらプールのサイズがたとえ固定されたまま（少なくとも一時的に）であっても、性能の向上を実現することができる。あるいは、いずれかまたは両方のプール調整技法が同様に実施可能であり、他の性能の向上を提供すると予測される。開示された技法は、入ってくる様々な作業負荷タイプで有利に使用することができる。好ましい実施形態について、特定のデータ・タイプを使用したインバウンド要求の分類を参照しながら説明してきたが、これは例示を目的とするものであって、限定的なものではない。一般に、メッセージ待ち行列作業負荷は、メッセージ・タイプおよび／またはメッセージに含まれるデータ（メッセージの処理宛先を含むがこれに限定されるものではなく、たとえば処理宛先は、インバウンド作業の第１のレベルのハンドラを定義し、パラメータは、待ち行列に入れられたメッセージによって使用されるコード・パスおよびリソースが異なる追加の論理を駆動することができる）によって分類することができる。

本発明は、ビジネスを実行する方法としても提供することができる。たとえば、サービスが顧客に提供され、それによって顧客のクライアント／サーバ・ネットワーク・トラフィックの動作特徴が監視され、実行リソースへの調整が観察に基づきプログラムに基づいて実行される。これまでに述べてきた技法は、このサービスを実行するためのソフトウェアを実施する際に使用可能である。このサービスは、利用回数制課金、毎月または他の定期的な課金などの、様々な収益モデルの下で提供することができる。

当分野の技術者であれば理解されるように、本発明の実施形態は、方法、システム、またはコンピュータ・プログラムとして提供することができる。したがって、本発明は、全体的なハードウェア実施、全体的なソフトウェア実施、またはソフトウェア面とハードウェア面を組み合わせた実施の形を取ることができる。さらに本発明は、コンピュータ使用可能プログラム・コードを内部で実施する１つまたは複数のコンピュータ使用可能記憶媒体（ディスク記憶装置、ＣＤ−ＲＯＭ、光記憶装置などを含むが、これらに限定されるものではない）上で実施される、コンピュータ・プログラム内で実施することができる。

以上、本発明について、流れ図、および／または、本発明の実施形態に従った方法、装置（システム）、およびコンピュータ・プログラムの構成図を参照しながら説明してきた。流れ図および／または構成図の各ブロック、ならびに流れ図および／または構成図のブロックの組合せは、コンピュータ／プログラム命令によって実施可能であることを理解されよう。これらのコンピュータ・プログラム命令は、汎用コンピュータ、特定用途向けコンピュータ、埋込み型プロセッサ、または他のプログラム可能データ処理装置のプロセッサに、マシンを生成するために提供することが可能であり、その結果、命令（コンピュータまたは他のプログラム可能データ処理装置のプロセッサを介して実行する）は、流れ図および／または構成図のブロックに指定された機能を実施するための手段を作成する。

これらのコンピュータ・プログラム命令は、１つまたは複数のコンピュータ読取り可能メモリ内に格納することも可能であり、ここではこうしたメモリがそれぞれ、コンピュータまたは他のプログラム可能データ処理装置に対して、特定の方法で機能するように命令することが可能であり、その結果、コンピュータ読取り可能メモリ内に格納された命令は、流れ図および／または構成図のブロックに指定された機能を実施する命令手段を含む製品を生成する。

コンピュータ・プログラム命令は、デバイス上で実行する命令が、流れ図および／または構成図のブロック内に指定された機能を実施するためのステップを提供するように、こうした各デバイス上でコンピュータ実施プロセスを生成するために、コンピュータまたは他のプログラム可能装置上で一連の動作ステップを実行させるように、１つまたは複数のコンピュータ、あるいは他のプログラム可能データ処理装置上にロードすることも可能である。

以上、本発明の好ましい実施形態について説明してきたが、当分野の技術者が基本的な発明の概念を習得すれば、これらの実施形態の追加の変形形態および修正形態も思いつくであろう。したがって、添付の特許請求の範囲は、好ましい実施形態ならびに本発明の精神および範囲内に含まれるすべてのこうした変形形態および修正形態を含むものと解釈されるものであることが意図される。

まとめとして、本発明の構成に関して以下の事項を開示する。

（１）サーバのリソース全体にわたってプログラムに基づいて作業負荷を分配する方法であって、
使用可能なスレッド・プール数を決定するステップと、
サーバ上の作業負荷の履歴統計から実行時間を取得するステップと、
取得された前記実行時間を、前記使用可能なスレッド・プール数全体にわたって、プログラムに基づいて分配するステップとを含む方法。
（２）前記プログラムに基づいて分配するステップは、
前記実行時間をソートするステップと、
前記ソートされた実行時間を前記使用可能なスレッド・プール数全体にわたって割り振るステップとをさらに含む、請求項１に記載の方法。
（３）前記ソートされた実行時間は前記使用可能なスレッド・プール数全体に均一に割り振られる、請求項２に記載の方法。
（４）前記ソートされた実行時間の総数を決定するステップをさらに含み、前記割振りステップは、
ソートされた実行時間の前記総数を前記使用可能なスレッド・プール数で割り値「Ｎ」を見つけるステップと、
索引として「Ｎ」の整数倍を使用してアクセスされるときの前記ソートされた実行時間に従って、使用可能な各スレッド・プールの実行時間についての上限を割り当てるステップとをさらに含む、請求項２に記載の方法。
（５）実行時に、インバウンド要求をサーバで受け取るステップと、
前記プログラムに基づいて分配された実行時間に従って、前記インバウンド要求を、前記使用可能なスレッド・プールに割り当てるステップとをさらに含む、請求項１に記載の方法。
（６）前記インバウンド要求が前記サーバで実行されるときの実行時間を追跡するステップと、
前記追跡された実行時間を反映するように、前記サーバ上の作業負荷の前記実行時間を改訂するステップとをさらに含む、請求項５に記載の方法。
（７）前記プログラムに基づいた分配を、改訂された前記実行時間を反映するように定期的に再計算するステップをさらに含む、請求項６に記載の方法。
（８）ソートされた実行時間は移動平均実行時間である、請求項１に記載の方法。
（９）前記実行時間は要求タイプごとに維持される、請求項１に記載の方法。
（１０）前記実行時間は要求タイプおよびパラメータ値ごとに維持される、請求項１に記載の方法。
（１１）前記実行時間は方法名ごとに維持される、請求項１に記載の方法。
（１２）前記実行時間は方法名およびパラメータ値ごとに維持される、請求項１に記載の方法。
（１３）前記実行時間は方法名ならびにパラメータ名およびパラメータ値ごとに維持される、請求項１に記載の方法。
（１４）前記実行時間はＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＩｄｅｎｔｉｆｉｅｒ（「ＵＲＩ」）名およびパラメータ値ごとに維持される、請求項１に記載の方法。
（１５）前記実行時間は処理宛先ごとに維持される、請求項１に記載の方法。
（１６）前記サーバでインバウンド要求を受け取るステップと、
前記受け取った要求の分類キーを決定するステップと、
前記決定された分類キーを使用して、前記受け取った要求の平均実行時間を突き止めるステップと、
前記突き止められた平均実行時間と前記割り当てられたそれぞれの上限とを、前記比較された割り当てられた上限が前記突き止められた平均実行時間よりも大きいかまたは等しくなるまで繰り返し比較することによって、前記受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止めるステップとをさらに含む、請求項４に記載の方法。
（１７）前記スレッド・プールは論理スレッド・プールである、請求項１に記載の方法。
（１８）マルチスレッド・サーバ内のスレッド・プール全体にわたって、インバウンド要求をプログラムに基づいて分配するためのシステムであって、
使用可能なスレッド・プール数を決定するための手段と、
サーバ上の作業負荷の履歴統計から実行時間を取得するための手段と、
前記取得された実行時間を、前記使用可能なスレッド・プール数全体にわたって、プログラムに基づいて分配するための手段と、
実行時に、インバウンド要求を前記サーバで受け取るための手段と、
前記プログラムに基づいて分配された実行時間に従って、前記インバウンド要求を、前記使用可能なスレッド・プールに割り当てるための手段とを含むシステム。
（１９）前記プログラムに基づいて分配するための手段は、
前記実行時間をソートするための手段と、
前記ソートされた実行時間を前記使用可能なスレッド・プール数全体にわたって割り振るための手段とをさらに含む、請求項１８に記載のシステム。
（２０）前記ソートされた実行時間の総数を決定するための手段をさらに含み、前記割り振るための手段は、
前記ソートされた実行時間の総数を前記使用可能なスレッド・プール数で割り値「Ｎ」を見つけるための手段と、
索引として「Ｎ」の整数倍を使用してアクセスされるときの前記ソートされた実行時間に従って、使用可能な各スレッド・プールの実行時間についての上限を割り当てるための手段とをさらに含む、請求項１９に記載のシステム。
（２１）前記インバウンド要求が前記サーバで実行されるときの実行時間を追跡するための手段と、
前記追跡された実行時間を反映するように、前記サーバ上の前記作業負荷の前記実行時間を改訂するための手段とをさらに含む、請求項１８に記載のシステム。
（２２）前記プログラムに基づいた分配を、改訂された前記実行時間を反映するように定期的に再計算するための手段をさらに含む、請求項２１に記載のシステム。
（２３）前記ソートされた実行時間は移動平均実行時間である、請求項１８に記載のシステム。
（２４）前記実行時間は要求タイプごとに維持される、請求項１８に記載のシステム。
（２５）前記実行時間は方法名ごとに維持される、請求項１８に記載のシステム。
（２６）前記実行時間はＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＩｄｅｎｔｉｆｉｅｒ（「ＵＲＩ」）名ごとに維持される、請求項１８に記載のシステム。
（２７）前記実行時間は処理宛先ごとに維持される、請求項１８に記載のシステム。
（２８）前記上限を割り当てるための手段は、
前記受け取った要求の分類キーを決定するための手段と、
前記決定された分類キーを使用して、前記受け取った要求の平均実行時間を突き止めるための手段と、
前記突き止められた平均実行時間と前記割り当てられたそれぞれの上限とを、前記比較された割り当てられた上限が前記突き止められた平均実行時間よりも大きいかまたは等しくなるまで繰り返し比較することによって、前記受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止めるための手段とをさらに含む、請求項２０に記載のシステム。
（２９）サーバのリソース全体にわたって作業負荷をプログラムに基づいて分配するためのコンピュータ・プログラム製品であって、コンピュータ・プログラム製品は、コンピューティング環境内のコンピューティング・システムによって読取り可能な１つまたは複数のコンピュータ読取り可能媒体上で実施され、
使用可能なスレッド・プール数を決定するためのコンピュータ読取り可能プログラム・コード手段と、
サーバ上の作業負荷の履歴統計から実行時間を取得するためのコンピュータ読取り可能プログラム・コード手段と、
前記取得された実行時間を、前記使用可能なスレッド・プール数全体にわたって、プログラムに基づいて分配するためのコンピュータ読取り可能プログラム・コード手段とを含む、コンピュータ・プログラム製品。
（３０）前記プログラムに基づいて分配するためのコンピュータ読取り可能プログラム・コード手段は、
実行時間をソートするためのコンピュータ読取り可能プログラム・コード手段と、
前記ソートされた実行時間を前記使用可能なスレッド・プール数全体にわたって均一に割り振るためのコンピュータ読取り可能プログラム・コード手段とをさらに含む、請求項２９に記載のコンピュータ・プログラム製品。
（３１）前記ソートされた実行時間の総数を決定するためのコンピュータ読取り可能プログラム・コード手段をさらに含み、割り振るためのコンピュータ読取り可能プログラム・コード手段は、
ソートされた実行時間の前記総数を前記使用可能なスレッド・プール数で割り値「Ｎ」を見つけるためのコンピュータ読取り可能プログラム・コード手段と、
索引として「Ｎ」の整数倍を使用してアクセスされるときの前記ソートされた実行時間に従って、使用可能な各スレッド・プールの実行時間についての上限を割り当てるためのコンピュータ読取り可能プログラム・コード手段とをさらに含む、請求項３０に記載のコンピュータ・プログラム製品。
（３２）実行時に、インバウンド要求を前記サーバで受け取るためのコンピュータ読取り可能プログラム・コード手段と、
前記プログラムに基づいて分配された実行時間に従って、前記インバウンド要求を、使用可能なスレッド・プールに割り当てるためのコンピュータ読取り可能プログラム・コード手段とをさらに含む、請求項２９に記載のコンピュータ・プログラム製品。
（３３）前記インバウンド要求が前記サーバで実行されるときの実行時間を追跡するためのコンピュータ読取り可能プログラム・コード手段と、
前記追跡された実行時間を反映するように、前記サーバ上の作業負荷の前記実行時間を改訂するためのコンピュータ読取り可能プログラム・コード手段とをさらに含む、請求項３２に記載のコンピュータ・プログラム製品。
（３４）前記プログラムに基づいた分配を、改訂された前記実行時間を反映するように定期的に再計算するためのコンピュータ読取り可能プログラム・コード手段をさらに含む、請求項３３に記載のコンピュータ・プログラム製品。
（３５）前記実行時間は要求タイプ、パラメータ名、およびパラメータ値ごとに維持される、請求項２９に記載のコンピュータ・プログラム製品。
（３６）前記実行時間は方法名およびパラメータ値ごとに維持される、請求項２９に記載のコンピュータ・プログラム製品。
（３７）前記実行時間はＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＩｄｅｎｔｉｆｉｅｒ（「ＵＲＩ」）名およびパラメータ値ごとに維持される、請求項２９に記載のコンピュータ・プログラム製品。
（３８）前記実行時間は処理宛先ごとに維持される、請求項２９に記載のコンピュータ・プログラム製品。
（３９）前記サーバでインバウンド要求を受け取るためのコンピュータ読取り可能プログラム・コード手段と、
前記受け取った要求の分類キーを決定するためのコンピュータ読取り可能プログラム・コード手段と、
前記決定された分類キーを使用して、前記受け取った要求の平均実行時間を突き止めるためのコンピュータ読取り可能プログラム・コード手段と、
前記突き止められた平均実行時間と前記割り当てられたそれぞれの上限とを、前記比較された割り当てられた上限が前記突き止められた平均実行時間よりも大きいかまたは等しくなるまで繰り返し比較することによって、前記受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止めるためのコンピュータ読取り可能プログラム・コード手段とをさらに含む、請求項３１に記載のコンピュータ・プログラム製品。
（４０）サーバのリソース全体にわたって作業負荷をプログラムに基づいて分配することにより、ビジネスを実行する方法であって、
前記サーバでの作業負荷の動作特徴をプログラムに基づいて監視するステップと、
前記サーバのリソース全体にわたって前記作業負荷をプログラムに基づいて分配するステップとを含み、このステップは、
使用可能なスレッド・プール数を決定するステップと、
前記作業負荷の履歴統計から実行時間を取得するステップと、
前記取得された実行時間を、前記使用可能なスレッド・プール数全体にわたって、プログラムに基づいて分配するステップと、
実行時に、インバウンド要求を前記サーバで受け取るステップと、
前記プログラムに基づいて分配された実行時間に従って、前記インバウンド要求を、前記使用可能なスレッド・プールに割り当てるステップとをさらに含み、
さらに前記方法は、前記プログラムに基づいて監視するステップおよび前記プログラムに基づいて分配するステップとを実行するための料金を課金するステップをさらに含む方法。

本発明に従って動作するシステムの抽象図を示す図である。本発明の好ましい実施形態がどの要求タイプをどのスレッド・プールに割り当てるべきかを決定できる方法を示す、流れ図である。本発明の好ましい実施形態がどの要求タイプをどのスレッド・プールに割り当てるべきかを決定できる方法を示す、流れ図である。本発明の好ましい実施形態がプールごとの実行時間の上限をどのように決定するかを示す、流れ図である。本発明の実施形態で使用可能な状態の移行を示す状態図であり、これらの移行は、図６〜８に示された論理と組み合わせて使用することが可能である。好ましい実施形態に従ってプールの数および各プールのサイズを調整する場合の変更を分離するための論理を示す図である。好ましい実施形態に従ってプールの数を調整するための論理を示す図である。好ましい実施形態に従って各プールのサイズを調整するための論理を示す図である。

符号の説明

１０５作業要求
１１０待機待ち行列要素
１１５分類
１２０待機待ち行列１
１２５待機待ち行列２
１３０待機待ち行列Ｎ
１３５ラン可能プール
１４０ラン可能プール
１４５ラン可能プール
１５０グローバル・スレッド・プール
１５５統計待ち行列
１６０統計／ＬＲＵ／プール・ターゲット計算
１６５解放リスト

Claims

サーバのリソース全体にわたってプログラムに基づいて作業負荷を分配する方法であって、
使用可能な複数のスレッド・プールを用意するステップと、
サーバ上の作業負荷の履歴統計から、前記サーバで処理された要求ごとの平均実行時間を複数取得するステップと、
前記複数の平均実行時間に基づいて、前記使用可能な複数のスレッド・プールの各々に対し、割り当てられる要求の平均実行時間の異なる上限値を決定するステップとを含み、
前記平均実行時間の上限値は、前記サーバにおいて受信される要求を前記複数のスレッド・プールのうちいずれのスレッド・プールに割当てるかを決定するために使用される、
方法。
前記上限値を決定するステップは、
前記複数の平均実行時間を配列内にコピーするステップと、
前記配列をその値に従ってソートするステップと、
前記配列の総数を前記使用可能な複数のスレッド・プールの数で割り、値「Ｎ」を見つけるステップと、
索引として「Ｎ」の整数倍を使用してアクセスされる前記配列の値を、前記各スレッド・プールの平均実行時間の異なる上限値とするステップとを含む、請求項１に記載の方法。
前記サーバにおいて受信される前記要求が前記サーバで実行されるときの実行時間を追跡するステップと、
前記追跡された実行時間を反映するように、前記複数の平均実行時間を更新するステップとをさらに含む、
請求項１に記載の方法。
前記更新された前記複数の平均実行時間を反映するように、前記各スレッド・プールの前記平均実行時間の異なる上限値を定期的に再計算するステップをさらに含む、請求項３に記載の方法。
前記サーバで処理された前記要求ごとの平均実行時間は、最近の所定間隔にわたって計算された、各要求の実行時間の移動平均値である、請求項１に記載の方法。
前記サーバで処理された要求はそのタイプによって識別され、前記複数の平均実行時間は前記要求のタイプごとに取得される、請求項１に記載の方法。
前記サーバで処理された要求はそのタイプ及び当該要求に含まれるパラメータ値によって識別され、前記複数の平均実行時間は前記要求のタイプおよび前記パラメータ値ごとに取得される、請求項１に記載の方法。
前記サーバで処理された要求は当該要求に基づいて呼び出される方法名によって識別され、前記複数の平均実行時間は方法名ごとに取得される、請求項１に記載の方法。
前記サーバで処理された要求は当該要求に基づいて呼び出される方法名及び当該方法に渡されるパラメータ値によって識別され、前記複数の平均実行時間は前記方法名および前記パラメータ値ごとに取得される、請求項１に記載の方法。
前記サーバで処理された要求は当該要求に基づいて呼び出される方法名、当該方法に渡されるパラメータ値および当該パラメータの名によって識別され、前記複数の平均実行時間は前記方法名、前記パラメータ名および前記パラメータ値ごとに取得される、請求項１に記載の方法。
前記サーバで処理された要求は当該要求に含まれるＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＩｄｅｎｔｉｆｉｅｒ（「ＵＲＩ」）およびＵＲＩの一部としてのパラメータ値によって各々識別され、前記複数の平均実行時間は前記ＵＲＩおよび前記パラメータ値ごとに取得される、請求項１に記載の方法。
前記サーバで処理された要求はその処理宛先によって識別され、前記複数の平均実行時間は処理宛先ごとに取得される、請求項１に記載の方法。
前記サーバでインバウンド要求を受け取るステップと、
前記受け取った要求の分類キーを決定するステップと、
前記決定された分類キーを使用して、前記受け取った要求の平均実行時間を突き止めるステップと、
前記突き止められた平均実行時間と前記決定された各スレッド・プールの平均実行時間の上限値とを、前記比較された平均実行時間の上限値が前記突き止められた平均実行時間よりも大きいかまたは等しくなるまで繰り返し比較することによって、前記受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止めるステップとをさらに含む、
請求項１に記載の方法。
前記スレッド・プールは論理スレッド・プールである、請求項１に記載の方法。
マルチスレッド・サーバ内のスレッド・プール全体にわたって、インバウンド要求をプログラムに基づいて分配するためのシステムであって、
使用可能な複数のスレッド・プールと、
サーバ上の作業負荷の履歴統計から、前記サーバで処理された要求ごとの平均実行時間を複数取得するための手段と、
前記複数の平均実行時間に基づいて、前記使用可能な複数のスレッド・プールの各々に対し、割り当てられる要求の平均実行時間の異なる上限値を決定するための手段と、
実行時に、インバウンド要求を前記サーバで受け取るための手段と、
前記平均実行時間の上限値に基づいて、前記インバウンド要求を、前記使用可能なスレッド・プールいずれかに割り当てるための手段とを含むシステム。
前記上限値を決定するための手段は、
前記複数の平均実行時間を配列内にコピーする手段と、
前記配列をその値に従ってソートする手段と、
前記配列の総数を前記使用可能な複数のスレッド・プールの数で割り、値「Ｎ」を見つけるための手段と、
索引として「Ｎ」の整数倍を使用してアクセスされる前記配列の値を、前記各スレッド・プールの平均実行時間の異なる上限値とするための手段とを含む、請求項１５に記載のシステム。
前記サーバにおいて受信される前記要求が前記サーバで実行されるときの実行時間を追跡するための手段と、
前記追跡された実行時間を反映するように、前記複数の平均実行時間を更新するための手段とをさらに含む、請求項１５に記載のシステム。
前記更新された前記複数の平均実行時間を反映するように、前記各スレッド・プールの前記平均実行時間の異なる上限値を定期的に再計算するための手段をさらに含む、請求項１７に記載のシステム。
前記サーバで処理された前記要求ごとの平均実行時間は、最近の所定間隔にわたって計算された、各要求の実行時間の移動平均値である、請求項１５に記載のシステム。
前記サーバで処理された要求はそのタイプによって識別され、前記複数の平均実行時間は前記要求のタイプごとに取得される、請求項１５に記載のシステム。
前記サーバで処理された要求は当該要求に基づいて呼び出される方法名によって識別され、前記複数の平均実行時間は方法名ごとに取得される、請求項１５に記載のシステム。
前記サーバで処理された要求は当該要求に含まれるＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＩｄｅｎｔｉｆｉｅｒ（「ＵＲＩ」）によって各々識別され、前記複数の平均実行時間は前記ＵＲＩごとに取得される、請求項１５に記載のシステム。
前記サーバで処理された要求はその処理宛先によって識別され、前記複数の平均実行時間は処理宛先ごとに取得される、請求項１５に記載のシステム。
前記割り当てるための手段は、
前記受け取った要求の分類キーを決定するための手段と、
前記決定された分類キーを使用して、前記受け取った要求の平均実行時間を突き止めるための手段と、
前記突き止められた平均実行時間と前記決定された各スレッド・プールの平均実行時間の上限値とを、前記比較された平均実行時間の上限値が前記突き止められた平均実行時間よりも大きいかまたは等しくなるまで繰り返し比較することによって、前記受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止めるための手段とをさらに含む、請求項１５に記載のシステム。
サーバのリソース全体にわたって作業負荷をプログラムに基づいて分配するためのコンピュータ・プログラムであって、コンピュータを、
使用可能な複数のスレッド・プールを用意する手段と、
サーバ上の作業負荷の履歴統計から、前記サーバで処理された要求ごとの平均実行時間を複数取得する手段と、
前記複数の平均実行時間に基づいて、前記使用可能な複数のスレッド・プールの各々に対し、割当てられる要求の平均実行時間の異なる上限値を決定する手段として機能させるためのコンピュータ・プログラムであって、
、前記平均実行時間の上限値は、前記サーバにおいて受信される要求を前記複数のスレッド・プールのうちいずれのスレッド・プールに割当てるかを決定するために使用される、
コンピュータ・プログラム。
前記上限値を決定する手段は、
前記複数の平均実行時間を配列内にコピーする手段と、
前記配列をその値に従ってソートする手段と、
前記配列の総数を前記使用可能な複数のスレッド・プールの数で割り、値「Ｎ」を見つける手段と、
索引として「Ｎ」の整数倍を使用してアクセスされる前記配列の値を、前記各スレッド・プールの実行時間の異なる上限値とする手段とを含む、請求項２５に記載のコンピュータ・プログラム。
コンピュータを、さらに、
前記サーバにおいて受信される前記要求が前記サーバで実行されるときの実行時間を追跡する手段と、
前記追跡された実行時間を反映するように、前記複数の平均実行時間を更新する手段として機能させる、請求項２５に記載のコンピュータ・プログラム。
コンピュータを、さらに、
前記更新された前記複数の平均実行時間を反映するように、前記各スレッド・プールの前記平均実行時間の異なる上限値を定期的に再計算する手段として機能させる、請求項２５に記載のコンピュータ・プログラム。
前記サーバで処理された要求はそのタイプ、当該要求に含まれるパラメータ名、およびパラメータ値によって識別され、前記複数の平均実行時間は前記要求タイプ、前記パラメータ名、および前記パラメータ値ごとに取得される、請求項２５に記載のコンピュータ・プログラム。
前記サーバで処理された要求は当該要求に基づいて呼び出される方法名および当該方法に渡されるパラメータ値によって識別され、前記複数の実行時間は前記方法名および前記パラメータ値ごとに取得される、請求項２５に記載のコンピュータ・プログラム。
前記サーバで処理された要求は当該要求に含まれるＵｎｉｆｏｒｍＲｅｓｏｕｒｃｅＩｄｅｎｔｉｆｉｅｒ（「ＵＲＩ」）およびＵＲＩの一部としてのパラメータ値によって各々識別され、前記複数の平均実行時間は前記ＵＲＩおよび前記パラメータ値ごとに取得される、請求項２５に記載のコンピュータ・プログラム。
前記サーバで処理された要求は処理宛先によって識別され、前記複数の平均実行時間は前記処理宛先ごとに取得される、請求項２５に記載のコンピュータ・プログラム。
コンピュータを、さらに、
前記サーバでインバウンド要求を受け取るための手段と、
前記受け取った要求の分類キーを決定するための手段と、
前記決定された分類キーを使用して、前記受け取った要求の平均実行時間を突き止めるための手段と、
前記突き止められた平均実行時間と前記決定された各スレッド・プールの平均実行時間の上限値とを、前記比較された平均実行時間の上限値が前記突き止められた平均実行時間よりも大きいかまたは等しくなるまで繰り返し比較することによって、前記受け取った要求が実行されることになる特定の使用可能なスレッド・プールを突き止めるための手段として機能させる、請求項２５に記載のコンピュータ・プログラム。
サーバのリソース全体にわたって作業負荷をプログラムに基づいて分配することにより、ビジネスを実行する方法であって、
前記サーバでの作業負荷の動作特徴をプログラムに基づいて監視するステップと、
前記サーバのリソース全体にわたって前記作業負荷をプログラムに基づいて分配するステップとを含み、当該分配するステップは、
使用可能な複数のスレッド・プールの数を決定するステップと、
前記作業負荷の履歴統計から、前記サーバで処理された要求ごとの平均実行時間を複数取得するステップと、
前記複数の平均実行時間に基づいて、前記使用可能な複数のスレッド・プールの各々に対し、割当てられる要求の平均実行時間の異なる上限値を決定するステップと、
実行時に、インバウンド要求を前記サーバで受け取るステップと、
前記平均実行時間の上限値に基づいて、前記インバウンド要求を、前記複数の使用可能なスレッド・プールのいずれかにに割り当てるステップとを含み、
前記方法は、前記プログラムに基づいて監視するステップおよび前記プログラムに基づいて分配するステップとを実行するための料金を課金するステップをさらに含む方法。