WO2014136302A1

WO2014136302A1 - タスク管理装置及びタスク管理方法

Info

Publication number: WO2014136302A1
Application number: PCT/JP2013/076660
Authority: WO
Inventors: 雅也藤若
Original assignee: 日本電気株式会社
Priority date: 2013-03-04
Filing date: 2013-10-01
Publication date: 2014-09-12

Abstract

　タスク管理装置（１００）は、サーバ装置上で実際に使用されているリソース量を示す実リソース使用量を取得するリソース情報取得部（１０１）と、取得された実リソース使用量の履歴に基づいて、サーバ装置のための、複数の所定空き確率についてその所定空き確率で保証される空きリソース量をそれぞれ示す確率的空きリソース情報を生成するリソース分析部（１０２）と、当該複数の所定空き確率の中から所定完了確率に対応する所定空き確率を選択し、当該サーバ装置のための確率的空きリソース情報により示される、その選択された所定空き確率で保証される空きリソース量に基づいて、対象タスクの実行計画を決定するスケジューリング部（１０３）と、を有する。

Description

タスク管理装置及びタスク管理方法

　本発明は、タスク等のソフトウェア実行単位のスケジューリング技術に関する。

　仮想化技術の普及により、データセンタ等では、複数の物理マシンのリソースが一元管理され、共有リソースプールとして扱われるようになってきている。例えば、複数の仮想マシンを１つのサーバ装置に集約することにより、効率的にリソースを利用することが可能である。しかしながら、依然としてサーバ装置には利用されていないリソースが存在する。リソースに空きが無い時間が存在する場合でも、一時的にリソースに空きができる場合は少なくない。ライブマイグレーション等を用いれば、このような一時的に生じる空きリソースを他の仮想マシンに利用させることができる。しかしながら、この手法は、ライブマイグレーション自体の移行コストや空きリソースの供給不確実性から効果的ではない。空きリソースの発生は、サーバ装置上で既に動作している仮想マシンやプロセスなどのリソース使用状況に依存するからである。

　仮想マシンへ割り当てるリソースの上限の設定や優先度制御も可能であるため、例えば、或る仮想マシンに対して、他の仮想マシンがリソースを利用していないときのみリソースを利用できるようにするといった制御も可能である。これにより、或る仮想マシンに対しては明示的に割り当てたリソース量を保証しつつ、他の仮想マシンに空きのリソースを利用させるといったリソースの効率的な利用が可能となる。例えば、高いサービスレベルを要求する仮想マシンには明示的にリソースを割り当て、低いサービスレベルの仮想マシンには空きのリソースを利用させるといった使い方が効果的である。

　一方で、ＭａｐＲｅｄｕｃｅ等の分散処理フレームワークの普及により、複数のサーバ装置のリソースを利用した分散処理が行われるようになってきている。このような技術は、例えば、大量なログをバッチ的に処理するタスクを実行する際に利用することができる。但し、一時的にリソースを利用できなくてもよいという点において、この技術に要求されるサービスレベルは低い。

　下記特許文献１では、仮想マシン及び物理マシン並びにネットワークの負荷の時間変化に基づいて、仮想マシン、物理マシン及びネットワークにおいて負荷が偏らないように、かつ、物理マシン及び仮想マシンにおけるＣＰＵ負荷のピークの重複が回避されるように、仮想マシンの移動をスケジューリングする手法が提案されている。下記特許文献２では、各仮想マシンの負荷の相関関係から、各仮想マシンの相対的な最大負荷量を予測し、動作する仮想マシンの最大負荷量の合計が各サーバ装置の許容負荷量以下に収まるように、各仮想マシンをサーバ装置に配備して、物理リソースの利用効率の向上を図る手法が提案されている。

　下記特許文献３では、各プロセスに関し予測される将来のリソース使用量に基づいて、所定の時間内に終了しない非終了プロセスの発生時間帯を予測し、その非終了プロセスを他の計算機に移して実行させることで、非終了プロセスの発生を未然に防ぐ手法が提案されている。下記特許文献４では、ジョブを分割・移動する必要が生じた場合に、各ノードのリソース使用率データを取得し、そのリソース使用率データで示される各ノードのＣＰＵ使用率等に基づいて、タスクの移動先となるノードを選択する手法が提案されている。下記特許文献５では、単位時間毎のプロセッサ使用状況をプロセッサごとにそれぞれ収集し、各プロセスの所要プロセッサリソース量、許容処理完了時間及び経過時間に基づいて、各プロセスに割り当てるプロセッサリソース量を決める手法が提案されている。

特開２０１０－１１７７６０号公報特開２０１０－２４４１８１号公報特開２００８－０１５９５８号公報特開２００８－１２３２０５号公報特開平０６－０２８３２３号公報

　しかしながら、上述の各提案手法は、仮想マシン、プロセス、ジョブ、タスク等のようなソフトウェア実行単位に対して、サーバ装置の許容リソース量を超えないように、又は、許容処理時間内に完了するように、サーバ装置自体又はサーバ装置のリソース量を割り当てているに過ぎない。しかしながら、上述したように、サーバ装置の空きリソースには、そのサーバ装置上で動作する実行単位に明示的に割り当てられたリソースを除外した残りのリソースに加えて、その明示的に割り当てられているリソースの中の一時的に利用されていないリソースも含まれる。以降、このような、実行単位に明示的に割り当てられているリソースの中の一時的に利用されていないリソースを一時空きリソースと表記する。また、上述のようなソフトウェア実行単位の中の、スケジューリング（実行計画の制御）対象となるものをタスクと総称する。

　上述の各提案手法は、このような一時空きリソースを有効活用することについては全く考慮されていない。一時空きリソースは、対象タスクが利用している間は、他のタスクは重複して確保できないため、利用の可否が確率的であるという特性を有する。よって、例えば、上記特許文献３及び５のような提案手法を用いたとしても、確率的にリソースが確保され得る状況での対象タスクの完了時間の確実性を定量的に判断することができない。

　本発明は、このような事情に鑑みてなされたものであり、サーバ装置の一時空きリソースを利用する条件下において、所望の確実性で要求に適合し得るタスクスケジューリング技術を提供する。

　本発明の各側面では、上述した課題を解決するために、それぞれ以下の構成を採用する。

　第１の側面は、タスク管理装置に関する。第１の側面に係るタスク管理装置は、サーバ装置上で実際に使用されているリソース量を示す実リソース使用量を取得するリソース情報取得部と、リソース情報取得部により取得される実リソース使用量の履歴に基づいて、サーバ装置のための、複数の所定空き確率についてその所定空き確率で保証される空きリソース量をそれぞれ示す確率的空きリソース情報を生成するリソース分析部と、対象タスクを実行させる少なくとも１つのサーバ装置を選択し、当該複数の所定空き確率の中から所定完了確率に対応する所定空き確率を選択し、選択されたサーバ装置のための確率的空きリソース情報により示される、その選択された所定空き確率で保証される空きリソース量に基づいて、対象タスクの実行計画を決定するスケジューリング部と、を有する。

　第２の側面は、少なくとも１つのコンピュータにより実行されるタスク管理方法に関する。第２の側面に係るタスク管理方法は、サーバ装置上で実際に使用されているリソース量を示す実リソース使用量を取得し、取得された実リソース使用量の履歴に基づいて、サーバ装置のための、複数の所定空き確率についてその所定空き確率で保証される空きリソース量をそれぞれ示す確率的空きリソース情報を生成し、対象タスクを実行させる少なくとも１つのサーバ装置を選択し、複数の所定空き確率の中から所定完了確率に対応する所定空き確率を選択し、選択されたサーバ装置のための確率的空きリソース情報により示される、選択された所定空き確率で保証される空きリソース量に基づいて、対象タスクの実行計画を決定する、ことを含む。

　なお、本発明の他の側面としては、上記第２の側面の方法を少なくとも１つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。

　上記各側面によれば、サーバ装置の一時空きリソースを利用する条件下において、所望の確実性で要求に適合し得るタスクスケジューリング技術を提供することができる。

　上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。

本発明の実施の形態に係るタスク管理装置の構成例を概念的に示す図である。第１実施形態におけるタスク管理システムの構成例を概念的に示す図である。第１実施形態におけるタスク管理システムにおける処理構成例を概念的に示す図である。第１実施形態における管理装置の動作例を示すフローチャートである。１９時から２０時におけるサーバ装置１０（＃１）のＣＰＵの実リソース使用量の履歴を示すヒストグラムである。２０時から２１時におけるサーバ装置１０（＃１）のＣＰＵの実リソース使用量の履歴を示すヒストグラムである。１９時から２０時におけるサーバ装置１０（＃２）のＣＰＵの実リソース使用量の履歴を示すヒストグラムである。２０時から２１時におけるサーバ装置１０（＃２）のＣＰＵの実リソース使用量の履歴を示すヒストグラムである。１９時から２０時におけるサーバ装置１０（＃３）のＣＰＵの実リソース使用量の履歴を示すヒストグラムである。２０時から２１時におけるサーバ装置１０（＃３）のＣＰＵの実リソース使用量の履歴を示すヒストグラムである。実施例１における空きリソースモデルＤＢを示す図である。図８に示される空きリソースモデルに基づいて計算された処理能力の例を示す図である。第２実施形態における管理装置の動作例を示すフローチャートである。２つのサーバ装置に入力データを処理させる場合の、実施例２におけるタスクスケジューラで算出される中間データの例を示す図である。３つのサーバ装置に入力データを処理させる場合の、実施例２におけるタスクスケジューラで算出される中間データの例を示す図である。或る所定空き確率に対応する１９時帯及び２０時帯での各サーバ装置の空きリソースの処理能力の例を示す図である。

　以下、本発明の実施の形態について説明する。なお、以下に挙げる実施形態は例示であり、本発明は以下の実施形態の構成に限定されない。

　図１は、本発明の実施の形態に係るタスク管理装置１００の構成例を概念的に示す図である。図１に示されるように、タスク管理装置１００は、リソース情報取得部１０１と、リソース分析部１０２と、スケジューリング部１０３とを有する。リソース情報取得部１０１は、サーバ装置上で実際に使用されているリソース量を示す実リソース使用量を取得する。リソース分析部１０２は、リソース情報取得部１０１により取得される実リソース使用量の履歴に基づいて、サーバ装置のための、複数の所定空き確率についてその所定空き確率で保証される空きリソース量をそれぞれ示す確率的空きリソース情報を生成する。スケジューリング部１０３は、対象タスクを実行させる少なくとも１つのサーバ装置を選択し、当該複数の所定空き確率の中から所定完了確率に対応する所定空き確率を選択し、選択されたサーバ装置のための確率的空きリソース情報により示される、その選択された所定空き確率で保証される空きリソース量に基づいて、対象タスクの実行計画を決定する。

　タスク管理装置１００は、例えば、後述する詳細実施形態における管理装置２０と同様のハードウェア構成を有し、その管理装置２０と同様にプログラムが処理されることで、上述の各処理部が実現される。

　また、本発明の実施の形態に係るタスク管理方法は、少なくとも１つのコンピュータにより実行される。当該タスク管理方法は、サーバ装置上で実際に使用されているリソース量を示す実リソース使用量を取得し、取得された実リソース使用量の履歴に基づいて、サーバ装置のための、複数の所定空き確率についてその所定空き確率で保証される空きリソース量をそれぞれ示す確率的空きリソース情報を生成し、対象タスクを実行させる少なくとも１つのサーバ装置を選択し、複数の所定空き確率の中から所定完了確率に対応する所定空き確率を選択し、選択されたサーバ装置のための確率的空きリソース情報により示される、選択された所定空き確率で保証される空きリソース量に基づいて、対象タスクの実行計画を決定する、ことを含む。

　このように、本実施形態では、サーバ装置の実リソース使用量が取得され、実リソース使用量の履歴に基づいて、確率的空きリソース情報が生成される。ここで、実リソース使用量とは、サーバ装置で実行される各ソフトウェア実行単位に明示的に割り当てられているリソースの量ではなく、そのサーバ装置で各ソフトウェア実行単位により実際に使用されているリソースの量を意味する。また、所定空き確率とは、対応する空きリソース量が保証される確からしさの程度を意味する。これにより、本実施形態で生成される確率的空きリソース情報は、空きリソース量と、その空きリソース量が保証される確からしさの程度（所定空き確率）との対応関係を示す。空きリソース量には、ソフトウェア実行単位に明示的に割り当てられているリソースの中で一時的に利用されていない一時空きリソースの量も含まれるため、確率的空きリソース情報で示される空きリソース量は、確実に確保が保証されるリソース量ではなく、確率的な情報（所定空き確率）と関連付けられる。

　更に、本実施形態では、対象タスクの実行計画を決定するにあたり、複数の所定空き確率の中から所定完了確率に対応する所定空き確率が選択される。ここで、所定完了確率とは、決定された実行計画に基づいて対象タスクが実行された場合に、その実行計画に対する要求に適合する確からしさを意味する。ここで実行計画に対する要求とは、例えば、対象タスクを要求時間内に完了させることや、対象タスクを短い時間で完了させることなどである。但し、本実施形態では、実行計画に対する要求の内容を制限しない。

　これにより、言い換えれば、本実施形態では、所望の精度（所定完了確率）で要求に適合する実行計画を決めるために、保証される必要のある空きリソース量の確保の確からしさが決定される。対象タスクを実行させるサーバ装置が１つの場合、所定空き確率は、所定完了確率と同等の値に決められてもよい。また、対象タスクを実行させるサーバ装置が複数の場合、対象タスクの実行計画の精度は、全てのサーバ装置でそれぞれ空きリソースが利用された結果に依存するため、所定空き確率は、所定完了確率よりも高い値に決められる。

　そして、本実施形態では、当該確率的空きリソース情報により示される、当該選択された所定空き確率で保証される空きリソース量に基づいて、対象タスクの実行計画が決定される。ここで、対象タスクの実行計画とは、対象タスクをどのサーバ装置上で実行するか、対象タスクをいつ実行するか、対象タスクのためのデータをどのように移送するか等といった、対象タスクを実行するための何らかの計画を意味する。本実施形態では、この実行計画の内容自体は制限されない。

　このように、本実施形態では、所望の精度（所定完了確率）で要求に適合するための空きリソース量の確率情報（所定空き確率）に基づいて、タスクの実行計画が決定される。従って、本実施形態によれば、利用の可否が確率的であるという特性を持つサーバ装置の一時空きリソースを利用するという条件の下、所望の確実性で要求に適合し得るタスクの実行計画の策定（タスクスケジューリング）を実現することができる。

　以下、上述の実施形態について更に詳細を説明する。以下には、詳細実施形態として第１実施形態、第２実施形態及び第３実施形態を例示する。以下の各詳細実施形態は、上述のタスク管理装置及びタスク管理方法をタスク管理システムに適用した場合の例である。

　［第１実施形態］
　〔システム構成〕
　図２は、第１実施形態におけるタスク管理システム１の構成例を概念的に示す図である。第１実施形態におけるタスク管理システム１は、複数のサーバ装置１０（＃１）から１０（＃ｎ）、管理装置２０等を有する。以降、複数のサーバ装置１０（＃１）から１０（＃ｎ）は、個別に区別する必要がある場合を除き、サーバ装置１０と総称される。

　管理装置２０は、少なくとも１つの対象タスクを複数のサーバ装置１０の中の少なくとも１つに実行させるために、複数のサーバ装置１０を管理し、仮想マシンのサーバ装置１０への配備及び仮想マシンのリソース割当等を行う。
　サーバ装置１０は、管理装置２０からの指示により、割り当てられた仮想マシンを実行する。

　サーバ装置１０及び管理装置２０は、いわゆるコンピュータであり、例えば、バス５で相互に接続される、ＣＰＵ（Central Processing Unit）２、メモリ３、入出力インタフェース（Ｉ／Ｆ）４等を有する。メモリ３は、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、ハードディスク、可搬型記憶媒体等である。入出力Ｉ／Ｆ４は、ネットワーク９を介して他の装置と通信を行う通信装置７と接続される。なお、入出力Ｉ／Ｆ４は、キーボード、マウス等のようなユーザ操作の入力を受け付ける装置や、ディスプレイ装置やプリンタ等のようなユーザに情報を提供する装置に接続されてもよい。サーバ装置１０及び管理装置２０のハードウェア構成は制限されない。

　サーバ装置１０及び管理装置２０はネットワーク９を介して相互に通信可能に接続されている。ネットワーク９は、インターネット等のような公衆網、ＷＡＮ（Wide Area Network）、ＬＡＮ（Local Area Network）、無線通信ネットワーク等である。なお、本実施形態において、サーバ装置１０間、各サーバ装置１０と管理装置２０との間の各通信形態は制限されない。

　図３は、第１実施形態におけるタスク管理システム１における処理構成例を概念的に示す図である。タスク管理システム１は、図３に示されるように、性能情報データベース（ＤＢ）３０、タスク情報管理データベース（ＤＢ）３１、入力データ管理データベース（ＤＢ）３２、空きリソースモデルデータベース（ＤＢ）３３を有する。これらデータベースは、管理装置２０により実現されてもよいし、他の装置により実現されてもよい。

　性能情報ＤＢ３０は、各サーバ装置１０からそれぞれ収集された実リソース使用量を時間情報と共にそれぞれ格納する。例えば、性能情報ＤＢ３０は、サーバ装置１０を特定し得るサーバＩＤ、そのサーバ装置１０の実リソース使用量、及び、その実リソース使用量の時間情報を相互に関連付けた状態で格納する。実リソース使用量の時間情報は、例えば、その実リソース使用量が収集された時間を示す。

　タスク情報管理ＤＢ３１は、対象タスクに関するタスク情報を格納する。タスク情報は、タスクを特定し得るタスクＩＤ、タスクの開始時刻、タスクのデッドライン時刻等を示す。タスクのデッドライン時刻は、タスクの要求時間に相当する。但し、タスク情報は、タスクのデッドライン時刻に代えて、タスクの開始から完了までの時間制限を示すようにしてもよい。

　入力データ管理ＤＢ３２は、対象タスクにより処理される入力データの管理情報を格納する。入力データの管理情報は、当該入力データが複数のサーバ装置１０に分散配置される場合には、当該入力データが分散配置されている各サーバ装置１０における分散入力データの量をそれぞれ示す入力データ所在情報を含む。例えば、入力データの管理情報は、当該入力データの部分データとなる分散入力データ毎に、その分散入力データの量と、その分散入力データが存在するサーバ装置１０に関する情報とを示す。以降、各サーバ装置１０が持つ分散入力データが、単に入力データと表記される場合もある。

　空きリソースモデルＤＢ３３は、各サーバ装置１０について、空きリソースモデルをそれぞれ格納する。空きリソースモデルは、上述の確率的空きリソース情報に相当し、複数の所定空き確率の各々についてその所定空き確率で保証される空きリソース量をそれぞれ示す。空きリソースモデルで示される空きリソース量は、実行されるソフトウェア要素に明示的に割り当てられていないリソースの量だけでなく、上述の一時空きリソースの量も含まれる。

　〔サーバ装置〕
　サーバ装置１０は、少なくとも１つの仮想マシン１１を実行可能である。以降、仮想マシンは、ＶＭ（Virtual Machine）とも表記される。サーバ装置１０は、仮想マシン（ＶＭ）制御部１２、性能情報計測部１３等を有する。ＶＭ１１、ＶＭ制御部１２及び性能情報計測部１３は、例えば、ＣＰＵ２によりメモリ３に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、ＣＤ（Compact Disc）、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから入出力Ｉ／Ｆ４を介してインストールされ、メモリ３に格納されてもよい。

　サーバ装置１０で実行されるＶＭ１１の少なくとも１つは、タスク管理システム１において実行計画の策定対象となる対象タスクを、管理装置２０により決定される実行計画に基づいて、実行する。
　ＶＭ制御部１２は、ＶＭ１１の起動及び終了、並びに、ＶＭ１１へのリソース割当等を行う。

　性能情報計測部１３は、サーバ装置１０上で実際に使用されているリソース量を示す実リソース使用量を計測する。性能情報計測部１３により計測される実リソース使用量は、サーバ装置１０上で実行されているＶＭ１１やタスク等の全てのソフトウェア要素で利用されている総リソース使用量である。ここで、実リソース使用量は、サーバ装置１０上で実行されるソフトウェア要素に明示的に割り当てられているリソースの量とは異なり、計測時において使用中のリソースの量である。

　性能情報計測部１３は、複数のリソース種の各々について実リソース使用量をそれぞれ計測してもよい。具体的には、性能情報計測部１３は、ＣＰＵリソース、ネットワークリソース、ディスクリソース、メモリリソースのような複数のリソース種について、ＣＰＵ使用率、ネットワーク受信量、ネットワーク送信量、ディスク読み込み量、ディスク書き込み量、メモリ使用量を当該実リソース使用量として計測してもよい。

　〔管理装置〕
　管理装置２０は、タスク受付部２１、タスクスケジューラ２２、性能情報収集部２３、空きリソース分析部２４、入力データ管理部２５、仮想マシン（ＶＭ）管理部２６等を有する。これら各処理部は、例えば、ＣＰＵ２によりメモリ３に格納されるプログラムが実行されることによりそれぞれ実現される。また、当該プログラムは、例えば、ＣＤ（Compact Disc）、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから入出力Ｉ／Ｆ４を介してインストールされ、メモリ３に格納されてもよい。

　タスク受付部２１は、対象タスクを受け付け、対象タスクのタスク情報をタスク情報管理ＤＢ３１へ格納する。対象タスクの受け付けは、入力画面等に基づいて入力装置（図示せず）をユーザが操作することで入力された情報を入出力Ｉ／Ｆ４を介して取得することで実現されてもよいし、可搬型記録媒体、他のコンピュータ等から入出力Ｉ／Ｆ４を経由して情報を取得することで実現されてもよい。

　性能情報収集部２３は、定期的に、各サーバ装置１０から実リソース使用量をそれぞれ収集し、収集された実リソース使用量をサーバ装置１０のサーバＩＤ及び時間情報と共に性能情報ＤＢ３０に格納する。性能情報収集部２３は、サーバ装置１０から自発的に送られてくる実リソース使用量を受信するようにしてもよい。

　入力データ管理部２５は、入力データ管理ＤＢ３２に格納される入力データの管理情報を用いて、対象タスクにより処理される入力データを管理する。入力データ管理部２５は、各サーバ装置１０から当該入力データの情報を取得し、この情報を当該入力データの管理情報として入力データ管理ＤＢ３２に格納するようにしてもよい。入力データ管理部２５は、入力データが移送された場合には、その移送に伴い、入力データ管理ＤＢ３２に格納される管理情報を更新する。入力データの管理情報は、上述のように、入力データ所在情報を含むため、入力データ管理部２５は、入力データ取得部と呼ぶこともできる。

　空きリソース分析部２４は、各サーバ装置１０について上述の空きリソースモデルをそれぞれ生成し、生成された空きリソースモデルをサーバ装置１０のサーバＩＤと共に空きリソースモデルＤＢ３３に格納する。空きリソース分析部２４は、性能情報ＤＢ３０に格納される各サーバ装置１０の実リソース使用量の一定期間の履歴に基づいて、当該空きリソースモデルを生成する。空きリソースモデルで示される複数の所定空き確率は、空きリソース分析部２４により予め保持されていてもよいし、入力装置（図示せず）等から入力されてもよいし、他の装置から取得されてもよい。

　空きリソース分析部２４は、例えば、空きリソースモデルで示される空きリソース量を次のように算出する。性能情報ＤＢ３０に上述した総リソース使用量の履歴が格納されている場合、空きリソース分析部２４は、その履歴の同時間における複数の総リソース使用量から、各所定空き確率に対応する各パーセンタイルに相当する値をそれぞれ算出する。そして、空きリソース分析部２４は、サーバ装置１０の能力となる最大リソース量から、その算出された各値をそれぞれ減算することで、同時間毎に、各所定空き確率で保証される各空きリソース量をそれぞれ算出する。ここで、総リソース使用量の履歴の同時間とは、異なる日の同じ時間を意味する。よって、例えば、総リソース使用量の履歴が１日周期の場合、同時間は、同時刻を意味し、当該履歴が１週間周期の場合、同時間は、同じ曜日かつ同じ時刻を意味する。空きリソース分析部２４は、性能情報ＤＢ３０に格納される総リソース使用量の履歴とサーバ装置１０の最大リソース量とに基づいて、空きリソース量の履歴を算出し、この履歴の同時間における複数の空きリソース量から、各所定空き確率に対応する各パーセンタイルに相当する値をそれぞれ算出し、算出された各値を各所定空き確率で保証される各空きリソース量としてもよい。

　一方、性能情報ＤＢ３０に上述した総リソース使用量及び各ＶＭ１１のリソース使用量が格納される場合、空きリソース分析部２４は、現在動作している全ＶＭ１１が今まで動作し続けていると仮定して、空きリソース量を算出する。例えば、過去の或る時点ｔｐで、ＶＭ（Ａ）及びＶＭ（Ｂ）が稼働されており、現時点ｔｃで、ＶＭ（Ｂ）及びＶＭ（Ｃ）が稼働されている場合を例示する。この場合、時点ｔｐでもＶＭ（Ｂ）及びＶＭ（Ｃ）が稼働されていたと仮定する。即ち、空きリソース分析部２４は、時点ｔｐの総リソース使用量から、時点ｔｐでのＶＭ（Ａ）のリソース使用量を減算し、時点ｔｐでのＶＭ（Ｃ）のリソース使用量を加算することで、時点ｔｐの実リソース使用量を算出する。この場合、空きリソース分析部２４は、各時点での実リソース使用量を算出し、以降、上述と同様の手法により、各所定空き確率で保証される各空きリソース量をそれぞれ算出する。

　これにより、ＶＭ１１の移動に伴う空きリソース量の変動を捨象して空きリソース量が計算されるため、ＶＭ１１の移動を伴うシステムにおいても空きリソースモデルの精度を維持することができる。例えば、空きリソースモデルは、１時間毎に、複数の所定空き確率に対応する複数の空きリソース量を示す離散的なモデルとなる。空きリソースモデルは、連続値を示すモデルであってもよい。

　タスクスケジューラ２２は、タスク受付部２１により受け付けられた対象タスクが所定完了確率で要求時間内に完了するように、当該対象タスクの実行計画を決定する。当該要求時間は、タスク情報管理ＤＢ３１に格納される情報であり、例えば、対象タスクのデッドライン時刻である。当該所定完了確率は、同様に、タスク情報管理ＤＢ３１に格納されていてもよいし、タスクスケジューラ２２により予め保持されていてもよい。

　具体的には、まず、タスクスケジューラ２２は、入力データ管理部２５で管理される対象タスクの入力データの管理情報に基づいて、対象タスクを実行させるサーバ装置１０を決定する。そして、タスクスケジューラ２２は、この決定されたサーバ装置１０の数に基づいて、空きリソース分析部２４により生成された空きリソースモデルで示される複数の所定空き確率の中から、上記所定完了確率に対応する所定空き確率を選択する。例えば、複数の所定空き確率が８０％、９０％及び９３％であり、所定完了確率が８０％であり、かつ、対象タスクを２台のサーバ装置１０で実行する場合、所定完了確率に対応する所定空き確率は、９０％に決定される。例えば、各サーバ装置１０における８０％保証の空きリソースがそれぞれ用いられた場合、２台のサーバ装置１０全体として保証される確率は、６４％（＝０．８×０．８）となり、所定完了確率（８０％）を満たさないと考えられる。しかし、９０％保証の空きリソースがそれぞれ用いられた場合、２台のサーバ装置１０全体として保証される確率は、８１％（＝０．９×０．９）となり、所定完了確率（８０％）を満たすと考えられる。但し、対象タスクを１台のサーバ装置１０で実行する場合には、所定完了確率（８０％）以下の所定空き確率（８０％）が選択されればよい。このように複数のサーバ装置１０の一時空きリソースを利用する場合、対象タスクを実行させるサーバ装置１０の数が多くなるほど単一のサーバ装置１０に対して求められる空きリソースの確実性（空き確率）は高くなる。対象タスクを実行させるサーバ装置１０は、対象タスクの入力データを持つサーバ装置１０に決定される。

　次に、タスクスケジューラ２２は、決定された各サーバ装置１０における、所定完了確率に対応する所定空き確率で保証される各空きリソース量、及び、当該各サーバ装置１０が持つ入力データの量に基づいて、各サーバ装置１０上でそれぞれ実行される対象タスクが要求時間内に完了するか否かを判定する。タスクスケジューラ２２は、所定空き確率で保証される空きリソース量を用いて入力データが処理された場合にかかる処理時間を算出し、算出された処理時間を当該要求時間と比較することにより、上記判定を行う。

　タスクスケジューラ２２は、上記判定結果に基づいて、対象タスクの実行計画の１つとして、対象タスクを実行させる複数のサーバ装置１０を確定する。このとき、タスクスケジューラ２２は、タスク情報管理ＤＢ３１に格納されるタスク情報に基づいて、対象タスクの開始時刻も当該実行計画として決定する。

　タスクスケジューラ２２は、或るサーバ装置１０について対象タスクが要求時間内に完了しないと判定した場合、そのサーバ装置１０が持つ分散入力データの少なくとも一部の移送を決定する。対象タスクが要求時間内に完了しないと判定されたサーバ装置１０は、オーバフローサーバ装置と表記される場合もある。この場合、タスクスケジューラ２２は、その移送される分散入力データの移送先となるサーバ装置１０を決定し、その分散入力データの移送時間と、その移送先のサーバ装置１０におけるその移送される分散入力データに対する処理時間とを含む対象タスクの処理時間が、要求時間内に収まるか否かを判定する。このとき、タスクスケジューラ２２は、入力データを処理させるサーバ装置１０が複数存在している場合、その中から移送先のサーバ装置１０を決定することが望ましい。これにより、対象タスクの実行を少ない数のサーバ装置１０に集約することができ、リソースの有効活用に繋がるからである。タスクスケジューラ２２は、上記判定結果に基づいて、入力データの移送、及び、移送先となるサーバ装置１０での対象タスクの実行を、上記実行計画として更に決定する。

　また、タスクスケジューラ２２は、当該選択された所定空き確率で保証される空きリソース量に基づいて、オーバフローサーバ装置１０における、その空きリソース量で処理可能な最大入力データ量を算出し、分散入力データの量とその最大入力データ量との差分を、オーバフローサーバ装置１０から移送させる分散入力データの量として算出する。

　仮想マシン管理部２６は、タスクスケジューラ２２により決定された実行計画に基づいて、タスク開始時刻に対象タスクを実行するためのＶＭ１１を配備し稼働させるように、対象タスクを実行させると決定されたサーバ装置１０のＶＭ制御部１２に指示する。仮想マシン管理部２６は、入力データの移送が実行計画で示されている場合には、移送する入力データの量と共に入力データの移送を移送元のサーバ装置１０又は移送先のサーバ装置１０に指示する。また、仮想マシン管理部２６は、対象タスクが完了後、ＶＭ１１を終了させるように、ＶＭ制御部１２に指示するようにしてもよい。

　また、仮想マシン管理部２６は、対象タスク又は対象タスクを実行するために配備されたＶＭ１１が一時空きリソースを用いて実行されるようにＶＭ制御部１２に指示するようにしてもよい。この指示により、ＶＭ制御部１２は、対象タスクが一時空きリソースを用いて動作している最中に、そのサーバ装置１０上で動作しており、かつ、リソースが明示的に割当てられているソフトウェア実行単位（タスク、プロセス、仮想マシン等）がリソースを要求した際には、利用している一時空きリソースを対象タスクに解放させ、そのソフトウェア実行単位が明示的に割当てられているリソース量を確保できるように制御する。

　本実施形態では、仮想マシン管理部２６が、タスクスケジューラ２２により決定された実行計画に沿って対象タスクをスケジューリングするためにＶＭ１１の配備等を行ったが、管理装置２０は、サーバ装置１０に対して直接制御するようにしてもよい。この場合、直接、対象タスクを制御することになるため、仮想マシン管理部２６は、タスク制御部と呼ぶこともできる。

　〔動作例〕
　以下、第１実施形態におけるタスク管理方法について図４を用いて説明する。以下の説明では、管理装置２０及びサーバ装置１０が各方法の実行主体となるが、管理装置２０及びサーバ装置１０に含まれる上述の各処理部が実行主体となってもよい。図４は、第１実施形態における管理装置２０の動作例を示すフローチャートである。

　前提として、各サーバ装置１０は、任意のタイミングで、サーバ装置１０自身の実リソース使用量をそれぞれ計測している。複数のサーバ装置１０の代表となる少なくとも１つのサーバ装置１０が、他のサーバ装置１０の実リソース使用量を計測するようにしてもよい。また、管理装置２０は、所定の周期で、各サーバ装置１０の実リソース使用量をそれぞれ収集し、収集された実リソース使用量を性能情報ＤＢ３０に格納している。各サーバ装置１０の実リソース使用量の計測タイミングは、管理装置２０の収集周期と同一又はそれより短い周期となる。

　管理装置２０は、所定周期でタスク情報管理ＤＢ３１を参照し（Ｓ４１、Ｓ４２）、スケジューリングされていないタスクの存在を確認する（Ｓ４３）。管理装置２０は、スケジューリングされていないタスクを検出すると（Ｓ４３；ＹＥＳ）、この検出された各タスクを対象にそれぞれ以下のように動作する。以降、この検出されたタスクを対象タスクと表記する。

　管理装置２０は、対象タスクの所定完了確率と、対象タスクの入力データを持つサーバ装置１０とを特定する。所定完了確率は、タスク情報管理ＤＢ３１に格納される対象タスクのタスク情報で示されていてもよいし、管理装置２０により予め保持されていてもよい。入力データを持つサーバ装置１０は、入力データ管理ＤＢ３２に格納される管理情報に基づいて特定される。

　管理装置２０は、対象タスクの所定完了確率と、対象タスクの入力データを持つサーバ装置１０の数とに基づいて、空きリソースモデルで示される複数の所定空き確率の中から、その所定完了確率に対応する所定空き確率を選択する（Ｓ４４）。所定完了確率に対応する所定空き確率の選択の具体的手法については上述したとおりである。

　続いて、管理装置２０は、空きリソースモデルで示される、当該選択された所定空き確率で保証される空きリソース量、及び、入力データの量（サイズ）に基づいて、対象タスクの入力データを持つ各サーバ装置１０上で実行される対象タスクの完了時間をそれぞれ算出する（Ｓ４５）。算出される完了時間は、対象タスクの終了時刻であってもよいし、対象タスクの開始から終了までの期間であってもよい。このとき、管理装置２０は、性能情報ＤＢ３０に格納される実リソース使用量に基づいて、対象タスクの入力データを持つ各サーバ装置１０の空きリソースモデルをそれぞれ生成してもよい。空きリソースモデルの生成は、別途、独自のタイミングで生成されてもよい。

　管理装置２０は、対象タスクのタスク情報に要求時間（デッドライン時刻又は制限時間）が設定されているか否かを確認する（Ｓ４６）。管理装置２０は、要求時間が設定されていない場合（Ｓ４６；ＮＯ）、入力データを持つ各サーバ装置１０に対象タスクを実行させるよう対象タスクの実行計画を決定し、この実行計画に基づいて対象タスクのスケジューリングを行う（Ｓ４７）。対象タスクのスケジューリングでは、管理装置２０は、上述したように、タスク開始時刻に対象タスクを実行するためのＶＭ１１を配備し稼働させるように、対象タスクを実行させると決定されたサーバ装置１０に指示する。このとき、管理装置２０は、各サーバ装置１０について（Ｓ４５）で算出された完了時間を出力するようにしてもよい。管理装置２０は、例えば、完了時間を示す出力データを生成し、入出力Ｉ／Ｆ４を介して表示装置や他の出力装置（印刷装置や記録媒体など）に出力する。

　一方、管理装置２０は、要求時間が設定されている場合（Ｓ４６；ＹＥＳ）、（Ｓ４５）で算出された完了時間がその要求時間を超えるサーバ装置１０（オーバフローサーバ装置１０）が存在するか否かを確認する（Ｓ４８）。管理装置２０は、オーバフローサーバ装置１０が存在しない場合（Ｓ４８；ＮＯ）、入力データを持つ各サーバ装置１０に対象タスクを実行させるよう対象タスクの実行計画を決定し、この実行計画に基づいて対象タスクのスケジューリングを行う（Ｓ４７）。

　管理装置２０は、オーバフローサーバ装置１０が存在する場合（Ｓ４８；ＹＥＳ）、各オーバフローサーバ装置１０について超過分の入力データの量をそれぞれ算出する（Ｓ４９）。管理装置２０は、オーバフローサーバ装置１０に関し、選択された所定空き確率に対応する空きリソース量で処理可能な最大入力データ量を算出し、元の入力データ量からその最大入力データ量を減算することで、超過分の入力データの量を算出することが出来る。

　管理装置２０は、そのオーバフローサーバ装置１０以外の、対象タスクの入力データを持つサーバ装置１０の中で、空きリソース量に余剰のあるサーバ装置１０が存在するか否かを確認する（Ｓ５０）。以降、空きリソース量に余剰のあるサーバ装置１０を余剰サーバ装置１０と表記する。管理装置２０は、対象タスクの完了時間をデッドライン時刻以内とすることができる最大入力データ量を算出し、元の入力データ量よりもこの最大入力データ量が多いサーバ装置１０を余剰サーバ装置１０と決めることができる。

　管理装置２０は、余剰サーバ装置１０が存在する場合（Ｓ５０；ＹＥＳ）、余剰サーバ装置１０の中の１つを上記超過分の入力データの移送先に決定する（Ｓ５１）。これにより、超過分の入力データの移送が決定されたオーバフローサーバ装置１０は、完了時間が要求時間を超えないサーバ装置１０となる。

　管理装置２０は、入力データの移送を考慮して、移送先及び移送元の各サーバ装置１０での対象タスクの完了時間をそれぞれ再計算する（Ｓ５２）。具体的には、管理装置２０は、超過分の入力データの移送時間、及び、当該移送先に決定された余剰サーバ装置１０における元の入力データ及び超過分の入力データに対する処理時間を推定し、移動先のサーバ装置１０での対象タスクの完了時間を再計算する（Ｓ５２）。更に、管理装置２０は、移送後の入力データ量に基づいて、移送元のサーバ装置１０に関し、対象タスクの完了時間を再計算する。これにより、管理装置２０は、（Ｓ５２）で再計算された完了時間及び（Ｓ４５）で計算された完了時間が要求時間を超えるサーバ装置１０が存在するか否かを確認し（Ｓ４８）、（Ｓ４９）以降を再度実行する。

　管理装置２０は、対象タスクの入力データを持つサーバ装置１０の中に、余剰サーバ装置１０が存在しない場合（Ｓ５０；ＮＯ）、更に、対象タスクの入力データを持たないサーバ装置１０の中で、余剰サーバ装置１０が存在するか否かを確認する（Ｓ５３）。管理装置２０は、余剰サーバ装置１０が存在しない場合（Ｓ５３；ＮＯ）、リソース不足と判定する（Ｓ５４）。管理装置２０は、リソース不足判定の結果を出力するようにしてもよい。

　管理装置２０は、余剰サーバ装置１０が存在する場合（Ｓ５３；ＹＥＳ）、対象タスクを処理するサーバ装置１０の数が増えるため、所定完了確率に対応する所定空き確率を再選択する（Ｓ５５）。対象タスクを処理するサーバ装置１０の数が増加した場合、所定完了確率を満たすために、より高い所定空き確率が選択される。

　管理装置２０は、対象タスクの入力データを持たないサーバ装置１０の中の１つを上記超過分の入力データの移送先に決定する（Ｓ５１）。管理装置２０は、この移送先に決定されたサーバ装置１０を考慮に加えて、（Ｓ５２）以降を実行する。管理装置２０は、完了時間が要求時間を超過するサーバ装置が存在しなくなるまで、このような処理を繰り返し実行する。

　〔第１実施形態の作用及び効果〕
　上述したように第１実施形態では、複数のサーバ装置１０の各々の実リソース使用量が収集され、当該複数のサーバ装置１０の各々のための確率的空きリソース情報が生成される。また、入力データが分散配置されている各サーバ装置１０における分散入力データの量をそれぞれ示す入力データ管理情報が管理され、分散入力データを持つ複数のサーバ装置が対象タスクを実行させるサーバ装置として選択される。そして、選択された各サーバ装置のための各確率的空きリソース情報で示される、所定完了確率に対応する所定空き確率で保証される空きリソース量、及び、対象タスクで処理される入力データの量に基づいて、対象タスクが要求時間内に完了するか否かが判定される。そして、この判定結果に基づいて、対象タスクの実行計画が決定される。

　従って、第１実施形態によれば、サーバ装置１０の空きリソースを利用するという条件下において、所定完了確率で示される確実性で、対象タスクが要求時間内に完了するような対象タスクの実行計画を策定することができる。言い換えれば、第１実施形態によれば、利用の可否が確率的であるという特性を持つ空きリソースを利用することを考慮に入れた上で、対象タスクの完了時間の確実性を定量的に判断することができる。

　更に、第１実施形態では、入力データを処理させると仮決定されたサーバ装置１０のうち、対象タスクを要求時間内に完了させることができないと推定されるオーバフローサーバ装置が特定され、そのオーバフローサーバ装置が持つ分散入力データの少なくとも一部を他のサーバ装置１０で実行することが決定される。この場合、第１実施形態では、移送先となるサーバ装置１０が決定され、分散入力データの移送時間を含む対象タスクの処理時間が要求時間内に完了するか否かが判定される。このように、第１実施形態によれば、対象タスクが所定の精度で要求時間内に完了するように、対象タスクを実行させるサーバ装置１０や入力データの移送を決定することができる。

　更に、第１実施形態では、オーバフローサーバ装置の確率的空きリソース情報に基づいて、オーバフローサーバ装置における、選択された所定空き確率に対応する空きリソース量で処理可能な最大入力データ量が算出され、分散入力データの量とその最大入力データ量との差分が、オーバフローサーバ装置から移送させる分散入力データの量として算出される。このように、オーバフローサーバ装置には、空きリソース量で処理可能な最大入力データ量が処理対象として残される。即ち、第１実施形態において決定された実行計画によれば、各サーバ装置１０において、空きリソースを効率よく利用することができる。結果、第１実施形態によれば、タスク管理システム１内で、より多くのタスクを同時に実行することができる。

　以下、上述の第１実施形態を具体的な数値を用いて実施例１として更に詳細に説明する。但し、第１実施形態は、以下の実施例１から何ら制限を受けない。

　実施例１では、タスク受付部２１が次のような対象タスクを受け付け、この対象タスクを３つのサーバ装置１０（＃１）、１０（＃２）及び１０（＃３）で実行させる場合を例示する。
　対象タスク：タスクＩＤ（００１）、タスク開始時刻（１９時）、デッドライン時刻（２１時）
　このように、実施例１では、対象タスクの要求時間にはデッドライン時刻が設定されている。また、実施例１では、所定完了確率が８０％に設定され、複数の所定空き確率が８０％、９０％及び９３％に設定されている場合を例示する。

　図５Ａは、１９時から２０時におけるサーバ装置１０（＃１）のＣＰＵの実リソース使用量の履歴を示すヒストグラムであり、図５Ｂは、２０時から２１時におけるサーバ装置１０（＃１）のＣＰＵの実リソース使用量の履歴を示すヒストグラムである。図６Ａは、１９時から２０時におけるサーバ装置１０（＃２）のＣＰＵの実リソース使用量の履歴を示すヒストグラムであり、図６Ｂは、２０時から２１時におけるサーバ装置１０（＃２）のＣＰＵの実リソース使用量の履歴を示すヒストグラムである。図７Ａは、１９時から２０時におけるサーバ装置１０（＃３）のＣＰＵの実リソース使用量の履歴を示すヒストグラムであり、図７Ｂは、２０時から２１時におけるサーバ装置１０（＃３）のＣＰＵの実リソース使用量の履歴を示すヒストグラムである。以降、１９時から２０時を１９時帯、２０時から２１時を２０時帯と表記する。

　なお、実リソース使用量の履歴は、ヒストグラムのみならず、確率的なモデルで表現され得る。また、実施例１では、説明を簡単にするために、ＣＰＵリソースのみを対象に空きリソースモデルを生成することを例示し、かつ、ＣＰＵリソースの最大値は１００％であると仮定する。上述の各ヒストグラムでは、横軸がＣＰＵの実リソース使用量を示し、縦軸が確率を示す。

　空きリソース分析部２４は、図５Ａ及び図５Ｂで示されるサーバ装置１０（＃１）のヒストグラム情報に基づいて、時間帯ごとに、複数の所定空き確率で保証される空きリソース量を計算することで、サーバ装置１０（＃１）の空きリソースモデルを生成する。図５Ａにより、１９時帯における実リソース使用量の８０、９０、９３パーセンタイルはそれぞれ約５０、約７０、約８０％である。これにより、空きリソース分析部２４は、サーバ装置１０（＃１）の最大リソース量（１００％）から各パーセンタイルに相当する各値をそれぞれ減算することにより、８０、９０及び９３％の各所定空き確率で保証される各空きリソース量を約５０、約３０、約２０％と算出する。また、図５Ｂにより、２０時帯における実リソース使用量の８０、９０、９３パーセンタイルはそれぞれ約５０、約６５、約７０％であるため、空きリソース分析部２４は、８０、９０及び９３％の各所定空き確率で保証される各空きリソース量を約５０、約３５、約３０％と算出する。同様に、空きリソース分析部２４は、図６Ａ及び図６Ｂのヒストグラム情報を用いてサーバ装置１０（＃２）の空きリソースモデルを生成し、図７Ａ及び図７Ｂのヒストグラム情報を用いてサーバ装置１０（＃３）の空きリソースモデルを生成する。

　このように生成された空きリソースモデルを格納する空きリソースモデルＤＢ３３は、図８のようになる。図８は、実施例１における空きリソースモデルＤＢ３３を示す図である。

　ここで、入力データ管理ＤＢ３２には、次のような、対象タスク（タスクＩＤ＝００１）の入力データの管理情報が格納されていると仮定する。即ち、対象タスクの入力データは、サーバ装置１０（＃１）及び１０（＃２）に１５ＧＢ（ギガバイト）ずつ、分散配備されている。サーバ装置１０（＃３）は当該入力データを持っていない。また、ＣＰＵリソースを１００％利用した際の処理速度が全てのサーバ装置１０において１０ＭＢ（メガバイト）／ｓ（秒）であると仮定する。
　タスクＩＤ：００１
　サーバ装置１０（＃１）：１５ＧＢ（ギガバイト）
　サーバ装置１０（＃２）：１５ＧＢ（ギガバイト）
　サーバ装置１０（＃３）：０

　タスクスケジューラ２２は、まず、入力データを持つサーバ装置１０（＃１）及び１０（＃２）を対象タスクを実行させるサーバ装置に決定する。タスクスケジューラ２２は、決定されたサーバ装置の数が２であるため、所定完了確率（８０％）に対応する所定空き確率を、複数の所定空き確率（８０％、９０％、９３％）の中の９０％に決定する。これは、２台のサーバ装置１０（＃１）及び１０（＃２）全体として保証される確率は、８１％（＝０．９×０．９）となり、所定完了確率（８０％）を満たすからである。所定空き確率（９３％）が選択された場合でも、全体として保証される確率が約８６％になり、所定完了確率（８０％）を満たす。しかし、全体として保証される確率が所定完了確率に近くなる所定空き確率を選択したほうが、空きリソースをより効率的に利用することができる。

　タスクスケジューラ２２は、決定された所定空き確率（９０％）で保証される空きリソース量（図８参照）に基づいて、サーバ装置１０（＃１）及び１０（＃２）に関する、空きリソースを用いた対象タスクの処理能力を推定する。１９時帯では、サーバ装置１０（＃１）の９０％保証の空きリソース量は３０％であり、ＣＰＵの最大処理能力が１０ＭＢ／ｓであることから、空きリソースを用いたサーバ装置１０（＃１）の処理能力は、３ＭＢ／ｓ（＝１０×０．３）となる。２０時帯では、サーバ装置１０（＃１）の９０％保証の空きリソース量は３５％であることから、空きリソースを用いたサーバ装置１０（＃１）の処理能力は、３．５ＭＢ／ｓ（＝１０×０．３５）となる。図８に示される空きリソースモデルに基づいてこのように計算された処理能力は、図９で示されるようになる。図９は、図８に示される空きリソースモデルに基づいて計算された処理能力の例を示す図である。

　タスクスケジューラ２２は、図９で示される処理能力と、サーバ装置１０（＃１）及び１０（＃２）が持つ入力データの量とに基づいて、サーバ装置１０（＃１）及び１０（＃２）において、対象タスクが要求時間内に完了するか否かを判定する。ここで、要求時間は、上述のデッドライン時刻（２１時）である。

　１９時帯のサーバ装置１０（＃１）により、空きリソースを用いて処理できる入力データ量は、１０．８ＧＢ（＝６０×６０×３．０ＭＢ）である。２０時帯のサーバ装置１０（＃２）については、１２．６ＧＢ（＝６０×６０×３．５ＭＢ）である。このため、サーバ装置１０（＃１）では、タスク開始時刻（１９時）から実行された対象タスクは、およそ２０時２０分に完了すると推定できる。よって、タスクスケジューラ２２は、サーバ装置１０（＃１）では対象タスクがデッドライン時刻（２１時）までに完了すると判定することができる。

　タスクスケジューラ２２は、サーバ装置１０（＃２）についても同様に計算を行う。サーバ装置１０（＃２）では、タスク開始時刻（１９時）から実行された対象タスクは、およそ２０時３５分に完了すると推定できる。これにより、タスクスケジューラ２２は、サーバ装置１０（＃２）では対象タスクがデッドライン時刻（２１時）までに完了すると判定することができる。

　結果、タスクスケジューラ２２は、対象タスク（タスクＩＤ＝００１）の実行計画として、サーバ装置１０（＃１）及び１０（＃２）をその対象タスクを実行するサーバ装置に決定し、入力データの移送も不要と判断する。これにより、仮想マシン管理部２６に制御されることで、サーバ装置１０（＃１）及び１０（＃２）に対象タスクを実行するためのＶＭ１１がそれぞれ配備され、対象タスクが実行される。

　次に、上述のタスク（タスクＩＤ＝００１）に代えて、次のようなタスクが対象タスクとして処理される場合を例示する。なお、他の条件は、上述と同様とする。
　タスクＩＤ：００２
　サーバ装置１０（＃１）：２０ＧＢ（ギガバイト）
　サーバ装置１０（＃２）：２０ＧＢ（ギガバイト）
　サーバ装置１０（＃３）：０

　上述のように、１９時から２１時の間においてサーバ装置１０（＃１）により空きリソースを用いて処理できる入力データ量は、２３．４ＧＢ（＝（６０×６０×３．０ＭＢ）＋（６０×６０×３．５ＭＢ））である。よって、タスクＩＤが００２の対象タスクについても、サーバ装置１０（＃１）は、デッドライン時刻までに対象タスクの処理を完了させることができる。

　一方、１９時から２１時の間においてサーバ装置１０（＃２）により空きリソースを用いて処理できる入力データ量は、１８ＧＢ（＝（６０×６０×３．０ＭＢ）＋（６０×６０×２．０ＭＢ））である。この場合、対象タスク（タスクＩＤ＝００２）の入力データ量（２０ＧＢ）は、１９時から２１時の間にサーバ装置１０（＃２）により空きリソースを用いて処理できる入力データ量（１８ＧＢ）を２ＧＢ分超過する。これにより、タスクスケジューラ２２は、サーバ装置１０（＃２）において、対象タスクが要求時間内に完了できないと判定し、サーバ装置１０（＃２）の入力データの一部（超過分２ＧＢ）を他のサーバ装置１０で処理することを決める。以降、移送させる入力データの一部を超過入力データと表記する。

　タスクスケジューラ２２は、まず、超過入力データの移送先を既に対象タスクを処理すると決められているサーバ装置１０（＃１）に決定する。ここで、超過入力データを移送するためのリソースは、各サーバ装置１０で次のように確保されていると仮定する。
　データ移送用確保帯域：１０ＭＢ／ｓ

　タスクスケジューラ２２は、サーバ装置１０（＃１）における、元の入力データ（２０ＧＢ）を用いた対象タスクの完了時刻を推定する。この場合、タスクスケジューラ２２は、およそ２０時４４分に完了すると推定する。一方、超過入力データの移送時間は約３分（＝２０００／１０／６０）と算出されるため、タスク開始時間から移送を開始すれば、およそ１９時３分で超過入力データがサーバ装置１０（＃２）からサーバ装置１０（＃１）へ移送され得る。よって、サーバ装置１０（＃１）が超過入力データを元の入力データの処理後に処理すれば、その移送時間の影響は無視できる。

　タスクスケジューラ２２は、超過入力データを、元の入力データの処理完了（２０時４４分）後に処理させると仮定し、超過入力データの処理完了に掛かる時間を算出する。即ち、超過入力データは、２０時４４分以降の空きリソースが利用されるため、約１０分（＝２０００／３．５／６０）で処理が完了する。これにより、タスクスケジューラ２２は、元の入力データ（２０ＧＢ）と超過入力データ（２ＧＢ）とを用いた対象タスクの処理の完了を２０時５４分と推定する。結果、タスクスケジューラ２２は、超過入力データをサーバ装置１０（＃１）で処理させたとしても、サーバ装置１０（＃１）では、対象タスクがデッドライン時刻（２１時）までに完了すると判定することができる。

　結果、タスクスケジューラ２２は、対象タスク（タスクＩＤ＝００２）の実行計画として、サーバ装置１０（＃１）及び１０（＃２）をその対象タスクを実行するサーバ装置に決定し、サーバ装置１０（＃２）の入力データの一部（２ＧＢ分）をサーバ装置１０に移送することも決定する。

　次に、上述のタスク（タスクＩＤ＝００１及び００２）に代えて、次のようなタスクが対象タスクとして処理される場合を例示する。なお、他の条件は、上述と同様とする。
　タスクＩＤ：００３
　サーバ装置１０（＃１）：２５ＧＢ（ギガバイト）
　サーバ装置１０（＃２）：２５ＧＢ（ギガバイト）
　サーバ装置１０（＃３）：０

　上述のように、１９時から２１時の間にサーバ装置１０（＃１）により空きリソースを用いて処理できる入力データ量は、２３．４ＧＢであり、サーバ装置１０（＃２）については、１８ＧＢである。よって、対象タスク（タスクＩＤ＝００３）の入力データ量（２５ＧＢ）は、１９時から２１時の間にサーバ装置１０（＃１）及び１０（＃２）により空きリソースを用いて処理できる入力データ量（２３．４ＧＢ及び１８ＧＢ）をそれぞれ超過する。これにより、タスクスケジューラ２２は、サーバ装置１０（＃１）及び１０（＃２）において、対象タスクが要求時間内に完了できないと判定し、サーバ装置１０（＃１）及び１０（＃２）の各入力データの一部（超過分１．６ＧＢ及び超過分７ＧＢ）を他のサーバ装置１０（＃３）で処理することを決める。

　タスクスケジューラ２２は、対象タスクを実行させるサーバ装置の数が増えるため、所定完了確率（８０％）に対応する所定空き確率を９３％に再選択する。所定空き確率に９０％が選択されている場合、３台のサーバ装置１０（＃１）、１０（＃２）及び１０（＃３）全体として保証される確率は、約７３％（＝０．９×０．９×０．９）となり、所定完了確率（８０％）を満たさないからである。所定空き確率に９３％が選択されている場合、全体として保証される確率は、約８１％（＝０．９３×０．９３×０．９３）となり、所定完了確率（８０％）を満たす。

　タスクスケジューラ２２は、再選択された所定空き確率（９３％）で保証される空きリソース量（図８参照）に基づいて、サーバ装置１０（＃１）及び１０（＃２）に関する、空きリソースを用いた対象タスクの処理能力を推定する。この結果は、図９に示されるとおりである。この場合、１９時から２１時の間にサーバ装置１０（＃１）により空きリソースを用いて処理できる入力データ量は、１８ＧＢ（＝（６０×６０×２．０）＋（６０×６０×３．０））である。同様に、サーバ装置１０（＃２）についても、１８ＧＢ（＝（６０×６０×３．０）＋（６０×６０×２．０））であり、サーバ装置１０（＃３）についても、１８ＧＢ（＝（６０×６０×２．５）＋（６０×６０×２．５））である。これにより、サーバ装置１０（＃１）及び１０（＃２）の超過入力データはそれぞれ７ＧＢである。

　タスクスケジューラ２２は、各超過入力データ（７ＧＢ×２）の移送時間をそれぞれ約１２分（＝７０００／１０／６０）と算出する。タスクスケジューラ２２は、サーバ装置１０（＃１）の超過入力データの移送をタスク開始時刻（１９時）に開始し、その移送完了後に、サーバ装置１０（＃２）の超過入力データの移送、及び、サーバ装置１０（＃１）の超過入力データの処理を開始すると決定する。タスクスケジューラ２２は、サーバ装置１０（＃１）の超過入力データ（７ＧＢ）に対する処理時間を約４６分（＝７０００／２．５／６０）と推定できる。よって、サーバ装置１０（＃１）の超過入力データの移送完了後に、サーバ装置１０（＃２）の超過入力データの移送を開始したとしても、サーバ装置１０（＃２）の超過入力データの移送は、サーバ装置１０（＃１）の超過入力データ（７ＧＢ）の処理が完了するまでに完了し、サーバ装置１０（＃３）は、サーバ装置１０（＃１）の超過入力データの処理完了後、直ちに、サーバ装置１０（＃２）の超過入力データの処理を開始することができる。

　これにより、タスクスケジューラ２２は、サーバ装置１０（＃３）に関し、サーバ装置１０（＃１）の超過入力データの受信完了後、即ち、１９時１２分から２１時の間に処理できる入力データ量を１６．２ＧＢ（＝６０×４８×２．５ＭＢ＋６０×６０×２．５ＭＢ）と推定し、サーバ装置１０（＃３）では、移送される全超過入力データ（１４ＧＢ）をデッドライン時刻までに完了することができると判定することができる。

　結果、タスクスケジューラ２２は、対象タスク（タスクＩＤ＝００２）の実行計画として、サーバ装置１０（＃１）、１０（＃２）及び１０（＃３）をその対象タスクを実行するサーバ装置に決定し、サーバ装置１０（＃１）及び１０（＃２）の入力データの一部（各７ＧＢ分）をサーバ装置１０（＃３）にそれぞれ移送することも決定する。

　［第２実施形態］
　第２実施形態におけるタスク管理システム１は、対象タスクを最短で完了させるように、対象タスクのスケジューリングを行う。以下、第２実施形態におけるタスク管理システム１について、第１実施形態と異なる内容を中心に説明する。以下の説明では、第１実施形態と同様の内容については適宜省略する。

　第２実施形態では、タスクスケジューラ２２の処理内容が第１実施形態と異なる。第２実施形態におけるタスクスケジューラ２２は、まず、対象タスクを実行させる複数のサーバ装置１０を選択する。そして、タスクスケジューラ２２は、選択された各サーバ装置１０における、当該選択された所定空き確率で保証される各空きリソース量、及び、対象タスクで処理される入力データの中からその選択された各サーバ装置に割り当てられる分散入力データの量に基づいて、その選択された各サーバ装置における対象タスクの完了時間をそれぞれ推定する。そして、タスクスケジューラ２２は、推定結果から得られる対象タスク全体の完了時間が短縮されるように、該選択された各サーバ装置間での分散入力データの移送パターンを更に決定する。推定される対象タスク全体の完了時間は、所定完了確率で示される確実性を持つ。

　タスクスケジューラ２２は、対象タスクに要求時間が設定されている場合、第１実施形態と同じ手法により、対象タスクが要求時間内に完了するという要件を満たすように、入力データを処理させるサーバ装置１０を選択する。一方、タスクスケジューラ２２は、対象タスクに要求時間が設定されていない場合には、要求時間とは無関係に、入力データを処理させるサーバ装置１０を選択する。但し、第２実施形態におけるタスクスケジューラ２２は、所定のサーバ数閾値分のサーバ装置１０を処理対象とする。即ち、既に分散入力データを持つサーバ装置１０の数が上記閾値よりも小さい場合、タスクスケジューラ２２は、それらサーバ装置１０に加えて、分散入力データを持たないサーバ装置１０も、入力データを割り当てるサーバ装置１０の対象に加える。所定のサーバ数閾値は、対象タスクに設定されていてもよいし、予め、タスクスケジューラ２２により保持されていてもよい。

　〔動作例〕
　以下、第２実施形態におけるタスク管理方法について図１０を用いて説明する。以下の説明では、管理装置２０及びサーバ装置１０が各方法の実行主体となるが、管理装置２０及びサーバ装置１０に含まれる上述の各処理部が実行主体となってもよい。図１０は、第２実施形態における管理装置２０の動作例を示すフローチャートである。図１０に示される動作は、図４に示される（Ｓ４６；ＮＯ）の判断後、又は、（Ｓ４８；ＮＯ）の判断後であって、（Ｓ４７）の前に実施される。

　管理装置２０は、対象タスクを処理させるサーバ装置１０の数の閾値を取得する（Ｓ６１）。管理装置２０は、既に選択されているサーバ装置１０の数がその閾値未満である場合（Ｓ６２；ＹＥＳ）、入力データを持たないサーバ装置１０を残りの数分選択する（Ｓ６３）。残りの数とは、当該閾値から、既に選択されているサーバ装置１０の数を減算した値である。この場合、対象タスクを処理させるサーバ装置１０の数が変わるため、管理装置２０は、その数に応じて、所定完了確率に対応する所定空き確率を選択し直す。一方、管理装置２０は、既に選択されているサーバ装置１０の数がその閾値以上である場合（Ｓ６２；ＮＯ）、既に選択されているサーバ装置１０をそのまま処理対象とする。

（確認ステップ０）管理装置２０は、既に決定されている入力データの割り当てに基づいて、対象タスク全体の完了時間を算出する（Ｓ６４）。ここでの入力データの割り当てとは、図４に示される（Ｓ４５）で決定された割り当て、若しくは、図４に示される（Ｓ５２）で決定された割り当てである。

（確認ステップ１）確認ステップ０での対象タスク全体の完了時間が算出されると、次の確認ステップ１に移行する。この確認ステップの移行は、管理装置２０の動作ではなく、説明の便宜のために設けられた概念である。次の確認ステップ１では、まず、管理装置２０は、前の確認ステップ０で算出された各サーバ装置１０での完了時間に基づいて、入力データの移送パターンを決定する。確認ステップ０で算出された各サーバ装置１０での完了時間とは、図４で示される（Ｓ４５）で算出された完了時間である。管理装置２０は、入力データの移送パターンとして、所定量の入力データを、完了時間が最も遅いサーバ装置１０から、完了時間が最も早いサーバ装置１０へ移送することを決定する。

（確認ステップ１）続いて、管理装置２０は、決定された移送パターンに対応する各サーバ装置１０での完了時間を算出する（Ｓ６７）。各サーバ装置１０での完了時間の算出方法は、図４に示される（Ｓ４５）と同様である。管理装置２０は、各サーバ装置１０での完了時間に基づいて、対象タスク全体の完了時間を算出する（Ｓ６８）。管理装置２０は、確認ステップ１で算出された対象タスク全体の完了時間が確認ステップ０で算出されたものより短縮されているか否かを判定する（Ｓ６９）。

（確認ステップ２以降）管理装置２０は、短縮されている場合（Ｓ６９；ＹＥＳ）、（Ｓ６６）以降を再度実行する。このとき、確認ステップは、次の確認ステップ２に移行される。管理装置２０は、前の確認ステップ（ｔ－１）で算出された対象タスク全体の完了時間が今回の確認ステップｔで算出されたものより短縮されなくなるまで、（Ｓ６６）から（Ｓ６９）を繰り返す。

　管理装置２０は、短縮されない場合（Ｓ６９；ＮＯ）、前の確認ステップ（ｔ－１）で決定された入力データの移送パターンに基づいて、対象タスクの実行計画を決定する（Ｓ７０）。即ち、管理装置２０は、当該移送パターンで示される入力データの移送、及び、移送先となるサーバ装置１０での対象タスクの実行を、対象タスクの実行計画として更に決定する。

　〔第２実施形態における作用及び効果〕
　上述したように第２実施形態では、対象タスクを処理させるサーバ装置１０の数の閾値が取得され、この閾値の範囲内で、対象タスク全体の完了時間が短縮されるように、対象タスクを処理させるサーバ装置１０及び分散入力データの移送パターンが決定される。対象タスク全体の完了時間は、分散入力データの移送時間に加えて、所定完了確率に対応する所定空き確率で保証される空きリソース量に基づいてそれぞれ推定される、対象タスクを処理する各サーバ装置１０での空きリソースを用いた分散入力データの処理時間から算出されるため、所定完了確率により示される確実性を持つ。

　従って、第２実施形態によれば、利用の可否が確率的であるという特性を持つサーバ装置の一時空きリソースを利用するという条件の下、所望の精度（所定完了確率）で、対象タスク全体の完了時間の最小化を実現する、タスクの実行計画を決定することができる。

　以下、上述の第２実施形態を具体的な数値を用いて実施例２として更に詳細に説明する。但し、第２実施形態は、以下の実施例２から何ら制限を受けない。

　まず、対象タスクに要求時間が設定されておらず、上記所定条件に含まれるサーバ装置数の閾値が２に設定されている場合を例示する。また、対象タスクの入力データは、サーバ装置１０（＃１）に１５ＧＢ、サーバ装置１０（＃２）に１５ＧＢ、分散されて配置されていると仮定する。

　この場合、タスクスケジューラ２２は、まず、入力データを持つサーバ装置１０（＃１）及び１０（＃２）を対象タスクを実行させるサーバ装置に決定する。これは、サーバ装置数の閾値（２）に関する上記所定条件を満たす。このとき、タスクスケジューラ２２は、所定完了確率（８０％）に対応する所定空き確率を９０％に決定する。また、タスクスケジューラ２２により、所定空き確率（９０％）で保証される空きリソース量（図８参照）に基づいて、サーバ装置１０（＃１）及び１０（＃２）に関する、空きリソースを用いた対象タスクの処理能力が図９に示されるように算出される。

　タスクスケジューラ２２は、図９で示される処理能力と、サーバ装置１０（＃１）及び１０（＃２）が持つ入力データの量とに基づいて、サーバ装置１０（＃１）及び１０（＃２）において、対象タスクの完了時間を推定する。サーバ装置１０（＃１）では、１０ＧＢの入力データの処理完了時間は、約２０時２０分である。サーバ装置１０（＃２）については約２０時３５分である。これにより、タスクスケジューラ２２は、対象タスク全体の完了時間を約２０時３５分と決定する。

　図１１は、２つのサーバ装置に入力データを処理させる場合の、実施例２におけるタスクスケジューラ２２で算出される中間データの例を示す図である。上述の工程で算出された各完了時間は、図１１におけるステップ０に対応する行で示されている。実施例２では、タスクスケジューラ２２は、入力データの一部を移送させることで、対象タスク全体の完了時間を短縮するように、対象タスクの実行計画を決定する。

　次の各ステップにおいて、タスクスケジューラ２２は、入力データを持つサーバ装置１０（＃１）及び１０（＃２）の間で、一部の入力データを移送させることで、既に算出されている完了時間を短縮できないか確認していく。タスクスケジューラ２２は、対象タスク全体の完了時間が短縮できなくなるまでその確認を続ける。

　具体的には、次のステップ１において、タスクスケジューラ２２は、ステップ０で算出された完了時間が遅いほうのサーバ装置１０（＃２）から所定量（８４０ＭＢ）の入力データをサーバ装置１０（＃１）へ移送させた場合における、対象タスク全体の完了時間を推定する。ここで、入力データの移送量（８４０ＭＢ）は、任意の値に決められる。ここで、タスクスケジューラ２２は、その入力データの移送時間を１．４分（＝８４０／１０／６０）と算出する。ここでは、説明を簡単にするために、移送時間を２分とする。

　タスクスケジューラ２２は、入力データの移送を対象タスクの開始時刻（１９時）に開始し、サーバ装置１０（＃１）には、元から存在する入力データの処理完了後に、その移送された入力データの処理を開始させることを決定する。移送時間が２分であるため、移送された入力データのサーバ装置１０（＃１）による受信は、１９時２分に完了する。サーバ装置１０（＃１）で元から存在する入力データの処理完了時間は、上述のように、約２０時２０分である。これにより、入力データの移送は、サーバ装置１０（＃１）での移送された入力データの処理開始に影響を与えない。また、移送された入力データは、サーバ装置１０（＃１）において２０時２０分以降に処理されるため、図９に示される処理能力によれば、その入力データの処理時間は、４分（＝８４０／３．５／６０）である。これにより、タスクスケジューラ２２は、サーバ装置１０（＃１）における、元の入力データ及び移送されてきた入力データの処理完了時刻を２０時２４分と算出する。一方、サーバ装置１０（＃２）では、移送される入力データ（８４０ＭＢ）が処理対象から除かれるため、対象タスクの完了時間が７分（＝８４０／２／６０）短縮される。結果、タスクスケジューラ２２は、サーバ装置１０（＃２）における、移送された入力データを除く残りの入力データの処理完了時刻を２０時２８分と算出する。これにより、対象タスク全体の完了時間が２０時２８分となり、それは、ステップ０で算出された時間よりも短縮されている。

　タスクスケジューラ２２は、ステップ２において、上記ステップ１のプロセスを更に繰り返す。即ち、タスクスケジューラ２２は、ステップ１で算出された完了時間が遅いほうのサーバ装置１０（＃２）から所定量（８４０ＭＢ）の入力データをサーバ装置１０（＃１）へ更に移送させた場合における、対象タスク全体の完了時間を推定する。タスクスケジューラ２２は、ステップ１と同様に計算することで、ステップ２における完了時間を２０時２８分と算出する。この算出された完了時間は、ステップ１で算出された完了時間と同じであるため、タスクスケジューラ２２は、最終的に、ステップ１における実行計画を採用する。

　次に、対象タスクに要求時間が設定されておらず、上記所定条件に含まれるサーバ装置数の閾値が３に設定されている場合を例示する。また、対象タスクの入力データは、サーバ装置１０（＃１）に１５ＧＢ、サーバ装置１０（＃２）に１５ＧＢ、分散されて配置されており、サーバ装置１０（＃３）は入力データを持たないと仮定する。図１２は、３つのサーバ装置に入力データを処理させる場合の、実施例２におけるタスクスケジューラ２２で算出される中間データの例を示す図である。

　この場合においても、タスクスケジューラ２２は、ステップ０において、入力データの移送を行わず、入力データを持つサーバ装置１０（＃１）及び１０（＃２）を対象タスクを実行させるサーバ装置に決定する。ステップ０では、最終的に３台のサーバ装置に対象タスクを処理させるため、所定完了確率（８０％）に対応する所定空き確率には９３％が選択されるものとする。但し、対象タスクを実行させるサーバ装置の数が２台であるため、所定空き確率には９０％が選択されてもよい。タスクスケジューラ２２は、実施例１で述べた算出手法により、サーバ装置１０（＃１）での対象タスクの完了時間は、約２０時４３分であり、サーバ装置１０（＃２）での対象タスクの完了時間は、約２０時３５分と推定する。これにより、ステップ０では、タスクスケジューラ２２は、対象タスク全体の完了時間を２０時４３分と推定する。ここで推定される対象タスク全体の完了時刻は、所定完了確率（８０％）の確実性を持つ。

　次のステップ１において、タスクスケジューラ２２は、完了時間が最も遅いサーバ装置１０（＃１）からサーバ装置１０（＃３）に入力データを移送させることで、既に算出されている完了時間を短縮できないか確認する。移送させる入力データの量は、任意に設定される。ここでは、移送させる入力データの量は１．８ＧＢに設定される。

　データ移送用に確保される帯域が１０ＭＢ／ｓであると仮定すると、移送入力データの移送完了には３分（＝１８００／１０／６０）掛かる。よって、移送された入力データのサーバ装置１０（＃３）による受信は、１９時３分に完了するため、サーバ装置１０（＃３）は、１９時３分からその移送入力データの処理を開始することができる。その移送入力データの処理は、サーバ装置１０（＃１）の２０時帯で１０分（＝１８００／６０／３）掛かり、サーバ装置１０（＃３）の２０時帯で１２分（＝１８００／６０／２．５）掛かる。これにより、ステップ１では、タスクスケジューラ２２は、サーバ装置１０（＃１）の完了時間を２０時３３分（１０分短縮）と、サーバ装置１０（＃３）の完了時間を１９時１５分と推定する。このとき、サーバ装置１０（＃２）の完了時間は、ステップ１と同じである（２０時３５分）。結果、タスクスケジューラ２２は、ステップ１における対象タスク全体の完了時間を２０時３５分と推定し、ステップ０よりも短縮したと判定する。

　以降、タスクスケジューラ２２は、前のステップで計算された完了時間に基づいて、完了時間が最も遅いサーバ装置から、完了時間が最も早いサーバ装置に入力データを移送させることで、既に算出されている完了時間を短縮できないかを確認する。タスクスケジューラ２２は、タスク全体の完了時間が短縮されなくなるまで、その確認を繰り返し、タスク全体の完了時間が最も短く推定された入力データの割り当てを対象タスクの最終的な実行計画とする。図１２の例では、ステップ６で、タスク全体の完了時間が短縮されなくなっており、ステップ５で示される入力データの割り当てが対象タスクの最終的な実行計画に決定される。即ち、タスクスケジューラ２２は、サーバ装置１０（＃１）に９．６ＧＢの入力データを処理させ、サーバ装置１０（＃２）に１１．４ＧＢの入力データを処理させ、サーバ装置１０（＃３）に９ＧＢの入力データを処理させ、サーバ装置１０（＃１）からサーバ装置１０（＃３）へ５．４ＧＢの入力データを移送し、サーバ装置１０（＃２）からサーバ装置１０（＃３）へ３．６ＧＢの入力データを移送するという実行計画を決定する。

　［第３実施形態］
　第３実施形態におけるタスク管理システム１は、同じ内容の分散入力データが重複して複数のサーバ装置１０に配置されている対象タスクのスケジューリングを行う。以下、第３実施形態におけるタスク管理システム１について、第１実施形態及び第２実施形態と異なる内容を中心に説明する。以下の説明では、第１実施形態及び第２実施形態と同様の内容については適宜省略する。

　入力データ管理ＤＢ３２に格納される入力データの管理情報では、分散入力データにデータＩＤ（データ識別情報）が付与されている。これにより、同じ内容の分散入力データには同じデータＩＤが付与される。例えば、入力データの管理情報は、当該入力データの部分データとなる分散入力データ毎に、データＩＤと、その分散入力データの量と、その分散入力データが存在するサーバ装置１０に関する情報とを示す。重複して複数のサーバ装置１０に配置される同じ内容の分散入力データは、対象タスクにより少なくとも１つが処理されればよい。

　タスクスケジューラ２２は、要求時間を守ることを前提に、利用するサーバ装置１０の数を最小化する第１基準、及び、サーバ装置１０の空きリソースの使用効率を最大化する第２基準に基づいて、入力データの移送パターン及び入力データを処理させるサーバ装置１０を、対象タスクの実行計画として決定する。

　まず、上記前提条件を判断するために、タスクスケジューラ２２は、重複するか否かに関わらず、上述の各実施形態と同様の手法により、分散入力データを持つ各サーバ装置１０について、対象タスクの完了時間をそれぞれ算出する。このとき、タスクスケジューラ２２は、異なるデータＩＤの数を、対象タスクを処理させるサーバ装置１０の数とみなし、その数に基づいて、所定完了確率に対応する所定空き確率を選択する。タスクスケジューラ２２は、各サーバ装置１０での対象タスクの完了時間と要求時間との比較により、オーバフローサーバ装置１０の存在を確認する。タスクスケジューラ２２は、オーバフローサーバ装置１０の存在に応じて、次のように処理を行う。

　オーバフローサーバ装置１０が存在しない場合、タスクスケジューラ２２は、データＩＤ毎に、空きリソースの使用効率が最も高いサーバ装置１０をそれぞれ選択する。空きリソースの使用効率は、空きリソースの最大処理能力に対する処理予定の入力データ量によって算出される。例えば、選択された所定空き確率に対応する１９時帯での空きリソースの最大処理能力が１０ＧＢであり、処理予定の入力データ量が５ＧＢである場合、空きリソースの使用効率は０．５（＝５／１０）と算出される。

　また、或るデータＩＤの分散入力データを重複して持つ複数のサーバ装置１０に、オーバフローサーバ装置１０とそうでないサーバ装置１０とが混在する場合、タスクスケジューラ２２は、その複数のサーバ装置１０の中のオーバフローサーバ装置１０以外のサーバ装置１０を選択する。これは、オーバフローサーバ装置１０が選択された場合、要求時間を守るために入力データの一部を他のサーバ装置１０へ移送する必要があり、上記第１基準に沿うことができない可能性が生じるからである。但し、移送する入力データの量や他のサーバ装置１０の空きリソースの余剰状況によっては、対象タスクを処理させるサーバ装置１０の数が増えない場合もあり得るため、最終的なサーバ装置１０の数を見積もった後に、オーバフローサーバ装置１０を選択するようにしてもよい。

　また、或るデータＩＤの分散入力データを重複して持つサーバ装置１０の全てがオーバフローサーバ装置１０となる場合、タスクスケジューラ２２は、超過分の入力データの量が最も少ないサーバ装置１０を選択する。超過分の入力データの量は、上述の各実施形態と同様の手法により算出すればよい。このとき、タスクスケジューラ２２は、超過分の入力データの移送先として、まず、入力データを処理する予定になっているサーバ装置１０に決める。このサーバ装置１０がその超過分の入力データを処理することができない場合、次に、タスクスケジューラ２２は、移送する入力データと同じ入力データを持つサーバ装置１０を移送先に決める。

　〔動作例〕
　以下、第３実施形態におけるタスク管理方法について図４を用いて説明する。
　第３実施形態では、図４に示される（Ｓ４５）において、管理装置２０は、重複するか否かに関わらず、上述の各実施形態と同様の手法により、分散入力データを持つ各サーバ装置１０について、対象タスクの完了時間をそれぞれ算出する。そして、管理装置２０は、上述のような基準により、対象タスクを処理させるサーバ装置１０を選択していく。

　具体的には、図４で示される（Ｓ４８；ＹＥＳ）の場合、管理装置２０は、オーバフローサーバ装置１０が持つ入力データと同じ入力データを持ち、かつ、オーバフローサーバ装置１０でないサーバ装置１０が存在すれば、そのサーバ装置１０を選択する。一方、同じ入力データを重複して持つサーバ装置１０の全てがオーバフローサーバ装置１０である場合、管理装置２０は、超過分の入力データの量が最も少ないサーバ装置１０を選択する。

　〔第３実施形態における作用及び効果〕
　第３実施形態では、複数のサーバ装置が同じ入力データを重複して持つ場合において、上述の各実施形態と同様に、確率的空きリソース情報及び分散入力データの量に基づいて、同じ入力データを持つ各サーバ装置について、対象タスクが要求時間内に完了するか否かがそれぞれ判定される。そして、同じ入力データを持つ複数のサーバ装置の中の、対象タスクを要求時間内に完了させ得るサーバ装置が優先的に対象タスクを処理させるサーバ装置として選択される。これにより、第３実施形態により決定される実行計画によれば、対象タスクに関する要求時間を守りつつ、対象タスクを処理させるサーバ装置の数を最小化することができ、ひいては、タスク管理システム１内で多くのタスクを同時に処理することができる。

　また、第３実施形態では、対象タスクを要求時間内に完了させ得るサーバ装置が複数存在する場合、選択された所定空き確率で保証される空きリソース量で処理可能な最大入力データ量に対する入力データの量の割合が大きいサーバ装置が優先的に対象タスクを処理させるサーバ装置として選択される。これにより、第３実施形態により決定される実行計画によれば、対象タスクに関する要求時間を守ること、対象タスクを処理させるサーバ装置の数を最小化すること、及び、空きリソースの使用効率を高めることを実現することができる。

　以下、上述の第３実施形態を具体的な数値を用いて実施例３として更に詳細に説明する。但し、第３実施形態は、以下の実施例３から何ら制限を受けない。

　入力データ管理ＤＢ３２には、次のような、対象タスク（タスクＩＤ＝００４）の入力データの管理情報が格納されていると仮定する。即ち、データＩＤ（Ａ）の入力データ１０ＧＢがサーバ装置１０（＃１）とサーバ装置１０（＃３）とに重複して配備され、データＩＤ（Ｂ）の入力データ１０ＧＢがサーバ装置１０（＃２）とサーバ装置１０（＃４）とに重複して配備されている。また、ＣＰＵリソースを１００％利用した際の処理速度が全てのサーバ装置１０において１０ＭＢ（メガバイト）／ｓ（秒）であると仮定する。
　タスクＩＤ：００４
　サーバ装置１０（＃１）：データＩＤ（Ａ）、１０ＧＢ
　サーバ装置１０（＃２）：データＩＤ（Ｂ）、１０ＧＢ
　サーバ装置１０（＃３）：データＩＤ（Ａ）、１０ＧＢ
　サーバ装置１０（＃４）：データＩＤ（Ｂ）、１０ＧＢ

　この場合、タスクスケジューラ２２は、異なるデータＩＤの数が２つであるため、対象タスクを処理させるサーバ装置１０の数を２とみなし、その数に基づいて、所定完了確率に対応する所定空き確率を選択する。

　また、選択された所定空き確率に対応する１９時帯及び２０時帯での各サーバ装置１０の空きリソースの処理能力は、図１３に示される値であると仮定する。図１３は、或る所定空き確率に対応する１９時帯及び２０時帯での各サーバ装置１０の空きリソースの処理能力の例を示す図である。

　この場合、１９時から２１時の間でのサーバ装置１０（＃１）における空きリソースの最大処理能力は、１０．８ＧＢであり、サーバ装置１０（＃３）については７．２ＧＢである。よって、入力データ（Ａ）を持つサーバ装置１０（＃１）及び１０（＃３）のうち、サーバ装置１０（＃１）は、要求時間内に対象タスクを完了させることができ、サーバ装置１０（＃３）はできない。即ち、サーバ装置１０（＃３）は、オーバフローサーバ装置１０である。従って、タスクスケジューラ２２は、入力データ（Ａ）を処理させるサーバ装置としてサーバ装置１０（＃１）を選択する。

　一方、同時間帯でのサーバ装置１０（＃２）における空きリソースの最大処理能力は、５．４ＧＢであり、サーバ装置１０（＃４）については７．２ＧＢである。このため、タスクスケジューラ２２は、入力データ（Ｂ）を持つサーバ装置１０（＃２）及び１０（＃４）をオーバフローサーバ装置と判定する。この場合、タスクスケジューラ２２は、サーバ装置１０（＃２）及び１０（＃４）について超過分の入力データの量を計算する。サーバ装置１０（＃２）の超過分の入力データは、４．６ＧＢであり、サーバ装置１０（＃４）については、２．８ＧＢである。よって、タスクスケジューラ２２は、入力データ（Ｂ）のために、移送する必要のある入力データの量が少ないサーバ装置１０（＃４）を選択し、その超過分の入力データの量（２．８ＧＢ）を移送する入力データ量に決定する。

　この場合、タスクスケジューラ２２は、その超過分の入力データの移送先として、まず、入力データ（Ａ）を処理予定のサーバ装置１０（＃１）を選択する。しかし、サーバ装置１０（＃１）は、入力データ（Ａ）を１０ＧＢ分処理するため、残り０．８ＧＢしか余剰の空きリソースを持たない。従って、サーバ装置１０（＃１）は、サーバ装置１０（＃４）の超過分の入力データを全て処理することはできない。そこで、タスクスケジューラ２２は、次に、超過分の入力データと同じ入力データ（Ｂ）を持つサーバ装置１０（＃２）を移送先に決定する。このとき、対象タスクを処理させるサーバ装置１０の数が３台（サーバ装置１０（＃１）、１０（＃２）及び１０（＃４））と増加するため、タスクスケジューラ２２は、上述の各実施形態と同様に、所定空き確率を選び直す。

　［変形例］
　図４で示される（Ｓ４５）及び（Ｓ５２）では、対象タスクの完了時間を算出しているが、各実施形態におけるタスク管理方法は、対象タスクが要求時間内に完了するか否かが判定できるのであれば、対象タスクの完了時間を算出する工程を必ずしも含まなくてもよい。例えば、（Ｓ４５）及び（Ｓ５２）では、管理装置２０は、空きリソース量で処理可能な最大入力データ量と割り当てられている入力データ量との比較をするようにしてもよい。この比較により、当該最大入力データ量が割り当てられている入力データ量よりも小さいと判定されると、管理装置２０は、そのサーバ装置１０は対象タスクが要求時間内に完了することができないと判定する、即ち、そのサーバ装置１０をオーバフローサーバ装置と特定することができる。

　また、上述の説明で用いた複数のフローチャートでは、複数の工程（処理）が順番に記載されているが、本実施形態で実行される工程の実行順序は、その記載の順番に制限されない。本実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態及び各変形例は、内容が相反しない範囲で組み合わせることができる。

　上記の各実施形態及び各変形例の一部又は全部は、以下の付記のようにも特定され得る。但し、各実施形態及び各変形例が以下の記載に限定されるものではない。

　（付記１）
　サーバ装置上で実際に使用されているリソース量を示す実リソース使用量を取得するリソース情報取得部と、
　前記リソース情報取得部により取得される実リソース使用量の履歴に基づいて、前記サーバ装置のための、複数の所定空き確率について該所定空き確率で保証される空きリソース量をそれぞれ示す確率的空きリソース情報を生成するリソース分析部と、
　対象タスクを実行させる少なくとも１つのサーバ装置を選択し、前記複数の所定空き確率の中から所定完了確率に対応する所定空き確率を選択し、該選択されたサーバ装置のための前記確率的空きリソース情報により示される、該選択された所定空き確率で保証される空きリソース量に基づいて、該対象タスクの実行計画を決定するスケジューリング部と、
　を備えるタスク管理装置。

（付記２）
　前記スケジューリング部は、前記選択された所定空き確率で保証される空きリソース量、及び、前記対象タスクで処理される入力データの量に基づいて、前記対象タスクが要求時間内に完了するか否かを判定し、該判定結果に基づいて、前記対象タスクの実行計画を決定する、
　付記１に記載のタスク管理装置。

（付記３）
　前記対象タスクで処理される入力データが分散配置されている各サーバ装置における分散入力データの量をそれぞれ示す入力データ所在情報を取得する入力データ取得部、
　を更に備え、
　前記リソース情報取得部は、前記複数のサーバ装置の各々に関する前記実リソース使用量をそれぞれ取得し、
　前記リソース分析部は、前記複数のサーバ装置の各々について前記確率的空きリソース情報をそれぞれ生成し、
　前記スケジューリング部は、前記対象タスクを実行させるサーバ装置として前記分散入力データを持つ複数のサーバ装置を選択し、前記複数の所定空き確率の中から、該選択されたサーバ装置の数及び所定完了確率に対応する所定空き確率を選択し、該選択された各サーバ装置における該選択された所定空き確率で保証される各空きリソース量、及び、該選択された各サーバ装置が持つ分散入力データの量に基づいて、該選択された各サーバ装置上で実行される前記対象タスクがそれぞれ前記要求時間内に完了するか否かを判定する、
　付記２に記載のタスク管理装置。

（付記４）
　前記スケジューリング部は、前記対象タスクが前記要求時間内に完了しないと判定されたオーバフローサーバ装置が持つ分散入力データの少なくとも一部の移送先となるサーバ装置を決定し、該分散入力データの移送時間と、該移送先となるサーバ装置における該移送される分散入力データに対する処理時間とを含む前記対象タスクの処理時間が前記要求時間内に収まるか否かを判定し、該判定結果に基づいて、該分散入力データの移送、及び、該移送先となるサーバ装置での前記対象タスクの実行を、前記対象タスクの実行計画として更に決定する、
　付記３に記載のタスク管理装置。

（付記５）
　前記スケジューリング部は、前記選択された所定空き確率で保証される空きリソース量に基づいて、前記オーバフローサーバ装置における、該空きリソース量で処理可能な最大入力データ量を算出し、前記分散入力データの量と該最大入力データ量との差分を、前記オーバフローサーバ装置から移送させる分散入力データの量として算出する、
　付記４に記載のタスク管理装置。

（付記６）
　前記スケジューリング部は、前記対象タスクを実行させる複数のサーバ装置を選択し、該選択された各サーバ装置における前記選択された所定空き確率で保証される各空きリソース量と、前記対象タスクで処理される入力データの中から、該選択された各サーバ装置に割り当てられる分散入力データの量とに基づいて、該選択された各サーバ装置における前記対象タスクの完了時間をそれぞれ推定し、該推定結果から得られる前記対象タスク全体の完了時間が短縮されるように、該選択された各サーバ装置間での分散入力データの移送パターンを、前記対象タスクの実行計画として更に決定する、
　付記１から５のいずれか１つに記載のタスク管理装置。

（付記７）
　複数のサーバ装置が同じ入力データを重複して持つ場合、前記スケジューリング部は、前記選択された所定空き確率で保証される空きリソース量、及び、該入力データの量に基づいて、同じ入力データを持つ各サーバ装置について、前記対象タスクが前記要求時間内に完了するか否かをそれぞれ判定し、同じ入力データを持つ複数のサーバ装置の中の、前記対象タスクを前記要求時間内に完了させ得るサーバ装置を優先的に前記対象タスクを処理させるサーバ装置として選択する、
　付記１から６のいずれか１つに記載のタスク管理装置。

（付記８）
　複数のサーバ装置が同じ入力データを重複して持つ場合、前記スケジューリング部は、同じ入力データを持ち、かつ、前記対象タスクを前記要求時間内に完了させ得る複数のサーバ装置の中の、前記選択された所定空き確率で保証される空きリソース量で処理可能な最大入力データ量に対する該入力データの量の割合が大きいサーバ装置を優先的に前記対象タスクを処理させるサーバ装置として選択する、
　付記７に記載のタスク管理装置。

（付記９）
　前記スケジューリング部により決定された前記対象タスクの実行計画に基づいて、前記対象タスクを実行させると決定されたサーバ装置に前記対象タスクを実行させ、前記対象タスクの実行中に、所定量のリソースが明示的に割当てられているソフトウェア実行単位が該リソースを要求する場合、前記対象タスクにリソースを解放させるタスク制御部、
　を更に備える付記１から８のいずれか１つに記載のタスク管理装置。

（付記１０）
　少なくとも１つのコンピュータにより実行されるタスク管理方法において、
　サーバ装置上で実際に使用されているリソース量を示す実リソース使用量を取得し、
　前記取得された実リソース使用量の履歴に基づいて、前記サーバ装置のための、複数の所定空き確率について該所定空き確率で保証される空きリソース量をそれぞれ示す確率的空きリソース情報を生成し、
　対象タスクを実行させる少なくとも１つのサーバ装置を選択し、
　前記複数の所定空き確率の中から所定完了確率に対応する所定空き確率を選択し、
　前記選択されたサーバ装置のための前記確率的空きリソース情報により示される、前記選択された所定空き確率で保証される空きリソース量に基づいて、前記対象タスクの実行計画を決定する、
　ことを含むタスク管理方法。

（付記１１）
　前記選択された所定空き確率で保証される空きリソース量、及び、前記対象タスクで処理される入力データの量に基づいて、前記対象タスクが要求時間内に完了するか否かを判定する、
　ことを更に含み、
　前記対象タスクの実行計画の決定は、前記判定結果に基づいて、前記対象タスクの実行計画を決定する、
　付記１０に記載のタスク管理方法。

（付記１２）
　前記対象タスクで処理される入力データが分散配置されている各サーバ装置における分散入力データの量をそれぞれ示す入力データ所在情報を取得する、
　ことを更に含み、
　前記実リソース使用量の取得は、前記複数のサーバ装置の各々に関する前記実リソース使用量をそれぞれ取得し、
　前記確率的空きリソース情報の生成は、前記複数のサーバ装置の各々について前記確率的空きリソース情報をそれぞれ生成し、
　前記サーバ装置の選択は、前記対象タスクを実行させるサーバ装置として前記分散入力データを持つ複数のサーバ装置を選択し、
　前記所定空き確率の選択は、前記複数の所定空き確率の中から、前記選択されたサーバ装置の数及び所定完了確率に対応する所定空き確率を選択し、
　前記判定は、前記選択された各サーバ装置における、前記選択された所定空き確率で保証される各空きリソース量、及び、前記選択された各サーバ装置が持つ分散入力データの量に基づいて、前記選択された各サーバ装置上で実行される前記対象タスクがそれぞれ前記要求時間内に完了するか否かを判定する、
　付記１１に記載のタスク管理方法。

（付記１３）
　前記対象タスクが前記要求時間内に完了しないと判定されたオーバフローサーバ装置が持つ分散入力データの少なくとも一部の移送先となるサーバ装置を決定する、
　ことを更に含み、
　前記判定は、前記分散入力データの移送時間と、前記移送先となるサーバ装置における移送される分散入力データに対する処理時間とを含む前記対象タスクの処理時間が前記要求時間内に収まるか否かを判定し、
　前記対象タスクの実行計画の決定は、前記判定結果に基づいて、前記分散入力データの移送、及び、前記移送先となるサーバ装置での前記対象タスクの実行を、前記対象タスクの実行計画として更に決定する、
　付記１２に記載のタスク管理方法。

（付記１４）
　前記選択された所定空き確率で保証される空きリソース量に基づいて、前記オーバフローサーバ装置における、該空きリソース量で処理可能な最大入力データ量を算出し、
　前記分散入力データの量と前記最大入力データ量との差分を、前記オーバフローサーバ装置から移送させる分散入力データの量として算出する、
　ことを更に含む付記１３に記載のタスク管理方法。

（付記１５）
　前記対象タスクを実行させる複数のサーバ装置を選択し、
　前記選択された各サーバ装置における前記選択された所定空き確率で保証される各空きリソース量と、前記対象タスクで処理される入力データの中から、前記選択された各サーバ装置に割り当てられる分散入力データの量とに基づいて、前記選択された各サーバ装置における前記対象タスクの完了時間をそれぞれ推定し、
　前記推定結果から得られる前記対象タスク全体の完了時間が短縮されるように、前記選択された各サーバ装置間での分散入力データの移送パターンを決定する、
　ことを更に含む付記１０から１４のいずれか１つに記載のタスク管理方法。

（付記１６）
　前記判定は、複数のサーバ装置が同じ入力データを重複して持つ場合、前記スケジューリング部は、前記選択された所定空き確率で保証される空きリソース量、及び、該入力データの量に基づいて、同じ入力データを持つ各サーバ装置について、前記対象タスクが前記要求時間内に完了するか否かをそれぞれ判定し、
　前記サーバ装置の選択は、同じ入力データを持つ複数のサーバ装置の中の、前記対象タスクを前記要求時間内に完了させ得るサーバ装置を優先的に前記対象タスクを処理させるサーバ装置として選択する、
　付記１０から１５のいずれか１つに記載のタスク管理方法。

（付記１７）
　前記サーバ装置の選択は、複数のサーバ装置が同じ入力データを重複して持つ場合、同じ入力データを持ち、かつ、前記対象タスクを前記要求時間内に完了させ得る複数のサーバ装置の中の、前記選択された所定空き確率で保証される空きリソース量で処理可能な最大入力データ量に対する該入力データの量の割合が大きいサーバ装置を優先的に前記対象タスクを処理させるサーバ装置として選択する、
　付記１６に記載のタスク管理方法。

（付記１８）
　前記決定された前記対象タスクの実行計画に基づいて、前記対象タスクを実行させると決定されたサーバ装置に前記対象タスクを実行させ、
　前記対象タスクの実行中に、所定量のリソースが明示的に割当てられているソフトウェア実行単位が該リソースを要求する場合、前記対象タスクにリソースを解放させる、
　ことを更に含む付記１０から１７のいずれか１つに記載のタスク管理方法。

（付記１９）
　付記１０から１８のいずれか１つに記載のタスク管理方法を少なくとも１つのコンピュータに実行させるプログラム。

（付記２０）
　付記１９に記載のプログラムをコンピュータが読み取り可能に記録する記録媒体。

　この出願は、２０１３年３月４日に出願された日本出願特願２０１３－０４１８５７号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

　サーバ装置上で実際に使用されているリソース量を示す実リソース使用量を取得するリソース情報取得部と、
　前記リソース情報取得部により取得される実リソース使用量の履歴に基づいて、前記サーバ装置のための、複数の所定空き確率について該所定空き確率で保証される空きリソース量をそれぞれ示す確率的空きリソース情報を生成するリソース分析部と、
　対象タスクを実行させる少なくとも１つのサーバ装置を選択し、前記複数の所定空き確率の中から所定完了確率に対応する所定空き確率を選択し、該選択されたサーバ装置のための前記確率的空きリソース情報により示される、該選択された所定空き確率で保証される空きリソース量に基づいて、該対象タスクの実行計画を決定するスケジューリング部と、
　を備えるタスク管理装置。
　前記スケジューリング部は、前記選択された所定空き確率で保証される空きリソース量、及び、前記対象タスクで処理される入力データの量に基づいて、前記対象タスクが要求時間内に完了するか否かを判定し、該判定結果に基づいて、前記対象タスクの実行計画を決定する、
　請求項１に記載のタスク管理装置。
　前記対象タスクで処理される入力データが分散配置されている各サーバ装置における分散入力データの量をそれぞれ示す入力データ所在情報を取得する入力データ取得部、
　を更に備え、
　前記リソース情報取得部は、前記複数のサーバ装置の各々に関する前記実リソース使用量をそれぞれ取得し、
　前記リソース分析部は、前記複数のサーバ装置の各々について前記確率的空きリソース情報をそれぞれ生成し、
　前記スケジューリング部は、前記対象タスクを実行させるサーバ装置として前記分散入力データを持つ複数のサーバ装置を選択し、前記複数の所定空き確率の中から、該選択されたサーバ装置の数及び所定完了確率に対応する所定空き確率を選択し、該選択された各サーバ装置における該選択された所定空き確率で保証される各空きリソース量、及び、該選択された各サーバ装置が持つ分散入力データの量に基づいて、該選択された各サーバ装置上で実行される前記対象タスクがそれぞれ前記要求時間内に完了するか否かを判定する、
　請求項２に記載のタスク管理装置。
　前記スケジューリング部は、前記対象タスクが前記要求時間内に完了しないと判定されたオーバフローサーバ装置が持つ分散入力データの少なくとも一部の移送先となるサーバ装置を決定し、該分散入力データの移送と、該移送先となるサーバ装置において該移送される分散入力データに対する処理とを含む前記対象タスクが前記要求時間内に完了するか否かを判定し、該判定結果に基づいて、該分散入力データの移送、及び、該移送先となるサーバ装置での前記対象タスクの実行を、前記対象タスクの実行計画として更に決定する、
　請求項３に記載のタスク管理装置。
　前記スケジューリング部は、前記対象タスクを実行させる複数のサーバ装置を選択し、該選択された各サーバ装置における前記選択された所定空き確率で保証される各空きリソース量と、前記対象タスクで処理される入力データの中から、該選択された各サーバ装置に割り当てられる分散入力データの量とに基づいて、該選択された各サーバ装置における前記対象タスクの完了時間をそれぞれ推定し、該推定結果から得られる前記対象タスク全体の完了時間が短縮されるように、該選択された各サーバ装置間での分散入力データの移送パターンを、前記対象タスクの実行計画として更に決定する、
　請求項１から４のいずれか１項に記載のタスク管理装置。
　複数のサーバ装置が同じ入力データを重複して持つ場合、前記スケジューリング部は、前記選択された所定空き確率で保証される空きリソース量、及び、該入力データの量に基づいて、同じ入力データを持つ各サーバ装置について、前記対象タスクが前記要求時間内に完了するか否かをそれぞれ判定し、同じ入力データを持つ複数のサーバ装置の中の、前記対象タスクを前記要求時間内に完了させ得るサーバ装置を優先的に前記対象タスクを処理させるサーバ装置として選択する、
　請求項１から５のいずれか１項に記載のタスク管理装置。
　複数のサーバ装置が同じ入力データを重複して持つ場合、前記スケジューリング部は、同じ入力データを持ち、かつ、前記対象タスクを前記要求時間内に完了させ得る複数のサーバ装置の中の、前記選択された所定空き確率で保証される空きリソース量で処理可能な最大入力データ量に対する該入力データの量の割合が大きいサーバ装置を優先的に前記対象タスクを処理させるサーバ装置として選択する、
　請求項６に記載のタスク管理装置。
　前記スケジューリング部により決定された前記対象タスクの実行計画に基づいて、前記対象タスクを実行させると決定されたサーバ装置に前記対象タスクを実行させ、前記対象タスクの実行中に、所定量のリソースが明示的に割当てられているソフトウェア実行単位が該リソースを要求する場合、前記対象タスクにリソースを解放させるタスク制御部、
　を更に備える請求項１から７のいずれか１項に記載のタスク管理装置。
　少なくとも１つのコンピュータにより実行されるタスク管理方法において、
　サーバ装置上で実際に使用されているリソース量を示す実リソース使用量を取得し、
　前記取得された実リソース使用量の履歴に基づいて、前記サーバ装置のための、複数の所定空き確率について該所定空き確率で保証される空きリソース量をそれぞれ示す確率的空きリソース情報を生成し、
　対象タスクを実行させる少なくとも１つのサーバ装置を選択し、
　前記複数の所定空き確率の中から所定完了確率に対応する所定空き確率を選択し、
　前記選択されたサーバ装置のための前記確率的空きリソース情報により示される、前記選択された所定空き確率で保証される空きリソース量に基づいて、前記対象タスクの実行計画を決定する、
　ことを含むタスク管理方法。
　少なくとも１つのコンピュータに、
　サーバ装置上で実際に使用されているリソース量を示す実リソース使用量を取得し、
　前記取得された実リソース使用量の履歴に基づいて、前記サーバ装置のための、複数の所定空き確率について該所定空き確率で保証される空きリソース量をそれぞれ示す確率的空きリソース情報を生成し、
　対象タスクを実行させる少なくとも１つのサーバ装置を選択し、
　前記複数の所定空き確率の中から所定完了確率に対応する所定空き確率を選択し、
　前記選択されたサーバ装置のための前記確率的空きリソース情報により示される、前記選択された所定空き確率で保証される空きリソース量に基づいて、前記対象タスクの実行計画を決定する、
　ことを実行させるプログラム。