JP2022509170A

JP2022509170A - プロセッサにおける余裕認識（ｌａｘｉｔｙ－ａｗａｒｅ）型動的優先度変更

Info

Publication number: JP2022509170A
Application number: JP2021529283A
Authority: JP
Inventors: タイイエツン; ベックマンブラッドフォード; プソールスラージ; デイビッドシンクレアマシュー
Original assignee: Advanced Micro Devices Inc
Current assignee: Advanced Micro Devices Inc
Priority date: 2018-11-26
Filing date: 2019-06-20
Publication date: 2022-01-20
Anticipated expiration: 2039-06-20
Also published as: EP3887948A1; WO2020112170A1; CN113316767A; US20200167191A1; JP7461947B2; EP3887948A4; KR20210084620A

Abstract

処理システム（１００）は、タスクキュー（２３２）と、タスクキューに接続された余裕認識タスクスケジューラ（２３４）と、余裕認識タスクスケジューラに接続されたワークグループディスパッチャ（２３８）と、を含む。ワークグループディスパッチャは、タスクキューに記憶された複数のタスクに関連する余裕値の余裕評価に基づいて、複数のタスクをスケジューリングする。余裕評価は、複数のタスクの各タスクの優先度を決定することを含む。余裕値は、到着時間、タスク期間、タスク期限及びワークグループの数を含む余裕情報を使用して決定される。
【選択図】図２

Description

畳み込みニューラルネットワーク（ＣＮＮ）及びリカレントニューラルネットワーク（ＲＮＮ）等の多くの重要な機械学習コンピューティングアプリケーションには、タスクをスケジューリングする場合に考慮しなければならないリアルタイム期限（real-time deadlines）がある。タスクは、例えばＣＮＮ及びＲＮＮアプリケーションで通常使用される特化型データ依存性カーネル（narrow data-dependent kernels）として定義され得る。現在の機械学習システムは、多くの場合、プログラマにより静的に設定されるか、実行時にタスクがキューに入れられた場合に設定されるタスク優先度を使用して、同時に投入されたタスクをどのようにスケジューリングするかをハードウェアに通知する。その結果、優先度レベルは、期限が確実に守られるように、控えめに（conservatively）設定される。しかしながら、優先度レベルは、通常、タスクをいつ完了しなければならないかに関する情報を提供せずに、タスクの相対的な重要性のみを提供するので、優先度レベルのみを考慮するのは不十分である。さらに、個々のタスクに割り当てられた優先度レベルでは、一連の依存タスクをまとめて完了する必要がある場合のグローバルビュー（global view）をハードウェアに提供しない。

中央処理装置（ＣＰＵ）及びグラフィックス処理装置（ＧＰＵ）でリアルタイム期限を守るように展開されたタスクスケジューリングソリューションは、優先度の高いタスクを実行するために、優先度の低いタスクがプリエンプトされる。このプリエンプション技術は、マルチコアＣＰＵでよく使用され、ＧＰＵではあまり使用されない。殆どのプリエンプションスキームは、オペレーティングシステムによって制御され、プリエンプションのオーバーヘッドによって全体的なスループットが低下することがよくある。プリエンプションのオーバーヘッドは、ＧＰＵのコンテキスト状態の量が多いため、ＧＰＵで特に問題になる。さらに、ＯＳとアクセラレータとの間の通信のレイテンシは、即時変更を困難にする。

リアルタイム期限を守るように展開された別のタスクスケジューリングソリューションでは、複数のキューのタスクが同時に実行され、異なるキューのタスクに一意的な優先度が関連付けられる。例えば、一部のＧＰＵは、タスクのリアルタイム制約に関する情報をスケジューラに伝達するのに役立つ４つの優先度レベル（グラフィックス、高、中、低）をサポートする。しかしながら、上位レベルのソフトウェアが提供する情報は静的であり、個々のタスクにのみ関連付けられているため、スケジューラは、優先度が現在のＧＰＵの全体的な状況にどのように関係しているかを決定することができない。

他のソリューションでは、永続的なスレッド又はカーネルを低レベルのユーザランタイムとともに使用して、並行タスクを処理する。永続的カーネル技術は、現在のＲＮＮ推論アプリケーションで特に一般的になっている。タスクランタイムがよく理解され、使用可能なハードウェアリソースが一定に保たれている場合には、永続的カーネルが適切に動作するが、タスクランタイム及びハードウェアリソースが動的に変化する場合には、永続的カーネルが正常に動作しなくなる。よって、レイテンシを改善し、動的スケジューリングアプリケーションを利用する、改善されたタスクスケジューリング技術が望ましい。

本開示は、添付図面を参照することによってより良く理解することができ、その多くの特徴及び利点が当業者に明らかになる。異なる図面において同じ符号を使用する場合、類似又は同一の要素を示す。

いくつかの実施形態による、余裕認識（laxity-aware）タスクスケジューリングを実施する処理システムのブロック図である。いくつかの実施形態による、余裕認識タスクスケジューリングを実施するグラフィックス処理装置のブロック図である。いくつかの実施形態による、余裕認識タスクスケジューリングを実施する際に使用されるテーブル及びキューを備えた余裕認識タスクスケジューラのブロック図である。いくつかの実施形態による、余裕認識タスクスケジューラの例示的な動作のブロック図である。いくつかの実施形態による、余裕認識タスクスケジューラの例示的な動作のブロック図である。いくつかの実施形態による、処理システムの構成要素の少なくとも一部を利用して、余裕認識タスクスケジューリングを実行するための方法を示すフロー図である。

図１～図６を参照すると、余裕認識タスクスケジューリングシステムは、時間を考慮してタスク及び／又はジョブに優先度を付け、例えば中央処理装置（ＣＰＵ）又はメモリによってグラフィックス処理装置（ＧＰＵ）に提供されるタスクについて計算された余裕時間（laxity）に基づいて、ジョブに関連するタスクの優先度を切り替える。余裕認識タスクスケジューリングシステムは、ジョブに関連する期限に基づいてタスクの優先度を動的に変更するようにタスクスケジューラを拡張することによって、スケジューリングの問題を軽減する。

他のタスクスケジューラに対する余裕認識タスクスケジューリングシステムの改善点及び利点には、ＧＰＵで実行される多数のリカレントニューラルネットワーク（ＲＮＮ）推論ジョブを同時にスケジューリングすることを可能にする余裕認識タスクスケジューリングシステムの能力が含まれる。この場合のジョブという用語は、リアルタイム期限を守るために時間通りに完了する一連の依存タスク（ＧＰＵカーネル等）を指す。余裕認識スケジューリングシステムが重要なリアルタイム制約を管理する能力により、余裕認識スケジューリングシステムは、機械翻訳、音声認識、自動運転車のオブジェクト追跡、及び、音声翻訳で発生する多くの重要なスケジューリング問題を処理することが可能になる。単一のＲＮＮ推論ジョブは、通常、一連の特化型データ依存性カーネル（すなわち、タスク）を含み、適切なスケジューリングアプローチ無しにＧＰＵの処理能力を十分に活用できない場合がある。しかしながら、余裕認識タスクスケジューリングシステムを使用することによって、スケジューリング効率を向上させ、リアルタイム期限を守るように、多くの独立したＲＮＮ推論ジョブを同時にスケジューリングすることが可能になる。

個々のＲＮＮジョブに関連するタスクが別々のキューに入れられる同時ＲＮＮ推論ジョブの実行に使用される他のスケジューリング技術としては、例えば、先入れ先出し（ＦＩＦＯ）ジョブスケジューラが挙げられる。ＦＩＦＯジョブスケジューラは、常に、個々のジョブをＦＩＦＯ方式で実行し、ＧＰＵリソースをジョブ間で静的に分割したり、複数のジョブをまとめてバッチ処理するように試みるので、応答時間が長くなり、スループットが低下し、スケジューリングシステムのリアルタイム保証が損なわれる可能性がある。余裕認識タスクシステムは、ジョブをまとめてバッチ処理し、例えば、個々のジョブのＦＩＦＯスケジューリングと比較して、平均応答時間を４．５倍向上させる。したがって、余裕認識スケジューリングシステムは、他のＦＩＦＯスケジューリング技術と比較して、ＧＰＵパフォーマンスを大幅に向上させる。

図１は、いくつかの実施形態による、余裕認識タスクスケジューリングを実施する処理システム１００のブロック図である。処理システム１００は、中央処理装置（ＣＰＵ）１４５と、メモリ１０５と、バス１１０と、グラフィックス処理装置（ＧＰＵ）１１５と、入力／出力エンジン１６０と、ディスプレイ１２０と、外部ストレージ構成要素１６５と、を含む。ＧＰＵ１１５は、余裕認識タスクスケジューラ１４２と、計算ユニット１２５と、内部（又は、オンチップ）メモリ１３０と、を含む。ＣＰＵ１４５は、プロセッサコア１５０と、余裕（laxity）情報モジュール１２２と、を含む。メモリ１０５は、命令のコピー１３５と、オペレーティングシステム１４４と、プログラムコード１５５と、を含む。様々な実施形態では、ＣＰＵ１４５は、バス１１０を介してＧＰＵ１１５、メモリ１０５及びＩ／Ｏエンジン１６０に接続されている。

処理システム１００は、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）等の非一時的なコンピュータ可読記憶媒体を使用して実装されるメモリ１０５、又は、他のストレージコンポーネントにアクセスする。しかし、メモリ１０５は、スタティックランダムアクセスメモリ（ＳＲＡＭ）及び不揮発性ＲＡＭ等を含む他のタイプのメモリを使用して実装することもできる。

また、処理システム１００は、メモリ１０５等のように処理システム１００に実装されたエンティティ間の通信をサポートするバス１１０を含む。処理システム１００のいくつかの実施形態は、明確にするために図１に示されていない他のバス、ブリッジ、スイッチ及びルータ等を含む。

処理システム１００は、機械学習タスクを実行し、ディスプレイ１２０上に提示される画像をレンダリングするように構成された１つ以上のＧＰＵ１１５を含む。例えば、ＧＰＵ１１５は、オブジェクトをレンダリングして、ディスプレイ１２０に提供される画素値を生成することができ、ディスプレイ１２０は、画素値を使用して、レンダリングされたオブジェクトを表す画像を表示する。ＧＰＵ１１５のいくつかの実施形態は、ハイエンドコンピューティングにも使用することができる。例えば、ＧＰＵ１１５を使用して、例えば畳み込みニューラルネットワーク（ＣＮＮ）又はリカレントニューラルネットワーク（ＲＮＮ）等の様々なタイプのニューラルネットワークの機械学習アルゴリズムを実施することができる。場合によっては、例えば、単一のＧＰＵ１１５が、割り当てられた機械学習アルゴリズムを実行するのに十分な処理能力を有していない場合には、機械学習アルゴリズムを実行するように複数のＧＰＵ１１５の動作が調整される。複数のＧＰＵ１１５は、１つ以上のインターフェース（明確にするために図１に示されていない）を介したＧＰＵ間通信を使用して通信する。

処理システム１００は、ディスプレイ１２０、並びに、キーボード、マウス、プリンタ及び外部ディスク等の処理システム１００の他の要素に関連する入力動作又は出力動作を処理する入力／出力（Ｉ／Ｏ）エンジン１６０を含む。Ｉ／Ｏエンジン１６０は、メモリ１０５、ＧＰＵ１１５又はＣＰＵ１４５と通信するように、バス１１０に接続されている。図示した実施形態では、Ｉ／Ｏエンジン１６０は、コンパクトディスク（ＣＤ）、及びデジタルビデオディスク（ＤＶＤ）等の非一時的なコンピュータ可読記憶媒体を使用して実装された外部ストレージ構成要素１６５に記憶された情報を読み出すように構成されている。また、Ｉ／Ｏエンジン１６０は、ＧＰＵ１１５又はＣＰＵ１４５による処理の結果等の情報を、外部ストレージ構成要素１６５に書き込むことができる。

また、処理システム１００は、バス１１０に接続され、バス１１０を介してＧＰＵ１１５及びメモリ１０５と通信するＣＰＵ１４５を含む。図示した実施形態では、ＣＰＵ１４５は、命令を同時又は並行して実行するように構成された複数の処理要素（プロセッサコアとも呼ばれる）１５０を実装する。ＣＰＵ１４５は、メモリ１０５に記憶されたプログラムコード１５５等の命令を実行することができ、実行された命令の結果等の情報をメモリ１０５に記憶することができる。また、ＣＰＵ１４５は、ドローコール、すなわちコマンド又は命令をＧＰＵ１１５に発行することによって、グラフィック処理を開始することができる。

ＧＰＵ１１５は、命令を同時又は並行して実行するように構成された複数の処理要素（計算ユニットとも呼ばれる）１２５を実装する。また、ＧＰＵ１１５は、ローカルデータストア（ＬＤＳ）、並びに、計算ユニット１２５が利用するキャッシュ、レジスタ又はバッファを含む、内部メモリ１３０を含む。内部メモリ１３０は、１つ以上の計算ユニット１２５で実行されるタスクを記述するデータ構造を記憶する。

図示した実施形態では、ＧＰＵ１１５は、バス１１０を介してメモリ１０５と通信する。しかし、ＧＰＵ１１５のいくつかの実施形態は、直接接続を介して、又は、他のバス、ブリッジ、スイッチ及びルータ等を介して、メモリ１０５と通信する。ＧＰＵ１１５は、メモリ１０５に記憶された命令を実行することができ、実行された命令の結果等の情報をメモリ１０５に記憶することができる。例えば、メモリ１０５は、機械学習アルゴリズム又はニューラルネットワークを表すプログラムコード等のようにＧＰＵ１１５が実行するプログラムコードからの命令のコピー１３５を記憶することができる。また、ＧＰＵ１１５は、タスク要求を受信し、タスクを１つ以上の計算ユニット１２５にディスパッチするコプロセッサ１４０を含む。

処理システム１００の動作中、ＣＰＵ１４５は、ＧＰＵ１１５によって実行されるプログラム命令を表すカーネルの処理を開始するためのコマンド又は命令を、ＧＰＵ１１５に発行する。本明細書でスレッド又はワークアイテム（work items）と呼ばれるカーネルの複数のインスタンスは、計算ユニット１２５のサブセットを使用して同時に又は並行して実行される。いくつかの実施形態では、スレッドは、各スレッドが異なるデータに対して同じ命令を実行するように、単一命令複数データ（ＳＩＭＤ）プロトコルに従って実行される。スレッドは、異なる計算ユニット１２５で実行されるワークグループにまとめられる。

従来のタスクスケジューリングプラクティスに関連する問題に少なくとも部分的に対処し、使用率、パフォーマンスを改善し、一連のデータ依存タスクのリアルタイム期限を守るために、余裕認識タスクスケジューラ１４２は、ジョブ又はタスクの期限までの余裕（laxity）に基づいてタスク優先度を動的に調整するように、拡張される。本明細書で使用される場合、余裕とは、タスクを完了しなければならない時までにタスクが有する余分な時間、すなわちスラック（slack）の量である。いくつかの実施形態では、タスク（又は、ジョブ）の動的優先度は、ソフトウェアから提供される（又は、例えばＣＰＵ１４５から提供される余裕情報から計算される）タスク（又は、ジョブ）のリアルタイム期限と、ジョブに関連する残りのタスクの集合が完了するのに要する推定時間と、の差に基づいて設定される。推定は、例えば、以前に発生した同様のタスクが費やした時間に基づいており、余裕認識タスクスケジューラ１４２によって例えばハードウェアテーブルに記憶される。様々な実施形態では、推定は、例えば、関連するジョブのキュー内の残りのタスクを分析するパケットプロセッサ（例えば、ＧＰＵ１１５）によって決定される。パケットプロセッサは、残りのタスクのタイプを特定すると、以前のタスクの継続時間を記憶するハードウェアテーブルを参照する。余裕認識タスクスケジューラ１４２は、推定値を合計することによって、残り時間を推定する。タスクの余裕が少ないと、タスクの優先度が高くなる。さらに、後続の推定値の精度を継続的に向上させるために、ハードウェアテーブルに記憶された情報は、タスクの完了後に更新され、そのタスク専用のリソース量を含むようにさらに改良される。

様々な実施形態において、処理システム１００の余裕認識タスクスケジューラ１４２は、完了前のタスク又はジョブの余裕量に基づいて計算タスクのタスク優先度を動的に変化させることによって、例えば、最早期限優先（ＥＤＦ：Earliest Deadline First）タスクスケジューリングアルゴリズム等の既存のスケジューリングポリシーを増強するタスクスケジューリングのメカニズムを提供する。様々な実施形態において、タスク期限又はジョブ期限が終了する時までにジョブ又はタスクに余裕がある場合、他のタスクを完了できるように、スケジューリングキューにおいて、余裕のあるタスクの優先度が低減され得る。

様々な実施形態において、ＧＰＵ１１５が余裕を考慮してタスクを動的に調整できるようにするために、例えば、余裕認識タスクスケジューラ１４２及び余裕情報モジュール１２２等のハードウェア及びソフトウェアがＧＰＵ１１５のサポートとして提供され、同時に、ジョブのリアルタイム期限をＧＰＵ１１５に通知することにより、同じタスク（又は、類似カーネルの他のタスク）の以前の実行に基づいて、所定のタスク又はジョブが完了するまでの時間の推定値（例えば、タスク又はジョブが完了するのに要する時間）が提供され、タスクが完了した後に推定値が更新される。

図２は、いくつかの実施形態による、余裕認識タスクスケジューリングを実施するグラフィック処理装置（ＧＰＵ）２００を示す図である。ＧＰＵ２００は、タスクキュー２３２と、余裕認識タスクスケジューラ２３４と、ワークグループディスパッチャ２３８と、計算ユニット２１４と、計算ユニット２１６と、計算ユニット２１８と、相互接続２８２と、キャッシュ２８４と、メモリ２８８と、を含む。タスクキュー２３２は、余裕認識タスクスケジューラ２３４に接続されている。余裕認識タスクスケジューラ２３４は、ワークグループディスパッチャ２３８に接続されている。ワークグループディスパッチャ２３８は、計算ユニット２１４～２１８に接続されている。計算ユニット２１４～２１８は、相互接続２８２に接続されている。相互接続２８２は、キャッシュ２８４に接続されている。キャッシュ２８４は、メモリ２８８に接続されている。様々な実施形態では、余裕認識タスクスケジューリングを実施するために、例えばＣＰＵ等の他のタイプの処理ユニットが利用され得る。

ＧＰＵ２００の動作中、図１をさらに参照すると、ＣＰＵ１４５は、ＧＰＵ２００で実行されるカーネルを記述するアーキテクテッドキューイング言語（ＡＱＬ）パケット等のパケットを送信することによって、作業をＧＰＵ２００にディスパッチする。パケットのいくつかの実施形態は、ＧＰＵ２００で実行されるコードのアドレス、レジスタ割り当て要件、ローカルデータストア（ＬＤＳ）のサイズ、ワークグループサイズ、初期レジスタ状態を定義する構成情報、引数バッファへのポインタ等を含む。例えば、ＡＱＬキュー等のタスクキュー２３２にパケットを書き込むことによって、パケットがキューに入れられる。

様々な実施形態では、処理システム１００のＧＰＵ２００は、ポータビリティためのヘテロジニアスインターフェース（ＨＩＰ）ストリームを使用して、カーネルを非同期的に開始することができる。ＨＩＰストリームにより開始されたカーネルは、タスクキュー２３２（ＡＱＬキュー）にマッピングされる。様々な実施形態では、各ＲＮＮジョブは、個別のＨＩＰストリームを使用し、ワークグループディスパッチャ２３８は、各ＡＱＬキューを走査して、ジョブに関連するタスク（例えばＱ１、Ｑ２、・・・、Ｑ３２）を見つける。ワークグループディスパッチャ２３８は、これらのキュー内の作業をラウンドロビン方式でスケジューリングする。異なるＨＩＰストリーム又はＡＱＬキュー（異なるＲＮＮジョブを表す）によって処理されるカーネルは、ワークグループ、レジスタ及びＬＤＳ等のハードウェアリソースが利用可能である限り、同時に実行され得る。これにより、異なるＲＮＮジョブのカーネルを、複数のＧＰＵ２００で同時に実行することができる。様々な実施形態では、ＲＮＮタスクの応答時間を促進するために、ワークグループディスパッチャ２３８のスケジューリングポリシーは、余裕認識スケジューリングポリシーに再構成又は変更される。

処理システム１００の動作中、ＧＰＵ２００は、実行される複数のジョブ（例えば、ＲＮＮジョブ）をＣＰＵ１４５から受信する。様々な実施形態では、ジョブは、ＧＰＵ２００によって満たされるリアルタイム制約を有する複数のタスクを含む。各タスクは、ジョブのリアルタイム期限（タスク期限又はジョブ期限）までの残り時間と、タスク又はジョブを完了するのに要する時間（タスク期間又はジョブ期間）と、の差として定義される関連スラックすなわち余裕を有し得る。何れの場合も、ジョブ期限又はタスク期限は、例えばＯＳ１４４又はＣＰＵ１４５により提供され得る。

ＧＰＵ２００は、ジョブを受信し、ジョブ及び各ジョブに関連するタスクをタスクキュー２３２に記憶する。余裕認識タスクスケジューリングを実行するために、タスクキュー２３２に記憶された各タスクは、各ジョブ及びタスクに固有の余裕情報を含む。様々な実施形態では、余裕情報は、例えば、ジョブ到着時間、ジョブ期限、ワークグループの数を含む。様々な実施形態では、余裕情報は、例えば、タスク到着時間、タスク期限、ワークグループの数を含む。様々な実施形態では、余裕情報は、余裕情報モジュール１２２及び／又はＯＳ１４４により提供されるジョブ期間及び／又はタスク期間も含むことができる。

余裕認識タスクスケジューラ２３４は、余裕情報及びタスク期間を受信し、各タスクに関連する余裕がある場合には、その余裕を決定する。様々な実施形態では、上述したように、余裕認識タスクスケジューラ２３４は、タスクのジョブ期限からタスク期間を差し引くことによって、タスクに関連する余裕を決定する。例えば、タスクのジョブ期限のタイムステップ（すなわち、時間増分）が７であり、タスク期間のタイムステップが４であり、このタスクがジョブのキューにおける最後のタスクである場合、タスクに関連する余裕は３となる。余裕認識タスクスケジューラ２３４は、ジョブに関連する各タスクの余裕値を計算し続け、タスク優先度を割り当てるために、タスク余裕値をワークグループディスパッチャ２３８に提供する。

様々な実施形態では、ワークグループディスパッチャ２３８は、各タスクに関連する余裕値を余裕認識タスクスケジューラ２３４から受信し、全てのタスクの余裕値に基づいて各タスクの優先度を割り当てる。ワークグループディスパッチャ２３８は、各タスクの余裕値を他のタスクの余裕値と比較することによって、優先度を割り当てる。ワークグループディスパッチャ２３８は、比較の結果に基づいて、各タスクの優先度を動的に増減させる。例えば、他のタスクの余裕値と比較して余裕値が低いタスクには、高いスケジューリング優先度が与えられる。他のタスクの他の余裕値と比較して余裕値が高いタスクには、低いスケジューリング優先度が与えられる。スケジューリング優先度の高いタスクは、スケジューリング優先度の低いタスクよりも前に実行されるようにスケジューリングされる。スケジューリング優先度の低いタスクは、スケジューリング優先度の高いタスクよりも後に実行されるようにスケジューリングされる。

様々な実施形態では、ワークグループディスパッチャ２３８は、ワークグループスケジューラ（図示省略）を使用して、計算ユニット２１４～２１８が追加タスクに利用可能な追加スロットを有しなくなるまで、新たに更新された優先度の最も高いタスクから優先度のより低いタスクまでの中からワークグループを選択する。計算ユニット２１４～２１８は、所定の優先度でタスクを実行し、実行されたタスクを相互接続２８２に提供して、処理のためにキャッシュ２８４及びメモリ２８８にさらに分配する。

図３は、いくつかの実施形態による、余裕認識タスクスケジューリングを実施する余裕認識タスクスケジューラ３００のブロック図である。余裕認識タスクスケジューラ３００は、タスクレイテンシテーブル３１０と、カーネルテーブル３２０と、優先度キューテーブル３３０と、を含む。タスクレイテンシテーブル３１０は、タスク識別（タスクＩＤ）３１２と、カーネル名３１４と、ワークグループカウント３１６と、タスク期間３１８と、を含む。タスクＩＤ３１２は、タスクの識別番号を記憶する。様々な実施形態では、タスクＩＤは、例えばＣＰＵ１４５によって提供されるＡＱＬキューＩＤと同一である。カーネル名３１４は、カーネルの名称を記憶する。ワークグループカウントは、ジョブ内のタスクによって使用されるカーネルの数を記憶する。

タスク期間３１８は、タスクの残り時間であり、ワークグループ実行時間、すなわちカーネルテーブル３２０内のカーネル時間３２４に対して、ワークグループカウントエントリ、すなわちタスクレイテンシテーブル３１０のワークグループカウント３１６を乗算することによって決定される。タスク期間は、カーネルテーブル３２０の単一の作業実行時間と、タスクレイテンシテーブル３１０のカーネル名‐ワークグループカウントに基づくワークグループカウントエントリと、の乗算結果を記憶する。

カーネルテーブル３２０は、カーネル名３２２と、カーネル時間３２４と、を記憶する。カーネル名３２２は、実行中のカーネルの名称であり、カーネル時間３２４は、カーネルのワークグループの平均実行時間である。優先度キューテーブル３３０は、タスク優先度３３２と、タスクキューＩＤ３３４と、を含む。タスク優先度３３２は、余裕認識タスクスケジューラ３００によってタスクに割り当てられた優先度である。タスクキューＩＤ３３４は、キュー内のタスクのＩＤ番号である。様々な実施形態では、処理システム１００のＧＰＵ２００の余裕認識ジョブスケジューリングを可能にするために、ジョブは、余裕認識タスクスケジューラ３００内のタスクに置き換えられ得る。

図１～図３を参照すると、余裕認識タスクスケジューラ３００は、タスクレイテンシテーブル３１０及びカーネルテーブル３２０に記憶された値を、例えば、ＯＳ１４４若しくはランタイムによって渡される余裕情報、又は、アプリケーションからユーザによって設定された余裕情報と共に使用して、余裕及びタスク優先度の評価、すなわち余裕認識タスクスケジューリングを行う。余裕情報は、例えば、ジョブ到着時間、タスク期間、ジョブ期限、ワークグループの数を含む。ジョブ到着時間は、ジョブが例えばＧＰＵ２００に到着する時刻である。ジョブ期限は、ジョブを完了しなければならない時刻であり、処理システム１００によって指示される。タスク期間は、推定されるタスクの長さである。

タスク期間は、ＯＳ１４４によって余裕認識タスクスケジューラ３００に提供されてもよく、又は、余裕認識タスクスケジューラ３００は、タスクレイテンシテーブル３１０及びカーネルテーブル３２０を使用することによってタスク期間を推定してもよい。様々な実施形態では、余裕認識タスクスケジューラ３００は、現在のタスク時間からタスク到着時間を減算することによってタスク期間を推定する。

タスクレイテンシテーブル３１０、カーネルテーブル３２０及び優先度キューテーブル３３０のエントリは、カーネルが完了すると、処理システム１００によって更新される。処理システム１００がカーネルを完了すると、カーネルテーブル３２０及びタスクレイテンシテーブル３１０内の対応するエントリが更新され、後続のタスク期間の推定値が決定される。ジョブ／キューに関連する全てのタスクが把握されると、タスクレイテンシテーブル３１０、カーネルテーブル３２０及び優先度キューテーブル３３０に提供される情報を使用して、タスクの余裕が計算される。

図４は、いくつかの実施形態による、余裕認識タスクスケジューリングを示す図である。図１～図３を参照すると、図示した例では、３つのタスク、ＴＡＳＫ１、ＴＡＳＫ２、ＴＡＳＫ３が存在し、これらは、余裕認識タスクスケジューラ３００によってタスクキュー２３２から受信されている。各タスクは単一のカーネルを含み、カーネル及びタスクは、各タスクが到着した順番を表す１～３の番号が付されている（すなわち、ＴＡＳＫ１、ＴＡＳＫ２、ＴＡＳＫ３）。図４に示す例では、ＴＡＳＫ１が１番目に到着し、ＴＡＳＫ２が２番目に到着し、ＴＡＳＫ３が３番目に到着している。到着時に、ＧＰＵ２００は、３つのカーネル全てが同じ（静的）優先度を有すると想定する。図４に示す例では、余裕認識タスクスケジューラ３００がスケジューリングを行うために利用可能な２つの計算ユニットＣＵ２１４及びＣＵ２１６が存在する。横軸は、タイムステップ０～８を示しており、例えば、各タスクのタスク期限、タスク期間及び余裕値の指標を示している。

例えば、ＣＰＵ１４５やＯＳ１４４から提供される各タスク（ＴＡＳＫ１、ＴＡＳＫ２、ＴＡＳＫ３）の余裕情報は、Ｋ（到着時間、タスク期間、タスク期限、ワークグループの数）の形式である。ＴＡＳＫ１の場合、Ｋ１（到着時間、タスク期間、タスク期限、ワークグループの数）は、Ｋ１（０、３、３、１）である。ＴＡＳＫ２の場合、Ｋ２（到着時間、タスク期間、タスク期限、ワークグループの数）は、Ｋ２（０、４、７、１）である。ＴＡＳＫ３の場合、Ｋ３（到着時間、タスク期間、タスク期限、ワークグループの数）は、Ｋ３（０、８、８、１）である。したがって、Ｋ１の場合、到着時間、タスク期間、タスク期限、ワークグループの数は、それぞれ０、３、３、１である。Ｋ２の場合、到着時間、タスク期間、タスク期限、ワークグループの数は、それぞれ０、４、７、１である。Ｋ３の場合、到着時間、タスク期間、タスク期限、ワークグループの数は、それぞれ０、８、８、１である。

様々な実施形態では、各タスクの到着時間、タスク期間、タスク期限、ワークグループの数を使用して、各タスクの余裕値がスケジューリングのために計算される。ＴＡＳＫ１の場合、余裕値は３－３、つまり０と計算される。ＴＡＳＫ２の場合、余裕値は７－４、つまり３と計算される。ＴＡＳＫ３の場合、余裕値は８－８、つまり０と計算される。次に、各タスクの余裕値の比較に基づいて、丸で囲んだ数字１、２、３からわかるように、タスクがスケジューリングされる。ＴＡＳＫ３及びＴＡＳＫ１の余裕値は、３つのタスクの中で最も低く、それぞれの余裕値は０である。ＴＡＳＫ１及びＴＡＳＫ３の余裕値は等しいことから、ＴＡＳＫ１のタスク期間とＴＡＳＫ３のタスク期間とを比較して、タスクの中で何れのタスクのタスク期間が最も短いかが確認される。タスク期間が最大（最長）のタスクが１番目にスケジューリングされ、タスク期間が２番目に長いタスクが２番目にスケジューリングされ、以下同様である。提供された例では、ＴＡＳＫ３のタスク期間はＴＡＳＫ１のタスク期間よりも長いので、ＴＡＳＫ３が１番目に計算ユニット２１６にスケジューリングされる。ＴＡＳＫ１は、２番目に計算ユニット２１４にスケジューリングされる。ＴＡＳＫ２は、３番目に計算ユニット２１４にスケジューリングされる。このように、余裕認識タスクスケジューラ３００は、各タスクの余裕に基づいて、ＴＡＳＫ１、ＴＡＳＫ２、ＴＡＳＫ３のスケジューリングを行っている。

様々な実施形態では、例えば、ＴＡＳＫ３がＴＡＳＫ２よりも先に計算ユニット２１６でスケジューリングされた場合、ＴＡＳＫ１及びＴＡＳＫ２は、ＴＡＳＫ２の余裕を利用して、計算ユニット２１４を順次利用することができ、一方、ＴＡＳＫ３は、計算ユニット２１６使用することによってそのタスク期限を守る。タスクスケジューラ３００は、タスクＴＡＳＫ１及びＴＡＳＫ２が８タイムステップ内でＣＵ２１４によって実行され、タスクＴＡＳＫ３がＣＵ２１６によって実行されるように、スケジュールの対象となるタスクを動的に調整している。このように、余裕認識タスクスケジューラ３００を使用することによって、ＧＰＵ２００は、８タイムステップ期限内にタスクＴＡＳＫ１、ＴＡＳＫ２、ＴＡＳＫ３を実行することができる。余裕認識タスクスケジューリングを使用してタスクをスケジューリングすることにより、計算ユニット２１４及び計算ユニット２１６を最大限に使用することが可能になり、同時に、余裕値が最も低いタスクの優先度を動的に高めることが可能になる。

図５は、いくつかの実施形態による、余裕認識タスクスケジューリングを示す図である。図５は、複数のタスクを有するジョブ（すなわち、各ジョブが少なくとも１つのタスクを有する）の余裕認識タスクスケジューリングの例を示している。図１～図３を参照すると、図示した例では、３つのジョブＪＯＢ１、ＪＯＢ２、ＪＯＢ３が存在し、これらは、余裕認識タスクスケジューラ３００によってタスクキュー２３２から受信される。いくつかの実施形態において、２つ以上のタスク（すなわち、複数のタスク）を有する各ジョブについて、タスクシーケンスはタスクの順序に依存しており、すなわち、各ジョブのタスクは、タスクのグラフと同様に、事前に指定された順序で実行され得る。つまり、例えば、ＪＯＢ１のＴＡＳＫ１は、ＪＯＢ１のＴＡＳＫ２の前に完了する必要がある。ＪＯＢ２のＴＡＳＫ１は、ＪＯＢ２のＴＡＳＫ２の前に完了する必要がある。各ジョブは、単一のカーネルを含み、カーネル及びジョブは、各ジョブが到着した順番を表す１～３の番号が付されている（すなわち、ＪＯＢ１、ＪＯＢ２、ＪＯＢ３）。図５に示す例では、ＪＯＢ１が１番目に到着し、ＪＯＢ２が２番目に到着し、ＪＯＢ３が３番目に到着している。到着時に、ＧＰＵ２００は、３つのカーネル全てが同じ（静的）優先度を有すると想定する。図５に示す例では、余裕認識タスクスケジューラ３００がスケジューリングを行うために利用可能な２つの計算ユニットＣＵ２１４及びＣＵ２１６が存在する。

例えば、ＣＰＵ１４５又はＯＳ１４４から提供される各ジョブ（ＪＯＢ１、ＪＯＢ２、ＪＯＢ３）の余裕情報は、Ｋ（到着時間、ジョブ期間、ジョブ期限、ワークグループの数）の形式である。ＪＯＢ１の場合、Ｋ１（到着時間、ジョブ期間、ジョブ期限、ワークグループの数）は、Ｋ１（０、３、３、１）である。ＪＯＢ２の場合、Ｋ２（到着時間、ジョブ期間、ジョブ期限、ワークグループの数）は、Ｋ２（０、４、７、１）である。ＪＯＢ３の場合、Ｋ３（到着時間、ジョブ期間、ジョブ期限、ワークグループの数）は、Ｋ３（０、８、８、１）である。したがって、Ｋ１の場合、到着時間、ジョブ期間、ジョブ期限、ワークグループの数は、それぞれ０、３、３、１である。Ｋ２の場合、到着時間、ジョブ期間、ジョブ期限、ワークグループの数は、それぞれ０、４、７、１である。Ｋ３の場合、到着時間、ジョブ期間、ジョブ期限、ワークグループの数は、それぞれ０、８、８、１である。

様々な実施形態では、各ジョブの到着時間、ジョブ期間、ジョブ期限、ワークグループの数を使用して、各ジョブの余裕値がスケジューリングのために計算される。ＪＯＢ１の場合、余裕値は３－３、つまり０と計算される。ＪＯＢ２の場合、余裕値は７－４、つまり３と計算される。ＪＯＢ３の場合、余裕値は８－８、つまり０と計算される。次に、各ジョブの余裕値の比較に基づいて、丸で囲んだ数字１、２、３からわかるように、ジョブがスケジューリングされる。ＪＯＢ３及びＪＯＢ１の余裕値は、３つのジョブの中で最も低く、それぞれの余裕値は０である。ＪＯＢ１及びＪＯＢ３の余裕値は等しいことから、ＪＯＢ１のジョブ期間とＪＯＢ３のジョブ期間とを比較して、ジョブの中で何れのジョブのジョブ期間が最も短いかが特定される。ジョブ期間が最大（最長）のジョブが１番目にスケジューリングされ、ジョブ期間が２番目に長いジョブが２番目にスケジューリングされ、以下同様である。提供された例では、ＪＯＢ３のジョブ期間はＪＯＢ１のジョブ期間よりも長いので、ＪＯＢ３が１番目に計算ユニット２１６にスケジューリングされる。ＪＯＢ１は、２番目に計算ユニット２１４にスケジューリングされる。ＪＯＢ２は、３番目に計算ユニット２１４にスケジューリングされる。このように、余裕認識タスクスケジューラ３００は、各ジョブの余裕に基づいて、ＪＯＢ１、ＪＯＢ２、ＪＯＢ３と、これらの対応するタスクと、のスケジューリングを行っている。

様々な実施形態では、例えば、ＪＯＢ３がＪＯＢ２よりも先に計算ユニット２１６でスケジューリングされた場合、ＪＯＢ１及びＪＯＢ２は、ＪＯＢ２の余裕を利用して、計算ユニット２１４を順次利用することができ、ＪＯＢ３は、計算ユニット２１６使用してそのジョブ期限を守る。タスクスケジューラ３００は、ＪＯＢ１及びＪＯＢ２が８タイムステップ内でＣＵ２１４によって実行され、ＪＯＢ３がＣＵ２１６によって実行されるように、スケジュールの対象となるジョブを動的に調整している。したがって、余裕認識タスクスケジューラ３００を使用することによって、ＧＰＵ２００は、８タイムステップ期限内にジョブＪＯＢ１、ＪＯＢ２、ＪＯＢ３を実行することが可能になる。余裕認識タスクスケジューリングを使用してジョブをスケジューリングすることによって、計算ユニット２１４及び計算ユニット２１６を最大限に使用することが可能になり、同時に、余裕値が最も低いジョブの優先度を動的に高めることが可能になる。

図６は、いくつかの実施形態による、余裕認識タスクスケジューリングを実行するための方法６００を示すフロー図である。方法６００は、図１に示す処理システム１００、図２に示すＧＰＵ２００、及び、図３に示す余裕認識タスクスケジューラ３００のいくつかの実施形態で実施される。

様々な実施形態では、方法フローは、ブロック６２０から始まる。ブロック６２０において、余裕認識タスクスケジューラ２３４は、ジョブ及び余裕情報を例えばＣＰＵ１４５から受信する。ブロック６３０において、余裕認識タスクスケジューラ２３４は、各タスクの到着時間、タスク期間、タスク期限、ワークグループの数を決定する。

ブロック６３４において、余裕認識タスクスケジューラ２３４は、受信した各タスクのタスク期限を決定する。ブロック６４０において、余裕認識タスクスケジューラ２３４は、受信した各タスクの余裕値を決定する。

ブロック６４４において、ワークグループディスパッチャ２３８は、タスクの余裕値が、ＧＰＵ２００が受信したジョブ内の他のタスクの余裕値よりも大きいか否かを判別する。ブロック６５０において、タスクの余裕値が、ジョブ内の他のタスクの余裕値よりも大きくない場合、ワークグループディスパッチャ２３８は、標準のＥＤＦ技術に従って、タスクを、ＧＰＵ２００の利用可能な計算ユニット２１４～２１８にスケジューリングして、割り当てる。

ブロック６６０において、タスクの余裕値が、ジョブ内の他のタスクの余裕値よりも大きい場合、ワークグループディスパッチャ２３８は、低い余裕値を有するタスクの余裕値が等しいか否かを判別する。ブロック６７０において、低い余裕値を有するタスクの余裕値が等しい場合、ワークグループディスパッチャ２３８は、最高の優先度を、最大のタスク期間を有するタスクに割り当てる。

ブロック６８０において、低い余裕値を有するタスクの余裕値が等しくない場合、ワークグループディスパッチャ２３８は、最高の優先度を、最も低い余裕値を有するタスクに割り当てる。

ブロック６８４において、ワークグループディスパッチャ２３８は、各タスクの優先度に基づいて、タスクを、ＧＰＵ２００の利用可能な計算ユニット２１４～２１８にスケジューリングして割り当て、最高優先度のタスクが１番目にスケジューリングされる。ブロック６８８において、ＧＰＵ２００は、余裕認識スケジューリング優先度に基づいてタスクを実行する。

いくつかの実施形態では、上記の装置及び技術は、図１～図６を参照して上述した処理システム等の１つ以上の集積回路（ＩＣ）デバイス（集積回路パッケージ又はマイクロチップとも呼ばれる）を含むシステムに実装される。これらのＩＣデバイスの設計及び製造には、電子設計自動化（ＥＤＡ）及びコンピュータ支援設計（ＣＡＤ）ソフトウェアツールが使用される。これらの設計ツールは、通常、１つ以上のソフトウェアプログラムとして表される。１つ以上のソフトウェアプログラムは、回路を製造するための製造システムを設計又は適合するための処理の少なくとも一部を実行するように１つ以上のＩＣデバイスの回路を表すコードで動作するようにコンピュータシステムを操作する、コンピュータシステムによって実行可能なコードを含む。このコードは、命令、データ、又は、命令及びデータの組み合わせを含むことができる。設計ツール又は製造ツールを表すソフトウェア命令は、通常、コンピューティングシステムがアクセス可能なコンピュータ可読記憶媒体に記憶される。同様に、ＩＣデバイスの設計又は製造の１つ以上のフェーズを表すコードは、同じコンピュータ可読記憶媒体又は異なるコンピュータ可読記憶媒体に記憶されてもよいし、同じコンピュータ可読記憶媒体又は異なるコンピュータ可読記憶媒体からアクセスされてもよい。

コンピュータ可読記憶媒体は、命令及び／又はデータをコンピュータシステムに提供するために、使用中にコンピュータシステムによってアクセス可能な任意の非一時的な記憶媒体又は非一時的な記憶媒体の組み合わせを含む。このような記憶媒体には、限定されないが、光学媒体（例えば、コンパクトディスク（ＣＤ）、デジタル多用途ディスク（ＤＶＤ）、ブルーレイ（登録商標）ディスク）、磁気媒体（例えば、フロッピー（登録商標）ディスク、磁気テープ、磁気ハードドライブ）、揮発性メモリ（例えば、ランダムアクセスメモリ（ＲＡＭ）若しくはキャッシュ）、不揮発性メモリ（例えば、読取専用メモリ（ＲＯＭ）若しくはフラッシュメモリ）、又は、微小電気機械システム（ＭＥＭＳ）ベースの記憶媒体が含まれ得る。コンピュータ可読記憶媒体（例えば、システムＲＡＭ又はＲＯＭ）はコンピューティングシステムに内蔵されてもよいし、コンピュータ可読記憶媒体（例えば、磁気ハードドライブ）はコンピューティングシステムに固定的に取り付けられてもよいし、コンピュータ可読記憶媒体（例えば、光学ディスク又はユニバーサルシリアルバス（ＵＳＢ）ベースのフラッシュメモリ）はコンピューティングシステムに着脱可能に取り付けられてもよいし、コンピュータ可読記憶媒体（例えば、ネットワークアクセス可能ストレージ（ＮＡＳ））は有線又は無線ネットワークを介してコンピュータシステムに結合されてもよい。

いくつかの実施形態では、上記の技術のいくつかの態様は、ソフトウェアを実行するプロセッシングシステムの１つ以上のプロセッサによって実装されてもよい。ソフトウェアは、非一時的なコンピュータ可読記憶媒体に記憶され、又は、非一時的なコンピュータ可読記憶媒体上で有形に具現化された実行可能命令の１つ以上のセットを含む。ソフトウェアは、１つ以上のプロセッサによって実行されると、上記の技術の１つ以上の態様を実行するように１つ以上のプロセッサを操作する命令及び特定のデータを含むことができる。非一時的なコンピュータ可読記憶媒体は、例えば、磁気若しくは光ディスク記憶デバイス、例えばフラッシュメモリ、キャッシュ、ランダムアクセスメモリ（ＲＡＭ）等のソリッドステート記憶デバイス、又は、他の１つ以上の不揮発性メモリデバイス等を含むことができる。非一時的なコンピュータ可読記憶媒体に記憶された実行可能命令は、ソースコード、アセンブリ言語コード、オブジェクトコード、又は、１つ以上のプロセッサによって解釈若しくは実行可能な他の命令フォーマットであってもよい。

上述したものに加えて、概要説明において説明した全てのアクティビティ又は要素が必要とされているわけではなく、特定のアクティビティ又はデバイスの一部が必要とされない場合があり、１つ以上のさらなるアクティビティが実行される場合があり、１つ以上のさらなる要素が含まれる場合があることに留意されたい。さらに、アクティビティが列挙された順序は、必ずしもそれらが実行される順序ではない。また、概念は、特定の実施形態を参照して説明された。しかしながら、当業者であれば、特許請求の範囲に記載されているような本発明の範囲から逸脱することなく、様々な変更及び変形を行うことができるのを理解するであろう。したがって、明細書及び図面は、限定的な意味ではなく例示的な意味で考慮されるべきであり、これらの変更形態の全ては、本発明の範囲内に含まれることが意図される。

利益、他の利点及び問題に対する解決手段を、特定の実施形態に関して上述した。しかし、利益、利点、問題に対する解決手段、及び、何かしらの利益、利点若しくは解決手段が発生又は顕在化する可能性のある特徴は、何れか若しくは全ての請求項に重要な、必須の、又は、不可欠な特徴と解釈されない。さらに、開示された発明は、本明細書の教示の利益を有する当業者には明らかな方法であって、異なっているが同様の方法で修正され実施され得ることから、上述した特定の実施形態は例示にすぎない。添付の特許請求の範囲に記載されている以外に本明細書に示されている構成又は設計の詳細については限定がない。したがって、上述した特定の実施形態は、変更又は修正されてもよく、かかる変更形態の全ては、開示された発明の範囲内にあると考えられることが明らかである。したがって、ここで要求される保護は、添付の特許請求の範囲に記載されている。

Claims

複数のタスクの各タスクに関連する余裕（laxity）情報を受信することと、
前記余裕情報に基づいて、前記複数のタスクの各タスクの余裕値を決定することと、
前記余裕値の余裕評価を実行することと、
前記余裕評価に基づいて、前記複数のタスクをスケジューリングすることと、を含む、
方法。
前記余裕評価は、前記複数のタスクの各タスクの優先度を決定することを含む、
請求項１の方法。
前記余裕情報は、各タスクの完了までの時間を決定するために使用され、到着時間と、タスク期間と、タスク期限と、ワークグループの数と、を含む、
請求項２の方法。
前記複数のタスクの各タスクの優先度は、前記複数のタスクの各タスクの余裕値を比較することによって決定される、
請求項３の方法。
前記タスク期限から前記タスク期間を減算することによって前記余裕値を決定することをさらに含む、
請求項４の方法。
前記スケジューリングすることは、
前記複数のタスクのうち第１のタスクに関連する第１の余裕値が、前記複数のタスクのうち第２のタスクに関連する第２の余裕値よりも小さい場合に、前記第２のタスクよりも高いスケジューリング優先度を前記第１のタスクに与えることを含む、
請求項４の方法。
前記複数のタスクをスケジューリングすることは、前記複数のタスクのうち優先度レベルが低い第２のタスクを第１の計算ユニットに提供する前に、前記複数のタスクのうち優先度レベルが高い第１のタスクを前記第１の計算ユニットに提供することを含む、
請求項４の方法。
優先度が高い第１のタスクの余裕値が、前記第１のタスクよりも優先度が低い第２のタスクの余裕値以下である場合に、前記第１のタスクは、前記第２のタスクよりも前に第１の計算ユニットにスケジューリングされる、
請求項４の方法。
各タスクの優先度に基づいて、前記複数のタスクを少なくとも第１の計算ユニット及び第２の計算ユニットに割り当てることをさらに含む、
請求項４～８の何れかの方法。
タスクキューと、
前記タスクキューに接続された余裕認識（laxity-aware）タスクスケジューラと、
前記余裕認識タスクスケジューラに接続されたワークグループディスパッチャであって、前記タスクキューに記憶された複数のタスクに関連する余裕値の余裕評価に基づいて、前記複数のタスクをスケジューリングする、ワークグループディスパッチャと、を備える、
処理システム。
前記余裕評価は、前記複数のタスクの各タスクの優先度を決定することを含む、
請求項１０の処理システム。
前記複数のタスクの各タスクの優先度は、前記複数のタスクの各タスクの余裕値の比較に基づいている、
請求項１１の処理システム。
前記余裕値は、到着時間と、タスク期間と、タスク期限と、ワークグループの数と、を含む余裕情報を使用して決定される、
請求項１０の処理システム。
前記余裕値は、前記タスク期限から前記タスク期間を減算することによって決定される、
請求項１３の処理システム。
前記複数のタスクのうち第１のタスクに関連する余裕値のうち第１の余裕値が、前記複数のタスクのうち第２のタスクに関連する余裕値のうち第２の余裕値よりも小さい場合に、前記第２のタスクよりも高いスケジューリング優先度が前記第１のタスクに与えられる、
請求項１０の処理システム。
前記ワークグループディスパッチャは、前記複数のタスクのうち優先度レベルが低い第２のタスクを第１の計算ユニットに提供する前に、前記複数のタスクのうち優先度レベルが高い第１のタスクを前記第１の計算ユニットに提供することによって、前記複数のタスクをスケジューリングする、
請求項１５の処理システム。
優先度が高い第１のタスクの余裕値が、優先度が低い第２のタスクの余裕値以下である場合に、前記第１のタスクは、前記第２のタスクよりも前に第１の計算ユニットにスケジューリングされる、
請求項１６の処理システム。
第１のジョブ及び第２のジョブを含む複数のジョブを、余裕認識（laxity-aware）タスクスケジューラに提供することと、
前記第１のジョブの第１の余裕値と、前記第２のジョブの第２の余裕値と、を決定することと、
前記第１の余裕値及び前記第２の余裕値の余裕評価に基づいて、第１の優先度を前記第１のジョブに割り当て、第２の優先度を前記第２のジョブに割り当てることと、を含む、
方法。
前記余裕評価に基づいて、前記第１のジョブ及び前記第２のジョブをスケジューリングすることをさらに含む、
請求項１８の方法。
前記余裕評価に基づいて、前記第１のジョブの前記第１の優先度及び前記第２のジョブの前記第２の優先度を調整することをさらに含む、
請求項１８の方法。