JP7513189B2

JP7513189B2 - スケジューリング装置、スケジューリング方法、および、スケジューリングプログラム

Info

Publication number: JP7513189B2
Application number: JP2023503319A
Authority: JP
Inventors: 哲朗中村; 圭藤本; 奨悟斎藤
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2021-03-05
Filing date: 2021-03-05
Publication date: 2024-07-09
Anticipated expiration: 2041-03-05
Also published as: JPWO2022185527A1; WO2022185527A1; US20240231904A1

Description

本発明は、スケジューリング装置、スケジューリング方法、および、スケジューリングプログラムに関する。

ハードウェアの計算機資源であるリソースを、ソフトウェアのＶＭ（Virtual Machine）やコンテナにどの程度割り当てるかというリソース割り当てにより、得られる性能が異なってくる。そこで、リソースのサーバ負荷に応じて、自動的にＶＭ／コンテナの数を増減させる「オートスケール」という機能が提案されている。

特許文献１には、少ないリソース割当量でのオートスケールの実行により、ＶＭ／コンテナにおいて無駄なリソースが少なくなるようにリソース割当を行うネットワーク性能保証システムが記載されている。
特許文献２には、性能に対してリソースの割当量の依存度が有るか否かを求め、依存有りに該当する割当量のリソースのみをオートスケール実行により増減可能とするオートスケール型の性能保証システムが記載されている。

特開２０２０－１２３８４８号公報特開２０２０－１２３８４９号公報

CPU（Central Processing Unit）が行う処理の一部を代行し、処理の高速化を行うハードウェアアクセラレータが普及している。アクセラレータは、例えば、FPGA（Field-Programmable Gate Array、書き換え可能な論理回路）として実装される。FPGAデバイスは、例えば、CNN（Convolutional Neural Network）アルゴリズムが実装されたモデルを、CPUよりも高速に動作させる。

なお、CNNとは、主に画像認識・分類に使用される人工知能（ニューラルネットワーク）の一つであり、画像の局所的な特徴を抽出する畳み込み層を持つ。CNNアルゴリズムは、例えば、画像分類に適したモデルや、顔認識に適したモデルなどのユースケースによって、各層の深さや大きさが異なる様々なものが提案されている。
FPGAリソースを潤沢に使用できる場合には、モデルごとに専用のFPGAデバイスをそれぞれ用意すればよい。そして、同じモデルを利用するユーザ間で、特許文献１，２のようなオートスケールを適用すればよい。

一方、初期投資（CAPEX：Capital Expenditure）の削減などのため、FPGAリソースが少ない場合には、同じFPGAリソースを共用する複数種類のモデルを、時間的に切り替える必要がある。なお、FPGAリソースが少ない原因として、大学の研究室等で各メンバがオンプレミスのFPGAを共同で利用する場合も考えられる。

ここで、Linux（登録商標）で使用され、研究が多くなされているCPUのスケジューラでは、FPGAリソース上のモデルを切り替える用途には不向きである。まず、CPUのスケジューラに実装されるタスクの選定機能は、コンテキストスイッチを前提に、タイムスライスによるCPUのスケジューリングを実行する。しかし、FPGAではコンテキストの保存が行われないため、タイムスライスを利用したLinux従来のスケジューリングが適用できない。

このように、従来技術では、FPGA上のモデルの切替制御をプラットフォームで支援する機能は提供されていない。つまり、マルチユーザがそれぞれ実行させるモデルを、共用されるFPGA上で円滑に切り替える手段は提供されてこなかった。

そこで、本発明は、同じアクセラレータ上で複数種類のモデルを切替えながら複数のユーザのタスクを実行することを主な課題とする。

前記課題を解決するために、本発明のスケジューリング装置は、以下の特徴を有する。
本発明は、各タスクの使用するモデルを取得するコントローラ部と、
前記コントローラ部が取得したモデルが処理可能となるように、アクセラレータの設定を切り替える制御を行う制御部と、
各タスクの使用するモデルごとにタスクを保管するキューを参照し、前記制御部が切り替えたことで処理可能となったモデルを使用するタスクを読み込んで前記アクセラレータに実行させるスケジューラ部とを有しており、
各タスクには、タスクの到着時刻からタスクの終了時刻までに要する制限時間であるTAT（Turn Around Time）要件が指定されており、
前記制御部は、前記アクセラレータで動作中の現モデルから別モデルへの前記アクセラレータの切り替え時間と、前記別モデルのタスクの実行時間をもとに、前記現モデルを前記別モデルに切り替えることを仮定したときの前記別モデルの終了時刻が、前記別モデルのTAT要件から算出される締め切り時刻を超過する場合に、前記現モデルから前記別モデルへの切り替えを前記アクセラレータに設定することを特徴とする。

本発明によれば、同じアクセラレータ上で複数種類のモデルを切替えながら複数のユーザのタスクを実行することができる。

本実施形態に係わるスケジューリング装置の構成図である。本実施形態に係わるスケジューリング装置の詳細を示す構成図である。本実施形態に係わるスケジューリング装置のハードウェア構成図である。本実施形態に係わるタスク要件の組み合わせによる分類を示すテーブルである。本実施形態に係わる締め切り型のスケジューリング処理を示すフローチャートである。本実施形態に係わるベストエフォート型のスケジューリング処理を示すフローチャートである。本実施形態に係わる混在型のスケジューリング処理を示すフローチャートである。

以下、本発明の一実施形態について、図面を参照して詳細に説明する。

図１は、スケジューリング装置１００の構成図である。
スケジューリング装置１００は、プロセス１０の実行環境であるCPU（図示省略）と、モデルの実行環境であるFPGA７０とを有する。なお、プロセス１０の実行環境と、モデルの実行環境とはそれぞれスケジューリング装置１００とは別の装置として構成してもよい。
プロセス１０は、ユーザ自身がプログラムをデプロイした結果の処理単位である。図１の例では、２人のユーザそれぞれのプロセス１０（第１ユーザのプロセス１０Ｘ、第２ユーザのプロセス１０Ｙ）がデプロイされている。

１つのプロセス１０は１つ以上の「タスク」を実行する。タスクはジョブとも呼ばれ、画像分類や顔認識などの個別の処理を行う処理単位である。１つのタスクは、ある１つの「モデル」を使用して推論処理を実行する。よって、各タスクが各モデルを使用する処理要求はキュー４３に格納される。
なお、１つのプロセス１０は複数のタスクを並行して実行してもよい。同じプロセス１０でも、顔認識のユースケース等でそれぞれ異なるCNNアルゴリズムのモデルを使用する複数のタスクを組み合わせて、パイプライン的に処理することもある。

FPGA７０内のIPコア７１は、複数種類のモデルを切替えながら実行するハードウェアアクセラレータである。IPコア７１は、例えば、CNNの畳み込み計算を実装した推論回路である。IPコア７１に一度回路を構成すると、回路を再構成することなく様々なCNNモデルを切り替えて利用できるものもある。しかし、IPコア７１で実行される複数種類のモデルを切り替えるには、切替時間が発生する。
ここで、画像分類、顔認証、人物（ポーズ）検出、物体検出、標識・レーン検出などユースケースごとに適切なモデルが存在する。例えば、画像分類のタスクは、入力された画像が猫の画像なのか犬の画像なのかを、Resnet50というモデルを使用して推論する。さらに同じCNNアルゴリズムでも学習の仕方が異なれば、別々のCNNモデルとして利用される場合もある。

なお、IPコア７１でのモデルの切替処理の前提は、以下の通りである。
（前提１）FPGA７０はCPUからの通知を契機にモデルを使用するタスクを開始し、そのタスクの終了時にCPUに処理を返却するルックアサイド型の処理を行う。
（前提２）各タスクをFPGA７０で実行する前に、そのタスクが使用するモデルがIPコア７１に設定されていない場合、一定時間の再設定時間を要する（CNNモデルの切替えに相当）。
（前提３）IPコア７１がモデルＡに切替が行われた後は、別のモデルＢを使用する別タスクを実行するまでは、IPコア７１の切替の必要なくモデルＡを使用する複数のタスクを継続的に処理できる。
（前提４）IPコア７１の切替時間やモデルを利用した実処理の実行時間が一定であり、プラットフォーム側（後記するFPGA制御部５０）で取得可能であるとする。ただし、各プロセス１０からの各モデル実行要求は非周期的（aperiodic）で予測不能（unpredictable）とする。

スケジューリング装置１００は、IPコア７１上のモデルを切り替える制御部として、コントローラ部３０と、共通部４０と、キュー４３と、FPGA制御部５０と、スケジューラ部６０とを有する。コントローラ部３０と、FPGA制御部５０と、スケジューラ部６０との詳細は、図２で後記する。

各プロセス１０は、モデルＡを使用するタスクの実行要求であるモデルＡ要求２１と、モデルＢを使用するタスクの実行要求であるモデルＢ要求２２とを、それぞれモデル要求２０としてコントローラ部３０に通知する。
共通部４０は、コントローラ連携部４１と、キュー振分け部４２と有する。コントローラ連携部４１は、コントローラ部３０から使用可能なキュー４３に関する情報を受け取り、キュー４３をモデルごとに作成する。そして、キュー振分け部４２は、モデル要求２０で指定した各タスクを各プロセス１０から受け、各タスクを使用するモデル別にキュー４３に格納する。

なお、モデル要求２０には、どのモデルを実行すればよいかというモデル種別（モデルＡ，Ｂ，…）の指定に加え、そのモデルの実行性能に関する要件（タスク要件）がプロセス１０から指定されることもある。タスク要件は、例えば、以下の２つが代表的である。
・TAT（Turn Around Time）要件は、タスクの到着時刻からタスクの終了時刻までに要する時間（TAT）の許容される最大値（制限時間）であり、500[ms]などが指定される。
・TP（Throughput）要件は、単位時間（例えば１秒）あたりに処理される量の許容される最小値であり、200[batch/second]などが指定される。

以下、タスク要件に関する各種パラメータを定義する。「t」は時刻（ある瞬間）を示し、「T」は時間（開始時刻から終了時刻までの期間長）を示す。
t_nowは、現在時刻である。
t_arrivalは、タスクの到着時刻である。
T_tat[A]は、タスクが使用するモデルＡのTAT要件である。
t_limitは、タスクの締め切り時刻である。
よって、t_limit=t_arrival+T_tat[A]となる。

T_waitは、タスクがIPコア７１上で開始されるまでの待ち時間である。
t_startは、タスクの開始時刻である。
よって、t_start=t_arrival+T_waitとなる。

t_endは、タスクの終了時刻である。
T_reconf[A→B]は、モデルＡからモデルＢへのFPGAの切替時間である。
T_exec[B]は、モデルＢのタスクの実行時間である。
よって切替が必要な場合、t_end=t_start+T_reconf[A→B]+T_exec[B]となる。

R[A]は、モデルＡのTP要件である。
P_totalは、スケジューリング装置１００のCPUが扱うプロセス１０の数の総和である。

図２は、スケジューリング装置１００の詳細を示す構成図である。
コントローラ部３０は、コマンド受付部３１と、キュー管理部３２と、使用IPコア制御部３３と、FPGAモデル設定部３４とを有する。
コマンド受付部３１は、プロセス１０からのリソース制御命令（使用IPコア数）を受け付ける。
キュー管理部３２は、新たなモデルを使用するタスクが立ち上がるごとに、そのモデル用のキュー４３（複数の優先度を持つキューのセット）の作成をコントローラ連携部４１に通達する。

使用IPコア制御部３３は、FPGA７０のIPコア７１の占有／空き状態を管理し、コマンド受付部３１から指定された数のIPコアを確保する。また、使用IPコア制御部３３は、必要に応じてモデルごとに排他的となるように固定的に割り当てたマップを作成し管理する。また、使用IPコア制御部３３は、割り当て情報に関しては更新の都度、スケジューラ部６０に通達し、空きのIPコア７１が足りない場合は、NGを返す。
このように、使用IPコア制御部３３がIPコアの空き状態を見て内部でIPコアマスクを指定し、スケジューラ部６０に設定するため、クラウド内部の情報がプロセス１０に露呈しない。また、コントローラ部３０に外部IFを持たせることで、リソースの動的制御を実現する。
FPGAモデル設定部３４は、各プロセス１０から各タスクの使用するモデルを取得する。

FPGA制御部５０は、収容可否計算部５１と、FPGAモデル管理部５２と、FPGAモデル構成部５３と、タスク到着時刻管理部５４と、タスク切替部５５と、タスク実行時間管理部５６とを有する。
収容可否計算部５１は、各プロセス１０のタスク要件をもとに、各プロセス１０のデプロイの可否を判断する。
FPGAモデル管理部５２は、FPGAモデル設定部３４が取得したモデルを、プロセス１０に対応付けてコンテキストのデータとして保持する。
FPGAモデル構成部５３は、FPGAモデル管理部５２の保持するデータを参照して、実際にIPコア７１のモデルの切替えを行う。

なお、タスクの使用モデルを考慮せずにスケジューリングすると、スループットが著しく低下する。よって、以下に列挙する理由などにより、プロセス１０の要求するTAT要件を満たすように、モデルの切替えタイミングを決定することが望ましい。
・FIFO（First In First Out）やRR（Round Robin）などの単純なスケジューリングでタスクを実行していくと、スイッチングコストが大きく、スループットが低下する。
・スイッチングした後に、ある程度タスクをまとめて処理する必要があるが、一定時間で切替える方式ではアイドル状態が生まれリソース効率が低い。
・処理限度を決めてキューにタスクがない場合は即座に切替えることでリソース効率は上がるが、タスク到着頻度の小さいタスクが必要以上に待たされることになり、TAT要件に影響する。

そこで、タスク到着時刻管理部５４、タスク切替部５５、および、タスク実行時間管理部５６を用いることで、FPGA制御部５０は、TAT要件を満たすようにモデルの切替えタイミングを決定する。
まず、タスク到着時刻管理部５４は、キュー４３を監視することで、各タスクの到着時刻を取得し、スケジューリング装置１００の内部に保持する。一方、タスク実行時間管理部５６は、FPGA７０を監視することで、各タスクの実行時間および切替時間を取得する。

タスク切替部５５は、コントローラ部３０が取得したモデルが処理可能となるように、FPGA７０の設定を切り替える制御を行う。つまり、タスク切替部５５は、タスク到着時刻管理部５４およびタスク切替部５５の取得したタスクに関する各種の時間情報、時刻情報をもとに、TAT要件を守るようにモデル切替えのタイミングを決定する。この決定アルゴリズムでは、公平性やタスクの待ち時間が考慮される（詳細は図６）。
また、TP要件を守るために、収容可否計算部５１は、各プロセス１０の要求するTP要件をFPGAモデル設定部３４から取得し、デプロイの可否を判断してもよい。

スケジューラ部６０は、キュー間スケジューリング部６１と、キュー内スケジューリング部６２と、コントローラ連携部６３と、IPコアマスク設定部６４とを有する。
キュー間スケジューリング部６１は、ラウンドロビン等の公平なアルゴリズムによって、各優先度のキューを内包する独立したモデルごとのキュー４３から、タスクの取り出し元となるキュー４３を選択する。

キュー内スケジューリング部６２は、キュー間スケジューリング部６１が選択したキュー４３内で、優先度の高いキューからタスクを取り出す等、優先度を考慮したアルゴリズムによって、実行するタスクを選択する。
コントローラ連携部６３は、コントローラ部３０からFPGA７０の設定情報（IPコアマスク）を受け取る。
IPコアマスク設定部６４は、キュー内スケジューリング部６２がキュー４３を参照して取得したタスクをFPGA７０に実行させる。そのため、IPコアマスク設定部６４は、コントローラ連携部６３を介して受け取った各タスクにIPコアマスクを設定し、指定されていないIPコア７１を使用しないように制御する。IPコアマスク設定部６４により、各プロセス１０のアイソレーション（分離）を実現する。

図３は、スケジューリング装置１００のハードウェア構成図である。
スケジューリング装置１００は、ＣＰＵ９０１と、ＲＡＭ９０２と、ＲＯＭ９０３と、ＨＤＤ９０４と、通信Ｉ／Ｆ９０５と、入出力Ｉ／Ｆ９０６と、メディアＩ／Ｆ９０７とを有するコンピュータ９００として構成される。
通信Ｉ／Ｆ９０５は、外部の通信装置９１５と接続される。入出力Ｉ／Ｆ９０６は、入出力装置９１６と接続される。メディアＩ／Ｆ９０７は、記録媒体９１７からデータを読み書きする。さらに、ＣＰＵ９０１は、ＲＡＭ９０２に読み込んだプログラム（アプリケーションや、その略のアプリとも呼ばれる）を実行することにより、各処理部を制御する。そして、このプログラムは、通信回線を介して配布したり、ＣＤ－ＲＯＭ等の記録媒体９１７に記録して配布したりすることも可能である。

図４は、タスク要件の組み合わせによる分類を示すテーブル２００である。
テーブル２００は、分類ごとに、プロセス１０と、そのプロセス１０が生成したタスクの使用モデルと、そのタスクのモデル要求２０で指定されるタスク要件（TAT要件、TP要件）と、そのプロセス１０の稼働（デプロイ）の可否とを対応付ける。
・分類「締め切り型」は、TAT要件（タスクの到着時刻とTATとから求まる締め切り時刻）などのタスク要件が、すべてのタスクごとに厳密に指定される場合である。
・分類「ベストエフォート型」は、タスク要件が、どのタスクにも指定されない場合である。
・分類「混在型」は、一部のタスクにはタスク要件が指定され、他方のタスクにはタスク要件が指定されない場合である。

なお、デプロイ済のプロセスＸ（モデルＡ）のタスク要件と、デプロイ済のプロセスＹ（モデルＢ）のタスク要件とを守りつつ、新たにプロセスＺ（モデルＣ）のタスク要件が課せられたとする。
しかし、FPGA７０の処理能力では、モデルＣのタスク要件を追加で守るには不足する。この場合、収容可否計算部５１は、プロセスＺを「デプロイ不可」と判定することにより、処理超過を予防する。

図５は、締め切り型のスケジューリング処理を示すフローチャートである。このフローチャートの実行前に、コマンド受付部３１は、各プロセス１０からモデル要求２０（使用モデル、TAT要件、TP要件）を受け取っておく。
FPGAモデル構成部５３は、現モデルＡ用にFPGA７０を再設定（または初期設定）する（Ｓ１０１）。
キュー内スケジューリング部６２は、現モデルＡのタスクをキュー４３から取り出し（Ｓ１０２）、IPコアマスク設定部６４を介してFPGA７０に実行させる。
キュー内スケジューリング部６２は、現モデルＡとは別モデルＢのタスクがキュー４３に存在するか否かを判定する（Ｓ１０３）。Ｓ１０３でNoなら、キュー内スケジューリング部６２は、別モデルＢのタスクが存在するまでキュー４３の監視を継続する。

別モデルＢのタスクが存在する場合（Ｓ１０３,Yes）、タスク切替部５５は、FPGA７０で動作中の現モデルＡを別モデルＢに切り替えることを仮定し、その別モデルＢの終了時刻t_endが、別モデルＢの締め切り時刻t_limitを超過する場合に、切り替えが必要と判断する（Ｓ１０４,Yes）。Ｓ１０４の判定式は、例えば以下の（式１）であり、bufは適当なバッファ時間である。
t_now-t_arrival＞T_tat[B]-（T_reconf[A→B]+T_exec[B]）+buf …（式１）

例えば、t_now=12:20,t_arrival=12:18,T_tat[B]=0:30,T_reconf[A→B]=0:10,T_exec[B]=0:05,buf=0:05の場合、
（式１）の左辺＝12:20-12:18=0:02
（式１）の右辺＝0:30-(0:10+0:05)+0:05=0:20
よって、左辺＜右辺なので判定式を満たさず（Ｓ１０４,No）、現時点12:20での切り替えは不要となる。

切り替えが必要な場合（Ｓ１０４,Yes）、FPGAモデル構成部５３は、現モデルＡ用から別モデルＢ用にFPGA７０を再設定する（Ｓ１１１）。キュー内スケジューリング部６２は、別モデルＢのタスクをキュー４３から取り出し（Ｓ１１２）、IPコアマスク設定部６４を介してFPGA７０に実行させる。
その後は、Ｓ１１１で再設定した別モデルＢを「現モデルＡ」と読み替えて、タスク切替部５５は、Ｓ１０３以降の処理を繰り返す。

図６は、ベストエフォート型のスケジューリング処理を示すフローチャートである。
図６のフローチャートは、図５のＳ１０４をＳ１０５に置き換えたものである。図６のフローチャートの実行前に、コマンド受付部３１は、各プロセス１０からモデル要求２０（使用モデルの指定はあるが、タスク要件の指定はない）を受け取っておく。
タスク切替部５５は、現モデルＡのキュー４３よりも別モデルＢのキュー４３により長い待ち時間のタスクがより多く存在するか否かを判定する（Ｓ１０５）。Ｓ１０５でYesならＳ１１１に進み、NoならＳ１０３に戻る。

なお、全体のスループット向上のためには、同じモデルを使用する複数のタスクを連続して使用するべきだが、それだけだとタスクのリクエストが頻繁なモデルに処理が集中してしまう。
そのため、Ｓ１０５においてタスク切替部５５は、以下の２つの指針を併せて考慮して、FPGA７０の設定を切り替えるスケジューリング処理を行う。
（指針１）同じモデルを使用する複数のタスクを連続してFPGA７０に実行させることで、FPGA７０の切り替え回数を削減する。
（指針２）キュー４３内に保管されたタスクの待ち時間が短縮されるように、FPGA７０の設定を待ちタスクの多いモデルに切り替える。

具体的には、Ｓ１０５においてタスク切替部５５は、各タスクの数だけでなく、各タスクの待ち時間によりエイジングした値を同時に考慮する。Ｓ１０５の判定式は、例えば以下の（式２）である。
W_total[A]+S_cost[B]＜W_total[B] …（式２）
W_total[B]は、モデルBの全ての待ちタスクの合計待ち時間である。
S_cost[B]は、モデルBへの切替コストであり、頻繁にモデルが切り替わらないための調整因子である。

図７は、混在型のスケジューリング処理を示すフローチャートである。
図７のフローチャートは、図５のＳ１０４と図６のＳ１０５とを準に実行するものである。つまり、別モデルＢへの切り替え（再設定）を行う条件として、Ｓ１０４を満たす場合でもよいし、Ｓ１０５を満たす場合でもよい。
なお、Ｓ１０４で判定される（式１）の右辺にはTAT要件「T_tat[B]」が存在するが、TAT要件が指定されないタスクも混在している。その場合、仮のTAT要件として、充分大きいT_tat[B]（＝100年など）を代入することにより、（式１）の判定式を常に満たさないようにできる。

以上、図５－図７を参照して、TAT要件を満たすためのスケジューリング処理（タスクＢへの切り替え判定処理）を説明した。以下では、TP要件を満たすための収容可否計算部５１によるプロセス１０のデプロイ判定処理を説明する。

収容可否計算部５１は、実行中のプロセスＸ，Ｙを考慮し、新たにデプロイしようとするプロセスＺのTP要件が厳しく、仮にプロセスＺをデプロイしてもプロセスＸ，Ｙ，ＺのTP要件を満たせない場合は、プロセスＺをデプロイするまえにデプロイ不可（キャパシティ超過）と判定する。
そのため、収容可否計算部５１は、各プロセス１０の要求するTP要件をFPGAモデル設定部３４から取得する。

そして、収容可否計算部５１は、以下の（１）～（３）の手順により、プロセスＺのデプロイ可否をプラットフォーム側で判定する。
（１）現状すべてのデプロイ中の現プロセスＸ，ＹがそれぞれTP要件を満たすようなモデル要求２０を発行している状況下であるとする。
（２）今回追加予定の新プロセスＺをデプロイし、プロセスＺが単独で動作したときであればそのプロセスＺがTP要件を満たすようなモデル要求２０を発行したと仮定する。
（３）前記（１）および（２）の仮定において、タスク切替部５５は、図５－図７の処理により、プロセスＸ，Ｙ，Ｚがそれぞれ発行する各タスクを切り替えてスケジューリングをしたとする。このスケジューリングの切替時間を考慮しても、タスク切替部５５がプロセスＸ，Ｙ，ＺそれぞれのTP要件およびTAT要件の双方を満たすスケジューリングが立案できる場合は、収容可否計算部５１は、デプロイ可能と判断する。
以下、手順（１）～（３）を定式化する。

最高負荷のとき、TAT要件から最悪の場合、各プロセスiは高々n[i]回の実行でプロセス（が発行するタスクが使用するモデルのFPGA７０上の設定）を切り替える必要がある。このときのn[i]は、（式３）、（式４）のように、TAT要件と、自身以外のプロセスの実行時間＋切替時間とを見比べることで算出できる。

このとき、最悪の場合でもTP要件を満たせる条件は、（式５）で示される。そして、（式５）に（式４）のn[i]を代入する（式６）は、収容可否計算部５１がデプロイ可能かどうかの判別式として使用できる。
なお、TAT要件が指定されていないときには充分大きなT_tat[i]を用いればよく、TP要件が指定されていないときには充分大きなR[i]を用いればよい。

［効果］
本発明のスケジューリング装置１００は、各タスクの使用するモデルを取得するコントローラ部３０と、
コントローラ部３０が取得したモデルが処理可能となるように、FPGA７０の設定を切り替える制御を行うFPGA制御部５０と、
各タスクの使用するモデルごとにタスクを保管するキュー４３を参照し、FPGA制御部５０が切り替えたことで処理可能となったモデルを使用するタスクを読み込んでFPGA７０に実行させるスケジューラ部６０とを有することを特徴とする。

これにより、FPGA７０上のモデルの切替制御をFPGA制御部５０というプラットフォームで支援することで、同じアクセラレータ（FPGA７０）上で複数種類のモデルを切替えながら複数のユーザのタスクを実行することができる。よって、マルチユーザでのFPGA７０の共用を可能にし、FPGAの収容効率を高めることができる。

本発明は、FPGA制御部５０が、同じモデルを使用する複数のタスクを連続してFPGA７０に実行させることでFPGA７０の切り替え回数を削減するとともに、キュー４３内に保管されたタスクの到着時刻からの待ち時間が短縮されるように、FPGA７０の設定を切り替えるスケジューリング処理を行うことを特徴とする。

これにより、具体的な性能要件が指定されていないベストエフォート型の各タスクに対して、スループットの向上と、待ち時間の短縮とをバランスよく両立させた切替制御が提供できる。

本発明の各タスクには、タスクの到着時刻からタスクの終了時刻までに要する制限時間であるTAT（Turn Around Time）要件が指定されており、
FPGA制御部５０が、FPGA７０で動作中の現モデルＡから別モデルＢへのFPGA７０の切り替え時間と、別モデルＢのタスクの実行時間をもとに、現モデルＡを別モデルＢに切り替えることを仮定したときの別モデルＢの終了時刻が、別モデルＢのTAT要件から算出される締め切り時刻を超過する場合に、現モデルＡから別モデルＢへの切り替えをFPGA７０に設定することを特徴とする。

これにより、制限時間が指定された締め切り型の各タスクに対して、締め切りを超過する前に適切に切替制御を実行できる。つまり、CPUのコンテキストスイッチとは異なり、設定の切替えに無視できない時間のかかるFPGA７０においても、TAT要件を順守できる。

本発明の各プロセスは１つ以上のタスクを発行し、
各タスクには、単位時間あたりのタスクの処理量を規定するTP（Throughput）要件が指定されており、
FPGA制御部５０が、デプロイ中のプロセスＸ，Ｙに加えて、新たにプロセスＺが発生したとき、そのプロセスＺのTP要件およびTAT要件に加えて、プロセスＸ，ＹのTP要件およびTAT要件も満たすようなスケジューリング処理が立案できる場合が、プロセスＺをデプロイ可能と判断することを特徴とする。

これにより、デプロイ前のプロセスＺについて、あらかじめデプロイにより性能要件を満たせないことをスケジューリング処理の立案により推測するすることで、デプロイによるキャパシティ超過を未然に予防できる。

１０プロセス
２０モデル要求
３０コントローラ部
３１コマンド受付部
３２キュー管理部
３３使用IPコア制御部
３４ FPGAモデル設定部
４０共通部
４１コントローラ連携部
４２キュー振分け部
４３キュー
５０ FPGA制御部（制御部）
５１収容可否計算部
５２ FPGAモデル管理部
５３ FPGAモデル構成部
５４タスク到着時刻管理部
５５タスク切替部
５６タスク実行時間管理部
６０スケジューラ部
６１キュー間スケジューリング部
６２キュー内スケジューリング部
６３コントローラ連携部
６４ IPコアマスク設定部
７０ FPGA（アクセラレータ）
７１ IPコア
１００スケジューリング装置

Claims

各タスクの使用するモデルを取得するコントローラ部と、
前記コントローラ部が取得したモデルが処理可能となるように、アクセラレータの設定を切り替える制御を行う制御部と、
各タスクの使用するモデルごとにタスクを保管するキューを参照し、前記制御部が切り替えたことで処理可能となったモデルを使用するタスクを読み込んで前記アクセラレータに実行させるスケジューラ部とを有しており、
各タスクには、タスクの到着時刻からタスクの終了時刻までに要する制限時間であるTAT（Turn Around Time）要件が指定されており、
前記制御部は、前記アクセラレータで動作中の現モデルから別モデルへの前記アクセラレータの切り替え時間と、前記別モデルのタスクの実行時間をもとに、前記現モデルを前記別モデルに切り替えることを仮定したときの前記別モデルの終了時刻が、前記別モデルのTAT要件から算出される締め切り時刻を超過する場合に、前記現モデルから前記別モデルへの切り替えを前記アクセラレータに設定することを特徴とする
スケジューリング装置。
各プロセスは１つ以上のタスクを発行し、
各タスクには、単位時間あたりのタスクの処理量を規定するTP（Throughput）要件が指定されており、
前記制御部は、デプロイ中の現プロセスに加えて、新プロセスが発生したとき、その新プロセスのTP要件およびTAT要件に加えて、前記現プロセスのTP要件およびTAT要件も満たすようなスケジューリング処理が立案できる場合は、前記新プロセスをデプロイ可能と判断することを特徴とする
請求項１に記載のスケジューリング装置。
各タスクの使用するモデルを取得するコントローラ部と、
前記コントローラ部が取得したモデルが処理可能となるように、アクセラレータの設定を切り替える制御を行う制御部と、
各タスクの使用するモデルごとにタスクを保管するキューを参照し、前記制御部が切り替えたことで処理可能となったモデルを使用するタスクを読み込んで前記アクセラレータに実行させるスケジューラ部とを有しており、
前記制御部は、同じモデルを使用する複数のタスクを連続して前記アクセラレータに実行させることで前記アクセラレータの切り替え回数を削減するとともに、前記キュー内に保管された待ちタスクの到着時刻からの待ち時間について、前記アクセラレータの第１設定で処理可能な待ちタスクの合計待ち時間よりも、前記アクセラレータの第２設定で処理可能な待ちタスクの合計待ち時間のほうが長くなった場合に、前記アクセラレータの設定を前記第１設定から前記第２設定に切り替えるスケジューリング処理を行うことを特徴とする
スケジューリング装置。
スケジューリング装置は、コントローラ部と、制御部と、スケジューラ部とを有しており、
前記コントローラ部は、各タスクの使用するモデルを取得し、
前記制御部は、前記コントローラ部が取得したモデルが処理可能となるように、アクセラレータの設定を切り替える制御を行い、
前記スケジューラ部は、各タスクの使用するモデルごとにタスクを保管するキューを参照し、前記制御部が切り替えたことで処理可能となったモデルを使用するタスクを読み込んで前記アクセラレータに実行させ、
各タスクには、タスクの到着時刻からタスクの終了時刻までに要する制限時間であるTAT要件が指定されており、
前記制御部は、前記アクセラレータで動作中の現モデルから別モデルへの前記アクセラレータの切り替え時間と、前記別モデルのタスクの実行時間をもとに、前記現モデルを前記別モデルに切り替えることを仮定したときの前記別モデルの終了時刻が、前記別モデルのTAT要件から算出される締め切り時刻を超過する場合に、前記現モデルから前記別モデルへの切り替えを前記アクセラレータに設定することを特徴とする
スケジューリング方法。
スケジューリング装置は、コントローラ部と、制御部と、スケジューラ部とを有しており、
前記コントローラ部は、各タスクの使用するモデルを取得し、
前記制御部は、前記コントローラ部が取得したモデルが処理可能となるように、アクセラレータの設定を切り替える制御を行い、
前記スケジューラ部は、各タスクの使用するモデルごとにタスクを保管するキューを参照し、前記制御部が切り替えたことで処理可能となったモデルを使用するタスクを読み込んで前記アクセラレータに実行させ、
前記制御部は、同じモデルを使用する複数のタスクを連続して前記アクセラレータに実行させることで前記アクセラレータの切り替え回数を削減するとともに、前記キュー内に保管された待ちタスクの到着時刻からの待ち時間について、前記アクセラレータの第１設定で処理可能な待ちタスクの合計待ち時間よりも、前記アクセラレータの第２設定で処理可能な待ちタスクの合計待ち時間のほうが長くなった場合に、前記アクセラレータの設定を前記第１設定から前記第２設定に切り替えるスケジューリング処理を行うことを特徴とする
スケジューリング方法。
コンピュータを、請求項１ないし請求項３のいずれか１項に記載のスケジューリング装置として機能させるためのスケジューリングプログラム。