WO2024028990A1

WO2024028990A1 - アクセラレータ状態制御装置、アクセラレータ状態制御システム、アクセラレータ状態制御方法およびプログラム

Info

Publication number: WO2024028990A1
Application number: PCT/JP2022/029707
Authority: WO
Inventors: 奨悟斎藤; 廣名取; 育生大谷; 圭藤本
Original assignee: 日本電信電話株式会社
Priority date: 2022-08-02
Filing date: 2022-08-02
Publication date: 2024-02-08

Abstract

処理性能の異なる複数のアクセラレータ（１２）を有し、アプリケーション（１）の特定処理をアクセラレータ（１２）にオフロードして演算処理する際に、アクセラレータの状態を制御するアクセラレータ状態制御装置（１００）であって、異なる処理デッドラインが混在するデータが入力される場合において、アクセラレータ（１２）の性能情報を収集し、記録する演算装置性能収集・記録部（１１０）と、現在と過去のトラヒック量と処理デッドラインの割合から所定時間経過後のトラヒック量および処理デッドラインを予測するトラヒック量・処理デッドライン予測部（１５０）と、予測した所定時間経過後のトラヒック量および処理デッドラインと、記録されたアクセラレータ（１２）の性能とをもとに、処理デッドラインに対応するデータ量を求め、データ量をもとに性能を満たすアクセラレータを判断する演算装置割当判断部（１３０）と、を備える。

Description

アクセラレータ状態制御装置、アクセラレータ状態制御システム、アクセラレータ状態制御方法およびプログラム

　本発明は、アクセラレータ状態制御装置、アクセラレータ状態制御システム、アクセラレータ状態制御方法およびプログラムに関する。

　プロセッサの種別に応じて、得意（処理能力が高い）とするワークロードが異なる。汎用性の高いＣＰＵ（Central Processing Unit）に対し、ＣＰＵが苦手（処理能力が低い）とする並列度の高いワークロードを、高速かつ高効率に演算可能なＦＰＧＡ（Field Programmable Gate Array）／（以下の説明において、「／」は「または」を表記する）ＧＰＵ（Graphics Processing Unit）／ＡＳＩＣ（Application Specific Integrated Circuit）等のアクセラレータ（以下、適宜ＡＣＣという）がある。これらの異種プロセッサを組み合わせ、ＣＰＵの苦手とするワークロードをＡＣＣへオフロードして演算することで、総合的な演算時間や演算効率を向上させるオフロード技術の活用が進んでいる。

　ｖＲＡＮ（virtual Radio Access Network）等ではＣＰＵのみでは性能が足りず要件を満たせない場合に、ＦＰＧＡやＧＰＵなどの高速演算可能なアクセラレータに一部の処理をオフロードすることが行われている。
　ＡＣＣオフロードが行われる具体的ワークロードとしては、ｖＲＡＮにおける符号化／復号化処理（ＦＥＣ：Forward Error Correction処理）、音声や映像のメディア処理、暗号化／復号化処理等が代表例として挙げられる。

　計算機システムにおいて、計算機（以下、アクセラレータ搭載サーバ）上に、汎用処理に対応したハードウェア（ＣＰＵ）と特定の演算に特化したハードウェア（アクセラレータ）を搭載し、ソフトウェアの動作する汎用プロセッサからアクセラレータに対し一部の演算処理をオフロードする構成をとることがある。

　また、クラウドコンピューティングの進展に伴い、ユーザサイトに配備されたクライアントマシンから、ネットワーク（ＮＷ）を介して遠隔サイト（ユーザ近傍に位置するデータセンタなど）のサーバに対し、一部の演算量の大きな処理をオフロードすることで、クライアントマシンを単純な構成とすることが広まりつつある。

　図１４は、計算機システムを説明する図である。図１４中の矢印は、データの流れを示している。
　図１４に示すように、サーバ５０は、ハードウェア１０上にＣＰＵ１１と、処理能力の異なる複数のアクセラレータ（性能：高）１２－１，アクセラレータ（性能：低）１２－２と、入出力部１３と、を搭載し、サーバ５０上のＣＰＵ１１上で動作するソフトウェア２０のアプリケーション（以下、適宜ＡＰＬという）１を備える。

　アプリケーション１は、標準として規定された関数群（ＡＰＩ）を呼び出し、アクセラレータ１２への一部処理のオフロードを行う。

　本明細書において、処理能力の異なる複数のアクセラレータを利用可能な構成を、「性能のヘテロ構成」と呼ぶ。図１４では、処理能力の高いアクセラレータ（性能：高）１２－１と、処理能力の低いアクセラレータ（性能：低）１２－２とのヘテロ構成である。なお、アクセラレータ（性能：高）１２－１と、アクセラレータ（性能：低）１２－２とを区別しない場合は、アクセラレータ１２と総称する。
　アクセラレータ１２は、ＦＰＧＡ／ＧＰＵ等の計算アクセラレータデバイスである。アクセラレータ１２は、アクセラレータ演算回路またはプログラムを有し、アクセラレータ演算回路またはプログラムを用いて演算を行う。
　入出力部１３は、入力データを受け付け、出力する。

　サーバ５０は、外部からの入力データを受け付け、サーバ内部で演算処理を行った後に、外部に出力する。
　サーバ５０は、入力データに関して、前提がある。
（１）入力データの量は、時系列で変動する。例えば、ＲＡＮ（Radio Access Network）における、イベント発生時の突発トラヒックなどである。
（２）入力データは、それぞれ異なる処理デッドラインを持つ。例えば、処理デッドラインは、5G NRにおける、URLLC（Ultra-Reliable and Low Latency Communications：超高信頼低遅延）トラヒック（超低レイテンシ）やeMBB（enhanced Mobile Broadband：高速大容量）トラヒック（低～中程度のレイテンシ要件）において決められている。また、5G NRにおける、URLLCトラヒック（超低レイテンシ）とeMBBトラヒック（低～中程度のレイテンシ要件）の混在がある。

　図１５は、サーバ５０の入力データの量と、処理デッドラインの内訳の変動を説明する図である。図１５の実線は、総トラヒック量を示し、図１５の破線は、処理デッドラインの短いトラヒック量を示す。また、図１５中、トラヒック量が突出したところは、突発トラヒックである。突発トラヒックの一例として、ＲＡＮシステムにおける、一部エリアのトラヒックが増加するイベントなどに起因（例えば、花火大会など）する。

　サーバ５０において、時系列で量の変動する入力データに対し、各入力データの処理デッドラインを満たす要件は、下記である。
・要件１：[データそれぞれの処理デッドラインの充足]
　異なる処理デッドラインが混在する入力データにおいて、それぞれのデッドラインを満たすよう、入力から一定時間内にサーバでの処理が完了すること。
・要件２：[スケール性]
　入力トラヒックの量に応じて、処理性能がスケール（拡縮）できること。

　アクセラレータ搭載サーバにおいて、一定の量および一定の処理デッドラインの割合のトラヒックを対象に、アクセラレータを割り当てる技術には下記がある。

［処理デッドラインの割合のトラヒックを対象にしたアクセラレータの割当て］
　まず、アクセラレータ搭載サーバにおいて、処理デッドラインの割合のトラヒックを対象に、アクセラレータを固定的に割り当てる技術について述べる（非特許文献１）。

［既存技術１］
　図１６は、既存技術１（非特許文献１)の静的なアクセラレータの割り付けを説明する図である。図１４と同一構成部分には同一符号を付している。
　図１６に示すように、サーバ５０は、ハードウェア１０上にＣＰＵ１１と、処理能力の異なる複数のアクセラレータ（性能：高）１２－１，アクセラレータ（性能：低）１２－２と、を搭載し、サーバ５０上のＣＰＵ１１上で動作するソフトウェア２０のアプリケーション１を備える。
　サーバ５０は、一定の量および一定の処理デッドラインの割合のトラヒックを対象に、アクセラレータを固定的に割り当てる（図１８の二重線ａ）。図１６では、アクセラレータ（性能：高）１２－１をアプリケーション１に固定的に割当てる固定割り付けを行う。
　入力データそれぞれの処理デッドラインは、一定値を前提に設計されている。

　既存技術１では、下記要件を満たす／満たさない特徴がある。
　<要件１：データそれぞれの処理デッドラインの充足>
　入力データそれぞれの処理デッドラインは、一定値を前提に設計されているので、入力データは一定値を超えることがないので、「データそれぞれの処理デッドラインの充足」を条件付きで満たす。
　<要件２：スケール性>
　リソース量は一定であり、アクセラレータのスケールアウト／スケールインの（「スケール性」を満たさない。

　図１７は、既存技術１における、入力データ量の変動を説明する図である。図１７の実線は、総トラヒック量を示し、図１７の破線は、システムが応答性を確保できるトラヒック量を示す。
　図１７に示すように、システムが応答性を確保できるトラヒック量（図１７の破線）は一定である。
　既存技術１では、通常時のトラヒック最大量にあわせて、アクセラレータが静的に割り当てられる。このため、突発的な入力データ量の増大時、処理能力が不足する（図１７の白抜矢印ｂ）。

　次に、アクセラレータ搭載サーバにおいて、関数プロキシによりＡＣＣのスケールを実現する技術について述べる（非特許文献１）。

［既存技術２］
　図１８は、既存技術２の関数プロキシによるＡＣＣのスケールの実現を説明する図である。図１４と同一構成部分には同一符号を付している。
　図１８に示すように、サーバ５０は、ソフトウェア２０がプロキシソフトウェア２を備える。プロキシソフトウェア２は、関数プロキシ３と、その関数プロキシ３によりアクセラレータに対する入出力制御を行うアクセラレータＩ／Ｏ制御部４と、有する。
　サーバ５０は、ＡＣＣ利用関数の関数プロキシ３を用いたスケールアウトにより、アクセラレータを動的に割り当てる（図１８の二重線ｃ）。図１８では、プロキシソフトウェア２は、アプリケーション１の処理をアクセラレータ（性能：高）１２－１またはアクセラレータ（性能：低）１２－２に動的に割当てる。

　既存技術２では、下記要件を満たす／満たさない特徴がある。
　<要件１：データそれぞれの処理デッドラインの充足>
　ＡＣＣ性能を考慮しないため、トラヒックのうち、低レイテンシ処理が必要なトラヒックの割合が増加すると、応答性を満たさない。
　<要件２：スケール性>
　　トラヒック量に応じたスケールアウトが可能である。

　図１９は、既存技術２における、処理デッドラインを説明する図である。図１９の実線は、総トラヒック量を示し、図１９の破線は、処理デッドラインの短いトラヒック量を示し、図１９の二重線は、応答性を確保できるトラヒック量を示す。
　図１９の白抜矢印ｃに示すように、割り当てたＡＣＣがデッドラインを守れない瞬間がある。特に、低レイテンシ処理が必要なトラヒックの割合が増加すると、応答性を満たさない。

"16.2. SR-IOV デバイスを使用した PCI デバイスの割り当て Red Hat Enterprise Linux 7 | Red Hat Customer Portal",［online］,［令和４年７月６日検索］,インターネット〈URL:https://access.redhat.com/documentation/ja-jp/red_hat_enterprise_linux/7/html/virtualization_deployment_and_administration_guide/sect-pci_devices-pci_passthrough〉

　既存技術１，２は、下記課題がある。
　既存技術１（静的割り付け）は、アクセラレータのリソース量が一定であり、<要件２：スケール性>を満たさないという課題がある。
　既存技術２（関数プロキシによるスケールアウト）は、アクセラレータ個々の性能の違いを考慮しないため、<要件１：データそれぞれの処理デッドラインの充足>を満たさないという課題がある。

　このような背景を鑑みて本発明がなされたのであり、本発明は、ヘテロな構成のアクセラレータ搭載サーバにおいて、各処理デッドラインに対応するデータ量の変動に応じ、応答性を担保しつつ、使用する演算リソースの低減を実現することを課題とする。

　前記した課題を解決するため、本発明は、処理性能の異なる複数のアクセラレータを有し、アプリケーションの特定処理をアクセラレータにオフロードして演算処理する際に、アクセラレータの状態を制御するアクセラレータ状態制御装置であって、異なる処理デッドラインが混在するデータが入力される場合において、前記アクセラレータの性能情報を収集し、記録する記録部と、現在と過去のトラヒック量と処理デッドラインの割合から所定時間経過後のトラヒック量および処理デッドラインを予測する予測部と、前記予測部が予測した所定時間経過後の前記トラヒック量および前記処理デッドラインと、前記記録部に記録された前記アクセラレータの性能とをもとに、前記処理デッドラインに対応するデータ量を求め、当該データ量をもとに性能を満たすアクセラレータを判断する判断部と、を備えることを特徴とするアクセラレータ状態制御装置とした。

　本発明によれば、各処理デッドラインに対応するデータ量の変動に応じ、応答性を担保しつつ、使用する演算リソースの低減を実現することができる。

本発明の実施形態に係るアクセラレータ状態制御システムの概略構成図である。本発明の実施形態に係るアクセラレータ状態制御システムの概略構成図である。本発明の実施形態に係るアクセラレータ状態制御システムのアクセラレータ状態制御装置の配置のバリエーションを示す概略構成図である。本発明の実施形態に係るアクセラレータ状態制御システムのアクセラレータ状態制御装置のＤＢテーブルの一例を示す図である。本発明の実施形態に係るアクセラレータ状態制御システムのアクセラレータ状態制御装置のレイテンシテーブルの一例を示す図である。本発明の実施形態に係るアクセラレータ状態制御システムのアクセラレータ状態制御装置のＡＣＣ関数・引数データパケット構成例を示す図である。本発明の実施形態に係るアクセラレータ状態制御システムのHost-1からの利用可能ＡＣＣリストの算出例を示す図である。本発明の実施形態に係るアクセラレータ状態制御システムのアクセラレータ状態制御装置の演算装置割当判断部およびトラヒック量・処理デッドライン予測部の動作１を示すフローチャートである。本発明の実施形態に係るアクセラレータ状態制御システムのアクセラレータ状態制御装置の演算装置割当判断部およびトラヒック量・処理デッドライン予測部の動作２を示すフローチャートである。本発明の実施形態に係るアクセラレータ状態制御システムのアクセラレータ状態制御装置の演算装置割当（ＡＣＣ割当）を示すフローチャートである。本発明の実施形態に係るアクセラレータ状態制御システムの入力データ処理を示すフローチャートである。本発明の実施形態に係るアクセラレータ状態制御システムの入力データ処理を示すフローチャートである。本発明の実施形態に係るアクセラレータ状態制御システムの入力データ処理を示すフローチャートである。本発明の実施形態に係るアクセラレータ状態制御システムの入力データ処理を示すフローチャートである。本発明の実施形態に係るアクセラレータ状態制御システムの入力データ処理を示すフローチャートである。本発明の実施形態に係るアクセラレータ状態制御システムの入力データ処理を示すフローチャートである。本発明の実施形態に係るアクセラレータ状態制御システムの機能を実現するコンピュータの一例を示すハードウェア構成図である。計算機システムを説明する図である。サーバの入力データの量と、処理デッドラインの内訳の変動を説明する図である。既存技術１（非特許文献１)の静的なアクセラレータの割り付けを説明する図である。既存技術１における、入力データ量の変動を説明する図である。既存技術２の関数プロキシによるＡＣＣのスケールの実現を説明する図である。既存技術２における、処理デッドラインを説明する図である。

　以下、図面を参照して本発明を実施するための形態（以下、「本実施形態」という）におけるアクセラレータ状態制御システム等について説明する。
（実施形態）
［概要］
　図１は、本発明の実施形態に係るアクセラレータ状態制御システムの概略構成図である。図１は、「ＮＩＣ等の入出力部を介して得たデータを、ＣＰＵからアクセラレータに対し明示的にオフロードする」Look-Aside型のアクセラレータに適用した例である。Look-Aside型は、ＣＰＵが処理の一部をアクセラレータへオフロードする。Look-Aside型のアクセラレータは、ＣＰＵが状態を管理する。

　図１に示すように、アクセラレータ状態制御システム１０００は、サーバ２００（[信号処理装置]）と、遠隔オフロード用サーバ２１０と、アンテナ装置２２０と、後段処理装置２３０と、を備える。
　また、アクセラレータ状態制御システム１０００は、アプリケーション１の特定処理をアクセラレータ１２にオフロードして演算処理する際に、アクセラレータ１２の状態を制御するアクセラレータ状態制御装置１００を備える。

［サーバ２００］
　サーバ２００は、５Ｇ信号処理におけるDistributed Unitである。
　サーバ２００は、ハードウェア（ＨＷ）１０と、ソフトウェア２０と、を備える。

《ハードウェア１０》
　ハードウェア１０は、ＣＰＵ（Central Processing Unit）１１と、処理能力の異なる複数のアクセラレータ（性能：高）１２－１，アクセラレータ（性能：低）１２－２と、アクセラレータ１２と、入出力部１３と、遠隔オフロード用入出力部（クライアント）（ＮＩＣ）１４と、を有する。

<ＣＰＵ１１>
　ＣＰＵ１１は、アプリケーション１の処理を実行するとともに、サーバ２００における、各機能部のソフトウェアを実行する。

<アクセラレータ１２>
　アクセラレータ１２は、ＦＰＧＡ／ＧＰＵ等の計算アクセラレータデバイスである。アクセラレータ１２は、サーバ２００に搭載された、特定の処理に特化した演算機である。ＣＰＵ１１とバスを介して接続する形態としては、ＡＳＩＣ搭載型アクセラレータ、ＦＰＧＡ搭載型アクセラレータ、ＧＰＵ等の形態がある。

　本実施形態は、処理能力の異なる複数のアクセラレータを利用可能な「性能のヘテロ構成」を用いる。処理能力の異なる複数のアクセラレータは、アクセラレータ（性能：高）１２－１，アクセラレータ（性能：低）１２－２である。

<入出力部１３>
　入出力部１３は、ＮＩＣ（Network Interface Card）などの入出力機構であり、外部装置（アンテナ装置２２０や後段処理装置２３０）とのデータ入出力を行う。また、入出力部１３は、アプリケーション１に対して、現在のデータ入力量を通知するインターフェイスを持つ。

<遠隔オフロード用入出力部１４>
　遠隔オフロード用入出力部（クライアント）（ＮＩＣ）１４および遠隔オフロード用入出力部（サーバ）（ＮＩＣ）１４は、ＮＩＣなどに代表されるネットワークインタフェース装置であり、サーバ間の通信を行う機能部である。

《ソフトウェア２０》
　ソフトウェア２０は、アプリケーション１と、アクセラレータの状態を制御するアクセラレータ状態制御装置１００と、を有する。

<アプリケーション１>
　アプリケーション１は、信号処理を行うプログラムであり、ＣＰＵ１１上で動作する。一部の並列演算処理など、ＣＰＵに適さない専用処理については、アクセラレータ１２（アクセラレータ（性能：高）１２－１，アクセラレータ（性能：低）１２－２，アクセラレータ（性能：高）１２－３）にオフロードを行う。例えば、アプリケーション１は、標準として規定された関数群（ＡＰＩ）を呼び出し、アクセラレータ１２への一部処理のオフロードを行う。

・入出力
　アプリケーション１は、入力として、入出力部１３から処理対象データを受け付ける。出力として、演算したデータを入出力部１３に渡す。

・変形例
　本実施形態では、入出力部１３とＣＰＵ１１とアクセラレータ１２は、ハードウェアとして分かれた構成を示したが、これらが一体化した専用ハードウェアの形態でもよい。
　また、本実施形態のように、「ＮＩＣ等の入出力部１３を介して得たデータを、ＣＰＵ１１からアクセラレータ１２に対し明示的にオフロードする」所謂Look-Aside型のアクセラレータ適用形態に加えて、「ＮＩＣ・アクセラレータ・ＣＰＵ１１」が一体化したハードウェアで、ＮＩＣでのデータ受信後に同一ハードウェア内で処理が完結する、いわゆるIn-line型のアクセラレータ適用形態でもよい。

［アクセラレータ状態制御装置１００］
　アクセラレータ状態制御装置１００は、演算装置性能収集・記録部１１０と、遠隔オフロードレイテンシ収集・記録部１２０（レイテンシ記録部）と、演算装置割当判断部１３０と、データ処理デッドライン判別部１４０と、トラヒック量・処理デッドライン予測部１５０と、関数代理実行部１６０と、演算装置振分部１７０と、遠隔オフロード部１８０と、を備える。
　上記演算装置性能収集・記録部１１０、遠隔オフロードレイテンシ収集・記録部１２０、および演算装置割当判断部１３０は、割当判断機能部１０１を構成する。上記データ処理デッドライン判別部１４０およびトラヒック量・処理デッドライン予測部１５０は、予測機能部１０２を構成する。上記関数代理実行部１６０および演算装置振分部１７０は、振分機能部１０３を構成する。

<演算装置性能収集・記録部１１０>
　演算装置性能収集・記録部１１０は、各演算装置（ＣＰＵ１１、アクセラレータ（性能：高）１２－１，アクセラレータ（性能：低）１２－２）の性能を収集し、記録する。性能情報としては、スループットや処理レイテンシ、消費電力が挙げられる。

　演算装置性能収集・記録部１１０は、オペレータによる静的な設定投入により、各ホストのアクセラレータ情報を保存する。演算装置性能収集・記録部１１０は、各演算装置を一意に識別するための識別子をもとに、それぞれの性能情報を持つ。
・構成例
　記録装置のデータベース構成例を、演算装置性能収集・記録部１１０のＤＢテーブル３００（図４）の例に示す。
・入出力
　演算装置性能収集・記録部１１０は、入力として、特定の性能やホストの識別子など、必要となるアクセラレータの条件を受け付け、出力として、入力された条件に合致するアクセラレータの一覧を応答する。

・変形例
　演算装置性能収集・記録部１１０は、外部の構成管理ツールや、機器構成情報を取得するコマンドを利用して、自動的に情報収集を行う形態でもよい。

<遠隔オフロードレイテンシ収集・記録部１２０>
　遠隔オフロードレイテンシ収集・記録部１２０は、アクセラレータを搭載した信号処理装置（ここでは、サーバ２００から別サーバである遠隔オフロード用サーバ２１０）間の、遠隔オフロードにおいて生じる通信レイテンシ（レイテンシ）を収集し、記録する。遠隔オフロードレイテンシ収集・記録部１２０は、後記図５に示すレイテンシテーブル３１０に、遠隔オフロード用サーバ２１０とオフロード元であるサーバ２００の通信レイテンシを保持する。
・構成例
　記録装置のデータベース構成例を、演算装置性能収集・記録部１１０のＤＢテーブル３００の例に示す。

・入出力
　遠隔オフロードレイテンシ収集・記録部１２０は、入力として、特定の組み合わせのホスト情報を受け付け、出力として、入力で受け付けた組合せのホスト情報から、レイテンシを計算し、応答する。

・変形例
　遠隔オフロードレイテンシ収集・記録部１２０は、自動的に情報収集を行い、レイテンシをアップデートする形態でもよい。具体的には、各ホストに搭載したレイテンシ測定機能（図示省略）が、一定周期で他ホストへの通信遅延を測定し、遠隔オフロードレイテンシ収集・記録部１２０の情報をアップデートする形態でもよい。

<演算装置割当判断部１３０>
　演算装置割当判断部１３０は、トラヒック量・処理デッドライン予測部１５０が予測した所定時間経過後のトラヒック量と処理デッドラインと、演算装置性能収集・記録部１１０に記録されたアクセラレータ１２の性能情報をもとに、処理デッドラインに対応するデータ量を求め、データ量をもとに性能を満たすアクセラレータを判断する。
　演算装置割当判断部１３０は、一定時間経過後のトラヒック量と処理デッドラインをもとに、性能を充足する演算装置を判断し、演算装置振分部１７０に割り当てる。
　演算装置割当判断部１３０は、トラヒック量・処理デッドライン予測部１５０から、一定時間経過後のトラヒック量と、その処理デッドラインを受け取る。演算装置割当判断部１３０は、この性能要求をもとに、演算装置性能収集・記録部１１０と遠隔オフロードレイテンシ収集・記録部１２０とに問い合わせを行い、アクセラレータの一覧を得る。演算装置割当判断部１３０は、これらの情報をもとに、ローカルのアクセラレータと、遠隔オフロード先のアクセラレータのリストを得る。

・構成例
　遠隔オフロード先のアクセラレータ１２については、アクセラレータ処理時間に、オフロードのレイテンシを加算する。上記一覧から、性能を満たしつつ最も消費電力の小さなアクセラレータの組み合わせを選び、演算装置振分部１７０に通知する。

・入出力
　演算装置割当判断部１３０は、入力として、一定時間経過後の、トラヒック量と、その処理デッドラインの割合を受け付け、出力として、入力された条件に合致するアクセラレータの一覧を応答する。

・変形例
　演算装置割当判断部１３０は、外部の構成管理ツールや、機器構成情報を取得するコマンドを利用して、自動的に情報収集を行う形態でもよい。

<データ処理デッドライン判別部１４０>
　データ処理デッドライン判別部１４０は、入力データそれぞれの処理デッドラインを識別したうえで、各機能部に通知する。
　データ処理デッドライン判別部１４０は、入出力部１３から、入力データを受け取り、その先頭のヘッダ情報を参照し、処理デッドラインを識別する。ＲＡＮにおける例では、該当のeCPRI（enhanced Common Public Radio Interface）プロトコルヘッダを参照し、セッション情報を識別することで、該当のデータの処理デッドラインを識別する。

・入出力
　データ処理デッドライン判別部１４０は、入力として、入出力部１３から、入力データを受け取り、出力として、トラヒック量・処理デッドライン予測部１５０に対し、トラヒックの量と、処理デッドラインの割合を通知する。

<トラヒック量・処理デッドライン予測部１５０>
　トラヒック量・処理デッドライン予測部１５０は、一定時間経過後のトラヒック量と処理デッドラインを、現在と過去のトラヒック量と処理デッドラインの割合から予測する。
　トラヒック量・処理デッドライン予測部１５０は、データ処理デッドライン判別部１４０から、トラヒック量と処理デッドラインの割合を受け取り、入力トラヒック量に対し、各処理デッドラインの割合を乗算することで、各トラヒック種別の量を算出する。
　トラヒック量・処理デッドライン予測部１５０は、各デッドラインのトラヒック量が、それぞれ増加傾向か減少傾向かを予測する。

・入出力
　トラヒック量・処理デッドライン予測部１５０は、入力として、入力データの現在のトラヒック量と処理デッドラインの割合を受け取り、出力として、予測した一定時間経過後のトラヒック量と処理デッドラインを、演算装置割当判断部１３０に通知する。

・変形例
　トラヒック量・処理デッドライン予測部１５０は、ＲＡＮシステムにおけるトラヒック量および処理デッドラインの予測は、現在のトラヒックの推移から予測する方法のほかに、該当のトラヒック発生地点での時間帯による推移や、周辺での人が集合するイベントの発生をもとに、予測してもよい。
　具体的には、電車沿線の基地局からのトラヒック量は、始発～終電までの時間に多く、それ以外の時間は少ないと予測するなどの手法が考えられる。また、一定の地点における基地局周辺での人が集まるイベント（花火大会など）の情報をもとに、事前にトラヒックの増加を予測する方法でもよい。

<関数代理実行部１６０>
　関数代理実行部１６０は、既存のアクセラレータへのアクセス用ライブラリが提供する関数と、同一のインターフェイスをアプリケーションに提供し、代理で実際の関数実行を行う。関数代理実行部１６０は、提供形態としては、アプリケーションに対するライブラリとして提供され、静的にリンクされるか、あるいは実行時に動的にロードされ呼び出される。同一のインターフェイスとは、同一の関数名・同一の引数形式の関数を指す。

・入出力
《処理依頼時》
　関数代理実行部１６０は、入力として、アプリケーション１から、関数名と引数を受け取り、出力として、演算装置振分部１７０に対して、関数名と引数を通知する。

《処理結果応答時》
　関数代理実行部１６０は、入力として、演算装置振分部１７０から、処理結果を受け取り、出力として、処理結果を、アプリケーション１に通知する。

<演算装置振分部１７０>
　演算装置振分部１７０は、入力データを、事前に割り当てられた演算装置に対し振り分ける。
　演算装置振分部１７０は、データ処理デッドライン判別部１４０が判別した入力データの処理デッドラインと、演算装置割当判断部１３０の判断結果をもとに、処理性能を満たすアクセラレータを選択し、選択したアクセラレータに処理を振り分ける。
　具体的には、演算装置振分部１７０は、各入力データに含まれる処理デッドライン情報をもとに、処理性能を満たす演算装置を選択し、処理を振り分ける。この時、演算装置振分部１７０は、データ処理デッドライン判別部１４０に対して各データの処理デッドライン情報の問い合わせを行い、データ処理デッドラインを判別する。

・入出力
《処理依頼時》
　演算装置振分部１７０は、入力として、演算装置割当判断部１３０から、利用可能な演算装置のリストを受け付けるとともに、関数代理実行部１６０から、処理対象データを受け付ける。
　演算装置振分部１７０は、出力として、ＣＰＵ１１、アクセラレータ１２、遠隔オフロード部１８０のいずれかに、処理対象データを送付する。
　演算装置振分部１７０は、データ処理デッドライン判別部１４０に対し、入力データを入力し、データ処理デッドライン判別部１４０から該当データの処理デッドラインを受け付ける。

《処理結果応答》
　演算装置振分部１７０は、入力として、ＣＰＵ１１、アクセラレータ１２、遠隔オフロード用入出力部１４から、処理結果を受け取り、出力として、処理結果を関数代理実行部１６０に通知する。

・変形例
　演算装置振分部１７０は、処理デッドライン情報およびトラヒック量をもとにアクセラレータを振り分けているが、このほかの優先度情報を用いてもよい。具体的には、優先度情報は、システムの継続稼働に必要な、メンテナンス用のアクセラレータの確保などが挙げられる。

　本実施形態では、各演算装置（遠隔オフロードレイテンシ収集・記録部１２０，アクセラレータ１２，遠隔オフロード用入出力部１４）の演算結果等を、演算装置振分部１７０を介して関数代理実行部１６０に応答しているが、各演算装置（遠隔オフロードレイテンシ収集・記録部１２０，アクセラレータ１２，遠隔オフロード用入出力部１４）から直接関数代理実行部１６０に応答する形でもよい。

<遠隔オフロード部１８０>
　遠隔オフロード部１８０は、入力された関数名・引数を、ＮＩＣによって送信可能なＬ２フレームおよびそのペイロードとしてデータ化する。実施形態のデータフォーマットを、図６に示す。

・入出力
《オフロード時》
　遠隔オフロード部１８０は、入力として、演算装置振分部１７０から「関数名・引数」を受け付け、出力として、遠隔オフロード用入出力部１４へ「送信データ」を渡す。

《応答時》
　遠隔オフロード部１８０は、入力として、遠隔オフロード用入出力部１４から、「処理結果データ」を受け付け、出力として、演算装置振分部１７０に、処理結果データを渡す。

・変形例
　データ形式は、Ｌ２フレームだけでなく、Ｌ３，Ｌ４ヘッダを付与したデータでもよい。パケットフォーマットには、関数名・引数だけでなく、利用するアクセラレータを一意に識別できるＩＤを含めてもよい。
　また、引数サイズが大きい場合には、複数パケットへの分割機能を具備してもよい。

［遠隔オフロード用サーバ２１０］
　遠隔オフロード用サーバ２１０は、ハードウェア（ＨＷ）１０と、ソフトウェア２０と、を備える。

《ハードウェア１０》
　ハードウェア１０は、ＣＰＵ１１と、アクセラレータ（遠隔）（性能：高）１２－３，と、遠隔オフロード用入出力部（サーバ）（ＮＩＣ）１４と、を有する。

<ＣＰＵ１１>
　ＣＰＵ１１は、アプリケーション１の処理を実行するとともに、遠隔オフロード用サーバ２１０における、各機能部のソフトウェアを実行する。

<アクセラレータ１２>
　アクセラレータ（遠隔）（性能：高）１２－３は、ＦＰＧＡ／ＧＰＵ等の計算アクセラレータデバイスである。アクセラレータ（遠隔）（性能：高）１２－３は、遠隔オフロード用サーバ２１０に搭載された、特定の処理に特化した演算機である。ＣＰＵ１１とバスを介して接続する形態としては、ＡＳＩＣ搭載型アクセラレータ、ＦＰＧＡ搭載型アクセラレータ、ＧＰＵ等の形態がある。

　本実施形態は、処理能力の異なる複数のアクセラレータを利用可能な「性能のヘテロ構成」を用いる。処理能力の異なる複数のアクセラレータは、サーバ２００に搭載されたアクセラレータ（性能：高）１２－１，アクセラレータ（性能：低）１２－２、遠隔オフロード用サーバ２１０に搭載されたアクセラレータ（遠隔）（性能：高）１２－３である。

《ソフトウェア２０》
　ソフトウェア２０は、遠隔オフロード受付部２１１を有する。
　遠隔オフロード受付部２１１は、ネットワークを介して受信した処理対象データを、アクセラレータ（遠隔）１２－３にオフロードし、結果を応答する。

・入出力
《オフロード時》
　遠隔オフロード受付部２１１は、入力として、図６の形式のデータを受信し、出力として、アクセラレータ（遠隔）１２－３に対し、処理オフロードを行う。

《応答時》
　遠隔オフロード受付部２１１は、入力として、アクセラレータ（遠隔）１２－３から、オフロード結果を受信し、出力として、図６の形式のデータとして、処理結果を応答する。

［アンテナ装置２２０］
　アンテナ装置２２０は、端末（ＵＥ：User Equipment）と無線通信するアンテナおよび送受信部である（以下、「アンテナ装置」は、アンテナと送受信部、その電源部を総称して呼称する）。送受信データは、例えば専用ケーブルにより基地局（ＢＢＵ：Base Band Unit）の信号処理装置（サーバ２００）に接続される。

　アンテナ装置２２０は、アンテナ装置データ入出力部２２１を備える。アンテナ装置データ入出力部２２１は、サーバ２００に対し、アンテナ装置２２０で生成された信号を送る機能部であり、ＮＩＣ等の形態で実現される。

［後段処理装置２３０］
　後段処理装置２３０は、５Ｇ信号処理におけるCentralized Unitである。
　後段処理装置２３０は、後段処理装置データ入出力部２３１を備える。後段処理装置データ入出力部２３１は、サーバ２００で処理した信号処理結果を受信する機能部であり、ＮＩＣ等の形態で実現される。

<その他の実施形態>
　本実施形態では、入出力部１３とＣＰＵ１１、アクセラレータ１２はハードウェアとして分かれた構成であるが、ＣＰＵ１１、アクセラレータ１２およびアクセラレータ演算回路・プログラム１２ａが一体化した専用ハードウェアの形態でもよい。
　言い換えると、図１のように、「ＮＩＣ等の入出力部１３を介して得たデータを、ＣＰＵ１１からアクセラレータ１２に対し明示的にオフロードする」、いわゆるLook-Aside型のアクセラレータ適用形態（図１１Ａ－１１Ｃのシーケンス）に加えて、図２で後記する「ＮＩＣ・アクセラレータ・ＣＰＵ」が一体化したハードウェアで、ＮＩＣでのデータ受信後に同一ハードウェア内で処理が完結する」、いわゆるIn-line型のアクセラレータ適用形態（図１２Ａ－１２Ｃのシーケンス）でもよい。
　また、ＣＰＵ１１、アクセラレータ１２は、ＳｏＣ（System on Chip）の形態のように、単一のチップの中に搭載される形態でもよい。

［アクセラレータ状態制御装置のアクセラレータ適用形態］
　図２は、本発明の実施形態に係るアクセラレータ状態制御システム１０００Ａの概略構成図である。図２は、In-line型のアクセラレータ適用形態である。図１と同一構成部分には、同じ符号を付して重複箇所の説明を省略する。
　図２に示すIn-line型のアクセラレータ適用形態のサーバ２００Ａのアクセラレータ状態制御装置１００Ａは、図１のサーバ２００のアクセラレータ状態制御装置１００における、入出力部１３とアクセラレータ１２とを結ぶ双方向の信号線が、存在しない。また、図２に示すIn-line型のアクセラレータ適用形態のサーバ２００のアクセラレータ状態制御装置１００Ａは、新たに入出力部１３と演算装置振分部１７０とを結ぶ双方向の信号線が追加される。
　In-line型のアクセラレータ適用形態のサーバ２００Ａは、ＮＩＣから直接アクセラレータへデータをコピーする。アクセラレータが、専用回路のように自律的に演算を行う。

［アクセラレータ状態制御装置の配置］
　アクセラレータ状態制御システムのアクセラレータ状態制御装置の配置のバリエーションについて説明する。
　図１のアクセラレータ状態制御システム１０００は、アクセラレータ状態制御装置１００をサーバ２００のソフトウェア２０に配置した例である。アクセラレータ状態制御装置１００は、機能の一部を、サーバ２００外に別筐体で設置することも可能であり、以下に例示する。

　図３は、アクセラレータ状態制御システムのアクセラレータ状態制御装置の配置のバリエーションを示す概略構成図である。なお、以下の各図において、図１と同一構成部分には同一符号を付して重複箇所の説明を省略する。
　図３に示すバリエーションは、演算装置性能収集・記録部１１０、遠隔オフロードレイテンシ収集・記録部１２０、演算装置割当判断部１３０、データ処理デッドライン判別部１４０、およびトラヒック量・処理デットライン予測部１５０からなるコントローラ機能部を別筐体とした場合の例である。
　図３に示すように、アクセラレータ状態制御システム１０００Ｂは、サーバ２００外に別筐体で設置されたアクセラレータ状態制御装置１００Ｂを備える。
　サーバ２００のソフトウェア２０は、アプリケーション１と、関数代理実行部１６０と、演算装置振分部１７０と、を有する。
　アクセラレータ状態制御装置１００Ｂは、上記コントローラ機能部がサーバ２００外に設置され、図１および図２のアクセラレータ状態制御装置１００，１００Ａと同一の機能を有する。

　以上、図３に示すように、アクセラレータ状態制御装置の各機能の一部または全部を、サーバ２００外の別の筐体に独立して配備する形態をとることで、ＲＡＮ（Radio Access Network）におけるＲＩＣ（RAN Intelligent Controller）への機能配備に対応することができる。

　また、上記コントローラ機能部を外部に配置することで、複数のサーバマシンからの入力量取得（機能１）をもとに入力量を予測できるため、機能１のトラヒックの予測精度が上がるメリットがある。例えば、携帯電話の無線システムにおいて、あるサーバマシンが担当する処理エリアのトラヒック量が増大した場合、近傍の処理エリアの入力量も、それに遅れて変動すると想定される。

　また、複数のサーバ２００に対して、１つのアクセラレータ状態制御装置での運用が可能になる。これにより、コストの低減と、アクセラレータ状態制御装置のメンテナンス性を向上させることができる。また、サーバ側の改変を不要ないし軽減することができ、汎用的に適用することができる。

［演算装置性能収集・記録部１１０のＤＢテーブル］
　図４は、演算装置性能収集・記録部１１０のＤＢテーブル３００の一例を示す図である。
　図４に示すように、ＤＢテーブル３００は、搭載ホスト情報毎に、アクセラレータ識別子（ＣＰＵ，ＦＰＧＡ，ＡＳＩＣ）、ＡＣＣ性能（スループット）、ＡＣＣ性能（処理レイテンシ）、ＡＣＣ性能（消費電力）を保持する。例えば、搭載ホスト情報「Host-1(192.168.0.1：サーバＵＲＬ)」は、アクセラレータ識別子「ＦＰＧＡ－１」、ＡＣＣ性能（スループット）「10.0 Gbps」、ＡＣＣ性能（処理レイテンシ）「5.0μs」、ＡＣＣ性能（消費電力）「120.0 W」である。搭載ホスト情報に紐づけて、各ＡＣＣ性能が記録されており、搭載ホスト情報を指定することで当該ホストの各ＡＣＣ性能を知ることができる。

［遠隔オフロードレイテンシ収集・記録部１２０のレイテンシテーブル］
　図５は、遠隔オフロードレイテンシ収集・記録部１２０のレイテンシテーブル３１０の一例を示す図である。
　図５に示すように、レイテンシテーブル３１０は、アクセス元ホスト情報、アクセス先ホスト情報、レイテンシを保持（記録）する。例えば、アクセス元ホスト情報「Host-1(192.168.0.1：サーバＵＲＬ)」は、アクセス先ホスト情報「Host-2(192.168.0.2)」に接続した場合、レイテンシ（接続レイテンシ／通信レイテンシ）「30μs」である。

［遠隔オフロード部１８０のデータ構造］
　図６は、遠隔オフロード部１８０のＡＣＣ関数・引数データパケット３２０の構成例を示す図である。
　図６に示すように、ＡＣＣ関数・引数データパケット３２０は、Ｌ２フレーム(0～14byte)、関数ＩＤ(～34byte)、最終データビット(～42byte)、引数１(～46byte)、引数２(～50byte)でフォーマットされる。
　ＡＣＣ関数・引数データパケット３２０は、各データを固定長・固定位置とすることで、ＦＰＧＡの回路でのパースに適したデータ構造とする。

　制御ビットは、パケットの制御情報を付加する。ＡＣＣ関数・引数データパケット３２０は、例えば、引数サイズが大きい場合には、複数パケットへの分割機能を具備する。この際、分割した最後のパケットには、「制御ビット」に最終パケットを通知する制御用データを付与する。
　なお、図６に示すパケットフォーマットには、ヘッダにＬ３ヘッダ、Ｌ４ヘッダを含めてもよい。また、関数名・引数だけでなく、利用するアクセラレータを一意に識別できるＩＤを含めてもよい。

［Host-1からの利用可能ＡＣＣリストの算出例］
　図７は、Host-1からの利用可能ＡＣＣリスト３３０の算出例を示す図である。
　図７に示すように、利用可能ＡＣＣリスト３３０は、図４に示す演算装置性能収集・記録部１１０のＤＢテーブル３００と、図５に示す遠隔オフロードレイテンシ収集・記録部１２０のレイテンシテーブル３１０をもとに作成される。利用可能ＡＣＣリスト３３０は、ホストから他のホストを利用する場合に、ＡＣＣ性能（スループット）、ＡＣＣ性能（処理レイテンシ）、ＡＣＣ性能（消費電力）を一覧できる。例えば、Host-1からHost-2を利用する場合は、ＡＣＣ性能（処理レイテンシ）「40.0μs＝10.0μs＋30μs(遠隔化レイテンシ)」であり、Host-1がHost-2を利用する上で、重要な指標となる。

　演算装置割当判断部１３０は、図４に示す演算装置性能収集・記録部１１０のＤＢテーブル３００の一覧から、性能を満たしつつ最も消費電力の小さなアクセラレータの組み合わせを選び、演算装置振分部１７０に通知する。しかしながら、該当アクセラレータが、特にネットワークを経由した遠隔にある場合には、遠隔化レイテンシも考慮する。演算装置割当判断部１３０は、この利用可能ＡＣＣリスト３３０を用いて、遠隔化レイテンシも考慮しつつ、性能を充足する演算装置を判断し、演算装置振分部１７０に割り当てる。

　以下、上述のように構成されたアクセラレータ状態制御システム１０００の動作を説明する。
　まず、演算装置割当判断部１３０およびトラヒック量・処理デッドライン予測部１５０の動作について説明する。
［演算装置割当判断部１３０およびトラヒック量・処理デッドライン予測部１５０の動作１］
　図８は、演算装置割当判断部１３０およびトラヒック量・処理デッドライン予測部１５０の動作１を示すフローチャートである。図８は、トラフィック量または高い処理デッドラインをもつトラヒックの割合が増加する場合のである。

　ステップＳ１１でトラヒック量・処理デッドライン予測部１５０は、入力トラヒック量・処理デッドラインの長さの割合を取得する。
　ステップＳ１２でトラヒック量・処理デッドライン予測部１５０は、入力トラヒック量に対し、各処理デッドラインの割合を乗算し、各トラヒック種別の量を算出する。

　ステップＳ１３でトラヒック量・処理デッドライン予測部１５０は、トラヒックの合計量、もしくは短い処理デッドラインをもつトラヒックの量が、一定回数以上連続して、増加しているか否かを判別する。
　トラヒックの合計量、もしくは短い処理デッドラインをもつトラヒックの量が、一定回数以上連続して、増加していない場合（Ｓ１２：Ｎｏ）、ステップＳ１１に戻る。

　トラヒックの合計量、もしくは短い処理デッドラインをもつトラヒックの量が、一定回数以上連続して、増加している場合（Ｓ１２：Ｙｅｓ）、ステップＳ１４で演算装置性能収集・記録部１１０は、利用可能な演算装置一覧（図４のＤＢテーブル３００）の払出を行う（以下、「払出」とは、情報を取り出して応答することをいう）。

　ステップＳ１５で演算装置割当判断部１３０は、予測したトラヒック量が、現在の処理キャパシティより大きいか否かを判別する。
　予測したトラヒック量が、現在の処理キャパシティより大きい場合（Ｓ１５：Ｙｅｓ）、ステップＳ１６で演算装置割当判断部１３０は、予測した“短い処理デッドラインのトラヒックの量”が、現在の処理キャパシティより高いか否かを判別する。

　予測した“短い処理デッドラインのトラヒックの量”が、現在の処理キャパシティより高い場合（Ｓ１６：Ｙｅｓ）、ステップＳ１７で演算装置割当判断部１３０は、現状よりも、トラヒック性能が高く、リアルタイム性能の高い演算装置の選定および再払出を行いステップＳ２０に進む。

　予測した“短い処理デッドラインのトラヒックの量”が、現在の処理キャパシティより高くない場合（Ｓ１６：Ｎｏ）、ステップＳ１８で演算装置割当判断部１３０は、現状よりも、トラヒック性能が高く、リアルタイム性能が同様以上の演算装置の選定および再払出を行いステップＳ２０に進む。

　一方、上記ステップＳ１５で予測したトラヒック量が、現在の処理キャパシティ以下の場合（Ｓ１５：Ｎｏ）、トラヒック量は増加せず、“高い処理デッドラインを持つトラフィックの割合”が高いケースであると判断して、ステップＳ１９で演算装置割当判断部１３０は、現状よりも、トラヒック性能が同様以上で、リアルタイム性能が高い演算装置の選定および再払出を行いステップＳ２０に進む。

　ステップＳ２０で演算装置割当判断部１３０は、演算装置振分部１７０へ選定結果を通知して本フローの処理を終了する。

［演算装置割当判断部１３０およびトラヒック量・処理デッドライン予測部１５０の動作２］
　図９は、演算装置割当判断部１３０およびトラヒック量・処理デッドライン予測部１５０の動作２を示すフローチャートである。図９は、トラフィック量または高い処理デッドラインをもつトラヒックの割合が減少する場合のである。

　ステップＳ２１でトラヒック量・処理デッドライン予測部１５０は、入力トラヒック量・処理デッドライン割合を取得する。

　ステップＳ２２でトラヒック量・処理デッドライン予測部１５０は、トラヒックの合計量、もしくは高いレイテンシ要求をもつトラヒックの割合が、一定回数以上連続して、減少しているか否かを判別する。

　トラヒックの合計量、もしくは高いレイテンシ要求をもつトラヒックの割合が、一定回数以上連続して、減少していない場合（Ｓ２２：Ｎｏ）、ステップＳ２１に戻る。

　トラヒックの合計量、もしくは高いレイテンシ要求をもつトラヒックの割合が、一定回数以上連続して、減少している場合（Ｓ２２：Ｙｅｓ）、ステップＳ２３で演算装置性能収集・記録部１１０は、利用可能な演算装置一覧（図４のＤＢテーブル３００）の払出を行う。

　ステップＳ２４で演算装置割当判断部１３０は、予測したトラヒック量が、現在の処理キャパシティより小さいか否かを判別する。
　予測したトラヒック量が、現在の処理キャパシティより小さい場合（Ｓ２４：Ｙｅｓ）、ステップＳ２５で演算装置割当判断部１３０は、予測した“短い処理デッドラインのトラヒックの量”が、現在の処理キャパシティより低いか否かを判別する。

　予測した“短い処理デッドラインのトラヒックの割合”が、現在の処理キャパシティより低い場合（Ｓ２５：Ｙｅｓ）、ステップＳ２６で演算装置割当判断部１３０は、現状よりも、トラヒック性能が高く、リアルタイム性能の低い演算装置の選定および再払出を行いステップＳ２９に進む。

　予測した“短い処理デッドラインのトラヒックの割合”が、現在の処理キャパシティより低くない場合（Ｓ２５：Ｎｏ）、ステップＳ２７で演算装置割当判断部１３０は、現状よりも、トラヒック性能が低く、リアルタイム性能が同様以上の演算装置の選定および再払出を行いステップＳ２９に進む。

　一方、上記ステップＳ２４で予測したトラヒック量が、現在の処理キャパシティ以上の場合（Ｓ２４：Ｎｏ）、トラヒック量は：減少せず、“高いレイテンシ要求を持つトラフィックの割合”が減少しているケースであると判断して、ステップＳ２８で演算装置割当判断部１３０は、現状よりも、トラヒック性能が同様以上で、リアルタイム性能が低い演算装置の選定および再払出を行いステップＳ２９に進む。

　ステップＳ２９で演算装置割当判断部１３０は、演算装置振分部１７０へ選定結果を通知して本フローの処理を終了する。

［演算装置割当（ＡＣＣ割当）］
　図１０は、演算装置割当（ＡＣＣ割当）を示すフローチャートである。
　ステップＳ３１で入出力部１３は、データの入出力を行う。

　ステップＳ３２でデータ処理デッドライン判別部１４０は、入力データそれぞれの処理デッドラインを識別したうえで、各機能部に通知する。データ処理デッドライン判別部１４０は、入出力部から、入力データを受け取り、その先頭のヘッダ情報を参照し、処理デッドラインを識別する。

　ステップＳ３３でトラヒック量・処理デッドライン予測部１５０は、一定時間経過後のトラヒック量と処理デッドラインを、現在と過去のトラヒック量と処理デッドラインの割合から予測する。トラヒック量・処理デッドライン予測部１５０は、データ処理デッドライン判別部１４０から、トラヒック量とレイテンシ要求を受け取り、トラヒックおよびレイテンシ要求の割合が、それぞれ増加傾向か否かを予測する。

　ステップＳ３４で演算装置割当部１７０は、一定時間経過後のトラヒック量と処理デッドラインをもとに、性能を充足する演算装置を判断し、演算装置振分部１７０に割り当てる。

　ステップＳ３５で演算装置振分部１７０は、入力データを、事前に割り当てられた演算装置に対し振り分ける。演算装置振分部１７０は、各入力データに含まれる処理デッドライン情報をもとに、処理性能を満たす演算装置を選択し、処理を振り分けて本フローの処理を終了する。

［入力データ処理］
　図１１Ａ－１１Ｃは、入力データ処理を示すフローチャートである。図１１Ａ－１１Ｃは、Look-Aside型のアクセラレータ適用形態に対応する。
　なお、図１１Ａ－１１Ｃは、一つのフローであるが、図示の便宜上、[Ａ]，[Ｂ]，[Ｃ]を連結子として連結される。

　図１１Ａにおいて、ステップＳ４１でアンテナ装置２２０のアンテナ装置データ入出力部２２１は、サーバ２００に対し、アンテナ装置２２０で生成された信号を送る。

　ステップＳ４２で入出力部１３は、外部装置（アンテナ装置２２０）とのデータの入出力を行う。
　ステップＳ４３でアプリケーション１は、入出力部１３からの処理対象データを受け付け、演算したデータを入出力部１３に渡す。

　ステップＳ４４で関数代理実行部１６０は、入力としてアプリケーションから、関数名と引数を受け取り、出力として演算装置振分部１７０に対して、関数名と引数を通知する。
　ステップＳ４５で演算装置振分部１７０は、関数代理実行部１６０から処理対象データを受け付け、ＣＰＵ１１、アクセラレータ１２、遠隔オフロード用サーバのアクセラレータ[遠隔]１２－３のいずれかに、処理対象データを送付する。

　ステップＳ４６で演算装置振分部１７０は、振分先が下記のいずれかを判断する。
　振分先がＣＰＵの場合、図１１ＣのステップＳ４７でＣＰＵ１１は、ソフトウェアを実行してステップＳ５９に進む。
　振分先がアクセラレータ１（アクセラレータ１２－１）の場合、図１１ＣのステップＳ４８でアクセラレータ[性能：高]１２－１は、特定の処理に特化した処理を実行してステップＳ５９に進む。

　振分先がアクセラレータ２（アクセラレータ１２－２）の場合、図１１ＣのステップＳ４９でアクセラレータ[性能：低]１２－２は、特定の処理に特化した処理を実行してステップＳ５９に進む。
　振分先がアクセラレータ[遠隔]（アクセラレータ１２－３）の場合、図１１ＢのステップＳ５０に進む。

　図１１Ｂにおいて、ステップＳ５０で遠隔オフロード部１８０は、入力として演算装置振分部１７０から「関数名・引数」を受け付け、出力として遠隔オフロード用入出力部１４へ「送信データ」を渡す。

　ステップＳ５１で遠隔オフロード用入出力部[クライアント]１４は、遠隔オフロード用サーバ間の通信を行う。
　ステップＳ５２で遠隔オフロード用入出力部[サーバ]１４は、サーバ間の通信を行う。

　ステップＳ５３で遠隔オフロード受付部２１１は、入力として図６の形式のデータを受信し、出力としてアクセラレータ[遠隔]１２－３に対し、処理オフロードを行う。
　ステップＳ５４でアクセラレータ[遠隔]１２－３は、特定の処理に特化した演算を行う。
　ステップＳ５５で遠隔オフロード受付部２１１は、アクセラレータ [遠隔]から、オフロード結果を受信し、図６の形式のデータとして、処理結果を応答する。

　ステップＳ５６で遠隔オフロード用入出力部[サーバ]１４は、サーバ間の通信を行う。
　ステップＳ５７で遠隔オフロード用入出力部[クライアント]１４は、遠隔オフロード用サーバ間の通信を行う。
　ステップＳ５８で遠隔オフロード部１８０は、入力として遠隔オフロード用入出力部１４から、「処理結果データ」を受け付け、出力として演算装置振分部１７０に、処理結果データを渡して図１１ＣのステップＳ５９に進む。

　図１１ＣのステップＳ５９で関数代理実行部１６０は、入力として演算装置振分部１７０から、処理結果を受け取り、出力として処理結果を、アプリケーションに通知する。
　ステップＳ６０で演算装置振分部１７０は、入力としてＣＰＵ、アクセラレータ１２、遠隔オフロード用入出力部１４から、処理結果を受け取り、出力として処理結果を関数代理実行部１６０に通知する。

　ステップＳ６１でアプリケーション１は、入力として入出力部１３から処理対象データを受け付け、出力として演算したデータを入出力部１３に渡す。
　ステップＳ６２で後段処理装置２３０の後段処理装置データ入出力部２３１は、サーバで処理した信号処理結果を受信して本フローの処理を終了する。

　図１２Ａ－１２Ｃは、入力データ処理を示すフローチャートである。図１２Ａ－１２Ｃは、In-line型のアクセラレータ適用形態に対応する。図１１Ａ－１１Ｃと同一処理には同じステップ番号を付している。
　なお、図１２Ａ－１２Ｃは、一つのフローであるが、図示の便宜上、[Ａ]，[Ｂ]，[Ｃ]を連結子として連結される。

　図１２Ａにおいて、ステップＳ４１でアンテナ装置２２０のアンテナ装置データ入出力部２２１は、サーバ２００に対し、アンテナ装置２２０で生成された信号を送る。
　ステップＳ４２で入出力部１３は、外部装置（アンテナ装置２２０）とのデータの入出力を行う。

　ステップＳ４５で演算装置振分部１７０は、関数代理実行部１６０から処理対象データを受け付け、ＣＰＵ１１、アクセラレータ１２、遠隔オフロード用サーバのアクセラレータ[遠隔]１２－３のいずれかに、処理対象データを送付する。
　ステップＳ４６で演算装置振分部１７０は、振分先が下記のいずれかを判断する。
　振分先がＣＰＵの場合、図１２ＣのステップＳ４７でＣＰＵ１１は、ソフトウェアを実行してステップＳ５９に進む。

　振分先がアクセラレータ１（アクセラレータ１２－１）の場合、図１２ＣのステップＳ４８でアクセラレータ[性能：高]１２－１は、特定の処理に特化した処理を実行してステップＳ５９に進む。
　振分先がアクセラレータ２（アクセラレータ１２－２）の場合、図１２ＣのステップＳ４９でアクセラレータ[性能：低]１２－２は、特定の処理に特化した処理を実行してステップＳ５９に進む。
　振分先がアクセラレータ[遠隔]（アクセラレータ１２－３）の場合、図１２ＢのステップＳ５０に進む。

　図１２Ｂにおいて、ステップＳ５０で遠隔オフロード部１８０は、入力として演算装置振分部１７０から「関数名・引数」を受け付け、出力として遠隔オフロード用入出力部１４へ「送信データ」を渡す。
　ステップＳ５１で遠隔オフロード用入出力部[クライアント]１４は、遠隔オフロード用サーバ間の通信を行う。
　ステップＳ５２で遠隔オフロード用入出力部[サーバ]１４は、サーバ間の通信を行う。
　ステップＳ５３で遠隔オフロード受付部２１１は、入力として図６の形式のデータを受信し、出力としてアクセラレータ[遠隔]１２－３に対し、処理オフロードを行う。

　ステップＳ５４でアクセラレータ[遠隔]１２－３は、特定の処理に特化した演算を行う。
　ステップＳ５５で遠隔オフロード受付部２１１は、アクセラレータ [遠隔]から、オフロード結果を受信し、図６の形式のデータとして、処理結果を応答する。
　ステップＳ５６で遠隔オフロード用入出力部[サーバ]１４は、サーバ間の通信を行う。

　ステップＳ５７で遠隔オフロード用入出力部[クライアント]１４は、遠隔オフロード用サーバ間の通信を行う。
　ステップＳ５８で遠隔オフロード部１８０は、入力として遠隔オフロード用入出力部１４から、「処理結果データ」を受け付け、出力として演算装置振分部１７０に、処理結果データを渡して図１２ＣのステップＳ５９に進む。

　図１２ＣのステップＳ５９で関数代理実行部１６０は、入力として演算装置振分部１７０から、処理結果を受け取り、出力として処理結果を、アプリケーションに通知する。
　ステップＳ６０で演算装置振分部１７０は、入力としてＣＰＵ、アクセラレータ１２、遠隔オフロード用入出力部１４から、処理結果を受け取り、出力として処理結果を関数代理実行部１６０に通知する。

［ハードウェア構成］
　上記実施形態に係るアクセラレータ状態制御システム１０００，１０００Ａ（図１、図２）のアクセラレータ状態制御装置１００（図１）は、例えば図１３に示すような構成のコンピュータ９００によって実現される。
　図１３は、アクセラレータ状態制御装置１００の機能を実現するコンピュータ９００の一例を示すハードウェア構成図である。
　アクセラレータ状態制御装置１００は、ＣＰＵ９０１、ＲＡＭ９０２、ＲＯＭ９０３、ＨＤＤ９０４、アクセラレータ９０５、入出力インターフェイス（Ｉ／Ｆ）９０６、メディアインターフェイス（Ｉ／Ｆ）９０７、および通信インターフェイス（Ｉ／Ｆ：Interface）９０８を有する。アクセラレータ９０５は、図１、図２のアクセラレータ１２に対応する。

　アクセラレータ９０５は、通信Ｉ／Ｆ９０８からのデータ、または、ＲＡＭ９０２からのデータの少なくとも一方のデータを高速に処理するアクセラレータ（デバイス）１２（図１、図２）である。なお、アクセラレータ９０５として、ＣＰＵ９０１またはＲＡＭ９０２からの処理を実行した後にＣＰＵ９０１またはＲＡＭ９０２に実行結果を戻すタイプ（Look-Aside型）を用いてもよい。一方、アクセラレータ９０５として、通信Ｉ／Ｆ９０８とＣＰＵ９０１またはＲＡＭ９０２との間に入って、処理を行うタイプ（In-line型）を用いてもよい。

　アクセラレータ９０５は、通信Ｉ／Ｆ９０８を介して外部装置９１５と接続される。入出力Ｉ／Ｆ９０６は、入出力装置９１６と接続される。メディアＩ／Ｆ９０７は、記録媒体９１７からデータを読み書きする。

　ＣＰＵ９０１は、ＲＯＭ９０３またはＨＤＤ９０４に格納されたプログラムに基づいて動作し、ＲＡＭ９０２に読み込んだプログラム（アプリケーションや、その略のアプリとも呼ばれる）を実行することにより、図１および図２に示すアクセラレータ状態制御装置１００，１００Ａの各部の制御を行う。そして、このプログラムは、通信回線を介して配布したり、ＣＤ－ＲＯＭ等の記録媒体９１７に記録して配布したりすることも可能である。
　ＲＯＭ９０３は、コンピュータ９００の起動時にＣＰＵ９０１によって実行されるブートプログラムや、コンピュータ９００のハードウェアに依存するプログラム等を格納する。

　ＣＰＵ９０１は、入出力Ｉ／Ｆ９０６を介して、マウスやキーボード等の入力部、および、ディスプレイやプリンタ等の出力部からなる入出力装置９１６を制御する。ＣＰＵ９０１は、入出力Ｉ／Ｆ９０６を介して、入出力装置９１６からデータを取得するともに、生成したデータを入出力装置９１６へ出力する。なお、プロセッサとしてＣＰＵ９０１とともに、ＧＰＵ（Graphics Processing Unit）等を用いてもよい。

　ＨＤＤ９０４は、ＣＰＵ９０１により実行されるプログラムおよび当該プログラムによって使用されるデータ等を記憶する。通信Ｉ／Ｆ９０８は、通信網（例えば、ＮＷ（Network））を介して他の装置からデータを受信してＣＰＵ９０１へ出力し、また、ＣＰＵ９０１が生成したデータを、通信網を介して他の装置へ送信する。

　メディアＩ／Ｆ９０７は、記録媒体９１７に格納されたプログラムまたはデータを読み取り、ＲＡＭ９０２を介してＣＰＵ９０１へ出力する。ＣＰＵ９０１は、目的の処理に係るプログラムを、メディアＩ／Ｆ９０７を介して記録媒体９１７からＲＡＭ９０２上にロードし、ロードしたプログラムを実行する。記録媒体９１７は、ＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto Optical disk）等の光磁気記録媒体、磁気記録媒体、導体メモリテープ媒体又は半導体メモリ等である。

　例えば、コンピュータ９００が本実施形態に係る一装置として構成されるアクセラレータ状態制御装置１００（図１）として機能する場合、コンピュータ９００のＣＰＵ９０１は、ＲＡＭ９０２上にロードされたプログラムを実行することによりアクセラレータ状態制御装置１００の機能を実現する。また、ＨＤＤ９０４には、ＲＡＭ９０２内のデータが記憶される。ＣＰＵ９０１は、目的の処理に係るプログラムを記録媒体９１７から読み取って実行する。この他、ＣＰＵ９０１は、他の装置から通信網を介して目的の処理に係るプログラムを読み込んでもよい。
　なお、図３に示すコントローラ機能部がサーバ２００外に設置された場合において、このアクセラレータ状態制御装置１００Ａについても同様に、図１６に示すような構成のコンピュータ９００によって実現される。

［効果］
　以上説明したように、処理性能の異なる複数のアクセラレータ１２を有し、アプリケーション１の特定処理をアクセラレータ１２にオフロードして演算処理する際に、アクセラレータの状態を制御するアクセラレータ状態制御装置１００，１００Ａ，１００Ｂ（図１～図３）であって、異なる処理デッドラインが混在するデータが入力される場合において、アクセラレータ１の性能情報を収集し、記録する記録部（演算装置性能収集・記録部１１０）と、現在と過去のトラヒック量と処理デッドラインの割合から所定時間経過後のトラヒック量および処理デッドラインを予測する予測部（トラヒック量・処理デッドライン予測部１５０）と、予測部が予測した所定時間経過後のトラヒック量と処理デッドラインと、記録部に記録されたアクセラレータの性能とをもとに、処理デッドラインに対応するデータ量を求め、データ量をもとに性能を満たすアクセラレータを判断する判断部（演算装置割当判断部１３０）と、を備える。

　解決課題で述べたように、既存技術１（静的割り付け）は、アクセラレータのリソース量が一定であり、<要件２：スケール性>を満たさない。既存技術２（関数プロキシによるスケールアウト）は、アクセラレータ個々の性能の違いを考慮しないため、<要件１：データそれぞれの処理デッドラインの充足>を満たさない。このため、既存技術１は、スケールが固定のため、汎用性が悪く、既存技術２は、応答性が確保できる割合が決まっているため、低レイテンシが求められる処理には向いていなかった。これに対して、本実施形態に係るアクセラレータ状態制御装置１００では、複数の異なるアクセラレータを利用可能な、性能のヘテロ構成のアクセラレータを用いて、各データの処理デッドラインをもとに、アクセラレータを割り当て、オフロードする。これにより、アクセラレータ状態制御装置１００は、既存技術１、既存技術２では実現できなかった汎用性や低レイテンシを両立することができる。

　よって、アクセラレータ状態制御装置１００，１００Ａ，１００Ｂ（図１～図３）は、動的なアクセラレータの払出を実現し、[要件２：スケール性]を満たすことができる。また、アクセラレータ状態制御装置１００，１００Ａ，１００Ｂは、演算時において、データごとの処理デッドラインをもとに、割り当てられたアクセラレータから、性能を満たし消費電力を最小限とするものを選び、オフロードすることで、[要件１：データそれぞれの応答性の充足]を満たすことができる。その結果、アクセラレータ状態制御装置１００は、各処理デッドラインに対応するデータ量の変動に応じ、応答性を担保しつつ、使用する演算リソースの低減を実現することができる。

　アクセラレータ状態制御装置１００，１００Ａ，１００Ｂ（図１～図３）において、入力データの処理デッドラインを識別して通知するデータ処理デッドライン判別部１４０と、データ処理デッドライン判別部１４０が判別した入力データの処理デッドラインと、判断部（演算装置割当判断部１３０）の判断結果をもとに、処理性能を満たすアクセラレータを選択し、選択したアクセラレータに処理を振り分ける振分部（演算装置振分部１７０）を備えることを特徴とする。

　このようにすることにより、演算装置振分部１７０が、データごとの処理デッドラインをもとに、割り当てられたアクセラレータから、性能を満たし、消費電力を最小限とするものを選び、オフロードすることで、[要件１：データそれぞれの応答性の充足]を満たす。よって、アクセラレータ状態制御装置１００は、最適なアクセラレータを割当てるので、省電力を図ることができる。

　アクセラレータ状態制御装置１００，１００Ａ，１００Ｂ（図１～図３）において、アクセラレータを搭載した信号処理装置（サーバ２００，遠隔オフロード用サーバ２１０）間の、遠隔オフロードにおいて生じるレイテンシを計測し、記録するレイテンシ記録部（遠隔オフロードレイテンシ収集・記録部１２０）を備え、判断部（演算装置割当判断部１３０）は、レイテンシ記録部に記録されたレイテンシと記録部（演算装置性能収集・記録部１１０）に記録されたアクセラレータの性能とをもとに、処理デッドラインに対応するデータ量を求め、当該データ量をもとに性能を満たすアクセラレータを判断する。

　例えば、記録部（演算装置性能収集・記録部１１０）は、図５に示すレイテンシテーブル３１０に、アクセス元ホスト情報、アクセス先ホスト情報、レイテンシ（接続レイテンシ）を記録している。判断部（演算装置割当判断部１３０）は、条件に合うアクセラレータを選択する際に、遠隔アクセラレータについてはレイテンシテーブル３１０を参照して、事前に記録したレイテンシと、アクセラレータの性能とを比較して最適なアクセラレータを割当てる。判断部は、遠隔オフロードする際のレイテンシをもパラメータに入れて判断するので、アクセラレータの性能だけでは計れないシステム全体から見た、より最適なアクセラレータを割当てることができる。その結果、[要件２：スケール性]および[要件１：データそれぞれの応答性の充足]をより高次元で達成することができる。

　処理性能の異なる複数のアクセラレータ１２を有し、アプリケーション１の特定処理をアクセラレータ１２にオフロードして演算処理する際に、アクセラレータの状態を制御するアクセラレータ状態制御装置１００，１００Ａ，１００Ｂ（図１～図３）を備えるアクセラレータ状態制御システム１０００，１０００Ａ，１０００Ｂ（図１～図３）であって、アクセラレータ状態制御装置１００は、異なる処理デッドラインが混在するデータが入力される場合において、アクセラレータ１の性能情報を収集し、記録する記録部（演算装置性能収集・記録部１１０）と、現在と過去のトラヒック量および処理デッドラインの割合から所定時間経過後のトラヒック量および処理デッドラインを予測する予測部（トラヒック量・処理デッドライン予測部１５０）と、予測部が予測した所定時間経過後のトラヒック量と処理デッドラインと、記録部に記録されたアクセラレータの性能とをもとに、処理デッドラインに対応するデータ量を求め、データ量をもとに性能を満たすアクセラレータを判断する判断部（演算装置割当判断部１３０）と、を備える。

　このようにすることにより、処理性能の異なる複数のアクセラレータ１２を有し、アプリケーション１の特定処理をアクセラレータ１２にオフロードして演算処理する際に、アクセラレータの状態を制御するアクセラレータ状態制御装置１００，１００Ａ，１００Ｂを備えるアクセラレータ状態制御システム１０００，１０００Ａ，１０００Ｂにおいて、各処理デッドラインに対応するデータ量の変動に応じ、応答性を担保しつつ、使用する演算リソースの低減を実現することができる。

　また、上記実施形態および変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上述文書中や図面中に示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。

　また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行するためのソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、ＳＳＤ（Solid State Drive）等の記録装置、または、ＩＣ（Integrated Circuit）カード、ＳＤ（Secure Digital）カード、光ディスク等の記録媒体に保持することができる。

　１　アプリケーション（ＡＰＬ）
　１０　ハードウェア
　１１　ＣＰＵ
　１２，１２－１，１２－２，１２－３　アクセラレータ
　１３　入出力部
　１４　遠隔オフロード用入出力部
　２０　ソフトウェア
　１００，１００Ａ，１００Ｂ　アクセラレータ状態制御装置
　１１０　演算装置性能収集・記録部（記録部）
　１２０　遠隔オフロードレイテンシ収集・記録部（レイテンシ記録部）
　１３０　演算装置割当判断部
　１４０　データ処理デッドライン判別部
　１５０　トラヒック量・処理デッドライン予測部（予測部）
　１６０　関数代理実行部
　１７０　演算装置振分部（振分部）
　１８０　遠隔オフロード部
　２００　サーバ（アクセラレータ搭載サーバ）（信号処理装置）
　２１０　遠隔オフロード用サーバ（アクセラレータ搭載サーバ）（信号処理装置）
　２２０　アンテナ装置
　２２１　アンテナ装置データ入出力部
　２３０　後段処理装置
　２３１　後段処理装置データ入出力部
　１０００，１０００Ａ，１０００Ｂ　アクセラレータ状態制御システム

Claims

　処理性能の異なる複数のアクセラレータを有し、アプリケーションの特定処理をアクセラレータにオフロードして演算処理する際に、アクセラレータの状態を制御するアクセラレータ状態制御装置であって、
　異なる処理デッドラインが混在するデータが入力される場合において、
　前記アクセラレータの性能情報を収集し、記録する記録部と、
　現在と過去のトラヒック量と処理デッドラインの割合から所定時間経過後のトラヒック量および処理デッドラインを予測する予測部と、
　前記予測部が予測した所定時間経過後の前記トラヒック量および前記処理デッドラインと、前記記録部に記録された前記アクセラレータの性能とをもとに、前記処理デッドラインに対応するデータ量を求め、当該データ量をもとに性能を満たすアクセラレータを判断する判断部と、を備える
　ことを特徴とするアクセラレータ状態制御装置。
　入力データの処理デッドラインを識別して通知するデータ処理デッドライン判別部と、
　前記データ処理デッドライン判別部が判別した入力データの前記処理デッドラインと、前記判断部の判断結果をもとに、処理性能を満たすアクセラレータを選択し、選択したアクセラレータに処理を振り分ける振分部と、を備える
　ことを特徴とする請求項１に記載のアクセラレータ状態制御装置。
　前記アクセラレータを搭載した信号処理装置間の、遠隔オフロードにおいて生じるレイテンシを収集し、記録するレイテンシ記録部を備え、
　前記判断部は、前記レイテンシ記録部に記録されたレイテンシと前記記録部に記録された前記アクセラレータの性能とをもとに、前記処理デッドラインに対応するデータ量を求め、当該データ量をもとに性能を満たすアクセラレータを判断する
　ことを特徴とする請求項１に記載のアクセラレータ状態制御装置。
　処理性能の異なる複数のアクセラレータを有し、アプリケーションの特定処理をアクセラレータにオフロードして演算処理する際に、前記アクセラレータの状態を制御するアクセラレータ状態制御装置を備えるアクセラレータ状態制御システムであって、
　前記アクセラレータ状態制御装置は、
　異なる処理デッドラインが混在するデータが入力される場合において、
　前記アクセラレータの性能情報を収集し、記録する記録部と、
　現在と過去のトラヒック量と処理デッドラインの割合から所定時間経過後のトラヒック量および処理デッドラインを予測する予測部と、
　前記予測部が予測した所定時間経過後の前記トラヒック量および前記処理デッドラインと、前記記録部に記録されたアクセラレータの性能とをもとに、前記処理デッドラインに対応するデータ量を求め、当該データ量をもとに性能を満たすアクセラレータを判断する判断部と、を備える
　ことを特徴とするアクセラレータ状態制御システム。
　処理性能の異なる複数のアクセラレータを有し、アプリケーションの特定処理をアクセラレータにオフロードして演算処理する際に、アクセラレータの状態を制御するアクセラレータ状態制御装置のアクセラレータ状態制御方法であって、
　前記アクセラレータ状態制御装置は、
　異なる処理デッドラインが混在するデータが入力される場合において、
　アクセラレータの性能情報を収集し、記録するステップと、
　現在と過去のトラヒック量と処理デッドラインの割合から所定時間経過後のトラヒック量および処理デッドラインを予測するステップと、
　予測した所定時間経過後のトラヒック量および処理デッドラインと、記録された前記アクセラレータの性能とをもとに、処理デッドラインに対応するデータ量を求め、当該データ量をもとに性能を満たす前記アクセラレータを判断するステップと、を実行する
　ことを特徴とするアクセラレータ状態制御方法。
　処理性能の異なる複数のアクセラレータを有し、アプリケーションの特定処理をアクセラレータにオフロードして演算処理する際に、前記アクセラレータの状態を制御するアクセラレータ状態制御装置を備えるアクセラレータ状態制御システムのアクセラレータ状態制御方法であって、
　前記アクセラレータ状態制御装置は、
　異なる処理デッドラインが混在するデータが入力される場合において、
　アクセラレータの性能情報を収集し、記録するステップと、
　現在と過去のトラヒック量と処理デッドラインの割合から所定時間経過後のトラヒック量および処理デッドラインを予測するステップと、
　予測した所定時間経過後の前記トラヒック量および前記処理デッドラインと、記録された前記アクセラレータの性能とをもとに、処理デッドラインに対応するデータ量を求め、当該データ量をもとに性能を満たすアクセラレータを判断するステップと、を実行する
　ことを特徴とするアクセラレータ状態制御方法。
　処理性能の異なる複数のアクセラレータを有し、アプリケーションの特定処理をアクセラレータにオフロードして演算処理する際に、前記アクセラレータの状態を制御するアクセラレータ状態制御装置としてコンピュータに、
　異なる処理デッドラインが混在するデータが入力される場合において、
　アクセラレータの性能情報を収集し、記録する手順、
　現在と過去のトラヒック量と処理デッドラインの割合から所定時間経過後のトラヒック量および処理デッドラインを予測する手順、
　予測した所定時間経過後の前記トラヒック量および前記処理デッドラインと、記録された前記アクセラレータの性能とをもとに、処理デッドラインに対応するデータ量を求め、当該データ量をもとに性能を満たすアクセラレータを判断する手順、
　を実行させるためのプログラム。