WO2022009542A1

WO2022009542A1 - 情報処理装置、情報処理方法及びプログラム

Info

Publication number: WO2022009542A1
Application number: PCT/JP2021/019553
Authority: WO
Inventors: 正樹高橋; 洋平中田; 育規石井; 智行奥野
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2020-07-10
Filing date: 2021-05-24
Publication date: 2022-01-13
Also published as: EP4180954A1; US20230133989A1; CN115989481A; JPWO2022009542A1; EP4180954A4

Abstract

情報処理装置は、センシングデータを取得する取得部（１５０）と、センシングデータを推論モデルに入力して、推論結果及び推論モデルの処理の複数の後続のタスクの処理時間に関する情報を取得する共通ＮＮ（１２１）と、複数の後続のタスクの処理時間に関する情報に基づいて、複数の後続のタスクを処理するタスク処理部の複数の後続のタスクを処理するためのタスクスケジュールを決定し、タスク処理部に推論結果を入力して、決定したタスクスケジュールで複数の後続のタスクを処理させるＮＮ推論演算管理部（１３０）とを備える。

Description

情報処理装置、情報処理方法及びプログラム

　本開示は、情報処理装置、情報処理方法及びプログラムに関する。

　近年、ニューラルネットワーク（以下、ＮＮ）を採用した推論モデル（以下、ＮＮ推論モデル又は単にＮＮとも称する。）を搭載した種々の装置が提案されている。例えば、一般的に安価、低電力稼働が求められ、それに伴い計算能力も制限されるＩｏＴ（Ｉｎｔｅｒｎｅｔ　ｏｆ　Ｔｈｉｎｇｓ）機器にＮＮ推論モデルを搭載することが提案されている。例えば、特許文献１には、ＮＮ推論モデルのレイヤごとに要求される精度、計算量などに応じた駆動周波数でＮＮ推論モデルに推論を実行させることにより、高い精度を維持しつつ装置全体での消費電力を低減することができるＮＮ装置等が開示されている。

特開２０１８－００５２９７号公報

　しかし、特許文献１には、単一の推論モデルの推論処理についての技術しか開示されていない。

　そこで、本開示は、限られた計算環境下においても複数の推論モデルを用いた推論処理が可能な情報処理装置、情報処理方法及びプログラムを提供する。

　本開示の一態様に係る情報処理装置は、センシングデータを取得する取得部と、前記センシングデータを推論モデルに入力して、推論結果及び推論モデルの処理の複数の後続のタスクの処理時間に関する情報を取得する推論処理部と、前記複数の後続のタスクの処理時間に関する情報に基づいて、前記複数の後続のタスクを処理するタスク処理部の前記複数の後続のタスクを処理するためのタスクスケジュールを決定する決定部と、前記タスク処理部に推論結果を入力して、決定した前記タスクスケジュールで前記複数の後続のタスクを処理させる制御部と、を備える。

　本開示の一態様に係る情報処理方法は、コンピュータにより実行される方法であって、センシングデータを取得し、前記センシングデータを推論モデルに入力して、推論結果及び推論モデルの処理の複数の後続のタスクの処理時間に関する情報を取得し、前記複数の後続のタスクを処理するタスク処理部に前記推論結果を入力して、前記複数の後続のタスクを処理させ、前記推論結果を前記タスク処理部に入力してから前記複数の後続のタスクの処理が終了するまでの時間を含む推論時間を測定し、前記センシングデータを入力データとし、前記複数の後続のタスクの処理時間に関する情報を出力データとし、測定した前記推論時間をリファレンスデータとして用いた機械学習により前記推論モデルを訓練する。

　本開示の一態様に係るプログラムは、上記の情報処理方法をコンピュータに実行させるためのプログラムである。

　本開示の一態様によれば、限られた計算環境下においても複数の推論モデルを用いた推論処理が可能な情報処理装置等を実現することができる。

図１は、実施の形態に係る情報処理システムの機能構成を示すブロック図である。図２は、実施の形態に係る推論処理部の機能構成を示すブロック図である。図３は、実施の形態に係る遅延フラグ情報と、当該遅延フラグ情報に紐づいた特化ＮＮ群の順伝播演算手法とを含むテーブルの構成例を示す図である。図４は、実施の形態に係るＳｏＣの構成を示す模式図である。図５は、実施の形態に係る機器の動作を示すフローチャートである。図６Ａは、実施の形態に係る共通ＮＮ及び特化ＮＮ群の処理時間及び演算担当ユニットの一例を示す模式図である。図６Ｂは、実施の形態に係る共通ＮＮ及び特化ＮＮ群の処理時間及び演算担当ユニットの他の一例を示す模式図である。図６Ｃは、実施の形態に係る共通ＮＮ及び特化ＮＮ群の演算順序組み換え後の処理時間及び演算担当ユニットの一例を示す模式図である。図７は、実施の形態に係るマルチタスク訓練部の動作を示すフローチャートである。図８は、実施の形態に係るマルチタスク訓練部の動作を模式的に示す図である。図９は、実施の形態に係る遅延フラグ情報測定部及び遅延フラグ正解ラベル生成部の動作を示すフローチャートである。図１０は、実施の形態に係る遅延フラグ情報測定部及び遅延フラグ正解ラベル生成部の動作を模式的に示す図である。図１１は、実施の形態に係る遅延フラグ訓練部の動作を示すフローチャートである。図１２は、実施の形態に係る遅延フラグ訓練部の動作を模式的に示す図である。図１３は、実施の形態に係る遅延フラグ情報の発生率を示すテーブルである。

　（本開示の基礎となった知見）
　本開示の実施の形態の説明に先立ち、本開示の基礎に至った経緯について説明する。

　本開示は、機械学習を用いて生成される推論モデルを搭載した装置（以下、推論装置）に関する。より詳しくは、演算順序変更によるサービス品質維持を可能にするＮＮ型の推論装置、及び、そのための訓練処理に関する。

　近年、推論装置のうちの物体検出装置、分類装置などでは、ディープラーニング技術の採用により、飛躍的に性能が向上し、研究又は商品化が多数行われている。また、スマートフォン又は運転手の代わりに機械が運転する自動運転車（ロボットカー）においても、カメラ装置、赤外線アレイセンサ等から転送される画像に対する推論装置は、要素機能の１つである。物体とは、自動運転車の場合は、例えば、歩行者、乗用車、道路標識、建物、道路の領域等を示す。

　また、ＩｏＴ（Ｉｎｔｅｒｎｅｔ　ｏｆ　Ｔｈｉｎｇｓ）機器にＮＮ推論モデルを搭載させ、常にクラウドに判定させるのではなく、ＩｏＴ機器自体の判定によって機器が動作する、エッジＡＩ（Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ）の分野が最近普及し始めている。例えば、ＩｏＴ機器を含む様々な工業製品の分野において、当該工業製品にＮＮ型の推論装置を搭載し、その推論結果に基づき、サービスを実施する製品が市場に投入されている。ちなみに、ＩｏＴ機器は、一般的に安価、低電力稼働が求められ、それに伴い計算能力も制限される。

　ＩｏＴ機器は、省電力が求められる。そのようなＩｏＴ機器において、複数のＮＮ推論モデルを使用するサービスを行う場合、複数のＮＮ推論モデルを並列に推論するための演算を行わなければ、要求される処理時間内にサービスを完了することが困難である。このように、例えば、ＩｏＴ機器においては、並列に設けられた複数のＮＮ推論モデルを用いて、推論のための演算を行うことが想定される。なお、要求される処理時間を、許容時間とも記載する。

　また、ＮＰＵ（Ｎｅｕｒａｌ　ｎｅｔｗｏｒｋ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）と呼ばれるＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）、ＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）などで実装されたＮＮ処理専用回路がＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）とは別にＩｏＴ機器に搭載され始めている。しかしながら、ＩｏＴ機器に要求されるサービスが、上記のように複数のＮＮの推論処理を利用するようになってきており、当該サービスのための処理量が増える傾向にある。

　また、ＩｏＴ機器は、要求される処理時間内にサービスを完了することに加えて、省電力であることが求められる。そのため、ＩｏＴ機器では、入力画像によっては、要求される処理時間内に推論処理を完了できないという課題が発生しやすい。

　なお、複数のＮＮ推論モデルを使用するサービスとは、例えば、シーン画像に存在する対象人物が右手に「何か」を持っていることを骨格検出用ＮＮ推論モデルの推論処理によって判定し、かつ、その「何か」がスマートフォンであることを物体検出用ＮＮ推論モデルの推論処理によって判定する処理などが一例として挙げられる。

　上記の特許文献１は、単一のＮＮ推論モデルの推論処理を使用するサービスを想定した方式であり、複数のＮＮ推論モデルの推論処理を使用するサービスにおける、処理時間の担保に関する方式については開示されていない。また、従来では、初期段階で複数の推論モデルの推論処理に必要な処理時間を推定して、要求される処理時間内で最適な演算順序で推論処理を行う処理に関する設計及び技術的な解決策に関して検討はされておらず、特許文献１においてもそのようなことは開示されていない。

　そこで、複数のＮＮ推論モデルの推論処理を使用するサービスにおいて、要求される処理時間内で推論処理を行い得る情報処理装置等について鋭意検討を行い、以下に説明する情報処理方法等を創案した。

　これにより、情報処理装置は、センシングデータに対する複数の後続のタスクの処理時間に関する情報に基づいて、複数の後続のタスクを処理するタスク処理部（例えば、複数のＮＮ推論モデル）のタスクスケジュールを決定することができる。情報処理装置は、複数の後続のタスクの処理時間に関する情報に基づいて、タスク処理部の処理時間を要求される処理時間内となるようにタスクスケジュールを決定することで、限られた計算環境下においても複数の推論モデルを用いた推論処理が可能となる。

　また、例えば、前記推論モデルは、第１推論モデルと、第２推論モデルとを含み前記センシングデータを前記第１推論モデルに入力して前記推論結果を取得し、取得された前記推論結果又は前記推論の中間データを前記第２推論モデルに入力して前記複数の後続のタスクの処理時間に関する情報を取得してもよい。

　これにより、センシングデータを第２推論モデルに入力する場合に比べて、第２推論モデルの計算量を小さくすることができる。よって、第２推論モデルにおける処理時間を短くすることが可能である。また、推論結果が入力される場合は、第２推論モデルの入力が後続のタスク処理部の入力と同一であるため、後続のタスク処理部の処理時間に関する情報の正確性又は精度の向上が見込まれる。推論の中間データが入力される場合は、第１推論モデルの推論終了前に第２推論モデルの処理を開始することができるため、第２推論モデルの処理時間をより短くすることができる。

　また、例えば、前記推論モデルは、第１推論モデルと、第２推論モデルとを含み、前記センシングデータを前記第１推論モデルに入力して前記推論結果を取得し、前記センシングデータを前記第２推論モデルに入力して前記複数の後続のタスクの処理時間に関する情報を取得してもよい。

　これにより、第１推論モデルから推論結果が出力されることを待つことなく、センシングデータを用いて第２推論モデルに処理を開始させることができる。つまり、第２推論モデルの処理の開始タイミングを早めることが可能となる。

　また、例えば、前記複数の後続のタスクの処理時間に関する情報は、前記複数の後続のタスクの処理時間に対して定められる所定時間に対する遅延に関する情報を含んでもよい。

　これにより、遅延に関する情報に基づいてタスク処理部のタスクスケジュールを決定することができる。情報処理装置は、複数の後続のタスクの遅延に関する情報に基づいて、タスク処理部の処理時間を要求される処理時間内となるようにタスクスケジュールを決定することで、複数の推論モデルの推論処理を使用するサービスにおいて、要求される処理時間内で推論処理を行い得る確実性が増す。

　また、例えば、前記遅延に関する情報に、前記遅延が所定未満であることを示す情報が含まれる場合、第１のスケジュールを決定し、前記遅延に関する情報に、前記遅延が所定以上であることを示す情報が含まれる場合、前記第１のスケジュールより前記複数の後続のタスクの処理時間が短い第２のスケジュールを決定してもよい。

　これにより、遅延が所定以上である場合に、処理時間が短くなる第２のスケジュールが決定されるので、要求される処理時間内で推論処理を行い得る確実性が増す。

　また、例えば、前記第１のスケジュールの決定には、第１ルールを用い、前記第２のスケジュールの決定には、前記第２のスケジュールが前記第１のスケジュールよりも前記複数の後続のタスクの処理時間が短くなる第２ルールを用いてもよい。

　これにより、第１及び第２ルールに基づいてスケジュールが決定されることにより、スケジュールを動的に探索するよりも計算量及び計算時間を低減することができる。

　また、例えば、前記推論モデルは、前記複数の後続のタスクに共通する前処理である推論処理を実行してもよい。

　これにより、各タスクに共通する前処理のための推論モデルを使用することによって、各タスク処理に必要な推論処理の全体計算量及びメモリ使用量を圧縮することができる。

　また、例えば、前記推論モデル及び前記タスク処理部は、ニューラルネットワークモデルであり、前記推論結果は、前記センシングデータの特徴量であり、前記タスクスケジュールは、前記タスク処理部のメモリロード及び処理の順序を含んでもよい。

　これにより、高性能なＮＮ推論モデルをＩｏＴ機器などの限られた計算環境下において適用することができる。また、センシングデータの特徴量に基づいて後続のタスクの処理時間が推論されるため、センシングデータに対するタスク処理の難易度に応じた処理時間が推論されやすくなる。

　また、コンピュータにより実行される方法であって、センシングデータを取得し、前記センシングデータを推論モデルに入力して、推論結果及び推論モデルの処理の複数の後続のタスクの処理時間に関する情報を取得し、前記複数の後続のタスクを処理するタスク処理部に前記推論結果を入力して、前記複数の後続のタスクを処理させ、前記推論結果を前記タスク処理部に入力してから前記複数の後続のタスクの処理が終了するまでの時間を含む推論時間を測定し、前記センシングデータを入力データとし、前記複数の後続のタスクの処理時間に関する情報を出力データとし、測定した前記推論時間をリファレンスデータとして用いた機械学習により前記推論モデルを訓練する。また、プログラムは、上記の情報処理方法をコンピュータに実行させるためのプログラムである。

　これにより、上記情報処理装置において実行される処理を実現する推論モデルを生成することができる。生成された推論モデルを用いて推論処理が行われることで、複数の後続のタスクの処理時間に関する情報に基づいて、タスク処理部の処理時間を要求される処理時間内となるようにタスクスケジュールを決定することが可能となる。

　さらに、これらの包括的又は具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、又は、コンピュータ読み取り可能なＣＤ－ＲＯＭなどの非一時的な記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラム、及び、記録媒体の任意な組み合わせで実現されてもよい。

　以下、本開示の一態様に係る情報処理装置等の具体例について、図面を参照しながら説明する。ここで示す実施の形態は、いずれも本開示の一具体例を示すものである。従って、以下の実施の形態で示される数値、数値、構成要素、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また全ての実施の形態において、各々の内容を組み合わせることもできる。

　また、各図は、模式図であり、必ずしも厳密に図示されたものではない。したがって、例えば、各図において縮尺などは必ずしも一致しない。また、各図において、実質的に同一の構成については同一の符号を付しており、重複する説明は省略又は簡略化する。

　また、本明細書において、同じ、一致などの要素間の関係性を示す用語、並びに、数値、および、数値範囲は、厳格な意味のみを表す表現ではなく、実質的に同等な範囲、例えば数％程度の差異をも含むことを意味する表現である。

　（実施の形態）
　以下、本実施の形態に係る情報処理システム等について、図１～図１３を参照しながら説明する。

　［１.情報処理システムの構成］
　まずは、本実施の形態に係る情報処理システム１０の構成について、図１～図４を参照しながら説明する。図１は、本実施の形態に係る情報処理システム１０の機能構成を示すブロック図である。図２は、本実施の形態に係る推論処理部１１０の機能構成を示すブロック図である。

　図１に示すように、情報処理システム１０は、機器１００と、カメラ２００と、訓練装置３００とを備える。機器１００は、カメラ２００からの入力画像に対して推論処理を行い、推論結果に応じたサービスを行う。訓練装置３００は、機器１００で推論処理を行うためのＮＮデータ４００を生成する。以下、各構成要素について、説明する。

　機器１００は、例えば、ＩｏＴ機器であり、カメラ２００から取得した入力画像に基づいて、複数のサービスを提供する機能を有する。機器１００は、推論処理部１１０と、タスク実行部１４０とを有する。カメラ２００から取得する入力画像は、センシングデータの一例である。

　推論処理部１１０は、訓練装置３００により生成されたＮＮデータ４００を用いて、カメラ２００から入力される入力画像に対して推論処理を行う。推論処理部１１０は、並列に設けられた複数のＮＮを用いて推論処理を行う。言い換えると、ＮＮデータ４００は、並列に設けられた複数のＮＮを含んで構成される。なお、ＮＮデータ４００は、例えば、ＮＮのレイヤ構成、重み及びバイアスを格納したデータである。

　図２に示すように、ＮＮデータ４００は、共通ＮＮ１２１と、特化ＮＮ群１２４とを含んで構成される。共通ＮＮ１２１は、ＮＮデータ４００における前処理用のＮＮであり、特化ＮＮ群１２４は、ＮＮデータ４００における後続の処理用のＮＮ群である。

　機器１００での推論処理に要する時間は、入力画像に応じて変化することがある。そのため、入力画像によっては、推論処理に時間を要し、機器１００に要求される処理時間内にサービスを行えないことが起こり得る。そこで、推論処理部１１０は、前処理用のＮＮを用いて入力画像に対する後続の推論処理の時間に関する推論結果を取得し、取得した推論結果に基づいて、後続の推論処理の順序（タスクスケジュールの一例）等を変更する。以下、推論処理部１１０等の構成について説明する。

　推論処理部１１０は、ＮＮ推論部１２０と、ＮＮ推論演算管理部１３０と、取得部１５０とを有する。なお、推論処理部１１０は、演算順序を変更可能な推論処理装置である。推論処理部１１０は、演算順序可変推論装置であるとも言える。また、推論処理部１１０は、情報処理装置の一例である。

　ＮＮ推論部１２０は、訓練装置３００により生成されたＮＮデータ４００に基づく複数のＮＮを用いて、カメラ２００から入力される入力画像に対して推論処理を行う。

　ＮＮ推論部１２０は、共通ＮＮ１２１と、並列に設けられた複数のＮＮを含む特化ＮＮ群１２４とを用いて推論処理を行う。ＮＮ推論部１２０は、まず共通ＮＮ１２１を使用して、順伝播演算処理を行う。共通ＮＮ１２１は、例えば、順伝播型のＮＮである。

　共通ＮＮ１２１は、特化ＮＮ群１２４の複数のＮＮに共通する推論処理結果、及び、遅延フラグ情報を出力するＮＮである。共通ＮＮ１２１は、各タスクに共通する前処理である推論処理を実行する。共通ＮＮ１２１は、各タスクに共通する前処理として実行されるモデルであるとも言える。共通ＮＮ１２１は、特徴分類部１２２と、遅延フラグ分類部１２３とを含む。特徴分類部１２２と、遅延フラグ分類部１２３とは、例えば、訓練済みＮＮである。なお、共通ＮＮ１２１は、推論処理部の一例である。また、前処理である推論処理は、ＮＮを用いた処理に限定されない。

　ＮＮ推論部１２０は、共通ＮＮ１２１の特徴分類部１２２に入力画像が入力することで、特徴分類部１２２の出力である推論処理結果を取得する。推論処理結果（推論結果）は、例えば、特徴量（画像特徴量）であるがこれに限定されない。以下では、推論処理結果が特徴量である例について説明する。

　特徴分類部１２２は、入力画像を入力とし、当該入力画像に応じた特徴量を出力するように訓練された訓練済みのＮＮ（特徴分類用のＮＮ）である。特徴分類部１２２は、順伝播演算処理される特化ＮＮ群１２４の複数のＮＮのそれぞれに共通の推論処理を行う。特徴量は、特化ＮＮ群１２４の複数のＮＮのそれぞれに共通の情報である。

　ＮＮ推論部１２０は、特徴分類部１２２の出力である特徴量を、特化ＮＮ群１２４の複数のＮＮのそれぞれに出力する。また、本実施の形態では、ＮＮ推論部１２０は、遅延フラグ分類部１２３にも特徴量を出力する。このように、特徴分類部１２２の出力である特徴量は、遅延フラグ分類部１２３で利用されてもよい。本実施の形態では、遅延フラグ分類部１２３と、特化ＮＮ群１２４の複数のＮＮのそれぞれとに、同一の特徴量が入力される。

　ＮＮ推論部１２０は、特徴分類部１２２から特徴量を遅延フラグ分類部１２３に入力することで、遅延フラグ分類部１２３の出力である遅延フラグ情報を取得する。遅延フラグ分類部１２３は、特徴量を入力とし、当該特徴量に応じた遅延フラグ情報を出力するように訓練された訓練済みのＮＮ（遅延フラグ分類用のＮＮ）である。遅延フラグ情報は、特徴量（推論結果）を特化ＮＮ群１２４（タスク処理部又はその一部）に入力してから複数の後続のタスクの処理が終了するまでの時間を含む時間（推論時間）を示す情報である。例えば、遅延フラグ情報は、ＮＮ推論部１２０全体の推論処理時間が閾値を超えるか否かの推論結果を示す情報である。遅延フラグ情報は、所定時間（例えば、閾値）に対する遅延に関する情報であるとも言える。所定時間は、複数の後続のタスクの処理時間に対して定められる時間である。閾値は、例えば、機器１００又は機器１００のサービス内容に要求される処理時間に基づいて設定されてもよい。また、閾値は、予め設定される。なお、遅延フラグ情報は、例えば、機器１００全体の処理時間が閾値を超えるか否かの推論結果を示す情報であってもよい。遅延フラグ情報は、例えば、ＮＮ推論部１２０及びタスク実行部１４０の合計の処理時間が閾値を超えるか否かの推論結果を示す情報であってもよい。

　遅延フラグ情報は、例えば、推論処理時間が閾値以下である場合は「ＯＦＦ」を示す情報であり、推論処理時間が閾値を超える場合は「ＯＮ」を示す情報であってもよい。また、「ＯＮ」は、複数設定されてもよい。遅延フラグ情報は、例えば、推論処理時間が第１閾値を超え、かつ第１閾値より大きい第２閾値以下である場合は「ＯＮ１」を示す情報であり、推論処理時間が第２閾値を超える場合は「ＯＮ２」を示す情報であってもよい。第１閾値は、例えば１０ｍｓｅｃであり、第２閾値は、例えば、１５ｍｓｅｃであるがこれに限定されない。遅延フラグ情報は、複数の後続のタスクの処理時間に関する情報の一例である。複数の後続のタスクの処理時間は、例えば、特化ＮＮ群１２４の処理時間であってもよいし、特化ＮＮ群１２４及びタスク実行部１４０の合計の処理時間であってもよい。この場合は、特化ＮＮ群１２４及びタスク実行部１４０がタスク処理部の一例となる。

　本実施の形態では、遅延フラグ情報は、「ＯＦＦ」、「ＯＮ１」及び「ＯＮ２」の３つレベルが設定されている例について説明する。なお、遅延フラグ情報は、２つ又は４つ以上のレベルが設定されていてもよい。

　なお、遅延フラグ情報は、「ＯＦＦ」、「ＯＮ１」及び「ＯＮ２」などの遅延のレベルを示す情報であることに限定されず、例えば、処理時間（演算時間）そのものであってもよい。

　なお、遅延フラグ分類部１２３は、遅延フラグ情報を早く出力することが望まれる。よって、遅延フラグ分類部１２３は、特徴分類部１２２及び特化ＮＮ群１２４より計算量が小さいＮＮであるとよい。

　上記のように構成された共通ＮＮ１２１は、カメラ２００から入力画像が入力されると、特徴量及び遅延フラグ情報を出力する論理モデルの一例である。また、特徴分類部１２２は、第１推論モデルの一例であり、遅延フラグ分類部１２３は、第２推論モデルの一例である。つまり、推論モデルは、第１推論モデル及び第２推論モデルを含んで構成される。

　ＮＮ推論演算管理部１３０は、遅延フラグ分類部１２３からの遅延フラグ情報に基づいて、共通ＮＮ１２１の後続の特化ＮＮ群１２４の複数のタスクを処理するための順伝播演算の手法（例えば、演算順序）を決定し、特化ＮＮ群１２４に通知する。具体的には、ＮＮ推論演算管理部１３０は、特化ＮＮ群１２４の処理を制御するＮＮ推論部１２０に決定された順伝播演算の手法を通知する。これにより、ＮＮ推論部１２０は、特化ＮＮ群１２４に特徴分類部１２２からの特徴量を入力して、決定された順伝播演算の手法で複数の後続のＮＮを処理させることができる。ＮＮ推論演算管理部１３０は、順伝播演算の手法を決定する決定部、及び、後段のタスクを処理させる制御部の一例である。

　本実施の形態では、ＮＮ推論演算管理部１３０は、遅延フラグ情報と、図３に示すテーブル５００とに基づいて、共通ＮＮ１２１の後続の順伝播演算の手法を決定する。図３は、本実施の形態に係る遅延フラグ情報と、当該遅延フラグ情報に紐づいた特化ＮＮ群１２４の順伝播演算の手法とを含むテーブル５００の構成例を示す図である。図３の並列演算項目は、共通ＮＮ１２１の後続の順伝播演算の手法、例えば特化ＮＮ群１２４の順伝播演算の手法を示す。

　図３に示すように、遅延フラグ情報「ＯＦＦ」には、並列演算項目「最適並列演算処理」が対応付けられており（図３の第１行５０１を参照）、遅延フラグ情報「ＯＮ１」には、並列演算項目「遅延対処並列演算処理」が対応付けられており（図３の第２行５０２を参照）、遅延フラグ情報「ＯＮ２」には、並列演算項目「遅延対処並列演算処理＋ＣＰＵクロックアップ処理」が対応付けられている（図３の第３行５０３を参照）。なお、ここでの「ＯＮ」は、ＮＮ推論部１２０の演算時間が許容時間を超えており、「最適並列演算処理」が示す演算順序から演算順序を変更する必要があることを意味する。なお、順伝順序は、タスクスケジュールの一例である。

　「最適並列演算処理」は、メモリアクセス数、処理時間（演算時間）、消費電力などに基づいて決定された並列演算方式（例えば、並列演算順序）に従って、演算処理を行うことを示す。例えば、遅延が所定未満（例えば、遅延が閾値未満）である場合、「最適並列演算処理」を用いて順伝播演算の順序（第１のスケジュールの一例）が決定される。なお、「最適並列演算処理」は、第１ルールの一例である。遅延が所定未満とは、遅延がないこと、又は、遅延長若しくは遅延度が所定未満であることを含む。

　「遅延対処並列演算処理」は、「最適並列演算処理」に比べて処理時間が短くなるように決定された並列演算方式に従って、演算処理を行うことを示す。例えば、遅延が所定以上（例えば、遅延が閾値以上）である場合、「遅延対処並列演算処理」を用いて順伝播演算の順序（第２のスケジュールの一例）が決定される。当該並列演算方式は、例えば、入力画像に検出候補領域の数に応じて処理時間が変化する処理（例えば、ＮＭＳ（Ｎｏｎ－Ｍａｘｉｍｕｍ　Ｓｕｐｒｅｓｓｉｏｎ）処理）を優先的に開始するように演算順序を組み替えた方式であるが、これに限定されない。なお、「遅延対処並列演算処理」は、複数の後続のタスクの処理時間が第１のルールより短くなる第２ルールの一例である。また、遅延が所定以上とは、遅延があること、又は、遅延長若しくは遅延度が所定以上であることを含む。

　なお、ＮＭＳは、ある検出領域候補と、それよりも得点の高い検出領域候補との重なり度合（ＩｏＵ値）が、訓練処理によって設定された閾値を超えるなら、その検出領域候補を削除するアルゴリズムである。

　「遅延対処並列演算処理＋ＣＰＵクロックアップ処理」は、「遅延対処並列演算処理」に加えて、ＣＰＵ（例えば、後述する図４に示すＣＰＵ６０２）の駆動周波数の設定を上げることを示す。このように、遅延フラグ情報には、並列演算の演算順序の変更以外に、ＣＰＵの駆動周波数の設定に関することが含まれていてもよい。つまり、遅延対策を行うことは、並列演算の変更に限定されるものではなく、並列演算の変更とともに、又は並列演算の変更に代えて、機器１００が備える各処理部の設定（例えば、駆動周波数の設定）を変更することを含んでいてもよい。

　なお、「最適並列演算処理」が示す演算順序、及び、「遅延対処並列演算処理」が示す演算順序は、予め設定されており、メモリ６０５などに記憶されている。

　このように、遅延フラグ情報は、遅延フラグ「ＯＮ１」及び「ＯＮ２」のように、複数の種類が存在してもよい。例えば、遅延フラグ情報は、後述する遅延フラグ情報測定部３０２による処理時間の測定結果に応じて、複数の種類が存在してもよい。

　特化ＮＮ群１２４は、特徴分類部１２２からの特徴量に基づいて、複数のＮＮのそれぞれが、互いに異なる出力を行う複数のＮＮを含む。本実施の形態では、特化ＮＮ群１２４は、第１タスク用ＮＮ１２５と、第２タスク用ＮＮ１２６とを含む。以下では、第１タスク用ＮＮ１２５が物体検出用ＮＮであり、第２タスク用ＮＮ１２６が骨格検出用ＮＮである例について説明するが、これに限定されない。また、第１タスク用ＮＮ１２５は、ＮＭＳ処理を含み、第２タスク用ＮＮ１２６は、ＮＭＳ処理を含まない例について説明するが、これに限定されない。なお、特化ＮＮ群１２４（特化ＮＮ群１２４を用いて処理を行うＮＮ推論部１２０）は、タスク処理部の一例である。タスク処理部が特化ＮＮ群１２４を含んで構成される場合、推論モデル及びタスク処理部のそれぞれは、ＮＮモデルである。

　第１タスク用ＮＮ１２５は、特徴分類部１２２からの特徴量を入力とし、当該特徴量に応じた物体検出の推論結果を出力するように訓練された訓練済みＮＮである。第１タスク用ＮＮ１２５の出力である推論結果は、第１タスク用ＮＮ１２５に対応するタスク実行部１４０に出力される。

　第２タスク用ＮＮ１２６は、特徴分類部１２２からの特徴量を入力とし、当該特徴量に応じた骨格検出の推論結果を出力するように訓練された訓練済みＮＮである。第２タスク用ＮＮ１２６の出力である推論結果は、第２タスク用ＮＮ１２６に対応するタスク実行部１４０に出力される。

　なお、物体検出及び骨格検出は、複数の後続のタスクの一例である。

　遅延フラグ分類部１２３が「ＯＮ１」又は「ＯＮ２」を含む遅延フラグ情報を出力した場合、第１タスク用ＮＮ１２５及び第２タスク用ＮＮ１２６の演算順序が遅延フラグ情報「ＯＦＦ」のときから変更される。本実施の形態では、少なくともＮＭＳ処理を含む第１タスク用ＮＮ１２５における演算順序が遅延フラグ情報「ＯＦＦ」のときから変更される。

　ＮＮ推論演算管理部１３０は、例えば、遅延フラグ情報とテーブル５００とに基づいて決定された並列演算項目（並列演算方式）に従って、特化ＮＮ群１２４の順伝播演算を行うようにＮＮ推論部１２０に指示する。これにより、ＮＮ推論演算管理部１３０は、入力画像に対する推論処理の時間に関する推論結果（遅延フラグ情報）に応じて演算順序を変更することができるので、処理時間が長くなることを抑制することができる。

　取得部１５０は、カメラ２００から入力画像を取得する。取得部１５０は、取得した入力画像をＮＮ推論部１２０に出力する。

　続いて、タスク実行部１４０は、ＮＮ推論部１２０の推論結果に基づいて、予め設定されたタスクを実行する。タスク実行部１４０は、例えば、推論結果を表示する表示部であってもよいし、推論結果に応じた発光を行う発光部であってもよいし、推論結果を外部の機器に送信する送信部であってもよい。

　図４は、本実施の形態に係る機器１００のＳｏＣ（Ｓｙｓｔｅｍ－ｏｎ－ａ－Ｃｈｉｐ）６０１の構成を示す模式図である。本実施の形態では、ＮＰＵが搭載されている。

　図４に示すように、ＳｏＣ６０１は、ＣＰＵ６０２と、第１ＮＰＵ６０３と、第２ＮＰＵ６０４と、メモリ６０５とを含んで構成される。ＮＮ推論部１２０の各機能は、訓練済みのＮＮ（ＮＮデータ４００）をＳｏＣ６０１に実装することで実現される。

　ＣＰＵ６０２は、機器１００における各処理を実行する処理部である。ＣＰＵ６０２は、ＮＭＳ処理、タスク実行部１４０の処理などを実行する。

　第１ＮＰＵ６０３及び第２ＮＰＵ６０４は、ＮＮ処理を行う専用回路である。第１ＮＰＵ６０３及び第２ＮＰＵ６０４は、機器１００におけるＮＮ処理を実行する。第１ＮＰＵ６０３及び第２ＮＰＵ６０４は、例えば、共通ＮＮ１２１を用いた処理と、特化ＮＮ群１２４を用いた処理とを実行する。本実施の形態では、第１ＮＰＵ６０３及び第２ＮＰＵ６０４は、骨格検出処理、物体検出処理及び遅延ラベル決定処理を実行する。

　メモリ６０５は、ＣＰＵ６０２、第１ＮＰＵ６０３及び第２ＮＰＵ６０４のそれぞれが実行するプログラムを記憶する。メモリ６０５は、ＮＮデータ４００を記憶する。

　上記のように、推論処理部１１０は、入力画像を取得し、入力画像が共通ＮＮ１２１に入力されると特徴量及び遅延ラベル情報を出力し、遅延ラベル情報に基づいて、特化ＮＮ群１２４を処理するための順伝播演算の手法（最適並列演算処理、遅延対象並列演算処理など）を決定し、特化ＮＮ群１２４に特徴量を入力して、決定した順伝播演算の手法で特化ＮＮ群１２４を処理させるように構成される。例えば、推論処理部１１０は、入力画像を取得する取得部１５０と、入力画像を共通ＮＮ１２１に入力して特徴量及び遅延ラベル情報を出力する共通ＮＮ１２１と、遅延ラベル情報に基づいて、特化ＮＮ群１２４を処理するための順伝播演算の手法（最適並列演算処理、遅延対象並列演算処理など）を決定するＮＮ推論演算管理部１３０（決定部の一例）と、特化ＮＮ群１２４に特徴量を入力して、決定した順伝播演処理させるＮＮ推論演算管理部１３０（制御部の一例）とを備える。

　次に、訓練装置３００について説明する。訓練装置３００は、機器１００のＮＮ推論部１２０の推論処理に用いられるＮＮデータ４００を生成する。訓練装置３００は、マルチタスク訓練部３０１と、遅延フラグ情報測定部３０２と、遅延フラグ正解ラベル生成部３０３と、遅延フラグ訓練部３０４と、訓練用ラベルデータベース３０５（訓練用ラベルＤＢ３０５）と、シーン画像データベース３０６（シーン画像ＤＢ３０６）とを有する。

　マルチタスク訓練部３０１は、ＮＮデータ４００のうち特徴分類部１２２及び特化ＮＮ群１２４の訓練を行う。本実施の形態では、マルチタスク訓練部３０１は、物体検出及び骨格検出のための訓練を行う。

　マルチタスク訓練部３０１は、マルチタスク学習（Ｍｕｌｔｉ－Ｔａｓｋ　Ｌｅａｒｎｉｎｇ）をＮＮの訓練に適用した訓練処理を実施する。詳細は後述するが、マルチタスク訓練部３０１は、シーン画像ＤＢ３０６から取得したシーン画像を入力とし、訓練用ラベルＤＢ３０５から取得した、当該シーン画像に対応する骨格検出における正解ラベル及び当該シーン画像に対応する物体検出における正解ラベルをリファレンスデータ（教師データ）とし、誤差逆伝播法（ＢＰ：ＢａｃｋＰｒｏｐａｇａｔｉｏｎ）などに基づき、ＮＮ（共通ＮＮ１２１及び特化ＮＮ群１２４）を生成する。

　なお、マルチタスク学習とは、単一のモデルで複数の課題を解く機械学習の手法である。関連する複数の課題を同時に訓練させることで、課題間の「共通の要因」を獲得し、課題の予測精度向上を目指す手法である。画像認識分野では、物体分類、物体検出、物体領域（セグメンテーション）の認識といった複数のタスクを同時に訓練させることがある。本実施の形態では、複数のタスクは、骨格検出及び物体検出である。

　マルチタスク学習をＮＮデータの訓練処理に適用した研究は行われており、マルチタスク訓練部３０１は、例えば、各タスクに共通に使用されるＮＮ（例えば、共通ＮＮ１２１）と各タスクに特化したＮＮ（例えば、特化ＮＮ群１２４）とを訓練する。また、共通に使用されるＮＮを使用することによって、各タスク処理に必要な推論処理の全体計算量及びメモリ使用量を圧縮することができるというメリットもある。

　遅延フラグ情報測定部３０２及び遅延フラグ正解ラベル生成部３０３は、遅延フラグ訓練部３０４により遅延フラグ分類部１２３の訓練を行うときの訓練用データを生成するための処理を行う。

　遅延フラグ情報測定部３０２は、マルチタスク訓練部３０１により生成された共通ＮＮ１２１及び特化ＮＮ群１２４の順伝播演算の処理時間を測定する。本実施の形態では、遅延フラグ情報測定部３０２は、少なくとも第１タスク用ＮＮ１２５の処理時間を測定する。第１タスク用ＮＮ１２５は、ＮＭＳ処理を含み、入力画像における検出候補領域の数によって処理時間が異なるためである。また、第２タスク用ＮＮ１２６は、ＮＭＳ処理などの検出候補領域の数によって処理時間が異なる処理を含んでいない、つまり入力画像に応じて処理時間が大きく変化しないので、本実施の形態では処理時間の測定が行われない。

　遅延フラグ正解ラベル生成部３０３は、処理時間の測定結果に基づく情報を用いて、遅延フラグ訓練部３０４での共通ＮＮ１２１の訓練に用いられる遅延フラグ正解ラベルを生成する。

　遅延フラグ訓練部３０４は、マルチタスク訓練部３０１で生成された共通ＮＮ１２１及び特化ＮＮ群１２４のうち共通ＮＮ１２１を、遅延フラグ正解ラベル生成部３０３が生成した遅延フラグ正解ラベルを用いて訓練する処理を行う。遅延フラグ訓練部３０４は、例えば、シーン画像を入力データとし、遅延フラグ正解ラベルをリファレンスデータ（教師データ）として、誤差逆伝播法に基づき、共通ＮＮ１２１の遅延フラグ分類部１２３における重みデータとバイアスデータとを更新する。つまり、遅延フラグ訓練部３０４は、シーン画像と遅延フラグ正解ラベルとを用いて、共通ＮＮ１２１の遅延フラグ分類部１２３の訓練を行う。なお、遅延フラグ訓練部３０４は、例えば、遅延フラグ正解ラベルを用いて遅延フラグ分類部１２３とともに特徴分類部１２２を訓練させてもよい。

　訓練用ラベルＤＢ３０５は、ＮＮデータ４００を生成するための訓練用のラベルを記憶する。訓練用ラベルＤＢ３０５は、例えば、１枚のシーン画像に対して、骨格検出を行うときの訓練用ラベルと、物体検出を行うときの訓練用ラベルとを記憶する。

　シーン画像ＤＢ３０６は、ＮＮデータ４００を生成するためのシーン画像を記憶する。

　訓練用ラベルＤＢ３０５及びシーン画像ＤＢ３０６は、例えば、半導体メモリなどにより実現されるが、これに限定されない。

　上記のように、訓練装置３００は、シーン画像を取得し、シーン画像を共通ＮＮ１２１に入力して、特徴量を取得し、特化ＮＮ群１２４に特徴量を入力して、特化ＮＮ群１２４を処理させ、シーン画像を共通ＮＮ１２１に入力してから特化ＮＮ群１２４の処理が終了するまでの時間を測定し、シーン画像を入力データとし、特化ＮＮ群１２４の処理時間に関する情報を出力データとし、測定した時間をリファレンスデータとして用いた機械学習により共通ＮＮ１２１を訓練するように構成される。例えば、訓練装置３００は、シーン画像を取得し、シーン画像を共通ＮＮ１２１に入力して、特徴量を取得し、特化ＮＮ群１２４に当該特徴量を入力して、特化ＮＮ群１２４を処理させ、シーン画像を共通ＮＮ１２１に入力してから特化ＮＮ群１２４の処理が終了するまでの時間を測定する遅延フラグ情報測定部３０２と、シーン画像を入力データとし、特化ＮＮ群１２４の処理時間に関する情報を出力データとし、測定した時間をリファレンスデータとして用いた機械学習により共通ＮＮ１２１を訓練する遅延フラグ訓練部３０４とを備える。

　［２.情報処理システムの動作］
　続いて、上記の情報処理システム１０の動作について、図５～図１３を参照しながら説明する。

　［２－１.機器の動作］
　まずは、機器１００における処理について、図５～図６Ｃを参照しながら説明する。図５は、本実施の形態に係る機器１００の動作を示すフローチャートである。なお、便宜上、図５では、テーブル５００に含まれる遅延フラグ情報は、「ＯＮ（ＯＮ１）」及び「ＯＦＦ」の２種類である例について説明する。言い換えると、遅延フラグ分類部１２３は、「ＯＮ」及び「ＯＦＦ」のいずれかを出力するように訓練されているとする。

　図５に示すように、機器１００の取得部１５０は、カメラ２００から入力画像を取得する（Ｓ１０１）。取得部１５０は、ステップＳ１０１で取得した入力画像をＮＮ推論部１２０に出力する。

　次に、ＮＮ推論部１２０は、取得部１５０から入力画像が入力されると、まず共通ＮＮ１２１を使用して、順伝播演算処理を実行する（Ｓ１０２）。具体的には、ＮＮ推論部１２０は、共通ＮＮ１２１の特徴分類部１２２に入力画像を入力することで、特徴分類部１２２の出力である特徴量を取得する。そして、ＮＮ推論部１２０は、取得した特徴量を遅延フラグ分類部１２３に入力することで、遅延フラグ分類部１２３の出力である遅延フラグ情報を取得する。遅延フラグ情報は、遅延フラグ分類部１２３が特徴量から推論した結果であり、本実施の形態では、ＮＮ推論部１２０全体の推論処理時間が閾値を超えたか否かを推論した結果を示す。

　ＮＮ推論部１２０は、取得した遅延フラグ情報をＮＮ推論演算管理部１３０に出力する。なお、ＮＮ推論部１２０は、さらに、機器１００が備える機能部であって、推論処理部１１０の外部の機能部に遅延フラグ情報を出力してもよい。機能部は、例えば、グラフィック機能を担っている機能部などであってもよい。

　次に、ＮＮ推論演算管理部１３０は、遅延フラグ情報を取得する（Ｓ１０３）。ＮＮ推論演算管理部１３０は、取得した遅延フラグ情報が「ＯＮ」であるか否かを判定する（Ｓ１０４）。ＮＮ推論演算管理部１３０は、遅延フラグ情報が「ＯＦＦ」である場合、つまり「最適並列演算処理」に従って推論処理を行っても機器１００の要求される処理時間内にサービスを完了することができること示す推論結果である場合（Ｓ１０４でＮｏ）、図３に示すテーブル５００に基づいて、特化ＮＮ群１２４の順伝播演算手法を「最適並列演算処理」に決定する（Ｓ１０５）。つまり、ＮＮ推論演算管理部１３０は、遅延フラグ情報が「ＯＦＦ」である場合、「最適並列演算処理」に基づく順序で特化ＮＮ群１２４の処理を実行することを決定する。「最適並列演算処理」に基づく順序は、第１のスケジュールの一例である。ＮＮ推論演算管理部１３０は、決定した特化ＮＮ群１２４の順伝播演算手法をＮＮ推論部１２０に出力する。

　ＮＮ推論部１２０は、ＮＮ推論演算管理部１３０から特化ＮＮ群１２４の順伝播演算手法が「最適並列演算処理」であることを取得すると、「最適並列演算処理」が示す順序で並列順伝播演算処理を実行する。例えば、ＮＮ推論部１２０は、特化ＮＮ群１２４を最も効率的な順序で並列順伝播演算する（Ｓ１０６）。ＮＮ推論部１２０は、特化ＮＮ群１２４のそれぞれのＮＮに、特徴分類部１２２の出力である特徴量を入力し、「最適並列演算処理」に基づくスケジュールで推論処理を行い、それぞれのＮＮの出力である推論結果（骨格検出結果、物体検出結果など）を取得する。

　図６Ａは、本実施の形態に係る共通ＮＮ１２１及び特化ＮＮ群１２４の処理時間、及び、演算担当ユニットの一例を示す模式図である。具体的には、図６Ａに示す第１情報７００ａは、「最適並列演算処理」に基づく演算順序で処理を行っても許容時間内に処理が終了する場合の処理時間、及び、演算担当ユニットの一例を示す。なお、図６Ａ～図６Ｃでは、ＮＭＳ処理をＣＰＵ６０２にアウトソーシングしている例について説明する。

　領域７０１は、共通ＮＮ１２１における各ユニット（ＣＰＵ６０２、第１ＮＰＵ６０３及び第２ＮＰＵ６０４）の専有率を示す。領域７０１では、第１ＮＰＵ６０３（図６Ａ～６Ｃ中のＮＰＵ１）及び第２ＮＰＵ６０４（図６Ａ～６Ｃ中のＮＰＵ２）により共通ＮＮ１２１を用いて処理が行われる。領域７０２は、第１タスク用ＮＮ１２５における各ユニットの専有率を示す。領域７０２では、第１ＮＰＵ６０３及び第２ＮＰＵ６０４の少なくとも一方により第１タスク用ＮＮ１２５を用いて物体検出処理が行われる。

　領域７０３は、第２タスク用ＮＮ１２６における第２タスク用ＮＮ１２６における各ユニットの専有率を示す。領域７０３では、第１ＮＰＵ６０３及び第２ＮＰＵ６０４の少なくとも一方により第２タスク用ＮＮ１２６を用いて骨格検出処理が行われる。領域７０４ａ及び７０４ｂは、第１タスク用ＮＮ１２５のＮＭＳ処理における各ユニットの専有率を示す。領域７０４ａ及び７０４ｂでは、ＣＰＵ６０２によりＮＭＳ処理が行われる。

　図６Ａに示すように、ＮＮ推論演算管理部１３０は、ステップＳ１０４でＮｏである場合、特化ＮＮ群１２４の順伝播演算を、メモリアクセス数及び演算時間などのバランスがとれた並列演算方式で演算処理を行うことを示す「最適並列演算処理」で行うことをＮＮ推論部１２０に指示する。この場合、「最適並列演算処理」に基づく演算順序で処理を行っても、許容時間以内に処理を終えることができる。

　図５を再び参照して、ＮＮ推論演算管理部１３０は、遅延フラグ情報が「ＯＮ」である場合、つまり「最適並列演算処理」に従って推論処理を行うと機器１００の要求される処理時間内にサービスを完了することができないことを示す推論結果である場合（Ｓ１０４でＹｅｓ）、図３に示すテーブル５００に基づいて、特化ＮＮ群１２４の順伝播演算手法を「遅延対策並列演算処理」に決定する（Ｓ１０７）。つまり、ＮＮ推論演算管理部１３０は、遅延フラグ情報が「ＯＮ」である場合、「遅延対策並列演算処理」に基づく順序で特化ＮＮ群１２４の処理を実行することを決定する。「遅延対策並列演算処理」に基づく順序は、第２のスケジュールの一例である。ＮＮ推論演算管理部１３０は、決定した特化ＮＮ群１２４の順伝播演算手法をＮＮ推論部１２０に出力する。

　ＮＮ推論部１２０は、ＮＮ推論演算管理部１３０から特化ＮＮ群１２４の順伝播演算手法が「遅延対策並列演算処理」であることを取得すると、「遅延対策並列演算処理」が示す順序で並列順伝播演算処理を実行する。例えば、ＮＮ推論部１２０は、特化ＮＮ群１２４を設定された順序で並列順伝播演算する（Ｓ１０８）。ＮＮ推論部１２０は、特化ＮＮ群１２４のそれぞれのＮＮに、特徴分類部１２２の出力である特徴量を入力し、「遅延対策並列演算処理」に基づくスケジュールで推論処理を行い、それぞれのＮＮの出力である推論結果（骨格検出結果、物体検出結果など）を取得する。

　図６Ｂは、本実施の形態に係る共通ＮＮ１２１及び特化ＮＮ群１２４の処理時間及び演算担当ユニットの一例を示す模式図である。具体的には、図６Ｂに示す第２情報７００ｂは、「最適並列演算処理」に基づく演算順序で処理を行ったときに許容時間内に処理が終了しない場合の処理時間、及び、演算担当ユニットの一例を示す。図６Ｂは、最適並列演算処理を行ったときに許容時間を超えてしまう、つまりステップＳ１０４でＹｅｓと判定される場合を示している。

　図６Ｂに示すように、例えば、ＮＭＳ処理に要する時間（領域７０４ｂ）が図６Ａのときの時間（領域７０４ａ）より長くなることにより、推論処理部１１０の推論時間が許容時間を超えている。入力画像によっては、図６Ｂに示すようにＮＭＳ処理に要する時間が長くなることが起こり得る。

　そこで、図５のステップＳ１０７で示すように、ＮＮ推論演算管理部１３０は、「最適並列演算処理」に従って推論処理を行うと許容時間を超える可能性があるので、「最適並列演算処理」に変えて「遅延対策並列演算処理」に従って推論処理を行うことを決定する。本実施の形態では、「遅延対策並列演算処理」は、ＮＭＳ処理（領域７０４ｂで行われる処理）を優先的に開始できるように演算順序を組み替えることを示す。なお、以下において、許容時間を超えることを、遅延が発生するとも記載する。

　図６Ｃは、本実施の形態に係る共通ＮＮ１２１及び特化ＮＮ群１２４の演算順序組み換え後の処理時間及び演算担当ユニットの一例を示す模式図である。図６Ｃに示す第３情報７００ｃは、「最適並列演算処理」に基づく演算順序では許容時間内に処理が終了しない場合に、「遅延対策並列演算処理」に基づく演算順序で処理を行ったときの処理時間、及び、演算担当ユニットの一例を示す。第３情報７００ｃは、図６Ｂに示す第２情報７００ｂから処理順序を変更したものである。図６Ｃは、ステップＳ１０４でＹｅｓと判定されて、変更された後の処理順序等を示している。

　図６Ｃに示すように、「遅延対策並列演算処理」による演算順序は、ＮＭＳ処理を優先的に開始する。当該演算順序は、ＮＭＳ処理を開始するタイミングを早めるように、「最適並列演算処理」による演算順序から、ＮＭＳ処理を開始するタイミングが早められている。これにより、ＮＭＳ処理に要する時間が長くなる場合でも、推論処理部１１０の推論時間が許容時間を超えることを抑制することができる。当該演算順序（処理の順序）は、タスクスケジュールの一例である。また、タスクスケジュールは、特化ＮＮ群１２４のＮＮモデルのメモリロードの順序を含んでいてもよい。

　なお、図６Ｂ及び図６Ｃに示すように、「最適並列演算処理」及び「遅延対策並列演算処理」では、ＮＭＳ処理の処理タイミングは変更されるが、処理内容の変更、及び、処理の削除などは行われない。そのため、「最適並列演算処理」及び「遅延対策並列演算処理」で推論処理を行った場合の推論結果の精度は、実質的に同じである。

　なお、本実施の形態では、図６Ｂ及び図６Ｃに示すように、入力画像によって処理時間が大きく変動するレイヤがＮＭＳ処理を行うレイヤである例を示しているが、入力画像によって処理時間が大きく変動する他のアルゴリズムを使用するレイヤであってもよい。

　ＮＮ推論部１２０は、ステップＳ１０６又はＳ１０８の演算により出力された推論結果をタスク実行部１４０に出力する。

　図５を再び参照して、タスク実行部１４０は、ＮＮ推論部１２０から取得した推論結果に基づいて動作し、ユーザにサービスが提供される。つまり、タスク実行部１４０による各種タスク処理が実行される（Ｓ１０９）。

　以上のように、機器１００は、許容時間内に推論サービスを提供するため、早期に推論処理の負荷を判定し、演算順序を変更可能な推論処理部１１０を有することにより、一定のサービス能力を担保しながら稼働することができる。また、推論処理部１１０は、遅延フラグ情報が「ＯＦＦ」の場合、最適な並列演算で推論サービスを提供することができ、かつ、省電力にも貢献できる。

　また、推論処理部１１０は、入力画像の特徴量から、初期段階（前処理）で後続の複数のＮＮにおけるＮＮ推論処理に必要な処理時間を推定する。そして、推論処理部１１０は、並列演算において、要求される処理時間内で処理を完了できる演算順序でＮＮ推論処理を行うことができる。

　なお、上記では、遅延フラグ情報が「ＯＮ」である場合、図６Ｃに示す順序で演算処理が実行される例について説明したが、これに限定されず、遅延フラグ情報に応じて、演算処理の順序が変更されてもよい。例えば、遅延フラグ情報に遅延の度合いを示す情報（例えば、遅延度：「大」、「中」、「小」、又は、遅延時間の推定値など）が含まれる場合、遅延の度合いごとに、並列演算項目が設定されていてもよい。つまり、遅延の度合いごとに、演算処理の順序が設定されてもよい。そして、ＮＮ推論演算管理部１３０は、ステップＳ１０７において、遅延フラグ情報に含まれる遅延の度合いに応じた並列演算項目を、特化ＮＮ群１２４の順伝播演算の手法に決定してもよい。

　［２－２.訓練装置の動作］
　続いて、訓練装置３００の動作について、図７～図１３を参照しながら説明する。まずは、マルチタスク訓練部３０１の動作について、図７及び図８を参照しながら説明する。図７は、本実施の形態に係るマルチタスク訓練部３０１の動作を示すフローチャートである。図８は、本実施の形態に係るマルチタスク訓練部３０１の動作を模式的に示す図である。

　図７に示すように、マルチタスク訓練部３０１は、シーン画像ＤＢ３０６からシーン画像を取得し、訓練用ラベルＤＢ３０５から各ＮＮの正解ラベルを取得する（Ｓ２０１）。マルチタスク訓練部３０１は、シーン画像と、当該シーン画像に対する第１タスク用ＮＮ１２５用の正解ラベル（第１タスク用ＮＮ正解ラベル）、及び、当該シーン画像に対する第２タスク用ＮＮ１２６用の正解ラベル（第２タスク用ＮＮ正解ラベル）を取得する。本実施の形態では、マルチタスク訓練部３０１は、物体検出用ＮＮの正解ラベル及び骨格検出用ＮＮの正解ラベルを取得する。

　次に、マルチタスク訓練部３０１は、共通ＮＮ１２１及び特化ＮＮ群１２４を使用して順伝播演算を行う。例えば、マルチタスク訓練部３０１は、共通ＮＮ１２１の特徴分類部１２２及び特化ＮＮ群１２４を使用して順伝播演算を行う（Ｓ２０２）。

　図８に示すように、マルチタスク訓練部３０１は、シーン画像を共通ＮＮ１２１に入力して得られる共通ＮＮ１２１の出力である特徴量を取得し、さらに取得した特徴量を第１タスク用ＮＮ１２５に入力して得られる第１タスク用ＮＮ１２５の出力である第１推論結果、及び、当該特徴量を第２タスク用ＮＮ１２６に入力して得られる第２タスク用ＮＮ１２６の出力である第２推論結果を取得する。

　図７を再び参照して、次に、マルチタスク訓練部３０１は、各ＮＮの正解ラベルをリファレンスデータ（教師データ）として、特徴分類部１２２及び特化ＮＮ群１２４を逆伝播演算し、重み及びバイアスを更新する（Ｓ２０３）。マルチタスク訓練部３０１は、誤差逆伝播法に基づき、損失関数（ｌｏｓｓ　ｆｕｎｃｔｉｏｎ）の出力値を誤差と見立てて、逆伝播演算によって、共通ＮＮ１２１の特徴分類部１２２及び特化ＮＮ群１２４における重み（重みデータ）及びバイアス（バイアスデータ）の更新処理を実行する。

　図８に示すように、第１タスク用ＮＮ１２５における損失関数は、第１タスク用ＮＮ１２５の第１推論結果が第１タスク用ＮＮ正解ラベルとどれだけ誤差があるかを表す。第２タスク用ＮＮ１２６における損失関数は、第２タスク用ＮＮ１２６の第２推論結果が第２タスク用ＮＮ正解ラベルとどれだけ誤差があるかを表す。

　マルチタスク訓練部３０１は、シーン画像に基づいて第１タスク用ＮＮ１２５の出力である第１推論結果を取得し、第１推論結果と第１タスク用ＮＮ正解ラベルとに基づいて損失関数の出力値を取得する。そして、マルチタスク訓練部３０１は、当該出力値を誤差と見立てて、逆伝播演算によって、共通ＮＮ１２１の特徴分類部１２２及び特化ＮＮ群１２４の第１タスクＮＮ１２５における重み及びバイアスの更新処理を実行する。

　次に、マルチタスク訓練部３０１は、シーン画像に基づいて第２タスク用ＮＮ１２６の出力である第２推論結果を取得し、第２推論結果と第２タスク用ＮＮ正解ラベルとに基づいて損失関数の出力値を取得する。そして、マルチタスク訓練部３０１は、当該出力値を誤差と見立てて、逆伝播演算によって、共通ＮＮ１２１の特徴分類部１２２及び特化ＮＮ群１２４の第２タスクＮＮ１２６における重み及びバイアスの更新処理を実行する。このように、マルチタスク訓練部３０１は、例えば、更新処理を交互に実行する。

　図７を再び参照して、マルチタスク訓練部３０１は、ＮＮ推論結果の正解率（又は、シーン画像の正解ラベルと比較した誤差率）が要件を満たすか否かを判定する（Ｓ２０４）。要件は、例えば、機器１００に求められる正解率であってもよい。つまり、マルチタスク訓練部３０１は、ＮＮ推論結果の正解率が機器１００に求められる正解率以上であるか否かによりステップＳ２０４の判定を行ってもよい。

　マルチタスク訓練部３０１は、ＮＮ推論結果の正解率が要件を満たす場合（Ｓ２０４でＹｅｓ）、処理を終了する。また、マルチタスク訓練部３０１は、ＮＮ推論結果の正解率が要件を満たさない場合（Ｓ２０４でＮｏ）、ステップＳ２０１に戻り処理を継続する。つまり、マルチタスク訓練部３０１は、ＮＮ推論結果の正解率が要件を満たさない場合、様々なシーン画像とそれに紐づく正解ラベルとを使用して訓練していき、ＮＮ推論結果の正解率が要件を満たすまで訓練処理を継続する。

　続いて、遅延フラグ情報測定部３０２及び遅延フラグ正解ラベル生成部３０３の動作について、図９及び図１０を参照しながら説明する。図７は、本実施の形態に係る遅延フラグ情報測定部３０２及び遅延フラグ正解ラベル生成部３０３の動作を示すフローチャートである。図１０は、本実施の形態に係る遅延フラグ情報測定部３０２及び遅延フラグ正解ラベル生成部３０３の動作を模式的に示す図である。

　図９に示すように、遅延フラグ情報測定部３０２は、任意のシーン画像を取得する（Ｓ３０１）。遅延フラグ情報測定部３０２は、例えば、マルチタスク訓練部３０１によるマルチタスク学習に使用したシーン画像を取得してもよい。

　次に、遅延フラグ情報測定部３０２は、マルチタスク訓練部３０１により訓練された共通ＮＮ１２１及び特化ＮＮ群１２４の順伝播演算の演算時間を測定する（Ｓ３０２）。本実施の形態では、遅延フラグ情報測定部３０２は、ＮＭＳ処理を含む第１タスク用ＮＮ１２５の演算時間を測定する。

　遅延フラグ情報測定部３０２は、ステップＳ３０２において、シーン画像を共通ＮＮ１２１に入力して、特徴量果及び遅延フラグ情報を取得し、さらに、第１タスク用ＮＮ１２５に特徴量を入力して、第１タスク用ＮＮ１２５を処理させ、シーン画像を共通ＮＮ１２１に入力してから特化ＮＮ群１２４の処理が終了するまでの時間を測定する。なお、ステップＳ３０２では、遅延フラグ情報測定部３０２は、少なくとも、第１タスク用ＮＮ１２５に特徴量を入力してから特化ＮＮ群１２４の処理が終了するまでの時間を測定すればよい。図１０では、遅延フラグ情報測定部３０２が第１タスク用ＮＮ１２５に特徴量を入力してから特化ＮＮ群１２４の処理が終了するまでの時間（推論時間の一例）を測定する例を図示している。

　なお、処理時間の測定では、機器１００と同じハード機器が使用されてもよい。また、処理時間は、シミュレーションによって算出されたものであってもよい。

　図１０に示すように、遅延フラグ情報測定部３０２は、シーン画像を共通ＮＮ１２１に入力して得られる特徴量及び共通ＮＮ１２１の処理の複数の後続のタスクの処理時間に関する情報（遅延フラグ分類部１２３の出力である遅延フラグ情報）を取得し、当該特徴量が入力されたときの第１タスク用ＮＮ１２５の処理時間を測定する。処理時間を測定することは、遅延フラグ情報を測定することの一例である。

　図９を再び参照して、遅延フラグ情報測定部３０２は、測定した処理時間が閾値を超えたか否かを判定する（Ｓ３０３）。閾値は、例えば、予め設定されている。遅延フラグ情報測定部３０２は、処理時間が閾値を超えた場合（Ｓ３０３でＹｅｓ）、該当シーン画像を遅延フラグＯＮとして、遅延フラグ情報ＤＢ３０２ａ（図１０参照）に記憶する（Ｓ３０４）。また、遅延フラグ情報測定部３０２は、処理時間が閾値を超えなかった場合（Ｓ３０３でＮｏ）、該当シーン画像を遅延フラグＯＦＦとして、遅延フラグ情報ＤＢ３０２ａに記憶する（Ｓ３０５）。

　なお、第１タスク用ＮＮ１２５及び第２タスク用ＮＮ１２６のそれぞれにおいて、処理時間を測定している場合、（ｉ）第１タスク用ＮＮ１２５のみで遅延が発生する（許容時間を超える）こと、（ｉｉ）第２タスク用ＮＮ１２６のみで遅延が発生することが起こり得る。この場合、（ｉ）と（ｉｉ）とでは、「並列演算項目」の内容（例えば、組み換え後の演算順序）が異なる場合がある。このように、「並列演算項目」の内容が異なる場合、遅延フラグ「ＯＮ」は、「並列演算項目」の内容ごとに複数の種類が存在してもよい。

　次に、遅延フラグ正解ラベル生成部３０３は、遅延フラグ情報ＤＢ３０２ａの遅延フラグ情報に基づいて、遅延フラグ正解ラベルを生成する。遅延フラグ正解ラベル生成部３０３は、シーン画像に遅延フラグ「ＯＮ」又は「ＯＦＦ」をラベル付けして遅延フラグ正解ラベルを生成する（Ｓ３０６）。遅延フラグ正解ラベル生成部３０３は、遅延フラグ情報をシーン画像と対応付けることで遅延フラグ正解ラベルを生成するとも言える。遅延フラグ正解ラベル生成部３０３は、生成した遅延フラグ正解ラベルを遅延フラグ正解ラベルＤＢ３０３ａ（図１０参照）に記憶する。

　続いて、遅延フラグ訓練部３０４の動作について、図１１及び図１２を参照しながら説明する。図１１は、本実施の形態に係る遅延フラグ訓練部３０４の動作を示すフローチャートである。図１２は、本実施の形態に係る遅延フラグ訓練部３０４の動作を模式的に示す図である。

　図１１に示すように、遅延フラグ訓練部３０４は、シーン画像ＤＢ３０６からシーン画像を取得し、遅延フラグ正解ラベルＤＢ３０３ａから当該シーン画像に対応する遅延フラグ正解ラベルを取得する（Ｓ４０１）。

　次に、遅延フラグ訓練部３０４は、共通ＮＮ１２１を使用して順伝播演算を行う（Ｓ４０２）。遅延フラグ訓練部３０４は、例えば、共通ＮＮ１２１の遅延フラグ分類部１２３を使用して順伝播演算を行う。

　図１２に示すように、遅延フラグ訓練部３０４は、シーン画像を共通ＮＮ１２１の特徴分類部１２２に入力して得られる特徴分類部１２２の出力である特徴量を取得し、さらに取得した特徴量を遅延フラグ分類部１２３に入力して得られる遅延フラグ分類部１２３の出力である遅延フラグ情報を取得する。

　図１１を再び参照して、次に、遅延フラグ訓練部３０４は、遅延フラグ正解ラベルをリファレンスデータ（教師データ）として、共通ＮＮ１２１を逆伝播演算し、重み及びバイアスを更新する（Ｓ４０３）。遅延フラグ訓練部３０４は、誤差逆伝播法に基づき、損失関数の出力値を誤差と見立てて、逆伝播演算によって、共通ＮＮ１２１の遅延フラグ分類部１２３における重み（重みデータ）及びバイアス（バイアスデータ）の更新処理を実行する。

　図１２に示すように、共通ＮＮ１２１における損失関数は、共通ＮＮ１２１の遅延フラグ分類部１２３の推論結果（遅延フラグ情報）が当該シーン画像に対応する遅延フラグ正解ラベルとどれだけ誤差があるかを表す。

　遅延フラグ訓練部３０４は、シーン画像に基づいて遅延フラグ分類部１２３の出力である遅延フラグ情報を取得し、遅延フラグ情報と遅延フラグ正解ラベルとに基づいて損失関数の出力値を取得する。そして、遅延フラグ訓練部３０４は、当該出力値を誤差と見立てて、逆伝播演算によって、共通ＮＮ１２１の遅延フラグ分類部１２３における重み及びバイアスの更新処理を実行する。

　このように、ステップＳ４０２及び４０３では、シーン画像を入力データとし、共通ＮＮ１２１の遅延フラグ分類部１２３から出力される遅延フラグ情報を出力データとし、遅延フラグ情報測定部３０２で測定された時間をリファレンスデータとして用いて共通ＮＮ１２１（例えば遅延フラグ分類部１２３）を機械学習で訓練する。

　なお、遅延フラグ訓練部３０４は、当該出力値を誤差と見立てて、逆伝播演算によって、特徴分類部１２２及び遅延フラグ分類部１２３における重み及びバイアスの更新処理を実行してもよい。つまり、遅延フラグ訓練部３０４は、遅延フラグ分類部１２３に加えて特徴分類部１２２を訓練処理の対象としてもよい。これにより、遅延フラグ分類部１２３とともに特徴分類部１２２における重み及びバイアスが更新されることで、遅延フラグ分類部１２３が出力する遅延フラグ情報の精度が向上することが期待できる。

　図１１を再び参照して、遅延フラグ訓練部３０４は、ＮＮ推論結果の正解率（又は推論結果と遅延フラグ正解ラベルと比較した誤差率）が要件を満たすか否かを判定する（Ｓ４０４）。要件は、例えば、機器１００に求められる正解率であってもよい。つまり、遅延フラグ訓練部３０４は、ＮＮ推論結果の正解率が機器１００に求められる正解率以上であるか否かによりステップＳ４０４の判定を行ってもよい。

　遅延フラグ訓練部３０４は、ＮＮ推論結果の正解率が要件を満たす場合（Ｓ４０４でＹｅｓ）、処理を終了する。また、遅延フラグ訓練部３０４は、ＮＮ推論結果の正解率が要件を満たさない場合（Ｓ４０４でＮｏ）、ステップＳ４０１に戻り処理を継続する。つまり、遅延フラグ訓練部３０４は、ＮＮ推論結果の正解率が要件を満たさない場合、様々なシーン画像とそれに紐づく正解ラベルとを使用して訓練していき、ＮＮ推論結果の正解率が要件を満たすまで訓練処理を継続する。

　遅延フラグ訓練部３０４による訓練処理完了後に、上記で説明した機器１００の動作を実行可能なＮＮデータ４００となる。生成されたＮＮデータ４００は、機器１００に送信される。

　なお、本実施の形態に係る訓練装置３００は、逐次的に訓練処理を行っているが、共通ＮＮ１２１の特徴分類部１２２及び特化ＮＮ群１２４と、共通ＮＮ１２１の遅延フラグ分類部１２３とに対してマルチタスク学習を実施し、その際に特化ＮＮ群１２４の順伝播演算の測定も実施し、遅延フラグ情報を取得してもよい。また、訓練装置３００は、逆伝播演算時において、遅延フラグ情報（遅延フラグ正解ラベル）を正解とした誤差情報を用いて共通ＮＮ１２１の遅延フラグ分類部１２３の重み及びバイアスを更新し、マルチタスク学習の誤差情報を用いて共通ＮＮ１２１の特徴分類部１２２及び特化ＮＮ群１２４の重み及びバイアスを更新してもよい。このように、訓練装置３００は、共通ＮＮ１２１の特徴分類部１２２及び特化ＮＮ群１２４と、共通ＮＮ１２１の遅延フラグ分類部１２３とに対してマルチタスク学習を実施可能な構成であってもよい。

　ここで、本実施の形態に係る訓練装置３００の訓練結果の評価の出力について、図１３を参照しながら説明する。図１３は、本実施の形態に係る遅延フラグ情報の発生率を示すテーブルである。

　本実施の形態に係る訓練装置３００の訓練結果の評価の出力例として特化ＮＮ群１２４のｍＡＰ（Ｍｅａｎ　Ａｖｅｒａｇｅ　Ｐｒｅｃｉｓｉｏｎ）などの推論品質情報以外に図１３に示す「遅延フラグ情報の発生率」を出力する構成も考えられる。図１３に示す結果から、遅延フラグ情報「ＯＦＦ」の発生率を大きくするために、ＮＮの構成又はハイパーパラメータなどを変更するといった開発者の動機付けを促すこともできる。また、訓練装置３００は、要求仕様を満たさない推論遅延が発生した場合の発生率（図１３中の遅延フラグ情報「ＮＧ」に対応する発生率）又は該当シーン画像の情報を表示することによって、ＮＮの訓練処理の工程段階で推論遅延が発生しないような対策の検討を開発者などに促すことができる。

　（その他の実施の形態）
　以上、本開示について実施の形態に基づいて説明したが、本開示は、上記実施の形態に限定されるものではない。

　例えば、上記実施の形態では、遅延フラグ分類部１２３に特徴分類部１２２の出力である特徴量が入力データとして入力される例について説明したが、入力データはこれに限定されない。入力データは、例えば、カメラ２００からの入力画像であってもよい。例えば、ＮＮ推論部１２０は、カメラ２００からの入力画像を遅延フラグ分類部１２３に入力することで、遅延フラグ分類部１２３の出力である遅延フラグ情報を取得してもよい。また、この場合、遅延フラグ訓練部３０４は、図１１のステップＳ４０２において、シーン画像を共通ＮＮ１２１の遅延フラグ分類部１２３に入力して得られる遅延フラグ分類部１２３の出力である遅延フラグを取得する。そして、遅延フラグ訓練部３０４は、図１１のステップＳ４０３において、遅延フラグ正解ラベルをリファレンスデータ（教師データ）として、共通ＮＮ１２１の遅延フラグ分類部１２３を逆伝播演算し、遅延フラグ分類部１２３の重み及びバイアスを更新する。また、例えば、特徴分類部１２２及び遅延フラグ分類部１２３には、同じ入力データ（入力画像）が入力されてもよい。

　また、遅延フラグ分類部１２３の入力データは、例えば、特徴分類部１２２の推論の中間データであってもよい。例えば、ＮＮ推論部１２０は、特徴分類部１２２に推論の中間データを出力させ、当該中間データを遅延フラグ分類部１２３に入力することで、遅延フラグ分類部１２３の出力である遅延フラグ情報を取得してもよい。

　また、上記実施の形態では、後続のタスクの処理がＮＮを用いた処理であり、ＮＮ推論演算管理部１３０は、ＮＮを用いた処理の演算順序を決定する例について説明したが、これに限定されない。後続のタスクの処理がＮＮを用いない処理であり、ＮＮ推論演算管理部１３０は、ＮＮを用いない処理の演算順序を決定してもよい。

　また、上記実施の形態では、機器１００のＳｏＣ６０１には、ＮＰＵが搭載されている例について説明したが、ＮＰＵは搭載されていなくてもよい。ＳｏＣ６０１には、ＣＰＵ６０２及びＮＰＵのうちＣＰＵ６０２のみが搭載されており、例えば、上記で説明した各処理は、ＣＰＵ６０２により実行されてもよい。

　また、上記実施の形態では、ＮＮ推論処理部１１０は、ＩｏＴ機器の製品分野で用いられる例について説明したが、製品分野はこれに限定されない。ＮＮ推論処理部１１０は、自動運転車、ロボット、ドローンなどの無人飛行体などのＩｏＴ機器とは異なる製品分野においても適用可能である。

　また、上記実施の形態において説明された複数の処理の順序は一例である。複数の処理の順序は、変更されてもよいし、複数の処理は、並行して実行されてもよい。また、複数の処理の一部は、実行されなくてもよい。

　また、実施の形態で説明した各構成要素は、ソフトウェアとして実現されても良いし、典型的には、集積回路であるＬＳＩとして実現されてもよい。これらは、個別に１チップ化されてもよいし、一部または全てを含むように１チップ化されてもよい。ここでは、ＬＳＩとしたが、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）や、ＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。更には、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて構成要素の集積化を行ってもよい。

　また、ブロック図における機能ブロックの分割は一例であり、複数の機能ブロックを１つの機能ブロックとして実現したり、１つの機能ブロックを複数に分割したり、一部の機能を他の機能ブロックに移してもよい。また、類似する機能を有する複数の機能ブロックの機能を単一のハードウェア又はソフトウェアが並列又は時分割に処理してもよい。

　また、情報処理システムが備える訓練装置は、単一の装置として実現されてもよいし、複数の装置によって実現されてもよい。例えば、訓練装置の各処理部は、２以上のサーバ装置で実現されてもよい。情報処理システムが複数のサーバ装置によって実現される場合、情報処理システムが備える構成要素は、複数のサーバ装置にどのように振り分けられてもよい。また、複数のサーバ装置間の通信方法は、特に限定されない。

　さらに、本開示の技術は上記の情報処理方法における特徴的な処理をコンピュータに実行させるためのプログラムであってもよいし、上記プログラムが記録された非一時的なコンピュータ読み取り可能な記録媒体であってもよい。また、上記プログラムは、インターネット等の伝送媒体を介して流通させることができるのは言うまでもない。例えば、上記プログラム及び上記プログラムからなるデジタル信号は、電気通信回線、無線又は有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものであってもよい。また、上記プログラム及び上記プログラムからなるデジタル信号は、記録媒体に記録して移送されることにより、又はネットワーク等を経由して移送されることにより、独立した他のコンピュータシステムにより実行されてもよい。

　また、各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、ＣＰＵまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。

　本開示は、複数のＮＮの推論処理を使用する情報処理装置等に適用可能である。

　１０　　情報処理システム
　１００　　機器
　１１０　　推論処理部
　１２０　　ＮＮ推論部
　１２１　　共通ＮＮ（推論処理部）
　１２２　　特徴分類部
　１２３　　遅延フラグ分類部
　１２４　　特化ＮＮ群
　１２５　　第１タスク用ＮＮ
　１２６　　第２タスク用ＮＮ
　１３０　　ＮＮ推論演算管理部（決定部、制御部）
　１４０　　タスク実行部
　１５０　　取得部
　２００　　カメラ
　３００　　訓練装置
　３０１　　マルチタスク訓練部
　３０２　　遅延フラグ情報測定部
　３０２ａ　　遅延フラグ情報ＤＢ
　３０３　　遅延フラグ正解ラベル生成部
　３０３ａ　　遅延フラグ正解ラベルＤＢ
　３０４　　遅延フラグ訓練部
　３０５　　訓練用ラベルＤＢ
　３０６　　シーン画像ＤＢ
　４００　　ＮＮデータ
　５００　　テーブル
　５０１　　第１行
　５０２　　第２行
　５０３　　第３行
　６０１　　ＳｏＣ
　６０２　　ＣＰＵ
　６０３　　第１ＮＰＵ
　６０４　　第２ＮＰＵ
　６０５　　メモリ
　７００ａ　　第１情報
　７００ｂ　　第２情報
　７００ｃ　　第３情報
　７０１、７０２、７０３、７０４ａ、７０４ｂ　　領域

Claims

　センシングデータを取得する取得部と、
　前記センシングデータを推論モデルに入力して、推論結果及び推論モデルの処理の複数の後続のタスクの処理時間に関する情報を取得する推論処理部と、
　前記複数の後続のタスクの処理時間に関する情報に基づいて、前記複数の後続のタスクを処理するタスク処理部の前記複数の後続のタスクを処理するためのタスクスケジュールを決定する決定部と、
　前記タスク処理部に推論結果を入力して、決定した前記タスクスケジュールで前記複数の後続のタスクを処理させる制御部と、を備える
　情報処理装置。
　前記推論モデルは、第１推論モデルと、第２推論モデルとを含み、
　前記センシングデータを前記第１推論モデルに入力して前記推論結果を取得し、
　取得された前記推論結果又は前記推論の中間データを前記第２推論モデルに入力して前記複数の後続のタスクの処理時間に関する情報を取得する
　請求項１に記載の情報処理装置。
　前記推論モデルは、第１推論モデルと、第２推論モデルとを含み、
　前記センシングデータを前記第１推論モデルに入力して前記推論結果を取得し、
　前記センシングデータを前記第２推論モデルに入力して前記複数の後続のタスクの処理時間に関する情報を取得する
　請求項１に記載の情報処理装置。
　前記複数の後続のタスクの処理時間に関する情報は、前記複数の後続のタスクの処理時間に対して定められる所定時間に対する遅延に関する情報を含む
　請求項１～３のいずれか１項に記載の情報処理装置。
　前記遅延に関する情報に、前記遅延が所定未満であることを示す情報が含まれる場合、第１のスケジュールを決定し、
　前記遅延に関する情報に、前記遅延が所定以上であることを示す情報が含まれる場合、前記第１のスケジュールより前記複数の後続のタスクの処理時間が短い第２のスケジュールを決定する
　請求項４に記載の情報処理装置。
　前記第１のスケジュールの決定には、第１ルールを用い、
　前記第２のスケジュールの決定には、前記第２のスケジュールが前記第１のスケジュールよりも前記複数の後続のタスクの処理時間が短くなる第２ルールを用いる
　請求項５に記載の情報処理装置。
　前記推論モデルは、前記複数の後続のタスクに共通する前処理である推論処理を実行する
　請求項１～６のいずれか１項に記載の情報処理装置。
　前記推論モデル及び前記タスク処理部は、ニューラルネットワークモデルであり、
　前記推論結果は、前記センシングデータの特徴量であり、
　前記タスクスケジュールは、前記タスク処理部のメモリロード及び処理の順序を含む
　請求項１～７のいずれか１項に記載の情報処理装置。
　コンピュータにより実行される方法であって、
　センシングデータを取得し、
　前記センシングデータを推論モデルに入力して、推論結果及び推論モデルの処理の複数の後続のタスクの処理時間に関する情報を取得し、
　前記複数の後続のタスクを処理するタスク処理部に前記推論結果を入力して、前記複数の後続のタスクを処理させ、
　前記推論結果を前記タスク処理部に入力してから前記複数の後続のタスクの処理が終了するまでの時間を含む推論時間を測定し、
　前記センシングデータを入力データとし、前記複数の後続のタスクの処理時間に関する情報を出力データとし、測定した前記推論時間をリファレンスデータとして用いた機械学習により前記推論モデルを訓練する
　情報処理方法。
　請求項９に記載の情報処理方法をコンピュータに実行させるためのプログラム。