JP2018005357A

JP2018005357A - 情報処理装置および情報処理方法

Info

Publication number: JP2018005357A
Application number: JP2016128319A
Authority: JP
Inventors: 智行柴田; Satoyuki Shibata; 山口　修; Osamu Yamaguchi; 修山口; 雄土山地; Yuto Yamaji; 昌之丸山; Masayuki Maruyama
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2016-06-29
Filing date: 2016-06-29
Publication date: 2018-01-11
Anticipated expiration: 2036-06-29
Also published as: US10896343B2; JP6633462B2; US20180005069A1

Abstract

【課題】推定モデルを特定の場所に適応させる場合に、ユーザの負担を軽減させる。【解決手段】実施形態に係る情報処理装置は、取得部と、適応化部と、判定部と、出力部とを備える。取得部は、特定の場所に設置された撮像装置により撮像された複数の入力画像を取得する。適応化部は、複数の入力画像に基づき、画像に含まれる対象物を検出するための推定モデルを特定の場所に適応させる。判定部は、推定モデルにおける特定の場所に対する適応化状態を判定する。出力部は、適応化状態の判定結果を出力する。【選択図】図３

Description

本発明の実施形態は、情報処理装置および情報処理方法に関する。

汎用環境の学習用データを用いて機械学習した回帰モデルである推定モデルを、特定の環境下に適応させる適応化装置が知られている。

例えば、画像に含まれる人の数を推定する汎用の推定モデルを、駅の通路等を撮像した画像から通行者の数を推定する推定システムに適応させる場合、適応化装置は、駅の通路等に設置された撮像装置により撮像された画像を用いて、汎用の推定モデルを修正する。このような適応化技術は、例えば、ドメインアダプテーション、転移学習、ノウレッジトランスファー等と呼ばれる。

ところで、従来の適応化装置では、汎用の推定モデルを特定の環境下に適応させる場合、特別の知識を有するユーザ（オペレータ）等による操作が必要であった。例えば、従来の適応化装置では、オペレータ等が、特定の環境下で撮像した画像毎に、正解情報を入力しなければならなかった。また、例えば、従来の適応化装置では、オペレータ等が適応化の状態を参照して、適応化が成功したか失敗したかを判断しなければならなかった。このため、従来の適応化装置では、ユーザの負担が大きく、コストが高かった。

特開２０１５−８７９７３号公報特開２０１５−１５８７１２号公報

Shaoqing Ren， Xudong Cao， Yichen Wei， Jian Sun， "Global Refinement of Random Forest"，IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2015, pp 723-730

発明が解決しようとする課題は、推定モデルを特定の場所に適応させる場合に、ユーザの負担を軽減させることにある。

実施形態に係る情報処理装置は、取得部と、適応化部と、判定部と、出力部とを備える。前記取得部は、特定の場所に設置された撮像装置により撮像された複数の入力画像を取得する。前記適応化部は、前記複数の入力画像に基づき、画像に含まれる対象物を検出するための推定モデルを前記推定システムに適応させる。前記判定部は、前記推定モデルにおける前記特定の場所に対する適応化状態を判定する。前記出力部は、前記適応化状態の判定結果を出力する。

実施形態に係る推定システムを示す図。実施形態に係る推定システムにおける処理手順を示すフローチャート。モデル適応化機能の構成を示す図。適応化機能の構成を示す図。第１実施形態に係る判定機能の構成を示す図。情報処理装置の処理手順を示すフローチャート。適応化開始時に表示される画像を示す図。適応化中に表示される画像を示す図。適応化が成功した場合に表示される画像を示す図。適応化が失敗した場合に表示される画像を示す図。第２実施形態に係る判定機能の構成を示す図。第２実施形態に係る判定機能の処理手順を示すフローチャート。Ｓ２１３での処理手順を示すフローチャート。入力画像が不足している場合に表示される画像を示す図。Ｓ２１４での処理手順を示すフローチャート。対象物を含む入力画像が不足している場合に表示される画像を示す図。フォーカスが合っていない場合に表示される画像を示す図。コントラストが合っていない場合に表示される画像を示す図。モーションブラーが発生した場合に表示される画像を示す図。俯角が小さい場合に表示される画像を示す図。

以下、図面を参照しながら本実施形態に係る推定システム１０について説明する。なお、以下の実施形態では、同一の参照符号を付した部分は略同一の構成および動作をするので、相違点を除き重複する説明を適宜省略する。

（第１の実施形態）
図１は、実施形態に係る推定システム１０を示す図である。

推定システム１０は、対象物を撮像した画像に基づき、対象物の位置または数を推定する。本実施形態において、対象物は、人である。本実施形態において、推定システム１０は、駅等における特定の位置から撮像した画像に含まれる人の位置または数を推定する。なお、対象物は、人に限らず、例えば車両または微生物等であってもよい。

推定システム１０は、撮像装置１２と、情報処理装置２０と、入力装置２２と、表示装置２４とを備える。

撮像装置１２は、対象物が通過または滞在する所定空間を撮像可能な特定の場所に設置される。撮像装置１２は、特定の場所から所定空間を撮像する。例えば、対象物が人である場合、撮像装置１２は、駅等の人が移動する移動面を、上方から所定の角度で撮像する。撮像装置１２は、所定のフレームレートで画像を撮像し、撮像して得られたそれぞれの画像を入力画像として情報処理装置２０に与える。撮像装置１２が撮像した画像は、可視光画像、赤外線画像、距離画像等の種々の画像であってよい。

情報処理装置２０は、撮像装置１２が撮像した入力画像を用いた種々の画像処理を行い、入力画像に含まれる対象物の位置または数を推定する。対象物が人である場合、情報処理装置２０は、入力画像に含まれる人の位置または数を推定する。情報処理装置２０は、例えば、専用または汎用コンピュータである。情報処理装置２０は、ＰＣ、あるいは、画像を保存および管理するサーバに含まれるコンピュータであってもよい。

情報処理装置２０は、処理回路３２、記憶回路３４、通信部３６、各部を接続するバス３０を備える。情報処理装置２０は、例えば、バス３０を介して撮像装置１２と接続される。

処理回路３２は、対象物推定機能４２と、モデル適応化機能５０とを有する。モデル適応化機能５０は、取得機能５２と、適応化機能５４と、判定機能５６と、出力機能５８とを含む。これらの各処理機能は、後述する。

情報処理装置２０にて行われる各処理機能は、コンピュータによって実行可能なプログラムの形態で記憶回路３４へ記憶されている。処理回路３２は、プログラムを記憶回路３４から読み出し、実行することで各プログラムに対応する機能を実現するプロセッサである。各プログラムを読み出した状態の処理回路３２は、図１の処理回路３２内に示された各機能を有することになる。なお、図１においては単一の処理回路３２にて、対象物推定機能４２およびモデル適応化機能５０にて行われる処理機能が実現されるものとして説明したが、複数の独立したプロセッサを組み合わせて処理回路３２を構成し、各プロセッサがプログラムを実行することにより機能を実現するものとしても構わない。各処理機能がプログラムとして構成され、１つの回路が各プログラムを実行する場合であってもよいし、特定の機能が専用の独立したプログラム実行回路に実装される場合であってもよい。

なお、処理回路３２の有する対象物推定機能４２は、推定装置の一例である。また、処理回路３２の有するモデル適応化機能５０は、適応化装置の一例である。また、取得機能５２、適応化機能５４、判定機能５６および出力機能５８は、それぞれ、取得部、適応化部、判定部および出力部の一例である。

上記説明において用いた「プロセッサ」という文言は、例えば、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＧＰＵ（ＧｒａｐｈｉｃａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）或いは、特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ：ＡＳＩＣ）、プログラマブル論理デバイス（例えば、単純プログラマブル論理デバイス（ＳｉｍｐｌｅＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ：ＳＰＬＤ）、複合プログラマブル論理デバイス（ＣｏｍｐｌｅｘＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ：ＣＰＬＤ）およびフィールドプログラマブルゲートアレイ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ：ＦＰＧＡ））の回路を意味する。プロセッサは、記憶回路３４に保存されたプログラムを読み出し実行することで機能を実現する。なお、記憶回路３４にプログラムを保存する代わりに、プロセッサの回路内にプログラムを直接組み込むよう構成しても構わない。この場合、プロセッサは回路内に組み込まれたプログラムを読み出し実行することで機能を実現する。

記憶回路３４は、処理回路３２が行う各処理機能に伴うデータ等を必要に応じて記憶する。また、記憶回路３４は、処理回路３２により実行されるプログラムを記憶する。

また、本実施形態に係る記憶回路３４は、対象物の推定に用いられる回帰モデルである推定モデル４０を記憶する。さらに、本実施形態に係る記憶回路３４は、撮像装置１２により撮像された入力画像を記憶する。また、本実施形態に係る記憶回路３４は、推定処理および推定モデル４０の適応化処理に用いられる各種の設定値、および、ユーザインターフェース画像等を記憶する。本実施形態に係る記憶回路３４は、推定処理および推定モデル４０の適応化処理の過程において生成した各種のデータを記憶する。

例えば、記憶回路３４は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、フラッシュメモリ等の半導体メモリ素子、ハードディスク、光ディスク等である。また、記憶回路３４が行う処理は、情報処理装置２０の外部の記憶装置で代替されてもよい。記憶回路３４は、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）やインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記憶媒体であってもよい。また、記憶媒体は１つに限られず、複数の媒体から、上述した実施形態における処理が実行される場合も、実施形態における記憶媒体に含まれ、媒体の構成は何れの構成であってもよい。

通信部３６は、有線または無線で接続された外部装置と情報の入出力を行うインターフェースである。通信部３６は、ネットワークに接続して通信を行ってもよい。

入力装置２２は、操作者からの各種指示や情報入力を受け付ける。入力装置２２は、例えば、マウスまたはトラックボール等のポインティングデバイス、あるいはキーボード等の入力デバイスである。

表示装置２４は、画像データ等の各種の情報を表示する。表示装置２４は、例えば、液晶表示器等の表示デバイスである。

本実施形態の入力装置２２、表示装置２４は、有線または無線で情報処理装置２０に接続している。入力装置２２、表示装置２４は、ネットワークを介して情報処理装置２０と接続してもよい。

図２は、実施形態に係る推定システム１０における処理手順を示すフローチャートである。

まず、Ｓ１１１において、情報処理装置２０は、汎用の推定モデル４０を導入する。具体的には、情報処理装置２０は、ネットワークまたはメディア等を介して汎用の推定モデル４０を取得して、処理回路３２により参照可能なように記憶回路３４に記憶させる。

汎用の推定モデル４０は、汎用の環境下で撮像された学習用サンプル（画像および正解情報）を用いて機械学習した知識データである。すなわち、汎用の推定モデル４０は、複数の条件をカバーする大量のサンプル（画像および正解情報）から機械学習した知識データである。

続いて、Ｓ１１２において、情報処理装置２０は、導入された汎用の推定モデル４０を、特定の場所に適応させる。例えば、情報処理装置２０は、ユーザによる適応化開始指示に応じて、処理回路３２が有するモデル適応化機能５０の動作を開始させる。モデル適応化機能５０は、撮像装置１２により撮像された複数の入力画像に基づき、推定モデル４０を特定の場所に適応させるべく、推定モデル４０を修正する。つまり、情報処理装置２０は、推定モデル４０を特定の場所に調整する。これにより、情報処理装置２０は、推定モデル４０により、特定の場所に設置された撮像装置１２により撮像された画像から対象物の位置または数を推定した場合に、推定誤差を小さくすることができる。

推定モデル４０の適応化が成功した場合、Ｓ１１３において、適応化後の推定モデル４０を用いた推定処理を開始する。例えば、情報処理装置２０は、ユーザによる推定開始指示に応じて、処理回路３２が有する対象物推定機能４２の動作を開始させる。対象物推定機能４２は、適応化後の推定モデル４０を用いて、撮像装置１２により撮像された入力画像から対象物の位置または数を推定する。

ここで、本実施形態において、対象物推定機能４２は、群衆解析技術を用いて入力画像に含まれる対象物の数を推定する。より具体的には、次のように処理を実行する。まず、対象物推定機能４２は、入力画像から、対象物が存在する部分を含む複数の局所画像を抽出する。続いて、対象物推定機能４２は、推定モデル４０を用いて、それぞれの局所画像について、局所画像中における対象物の位置を表すベクトルを取得する。続いて、対象物推定機能４２は、それぞれの局所画像について、取得したベクトルから、局所画像中における人の存在を表す密度マップを生成する。

続いて、対象物推定機能４２は、それぞれの密度マップを、入力画像における対応する位置に配置することにより統合する。これにより、対象物推定機能４２は、入力画像の全体の密度マップを生成することができる。そして、対象物推定機能４２は、入力画像の全体に対応する密度マップの積分値を、入力画像に含まれる人の数として出力する。これにより、対象物推定機能４２は、群衆解析技術を用いて入力画像に含まれる対象物の数を推定することができる。

本実施形態において、対象物推定機能４２は、例えば、特許文献２に示すランダムフォレストで表される推定モデル４０を用いて、入力画像に含まれる人の数を推定してよい。この場合、対象物推定機能４２は、局所画像の各種の特徴量から、推定モデル４０を用いて、対象物の位置を表すベクトルを取得する。そして、対象物推定機能４２は、取得したベクトルから、局所画像に対応する密度マップを生成する。

また、このようなランダムフォレストで表される推定モデル４０を用いる場合、モデル適応化機能５０は、非特許文献１に記載された転移学習技術を用いて、推定モデル４０を特定の場所に適応させてもよい。なお、推定モデル４０は、画像から対象物を検出するためのモデルであれば、ランダムフォレストに限らず、どのようなモデルであってもよい。

以上のような手順で処理を実行することにより、推定システム１０は、撮像装置１２により撮像された入力画像から、対象物を推定することができる。

図３は、モデル適応化機能５０の構成の一例を示す図である。モデル適応化機能５０は、取得機能５２と、適応化機能５４と、判定機能５６と、出力機能５８とを有する。

取得機能５２は、特定の場所に設置された撮像装置１２により撮像された複数の入力画像を取得する。取得機能５２は、予め保存されている入力画像を記憶回路３４から取得してもよいし、撮像処理中の撮像装置１２から順次に入力画像を取得してもよい。

適応化機能５４は、取得機能５２が取得した複数の入力画像に基づき、推定モデル４０を特定の場所に適応させる。つまり、情報処理装置２０は、複数の入力画像に基づき、推定モデル４０を特定の場所に調整する。これにより、情報処理装置２０は、推定モデル４０により、特定の場所に設置された撮像装置１２により撮像された画像から対象物の位置または数を推定した場合に、推定誤差を小さくすることができる。適応化機能５４は、適応化処理を開始した場合、開始したことを示す情報を出力機能５８に与える。

また、適応化機能５４は、推定モデル４０の適応化処理を実行する場合に、複数の入力画像から、複数の正例データおよび複数の負例データを生成する。適応化機能５４は、生成した複数の正例データおよび複数の負例データのうちのそれぞれ一部を用いて適応化処理を実行する。なお、適応化機能５４は、複数の正例データのみを用いて適応化を実行してもよいし、複数の負例データのみを用いて適応化を実行してもよい。また、適応化機能５４は、生成した複数の正例データおよび複数の負例データのうちの適応化処理に用いていないそれぞれ一部を、判定機能５６に与える。なお、適応化機能５４は、生成した複数の正例データのみを判定機能５６に与えてもよい。適応化機能５４については、図４を参照してさらに説明する。

判定機能５６は、適応化機能５４による適応化処理が完了した後、推定モデル４０における特定の場所に対する適応化状態を判定する。すなわち、判定機能５６は、適応化機能５４による、推定モデル４０における特定の場所に対する適応化の度合い（調整の度合い）を判定する。例えば、判定機能５６は、適応化処理を実行後の推定モデル４０を検証して、適応化が成功したか、適応化が失敗したかを判定してよい。

より具体的には、判定機能５６は、適応化処理を実行後の推定モデル４０における推定精度を、適応化機能５４から受け取った複数の正例データおよび複数の負例データを用いて算出する。なお、判定機能５６は、複数の正例データのみを用いて推定精度を算出してもよいし、複数の負例データのみを用いて推定精度を算出してもよい。そして、判定機能５６は、算出した推定精度が所定精度以上である場合には、適応化が成功した状態であると判定し、推定精度が所定精度より小さい場合には、適応化が失敗した状態であると判定してよい。

判定機能５６は、推定モデル４０における適応化状態の判定結果を出力機能５８に与える。なお、判定機能５６については、図５を参照してさらに説明する。

出力機能５８は、判定機能５６から受け取った適応化状態の判定結果を出力する。すなわち、出力機能５８は、判定機能５６から受け取った適応化状態（特定の場所に対する適応化の度合い）をユーザに提供する。例えば、出力機能５８は、表示装置２４に適応化状態の判定結果を表示させる。例えば、出力機能５８は、適応化状態の判定結果として、適応化が成功したことを示す情報または適応化が失敗したことを示す情報を出力してよい。これにより、出力機能５８は、適応化が成功したか失敗したかをユーザに知らせることができる。

また、出力機能５８は、適応化機能５４による適応化処理が開始された場合、適応化中であることを示す情報を出力してもよい。また、出力機能５８は、適応化機能５４による適応化処理が終了した場合、あるいは、判定機能５６による判定処理が終了した場合、適応化が完了したことを示す情報を出力してもよい。

また、出力機能５８は、適応化が開始されたことが通知された場合、適応化が完了するまでの時間を算出してもよい。例えば、出力機能５８は、適応化機能５４が適応化に用いる複数の正例データの数等に基づいて、適応化が完了するまでの時間を算出する。そして、出力機能５８は、適応化処理が開始された場合、適応化が完了するまでの時間を示す情報を出力してもよい。

図４は、適応化機能５４の構成の一例を示す図である。適応化機能５４は、対象物検出機能６２と、抽出機能６４と、正例生成機能６６と、負例生成機能６８と、モデル修正機能７０とを含む。対象物検出機能６２、抽出機能６４、正例生成機能６６、負例生成機能６８およびモデル修正機能７０は、それぞれ、対象物検出部、抽出部、正例生成部、負例生成部およびモデル修正部の一例である。

対象物検出機能６２は、取得機能５２から入力画像を受け取る。対象物検出機能６２は、推定モデル４０を用いた対象物の検出処理とは異なる処理により、それぞれの入力画像に含まれる対象物を検出する。

例えば、推定モデル４０が、局所画像の各種の特徴量から、対象物の位置を表すベクトルを特定するラベルを推定するためのランダムフォレストであるとする。この場合、対象物検出機能６２は、このランダムフォレストを用いる以外の処理により、対象物を検出する。対象物が人である場合、例えば、対象物検出機能６２は、顔検出処理、全身検出処理、上半身検出処理または頭部検出処理等の、画像中から人体の一部分または全部を検出する方法により人を検出してよい。

また、対象物検出機能６２は、１つの入力画像に対して複数の検出処理を実行して、対象物の検出の信頼性を高くしてもよい。例えば、対象物検出機能６２は、顔検出処理、全身検出処理、上半身検出処理および頭部検出処理のうちの複数の処理を実行してもよい。また、例えば、対象物検出機能６２は、異なるアルゴリズムで、複数の顔検出処理を実行してもよい。そして、この場合、対象物検出機能６２は、所定数以上の検出処理が共に対象物として検出した部分を、対象物と検出し、所定数未満の検出処理が対象物と検出した部分は、対象物としなくてもよい。さらに、対象物検出機能６２は、時系列に並んだ複数の入力画像に基づき対象物の動きを予測して、それぞれの入力画像に含まれる対象物を検出してもよい。

また、対象物検出機能６２は、過検出がほとんど発生しないように設定された閾値によって、対象物か否かを判別してもよい。これにより、対象物検出機能６２は、誤っている可能性が非常に低い部分を対象物として検出することができ、適応化の精度を向上させることができる。このような対象物検出機能６２は、ユーザによる入力操作を受け付けずに、入力画像から対象物を自動検出することができる。

抽出機能６４は、取得機能５２から入力画像を受け取る。また、抽出機能６４は、対象物検出機能６２による対象物の検出結果を取得する。そして、抽出機能６４は、入力画像から対象物を含む局所画像を抽出する。局所画像は、推定モデル４０を用いて対象物を推定する場合における、推定モデル４０に与えるパターン画像である。

正例生成機能６６は、抽出機能６４から局所画像を取得する。また、正例生成機能６６は、対象物検出機能６２による対象物の検出結果を取得する。正例生成機能６６は、取得した対象物の検出結果から、局所画像に含まれる対象物を表す正解情報を生成する。正解情報は、例えば、対象物の数であってもよいし、対象物の位置であってもよいし、局所画像に含まれる対象物の密度を表す密度マップであってもよい。そして、正例生成機能６６は、局所画像と、局所画像に含まれる対象物を表す正解情報との組である正例データを複数個生成する。これにより、正例生成機能６６は、ユーザに正解情報を入力させずに、正例データを生成することができる。

正例生成機能６６は、生成した複数の正例データのうち一部（例えば半分）を訓練用とし、他の一部（他の半分）を検証用とする。正例生成機能６６は、訓練用の複数の正例データをモデル修正機能７０に与える。正例生成機能６６は、検証用の複数の正例データを判定機能５６に与える。

負例生成機能６８は、対象物を含まない局所画像と、対象物が存在しないことを表す正解情報との組である負例データを少なくとも１個生成する。

例えば撮像装置１２が固定されている場合、負例生成機能６８は、時間的に連続した複数の入力画像を取得する。そして、負例生成機能６８は、対象物が移動することを利用した背景自動生成技術により、時間的に連続した複数の入力画像から背景画像を生成する。そして、負例生成機能６８は、背景画像から対象物を含まない局所画像を生成する。

例えば撮像装置１２が移動する場合、負例生成機能６８は、対象物を含む局所画像として抽出されなかった領域から、対象物を含まない局所画像を生成してもよい。また、対象物検出機能６２における検出処理において、未検出がほとんど発生しないように設定された閾値によっても、対象物として判別されなかった領域から、対象物を含まない局所画像を生成してもよい。このような負例生成機能６８は、ユーザによる入力操作を受け付けずに、入力画像から対象物を含まない局所画像を生成することができる。

なお、負例データは、正例データと比較して生成すべき個数が少ない。従って、負例生成機能６８は、ユーザから対象物が存在しない領域の指定を受け付けて、負例データを生成してもよい。また、負例生成機能６８は、予め対象物が存在しない状況で撮像した入力画像を受け取って、負例データを生成してもよい。負例生成機能６８は、生成した少なくとも１個の負例データをモデル修正機能７０に与える。

負例生成機能６８は、生成した複数の負例データのうち一部（例えば半分）を訓練用とし、他の一部（他の半分）を検証用とする。負例生成機能６８は、訓練用の負例データをモデル修正機能７０に与える。負例生成機能６８は、検証用の負例データを判定機能５６に与える。なお、負例生成機能６８は、検証用の負例データを生成しなくてもよい。この場合、負例生成機能６８は、生成した全ての負例データをモデル修正機能７０に与える。

モデル修正機能７０は、正例生成機能６６から複数の正例データを受け取る。また、モデル修正機能７０は、負例生成機能６８から少なくとも１つの負例データを受け取る。モデル修正機能７０は、複数の正例データおよび少なくとも１つの負例データを用いて、推定モデル４０を特定の場所に適応させる。例えば、モデル修正機能７０は、推定モデル４０がランダムフォレストである場合、非特許文献１に記載された転移学習技術を用いて推定モデル４０を特定の場所に適応させてもよい。

このような適応化機能５４は、ユーザによる操作入力を受けずに、推定モデル４０に対する適応化処理を実行することができる。これにより、適応化機能５４によれば、特別の知識を有さないユーザにより操作をさせることができる。

図５は、第１実施形態に係る判定機能５６の構成の一例を示す図である。判定機能５６は、正例取得機能７２と、推定機能７４と、精度算出機能７６と、成否判定機能７８とを含む。正例取得機能７２、推定機能７４、精度算出機能７６および成否判定機能７８は、それぞれ、正例取得部、推定部、精度算出部および成否判定部の一例である。

正例取得機能７２は、検証用の複数の正例データおよび少なくとも１つの負例データを適応化機能５４から受け取る。なお、正例取得機能７２は、検証用の正例データのみまたは負例データのみを受け取ってもよい。正例取得機能７２は、正例データおよび負例データに含まれる局所画像を推定機能７４に与え、正例データおよび負例データに含まれる正解情報を精度算出機能７６に与える。

推定機能７４は、適応化処理を実行した後の推定モデル４０を用いて、局所画像から、局所画像に含まれる対象物を推定する。例えば、推定機能７４は、局所画像から特徴量を算出し、算出した特徴量から推定モデル４０を用いて局所画像に含まれる対象物の推定結果を出力する。推定結果は、例えば、対象物の数、位置または密度マップである。推定機能７４は、推定結果を精度算出機能７６に与える。

精度算出機能７６は、推定機能７４から受け取った推定結果と、正例取得機能７２から受け取った正解情報とに基づき、推定精度を算出する。例えば、精度算出機能７６は、正解情報に対する推定結果の一致割合を推定精度として算出する。精度算出機能７６は、複数の正例データについて算出した推定精度を合成した結果（例えば推定精度の平均値）を成否判定機能７８に与える。

成否判定機能７８は、受け取った推定精度を予め設定されている所定精度と比較する。成否判定機能７８は、推定精度が所定精度以上である場合には、適応化が成功した状態であると判定する。成否判定機能７８は、推定精度が所定精度より小さい場合には、適応化が失敗した状態であると判定する。そして、成否判定機能７８は、適応化が成功したかまたは適応化が失敗したかを示す情報を、推定モデル４０における適応化状態の判定結果として、出力機能５８に与える。

このような判定機能５６は、正例生成機能６６により生成された正例データおよび負例データにより推定精度を算出するので、特別な知識を有さないユーザにより操作をさせることができる。さらに、判定機能５６は、特別な知識を有さないユーザに適応化が成功したか失敗したかを知らせることができる。

図６は、情報処理装置２０の処理手順を示すフローチャートである。情報処理装置２０は、汎用の推定モデル４０を、特定の場所に適応させる場合、図６に示す処理を実行する。

まず、Ｓ１２１において、情報処理装置２０は、各種の設定を受け付ける。例えば、情報処理装置２０は、撮像装置１２の撮像方向（位置および俯角等）の設定を受け付けてよい。また、情報処理装置２０は、撮像装置１２のフォーカス、ゲイン、明るさ、アイリスおよび露光時間等の設定を受け付けてよい。

続いて、Ｓ１２２において、情報処理装置２０は、撮像処理を開始する。例えば、情報処理装置２０は、所定のフレームレートで、予め設定された期間、撮像処理を実行する。

続いて、Ｓ１２３において、情報処理装置２０は、適応化処理の開始の操作を受け付ける。情報処理装置２０は、Ｓ１２２の撮像処理が完了した後に、適応化処理を開始してもよいし、Ｓ１２２の撮像処理中に、適応化処理を開始してもよい。

情報処理装置２０は、例えば、図７に示すようなユーザインターフェース画像を表示して、ユーザから適応化処理の開始の指示を受け付けてよい。情報処理装置２０は、ユーザから適応化処理の開始の指示を受けた場合、モデル適応化機能５０を呼び出して、適応化処理を開始させる。

また、情報処理装置２０は、適応化処理が開始された場合、図８に示すようなユーザインターフェース画像を表示して、適応化中であることをユーザに知らせてもよい。この場合、情報処理装置２０は、入力画像の数等から適応化処理に要する時間を推定し、適応化処理が完了するまでの時間を表示してもよい。

続いて、モデル適応化機能５０は、入力画像毎に、Ｓ１２５からＳ１２８までの処理を実行する（Ｓ１２４とＳ１２９との間のループ）。ループ内では、まず、Ｓ１２５において、取得機能５２は、入力画像を取得する。続いて、Ｓ１２６において、適応化機能５４は、推定モデル４０を用いた対象物の検出処理とは異なる処理により、入力画像から対象物を検出する。

続いて、Ｓ１２７において、適応化機能５４は、入力画像から対象物を含む局所画像を抽出する。続いて、Ｓ１２８において、適応化機能５４は、抽出した局所画像についての正解情報を生成し、局所画像と正解情報との組である正例データを生成する。なお、適応化機能５４は、１つの入力画像に対して、複数の正例データを生成してもよい。

全ての入力画像について処理が完了した場合（Ｓ１２４とＳ１２９との間のループが終了）、適応化機能５４は、処理をＳ１３０に進める。Ｓ１３０において、適応化機能５４は、負例データを生成する。なお、適応化機能５４は、Ｓ１２４とＳ１２９との間のループ内において、負例データを生成してもよい。

続いて、Ｓ１３１において、適応化機能５４は、複数の正例データを訓練用と検証用とに分割する。続いて、Ｓ１３２において、適応化機能５４は、訓練用の複数の正例データおよび負例データを用いて、推定モデル４０に対する適応化処理を実行する。

続いて、判定機能５６は、検証用の正例データ毎に、Ｓ１３４からＳ１３５までの処理を実行する（Ｓ１３３とＳ１３６との間のループ）。ループ内では、まず、Ｓ１３４において、判定機能５６は、検証用の正例データに含まれる局所画像から、対象物を推定する。続いて、Ｓ１３５において、判定機能５６は、推定結果と、検証用の正例データに含まれる正解情報とを比較する。

全ての検証用の正例データについて処理が完了した場合（Ｓ１３３とＳ１３６との間のループが終了）、判定機能５６は、処理をＳ１３７に進める。Ｓ１３７において、判定機能５６は、全ての検証用の正例データにおける、推定結果と正解情報との比較結果に基づき、推定精度を算出する。

続いて、Ｓ１３８において、判定機能５６は、推定精度に基づき適応化状態を判定する。具体的には、判定機能５６は、推定精度が所定精度以上である場合には、適応化が成功した状態であると判定し、推定精度が所定精度より小さい場合には、適応化が失敗した状態であると判定する。

続いて、Ｓ１３９において、出力機能５８は、適応化状態を出力する。具体的には、出力機能５８は、適応化が成功した状態であると判定した場合には、適応化が成功したことを示す情報を出力する。例えば、出力機能５８は、図９に示すようなユーザインターフェース画像により、適応化が成功したことを示す情報を表示する。

また、出力機能５８は、適応化が失敗した状態であると判定した場合には、適応化が失敗したことを示す情報を出力する。例えば、出力機能５８は、図１０に示すようなユーザインターフェース画像により、適応化が失敗したことを示す情報を表示する。

以上のように本実施形態に係る情報処理装置２０は、推定モデル４０を特定の場所に適応させる場合に、推定モデル４０の適応化状態を判定して出力する。これにより、情報処理装置２０によれば、特別な知識を有さないユーザにも適応化状態の判定結果を認識させることができ、ユーザの負担を軽減させることができる。

（第２実施形態）
図１１は、第２実施形態に係る判定機能５６の構成を示す図である。

第２実施形態に係る判定機能５６は、失敗解析機能８２をさらに含む。失敗解析機能８２は、失敗解析部に対応する。

失敗解析機能８２は、成否判定機能７８が、適応化が失敗した状態であると判定した場合、失敗の要因を解析する。失敗解析機能８２は、適応化機能５４から、訓練用の複数の正例データおよび入力画像の数を取得する。

失敗解析機能８２は、正例データの数が予め定められた第１閾値以下、且つ、第２閾値以上であるか否かを判断する。第２閾値は、第１閾値より小さい値である。

第１閾値は、推定モデル４０の適応化処理を非常に高い確率で成功させるために必要となる、品質の良い正例データの数である。従って、失敗解析機能８２は、正例データの数が第１閾値より多かったにも関わらず推定モデル４０の適応化が失敗した場合、正例データの品質が悪かったと判断できる。

第２閾値は、十分な数の入力画像が存在するにも関わらず、第２閾値より少ない正例データしか生成できない場合には、入力画像の品質が悪い、例えば、入力画像を撮像する撮像装置１２の設定方法が悪いまたは入力画像のコンテンツが悪いと判断できる値である。

失敗解析機能８２は、適応化に失敗した場合であって、正例データの数が予め定められた第１閾値以下、且つ、第１閾値より小さい第２閾値以上である場合、適応化に用いた画像の数が少ない状態であると判定する。すなわち、失敗解析機能８２は、正例データの品質または入力画像の品質は問題ないが、適応化に用いた画像の数が少ないので適応化が失敗したと判定する。

また、失敗解析機能８２は、適応化に失敗した場合であって、正例データの数が予め定められた第１閾値より大きく、または、第１閾値より小さい第２閾値未満である場合、適応化に用いた画像の品質が悪い状態であると判定する。すなわち、失敗解析機能８２は、適応化に用いた画像数には問題が無いが、正例データの品質または入力画像の品質が悪いので、適応化が失敗したと判定する。

失敗解析機能８２は、適応化に失敗した場合、このような判定結果を推定モデル４０における適応化状態の判定結果として、出力機能５８に与える。

図１２は、第２実施形態に係る判定機能５６の処理手順を示すフローチャートである。判定機能５６は、推定モデル４０の適応化が失敗したと判定した場合、図１２に示す処理を実行する。

まず、Ｓ２１１において、判定機能５６は、適応化処理で用いた訓練用の正例データの数を取得する。続いて、Ｓ２１２において、判定機能５６は、訓練用の正例データの数が、第１閾値以下であり、且つ、第２閾値以上であるか否かを判断する。

訓練用の正例データの数が、第１閾値以下であり且つ第２閾値以上である場合（Ｓ２１２のＹｅｓ）、Ｓ２１３において、判定機能５６は、適応化に用いた画像の数が少ない状態であると判定する。そして、例えば、Ｓ２１３において、判定機能５６は、追加して取得すべき入力画像の数（または撮像時間）を算出する。さらに、判定機能５６は、適応化が失敗したこと、および、算出した追加して取得すべき入力画像の数（または撮像時間）をユーザに出力する。

これにより、判定機能５６は、適応化に用いた画像の数が少ないことが適応化に失敗した要因であるとユーザに知らせて、ユーザに適切な対応をさせることができる。そして、判定機能５６は、Ｓ２１３の処理を終えると、本フローの処理を終了する。なお、Ｓ２１３のより詳細な処理については、図１３においてさらに説明する。

一方、訓練用の正例データの数が、第１閾値より大きい、または、第２閾値未満である場合（Ｓ２１２のＮｏ）、Ｓ２１４において、判定機能５６は、適応化に用いた画像の品質が悪い状態であると判定する。そして、例えば、Ｓ２１４において、判定機能５６は、品質を悪くする要因を解析する。さらに、判定機能５６は、適応化が失敗したこと、および、品質を悪くした要因を示す情報をユーザに出力する。

これにより、判定機能５６は、適応化に用いた画像の品質が悪いことが適応化に失敗した要因であるとユーザに知らせて、ユーザに適切な対応をさせることができる。そして、判定機能５６は、Ｓ２１４の処理を終えると、本フローの処理を終了する。なお、Ｓ２１４のより詳細な処理については、図１５においてさらに説明する。

図１３は、図１２のＳ２１３での処理手順を示すフローチャートである。判定機能５６は、図１２のＳ２１３において、図１３に示す処理を実行する。

まず、Ｓ２２１において、判定機能５６は、適応化処理に用いた入力画像の数を取得する。続いて、Ｓ２２２において、判定機能５６は、入力画像の数が所定数以下であるか否かを判断する。判定機能５６は、入力画像の数が所定数以下の場合（Ｓ２２２のＹｅｓ）、処理をＳ２２３に進める。判定機能５６は、入力画像の数が所定数より大きい場合（Ｓ２２２のＮｏ）、処理をＳ２２５に進める。

Ｓ２２３において、判定機能５６は、適応化に用いた入力画像の数が少ない状態であると判定する。これにより、判定機能５６は、入力画像の数（撮像枚数）が少ないことが、適応化に失敗した要因であるとユーザに知らせることができる。

続いて、Ｓ２２４において、判定機能５６は、追加して取得すべき入力画像の数を算出する。例えば、判定機能５６は、予め設定された必要な入力画像の数から、適応化に用いた入力画像の数を減算して、追加して取得すべき入力画像の数を算出する。これにより、判定機能５６は、適応化を成功させるために必要な入力画像の数を算出することができる。Ｓ２２４の処理を終えると、判定機能５６は、処理をＳ２２７に進める。

一方、Ｓ２２５において、判定機能５６は、適応化に用いた、対象物が含まれる局所画像の数が少ない状態であると判定する。これにより、判定機能５６は、適応化に用いた局所画像の数が少ないことが、適応化に失敗した要因であるとユーザに知らせることができる。

続いて、Ｓ２２６において、判定機能５６は、補間処理により、追加して撮像すべき入力画像の数を算出する。例えば、判定機能５６は、取得した入力画像の数と適応化に用いた局所画像の数との比率に基づき、予め設定された数の局所画像を抽出するために必要となる追加して取得すべき入力画像の数を算出する。これにより、判定機能５６は、適応化を成功させるために必要な入力画像の数を算出することができる。Ｓ２２６の処理を終えると、判定機能５６は、処理をＳ２２７に進める。

Ｓ２２７において、判定機能５６は、追加して取得すべき入力画像の数から、追加して取得すべき入力画像を撮像して取得する場合の撮像時間を算出する。具体的には、判定機能５６は、追加して取得すべき入力画像の数と、フレームレートとから、撮像時間を算出する。これにより、判定機能５６は、適応化を成功させるために必要な撮像時間を算出することができる。なお、判定機能５６は、次のＳ２２８において、撮像時間を出力しない場合には、Ｓ２２７の処理を実行しなくてもよい。

続いて、Ｓ２２８において、判定機能５６は、適応化状態の判定結果を出力する。より具体的には、判定機能５６は、適応化が失敗したこと、および、入力画像の数が不足しているために適応化が失敗したことを示す情報を出力する。この場合において、判定機能５６は、追加して取得すべき入力画像の数および撮像時間の少なくとも一方も併せて出力してよい。

例えば、判定機能５６は、図１４に示すようなユーザインターフェース画像を表示して、適応化が失敗したこと、入力画像の数が不足していること、追加して取得すべき入力画像の数（または撮像時間）をユーザに通知する。

なお、判定機能５６は、Ｓ２２２において入力画像の数が所定数以下であると判断した場合（Ｓ２２２のＹｅｓ）、撮像した入力画像の数が少ないので、適応化に失敗したことをユーザに通知してもよい。また、判定機能５６は、Ｓ２２２において入力画像の数が所定数より大きいと判断した場合（Ｓ２２２のＮｏ）、撮像した入力画像の数は足りているが、対象物が含まれる局所画像の数が少ないので、適応化に失敗したことをユーザに通知してもよい。また、判定機能５６は、Ｓ２２７の処理を終えると、本フローの処理を終了する。

以上のように、判定機能５６は、適応化に失敗した場合であって、正例データの数が予め定められた第１閾値以下、且つ、第１閾値より小さい第２閾値以上である場合、適応化に用いた画像の数が少ない状態であることをユーザに通知することができる。これにより、判定機能５６によれば、特別な知識を有さないユーザであっても、適切な対応を取って、適応化を成功させることができる。

さらに、判定機能５６は、適応化を成功させるために追加して取得すべき入力画像の数または撮像時間をユーザに出力することができる。これにより、判定機能５６は、適応化を成功させるために必要なコスト（枚数または時間）を、ユーザに知らせることができる。

図１５は、図１２のＳ２１４での処理手順を示すフローチャートである。判定機能５６は、図１２のＳ２１４において、図１５に示す処理を実行する。

まず、Ｓ２３１において、判定機能５６は、対象物の含まれる局所画像の数が所定数よりも少ないか否かを判断する。所定数は、例えば第２閾値より小さい数であってよい。また、所定数は、入力画像の数に、予め設定された値を乗じた値であってもよい。判定機能５６は、対象物の含まれる局所画像の数が所定数よりも少ない場合（Ｓ２３１のＹｅｓ）、処理をＳ２３２に進める。判定機能５６は、対象物の含まれる局所画像の数が所定数以上の場合（Ｓ２３１のＮｏ）、処理をＳ２３３に進める。

Ｓ２３２において、判定機能５６は、対象物が撮像できていない状態であると判定する。これにより、判定機能５６は、対象物が撮像できていないことが、適応化に失敗した要因であるとユーザに知らせることができる。

そして、出力機能５８は、対象物が撮像できていない状態を示す情報を、適応化状態の判定結果として出力する。より具体的には、出力機能５８は、適応化が失敗したこと、および、対象物が撮像できていないために適応化が失敗したことを示す情報を出力する。

例えば、出力機能５８は、図１６に示すようなユーザインターフェース画像を表示して、適応化が失敗したこと、および、対象物が撮像できていないことをユーザに通知する。また、この場合、出力機能５８は、適応化を成功させるためのどのような処理をすべきかのアドバイスをユーザに通知してもよい。例えば、出力機能５８は、対象物である人が通行している時間帯に撮像することをユーザに通知してもよい。Ｓ２３２の処理を終えると、判定機能５６は、本フローの処理を終了する。

Ｓ２３３において、判定機能５６は、入力画像のうちの少なくとも１つを取得し、鮮鋭度を算出する。判定機能５６は、複数の入力画像の鮮鋭度を平均化してもよい。そして、判定機能５６は、鮮鋭度が所定値以下であるか否かを判断する。判定機能５６は、鮮鋭度が所定値以下の場合（Ｓ２３３のＹｅｓ）、処理をＳ２３４に進める。判定機能５６は、鮮鋭度が所定値より大きい場合（Ｓ２３３のＮｏ）、処理をＳ２３５に進める。

Ｓ２３４において、判定機能５６は、撮像装置１２のフォーカスが合っていない状態であると判定する。これにより、判定機能５６は、フォーカスが合っていないことが、適応化に失敗した要因であるとユーザに知らせることができる。

そして、出力機能５８は、撮像装置１２のフォーカスが合っていない状態を示す情報を、適応化状態の判定結果として出力する。より具体的には、出力機能５８は、適応化が失敗したこと、および、撮像装置１２のフォーカスが合っていないために適応化が失敗したことを示す情報を出力する。

例えば、出力機能５８は、図１７に示すようなユーザインターフェース画像を表示して、適応化が失敗したこと、および、撮像装置１２のフォーカスが合っていないことをユーザに通知する。また、この場合、出力機能５８は、適応化を成功させるためのどのような処理をすべきかのアドバイスをユーザに通知してもよい。例えば、出力機能５８は、フォーカスを調整すべきことをユーザに通知してもよい。Ｓ２３４の処理を終えると、出力機能５８は、本フローの処理を終了する。

Ｓ２３５において、判定機能５６は、入力画像のうちの少なくとも１つを取得し、コントラストを算出する。判定機能５６は、複数の入力画像のコントラストを平均化してもよい。そして、判定機能５６は、コントラストが所定値以下であるか否かを判断する。判定機能５６は、コントラストが所定値以下の場合（Ｓ２３５のＹｅｓ）、処理をＳ２３６に進める。判定機能５６は、コントラストが所定値より大きい場合（Ｓ２３５のＮｏ）、処理をＳ２３７に進める。

Ｓ２３６において、判定機能５６は、撮像装置１２のゲイン、明るさまたはアイリスが合っていない状態であると判定する。これにより、判定機能５６は、ゲイン、明るさまたはアイリスが合っていないことが、適応化に失敗した要因であるとユーザに知らせることができる。

そして、出力機能５８は、撮像装置１２のゲイン、明るさまたはアイリスが合っていない状態を示す情報を、適応化状態の判定結果として出力する。より具体的には、出力機能５８は、適応化が失敗したこと、および、撮像装置１２のゲイン、明るさまたはアイリスが合っていないために適応化が失敗したことを示す情報を出力する。

例えば、出力機能５８は、図１８に示すようなユーザインターフェース画像を表示して、適応化が失敗したこと、および、撮像装置１２のゲイン、明るさまたはアイリスが合っていないことをユーザに通知する。また、この場合、出力機能５８は、適応化を成功させるためのどのような処理をすべきかのアドバイスをユーザに通知してもよい。例えば、出力機能５８は、ゲイン、明るさまたはアイリスを調整すべきことをユーザに通知してもよい。Ｓ２３６の処理を終えると、出力機能５８は、本フローの処理を終了する。

Ｓ２３７において、判定機能５６は、連続する複数の入力画像を取得し、モーションブラーが発生しているか否かを検出する。そして、判定機能５６は、モーションブラーが発生しているか否かを判断する。判定機能５６は、モーションブラーが発生している場合（Ｓ２３７のＹｅｓ）、処理をＳ２３８に進める。判定機能５６は、モーションブラーが発生していない場合（Ｓ２３７のＮｏ）、処理をＳ２３９に進める。

Ｓ２３８において、判定機能５６は、撮像装置１２の露光時間が長い状態であると判定する。これにより、判定機能５６は、露光時間が長いことが、適応化に失敗した要因であるとユーザに知らせることができる。

そして、出力機能５８は、撮像装置１２の露光時間が長い状態であることを示す情報を、適応化状態の判定結果として出力する。より具体的には、出力機能５８は、適応化が失敗したこと、および、撮像装置１２の露光時間が長いために適応化が失敗したことを示す情報を出力する。

例えば、出力機能５８は、図１９に示すようなユーザインターフェース画像を表示して、適応化が失敗したこと、および、撮像装置１２の露光時間が長いことをユーザに通知する。また、この場合、出力機能５８は、適応化を成功させるためのどのような処理をすべきかのアドバイスをユーザに通知してもよい。例えば、出力機能５８は、露光時間を短くすべきことをユーザに通知してもよい。Ｓ２３８の処理を終えると、出力機能５８は、本フローの処理を終了する。

Ｓ２３９において、判定機能５６は、連続する複数の入力画像を取得し、３次元空間における対象物（例えば人）の移動面を推定する。そして、判定機能５６は、推定した移動面の消失点が、撮像装置１２の光軸より下であるか否かを判断する。判定機能５６は、推定した移動面の消失点が、撮像装置１２の光軸より下である場合（Ｓ２３９のＹｅｓ）、処理をＳ２４０に進める。判定機能５６は、推定した移動面の消失点が、撮像装置１２の光軸より下ではない場合（Ｓ２３９のＮｏ）、処理をＳ２４１に進める。

撮像装置１２により撮像した画像から推定された移動面の消失点が、撮像装置１２の光軸より下である場合、移動する対象物の位置を推定することが困難となる。すなわち、撮像装置１２の俯角が小さい場合、撮像装置１２により撮像された画像から、移動する物体の位置を推定することは困難となる。

そこで、Ｓ２４０において、判定機能５６は、撮像装置１２の俯角が小さい状態であると判定する。これにより、判定機能５６は、撮像装置１２の俯角が小さいことが、適応化に失敗した要因であるとユーザに知らせることができる。

そして、出力機能５８は、撮像装置１２の俯角が小さい状態であることを示す情報を、適応化状態の判定結果として出力する。より具体的には、出力機能５８は、適応化が失敗したこと、および、撮像装置１２の俯角が小さいために適応化が失敗したことを示す情報を出力する。

例えば、出力機能５８は、図２０に示すようなユーザインターフェース画像を表示して、適応化が失敗したこと、および、撮像装置１２の俯角が小さいことをユーザに通知する。また、この場合、出力機能５８は、適応化を成功させるためのどのような処理をすべきかのアドバイスをユーザに通知してもよい。例えば、出力機能５８は、撮像装置１２の俯角を大きくすべきことをユーザに通知してもよい。Ｓ２４０の処理を終えると、出力機能５８は、本フローの処理を終了する。

Ｓ２４１において、判定機能５６は、撮像装置１２の何れかの設定が悪い状態であると判定する。そして、出力機能５８は、撮像装置１２の何れかの設定が悪いことを示す情報を、適応化状態の判定結果として出力する。例えば、出力機能５８は、適応化が失敗したこと、および、撮像装置１２の何れかの設定が悪いことをユーザに通知する。Ｓ２４１の処理を終えると、出力機能５８は、本フローの処理を終了する。

以上のように、判定機能５６は、適応化に失敗した場合であって、正例データの数が予め定められた第１閾値より大きい、または、第２閾値未満である場合、適応化に用いた画像の品質が悪い状態であることをユーザに通知することができる。これにより、判定機能５６によれば、特別な知識を有さないユーザであっても、適切な対応を取って、適応化を成功させることができる。例えば、判定機能５６は、対象物が撮像できていない、撮像装置１２のフォーカスが合っていない、撮像装置１２のゲイン、明るさまたはアイリスが合っていない、撮像装置１２の露光時間が合っていない、および、撮像装置１２の俯角が小さい等の適応化の失敗要因をユーザに知らせて、ユーザに適切な対応を取らせることができる。

なお、実施形態におけるコンピュータまたは組み込みシステムは、記憶媒体に記憶されたプログラムに基づき、上述した実施形態における各処理を実行するためのものであって、パソコン、マイコン等の１つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。また、実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって実施形態における機能を実現することが可能な機器、装置を総称している。

なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、請求の範囲に記載された発明とその均等の範囲に含まれる。

１０推定システム
１２撮像装置
２０情報処理装置
２２入力装置
２４表示装置
３２処理回路
３４記憶回路
３６通信部
４０推定モデル
４２対象物推定機能
５０モデル適応化機能
５２取得機能
５４適応化機能
５６判定機能
５８出力機能
６２対象物検出機能
６４抽出機能
６６正例生成機能
６８負例生成機能
７０モデル修正機能
７２正例取得機能
７４推定機能
７６精度算出機能
７８成否判定機能
８２失敗解析機能

Claims

特定の場所に設置された撮像装置により撮像された複数の入力画像を取得する取得部と、
前記複数の入力画像に基づき、画像に含まれる対象物を検出するための推定モデルを前記特定の場所に適応させる適応化部と、
前記推定モデルにおける前記特定の場所に対する適応化状態を判定する判定部と、
前記適応化状態の判定結果を出力する出力部と、
を備える情報処理装置。
前記判定部は、適応化処理を実行後の前記推定モデルを検証して、適応化が成功したか、適応化が失敗したかを判定する
請求項１に記載の情報処理装置。
前記適応化部は、
前記推定モデルを用いた前記対象物の検出処理とは異なる処理により、前記入力画像に含まれる前記対象物を検出する対象物検出部と、
前記入力画像から前記対象物を含む局所画像を抽出する抽出部と、
前記局所画像と、前記局所画像に含まれる前記対象物を表す正解情報との組である正例データを複数個生成する正例生成部と、
複数の前記正例データを用いて、前記推定モデルを前記特定の場所に適応させるモデル修正部と、
を有する請求項２に記載の情報処理装置。
前記適応化部は、
前記対象物を含まない前記局所画像と、前記対象物が存在しないことを表す正解情報との組である負例データを生成する負例生成部と、
前記モデル修正部は、複数の前記正例データと前記負例データとを用いて前記推定モデルを適応化する
請求項３に記載の情報処理装置。
前記判定部は、適応化処理を実行後の前記推定モデルにおける推定精度を前記正例データおよび前記負例データの少なくとも一方を用いて算出し、算出した前記推定精度が所定精度以上である場合には、適応化が成功した状態であると判定し、前記推定精度が前記所定精度より小さい場合には、適応化が失敗した状態であると判定する
請求項４に記載の情報処理装置。
前記判定部は、適応化に失敗した場合であって、前記正例データの数が予め定められた第１閾値以下、且つ、前記第１閾値より小さい第２閾値以上である場合、適応化に用いた画像の数が少ない状態であると判定する
請求項５に記載の情報処理装置。
前記判定部は、追加して取得すべき前記入力画像の数および追加して取得すべき前記入力画像を撮像するために要する時間の少なくとも一方を算出する
請求項６に記載の情報処理装置。
前記判定部は、前記入力画像の数が所定数以下である場合、適応化に用いた前記入力画像の数が少ない状態であると判定する
請求項６または７に記載の情報処理装置。
前記判定部は、前記入力画像の数が所定数より大きい場合、適応化に用いた前記局所画像の数が少ない状態であると判定する
請求項８に記載の情報処理装置。
前記判定部は、取得した前記入力画像の数と前記局所画像の数との比率に基づき、予め設定された数の前記局所画像を抽出するために必要となる追加して取得すべき前記入力画像の数を算出する
請求項９に記載の情報処理装置。
前記判定部は、適応化に失敗した場合であって、前記正例データの数が予め定められた第１閾値より大きく、または、前記第１閾値より小さい第２閾値未満である場合、適応化に用いた画像の品質が悪い状態であると判定する
請求項５に記載の情報処理装置。
前記判定部は、前記局所画像の数が所定数以下の場合、前記対象物が撮像できていない状態であると判定する
請求項１１に記載の情報処理装置。
前記判定部は、前記入力画像の鮮鋭度が所定値以下の場合、前記撮像装置のフォーカスが合っていない状態であると判定する
請求項１１に記載の情報処理装置。
前記判定部は、前記入力画像のコントラストが所定値以下の場合、前記撮像装置のゲイン、明るさまたはアイリスが合っていない状態であると判定する
請求項１１に記載の情報処理装置。
前記判定部は、前記入力画像にモーションブラーが発生している場合、前記撮像装置の露光時間が長い状態であると判定する
請求項１１に記載の情報処理装置。
前記判定部は、前記対象物の移動面の消失点が光軸より下である場合、前記撮像装置の俯角が小さい状態であると判定する
請求項１１に記載の情報処理装置。
前記出力部は、適応化処理が開始された場合、適応化中であることを示す情報を出力する
請求項１から１６の何れか１項に記載の情報処理装置。
前記出力部は、適応化処理が開始された場合、適応化が完了するまでの時間を示す情報を出力する
請求項１から１７の何れか１項に記載の情報処理装置。
特定の場所に設置された撮像装置により撮像された複数の入力画像を取得する取得ステップと、
前記複数の入力画像に基づき、画像に含まれる対象物を検出するための推定モデルを前記特定の場所に適応させる適応化ステップと、
前記推定モデルにおける前記特定の場所に対する適応化状態を判定する判定部と、
前記適応化状態の判定結果を出力する出力ステップと、
を実行する情報処理方法。