JP7248037B2

JP7248037B2 - 画像処理装置、画像処理方法、およびプログラム

Info

Publication number: JP7248037B2
Application number: JP2020556094A
Authority: JP
Inventors: 啓文日比; 裕之森崎
Original assignee: Sony Corp; Sony Group Corp
Current assignee: Sony Corp; Sony Group Corp
Priority date: 2018-11-13
Filing date: 2019-11-06
Publication date: 2023-03-29
Anticipated expiration: 2039-11-06
Also published as: JPWO2020100664A1; WO2020100664A1; CN113056768B; CN113056768A; US20210350570A1

Description

本開示は、画像処理装置、画像処理方法、およびプログラムに関し、特に、高解像度画像における物体の検出から認識までの一連の処理にかかる処理量を低減することができるようにする画像処理装置、画像処理方法、およびプログラムに関する。

従来、撮像された動画像に写る人や物体を検出し、認識処理を行う画像処理装置がある。

例えば、特許文献１には、全方位を撮像した広範囲画像から取得した低解像度画像において被写体領域を検出し、広範囲画像において被写体領域に対応する領域に対して認識処理を行う技術が開示されている。

特開２０１３－９０５０号公報

しかしながら、高解像度画像において物体を認識する場合、その物体の検出から認識までの一連の処理にかかる処理量が増大してしまう。

本開示は、このような状況に鑑みてなされたものであり、高解像度画像における物体の検出から認識までの一連の処理にかかる処理量を低減することができるようにするものである。

本開示の画像処理装置は、第１解像度画像から、前記第１解像度画像より解像度の低い第２解像度画像を取得する第１の取得部と、前記第２解像度画像において動きオブジェクトを抽出する抽出部と、前記第２解像度画像において抽出された前記動きオブジェクトに、あらかじめ決められた所定サイズより小さい複数の画枠を設定することで、前記動きオブジェクトを分類する分類部と、前記第１解像度画像において、所定の分類の前記動きオブジェクトに対応するオブジェクト領域を特定する特定部と、前記第１解像度画像において特定された前記オブジェクト領域に対して、前記動きオブジェクトの認識処理を行う認識部とを備える画像処理装置である。

本開示の画像処理方法は、画像処理装置が、第１解像度画像から、前記第１解像度画像より解像度の低い第２解像度画像を取得し、前記第２解像度画像において動きオブジェクトを抽出し、前記第２解像度画像において抽出された前記動きオブジェクトに、あらかじめ決められた所定サイズより小さい複数の画枠を設定することで、前記動きオブジェクトを分類し、前記第１解像度画像において、所定の分類の前記動きオブジェクトに対応するオブジェクト領域を特定し、前記第１解像度画像において特定された前記オブジェクト領域に対して、前記動きオブジェクトの認識処理を行う画像処理方法である。

本開示のプログラムは、第１解像度画像から、前記第１解像度画像より解像度の低い第２解像度画像を取得し、前記第２解像度画像において動きオブジェクトを抽出し、前記第２解像度画像において抽出された前記動きオブジェクトに、あらかじめ決められた所定サイズより小さい複数の画枠を設定することで、前記動きオブジェクトを分類し、前記第１解像度画像において、所定の分類の前記動きオブジェクトに対応するオブジェクト領域を特定し、前記第１解像度画像において特定された前記オブジェクト領域に対して、前記動きオブジェクトの認識処理を行う処理をコンピュータに実行させるプログラムである。

本開示においては、第１解像度画像から、前記第１解像度画像より解像度の低い第２解像度画像が取得され、前記第２解像度画像において動きオブジェクトが抽出され、前記第２解像度画像において抽出された前記動きオブジェクトに、あらかじめ決められた所定サイズより小さい複数の画枠が設定されることで、前記動きオブジェクトが分類され、前記第１解像度画像において、所定の分類の前記動きオブジェクトに対応するオブジェクト領域が特定され、前記第１解像度画像において特定された前記オブジェクト領域に対して、前記動きオブジェクトの認識処理が行われる。

本開示に係る技術を適用した画像処理装置を示す図である。高解像度画像の例を示す図である。本開示に係る技術により検出される小物体の例を示す図である。画像処理装置の機能構成例を示すブロック図である。小物体検出処理の流れについて説明するフローチャートである。オブジェクトの抽出と分類の詳細について説明するフローチャートである。ＨＳＶ色マスクの生成により得られた画像の例を示す図である。背景差分・膨張処理により得られた処理後画像の例を示す図である。輪郭矩形の設定について説明する図である。画枠の設定について説明する図である。輪郭矩形に応じた画枠の切り替えについて説明する図である。重複の排除について説明する図である。小物体の検出結果の例を示す図である。画像処理装置の処理速度について説明する図である。画像処理装置の他の機能構成例を示すブロック図である。画像処理装置のさらに他の機能構成例を示すブロック図である。画像処理装置のさらに他の機能構成例を示すブロック図である。画像処理装置のさらに他の機能構成例を示すブロック図である。背景画像空間への射影により更新された背景画像の例を示す図である。画像処理装置のさらに他の機能構成例を示すブロック図である。色に基づいたオブジェクト抽出について説明する図である。画像処理装置のさらに他の機能構成例を示すブロック図である。コンピュータの構成例を示すブロック図である。手術室システムの全体構成を概略的に示す図である。集中操作パネルにおける操作画面の表示例を示す図である。手術室システムが適用された手術の様子の一例を示す図である。図２６に示すカメラヘッド及びＣＣＵの機能構成の一例を示すブロック図である。車両制御システムの概略的な構成の一例を示すブロック図である。車外情報検出部及び撮像部の設置位置の一例を示す説明図である。

以下、本開示を実施するための形態（以下、実施の形態とする）について説明する。なお、説明は以下の順序で行う。

１．本開示に係る小物体検出の概要
２．画像処理装置の構成と動作
３．処理速度について
４．変形例
５．コンピュータの構成例
６．応用例

＜１．本開示に係る小物体検出の概要＞
図１は、本開示に係る技術（本技術）を適用した画像処理装置を示す図である。

図１の画像処理装置１０は、撮像装置２１により撮像された高解像度画像（動画像）を取得する。画像処理装置１０は、取得した高解像度画像から物体（特に小物体）を検出し、その検出結果を表示装置２２に出力する。

撮像装置２１は、高解像度画像を撮像することが可能なＣＭＯＳ（Complementary Metal-Oxide-Semiconductor）イメージセンサやＣＣＤ（Charge Coupled Device）イメージセンサを備えるカメラにより構成される。

表示装置２２は、高解像度画像を表示することが可能なＬＣＤ（Liquid Crystal Display）や有機ＥＬ（Electro-Luminescence）ディスプレイなどにより構成される。表示装置２２には、撮像装置２１により撮像された高解像度画像に、小物体の検出結果などが重畳して表示される。本技術における画像は、表示装置２２に表示される以外にも、画像データとして、例えば図示せぬ記憶装置に記憶されるようにしてもよい。

高解像度画像は、例えば、管制官のいない空港に設けられるリモート管制塔に設置されたカメラにより撮像された画像であったり、ビルや工場、店舗、街中などを遠隔地で監視する遠隔監視装置により得られる画像であったりする。高解像度画像の解像度は、例えば４Ｋ解像度とされる。

図２は、高解像度画像の例を示す図である。図２に示される高解像度画像は、リモート管制塔に設置されたカメラにより撮像された画像であり、空港のエプロンに複数の航空機が駐機されている様子が写っている。さらに、図示はしないが、図２の高解像度画像においては、空港の上空に、複数の航空機が飛行している様子も写っている。

従来、４Ｋ解像度の高解像度画像において、遠方を飛行している航空機などのような小物体を認識する場合、その小物体の検出から認識までの一連の処理にかかる処理量が増大してしまう。具体的には、高性能のＧＰＵ（Graphics Processing Unit）により既存の物体検出手法を用いた場合であっても、４Ｋ解像度の高解像度画像において小物体を検出するのに数秒～十数秒要するほどの処理量がかかってしまう。

一方で、高解像度画像を縮小した低解像度画像においては、解像度が低いため、小物体の認識精度が落ちてしまう。

そこで、本技術を適用した画像処理装置においては、高解像度画像における小物体の検出から認識までの一連の処理にかかる処理量を低減することを実現する。具体的には、本開示に係る技術により、４Ｋ解像度の高解像度画像において、図３に示されるような１２×８，２０×１０，２８×１５，３４×２１，４１×２３，４４×２３，５４×２０画素サイズの小物体の検出から認識にかかる処理量を低減することを実現する。

＜２．画像処理装置の構成と動作＞
以下では、本技術を適用した画像処理装置１０の構成と動作について説明する。

（画像処理装置の構成）
図４は、画像処理装置１０の機能構成例を示すブロック図である。

図４の画像処理装置１０は、追尾処理部３１、中解像度画像取得部３２、オブジェクト抽出部３３、分類部３４、特定部３５、重複排除処理部３６、認識部３７、およびフィルタ処理部３８を備えている。画像処理装置１０はさらに、低解像度画像取得部３９、物体検出部４０、フィルタ処理部４１、重複排除処理部４２を備えている。

追尾処理部３１は、撮像装置２１から供給される、例えば３８４０×２１６０画素の高解像度画像において、後述する認識部３７によって認識されたオブジェクトを追尾する。追尾対象となるオブジェクトは、上述したような画素サイズの小物体とされる。追尾処理部３１は、例えば３フレーム毎などの所定フレーム毎に、追尾しているオブジェクトの位置の修正を行う。高解像度画像上で追尾されているオブジェクトの領域（以下、オブジェクト領域という）を示す情報は、重複排除処理部に３６に供給される。オブジェクト領域を示す情報には、その動きオブジェクトのサイズおよび位置（画像上の座標位置）を示す情報が含まれる。

中解像度画像取得部３２は、撮像装置２１から供給される高解像度画像から、例えば１５フレーム毎などの所定フレーム毎に、高解像度画像より解像度の低い、例えば９６０×５４０画素の中解像度画像を取得する。具体的には、中解像度画像取得部３２は、画像の解像度を変換する解像度変換機能を有しており、高解像度画像に対して、間引き処理などのダウンコンバート処理を施すことにより、中解像度画像を取得する。取得された中解像度画像は、オブジェクト抽出部３３と低解像度画像取得部３９に供給される。なお、低解像度画像取得部３９には、撮像装置２１から供給される高解像度画像がそのまま供給されるようにしてもよい。

なお、図４の画像処理装置１０において、破線で囲まれる機能ブロックは、中解像度画像取得部３２と同様、１５フレーム毎に各処理を繰り返す。

オブジェクト抽出部３３は、中解像度画像取得部３２からの中解像度画像において、所定のオブジェクトを抽出する。ここでは、中解像度画像において、動きのある動きオブジェクトが抽出されるものとするが、抽出手法によっては、動きのない静止オブジェクトが抽出されてもよい。抽出される動きオブジェクトには、追尾対象となる小物体の他、追尾対象ではない物体も含まれる。オブジェクト抽出部３３は、抽出された動きオブジェクトを示す情報を分類部３４に供給する。動きオブジェクトを示す情報には、その動きオブジェクトのサイズおよび座標位置を示す情報が含まれる。

分類部３４は、オブジェクト抽出部３３からの情報に基づいて、中解像度画像に含まれる動きオブジェクトを、所定の条件で分類する。分類部３４は、分類された動きオブジェクトを示す情報を特定部３５に供給する。

特定部３５は、分類部３４からの情報に基づいて、高解像度画像において、所定の分類の動きオブジェクトに対応するオブジェクト領域を特定する。オブジェクト領域を示す情報（オブジェクトのサイズおよび座標位置）は、重複排除処理部３６に供給される。

重複排除処理部３６は、追尾処理部３１からの情報と、特定部３５からの情報とに基づいて、高解像度画像において、追尾処理部３１により追尾されているオブジェクト領域と、特定部３５により特定されたオブジェクト領域との重複を排除する。高解像度画像において重複が排除されたオブジェクト領域を示す情報は、認識部３７に供給される。

認識部３７は、重複排除処理部３６からの情報に基づいて、高解像度画像におけるオブジェクト領域に対して、動きオブジェクトの認識処理を行う。具体的には、認識部３７は、教師データを用いた機械学習による画像分類を行うことで、動きオブジェクトの認識処理を行う。認識部３７は、オブジェクト領域内の動きオブジェクトが、認識対象とする小物体であることの確かさを表す確信度をフィルタ処理部３８に供給する。

フィルタ処理部３８は、時系列フィルタ処理を行うことで、認識部３７からの確信度を時系列に判定することで確信度を決定する。決定された確信度が例えば一定値より大きい動きオブジェクトを示す情報は、小物体の検出結果として重複排除処理部４２に供給される。

低解像度画像取得部３９は、中解像度画像取得部３２からの中解像度画像から、中解像度画像よりさらに解像度の低い、例えば３００×３００画素の低解像度画像を取得する。具体的には、低解像度画像取得部３９は、画像の解像度を変換する解像度変換機能を有しており、中解像度画像に対して、間引き処理などのダウンコンバート処理を施すことにより、低解像度画像を取得する。取得された低解像度画像は、物体検出部４０に供給される。なお、中解像度画像取得部３２から、撮像装置２１からの高解像度画像がそのまま供給される場合、低解像度画像取得部３９は、高解像度画像に対してダウンコンバート処理を施すことにより、低解像度画像を取得することができる。

物体検出部４０は、低解像度画像取得部３９からの低解像度画像に対して、物体検出部を行う。物体検出結果は、フィルタ処理部４１に供給される。

フィルタ処理部４１は、時系列フィルタ処理を行うことで、物体検出部４０からの物体検出結果を時系列に判定することで、物体検出結果を決定する。決定された物体検出結果は、重複排除処理部４２に供給する。

重複排除処理部４２は、フィルタ処理部３８からの小物体の検出結果と、物体検出部４０からの物体検出結果とに基づいて、高解像度画像において認識された動きオブジェクト（小物体）と、物体検出部４０により検出された物体との重複を排除する。高解像度画像において重複が排除されたオブジェクト領域を示す情報は、最終的な小物体の検出結果として出力される。

（画像処理装置の動作）
次に、図５のフローチャートを参照して、画像処理装置１０による小物体検出処理の流れについて説明する。図５の処理において、ステップＳ１１の処理は３フレーム毎に、ステップＳ２１乃至Ｓ２８の処理と、ステップＳ３１乃至Ｓ３３の処理は１５フレーム毎に実行される。

ステップＳ１１において、追尾処理部３１は、高解像度画像において動きオブジェクト（小物体）を追尾する。ステップＳ１１の処理は、画像処理装置１０に高解像度画像の所定フレームに対して、一度ステップＳ２１乃至Ｓ２８，Ｓ３１乃至Ｓ３３の処理が実行されて以降に行われる。

動きオブジェクトの追尾には、テンプレートマッチングなどの領域ベースの物体追跡方法や、ＫＬＴ法などの特徴点ベースの物体追跡方法が用いられる。例えば、動きオブジェクトの追尾には、物体を追跡しながら物体テンプレートを随時学習するＫＣＦ（Kernelized Correlation Filter）による物体追跡方法を用いることができる。高解像度画像において追尾されている動きオブジェクトには、後述するような画枠が設定され、高解像度画像から、画枠が設定されている領域が切り出される。

一方、ステップＳ２１においては、中解像度画像取得部３２が、高解像度画像から解像度画像を取得する。

ステップＳ２２において、オブジェクト抽出部３３は、中解像度画像取得部３２により取得された中解像度画像において動きオブジェクトを抽出する。

ステップＳ２３において、分類部３４は、オブジェクト抽出部３３によって中解像度画像から抽出された動きオブジェクトを分類する。

ここで、図６のフローチャートを参照して、ステップＳ２２，Ｓ２３における動きオブジェクトの抽出と分類の詳細について説明する。

ステップＳ５１においては、中解像度画像に基づいて、ＨＳＶ色マスク画像が生成される。ＨＳＶ色マスク画像によれば、Ｈ（色相），Ｓ（彩度），Ｖ（明度）の値を指定することで、中解像度画像から特定の色の領域を抽出することができる。

図７は、図２の高解像度画像から取得された中解像度画像に基づいて生成されたＨＳＶ色マスク画像の例である。図７に示されるＨＳＶ色マスク画像は、中解像度画像から空の色を抽出するマスク画像である。ここでは、空の色を抽出するマスク画像に限らず、例えばエプロンや滑走路の舗装面の色を抽出するマスク画像が生成されるようにしてもよい。

ステップＳ５２においては、中解像度画像において、ＨＳＶ色マスク画像により色が抽出された領域に対して背景差分・膨張処理が行われる。背景差分によれば、中解像度画像から、前フレームと現フレームとの比較により動きのある動きオブジェクトが抽出される。また、膨張処理によれば、背景差分により抽出された動きオブジェクトの画素領域を膨張させることができる。

図８は、中解像度画像において、図７のＨＳＶ色マスク画像により色が抽出された領域に対する背景差分・膨張処理により得られた処理後画像の例を示す図である。

図８の処理後画像においては、中解像度画像における空の領域に存在する動きオブジェクトが、白画素の集合として複数（具体的には５個）示されている。これらの動きオブジェクトの中には、追尾対象となる航空機の他、追尾対象ではない物体も含まれる。

ステップＳ５３においては、図９に示されるように、抽出された動きオブジェクトの輪郭が収まる輪郭矩形が設定される。図９においては、図８を参照して説明した５個の動きオブジェクトそれぞれについて輪郭矩形が示されている。

ステップＳ５４においては、図１０に示されるように、輪郭矩形が設定された動きオブジェクトに対して画枠が設定される。画枠は、高解像度画像において追尾対象を含むオブジェクト領域を特定するための情報である。図１０の例では、図９を参照して説明した、輪郭矩形が抽出された５個の動きオブジェクトそれぞれについて、画枠が設定されている。

画枠のサイズは、あらかじめ決められた所定サイズより小さく、複数の異なるサイズの画枠が用意される。動きオブジェクトについて設定された輪郭矩形のサイズに応じて、設定される画枠のサイズが切り替わる。あらかじめ決められた所定サイズは、動きオブジェクトを小物体として検出することができる画枠のサイズの上限となる。これにより、ある大きさを超えない動きオブジェクトは、小物体として検出され、ある大きさを超える動きオブジェクトは、後述する大物体として検出されるようになる。

図１１は、輪郭矩形に応じた画枠の切り替えについて説明する図である。

図１１左上には、所定の動きオブジェクトについて設定された輪郭矩形１１０が示されている。図１１右側には、サイズの異なる複数（具体的には３つ）の画枠１２０ａ，１２０ｂ，１２０ｃが示されている。

例えば、画枠１２０ａのサイズは、高解像度画像の１２８×６４画素に対応した１６×８画素とされ、画枠１２０ｂのサイズは、高解像度画像の２５６×１２８画素に対応した３２×１６画素とされる。また、画枠１２０ｃのサイズは、高解像度画像の５１２×２５６画素に対応した６４×３２画素とされる。

動きオブジェクトに対して画枠が設定される際、輪郭矩形１１０の対角線Ｄ１の長さと、画枠１２０（１２０ａ，１２０ｂ，１２０ｃ）の対角線Ｄ２（Ｄ２ａ，Ｄ２ｂ，Ｄ２ｃ）の長さとが、サイズの小さい画枠から順番に比較される。具体的には、輪郭矩形１１０の対角線Ｄ１の長さが、画枠１２０の対角線Ｄ２の長さの７５％（Ｄ２×０．７５）を超える毎に、１つ上のサイズの画枠１２０の対角線Ｄ２の長さとの比較が繰り返される。そして、輪郭矩形１１０の対角線Ｄ１の長さが、画枠１２０の対角線Ｄ２の長さの７５％未満となったとき、動きオブジェクトに対してその画枠１２０が設定される。

すなわち、画枠の設定により、抽出された動きオブジェクトは、その大きさに基づいて分類されることになる。

なお、設定される画枠のサイズは、抽出された動きオブジェクトが存在する領域によって限定されてもよい。例えば、航空機がより小さく写る空の領域に存在する動きオブジェクトには、１６×８画素の画枠のみが設定されるようにする。また、空の領域より航空機が大きく見える舗装面の領域に存在する動きオブジェクトには、３２×１６画素または６４×３２画素の画枠が設定されるようにする。

また、その大きさに基づいて分類された動きオブジェクトには、その動きオブジェクトが抽出された時点で、中解像度画像上の座標位置が設定される。中解像度画像上に設定される動きオブジェクトの座標位置は、例えば、その動きオブジェクトに設定された輪郭矩形の中心となる。

このようにして、動きオブジェクトがその大きさに基づいて分類されると、図５のステップＳ２４に進む。

ステップＳ２４において、特定部３５は、高解像度画像において、大きさに基づいて分類された各動きオブジェクトに対応するオブジェクト領域を特定する。

具体的には、特定部３５は、中解像度画像において動きオブジェクト毎に設定された画枠を、高解像度画像上に座標変換することで、オブジェクト領域を特定する。

例えば、中解像度画像上の座標位置（100，50）を中心とした５×５画素サイズの動きオブジェクト（輪郭矩形）に、１６×８画素の画枠が設定されたとする。この場合、座標位置（100，50）を中心とした１６×８画素の画枠は、高解像度画像上の座標位置（400，200）を中心とした１２８×６４画素の画枠に座標変換され、座標変換後の画枠の領域がオブジェクト領域となる。

ここでは、高解像度画像から、特定されたオブジェクト領域（座標変換後の画枠の領域）が切り出される。

ステップＳ２５において、重複排除処理部３６は、高解像度画像において、追尾処理部３１により追尾されている動きオブジェクト領域と、特定部３５により特定されたオブジェクト領域との重複を排除する。ここでは、ＩｏＵ（Intersection Over Union）を用いることで、追尾されている動きオブジェクト領域と、特定されたオブジェクト領域との重複が排除される。

ＩｏＵによれば、図１２に示されるように、物体領域１３１と物体領域１３２の面積全体のうち、互いに重なっている部分の面積の割合が所定の閾値（例えば０．５）を超える場合に、物体領域１３１と物体領域１３２が重複していると判断される。この場合、物体領域１３１と物体領域１３２とは、同一の物体領域１４１と判断される。

このようにして、追尾されている動きオブジェクト領域と、特定されたオブジェクト領域との重複が排除されると、ステップＳ２６に進む。

ステップＳ２６において、認識部３７は、高解像度画像において、追尾されている動きオブジェクト領域との重複が排除されたオブジェクト領域に対して、動きオブジェクトの認識処理を行う。

このとき、認識部３７は、特定されたオブジェクト領域のサイズを、動きオブジェクトの認識処理に用いられる所定のオブジェクトの画像である教師データの画素サイズに基づいて正規化する。具体的には、オブジェクト領域のサイズは、全て１２８×６４画素のサイズに正規化される。これにより、６４個のオブジェクト領域に対する認識処理が同時に行われるようになる。

認識部３７は、教師データであらかじめ学習された学習モデルを用いて、オブジェクト領域を二値分類することで、オブジェクト領域内の動きオブジェクトが航空機らしいか否かを判別する。その結果、オブジェクト領域内の動きオブジェクトが、認識対象とする小物体（航空機）であることの確からしさを表す確信度が算出される。

ステップＳ２７において、フィルタ処理部３８は、時系列フィルタ処理を行うことで、認識部３７により算出された確信度を時系列に判定することで、確信度を決定する。ここでは、例えば、決定された確信度の値の大きさが上位３つの動きオブジェクトを示す情報が、小物体（航空機）の検出結果とされる。

ここで、ステップＳ２８の処理について説明する前に、ステップＳ３１乃至Ｓ３３の処理について説明する。

ステップＳ３１においては、低解像度画像取得部３９が、中解像度画像取得部３２からの中解像度画像から低解像度画像を取得する。

ステップＳ３２において、物体検出部４０は、低解像度画像取得部３９により取得された低解像度画像に対して、物体検出を行う。ここでは、低解像度画像に対する物体検出が行われることから、検出対象は、上述した小物体のような小さい物体ではなく、比較的大きい物体（大物体）が検出される。

ステップＳ３３において、フィルタ処理部４１は、時系列フィルタ処理を行うことで、物体検出部４０からの物体検出結果を時系列に判定することで、物体検出結果を決定する。

そして、ステップＳ２８において、重複排除処理部４２は、高解像度画像において認識された動きオブジェクト（小物体）と、低解像度画像において検出された大物体との重複を排除する。ここでも、ＩｏＵを用いることで、認識された動きオブジェクト領域と、検出された大物体の領域との重複が排除される。

このようにして、最終的な小物体の検出結果が出力される。

図１３は、小物体の検出結果の例を示す図である。

図１３においては、図２の高解像度画像に、動きオブジェクトの抽出結果と、抽出された動きオブジェクトの中で航空機と判別された検出結果とが重畳されて示されている。

図中、画枠１６１，１６２，１６３は、航空機の検出結果を示しており、その他の画枠は、航空機以外の動きオブジェクトの抽出結果を示している。画枠１６１，１６２，１６３の近傍には、確信度の値が示されている。すなわち、画枠１６１で特定される動きオブジェクトが、最も航空機である可能性が高いといえる。

以上の処理によれば、高解像度画像から取得した中解像度画像において、所定サイズより小さい動きオブジェクトが分類され、分類された動きオブジェクトに対応する領域が高解像度画像上で、認識対象の候補として特定される。これにより、高解像度画像における物体（特に小物体）の検出から認識までの一連の処理にかかる処理量を低減することが可能となる。結果として、４Ｋ解像度のような高解像度画像においてリアルタイムに小物体を追尾することが可能となる。

特に、動きオブジェクトは、画枠の設定によりその大きさに基づいて分類されるようにしたので、従来よりも小さい物体を認識／追尾することができる上、その認識精度を高めることができる。

＜３．処理速度について＞
ここで、図１４を参照して、本技術の画像処理装置１０の処理速度について説明する。画像処理装置１０は、図中、太枠で囲われる各ブロック単位で実行される処理にかかる時間が、以下のような値になるように設計される。

認識部３７による認識処理は、１２８×６４画素のサイズの６４個のオブジェクト領域に対して実行され、その処理時間は２０ｍｓとする。

３フレーム毎に実行される追尾処理部３１による追尾処理の処理時間は、１物体あたり１５ｍｓとする。したがって、３０フレームあたりの追尾処理の処理時間は、１５０ｍｓ×物体数となる。

１５フレーム毎に実行される処理のうち、オブジェクト抽出部３３乃至フィルタ処理部３８による小物体の検出処理の処理時間は、１２×８画素の小物体を検出する場合で、２２０ｍｓとする。また、物体検出部４０とフィルタ処理部４１による大物体の検出処理の処理時間は、７０ｍｓとする。

小物体の検出処理と大物体の検出処理とがシリアルに実行される場合、１５フレーム毎に実行される処理の処理時間は、２９０ｍｓとなる。したがって、３０フレームあたりの小物体の検出処理と大物体の検出処理の処理時間は、５８０ｍｓとなる。

すなわち、上述した一連の処理には、３０フレームあたり１５０ｍｓ×物体数と５８０ｍｓとを合算した時間がかかることになる。ここで、通常１秒３０フレームであるとすると、小物体の数が３個であれば、一連の処理にかかる時間を１秒程度に収めることができる。また、上述した一連の処理が並列に実行されるようにした場合には、より多くのオブジェクトの認識であっても、一連の処理にかかる時間を１秒程度に収めることができる。

＜４．変形例＞
以下においては、上述した実施の形態における変形例について説明する。

（変形例１）
図１５は、画像処理装置１０の第１の変形例である画像処理装置１０Ａの機能構成例を示すブロック図である。

図１５の画像処理装置１０Ａは、中解像度画像取得部３２の前段に、高解像度化処理部２１１が設けられている点で、図１の画像処理装置１０と異なる。

高解像度化処理部２１１は、撮像装置２１から供給される高解像度画像に対して、エッジ強調などの高解像度化処理を施し、中解像度画像取得部３２に供給する。

このような構成により、オブジェクト抽出部３３には、物体のエッジが強調された中解像度画像が供給されるので、オブジェクト抽出部３３によるオブジェクトの抽出性能を向上させることができる。

（変形例２）
図１６は、画像処理装置１０の第２の変形例である画像処理装置１０Ｂの機能構成例を示すブロック図である。

図１６の画像処理装置１０Ｂは、オブジェクト抽出部３３の前段に、高解像度背景画像生成部２２１が設けられている点で、図１の画像処理装置１０と異なる。

高解像度背景画像生成部２２１は、中解像度画像取得部３２からの中解像度画像において背景部分を拡大（高解像度化）することで、高解像度背景画像を生成する。生成された高解像度背景画像は、オブジェクト抽出部３３に供給される。

オブジェクト抽出部３３においては、高解像度背景画像上で、背景差分により動きオブジェクトが抽出される。

このような構成により、より小さい動きオブジェクトの抽出精度を向上させることができる。

（変形例３）
図１７は、画像処理装置１０の第３の変形例である画像処理装置１０Ｃの機能構成例を示すブロック図である。

図１７の画像処理装置１０Ｃは、認識部３７に代えて、認識部２３１が設けられている点で、図１の画像処理装置１０と異なる。

認識部２３１は、ＲＮＮ（Recurrent Neural Network）を用いて、１５フレーム毎の静止画像ではなく動画像に対して、動きオブジェクトの認識処理を行う。

このような構成により、他の物体に見え隠れするような小物体であっても、高い精度で認識処理を行うことができる。

（変形例４）
図１８は、画像処理装置１０の第４の変形例である画像処理装置１０Ｄの機能構成例を示すブロック図である。

図１８の画像処理装置１０Ｄは、オブジェクト抽出部３３の前段に、背景画像空間射影部２４１と高解像度背景画像生成部２４２が設けられている点で、図１の画像処理装置１０と異なる。

背景画像空間射影部２４１は、中解像度画像取得部３２からの中解像度画像を、背景画像空間へ射影することで背景画像を更新する。背景画像空間へ射影された中解像度画像は、高解像度背景画像生成部２４２に供給される。背景画像空間は、撮像装置２１により撮像され得る撮像範囲に対応する。撮像装置２１の撮像範囲に動きがある場合、背景画像は、背景画像空間上で時間的に変化する。

図１９は、背景画像空間への射影により更新される背景画像の例を示す図である。

図１９に示される背景画像は、異なる５つの撮像範囲で撮影された背景画像ＢＧ１乃至ＢＧ５から構成される。中解像度画像取得部３２から、背景画像ＢＧ１乃至ＢＧ５とは異なる撮像範囲の中解像度画像が供給された場合、背景画像空間上でその撮像範囲に対応する位置に中解像度画像が射影され、図１９の背景画像が更新される。

高解像度背景画像生成部２４２は、背景画像空間射影部２４１からの、背景画像空間へ射影された中解像度画像において背景部分を拡大（高解像度化）することで、高解像度背景画像を生成する。生成された高解像度背景画像は、オブジェクト抽出部３３に供給される。

このような構成により、撮像装置２１の撮像範囲に動きがある場合であっても、より小さい動きオブジェクトの抽出精度を向上させることができる。

（変形例５）
図２０は、画像処理装置１０の第５の変形例である画像処理装置１０Ｅの機能構成例を示すブロック図である。

図２０の画像処理装置１０Ｅは、オブジェクト抽出部３３に代えて、オブジェクト抽出部２５１が設けられている点で、図１の画像処理装置１０と異なる。

オブジェクト抽出部２５１は、中解像度画像取得部３２からの中解像度画像において、所定の色のオブジェクトを抽出する。オブジェクト抽出部２５１は、例えば図２１に示されるように、中解像度画像において、ＨＳＶ色空間のＨ（色相）が８０乃至１２０の物体のみを抽出する。抽出されたオブジェクトを示す情報は、分類部３４に供給される。

このような構成により、高解像度画像において特定の色の小物体を追尾することができる。

（変形例６）
図２２は、画像処理装置１０の第６の変形例である画像処理装置１０Ｆの機能構成例を示すブロック図である。

図２２の画像処理装置１０Ｆは、オブジェクト抽出部３３が設けられず、かつ、分類部３４に代えて、分類部２６１が設けられている点で、図１の画像処理装置１０と異なる。

分類部２６１は、物体検出部４０からの物体検出結果に基づいて、低解像度画像に含まれる物体を、例えばその大きさに基づいて分類する。分類部３４は、分類された物体を示す情報を特定部３５に供給する。特定部３５からフィルタ処理部３８までの処理は、低解像度画像において分類された物体について行われることになる。

このような構成により、高解像度画像において比較的小さい物体を追尾することができる。

（その他の変形例）
上述した例では、認識部３７は、動きオブジェクトの認識処理において、オブジェクト領域を二値分類するものとしたが、認識対象とする小物体の種類が複数ある場合には、オブジェクト領域を多値分類するようにしてもよい。これにより、例えば、航空機に加えて、鳥などの航空機以外の物体（生物）を検出することができる。

また、認識部３７は、例えば航空機の認識処理を行う際、航空機の色や、その機体に描かれた文字（社名やその略称）の認識処理を行うようにしてもよい。これにより、認識された航空機がどの航空会社の機体であるかが判別されるようになる。

また、上述した例では、分類部３４は、動きオブジェクトの大きさに基づいて、動きオブジェクトを分類するものとしたが、画像上の動きオブジェクトの位置や、動きオブジェクトの動きの速さに基づいて、動きオブジェクトをさらに分類するようにしてもよい。

画像内の動きオブジェクトの位置に基づいて、動きオブジェクトを分類するようにした場合、例えば、空の領域の動きオブジェクトを分類することで、上空を飛行している航空機のみを検出することができる。また、舗装面の領域の動きオブジェクトを分類することで、地上（滑走路）を滑走している航空機のみを検出することができる。

また、動きオブジェクトの動きの速さに基づいて、動きオブジェクトを分類するようにした場合、例えば、低速で移動している動きオブジェクトを分類することで、遠方の上空を飛行している航空機のみを検出することができる。動きオブジェクトの動きの速さは、例えば、連続する２フレームにおける動きオブジェクトの位置を比較して得られた距離を、２フレーム間の時間で除算することで求められる。また、動きオブジェクトの座標位置の移動を追跡し、時系列で等速に移動しているか否かに応じて、航空機が検出されるようにしてもよい。なお、追尾処理の画枠を超えるほど動きの速い動きオブジェクトは、追尾対象外とされてもよい。

＜５．コンピュータの構成例＞
上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

図２３は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

上述した画像処理装置１０は、図２３に示す構成を有するコンピュータにより実現される。

ＣＰＵ１００１、ＲＯＭ１００２、ＲＡＭ１００３は、バス１００４により相互に接続されている。

バス１００４には、さらに、入出力インタフェース１００５が接続されている。入出力インタフェース１００５には、キーボード、マウスなどよりなる入力部１００６、ディスプレイ、スピーカなどよりなる出力部１００７が接続される。また、入出力インタフェース１００５には、ハードディスクや不揮発性のメモリなどよりなる記憶部１００８、ネットワークインタフェースなどよりなる通信部１００９、リムーバブルメディア５１１を駆動するドライブ１０１０が接続される。

以上のように構成されるコンピュータでは、ＣＰＵ１００１が、例えば、記憶部１００８に記憶されているプログラムを入出力インタフェース１００５およびバス１００４を介してＲＡＭ１００３にロードして実行することにより、上述した一連の処理が行われる。

ＣＰＵ１００１が実行するプログラムは、例えばリムーバブルメディア１０１１に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供され、記憶部１００８にインストールされる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたときなどの必要なタイミングで処理が行われるプログラムであっても良い。

＜６．応用例＞
以上においては、本開示に係る技術は、リモート管制塔のカメラシステムにより得られる画像において、遠方を飛行している航空機などのような小物体を追尾する構成に適用されるものとした。これ以外にも、本開示に係る技術は、ビルや工場、店舗、街中などを遠隔地で監視する遠隔監視装置により得られる画像において、遠方にいる人や小動物を追尾する構成に適用されてもよい。また、本開示に係る技術は、サッカーや野球などのスポーツの中継画像において、ボールを追尾する構成に適用されてもよい。

さらに、本開示に係る技術は、様々な製品へ応用することができる。

（手術室システムへの適用）
例えば、本開示に係る技術は、手術室システムに適用されてもよい。

図２４は、本開示に係る技術が適用され得る手術室システム５１００の全体構成を概略的に示す図である。図２４を参照すると、手術室システム５１００は、手術室内に設置される装置群が視聴覚コントローラ（AV Controller）５１０７及び手術室制御装置５１０９を介して互いに連携可能に接続されることにより構成される。

手術室には、様々な装置が設置され得る。図２４では、一例として、内視鏡下手術のための各種の装置群５１０１と、手術室の天井に設けられ術者の手元を撮像するシーリングカメラ５１８７と、手術室の天井に設けられ手術室全体の様子を撮像する術場カメラ５１８９と、複数の表示装置５１０３Ａ～５１０３Ｄと、レコーダ５１０５と、患者ベッド５１８３と、照明５１９１と、を図示している。

ここで、これらの装置のうち、装置群５１０１は、後述する内視鏡手術システム５１１３に属するものであり、内視鏡や当該内視鏡によって撮像された画像を表示する表示装置等からなる。内視鏡手術システム５１１３に属する各装置は医療用機器とも呼称される。一方、表示装置５１０３Ａ～５１０３Ｄ、レコーダ５１０５、患者ベッド５１８３及び照明５１９１は、内視鏡手術システム５１１３とは別個に、例えば手術室に備え付けられている装置である。これらの内視鏡手術システム５１１３に属さない各装置は非医療用機器とも呼称される。視聴覚コントローラ５１０７及び／又は手術室制御装置５１０９は、これら医療機器及び非医療機器の動作を互いに連携して制御する。

視聴覚コントローラ５１０７は、医療機器及び非医療機器における画像表示に関する処理を、統括的に制御する。具体的には、手術室システム５１００が備える装置のうち、装置群５１０１、シーリングカメラ５１８７及び術場カメラ５１８９は、手術中に表示すべき情報（以下、表示情報ともいう）を発信する機能を有する装置（以下、発信元の装置とも呼称する）であり得る。また、表示装置５１０３Ａ～５１０３Ｄは、表示情報が出力される装置（以下、出力先の装置とも呼称する）であり得る。また、レコーダ５１０５は、発信元の装置及び出力先の装置の双方に該当する装置であり得る。視聴覚コントローラ５１０７は、発信元の装置及び出力先の装置の動作を制御し、発信元の装置から表示情報を取得するとともに、当該表示情報を出力先の装置に送信し、表示又は記録させる機能を有する。なお、表示情報とは、手術中に撮像された各種の画像や、手術に関する各種の情報（例えば、患者の身体情報や、過去の検査結果、術式についての情報等）等である。

具体的には、視聴覚コントローラ５１０７には、装置群５１０１から、表示情報として、内視鏡によって撮像された患者の体腔内の術部の画像についての情報が送信され得る。また、シーリングカメラ５１８７から、表示情報として、当該シーリングカメラ５１８７によって撮像された術者の手元の画像についての情報が送信され得る。また、術場カメラ５１８９から、表示情報として、当該術場カメラ５１８９によって撮像された手術室全体の様子を示す画像についての情報が送信され得る。なお、手術室システム５１００に撮像機能を有する他の装置が存在する場合には、視聴覚コントローラ５１０７は、表示情報として、当該他の装置からも当該他の装置によって撮像された画像についての情報を取得してもよい。

あるいは、例えば、レコーダ５１０５には、過去に撮像されたこれらの画像についての情報が視聴覚コントローラ５１０７によって記録されている。視聴覚コントローラ５１０７は、表示情報として、レコーダ５１０５から当該過去に撮像された画像についての情報を取得することができる。なお、レコーダ５１０５には、手術に関する各種の情報も事前に記録されていてもよい。

視聴覚コントローラ５１０７は、出力先の装置である表示装置５１０３Ａ～５１０３Ｄの少なくともいずれかに、取得した表示情報（すなわち、手術中に撮影された画像や、手術に関する各種の情報）を表示させる。図示する例では、表示装置５１０３Ａは手術室の天井から吊り下げられて設置される表示装置であり、表示装置５１０３Ｂは手術室の壁面に設置される表示装置であり、表示装置５１０３Ｃは手術室内の机上に設置される表示装置であり、表示装置５１０３Ｄは表示機能を有するモバイル機器（例えば、タブレットＰＣ（Personal Computer））である。

また、図２４では図示を省略しているが、手術室システム５１００には、手術室の外部の装置が含まれてもよい。手術室の外部の装置は、例えば、病院内外に構築されたネットワークに接続されるサーバや、医療スタッフが用いるＰＣ、病院の会議室に設置されるプロジェクタ等であり得る。このような外部装置が病院外にある場合には、視聴覚コントローラ５１０７は、遠隔医療のために、テレビ会議システム等を介して、他の病院の表示装置に表示情報を表示させることもできる。

手術室制御装置５１０９は、非医療機器における画像表示に関する処理以外の処理を、統括的に制御する。例えば、手術室制御装置５１０９は、患者ベッド５１８３、シーリングカメラ５１８７、術場カメラ５１８９及び照明５１９１の駆動を制御する。

手術室システム５１００には、集中操作パネル５１１１が設けられており、ユーザは、当該集中操作パネル５１１１を介して、視聴覚コントローラ５１０７に対して画像表示についての指示を与えたり、手術室制御装置５１０９に対して非医療機器の動作についての指示を与えることができる。集中操作パネル５１１１は、表示装置の表示面上にタッチパネルが設けられて構成される。

図２５は、集中操作パネル５１１１における操作画面の表示例を示す図である。図２５では、一例として、手術室システム５１００に、出力先の装置として、２つの表示装置が設けられている場合に対応する操作画面を示している。図２５を参照すると、操作画面５１９３には、発信元選択領域５１９５と、プレビュー領域５１９７と、コントロール領域５２０１と、が設けられる。

発信元選択領域５１９５には、手術室システム５１００に備えられる発信元装置と、当該発信元装置が有する表示情報を表すサムネイル画面と、が紐付けられて表示される。ユーザは、表示装置に表示させたい表示情報を、発信元選択領域５１９５に表示されているいずれかの発信元装置から選択することができる。

プレビュー領域５１９７には、出力先の装置である２つの表示装置（Monitor1、Monitor2）に表示される画面のプレビューが表示される。図示する例では、１つの表示装置において４つの画像がＰｉｎＰ表示されている。当該４つの画像は、発信元選択領域５１９５において選択された発信元装置から発信された表示情報に対応するものである。４つの画像のうち、１つはメイン画像として比較的大きく表示され、残りの３つはサブ画像として比較的小さく表示される。ユーザは、４つの画像が表示された領域を適宜選択することにより、メイン画像とサブ画像を入れ替えることができる。また、４つの画像が表示される領域の下部には、ステータス表示領域５１９９が設けられており、当該領域に手術に関するステータス（例えば、手術の経過時間や、患者の身体情報等）が適宜表示され得る。

コントロール領域５２０１には、発信元の装置に対して操作を行うためのＧＵＩ（Graphical User Interface）部品が表示される発信元操作領域５２０３と、出力先の装置に対して操作を行うためのＧＵＩ部品が表示される出力先操作領域５２０５と、が設けられる。図示する例では、発信元操作領域５２０３には、撮像機能を有する発信元の装置におけるカメラに対して各種の操作（パン、チルト及びズーム）を行うためのＧＵＩ部品が設けられている。ユーザは、これらのＧＵＩ部品を適宜選択することにより、発信元の装置におけるカメラの動作を操作することができる。なお、図示は省略しているが、発信元選択領域５１９５において選択されている発信元の装置がレコーダである場合（すなわち、プレビュー領域５１９７において、レコーダに過去に記録された画像が表示されている場合）には、発信元操作領域５２０３には、当該画像の再生、再生停止、巻き戻し、早送り等の操作を行うためのＧＵＩ部品が設けられ得る。

また、出力先操作領域５２０５には、出力先の装置である表示装置における表示に対する各種の操作（スワップ、フリップ、色調整、コントラスト調整、２Ｄ表示と３Ｄ表示の切り替え）を行うためのＧＵＩ部品が設けられている。ユーザは、これらのＧＵＩ部品を適宜選択することにより、表示装置における表示を操作することができる。

なお、集中操作パネル５１１１に表示される操作画面は図示する例に限定されず、ユーザは、集中操作パネル５１１１を介して、手術室システム５１００に備えられる、視聴覚コントローラ５１０７及び手術室制御装置５１０９によって制御され得る各装置に対する操作入力が可能であってよい。

図２６は、以上説明した手術室システムが適用された手術の様子の一例を示す図である。シーリングカメラ５１８７及び術場カメラ５１８９は、手術室の天井に設けられ、患者ベッド５１８３上の患者５１８５の患部に対して処置を行う術者（医者）５１８１の手元及び手術室全体の様子を撮影可能である。シーリングカメラ５１８７及び術場カメラ５１８９には、倍率調整機能、焦点距離調整機能、撮影方向調整機能等が設けられ得る。照明５１９１は、手術室の天井に設けられ、少なくとも術者５１８１の手元を照射する。照明５１９１は、その照射光量、照射光の波長（色）及び光の照射方向等を適宜調整可能であってよい。

内視鏡手術システム５１１３、患者ベッド５１８３、シーリングカメラ５１８７、術場カメラ５１８９及び照明５１９１は、図２４に示すように、視聴覚コントローラ５１０７及び手術室制御装置５１０９（図２６では図示せず）を介して互いに連携可能に接続されている。手術室内には、集中操作パネル５１１１が設けられており、上述したように、ユーザは、当該集中操作パネル５１１１を介して、手術室内に存在するこれらの装置を適宜操作することが可能である。

以下、内視鏡手術システム５１１３の構成について詳細に説明する。図示するように、内視鏡手術システム５１１３は、内視鏡５１１５と、その他の術具５１３１と、内視鏡５１１５を支持する支持アーム装置５１４１と、内視鏡下手術のための各種の装置が搭載されたカート５１５１と、から構成される。

内視鏡手術では、腹壁を切って開腹する代わりに、トロッカ５１３９ａ～５１３９ｄと呼ばれる筒状の開孔器具が腹壁に複数穿刺される。そして、トロッカ５１３９ａ～５１３９ｄから、内視鏡５１１５の鏡筒５１１７や、その他の術具５１３１が患者５１８５の体腔内に挿入される。図示する例では、その他の術具５１３１として、気腹チューブ５１３３、エネルギー処置具５１３５及び鉗子５１３７が、患者５１８５の体腔内に挿入されている。また、エネルギー処置具５１３５は、高周波電流や超音波振動により、組織の切開及び剥離、又は血管の封止等を行う処置具である。ただし、図示する術具５１３１はあくまで一例であり、術具５１３１としては、例えば攝子、レトラクタ等、一般的に内視鏡下手術において用いられる各種の術具が用いられてよい。

内視鏡５１１５によって撮影された患者５１８５の体腔内の術部の画像が、表示装置５１５５に表示される。術者５１８１は、表示装置５１５５に表示された術部の画像をリアルタイムで見ながら、エネルギー処置具５１３５や鉗子５１３７を用いて、例えば患部を切除する等の処置を行う。なお、図示は省略しているが、気腹チューブ５１３３、エネルギー処置具５１３５及び鉗子５１３７は、手術中に、術者５１８１又は助手等によって支持される。

（支持アーム装置）
支持アーム装置５１４１は、ベース部５１４３から延伸するアーム部５１４５を備える。図示する例では、アーム部５１４５は、関節部５１４７ａ、５１４７ｂ、５１４７ｃ、及びリンク５１４９ａ、５１４９ｂから構成されており、アーム制御装置５１５９からの制御により駆動される。アーム部５１４５によって内視鏡５１１５が支持され、その位置及び姿勢が制御される。これにより、内視鏡５１１５の安定的な位置の固定が実現され得る。

（内視鏡）
内視鏡５１１５は、先端から所定の長さの領域が患者５１８５の体腔内に挿入される鏡筒５１１７と、鏡筒５１１７の基端に接続されるカメラヘッド５１１９と、から構成される。図示する例では、硬性の鏡筒５１１７を有するいわゆる硬性鏡として構成される内視鏡５１１５を図示しているが、内視鏡５１１５は、軟性の鏡筒５１１７を有するいわゆる軟性鏡として構成されてもよい。

鏡筒５１１７の先端には、対物レンズが嵌め込まれた開口部が設けられている。内視鏡５１１５には光源装置５１５７が接続されており、当該光源装置５１５７によって生成された光が、鏡筒５１１７の内部に延設されるライトガイドによって当該鏡筒の先端まで導光され、対物レンズを介して患者５１８５の体腔内の観察対象に向かって照射される。なお、内視鏡５１１５は、直視鏡であってもよいし、斜視鏡又は側視鏡であってもよい。

カメラヘッド５１１９の内部には光学系及び撮像素子が設けられており、観察対象からの反射光（観察光）は当該光学系によって当該撮像素子に集光される。当該撮像素子によって観察光が光電変換され、観察光に対応する電気信号、すなわち観察像に対応する画像信号が生成される。当該画像信号は、ＲＡＷデータとしてカメラコントロールユニット（ＣＣＵ：Camera Control Unit）５１５３に送信される。なお、カメラヘッド５１１９には、その光学系を適宜駆動させることにより、倍率及び焦点距離を調整する機能が搭載される。

なお、例えば立体視（３Ｄ表示）等に対応するために、カメラヘッド５１１９には撮像素子が複数設けられてもよい。この場合、鏡筒５１１７の内部には、当該複数の撮像素子のそれぞれに観察光を導光するために、リレー光学系が複数系統設けられる。

（カートに搭載される各種の装置）
ＣＣＵ５１５３は、ＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等によって構成され、内視鏡５１１５及び表示装置５１５５の動作を統括的に制御する。具体的には、ＣＣＵ５１５３は、カメラヘッド５１１９から受け取った画像信号に対して、例えば現像処理（デモザイク処理）等の、当該画像信号に基づく画像を表示するための各種の画像処理を施す。ＣＣＵ５１５３は、当該画像処理を施した画像信号を表示装置５１５５に提供する。また、ＣＣＵ５１５３には、図２４に示す視聴覚コントローラ５１０７が接続される。ＣＣＵ５１５３は、画像処理を施した画像信号を視聴覚コントローラ５１０７にも提供する。また、ＣＣＵ５１５３は、カメラヘッド５１１９に対して制御信号を送信し、その駆動を制御する。当該制御信号には、倍率や焦点距離等、撮像条件に関する情報が含まれ得る。当該撮像条件に関する情報は、入力装置５１６１を介して入力されてもよいし、上述した集中操作パネル５１１１を介して入力されてもよい。

表示装置５１５５は、ＣＣＵ５１５３からの制御により、当該ＣＣＵ５１５３によって画像処理が施された画像信号に基づく画像を表示する。内視鏡５１１５が例えば４Ｋ（水平画素数３８４０×垂直画素数２１６０）又は８Ｋ（水平画素数７６８０×垂直画素数４３２０）等の高解像度の撮影に対応したものである場合、及び／又は３Ｄ表示に対応したものである場合には、表示装置５１５５としては、それぞれに対応して、高解像度の表示が可能なもの、及び／又は３Ｄ表示可能なものが用いられ得る。４Ｋ又は８Ｋ等の高解像度の撮影に対応したものである場合、表示装置５１５５として５５インチ以上のサイズのものを用いることで一層の没入感が得られる。また、用途に応じて、解像度、サイズが異なる複数の表示装置５１５５が設けられてもよい。

光源装置５１５７は、例えばＬＥＤ（light emitting diode）等の光源から構成され、術部を撮影する際の照射光を内視鏡５１１５に供給する。

アーム制御装置５１５９は、例えばＣＰＵ等のプロセッサによって構成され、所定のプログラムに従って動作することにより、所定の制御方式に従って支持アーム装置５１４１のアーム部５１４５の駆動を制御する。

入力装置５１６１は、内視鏡手術システム５１１３に対する入力インタフェースである。ユーザは、入力装置５１６１を介して、内視鏡手術システム５１１３に対して各種の情報の入力や指示入力を行うことができる。例えば、ユーザは、入力装置５１６１を介して、患者の身体情報や、手術の術式についての情報等、手術に関する各種の情報を入力する。また、例えば、ユーザは、入力装置５１６１を介して、アーム部５１４５を駆動させる旨の指示や、内視鏡５１１５による撮像条件（照射光の種類、倍率及び焦点距離等）を変更する旨の指示、エネルギー処置具５１３５を駆動させる旨の指示等を入力する。

入力装置５１６１の種類は限定されず、入力装置５１６１は各種の公知の入力装置であってよい。入力装置５１６１としては、例えば、マウス、キーボード、タッチパネル、スイッチ、フットスイッチ５１７１及び／又はレバー等が適用され得る。入力装置５１６１としてタッチパネルが用いられる場合には、当該タッチパネルは表示装置５１５５の表示面上に設けられてもよい。

あるいは、入力装置５１６１は、例えばメガネ型のウェアラブルデバイスやＨＭＤ（Head Mounted Display）等の、ユーザによって装着されるデバイスであり、これらのデバイスによって検出されるユーザのジェスチャや視線に応じて各種の入力が行われる。また、入力装置５１６１は、ユーザの動きを検出可能なカメラを含み、当該カメラによって撮像された映像から検出されるユーザのジェスチャや視線に応じて各種の入力が行われる。更に、入力装置５１６１は、ユーザの声を収音可能なマイクロフォンを含み、当該マイクロフォンを介して音声によって各種の入力が行われる。このように、入力装置５１６１が非接触で各種の情報を入力可能に構成されることにより、特に清潔域に属するユーザ（例えば術者５１８１）が、不潔域に属する機器を非接触で操作することが可能となる。また、ユーザは、所持している術具から手を離すことなく機器を操作することが可能となるため、ユーザの利便性が向上する。

処置具制御装置５１６３は、組織の焼灼、切開又は血管の封止等のためのエネルギー処置具５１３５の駆動を制御する。気腹装置５１６５は、内視鏡５１１５による視野の確保及び術者の作業空間の確保の目的で、患者５１８５の体腔を膨らめるために、気腹チューブ５１３３を介して当該体腔内にガスを送り込む。レコーダ５１６７は、手術に関する各種の情報を記録可能な装置である。プリンタ５１６９は、手術に関する各種の情報を、テキスト、画像又はグラフ等各種の形式で印刷可能な装置である。

以下、内視鏡手術システム５１１３において特に特徴的な構成について、更に詳細に説明する。

（支持アーム装置）
支持アーム装置５１４１は、基台であるベース部５１４３と、ベース部５１４３から延伸するアーム部５１４５と、を備える。図示する例では、アーム部５１４５は、複数の関節部５１４７ａ、５１４７ｂ、５１４７ｃと、関節部５１４７ｂによって連結される複数のリンク５１４９ａ、５１４９ｂと、から構成されているが、図２６では、簡単のため、アーム部５１４５の構成を簡略化して図示している。実際には、アーム部５１４５が所望の自由度を有するように、関節部５１４７ａ～５１４７ｃ及びリンク５１４９ａ、５１４９ｂの形状、数及び配置、並びに関節部５１４７ａ～５１４７ｃの回転軸の方向等が適宜設定され得る。例えば、アーム部５１４５は、好適に、６自由度以上の自由度を有するように構成され得る。これにより、アーム部５１４５の可動範囲内において内視鏡５１１５を自由に移動させることが可能になるため、所望の方向から内視鏡５１１５の鏡筒５１１７を患者５１８５の体腔内に挿入することが可能になる。

関節部５１４７ａ～５１４７ｃにはアクチュエータが設けられており、関節部５１４７ａ～５１４７ｃは当該アクチュエータの駆動により所定の回転軸まわりに回転可能に構成されている。当該アクチュエータの駆動がアーム制御装置５１５９によって制御されることにより、各関節部５１４７ａ～５１４７ｃの回転角度が制御され、アーム部５１４５の駆動が制御される。これにより、内視鏡５１１５の位置及び姿勢の制御が実現され得る。この際、アーム制御装置５１５９は、力制御又は位置制御等、各種の公知の制御方式によってアーム部５１４５の駆動を制御することができる。

例えば、術者５１８１が、入力装置５１６１（フットスイッチ５１７１を含む）を介して適宜操作入力を行うことにより、当該操作入力に応じてアーム制御装置５１５９によってアーム部５１４５の駆動が適宜制御され、内視鏡５１１５の位置及び姿勢が制御されてよい。当該制御により、アーム部５１４５の先端の内視鏡５１１５を任意の位置から任意の位置まで移動させた後、その移動後の位置で固定的に支持することができる。なお、アーム部５１４５は、いわゆるマスタースレイブ方式で操作されてもよい。この場合、アーム部５１４５は、手術室から離れた場所に設置される入力装置５１６１を介してユーザによって遠隔操作され得る。

また、力制御が適用される場合には、アーム制御装置５１５９は、ユーザからの外力を受け、その外力にならってスムーズにアーム部５１４５が移動するように、各関節部５１４７ａ～５１４７ｃのアクチュエータを駆動させる、いわゆるパワーアシスト制御を行ってもよい。これにより、ユーザが直接アーム部５１４５に触れながらアーム部５１４５を移動させる際に、比較的軽い力で当該アーム部５１４５を移動させることができる。従って、より直感的に、より簡易な操作で内視鏡５１１５を移動させることが可能となり、ユーザの利便性を向上させることができる。

ここで、一般的に、内視鏡下手術では、スコピストと呼ばれる医師によって内視鏡５１１５が支持されていた。これに対して、支持アーム装置５１４１を用いることにより、人手によらずに内視鏡５１１５の位置をより確実に固定することが可能になるため、術部の画像を安定的に得ることができ、手術を円滑に行うことが可能になる。

なお、アーム制御装置５１５９は必ずしもカート５１５１に設けられなくてもよい。また、アーム制御装置５１５９は必ずしも１つの装置でなくてもよい。例えば、アーム制御装置５１５９は、支持アーム装置５１４１のアーム部５１４５の各関節部５１４７ａ～５１４７ｃにそれぞれ設けられてもよく、複数のアーム制御装置５１５９が互いに協働することにより、アーム部５１４５の駆動制御が実現されてもよい。

（光源装置）
光源装置５１５７は、内視鏡５１１５に術部を撮影する際の照射光を供給する。光源装置５１５７は、例えばＬＥＤ、レーザ光源又はこれらの組み合わせによって構成される白色光源から構成される。このとき、ＲＧＢレーザ光源の組み合わせにより白色光源が構成される場合には、各色（各波長）の出力強度及び出力タイミングを高精度に制御することができるため、光源装置５１５７において撮像画像のホワイトバランスの調整を行うことができる。また、この場合には、ＲＧＢレーザ光源それぞれからのレーザ光を時分割で観察対象に照射し、その照射タイミングに同期してカメラヘッド５１１９の撮像素子の駆動を制御することにより、ＲＧＢそれぞれに対応した画像を時分割で撮像することも可能である。当該方法によれば、当該撮像素子にカラーフィルタを設けなくても、カラー画像を得ることができる。

また、光源装置５１５７は、出力する光の強度を所定の時間ごとに変更するようにその駆動が制御されてもよい。その光の強度の変更のタイミングに同期してカメラヘッド５１１９の撮像素子の駆動を制御して時分割で画像を取得し、その画像を合成することにより、いわゆる黒つぶれ及び白とびのない高ダイナミックレンジの画像を生成することができる。

また、光源装置５１５７は、特殊光観察に対応した所定の波長帯域の光を供給可能に構成されてもよい。特殊光観察では、例えば、体組織における光の吸収の波長依存性を利用して、通常の観察時における照射光（すなわち、白色光）に比べて狭帯域の光を照射することにより、粘膜表層の血管等の所定の組織を高コントラストで撮影する、いわゆる狭帯域光観察（Narrow Band Imaging）が行われる。あるいは、特殊光観察では、励起光を照射することにより発生する蛍光により画像を得る蛍光観察が行われてもよい。蛍光観察では、体組織に励起光を照射し当該体組織からの蛍光を観察するもの（自家蛍光観察）、又はインドシアニングリーン（ICG）等の試薬を体組織に局注するとともに当該体組織にその試薬の蛍光波長に対応した励起光を照射し蛍光像を得るもの等が行われ得る。光源装置５１５７は、このような特殊光観察に対応した狭帯域光及び／又は励起光を供給可能に構成され得る。

（カメラヘッド及びＣＣＵ）
図２７を参照して、内視鏡５１１５のカメラヘッド５１１９及びＣＣＵ５１５３の機能についてより詳細に説明する。図２７は、図２６に示すカメラヘッド５１１９及びＣＣＵ５１５３の機能構成の一例を示すブロック図である。

図２７を参照すると、カメラヘッド５１１９は、その機能として、レンズユニット５１２１と、撮像部５１２３と、駆動部５１２５と、通信部５１２７と、カメラヘッド制御部５１２９と、を有する。また、ＣＣＵ５１５３は、その機能として、通信部５１７３と、画像処理部５１７５と、制御部５１７７と、を有する。カメラヘッド５１１９とＣＣＵ５１５３とは、伝送ケーブル５１７９によって双方向に通信可能に接続されている。

まず、カメラヘッド５１１９の機能構成について説明する。レンズユニット５１２１は、鏡筒５１１７との接続部に設けられる光学系である。鏡筒５１１７の先端から取り込まれた観察光は、カメラヘッド５１１９まで導光され、当該レンズユニット５１２１に入射する。レンズユニット５１２１は、ズームレンズ及びフォーカスレンズを含む複数のレンズが組み合わされて構成される。レンズユニット５１２１は、撮像部５１２３の撮像素子の受光面上に観察光を集光するように、その光学特性が調整されている。また、ズームレンズ及びフォーカスレンズは、撮像画像の倍率及び焦点の調整のため、その光軸上の位置が移動可能に構成される。

撮像部５１２３は撮像素子によって構成され、レンズユニット５１２１の後段に配置される。レンズユニット５１２１を通過した観察光は、当該撮像素子の受光面に集光され、光電変換によって、観察像に対応した画像信号が生成される。撮像部５１２３によって生成された画像信号は、通信部５１２７に提供される。

撮像部５１２３を構成する撮像素子としては、例えばＣＭＯＳ（Complementary Metal Oxide Semiconductor）タイプのイメージセンサであり、Ｂａｙｅｒ配列を有するカラー撮影可能なものが用いられる。なお、当該撮像素子としては、例えば４Ｋ以上の高解像度の画像の撮影に対応可能なものが用いられてもよい。術部の画像が高解像度で得られることにより、術者５１８１は、当該術部の様子をより詳細に把握することができ、手術をより円滑に進行することが可能となる。

また、撮像部５１２３を構成する撮像素子は、３Ｄ表示に対応する右目用及び左目用の画像信号をそれぞれ取得するための１対の撮像素子を有するように構成される。３Ｄ表示が行われることにより、術者５１８１は術部における生体組織の奥行きをより正確に把握することが可能になる。なお、撮像部５１２３が多板式で構成される場合には、各撮像素子に対応して、レンズユニット５１２１も複数系統設けられる。

また、撮像部５１２３は、必ずしもカメラヘッド５１１９に設けられなくてもよい。例えば、撮像部５１２３は、鏡筒５１１７の内部に、対物レンズの直後に設けられてもよい。

駆動部５１２５は、アクチュエータによって構成され、カメラヘッド制御部５１２９からの制御により、レンズユニット５１２１のズームレンズ及びフォーカスレンズを光軸に沿って所定の距離だけ移動させる。これにより、撮像部５１２３による撮像画像の倍率及び焦点が適宜調整され得る。

通信部５１２７は、ＣＣＵ５１５３との間で各種の情報を送受信するための通信装置によって構成される。通信部５１２７は、撮像部５１２３から得た画像信号をＲＡＷデータとして伝送ケーブル５１７９を介してＣＣＵ５１５３に送信する。この際、術部の撮像画像を低レイテンシで表示するために、当該画像信号は光通信によって送信されることが好ましい。手術の際には、術者５１８１が撮像画像によって患部の状態を観察しながら手術を行うため、より安全で確実な手術のためには、術部の動画像が可能な限りリアルタイムに表示されることが求められるからである。光通信が行われる場合には、通信部５１２７には、電気信号を光信号に変換する光電変換モジュールが設けられる。画像信号は当該光電変換モジュールによって光信号に変換された後、伝送ケーブル５１７９を介してＣＣＵ５１５３に送信される。

また、通信部５１２７は、ＣＣＵ５１５３から、カメラヘッド５１１９の駆動を制御するための制御信号を受信する。当該制御信号には、例えば、撮像画像のフレームレートを指定する旨の情報、撮像時の露出値を指定する旨の情報、並びに／又は撮像画像の倍率及び焦点を指定する旨の情報等、撮像条件に関する情報が含まれる。通信部５１２７は、受信した制御信号をカメラヘッド制御部５１２９に提供する。なお、ＣＣＵ５１５３からの制御信号も、光通信によって伝送されてもよい。この場合、通信部５１２７には、光信号を電気信号に変換する光電変換モジュールが設けられ、制御信号は当該光電変換モジュールによって電気信号に変換された後、カメラヘッド制御部５１２９に提供される。

なお、上記のフレームレートや露出値、倍率、焦点等の撮像条件は、取得された画像信号に基づいてＣＣＵ５１５３の制御部５１７７によって自動的に設定される。つまり、いわゆるＡＥ（Auto Exposure）機能、ＡＦ（Auto Focus）機能及びＡＷＢ（Auto White Balance）機能が内視鏡５１１５に搭載される。

カメラヘッド制御部５１２９は、通信部５１２７を介して受信したＣＣＵ５１５３からの制御信号に基づいて、カメラヘッド５１１９の駆動を制御する。例えば、カメラヘッド制御部５１２９は、撮像画像のフレームレートを指定する旨の情報及び／又は撮像時の露光を指定する旨の情報に基づいて、撮像部５１２３の撮像素子の駆動を制御する。また、例えば、カメラヘッド制御部５１２９は、撮像画像の倍率及び焦点を指定する旨の情報に基づいて、駆動部５１２５を介してレンズユニット５１２１のズームレンズ及びフォーカスレンズを適宜移動させる。カメラヘッド制御部５１２９は、更に、鏡筒５１１７やカメラヘッド５１１９を識別するための情報を記憶する機能を備えてもよい。

なお、レンズユニット５１２１や撮像部５１２３等の構成を、気密性及び防水性が高い密閉構造内に配置することで、カメラヘッド５１１９について、オートクレーブ滅菌処理に対する耐性を持たせることができる。

次に、ＣＣＵ５１５３の機能構成について説明する。通信部５１７３は、カメラヘッド５１１９との間で各種の情報を送受信するための通信装置によって構成される。通信部５１７３は、カメラヘッド５１１９から、伝送ケーブル５１７９を介して送信される画像信号を受信する。この際、上記のように、当該画像信号は好適に光通信によって送信され得る。この場合、光通信に対応して、通信部５１７３には、光信号を電気信号に変換する光電変換モジュールが設けられる。通信部５１７３は、電気信号に変換した画像信号を画像処理部５１７５に提供する。

また、通信部５１７３は、カメラヘッド５１１９に対して、カメラヘッド５１１９の駆動を制御するための制御信号を送信する。当該制御信号も光通信によって送信されてよい。

画像処理部５１７５は、カメラヘッド５１１９から送信されたＲＡＷデータである画像信号に対して各種の画像処理を施す。当該画像処理としては、例えば現像処理、高画質化処理（帯域強調処理、超解像処理、ＮＲ（Noise reduction）処理及び／又は手ブレ補正処理等）、並びに／又は拡大処理（電子ズーム処理）等、各種の公知の信号処理が含まれる。また、画像処理部５１７５は、ＡＥ、ＡＦ及びＡＷＢを行うための、画像信号に対する検波処理を行う。

画像処理部５１７５は、ＣＰＵやＧＰＵ等のプロセッサによって構成され、当該プロセッサが所定のプログラムに従って動作することにより、上述した画像処理や検波処理が行われ得る。なお、画像処理部５１７５が複数のＧＰＵによって構成される場合には、画像処理部５１７５は、画像信号に係る情報を適宜分割し、これら複数のＧＰＵによって並列的に画像処理を行う。

制御部５１７７は、内視鏡５１１５による術部の撮像、及びその撮像画像の表示に関する各種の制御を行う。例えば、制御部５１７７は、カメラヘッド５１１９の駆動を制御するための制御信号を生成する。この際、撮像条件がユーザによって入力されている場合には、制御部５１７７は、当該ユーザによる入力に基づいて制御信号を生成する。あるいは、内視鏡５１１５にＡＥ機能、ＡＦ機能及びＡＷＢ機能が搭載されている場合には、制御部５１７７は、画像処理部５１７５による検波処理の結果に応じて、最適な露出値、焦点距離及びホワイトバランスを適宜算出し、制御信号を生成する。

また、制御部５１７７は、画像処理部５１７５によって画像処理が施された画像信号に基づいて、術部の画像を表示装置５１５５に表示させる。この際、制御部５１７７は、各種の画像認識技術を用いて術部画像内における各種の物体を認識する。例えば、制御部５１７７は、術部画像に含まれる物体のエッジの形状や色等を検出することにより、鉗子等の術具、特定の生体部位、出血、エネルギー処置具５１３５使用時のミスト等を認識することができる。制御部５１７７は、表示装置５１５５に術部の画像を表示させる際に、その認識結果を用いて、各種の手術支援情報を当該術部の画像に重畳表示させる。手術支援情報が重畳表示され、術者５１８１に提示されることにより、より安全かつ確実に手術を進めることが可能になる。

カメラヘッド５１１９及びＣＣＵ５１５３を接続する伝送ケーブル５１７９は、電気信号の通信に対応した電気信号ケーブル、光通信に対応した光ファイバ、又はこれらの複合ケーブルである。

ここで、図示する例では、伝送ケーブル５１７９を用いて有線で通信が行われていたが、カメラヘッド５１１９とＣＣＵ５１５３との間の通信は無線で行われてもよい。両者の間の通信が無線で行われる場合には、伝送ケーブル５１７９を手術室内に敷設する必要がなくなるため、手術室内における医療スタッフの移動が当該伝送ケーブル５１７９によって妨げられる事態が解消され得る。

以上、本開示に係る技術が適用され得る手術室システム５１００の一例について説明した。なお、ここでは、一例として手術室システム５１００が適用される医療用システムが内視鏡手術システム５１１３である場合について説明したが、手術室システム５１００の構成はかかる例に限定されない。例えば、手術室システム５１００は、内視鏡手術システム５１１３に代えて、検査用軟性内視鏡システムや顕微鏡手術システムに適用されてもよい。

本開示に係る技術は、上述した構成のうち、制御部５１７７に適用することができる。制御部５１７７に本開示に係る技術を適用することにより、術部画像に含まれる術部の微細な血管や、微小な出血点を認識することができる。制御部５１７７は、表示装置５１５５に術部画像を表示させる際に、その認識結果を用いて、各種の手術支援情報を術部画像に重畳表示させる。手術支援情報が重畳表示され、術者５１８１に提示されることにより、より安全かつ確実に手術を進めることが可能になる。

（移動体制御システムへの適用）
本開示に係る技術は、自動車、電気自動車、ハイブリッド電気自動車、自動二輪車、自転車、パーソナルモビリティ、飛行機、ドローン、船舶、ロボット、建設機械、農業機械（トラクター）などのいずれかの種類の移動体に搭載される装置として実現されてもよい。

図２８は、本開示に係る技術が適用され得る移動体制御システムの一例である車両制御システム７０００の概略的な構成例を示すブロック図である。車両制御システム７０００は、通信ネットワーク７０１０を介して接続された複数の電子制御ユニットを備える。図２８に示した例では、車両制御システム７０００は、駆動系制御ユニット７１００、ボディ系制御ユニット７２００、バッテリ制御ユニット７３００、車外情報検出ユニット７４００、車内情報検出ユニット７５００、及び統合制御ユニット７６００を備える。これらの複数の制御ユニットを接続する通信ネットワーク７０１０は、例えば、ＣＡＮ（Controller Area Network）、ＬＩＮ（Local Interconnect Network）、ＬＡＮ（Local Area Network）又はＦｌｅｘＲａｙ（登録商標）等の任意の規格に準拠した車載通信ネットワークであってよい。

各制御ユニットは、各種プログラムにしたがって演算処理を行うマイクロコンピュータと、マイクロコンピュータにより実行されるプログラム又は各種演算に用いられるパラメータ等を記憶する記憶部と、各種制御対象の装置を駆動する駆動回路とを備える。各制御ユニットは、通信ネットワーク７０１０を介して他の制御ユニットとの間で通信を行うためのネットワークＩ／Ｆを備えるとともに、車内外の装置又はセンサ等との間で、有線通信又は無線通信により通信を行うための通信Ｉ／Ｆを備える。図２８では、統合制御ユニット７６００の機能構成として、マイクロコンピュータ７６１０、汎用通信Ｉ／Ｆ７６２０、専用通信Ｉ／Ｆ７６３０、測位部７６４０、ビーコン受信部７６５０、車内機器Ｉ／Ｆ７６６０、音声画像出力部７６７０、車載ネットワークＩ／Ｆ７６８０及び記憶部７６９０が図示されている。他の制御ユニットも同様に、マイクロコンピュータ、通信Ｉ／Ｆ及び記憶部等を備える。

駆動系制御ユニット７１００は、各種プログラムにしたがって車両の駆動系に関連する装置の動作を制御する。例えば、駆動系制御ユニット７１００は、内燃機関又は駆動用モータ等の車両の駆動力を発生させるための駆動力発生装置、駆動力を車輪に伝達するための駆動力伝達機構、車両の舵角を調節するステアリング機構、及び、車両の制動力を発生させる制動装置等の制御装置として機能する。駆動系制御ユニット７１００は、ＡＢＳ（Antilock Brake System）又はＥＳＣ（Electronic Stability Control）等の制御装置としての機能を有してもよい。

駆動系制御ユニット７１００には、車両状態検出部７１１０が接続される。車両状態検出部７１１０には、例えば、車体の軸回転運動の角速度を検出するジャイロセンサ、車両の加速度を検出する加速度センサ、あるいは、アクセルペダルの操作量、ブレーキペダルの操作量、ステアリングホイールの操舵角、エンジン回転数又は車輪の回転速度等を検出するためのセンサのうちの少なくとも一つが含まれる。駆動系制御ユニット７１００は、車両状態検出部７１１０から入力される信号を用いて演算処理を行い、内燃機関、駆動用モータ、電動パワーステアリング装置又はブレーキ装置等を制御する。

ボディ系制御ユニット７２００は、各種プログラムにしたがって車体に装備された各種装置の動作を制御する。例えば、ボディ系制御ユニット７２００は、キーレスエントリシステム、スマートキーシステム、パワーウィンドウ装置、あるいは、ヘッドランプ、バックランプ、ブレーキランプ、ウィンカー又はフォグランプ等の各種ランプの制御装置として機能する。この場合、ボディ系制御ユニット７２００には、鍵を代替する携帯機から発信される電波又は各種スイッチの信号が入力され得る。ボディ系制御ユニット７２００は、これらの電波又は信号の入力を受け付け、車両のドアロック装置、パワーウィンドウ装置、ランプ等を制御する。

バッテリ制御ユニット７３００は、各種プログラムにしたがって駆動用モータの電力供給源である二次電池７３１０を制御する。例えば、バッテリ制御ユニット７３００には、二次電池７３１０を備えたバッテリ装置から、バッテリ温度、バッテリ出力電圧又はバッテリの残存容量等の情報が入力される。バッテリ制御ユニット７３００は、これらの信号を用いて演算処理を行い、二次電池７３１０の温度調節制御又はバッテリ装置に備えられた冷却装置等の制御を行う。

車外情報検出ユニット７４００は、車両制御システム７０００を搭載した車両の外部の情報を検出する。例えば、車外情報検出ユニット７４００には、撮像部７４１０及び車外情報検出部７４２０のうちの少なくとも一方が接続される。撮像部７４１０には、ＴｏＦ（Time Of Flight）カメラ、ステレオカメラ、単眼カメラ、赤外線カメラ及びその他のカメラのうちの少なくとも一つが含まれる。車外情報検出部７４２０には、例えば、現在の天候又は気象を検出するための環境センサ、あるいは、車両制御システム７０００を搭載した車両の周囲の他の車両、障害物又は歩行者等を検出するための周囲情報検出センサのうちの少なくとも一つが含まれる。

環境センサは、例えば、雨天を検出する雨滴センサ、霧を検出する霧センサ、日照度合いを検出する日照センサ、及び降雪を検出する雪センサのうちの少なくとも一つであってよい。周囲情報検出センサは、超音波センサ、レーダ装置及びＬＩＤＡＲ（Light Detection and Ranging、Laser Imaging Detection and Ranging）装置のうちの少なくとも一つであってよい。これらの撮像部７４１０及び車外情報検出部７４２０は、それぞれ独立したセンサないし装置として備えられてもよいし、複数のセンサないし装置が統合された装置として備えられてもよい。

ここで、図２９は、撮像部７４１０及び車外情報検出部７４２０の設置位置の例を示す。撮像部７９１０，７９１２，７９１４，７９１６，７９１８は、例えば、車両７９００のフロントノーズ、サイドミラー、リアバンパ、バックドア及び車室内のフロントガラスの上部のうちの少なくとも一つの位置に設けられる。フロントノーズに備えられる撮像部７９１０及び車室内のフロントガラスの上部に備えられる撮像部７９１８は、主として車両７９００の前方の画像を取得する。サイドミラーに備えられる撮像部７９１２，７９１４は、主として車両７９００の側方の画像を取得する。リアバンパ又はバックドアに備えられる撮像部７９１６は、主として車両７９００の後方の画像を取得する。車室内のフロントガラスの上部に備えられる撮像部７９１８は、主として先行車両又は、歩行者、障害物、信号機、交通標識又は車線等の検出に用いられる。

なお、図２９には、それぞれの撮像部７９１０，７９１２，７９１４，７９１６の撮影範囲の一例が示されている。撮像範囲ａは、フロントノーズに設けられた撮像部７９１０の撮像範囲を示し、撮像範囲ｂ，ｃは、それぞれサイドミラーに設けられた撮像部７９１２，７９１４の撮像範囲を示し、撮像範囲ｄは、リアバンパ又はバックドアに設けられた撮像部７９１６の撮像範囲を示す。例えば、撮像部７９１０，７９１２，７９１４，７９１６で撮像された画像データが重ね合わせられることにより、車両７９００を上方から見た俯瞰画像が得られる。

車両７９００のフロント、リア、サイド、コーナ及び車室内のフロントガラスの上部に設けられる車外情報検出部７９２０，７９２２，７９２４，７９２６，７９２８，７９３０は、例えば超音波センサ又はレーダ装置であってよい。車両７９００のフロントノーズ、リアバンパ、バックドア及び車室内のフロントガラスの上部に設けられる車外情報検出部７９２０，７９２６，７９３０は、例えばＬＩＤＡＲ装置であってよい。これらの車外情報検出部７９２０～７９３０は、主として先行車両、歩行者又は障害物等の検出に用いられる。

図２８に戻って説明を続ける。車外情報検出ユニット７４００は、撮像部７４１０に車外の画像を撮像させるとともに、撮像された画像データを受信する。また、車外情報検出ユニット７４００は、接続されている車外情報検出部７４２０から検出情報を受信する。車外情報検出部７４２０が超音波センサ、レーダ装置又はＬＩＤＡＲ装置である場合には、車外情報検出ユニット７４００は、超音波又は電磁波等を発信させるとともに、受信された反射波の情報を受信する。車外情報検出ユニット７４００は、受信した情報に基づいて、人、車、障害物、標識又は路面上の文字等の物体検出処理又は距離検出処理を行ってもよい。車外情報検出ユニット７４００は、受信した情報に基づいて、降雨、霧又は路面状況等を認識する環境認識処理を行ってもよい。車外情報検出ユニット７４００は、受信した情報に基づいて、車外の物体までの距離を算出してもよい。

また、車外情報検出ユニット７４００は、受信した画像データに基づいて、人、車、障害物、標識又は路面上の文字等を認識する画像認識処理又は距離検出処理を行ってもよい。車外情報検出ユニット７４００は、受信した画像データに対して歪補正又は位置合わせ等の処理を行うとともに、異なる撮像部７４１０により撮像された画像データを合成して、俯瞰画像又はパノラマ画像を生成してもよい。車外情報検出ユニット７４００は、異なる撮像部７４１０により撮像された画像データを用いて、視点変換処理を行ってもよい。

車内情報検出ユニット７５００は、車内の情報を検出する。車内情報検出ユニット７５００には、例えば、運転者の状態を検出する運転者状態検出部７５１０が接続される。運転者状態検出部７５１０は、運転者を撮像するカメラ、運転者の生体情報を検出する生体センサ又は車室内の音声を集音するマイク等を含んでもよい。生体センサは、例えば、座面又はステアリングホイール等に設けられ、座席に座った搭乗者又はステアリングホイールを握る運転者の生体情報を検出する。車内情報検出ユニット７５００は、運転者状態検出部７５１０から入力される検出情報に基づいて、運転者の疲労度合い又は集中度合いを算出してもよいし、運転者が居眠りをしていないかを判別してもよい。車内情報検出ユニット７５００は、集音された音声信号に対してノイズキャンセリング処理等の処理を行ってもよい。

統合制御ユニット７６００は、各種プログラムにしたがって車両制御システム７０００内の動作全般を制御する。統合制御ユニット７６００には、入力部７８００が接続されている。入力部７８００は、例えば、タッチパネル、ボタン、マイクロフォン、スイッチ又はレバー等、搭乗者によって入力操作され得る装置によって実現される。統合制御ユニット７６００には、マイクロフォンにより入力される音声を音声認識することにより得たデータが入力されてもよい。入力部７８００は、例えば、赤外線又はその他の電波を利用したリモートコントロール装置であってもよいし、車両制御システム７０００の操作に対応した携帯電話又はＰＤＡ（Personal Digital Assistant）等の外部接続機器であってもよい。入力部７８００は、例えばカメラであってもよく、その場合搭乗者はジェスチャにより情報を入力することができる。あるいは、搭乗者が装着したウェアラブル装置の動きを検出することで得られたデータが入力されてもよい。さらに、入力部７８００は、例えば、上記の入力部７８００を用いて搭乗者等により入力された情報に基づいて入力信号を生成し、統合制御ユニット７６００に出力する入力制御回路などを含んでもよい。搭乗者等は、この入力部７８００を操作することにより、車両制御システム７０００に対して各種のデータを入力したり処理動作を指示したりする。

記憶部７６９０は、マイクロコンピュータにより実行される各種プログラムを記憶するＲＯＭ（Read Only Memory）、及び各種パラメータ、演算結果又はセンサ値等を記憶するＲＡＭ（Random Access Memory）を含んでいてもよい。また、記憶部７６９０は、ＨＤＤ（Hard Disc Drive）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス又は光磁気記憶デバイス等によって実現してもよい。

汎用通信Ｉ／Ｆ７６２０は、外部環境７７５０に存在する様々な機器との間の通信を仲介する汎用的な通信Ｉ／Ｆである。汎用通信Ｉ／Ｆ７６２０は、ＧＳＭ（登録商標）（Global System of Mobile communications）、ＷｉＭＡＸ（登録商標）、ＬＴＥ（登録商標）（Long Term Evolution）若しくはＬＴＥ－Ａ（LTE－Advanced）などのセルラー通信プロトコル、又は無線ＬＡＮ（Ｗｉ－Ｆｉ（登録商標）ともいう）、Ｂｌｕｅｔｏｏｔｈ（登録商標）などのその他の無線通信プロトコルを実装してよい。汎用通信Ｉ／Ｆ７６２０は、例えば、基地局又はアクセスポイントを介して、外部ネットワーク（例えば、インターネット、クラウドネットワーク又は事業者固有のネットワーク）上に存在する機器（例えば、アプリケーションサーバ又は制御サーバ）へ接続してもよい。また、汎用通信Ｉ／Ｆ７６２０は、例えばＰ２Ｐ（Peer To Peer）技術を用いて、車両の近傍に存在する端末（例えば、運転者、歩行者若しくは店舗の端末、又はＭＴＣ（Machine Type Communication）端末）と接続してもよい。

専用通信Ｉ／Ｆ７６３０は、車両における使用を目的として策定された通信プロトコルをサポートする通信Ｉ／Ｆである。専用通信Ｉ／Ｆ７６３０は、例えば、下位レイヤのＩＥＥＥ８０２．１１ｐと上位レイヤのＩＥＥＥ１６０９との組合せであるＷＡＶＥ（Wireless Access in Vehicle Environment）、ＤＳＲＣ（Dedicated Short Range Communications）、又はセルラー通信プロトコルといった標準プロトコルを実装してよい。専用通信Ｉ／Ｆ７６３０は、典型的には、車車間（Vehicle to Vehicle）通信、路車間（Vehicle to Infrastructure）通信、車両と家との間（Vehicle to Home）の通信及び歩車間（Vehicle to Pedestrian）通信のうちの１つ以上を含む概念であるＶ２Ｘ通信を遂行する。

測位部７６４０は、例えば、ＧＮＳＳ（Global Navigation Satellite System）衛星からのＧＮＳＳ信号（例えば、ＧＰＳ（Global Positioning System）衛星からのＧＰＳ信号）を受信して測位を実行し、車両の緯度、経度及び高度を含む位置情報を生成する。なお、測位部７６４０は、無線アクセスポイントとの信号の交換により現在位置を特定してもよく、又は測位機能を有する携帯電話、ＰＨＳ若しくはスマートフォンといった端末から位置情報を取得してもよい。

ビーコン受信部７６５０は、例えば、道路上に設置された無線局等から発信される電波あるいは電磁波を受信し、現在位置、渋滞、通行止め又は所要時間等の情報を取得する。なお、ビーコン受信部７６５０の機能は、上述した専用通信Ｉ／Ｆ７６３０に含まれてもよい。

車内機器Ｉ／Ｆ７６６０は、マイクロコンピュータ７６１０と車内に存在する様々な車内機器７７６０との間の接続を仲介する通信インタフェースである。車内機器Ｉ／Ｆ７６６０は、無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＮＦＣ（Near Field Communication）又はＷＵＳＢ（Wireless USB）といった無線通信プロトコルを用いて無線接続を確立してもよい。また、車内機器Ｉ／Ｆ７６６０は、図示しない接続端子（及び、必要であればケーブル）を介して、ＵＳＢ（Universal Serial Bus）、ＨＤＭＩ（登録商標）（High-Definition Multimedia Interface）、又はＭＨＬ（Mobile High-definition Link）等の有線接続を確立してもよい。車内機器７７６０は、例えば、搭乗者が有するモバイル機器若しくはウェアラブル機器、又は車両に搬入され若しくは取り付けられる情報機器のうちの少なくとも１つを含んでいてもよい。また、車内機器７７６０は、任意の目的地までの経路探索を行うナビゲーション装置を含んでいてもよい。車内機器Ｉ／Ｆ７６６０は、これらの車内機器７７６０との間で、制御信号又はデータ信号を交換する。

車載ネットワークＩ／Ｆ７６８０は、マイクロコンピュータ７６１０と通信ネットワーク７０１０との間の通信を仲介するインタフェースである。車載ネットワークＩ／Ｆ７６８０は、通信ネットワーク７０１０によりサポートされる所定のプロトコルに則して、信号等を送受信する。

統合制御ユニット７６００のマイクロコンピュータ７６１０は、汎用通信Ｉ／Ｆ７６２０、専用通信Ｉ／Ｆ７６３０、測位部７６４０、ビーコン受信部７６５０、車内機器Ｉ／Ｆ７６６０及び車載ネットワークＩ／Ｆ７６８０のうちの少なくとも一つを介して取得される情報に基づき、各種プログラムにしたがって、車両制御システム７０００を制御する。例えば、マイクロコンピュータ７６１０は、取得される車内外の情報に基づいて、駆動力発生装置、ステアリング機構又は制動装置の制御目標値を演算し、駆動系制御ユニット７１００に対して制御指令を出力してもよい。例えば、マイクロコンピュータ７６１０は、車両の衝突回避あるいは衝撃緩和、車間距離に基づく追従走行、車速維持走行、車両の衝突警告、又は車両のレーン逸脱警告等を含むＡＤＡＳ（Advanced Driver Assistance System）の機能実現を目的とした協調制御を行ってもよい。また、マイクロコンピュータ７６１０は、取得される車両の周囲の情報に基づいて駆動力発生装置、ステアリング機構又は制動装置等を制御することにより、運転者の操作に拠らずに自律的に走行する自動運転等を目的とした協調制御を行ってもよい。

マイクロコンピュータ７６１０は、汎用通信Ｉ／Ｆ７６２０、専用通信Ｉ／Ｆ７６３０、測位部７６４０、ビーコン受信部７６５０、車内機器Ｉ／Ｆ７６６０及び車載ネットワークＩ／Ｆ７６８０のうちの少なくとも一つを介して取得される情報に基づき、車両と周辺の構造物や人物等の物体との間の３次元距離情報を生成し、車両の現在位置の周辺情報を含むローカル地図情報を作成してもよい。また、マイクロコンピュータ７６１０は、取得される情報に基づき、車両の衝突、歩行者等の近接又は通行止めの道路への進入等の危険を予測し、警告用信号を生成してもよい。警告用信号は、例えば、警告音を発生させたり、警告ランプを点灯させたりするための信号であってよい。

音声画像出力部７６７０は、車両の搭乗者又は車外に対して、視覚的又は聴覚的に情報を通知することが可能な出力装置へ音声及び画像のうちの少なくとも一方の出力信号を送信する。図２８の例では、出力装置として、オーディオスピーカ７７１０、表示部７７２０及びインストルメントパネル７７３０が例示されている。表示部７７２０は、例えば、オンボードディスプレイ及びヘッドアップディスプレイの少なくとも一つを含んでいてもよい。表示部７７２０は、ＡＲ（Augmented Reality）表示機能を有していてもよい。出力装置は、これらの装置以外の、ヘッドホン、搭乗者が装着する眼鏡型ディスプレイ等のウェアラブルデバイス、プロジェクタ又はランプ等の他の装置であってもよい。出力装置が表示装置の場合、表示装置は、マイクロコンピュータ７６１０が行った各種処理により得られた結果又は他の制御ユニットから受信された情報を、テキスト、イメージ、表、グラフ等、様々な形式で視覚的に表示する。また、出力装置が音声出力装置の場合、音声出力装置は、再生された音声データ又は音響データ等からなるオーディオ信号をアナログ信号に変換して聴覚的に出力する。

なお、図２８に示した例において、通信ネットワーク７０１０を介して接続された少なくとも二つの制御ユニットが一つの制御ユニットとして一体化されてもよい。あるいは、個々の制御ユニットが、複数の制御ユニットにより構成されてもよい。さらに、車両制御システム７０００が、図示されていない別の制御ユニットを備えてもよい。また、上記の説明において、いずれかの制御ユニットが担う機能の一部又は全部を、他の制御ユニットに持たせてもよい。つまり、通信ネットワーク７０１０を介して情報の送受信がされるようになっていれば、所定の演算処理が、いずれかの制御ユニットで行われるようになってもよい。同様に、いずれかの制御ユニットに接続されているセンサ又は装置が、他の制御ユニットに接続されるとともに、複数の制御ユニットが、通信ネットワーク７０１０を介して相互に検出情報を送受信してもよい。

本開示に係る技術は、上述した構成のうち、車外情報検出ユニット７４００に適用することができる。車外情報検出ユニット７４００に本開示に係る技術を適用することにより、車外を撮像した車外画像に含まれる、遠方の人、車、障害物、標識、または路面上の文字などを認識することができる。車外情報検出ユニット７４００は、表示部７７２０に車外画像を表示させる際に、その認識結果を用いて、各種の運転支援情報を車外画像に重畳表示させる。運転支援情報が重畳表示され、運転者に提示されることにより、事前に道路状況などを把握することができ、未然に事故を防ぐことが可能になる。

本開示に係る技術の実施の形態は、上述した実施の形態に限定されるものではなく、本開示に係る技術の要旨を逸脱しない範囲において種々の変更が可能である。

また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

さらに、本開示に係る技術は以下のような構成をとることができる。
（１）
第１解像度画像から、前記第１解像度画像より解像度の低い第２解像度画像を取得する第１の取得部と、
前記第２解像度画像に含まれるオブジェクトを分類する分類部と、
前記第１解像度画像において、所定の分類の前記オブジェクトに対応するオブジェクト領域を特定する特定部と、
前記第１解像度画像において特定された前記オブジェクト領域に対して、前記オブジェクトの認識処理を行う認識部と
を備える画像処理装置。
（２）
前記第２解像度画像において動きオブジェクトを抽出する抽出部をさらに備え、
前記分類部は、抽出された前記動きオブジェクトを分類する
（１）に記載の画像処理装置。
（３）
前記抽出部は、背景差分により前記動きオブジェクトを抽出する
（２）に記載の画像処理装置。
（４）
前記分類部は、抽出された前記動きオブジェクトの大きさに基づいて、前記動きオブジェクトを分類する
（２）または（３）に記載の画像処理装置。
（５）
前記分類部は、前記第２解像度画像において抽出された前記動きオブジェクトに、あらかじめ決められた所定サイズより小さい複数の画枠を設定することで、前記動きオブジェクトを分類する
（４）に記載の画像処理装置。
（６）
前記分類部は、抽出された前記動きオブジェクトの輪郭が収まる輪郭矩形のサイズに応じて、設定される前記画枠のサイズを切り替える
（５）に記載の画像処理装置。
（７）
前記特定部は、前記第２解像度画像において設定された前記画枠を、前記第１解像度画像上に座標変換することで、前記オブジェクト領域を特定する
（５）または（６）に記載の画像処理装置。
（８）
前記第１解像度画像において認識された前記動きオブジェクトを追尾する追尾処理部と、
前記第１解像度画像において、追尾されている前記動きオブジェクトと、特定された前記オブジェクト領域との重複を排除する第１の重複排除処理部とをさらに備える
（２）乃至（７）のいずれかに記載の画像処理装置。
（９）
前記追尾処理部は、所定フレーム毎に、追尾する前記動きオブジェクトの位置の修正を行う
（８）に記載の画像処理装置。
（１０）
前記認識部は、特定された前記オブジェクト領域のサイズを、前記オブジェクトの認識処理に用いられる教師データのサイズに基づいて正規化して、前記オブジェクトの認識処理を行う
（９）に記載の画像処理装置。
（１１）
前記第２解像度画像から、前記第２解像度画像より解像度の低い第３解像度画像を取得する第２の取得部と、
前記第３解像度画像に対して、物体検出を行う物体検出部とをさらに備える
（１０）に記載の画像処理装置。
（１２）
前記第１解像度画像において認識された前記動きオブジェクトと、前記物体検出部により検出された物体との重複を排除する第２の重複排除処理部をさらに備える
（１１）に記載の画像処理装置。
（１３）
前記分類部は、さらに、抽出された前記動きオブジェクトの位置に基づいて、前記動きオブジェクトを分類する
（４）乃至（１２）のいずれかに記載の画像処理装置。
（１４）
前記分類部は、さらに、抽出された前記動きオブジェクトの動きの速さに基づいて、前記動きオブジェクトを分類する
（４）乃至（１３）のいずれかに記載の画像処理装置。
（１５）
前記認識部は、前記オブジェクト領域を二値分類することで、前記オブジェクトの認識処理を行う
（１）乃至（１４）のいずれかに記載の画像処理装置。
（１６）
前記認識部は、前記オブジェクト領域を多値分類することで、前記オブジェクトの認識処理を行う
（１）乃至（１４）のいずれかに記載の画像処理装置。
（１７）
前記第１解像度画像を高解像度化する高解像度化処理部をさらに備え、
前記第１の取得部は、高解像度化された前記第１解像度画像から前記第２解像度画像を取得する
（１）乃至（１６）のいずれかに記載の画像処理装置。
（１８）
前記第１の取得部、前記分類部、前記特定部、および前記認識部は、所定フレーム毎に処理を繰り返す
（１）乃至（１７）のいずれかに記載の画像処理装置。
（１９）
画像処理装置が、
第１解像度画像から、前記第１解像度画像より解像度の低い第２解像度画像を取得し、
前記第２解像度画像に含まれるオブジェクトを分類し、
前記第１解像度画像において、所定の分類の前記オブジェクトに対応するオブジェクト領域を特定し、
前記第１解像度画像において特定された前記オブジェクト領域に対して、前記オブジェクトの認識処理を行う
画像処理方法。
（２０）
第１解像度画像から、前記第１解像度画像より解像度の低い第２解像度画像を取得し、
前記第２解像度画像に含まれるオブジェクトを分類し、
前記第１解像度画像において、所定の分類の前記オブジェクトに対応するオブジェクト領域を特定し、
前記第１解像度画像において特定された前記オブジェクト領域に対して、前記オブジェクトの認識処理を行う
処理をコンピュータに実行させるプログラム。

１０画像処理装置，３１追尾処理部，３２中解像度画像取得部，３３オブジェクト抽出部，３４分類部，３５特定部，３６重複排除処理部，３７認識部，３８フィルタ処理部，３９低解像度画像取得部，４０物体検出部，４１フィルタ処理部，４２重複排除処理

Claims

第１解像度画像から、前記第１解像度画像より解像度の低い第２解像度画像を取得する第１の取得部と、
前記第２解像度画像において動きオブジェクトを抽出する抽出部と、
前記第２解像度画像において抽出された前記動きオブジェクトに、あらかじめ決められた所定サイズより小さい複数の画枠を設定することで、前記動きオブジェクトを分類する分類部と、
前記第１解像度画像において、所定の分類の前記動きオブジェクトに対応するオブジェクト領域を特定する特定部と、
前記第１解像度画像において特定された前記オブジェクト領域に対して、前記動きオブジェクトの認識処理を行う認識部と
を備える画像処理装置。
前記抽出部は、背景差分により前記動きオブジェクトを抽出する
請求項１に記載の画像処理装置。
前記分類部は、抽出された前記動きオブジェクトの輪郭が収まる輪郭矩形のサイズに応じて、設定される前記画枠のサイズを切り替える
請求項１または２に記載の画像処理装置。
前記特定部は、前記第２解像度画像において設定された前記画枠を、前記第１解像度画像上に座標変換することで、前記オブジェクト領域を特定する
請求項３に記載の画像処理装置。
前記第１解像度画像において認識された前記動きオブジェクトを追尾する追尾処理部と、
前記第１解像度画像において、追尾されている前記動きオブジェクトと、特定された前記オブジェクト領域との重複を排除する第１の重複排除処理部とをさらに備える
請求項４に記載の画像処理装置。
前記追尾処理部は、所定フレーム毎に、追尾する前記動きオブジェクトの位置の修正を行う
請求項５に記載の画像処理装置。
前記認識部は、特定された前記オブジェクト領域のサイズを、前記動きオブジェクトの認識処理に用いられる教師データのサイズに基づいて正規化して、前記動きオブジェクトの認識処理を行う
請求項６に記載の画像処理装置。
前記第２解像度画像から、前記第２解像度画像より解像度の低い第３解像度画像を取得する第２の取得部と、
前記第３解像度画像に対して、物体検出を行う物体検出部とをさらに備える
請求項７に記載の画像処理装置。
前記第１解像度画像において認識された前記動きオブジェクトと、前記物体検出部により検出された物体との重複を排除する第２の重複排除処理部をさらに備える
請求項８に記載の画像処理装置。
前記分類部は、さらに、抽出された前記動きオブジェクトの位置に基づいて、前記動きオブジェクトを分類する
請求項１乃至９のいずれかに記載の画像処理装置。
前記分類部は、さらに、抽出された前記動きオブジェクトの動きの速さに基づいて、前記動きオブジェクトを分類する
請求項１乃至１０のいずれかに記載の画像処理装置。
前記認識部は、前記オブジェクト領域を二値分類することで、前記動きオブジェクトの認識処理を行う
請求項１乃至１１のいずれかに記載の画像処理装置。
前記認識部は、前記オブジェクト領域を多値分類することで、前記動きオブジェクトの認識処理を行う
請求項１乃至１１のいずれかに記載の画像処理装置。
前記第１解像度画像を高解像度化する高解像度化処理部をさらに備え、
前記第１の取得部は、高解像度化された前記第１解像度画像から前記第２解像度画像を取得する
請求項１乃至１３のいずれかに記載の画像処理装置。
前記第１の取得部、前記抽出部、前記分類部、前記特定部、および前記認識部は、所定フレーム毎に処理を繰り返す
請求項１乃至１４のいずれかに記載の画像処理装置。
画像処理装置が、
第１解像度画像から、前記第１解像度画像より解像度の低い第２解像度画像を取得し、
前記第２解像度画像において動きオブジェクトを抽出し、
前記第２解像度画像において抽出された前記動きオブジェクトに、あらかじめ決められた所定サイズより小さい複数の画枠を設定することで、前記動きオブジェクトを分類し、
前記第１解像度画像において、所定の分類の前記動きオブジェクトに対応するオブジェクト領域を特定し、
前記第１解像度画像において特定された前記オブジェクト領域に対して、前記動きオブジェクトの認識処理を行う
画像処理方法。
第１解像度画像から、前記第１解像度画像より解像度の低い第２解像度画像を取得し、
前記第２解像度画像において動きオブジェクトを抽出し、
前記第２解像度画像において抽出された前記動きオブジェクトに、あらかじめ決められた所定サイズより小さい複数の画枠を設定することで、前記動きオブジェクトを分類し、
前記第１解像度画像において、所定の分類の前記動きオブジェクトに対応するオブジェクト領域を特定し、
前記第１解像度画像において特定された前記オブジェクト領域に対して、前記動きオブジェクトの認識処理を行う
処理をコンピュータに実行させるプログラム。