JP6655878B2 - 画像認識方法及び装置、プログラム - Google Patents

画像認識方法及び装置、プログラム Download PDF

Info

Publication number
JP6655878B2
JP6655878B2 JP2015040748A JP2015040748A JP6655878B2 JP 6655878 B2 JP6655878 B2 JP 6655878B2 JP 2015040748 A JP2015040748 A JP 2015040748A JP 2015040748 A JP2015040748 A JP 2015040748A JP 6655878 B2 JP6655878 B2 JP 6655878B2
Authority
JP
Japan
Prior art keywords
image
detected
tracking
detection
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015040748A
Other languages
English (en)
Other versions
JP2016162232A (ja
Inventor
矢野 光太郎
光太郎 矢野
一郎 梅田
一郎 梅田
睦凌 郭
睦凌 郭
ズー リーフェン
ズー リーフェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015040748A priority Critical patent/JP6655878B2/ja
Priority to EP16157703.6A priority patent/EP3065082A1/en
Priority to US15/058,067 priority patent/US10417773B2/en
Priority to CN201610118359.8A priority patent/CN105938622B/zh
Priority to KR1020160024845A priority patent/KR101971866B1/ko
Publication of JP2016162232A publication Critical patent/JP2016162232A/ja
Application granted granted Critical
Publication of JP6655878B2 publication Critical patent/JP6655878B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/248Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/277Analysis of motion involving stochastic approaches, e.g. using Kalman filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/62Extraction of image or video features relating to a temporal dimension, e.g. time-based feature extraction; Pattern tracking

Description

本発明は、動画像において所定の物体を認識し、追跡する画像認識方法及び装置に関するものである。
近年、監視カメラで撮影した映像を解析して、監視エリア内に人物が侵入したかどうかを検知して、検知結果を報告するようなシステムが提案されている。また、侵入を検知するだけでなく、画面に映っている人物を追跡して所定期間に監視エリアを通過した人数を数えたり、その人数から混雑度合いを検知するようなシステムも提案されている。
このようなアプリケーションを実現するためには、監視カメラ映像から自動的に人物を検出し、追跡する必要がある。画像から人物を検出する方法としては、例えば非特許文献1に提案されている方法がある。ここで示されている方法は、画像から画素値の勾配方向のヒストグラムを抽出し、それを特徴量(HOG特徴量)として画像中の部分領域が人物か否かを判定するものである。即ち、画素値の勾配の方向という特徴量によって人体の輪郭を表現し、認識に利用している。
しかしながら、このような人物検出技術を実際の監視カメラ映像に適用するには、検出率の向上が必要である。一般に人物検出技術に代表される物体検出技術においては、検出率を上げようとすると誤検出(検出対象でないものを誤報として検出してしまうこと)が多くなり、実用に向かない。したがって、誤検出を抑えつつ、検出率を向上させる方法が要求される。
このような問題の解決策として、一旦検出した人物を後続する時系列画像中で追跡しつつ、並行して人物の検出を継続して行うことで見かけ上の検出率を向上させるような方法が考えられる。図2を用いて、この方法を説明する。図中、画像上の実線で示した矩形は人物検出結果、破線で示した矩形は追跡結果である。同図に示すように時刻tで検出した結果を後続する時刻t+1と時刻t+2の画像で追跡し、同様に時刻t+1で検出した結果を後続する時刻t+2の画像で追跡、更に時刻t+2で人物を検出する。この例では、検出器は夫々の画像から5人中2人しか検出していないが、検出結果と追跡結果を統合することで結果的に全員を検出し、追跡している。
このような検出と追跡処理の併用において、特許文献1では、以前のフレームで物体が検出されたウィンドウを追跡対象にするとともに、現フレームを分割した一部の領域で物体を探索し、探索により新たに物体が検出されたウィンドウを追跡対象に追加するようにしている。
物体識別器を用いて追跡対象を処理を行うようにしている。追跡処理に識別器を用いることで、一旦検出した対象を見失うことなく確実に追跡することが可能である。
特開2014−48702号公報
Dalal and Triggs. Histograms of Oriented Gradients for Human Detection. IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2005
しかしながら、特許文献1に示されているような方法を用いて人物の追跡を行ったとしても、更に検出率を上げたいという要望がある。例えば、人物検出器における識別器の閾値を変更して検出率を向上させることも考えられるが、その場合、誤検出が増え、誤検出した対象をそのまま追跡し続ける、といった問題がある。
本発明の目的は、上記課題を解決すべく、カメラ映像から自動的に人物を検出し、追跡する高精度な画像認識装置を提供することである。
上記課題を解決するために、本発明によれば、画像処理装置に、動画像を取得する取得手段と、前記動画像中の注目画像の部分領域毎に検出対象とする物体を含む尤度に基づいて当該物体を検出する検出手段と、前記動画像中の前記注目画像に先行する画像において前記検出対象とする物体が検出された検出位置の近傍領域について前記物体を含む尤度に基づいて当該物体を追跡し、追跡中の物体について時刻の異なる複数の尤度から統計量を求め、該統計量から前記追跡中の物体を前記検出対象とする物体として確定する追跡手段と、前記検出手段により前記物体が検出された位置と前記追跡手段により前記物体が追跡された位置とを統合して前記注目画像における前記物体の検出位置を出力する出力手段とを備える。
本発明によれば、物体識別部が出力した尤度から追跡中の物体が検出対象とする物体か否かを判定するようにした。したがって、たとえ検出器が誤検出したとしても、その対象を追跡しながら人物なのか否かを判定するので、精度良く人物を検出し、追跡することができるという効果がある。
実施形態1の画像認識装置の構成を示す図である。 検出と追跡の連携処理を説明する図である。 実施形態1の処理フローチャートである。 検出結果の例を示す図である。 検出結果記憶部における記憶形式の例を示す図である。 物体情報記憶部における記憶形式の例を示す図である。 初期状態での追跡結果記憶部における記憶形式の例を示す図である。 物体追跡中の追跡結果記憶部における記憶形式の例を示す図である。 追跡結果の画像出力例を示す図である。 実施形態2の画像認識装置の構成を示す図である。
以下、添付図面を参照しながら本発明の実施形態を説明する。
<第1の実施形態>
図1に第1の実施形態の画像認識装置の構成を示す。図1に示すように本実施形態の画像認識装置は、画像取得部100、物体識別部200、物体検出部300、第一の物体追跡部400、第二の物体追跡部500、検出結果統合部600、追跡物体判定部700、追跡結果出力部800、検出結果記憶部910、物体情報記憶部920、追跡結果記憶部930を備えている。
画像取得部100は、カメラ等の撮像部で撮像した画像データを取得する。ここで取得する画像データはRGB画像であるものとする。物体識別部200は、画像取得部100で取得した画像データの部分領域が検出対象とする物体を含む尤度を算出して出力する。本実施形態では、検出対象を人物とする。すなわち、物体識別部200が出力する尤度は部分領域画像がどの程度人物らしいかを表す値である。
物体検出部300は、画像取得部100で取得した画像から部分領域を走査し、順次設定した部分領域の画像データ、すなわち部分領域画像、に対して物体識別部200が出力する尤度から画像中の物体位置を検出する。物体検出部300は物体を検出した検出位置および対応する部分領域画像を出力する。本実施形態では、物体検出部300は画像中の人物位置を検出する。
第一の物体追跡部400は、画像取得部100で取得した画像中の一部領域から部分領域を走査し、順次設定した部分領域画像に対して物体識別部200が出力する尤度から物体検出部300で検出した物体を追跡する。ここで第一の物体追跡部400が走査する一部領域は、画像取得部100が前の時刻に取得した画像中で物体検出部300が物体を検出した位置の近傍領域である。本実施形態では、第一の物体追跡部400は画像中の人物位置を追跡する。
第二の物体追跡部500は、画像取得部100で取得した画像中の一部領域から部分領域を走査し、順次設定した部分領域画像に対して物体検出部300で検出した部分領域画像を用いて物体を追跡する。ここで第二の物体追跡部500が走査する一部領域は物体検出部300が検出した物体位置の近傍領域である。第二の物体追跡部500が追跡し、出力する物体位置は、物体検出部300が検出した物体の検出終了時での位置に相当する。一般に物体検出は時間が掛かるため、毎フレーム全領域について行うのではなく、数フレームに1フレームを数フレームの時間を掛けて行うことになる。このため検出終了時のフレームは検出開始時のフレームとは異なっており、第二の物体追跡部による追跡が行われる。
検出結果統合部600は、物体検出部300で検出した物体と第一の物体追跡部400で追跡した物体とを、その位置情報にもとづいて対応付ける。追跡物体判定部700は、第一の物体追跡部400が追跡中の物体の物体識別部200が出力した尤度から追跡中の物体が検出および追跡対象とする物体か否かを判定する。本実施形態では、追跡物体判定部700は追跡中の物体が人物か否かを判定する。
追跡結果出力部800は、追跡結果を出力する。例えば、人物であると判定した部分領域画像を表す矩形を画像取得部100で取得した画像データに重畳してディスプレイに表示する。検出結果記憶部910は、物体検出部300が検出した物体位置と対応する部分領域画像を検出結果として記憶する。
物体情報記憶部920は、第一の物体追跡部400および第二の物体追跡部500が追跡した物体位置を画像データの撮像時刻と関連付けて物体情報として記憶する。
追跡結果記憶部930は、第一の物体追跡部400および第二の物体追跡部500が追跡した結果を記憶する。追跡結果は追跡対象毎に異なる時刻の物体情報を関連付けたもので、この結果から物体の移動軌跡を再現することができる。
以下、本実施形態の動作を図3に示す処理フローチャートに従って説明する。画像取得部100は撮像した画像データを取得する。取得した画像データは、夫々、画像取得部100のメモリに格納される(ステップS100)。物体検出部300は、ステップS100で取得した画像から部分領域を走査し、画像中の物体位置を検出する(ステップS200)。物体検出部300は画像から切り出した部分領域画像に対して物体識別部200を用いて部分領域画像が検出対象とする物体を含む尤度を求める。そして、尤度が所定の閾値より大きい部分領域を検出対象物体であると判定して、その位置を出力する。物体検出部300で行う検出方法としては、例えば、非特許文献1で公開されている方法を用いることができる。この方法によれば、画像から所定の大きさ、および、形状の部分領域を画像中で位置を少しずつずらしながら走査し、切り出した部分領域画像に対してHOG特徴量を求めてSVM(Support Vector Machine)によって人物を検出する。
ここで、SVMの出力が尤度に相当する。画像中から異なるサイズの人物を検出するには、事前に画像を所定の倍率(例えば、0.8倍やその自乗の0.82倍)になるように縮小処理を行い、縮小した夫々の画像に対しても検出処理を行うようにする。以下、簡単のために一つのサイズでのみ検出する場合を例に説明する。したがって、ここで出力する検出結果は画像中の水平および垂直方向の位置であり、例えば、部分領域の左上端の画像上での座標である。
ステップS210において画像から対象とする物体(本実施形態では人物)を検出したか否かを判断し、検出しなかった場合はステップS900に処理を移す。ステップS900では次の時刻(例えば、0.03秒後、等の所定の時間)での画像を処理すべく、ステップS100に処理を移す。なお、ステップS210において「対象とする物体を検出しなかった場合」とは、ステップS200での検出処理が所定の時間内に終了しなかった場合と物体検出処理を行ったが結果的に物体を検出しなかった場合の両方を含む。一方、ステップS210において対象とする物体を検出した場合は処理をステップS220に移す。
検出結果記憶部910は、物体検出部300が検出した物体位置と、その物体位置に対応する部分領域画像とを検出結果として記憶する(ステップS220)。例えば、図4(a)に示すように画像から2人の人物を検出したとする。この場合、図中、点P1および点P2の水平および垂直方向の位置座標を記憶する。また、同時に、図4(b)および(c)に示す部分領域画像の画像データを記憶する。これらの結果は夫々、識別番号に対応付けられる。検出結果記憶部910における記憶形式の例を図5に示す。(x1,y1)、(x2,y2)は夫々、点P1および点P2の水平および垂直方向の位置座標、{p11,p12,...,p1N}、{p21,p22,...,p2N}は夫々、部分領域画像の画素値を表す。但し、Nは部分領域画像の画素数である。同様に、一つの画像中からL人の人物を検出した場合は識別番号1〜Lに対してこれらの結果を記憶することになる。
検出結果統合部600は、物体検出部300で検出した検出結果と第一の物体追跡部400で追跡した追跡結果とを、その位置情報にもとづいて対応付ける(ステップS230)。ステップS220において記憶した夫々の検出結果に対する位置座標と第一の物体追跡部400で追跡した結果に対する位置座標とを比較し、一致するかどうかを判定する。但し、座標値の差が所定の範囲内にある場合も近似的に一致するとしてもよい。第一の物体追跡部400で追跡した結果は物体情報記憶部920に記憶されている。第一の物体追跡部400における追跡処理および追跡結果の詳細については後述する。
ステップS240において、物体検出部300で検出した全ての検出結果に対応する物体が物体情報記憶部920に既にある場合には、ステップS900に処理を移す。ステップS900では、次の時刻での画像を処理すべくステップS100に処理を移す。一方、ステップS240において物体検出部300で検出した検出結果に対応する物体が物体情報記憶部920にない、すなわち、検出結果が新規の物体を含む場合には、処理をステップS250に移す。
第二の物体追跡部500は、ステップS100で取得した画像中の一部領域から部分領域を走査し、順次設定した部分領域画像に対してステップS200で物体検出部300が検出した部分領域画像を用いて物体を追跡する(ステップS250)。ここで第二の物体追跡部500が追跡する対象は、ステップS240にて新規の物体であると判定した物体であり、検出結果記憶部910に記憶されている物体位置の近傍領域を走査する。走査する近傍領域の範囲は、画像を取得してから物体検出処理が終了するまでの間に物体が移動する範囲をカバーするように撮影するシーンに応じて予め設定しておく。物体検出部300の処理時間は処理する画像に依存するので、処理時間に応じて走査する近傍領域の範囲を適応的に設定するようにしてもよい。
第二の物体追跡部500は、ステップS100で取得した画像の部分領域画像と検出結果記憶部910に記憶されている部分領域画像とを照合し、画像間の類似度が最も高い物体位置を追跡結果として出力する。画像間の類似度は、画像データの相関、あるいは、差の絶対値和から求めてもよいし、夫々の画像から画像特徴量を抽出し、画像特徴量の類似度を求めるようにしてもよい。画像特徴量としては、例えば、HOG特徴量や色ヒストグラムを用いることができる。ここで出力する物体位置は、物体検出部300が検出した物体の検出終了時での位置に相当し、第二の物体追跡部500は画像間の類似度からその位置を推定している。
第二の物体追跡部500で追跡した結果は、物体情報記憶部920および追跡結果記憶部930に追加される(ステップS260)。物体情報記憶部920には、第二の物体追跡部500が追跡した物体位置が画像データの撮像時刻と関連付けて物体情報として記憶される。記憶される撮像時刻は、実際の撮像時刻でもよいし、撮像時刻に対応したフレーム番号でもよい。これらの結果は夫々、識別番号に対応付けられる。物体情報記憶部920における記憶形式の例を図6に示す。(x1,y1)、(x2,y2)は夫々、追跡した物体の位置座標、f1、f2は夫々、追跡した画像のフレーム番号を表す。これら2つの物体を1つの画像から追跡した場合はf1、f2は同じ番号になる。
追跡結果記憶部930には、第二の物体追跡部500が追跡した物体の、物体情報記憶部920に記憶された物体情報の識別番号が、追跡対象毎に異なる時刻間で関連付けられるように記憶される。これらの結果は夫々、追跡結果の識別番号に対応付けられる。ステップS260では、新規に検出した物体の追跡結果を初めて記憶するので、物体情報の識別番号は1つである。また、追跡結果の夫々について状態を表す識別子が付与される。追跡結果記憶部930における記憶形式の例を図7に示す。
図7の例は、物体検出部300で2つの物体を検出し、新規に検出した物体として第二の物体追跡部500で夫々追跡した結果である。ID1、ID2は夫々、追跡結果の識別番号に対応する物体情報記憶部920に記憶された物体情報の識別番号を表す。‘detect’は「物体が新規に検出された」という状態を表す。本実施形態では追跡結果の状態を表す識別子として、‘detect’、‘track’、‘recognize’の 3つの状態を用いる。‘track’、‘recognize’は夫々、「追跡中」、「対象物体として認識」の状態を表す。状態更新の詳細については後述する。
ステップS900では、次の時刻での画像を処理すべく、ステップS100に処理を移す。本実施形態では、ステップS100で取得した画像からステップS200〜260に示した処理と並行して検出した物体を追跡する処理を行う。ステップS300において、物体情報記憶部920に記憶されている物体情報を参照して、前の時刻の画像に追跡対象の物体があるか否かを検索する。例えば、時刻tの画像を取得した場合は、時刻t−1に相当するフレーム番号の物体情報があるかどうかを調べる。追跡対象の物体がない場合にはステップS900に処理を移す。ステップS900では次の時刻での画像を処理すべく、ステップS100に処理を移す。一方、追跡対象の物体がある場合には、該当する物体情報の識別番号を取得し、処理をステップS400に移す。
第一の物体追跡部400は、ステップS100で取得した画像中の一部領域から部分領域を走査し、順次設定した部分領域画像に対して物体識別部200が出力する尤度から物体を追跡する(ステップS400)。ここで第一の物体追跡部400が追跡する対象は物体情報記憶部920に記憶されている物体であり、物体情報記憶部920に記憶されている物体位置の近傍領域を走査する。走査する近傍領域の範囲は前後フレームの画像取得期間に物体が移動する範囲をカバーするように撮影するシーンに応じて予め設定しておく。したがって、第一の物体追跡部400は第二の物体追跡部500が走査する範囲に比べて狭い範囲を走査する。第一の物体追跡部400はステップS100で取得した画像の部分領域画像に対して物体識別部200を用いて部分領域画像が検出対象とする物体を含む尤度を求める。そして、走査した近傍領域の中で尤度が最も高い物体位置を追跡結果として出力する。ステップS300で取得した物体情報の数だけステップS400の処理を繰り返す。
第一の物体追跡部400で追跡した結果は、物体情報記憶部920および追跡結果記憶部930に追加される(ステップS410)。物体情報記憶部920には、第一の物体追跡部400が、追跡した物体位置が画像データの撮像時刻と関連付けて物体情報として記憶される。物体情報は図6に示した形式で記憶される。追跡結果記憶部930には第一の物体追跡部400が追跡した物体の、物体情報記憶部920に記憶された物体情報の識別番号が、追跡対象毎に異なる時刻間で関連付けられるように記憶される。これらの結果は夫々、追跡結果の識別番号に対応付けられる。
ステップS300で取得した物体情報の識別番号を追跡結果記憶部930から検索し、一致する識別番号を保持した検出結果に第一の物体追跡部400が追跡した物体識別番号を追加する。また、追跡結果の状態を‘track’に更新する。このときの追跡結果記憶部930に記憶した追跡結果の例を図8に示す。{ID11,ID12}、{ID21,ID22}は夫々、追跡結果の識別番号に対応する物体情報記憶部920に記憶された物体情報の識別番号を表す。‘track’は「追跡中」の状態を表す。この例では、前の時刻に第二の物体追跡部500で追跡を始めた識別番号ID11およびID21の物体を夫々、第一の物体追跡部400で追跡した識別番号ID12およびID22の物体に関連付けている。例えば、Nフレームの間、物体を追跡した場合は物体情報の識別番号がN個並んで検出結果に記憶される。ステップS300で取得した物体情報の数だけステップS410の処理を繰り返す。
追跡物体判定部700は、第一の物体追跡部400が追跡中の物体の物体識別部200が出力した尤度から追跡中の物体が検出および追跡対象とする物体か否かを判定する(ステップS420)。ステップS400で得た夫々の追跡結果の物体識別部200が出力した尤度が所定の閾値より大きいか否かを判定し、所定値より大きい場合は追跡中の物体を対象物体として確定する。このとき、追跡結果の状態を‘recognize’に更新する。本実施形態では、ステップS200における物体検出部300で用いる閾値は検出率を向上させるために比較的小さい値を設定している。すなわち、物体検出部300で検出した物体は追跡対象とする物体かどうか未確定の状態であり、追跡物体判定部700で追跡対象とする物体と確定するための候補である。一方、ステップS420における追跡物体判定部700で用いる閾値は誤検出を抑制するためにステップS200での値に比べて大きい値を設定するようにしている。
なお、本実施形態では、追跡中の物体の尤度が所定値より大きい場合に対象物体として確定するようにしたが、時刻の異なる追跡中の物体の複数の尤度から統計量を求め、対象物体として確定するようにしてもよい。例えば、尤度が所定値より大きい値を取る度数、または、相対度数(所定値より大きい値を取る度数と統計対象とする全体度数との比)を統計量とする。このように複数の尤度から統計量を求めて判定を行うと、判定結果の精度を高め、より信頼性の高い結果を得ることができる。統計量を求めて判定処理を行うには、ステップS200の物体検出処理で得た尤度、ステップS400の物体追跡処理で得た尤度を夫々、検出結果記憶部910、物体情報記憶部920に物体位置と共に記憶するようにする。ステップS300で取得した物体情報の数だけステップS420の処理を繰り返す。
追跡結果出力部800は、ステップS420で対象物体として確定した追跡結果を出力する(ステップS430)。図9に画像出力例を示す。図中、対象物体(本実施形態では人物)として確定した部分領域を矩形、物体を追跡した軌跡を破線で示す。追跡結果記憶部930に記憶されている追跡結果のうち、状態が‘recognize’である結果を抽出し、その物体情報識別番号から物体情報記憶部920に記憶されている物体情報の位置座標を取得し、矩形および軌跡を描画する。軌跡は部分領域の中心位置を過去に遡ってつないだものである。ステップS900では次の時刻での画像を処理すべく、ステップS100に処理を移す。
以上説明したように、第1の実施形態では、一旦検出した人物を後続する時系列画像中で追跡しながら並行して人物の検出を継続して行うようにした。そして、第一の物体追跡部400が物体識別部200を用いて人物を追跡し、取得した画像毎に追跡物体判定部700にて物体識別部200が出力した尤度から追跡対象が人物か否かを判定するようにした。この結果、検出処理よりも高頻度で、かつ、厳しい閾値で人物か否かを判定できるので、誤検出を抑えつつ、検出率を向上させることができる。
更に、物体検出部300で用いる閾値を追跡物体判定部700で用いる閾値よりも小さい値を設定することによって、追跡対象の候補をより多くし、検出率を向上させることができる。また、前記実施形態では第二の物体追跡部500によって物体検出部300が新規に検出した物体を追跡し、検出処理終了時での位置を推定するようにした。この結果、検出処理に時間が掛って検出対象とする物体が大きく移動するような場合でも正確に物体を追跡することができる。
<第2の実施形態>
一方、検出処理が高速に実行できたり、検出対象とする物体の移動速度が比較的遅い場合には、検出した物体が検出中に移動した後の位置を推定する必要がないので、第二の物体追跡部500を省略し、よりシンプルに本発明を構成することができる。図10にその構成を示す。図中、図1と同記号の構成要素は同等の機能を有する。また、動作は図3に示した処理フローに準ずるが、第二の物体追跡部500による物体追跡処理ステップS250は含まない。
なお、以上の実施形態では画像全体から部分領域を走査して検出処理を行うことを前提として説明したが、走査領域は画像の一部領域でもよい。画像から人物が出現する可能性のある領域、例えば、画像端や撮影シーン中の人物の出入り口に相当する領域に限定することができる。
また、以上の実施形態では画像中に現れる所定のサイズの人物を検出することを前提として説明したが、異なるサイズの人物を検出するようにしてもよい。この場合、検出結果や物体情報に位置座標だけでなくサイズも記憶するようにすればよい。
また、人物の検出精度を向上させるために、物体識別部200を複数の人物モデルを備えるように構成することができる。例えば、正面、背面、左側面、右側面の4つの人物モデルを向き別に備え、夫々の尤度を求めるようにする。そして、物体検出部300は最も尤度の高い結果から検出処理を行う。第一の物体追跡部400においては物体検出部300で検出した物体に対応するモデルに応じて物体識別部200のモデルを選択することで効率よく物体の追跡を行うことができる。例えば、物体検出部300が正面モデルで人物を検出した場合は、正面、左側面、右側面の3つの人物モデルに限定して物体追跡処理を行うようにする。
以上、画像から人物を検出する場合に本発明を適用する例について説明したが、人物以外の物体を検出対象とした場合にも本発明は広く適用可能である。
<その他の実施形態>
以上、実施形態を詳述したが、本発明は、例えば、システム、装置、方法、コンピュータ読み取り可能なプログラムもしくは記憶媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
更に、本発明は、ソフトウェアのプログラムをシステム或いは装置に直接或いは遠隔から供給し、そのシステム或いは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによって前述した実施形態の機能が達成される場合を含む。この場合、供給されるプログラムは実施形態で図に示したフローチャートに対応したコンピュータプログラムである。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどとの協働で実施形態の機能が実現されてもよい。この場合、OSなどが、実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される。
100 画像取得部
200 物体識別部
300 物体検出部
400 第一の物体追跡部
500 第二の物体追跡部
600 検出結果統合部
700 追跡物体判定部
800 追跡結果出力部
910 検出結果記憶部
920 物体情報記憶部
930 追加結果記憶部

Claims (8)

  1. 動画像を取得する取得手段と、
    前記動画像中の注目画像の部分領域毎に検出対象とする物体を含む尤度に基づいて当該物体を検出する検出手段と、
    前記動画像中の前記注目画像に先行する画像において前記検出対象とする物体が検出された検出位置の近傍領域について前記物体を含む尤度に基づいて当該物体を追跡し、追跡中の物体について時刻の異なる複数の尤度から統計量を求め、該統計量から前記追跡中の物体を前記検出対象とする物体として確定する追跡手段と、
    前記検出手段により前記物体が検出された位置と前記追跡手段により前記物体が追跡された位置とを統合して前記注目画像における前記物体の検出位置を出力する出力手段とを備えたことを特徴とする画像認識装置。
  2. 前記統計量は、前記複数の尤度が所定の閾値よりも大きい値を取る度数、または、相対度数であることを特徴とする請求項1記載の画像認識装置。
  3. 前記検出手段は、前記部分領域の尤度が所定の閾値よりも大きい場合に物体を検出することを特徴とし、更に前記閾値は前記追跡手段が用いる閾値よりも小さいことを特徴とする請求項2記載の画像認識装置。
  4. 動画像を取得する取得手段と、
    前記動画像中の注目画像の部分領域毎に検出対象とする物体を含む尤度に基づいて当該物体を検出する検出手段と、
    前記動画像中の前記注目画像に先行する画像において前記検出対象とする物体が検出された検出位置の近傍領域について前記物体を含む尤度に基づいて当該物体を追跡する第一の追跡手段と、
    前記検出手段が検出した物体の検出処理終了時での位置を推定する第二の追跡手段と、
    前記第一及び第二の追跡手段により前記物体が追跡された位置を出力する出力手段とを備えたことを特徴とする画像認識装置。
  5. 前記第二の追跡手段は、前記動画像中の画像の一部領域を走査して物体を追跡し、更に前記走査の範囲は前記第一の追跡手段の走査範囲よりも広いことを特徴とする請求項4に記載の画像認識装置。
  6. 動画像を取得する取得工程と、
    前記動画像中の注目画像の部分領域毎に検出対象とする物体を含む尤度に基づいて当該物体を検出する検出工程と、
    前記動画像中の前記注目画像に先行する画像において前記検出対象とする物体が検出された検出位置の近傍領域について前記物体を含む尤度に基づいて当該物体を追跡し、追跡中の物体について時刻の異なる複数の尤度から統計量を求め、該統計量から前記追跡中の物体を前記検出対象とする物体として確定する追跡工程と、
    前記検出工程において前記物体が検出された位置と前記追跡工程において前記物体が追跡された位置とを統合して前記注目画像における前記物体の検出位置を出力する出力工程とを備えたことを特徴とする画像認識方法。
  7. 動画像を取得する取得手段工程と、
    前記動画像中の注目画像の部分領域毎に検出対象とする物体を含む尤度に基づいて当該物体を検出する検出工程と、
    前記動画像中の前記注目画像に先行する画像において前記検出対象とする物体が検出された検出位置の近傍領域について前記物体を含む尤度に基づいて当該物体を追跡する第一の追跡工程と、
    前記検出工程において検出した物体の検出処理終了時での位置を推定する第二の追跡工程と、
    前記第一及び第二の追跡工程において前記物体が追跡された位置を出力する出力工程とを備えたことを特徴とする画像認識方法。
  8. 請求項6または7に記載の画像認識方法をコンピュータに実行させることを特徴とするコンピュータ読み取り可能なプログラム。
JP2015040748A 2015-03-02 2015-03-02 画像認識方法及び装置、プログラム Active JP6655878B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2015040748A JP6655878B2 (ja) 2015-03-02 2015-03-02 画像認識方法及び装置、プログラム
EP16157703.6A EP3065082A1 (en) 2015-03-02 2016-02-26 Method and apparatus for detecting object in moving image and storage medium storing program thereof
US15/058,067 US10417773B2 (en) 2015-03-02 2016-03-01 Method and apparatus for detecting object in moving image and storage medium storing program thereof
CN201610118359.8A CN105938622B (zh) 2015-03-02 2016-03-02 检测运动图像中的物体的方法和装置
KR1020160024845A KR101971866B1 (ko) 2015-03-02 2016-03-02 동화상에 있어서 물체를 검출하는 방법 및 장치, 및 그 프로그램을 기억한 기억 매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015040748A JP6655878B2 (ja) 2015-03-02 2015-03-02 画像認識方法及び装置、プログラム

Publications (2)

Publication Number Publication Date
JP2016162232A JP2016162232A (ja) 2016-09-05
JP6655878B2 true JP6655878B2 (ja) 2020-03-04

Family

ID=55588047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015040748A Active JP6655878B2 (ja) 2015-03-02 2015-03-02 画像認識方法及び装置、プログラム

Country Status (5)

Country Link
US (1) US10417773B2 (ja)
EP (1) EP3065082A1 (ja)
JP (1) JP6655878B2 (ja)
KR (1) KR101971866B1 (ja)
CN (1) CN105938622B (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5999394B2 (ja) * 2015-02-20 2016-09-28 パナソニックIpマネジメント株式会社 追跡支援装置、追跡支援システムおよび追跡支援方法
US20170054982A1 (en) * 2015-08-19 2017-02-23 Hitachi, Ltd. Real time video stream processing systems and methods thereof
CN105957110B (zh) * 2016-06-29 2018-04-13 上海小蚁科技有限公司 用于检测对象的设备和方法
CN106504270B (zh) 2016-11-08 2019-12-20 浙江大华技术股份有限公司 一种视频中目标物体的展示方法及装置
JP6914699B2 (ja) * 2017-04-04 2021-08-04 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US10839552B2 (en) * 2017-06-01 2020-11-17 Nec Corporation Image processing apparatus, tracking method, and program
US10395385B2 (en) 2017-06-27 2019-08-27 Qualcomm Incorporated Using object re-identification in video surveillance
JP2019020360A (ja) * 2017-07-21 2019-02-07 日本電信電話株式会社 物体認識装置、物体認識方法、及びプログラム
CN107742303B (zh) * 2017-09-29 2021-05-25 南京阿凡达机器人科技有限公司 一种基于机器人的目标图像显示处理方法及系统
CN107820010B (zh) * 2017-11-17 2020-11-06 英业达科技有限公司 摄影计数装置
JP7208713B2 (ja) * 2018-02-13 2023-01-19 キヤノン株式会社 画像解析装置および画像解析方法
JP6977624B2 (ja) 2018-03-07 2021-12-08 オムロン株式会社 物体検出装置、物体検出方法、およびプログラム
WO2019180917A1 (ja) 2018-03-23 2019-09-26 日本電気株式会社 オブジェクト追跡装置、オブジェクト追跡方法、及びオブジェクト追跡プログラム
US10593049B2 (en) * 2018-05-30 2020-03-17 Chiral Software, Inc. System and method for real-time detection of objects in motion
CN108898086B (zh) * 2018-06-20 2023-05-26 腾讯科技(深圳)有限公司 视频图像处理方法及装置、计算机可读介质和电子设备
TWI692731B (zh) * 2019-01-02 2020-05-01 瑞昱半導體股份有限公司 物件位置判斷電路
CN111416916B (zh) * 2019-01-04 2022-07-26 瑞昱半导体股份有限公司 物件位置判断电路
JP6579727B1 (ja) * 2019-02-04 2019-09-25 株式会社Qoncept 動体検出装置、動体検出方法、動体検出プログラム
US11948312B2 (en) 2019-04-17 2024-04-02 Nec Corporation Object detection/tracking device, method, and program recording medium
JP6785437B2 (ja) * 2019-09-19 2020-11-18 パナソニックIpマネジメント株式会社 人物行動監視装置および人物行動監視システム
JP7360303B2 (ja) 2019-11-08 2023-10-12 株式会社デンソーテン 画像処理装置および画像処理方法
CN112614156A (zh) * 2020-12-16 2021-04-06 深圳市安软科技股份有限公司 一种多目标跟踪网络模型的训练方法、装置及相关设备
JP2022110648A (ja) * 2021-01-19 2022-07-29 株式会社東芝 情報処理システム、情報処理方法およびプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7110569B2 (en) * 2001-09-27 2006-09-19 Koninklijke Philips Electronics N.V. Video based detection of fall-down and other events
KR20080073933A (ko) * 2007-02-07 2008-08-12 삼성전자주식회사 객체 트래킹 방법 및 장치, 그리고 객체 포즈 정보 산출방법 및 장치
JP4458173B2 (ja) * 2008-03-19 2010-04-28 カシオ計算機株式会社 画像記録方法、画像記録装置、およびプログラム
JP5361524B2 (ja) 2009-05-11 2013-12-04 キヤノン株式会社 パターン認識システム及びパターン認識方法
JP5656567B2 (ja) 2010-11-05 2015-01-21 キヤノン株式会社 映像処理装置および方法
JP5498454B2 (ja) * 2011-09-15 2014-05-21 株式会社東芝 追跡装置、追跡方法およびプログラム
JP5886616B2 (ja) * 2011-11-30 2016-03-16 キヤノン株式会社 物体検出装置、物体検出装置の制御方法、およびプログラム
WO2013128839A1 (ja) * 2012-03-02 2013-09-06 日本電気株式会社 画像認識システム、画像認識方法およびコンピュータ・プログラム
JP2014048702A (ja) 2012-08-29 2014-03-17 Honda Elesys Co Ltd 画像認識装置、画像認識方法、及び画像認識プログラム
US9852511B2 (en) * 2013-01-22 2017-12-26 Qualcomm Incoporated Systems and methods for tracking and detecting a target object
CN103106667B (zh) 2013-02-01 2016-01-20 山东科技大学 一种面向遮挡和场景变换的运动对象追踪方法
US9589595B2 (en) * 2013-12-20 2017-03-07 Qualcomm Incorporated Selection and tracking of objects for display partitioning and clustering of video frames
US9489598B2 (en) * 2014-08-26 2016-11-08 Qualcomm Incorporated Systems and methods for object classification, object detection and memory management
US9811732B2 (en) * 2015-03-12 2017-11-07 Qualcomm Incorporated Systems and methods for object tracking

Also Published As

Publication number Publication date
KR101971866B1 (ko) 2019-04-24
US10417773B2 (en) 2019-09-17
US20160260226A1 (en) 2016-09-08
CN105938622B (zh) 2020-06-30
CN105938622A (zh) 2016-09-14
KR20160106514A (ko) 2016-09-12
JP2016162232A (ja) 2016-09-05
EP3065082A1 (en) 2016-09-07

Similar Documents

Publication Publication Date Title
JP6655878B2 (ja) 画像認識方法及び装置、プログラム
US10417503B2 (en) Image processing apparatus and image processing method
US10636152B2 (en) System and method of hybrid tracking for match moving
JP6501092B2 (ja) オブジェクトセグメンテーションのための前景マスク補正のための画像処理装置及び方法
US9317772B2 (en) Method for improving tracking using dynamic background compensation with centroid compensation
US8331619B2 (en) Image processing apparatus and image processing method
JP6555906B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP4373840B2 (ja) 動物体追跡方法、動物体追跡プログラムおよびその記録媒体、ならびに、動物体追跡装置
KR20140013407A (ko) 객체 추적 장치 및 방법
JP2010176380A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
US10181075B2 (en) Image analyzing apparatus,image analyzing, and storage medium
EP3241151A1 (en) An image face processing method and apparatus
JP6362085B2 (ja) 画像認識システム、画像認識方法およびプログラム
US9947106B2 (en) Method and electronic device for object tracking in a light-field capture
JPWO2017064838A1 (ja) 顔検出装置およびこれを備えた顔検出システムならびに顔検出方法
KR102434397B1 (ko) 전역적 움직임 기반의 실시간 다중 객체 추적 장치 및 방법
KR20170053807A (ko) 동적 배경을 가진 영상의 대상 객체 검출 방법
AU2014277855A1 (en) Method, system and apparatus for processing an image
JP6028972B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
Ilao et al. Crowd estimation using region-specific HOG With SVM
JP2019075051A (ja) 画像処理装置
JP2004295416A (ja) 画像処理装置
JP6539720B1 (ja) 画像処理装置
JP2020021170A (ja) 特定装置、特定方法及び特定プログラム
US20230410467A1 (en) Image processing device and image processing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190924

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200204

R151 Written notification of patent or utility model registration

Ref document number: 6655878

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151