JP2018190132A - 画像認識用コンピュータプログラム、画像認識装置及び画像認識方法 - Google Patents

画像認識用コンピュータプログラム、画像認識装置及び画像認識方法 Download PDF

Info

Publication number
JP2018190132A
JP2018190132A JP2017091201A JP2017091201A JP2018190132A JP 2018190132 A JP2018190132 A JP 2018190132A JP 2017091201 A JP2017091201 A JP 2017091201A JP 2017091201 A JP2017091201 A JP 2017091201A JP 2018190132 A JP2018190132 A JP 2018190132A
Authority
JP
Japan
Prior art keywords
image
subject
region
images
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017091201A
Other languages
English (en)
Other versions
JP6939065B2 (ja
Inventor
明燮 鄭
Mingbian Zheng
明燮 鄭
馬場 孝之
Takayuki Baba
孝之 馬場
上原 祐介
Yusuke Uehara
祐介 上原
信浩 宮▲崎▼
Nobuhiro Miyazaki
信浩 宮▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017091201A priority Critical patent/JP6939065B2/ja
Publication of JP2018190132A publication Critical patent/JP2018190132A/ja
Application granted granted Critical
Publication of JP6939065B2 publication Critical patent/JP6939065B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】被写体が表された領域が誤検出されている可能性がある画像を特定することが可能な画像認識用コンピュータプログラムを提供する。【解決手段】画像認識用コンピュータプログラムは、撮像部により得られた時系列の複数の画像のそれぞれから被写体が表された領域を検出しS101、被写体が表された領域の縦横比の時系列に沿った変化度合い、または、被写体が表された領域内の各画素の前景の値と背景の値との差に応じてS105、複数の画像のうち、被写体が表された領域が誤検出されている可能性がある要注意画像を特定する、ことをコンピュータに実行させるための命令を含む。【選択図】図8

Description

本発明は、例えば、画像上に表された被写体を認識する画像認識用コンピュータプログラム、画像認識装置及び画像認識方法に関する。
防犯、防災、あるいは情報収集といった目的のために、建物内あるいは屋外に監視カメラが設置されることがある。このような監視カメラにより得られた画像に基づいて、上記のような所望の目的を達成するためには、その画像から、人あるいは車両といった認識対象となる被写体を正確に検出できることが好ましい。そこで、背景画像のフレームと対象映像のフレーム間の背景差分領域を求めることで、対象映像のフレームにおいて被写体が表された領域を抽出する技術が提案されている(例えば、特許文献1を参照)。
特開平06−251151号公報
画像から被写体を検出するための技術の一つとして、adaBoost、サポートベクトルマシン、あるいは、ニューラルネットワークといった、機械学習を用いた識別器が知られている。このような識別器を用いて画像から被写体を高精度で検出できるようにするために、カメラの設置環境下において被写体が表された様々な画像、及び、被写体が表されていない様々な画像が、その識別器を学習するための教師画像として収集される。
このような教師画像を収集するために、画像ごとに、その画像に被写体が表されているか否かを確認し、かつ、被写体が表されている場合には、被写体が表されている領域を示す枠及び識別情報などを画像に付与する作業が行われる。作業者が、画像ごとにこのような作業を実施すると、その工数は膨大となる。そのため、このような作業は、極力自動で行えることが好ましい。しかしながら、例えば、特許文献1に記載されたような技術を利用して、画像に被写体が表されているか否かを自動的に判別する場合でも、被写体でないものを被写体と誤検出したり、被写体の検出に失敗することがある。このような場合、得られた教師画像のセットは識別器の学習には適さないものとなる。
一つの側面では、本発明は、被写体が表された領域が誤検出されている可能性がある画像を特定することが可能な画像認識用コンピュータプログラムを提供することを目的とする。
一つの実施形態によれば、画像認識用コンピュータプログラムが提供される。この画像認識用コンピュータプログラムは、撮像部により得られた時系列の複数の画像のそれぞれから被写体が表された領域を検出し、被写体が表された領域の縦横比の時系列に沿った変化度合い、または、被写体が表された領域内の各画素の前景の値と背景の値との差に応じて、複数の画像のうち、被写体が表された領域が誤検出されている可能性がある要注意画像を特定する、ことをコンピュータに実行させるための命令を含む。
一つの側面によれば、被写体が表された領域が誤検出されている可能性がある画像を特定することができる。
一つの実施形態による、画像認識装置のハードウェア構成図である。 画像認識処理に関するCPUの機能ブロック図である。 画素値差算出の概要の説明図である。 被写体領域の縦横比算出の概要の説明図である。 検出情報テーブルの一例を示す図である。 ユーザインターフェースに表示される画像の一例を示す図である。 (a)及び(b)は、変形例による、ユーザインターフェースに表示される画像の一例を示す図である。 画像認識処理の動作フローチャートである。
以下、図を参照しつつ、画像認識装置、及び、その画像認識装置で利用される画像認識方法及び画像認識用コンピュータプログラムについて説明する。この画像認識装置は、例えば、機械学習に基づく被写体認識用の識別器の学習に使用される教師画像のセットを作成するために用いられる。そのために、この画像認識装置は、その識別器が利用されるカメラの設置環境下で、そのカメラにより得られた一連の複数の画像のそれぞれから、検出対象となる被写体が表されている被写体領域を検出する。そしてこの画像認識装置は、被写体領域内の各画素の前景と背景間の画素値の差の統計的代表値、及び、被写体領域の縦横比を算出する。そしてこの画像認識装置は、画素値の差の統計的代表値または被写体領域の縦横比の時系列に沿った変化度合いに応じて、被写体領域が誤検出されている可能性がある画像を要注意画像として特定する。なお、本明細書において、被写体領域が誤検出されていることには、被写体領域に被写体以外のものが表されていることだけでなく、被写体領域に被写体の一部しか表されていないことも含まれる。
図1は、一つの実施形態による、画像認識装置のハードウェア構成図である。図1に示されるように、画像認識装置1は、カメラ2と、通信インターフェース3と、ユーザインターフェース4と、メモリ5と、記憶媒体アクセス装置6と、CPU(Central Processing Unit)7とを有する。
カメラ2は、撮像部の一例であり、所定の撮影範囲を撮影し、その撮影範囲が写った画像を生成する。そのために、カメラ2は、CCDあるいはC-MOSなど、可視光に感度を有する固体撮像素子のアレイで構成された2次元検出器と、その2次元検出器上に撮影範囲の像を結像する結像光学系とを有する。カメラ2は、一定の撮影周期(例えば1/30秒)ごとに画像を生成する。そしてカメラ2は、画像を生成する度に、その画像を、通信ネットワークを介して、通信インターフェース3へ出力する。
本実施形態では、カメラ2により生成される画像は、各画素の値が輝度値で表されるモノクロ画像である。しかし、カメラ2により生成される画像は、各画素の値がRGB色空間または他の色空間(例えば、HLS色空間あるいはYPbPr色空間)の値で表されるカラー画像であってもよい。
通信インターフェース3は、イーサネット(登録商標)などの通信規格に従った通信ネットワークに接続するための通信インターフェース及びその制御回路を有する。通信インターフェース3は、通信ネットワークを介してカメラ2から画像を受け取り、その受け取った画像をCPU7にわたす。また通信インターフェース3は、CPU7から受け取った、機械学習システムの学習用の教師画像のセットを、通信ネットワークを介して他の機器(図示せず)へ出力してもよい。
ユーザインターフェース4は、例えば、キーボードとマウスなどの入力装置と、液晶ディスプレイといった表示装置とを有する。あるいは、ユーザインターフェース4は、タッチパネルといった、入力装置と表示装置とが一体化された装置を有していてもよい。そしてユーザインターフェース4は、例えば、CPU7から受け取った、画像認識処理が行われた画像とその画像認識結果とを表示装置に表示する。また、ユーザインターフェース4は、表示装置に表示された画像及び画像認識結果を確認したユーザの操作に応じて修正された被写体領域の外接矩形を表す情報及び被写体の識別情報などをCPU7へ出力する。
メモリ5は、記憶部の一例であり、例えば、読み書き可能な半導体メモリと読み出し専用の半導体メモリである。そしてメモリ5は、例えば、CPU7で実行される画像認識処理を実行するための各種のデータ及び認識結果などを記憶する。さらに、メモリ5は、カメラ2から取得した画像を一定期間記憶してもよい。
記憶媒体アクセス装置6は、記憶部の他の一例であり、例えば、磁気ディスク、半導体メモリカード及び光記憶媒体といった記憶媒体8にアクセスする装置である。記憶媒体アクセス装置6は、例えば、記憶媒体8に記憶された、CPU7上で実行される画像認識処理用のコンピュータプログラムを読み込み、CPU7に渡す。あるいは、記憶媒体アクセス装置6は、作成された教師画像のセットをCPU7から受け取って、そのセットを記憶媒体8に書き込んでもよい。
CPU7は、制御部の一例であり、例えば、1個または複数個のプロセッサ及びその周辺回路を有する。そしてCPU7は、画像認識装置1全体を制御する。また、CPU7は、通信インターフェース3を介してカメラ2から画像を受け取る度に、その画像に画像生成日時を対応付けてメモリ5に保存する。そしてCPU7は、教師画像のセットに含める予定の複数の画像のそれぞれに対して画像認識処理を実行する。
本実施形態では、画像認識処理の対象となる複数の画像は、カメラ2が連続的に撮影することにより生成された、時系列に沿って連続する一連の画像である。なお、画像認識処理の対象となる複数の画像には、そのような一連の画像のセットが複数含まれていてもよい。また、画像認識処理における認識対象となる被写体は人である。しかし、認識対象となる被写体は人に限られず、例えば、車両あるいは人以外の他の動物であってもよい。
図2は、画像認識処理に関するCPU7の機能ブロック図である。図2に示されるように、CPU7は、被写体検出部11と、画素値差算出部12と、縦横比算出部13と、要注意判定部14と、提示部15とを有する。
CPU7が有するこれらの各部は、例えば、CPU7が有するプロセッサ上で実行されるコンピュータプログラムによって実現される機能モジュールである。あるいは、CPU7が有するこれらの各部は、ファームウェアとして画像認識装置1に実装されてもよい。
被写体検出部11は、画像認識処理の対象となる複数の画像のそれぞれから被写体が表された領域である被写体領域を検出する。なお、被写体検出部11は、複数の画像のそれぞれに対して同一の処理を行えばよいので、以下では、一つの画像に対する処理について説明する。
被写体検出部11は、例えば、画像に対して背景差分処理を行うことにより、被写体領域を検出する。この場合、被写体検出部11は、画像と背景画像との各対応画素間の輝度値の差の絶対値を算出し、輝度値の差の絶対値が所定の閾値以上となる画素を抽出する。そして被写体検出部11は、抽出した画素の集合を被写体領域とする。なお、背景画像は、例えば、カメラ2の撮影範囲内に被写体が存在しないときにカメラ2がその撮影範囲を撮影することにより生成され、メモリ5に予め保存される。
なお、被写体検出部11は、抽出した画素の集合に対してラベリング処理を行って、互いに連結される画素同士を一つの被写体領域としてもよい。これにより、被写体検出部11は、一つの画像に複数の被写体が写っている場合でも、被写体ごとに、その被写体が表される被写体領域を検出できる。また、被写体検出部11は、ラベリング処理の前に、モルフォロジーの膨張収縮演算を実行して得られる領域を被写体領域としてもよい。これにより、被写体検出部11は、被写体の一部が写っているにもかかわらず、孤立した画素を被写体領域に含めることができる。
また、被写体検出部11は、カメラ2の設置環境に対して最適化されていない、被写体検出用の汎用識別器を用いて、画像から被写体領域を検出してもよい。この場合、被写体検出部11は、画像上にウィンドウを設定し、ウィンドウ内の各画素の値から、汎用識別器に入力する特徴(例えば、Haar-like特徴)を算出して、その特徴を汎用識別器に入力することで、ウィンドウ内に被写体が写っているか否か判定する。そして被写体検出部11は、被写体が写っていると判定されたウィンドウに対して、例えば、改めて背景差分処理を実行することで、被写体領域を検出してもよい。被写体検出部11は、ウィンドウの位置を変更しながら上記の処理を繰り返すことで、画像上の何れの位置に写っている被写体についても、被写体領域を検出できる。
なお、汎用識別器として、例えば、adaBoost識別器、サポートベクトルマシンあるいは多層パーセプトロンなどを用いることができる。ただし、汎用識別器は、カメラ2の設置環境に応じて最適化された識別器と比較して、被写体の検出精度は低い。そこで汎用識別器は、被写体以外のものが写っている領域を被写体領域として誤検出する可能性が若干高くても、被写体が写っているにもかかわらず、被写体領域の検出に失敗する可能性が低くなるように調整されていることが好ましい。
被写体検出部11は、画像上に複数の被写体領域が検出された場合、それら被写体領域のうちの面積が最大となる被写体領域を残し、他の被写体領域は誤検出されたものとして削除してもよい。あるいは、被写体検出部11は、面積が所定の面積閾値未満となる被写体領域について、誤検出されたものとして削除してもよい。
検出した被写体領域は、例えば、被写体領域に含まれる各画素の値と被写体領域外の各画素の値とが異なる2値画像で表される。被写体検出部11は、各画像について、検出した被写体領域を画素値差算出部12及び縦横比算出部13へ通知する。
画素値差算出部12は、画像認識処理の対象となる複数の画像のうち、被写体領域が検出された画像に対して、被写体領域内の前景と背景間の画素値の差の統計的代表値を算出する。この画素値の差の統計的代表値は、被写体領域が誤検出されている可能性がある要注意画像を特定するために用いられる特徴量の一つである。なお、画素値差算出部12は、複数の画像のそれぞれに対して同一の処理を行えばよいので、以下では、一つの画像に対する処理について説明する。
画素値差算出部12は、例えば、直前の画像について被写体領域が確認されている場合、直前の画像について設定された、被写体領域の外接矩形と同サイズの画素値差算出枠を、着目する画像の被写体領域の位置に応じて設定する。そして画素値差算出部12は、画素値差算出枠内の被写体領域の各画素について前景と背景間の画素値の差を算出する。例えば、画素値差算出部12は、画素値差算出枠の上端を被写体領域の上端と一致させ、かつ、画素値差算出枠の水平方向の中心が、被写体領域の重心の水平方向の座標と一致するように、画素値差算出枠を設定する。これにより、着目する画像において被写体領域が正確に検出されていない場合でも、画素値差算出部12は、画素値差が算出される領域を適切に設定できる。
なお、直前の画像について検出された被写体領域が作業者により確認されていない場合には、画素値差算出部12は、着目する画像の被写体領域の外接矩形そのものを画素値差算出枠としてもよい。
本実施形態では、画素値差算出部12は、被写体領域を複数のサブ領域に分割する。その際、画素値差算出部12は、互いに類似する画素値を持つ画素同士が同じサブ領域に含まれるように、例えば、被写体領域の前景内の各画素の値(すなわち、着目画像における、被写体領域内の各画素の値)に基づいて、被写体領域をサブ領域ごとに分割する。なお、被写体領域をサブ領域ごとに分割するために、画素値差算出部12は、例えば、単純領域拡張法といった領域分割法を用いることができる。また、カメラ2により生成される画像がカラー画像である場合には、画素値差算出部12は、領域分割法として、例えば、Maximally Stable Color Regions(MSCR)法といった、色情報を用いる領域分割法を使用してもよい。
画素値差算出部12は、サブ領域ごとに、そのサブ領域内の各画素について、前景と背景の画素値の差の絶対値を算出する。なお、前景の画素の画素値は、着目する画像における、対応画素の画素値であり、背景の画素の画素値は、背景画像における、対応画素の画素値である。また、本実施形態では、画素値の差の絶対値の算出に利用する画素値は、輝度値とすることができる。しかし、カメラ2により生成される画像がカラー画像である場合、画素値の差の絶対値の算出に利用する画素値は、何れかの色成分、色相あるいは彩度の値であってもよい。
画素値差算出部12は、サブ領域ごとに、そのサブ領域内の各画素の画素値の差の絶対値の平均値を、前景と背景間の画素値の差の統計的代表値として算出する。
図3は、画素値差算出の概要の説明図である。図3に示されるように、着目する画像300と背景画像301間の背景差分により得られる差分画像302上で、被写体領域310が特定される。被写体領域310が複数のサブ領域311に分割され、サブ領域311ごとに、前景と背景間の画素値の差の統計的代表値mdiが算出される。
なお、変形例によれば、画素値差算出部12は、サブ領域ごとに、そのサブ領域内の各画素の輝度値の差の絶対値の最頻値あるいは中央値を、前景と背景間の画素値の差の統計的代表値として算出してもよい。また、他の変形例によれば、画素値差算出部12は、被写体領域全体として、前景と背景間の画素値の差の絶対値の平均値、中央値あるいは最頻値の何れかを、前景と背景間の画素値の差の統計的代表値として算出してもよい。
画素値差算出部12は、画像ごとに、その画像の被写体領域のサブ領域ごとの画素値の差の統計的代表値を要注意判定部14へ通知する。また、被写体領域全体として一つの統計的代表値が算出されている場合、画素値差算出部12は、被写体領域について算出されたその統計的代表値を要注意判定部14へ通知する。
縦横比算出部13は、画像認識処理の対象となる複数の画像のうち、被写体領域が検出された画像に対して、被写体領域の縦横比を算出する。なお、縦横比算出部13は、複数の画像のそれぞれに対して同一の処理を行えばよいので、以下では、一つの画像に対する処理について説明する。
縦横比算出部13は、被写体領域に対して外接矩形を設定し、その外接矩形の横幅に対する縦幅の比を、被写体領域の縦横比として算出する。画像に表される被写体(例えば、人)の縦横比の取り得る範囲は、その被写体の形状に応じて予め想定される。また、被写体領域の縦横比は、ある画像について被写体の一部が被写体領域に含まれていなかったり、逆に、被写体領域に被写体以外の物が含まれると、時系列に大きく変化することがある。そのため、被写体領域の縦横比の時系列の変化は、要注意画像を特定するために用いられる特徴量の他の一つである。
図4は、被写体領域の縦横比算出の概要の説明図である。画像400上の被写体領域401に対して、被写体領域401の上下端、及び左右端とそれぞれ接するように、外接矩形402が設定される。この場合、被写体領域401の縦横比Rは、外接矩形402の横幅Wに対する縦幅Hの比として算出される。すなわち、外接矩形402の左上端の画素SPの座標が(x1,y1)であり、右下端の画素EPの座標が(x2,y2)であれば、縦横比Rは、次式で表される。
縦横比算出部13は、画像ごとに、その画像の被写体領域の縦横比を要注意判定部14へ通知する。
要注意判定部14は、画像認識処理の対象となる複数の画像のうち、被写体領域が検出された画像について、被写体領域の前景と背景間の画素値の差の統計的代表値及び被写体領域の縦横比に基づいて、要注意画像か否か判定する。なお、要注意判定部14は、複数の画像のそれぞれに対して同一の処理を行えばよいので、以下では、一つの画像に対する処理について説明する。
例えば、画像上に表された被写体とその背景間の画素値の差が小さいほど、被写体を正確に検出することが困難となる。そのため、被写体領域の前景と背景間の画素値の差の統計的代表値(例えば、差の絶対値の平均値、中央値あるいは最頻値)が小さいほど、被写体の一部について検出に失敗していたり、逆に、被写体以外の物体を被写体として誤検出している可能性が高くなる。また、被写体領域の一部に、被写体以外の物が含まれる場合、その一部について、前景と背景間の画素値の差の統計的代表値が小さくなることがある。
そこで、要注意判定部14は、着目する画像の被写体領域について複数のサブ領域が設定されている場合、サブ領域ごとに、そのサブ領域について算出された前景と背景間の画素値の差の統計的代表値を画素値差閾値Th1と比較する。そして要注意判定部14は、何れかのサブ領域について、その統計的代表値が画素値差閾値Th1未満となる場合、そのサブ領域が含まれる被写体領域は、正しく検出されていない可能性があると判定する。すなわち、被写体の一部のみが被写体領域に含まれていたり、あるいは、被写体とは異なる他の物体が被写体領域に含まれている可能性がある。そこで要注意判定部14は、着目する画像を要注意画像と判定する。このように、要注意判定部14は、サブ領域ごとに前景と背景間の画素値の差の統計的代表値を画素値差閾値Th1と比較することで、被写体領域の一部に他の物体が含まれている場合でも、その被写体領域を含む画像を要注意画像として特定できる。
なお、着目する画像の被写体領域全体について前景と背景間の画素値の差の統計的代表値が算出されている場合、要注意判定部14は、その統計的代表値が画素値差閾値Th1未満となる場合、着目する画像を要注意画像と判定すればよい。
なお、画素値差閾値Th1は、例えば、カメラ2の撮影範囲内に被写体が存在しない状態でカメラ2がその撮影範囲を互いに異なるタイミングで撮影することで得られた2枚の背景画像の対応画素間の差分値D(i,j)の標準偏差σの3倍とすることができる。
また、時間的に連続する複数の画像間で、被写体の形状はあまり変化しないと想定される。したがって、各画像において、被写体領域が被写体を正しく表している場合には、被写体領域の縦横比は、それら複数の画像間であまり変化しないと想定される。一方、何れかの画像において被写体領域が被写体を正確に表していなければ、その画像と前後の画像間で、被写体領域の縦横比が相対的に大きく変化することがある。
そこで要注意判定部14は、着目する画像の被写体領域の縦横比Rnと、着目する画像の直前の被写体領域の縦横比Rn-1間の差Rvを縦横比の時系列に沿った変化度合いとして算出し、その変化度合いRvを所定の形状閾値Th2と比較する。そして要注意判定部14は、その変化度合いRvが所定の形状閾値Th2よりも大きければ、着目する画像を要注意画像と判定する。なお、変化度合いRvは、例えば、次式に従って算出される。
また、形状閾値Th2は、想定される被写体の縦横比に応じて予め設定される。
なお、着目する画像の直前の画像において被写体領域が検出されていない場合、被写体領域の縦横比の時系列に沿った変化度合いが算出されないので、要注意判定部14は、着目する画像を要注意画像と判定してもよい。また、要注意判定部14は、被写体領域が検出されなかった画像を、要注意画像でないとしてもよい。
要注意判定部14は、画像ごとに、検出された被写体領域の外接矩形の位置及び範囲と、被写体領域内のサブ領域ごとの画素値の差の統計的代表値と、縦横比と、要注意画像か否かを表すフラグとを、メモリ5に記憶される検出情報テーブルに書き込む。
図5は、検出情報テーブルの一例を示す図である。検出情報テーブル500には、行ごとに、一つの画像についての検出情報が表される。すなわち、検出情報テーブル500の左端の欄には、画像の生成順序を表すフレーム番号が示される。左から2番目の欄には、検出された被写体領域の外接矩形の左上端画素の座標SPn(x1,y1)及び右下端画素の座標EPn(x2,y2)が示される。左から3番目の欄には、被写体領域内のサブ領域ごとの前景と背景間の画素値の差の統計的代表値(md1, md2, ...)が示される。また、右から2番目の欄には、縦横比Rnが示される。そして右端の欄には、要注意画像か否かのフラグが示される。
提示部15は、画像認識処理の対象となる複数の画像のそれぞれを、例えば、生成時間順に、ユーザインターフェース4に順次表示させる。その際、提示部15は、検出情報テーブルを参照して、要注意画像でない画像については、被写体領域の外接矩形をその画像に重畳して表示させる。一方、提示部15は、検出情報テーブルを参照して、要注意画像である画像については、被写体領域が検出されていても、被写体領域の外接矩形を表示しない。提示部15は、代わりに、被写体領域の近傍に、要注意画像であることを表すマーク、例えば、矢印を表示させてもよい。
図6は、ユーザインターフェース4に表示される画像の一例を示す図である。この例では、時刻T0〜T3に得られた4枚の画像600〜603のうち、時刻T3に得られた画像603のみが要注意画像であるとする。なお、画像600〜603は、例えば、生成時間順に一枚ずつ表示される。
この場合、画像600〜602については、それぞれ、検出された被写体領域の外接矩形610〜612が、画像600〜602とともに表示される。これにより、作業者は、画像600〜602に関しては、外接矩形610〜612を参照して、被写体が正しく検出されていることを確認すればよい。なお、提示部15は、ユーザインターフェース4から、画像600〜602のそれぞれごとに、作業者が確認したことを表す操作信号を受け付けてもよい。そして提示部15は、その操作信号を受け付けると、外接矩形に被写体の識別情報を付してもよい。あるいは、作業者が、各画像に写っている被写体を確認して、各画像に被写体の識別情報を付してもよい。また、同一の被写体ごとに、その被写体の識別情報と、その被写体が写っている画像の数と、各画像における検出情報とを対応付けた被写体データが作成されてもよい。
一方、要注意画像である画像603については、被写体領域の外接矩形は表示されない。その代り、被写体領域620の近傍に、要注意画像であることを表す矢印613が表示される。そして画像603について、作業者が、ユーザインターフェース4を操作して、被写体領域の外接矩形を設定し、設定された外接矩形の位置及び範囲を表す情報がCPU7に渡される。CPU7が、ユーザにより設定された外接矩形の位置及び範囲を表す情報を受け取ると、提示部15は、その情報で表される外接矩形を、被写体領域の本当の外接矩形とする。そして提示部15は、検出情報テーブルに示された、要注意画像603の外接矩形の位置及び範囲を表す情報を、作業者により設定された外接矩形の位置及び範囲を表す情報で更新してもよい。さらに、作業者は、ユーザインターフェース4を操作して、設定した外接矩形に被写体の識別情報を付してもよい。
なお、変形例によれば、提示部15は、要注意画像でない画像が連続する場合、その連続する画像を早送り表示させてもよい。あるいは、提示部15は、その連続する画像のそれぞれの被写体領域及びその外接矩形を一度に表示させてもよい。例えば、提示部15は、その連続する画像のそれぞれから被写体領域を切り出して、一つの画像に合成することで、連続する画像のそれぞれの被写体領域及び外接矩形を一つの画像に表してもよい。あるいは、提示部15は、連続する画像のそれぞれを縮小してサムネイル画像を生成し、それらサムネイル画像をユーザインターフェース4に同時に表示させてもよい。その際、提示部15は、各サムネイル画像上に、被写体領域を囲う外接矩形を表示すればよい。
ただし、この変形例の場合も、提示部15は、要注意画像については、個々の要注意画像ごとに、ユーザインターフェース4に表示することが好ましい。これにより、作業者は、要注意画像でない画像については、一度に複数の画像について検出された被写体領域が正しいか否か確認することができ、一方、要注意画像を見易い状態で、被写体領域の外接矩形を設定する操作を行うことができる。
図7(a)及び図7(b)は、この変形例による、ユーザインターフェース4に表示される画像の一例を示す図である。この例では、時刻T0〜T2に得られた3枚の画像700〜702は、何れも、要注意画像でないとする。
図7(a)に示される例では、画像700〜702は、被写体領域の外枠710〜712とともに早送り表示される。その際、作業者が、ユーザインターフェース4を介して早送り表示を停止する操作を行わない限り、提示部15は、各画像の被写体領域が正しいことが確認されたとみなして、各画像について、一定期間(例えば、1〜5秒)表示後に次の画像を表示してもよい。
また、図7(b)に示される例では、画像700〜702のそれぞれから検出された被写体領域720〜722が一つの画像730上に合成され、その画像730が表示される。そのため、作業者は、一枚の画像730を確認するだけで、3枚の画像700〜702のそれぞれの被写体領域が正しいことを確認できる。
図8は、CPU7により実行される、画像認識処理の動作フローチャートである。CPU7は、画像ごとに、下記の動作フローチャートに従って画像認識処理を実行すればよい。
被写体検出部11は、画像上で検出対象となる被写体が表されている被写体領域を検出する(ステップS101)。
画素値差算出部12は、被写体領域を複数のサブ領域に分割する(ステップS102)。そして画素値差算出部12は、サブ領域ごとに、前景と背景間の画素値の差の統計的代表値を算出する(ステップS103)。
また、縦横比算出部13は、被写体領域の縦横比を算出する(ステップS104)。
要注意判定部14は、被写体領域のサブ領域ごとの前景と背景間の画素値の差の統計的代表値、または、縦横比の時系列に沿った変化度合いが、画像が要注意画像となる条件を満たすか否か判定する(ステップS105)。画素値の差の統計的代表値及び縦横比の時系列に沿った変化度合いの何れも要注意画像となる条件を満たさない場合(ステップS105−No)、提示部15は、ユーザインターフェース4に画像とともに被写体領域の外接矩形を表示させる(ステップS106)。一方、画素値の差の統計的代表値または縦横比の時系列に沿った変化度合いの何れかが要注意画像となる条件を満たす場合(ステップS105−Yes)、着目する画像は要注意画像である。そこで提示部15は、ユーザインターフェース4に、画像とともに要注意画像であることを表すマークを表示させる(ステップS107)。そして提示部15は、ユーザインターフェース4を介した被写体領域の外接矩形の設定情報及び被写体の識別情報を受け付け、その設定情報にしたがって、被写体領域の外接矩形を設定するとともに、その外接矩形に被写体の識別情報を付す(ステップS108)。
ステップS106またはS108の後、CPU7は、画像認識処理を終了する。なお、CPU7は、ステップS102及びS103の処理と、ステップS104の処理の順序を入れ替えてもよく、あるいは、ステップS102及びS103の処理と、ステップS104の処理を並列に実行してもよい。
以上に説明してきたように、この画像認識装置は、着目する画像の被写体領域の前景と背景間の画素値の差の統計的代表値、及び、被写体領域の縦横比の時系列に沿った変化度合いを算出する。そしてこの画像認識装置は、その統計的代表値または縦横比の時系列に沿った変化度合いに応じて、着目する画像が、被写体領域が誤検出されている可能性がある要注意画像か否か判定する。そのため、この画像認識装置は、識別器学習用の教師画像のセットを生成する際に、要注意画像を自動的に特定できる。また、この画像認識装置は、要注意画像を作業者に確認させる際、被写体領域の外接矩形を表示しないことで、その外接矩形を修正する手間を削減することができる。
なお、変形例によれば、要注意判定部14は、被写体領域の前景と背景間の画素値の差の統計的代表値、及び、被写体領域の縦横比の時系列に沿った変化度合いのうちの何れか一方のみに基づいて、着目する画像が要注意画像か否か判定してもよい。この場合、画素値差算出部12及び縦横比算出部13のうち、算出される値が要注意判定部14で使用されない方については省略されてもよい。
また他の変形例によれば、縦横比算出部13は、被写体領域の外接矩形を設定する代わりに、被写体領域の外接楕円を設定してもよい。そして縦横比算出部13は、その外接楕円の短軸方向の直径に対する長軸方向の直径の比を、縦横比として算出してもよい。
さらに他の変形例によれば、一つの画像から複数の被写体領域が検出された場合、画素値差算出部12、縦横比算出部13及び要注意判定部14は、被写体領域ごとに、上記の実施形態または変形例による処理を行ってもよい。そして要注意判定部14は、複数の被写体領域のうちの何れか一つについて、画像が要注意画像に該当する判定条件が満たされる場合、その画像を要注意画像としてもよい。
さらに他の変形例によれば、提示部15は省略されてもよい。この場合には、例えば、作業者は、一連の画像について画像認識処理が終了した後に、検出情報テーブルを参照して、ユーザインターフェース4を操作することで、特定された要注意画像をユーザインターフェース4に表示させてもよい。そして作業者は、表示された要注意画像を参照して、ユーザインターフェース4を操作することで、その要注意画像に被写体領域の外接矩形及び被写体の識別情報を付してもよい。
さらに、上記の実施形態または変形例による画像認識装置のCPUが有する各部の機能をコンピュータに実現させるコンピュータプログラムは、コンピュータによって読取り可能な記録媒体に記憶された形で提供されてもよい。なお、コンピュータによって読取り可能な記録媒体は、例えば、磁気記録媒体、光記録媒体、又は半導体メモリとすることができる。
ここに挙げられた全ての例及び特定の用語は、読者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の精神及び範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。
1 画像認識装置
2 カメラ
3 通信インターフェース
4 ユーザインターフェース
5 メモリ
6 記憶媒体アクセス装置
7 CPU
8 記憶媒体
11 被写体検出部
12 画素値差算出部
13 縦横比算出部
14 要注意判定部
15 提示部

Claims (6)

  1. 撮像部により得られた時系列の複数の画像のそれぞれから被写体が表された領域を検出し、
    前記領域の縦横比の時系列に沿った変化度合い、または、前記領域内の各画素の前景の値と背景の値との差に応じて、前記複数の画像のうち、前記領域が誤検出されている可能性がある要注意画像を特定する、
    ことをコンピュータに実行させるための画像認識用コンピュータプログラム。
  2. 前記複数の画像のうちの前記被写体が表された領域が検出された画像のそれぞれについて、当該領域を複数のサブ領域に分割し、前記複数のサブ領域のそれぞれについて、当該サブ領域内の各画素について前景の値と背景の値との差の統計的代表値を算出することをさらにコンピュータに実行させ、
    前記要注意画像を特定することは、前記被写体が表された領域が検出された画像のうち、前記複数のサブ領域の何れかのサブ領域についての前記統計的代表値が第1の閾値未満となる画像を前記要注意画像として特定することを含む、請求項1に記載の画像認識用コンピュータプログラム。
  3. 前記複数の画像のうちの前記被写体が表された領域が検出された画像のそれぞれについて、当該領域の縦横比を算出することをさらにコンピュータに実行させ、
    前記要注意画像を特定することは、前記被写体が表された領域が検出された画像のうち、当該画像の前記縦横比と時系列で直前の画像における前記縦横比との差の絶対値が第2の閾値よりも大きくなる画像を前記要注意画像として特定することを含む、請求項1または2に記載の画像認識用コンピュータプログラム。
  4. 前記複数の画像のうちの前記要注意画像以外の画像を、当該画像から検出された前記被写体が表された領域の外枠を重畳した上で表示装置に表示させ、一方、前記複数の画像のうちの前記要注意画像を、当該画像から検出された前記被写体が表された領域の外枠を重畳せずに前記表示装置に表示させることをさらにコンピュータに実行させる、請求項1〜3の何れか一項に記載の画像認識用コンピュータプログラム。
  5. 撮像部により得られた時系列の複数の画像のそれぞれから被写体が表された領域を検出する被写体検出部と、
    前記領域の縦横比の時系列に沿った変化度合い、または、前記領域内の各画素の前景の値と背景の値との差に応じて、前記複数の画像のうち、前記領域が誤検出されている可能性がある要注意画像を特定する要注意判定部と、
    を有する画像認識装置。
  6. 撮像部により得られた時系列の複数の画像のそれぞれから被写体が表された領域を検出し、
    前記領域の縦横比の時系列に沿った変化度合い、または、前記領域内の各画素の前景の値と背景の値との差に応じて、前記複数の画像のうち、前記領域が誤検出されている可能性がある要注意画像を特定する、
    ことを含む画像認識方法。
JP2017091201A 2017-05-01 2017-05-01 画像認識用コンピュータプログラム、画像認識装置及び画像認識方法 Active JP6939065B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017091201A JP6939065B2 (ja) 2017-05-01 2017-05-01 画像認識用コンピュータプログラム、画像認識装置及び画像認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017091201A JP6939065B2 (ja) 2017-05-01 2017-05-01 画像認識用コンピュータプログラム、画像認識装置及び画像認識方法

Publications (2)

Publication Number Publication Date
JP2018190132A true JP2018190132A (ja) 2018-11-29
JP6939065B2 JP6939065B2 (ja) 2021-09-22

Family

ID=64480257

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017091201A Active JP6939065B2 (ja) 2017-05-01 2017-05-01 画像認識用コンピュータプログラム、画像認識装置及び画像認識方法

Country Status (1)

Country Link
JP (1) JP6939065B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021182564A1 (en) * 2020-03-13 2021-09-16 Nec Corporation Labelling training method and system for implementing the same
CN113712594A (zh) * 2020-05-25 2021-11-30 株式会社日立制作所 医用图像处理装置以及医用摄像装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013108686A1 (ja) * 2012-01-17 2013-07-25 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP2015032133A (ja) * 2013-08-02 2015-02-16 株式会社日立国際電気 物体検索システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013108686A1 (ja) * 2012-01-17 2013-07-25 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP2015032133A (ja) * 2013-08-02 2015-02-16 株式会社日立国際電気 物体検索システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021182564A1 (en) * 2020-03-13 2021-09-16 Nec Corporation Labelling training method and system for implementing the same
US11410443B2 (en) 2020-03-13 2022-08-09 Nec Corporation Labelling training method and system for implementing the same
JP2023516331A (ja) * 2020-03-13 2023-04-19 日本電気株式会社 ラベリング訓練方法およびそれを実施するためのシステム
JP7302752B2 (ja) 2020-03-13 2023-07-04 日本電気株式会社 ラベリング訓練方法およびそれを実施するためのシステム
CN113712594A (zh) * 2020-05-25 2021-11-30 株式会社日立制作所 医用图像处理装置以及医用摄像装置
US11526991B2 (en) 2020-05-25 2022-12-13 Fujifilm Healthcare Corporation Medical image processing apparatus, and medical imaging apparatus
CN113712594B (zh) * 2020-05-25 2023-12-26 富士胶片医疗健康株式会社 医用图像处理装置以及医用摄像装置

Also Published As

Publication number Publication date
JP6939065B2 (ja) 2021-09-22

Similar Documents

Publication Publication Date Title
US10572736B2 (en) Image processing apparatus, image processing system, method for image processing, and computer program
US10810438B2 (en) Setting apparatus, output method, and non-transitory computer-readable storage medium
US11106920B2 (en) People flow estimation device, display control device, people flow estimation method, and recording medium
US10445887B2 (en) Tracking processing device and tracking processing system provided with same, and tracking processing method
US11030464B2 (en) Privacy processing based on person region depth
US10872242B2 (en) Information processing apparatus, information processing method, and storage medium
US20160142680A1 (en) Image processing apparatus, image processing method, and storage medium
US20150262068A1 (en) Event detection apparatus and event detection method
US9807300B2 (en) Display apparatus for generating a background image and control method thereof
US11004214B2 (en) Image processing apparatus, image processing method, and storage medium
JP2011029737A (ja) 監視映像検索装置及び監視システム
CN110199316B (zh) 相机和相机的图像处理方法
US10496874B2 (en) Facial detection device, facial detection system provided with same, and facial detection method
JP2016134803A (ja) 画像処理装置及び画像処理方法
KR20150136225A (ko) 관심객체 검출을 위한 관심영역 학습장치 및 방법
US20220004748A1 (en) Video display method, device and system, and video camera
JP6939065B2 (ja) 画像認識用コンピュータプログラム、画像認識装置及び画像認識方法
JP7074174B2 (ja) 識別器学習装置、識別器学習方法およびコンピュータプログラム
JP2020106970A (ja) 人検出装置および人検出方法
JP6798609B2 (ja) 映像解析装置、映像解析方法およびプログラム
JP7214437B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP6350331B2 (ja) 追尾装置、追尾方法及び追尾プログラム
KR102516172B1 (ko) 전경의 색상 추출 시스템, 방법 및 컴퓨터 판독 가능한 기록매체
US11514703B2 (en) Detection device and control method of the same
JP6543546B2 (ja) 特定動作検出装置及び特定動作検出方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210816

R150 Certificate of patent or registration of utility model

Ref document number: 6939065

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150