JP6255944B2 - 画像解析装置、画像解析方法及び画像解析プログラム - Google Patents

画像解析装置、画像解析方法及び画像解析プログラム Download PDF

Info

Publication number
JP6255944B2
JP6255944B2 JP2013245401A JP2013245401A JP6255944B2 JP 6255944 B2 JP6255944 B2 JP 6255944B2 JP 2013245401 A JP2013245401 A JP 2013245401A JP 2013245401 A JP2013245401 A JP 2013245401A JP 6255944 B2 JP6255944 B2 JP 6255944B2
Authority
JP
Japan
Prior art keywords
image
space
displayed
input image
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013245401A
Other languages
English (en)
Other versions
JP2015103188A (ja
Inventor
酉華 木原
酉華 木原
志村 浩
浩 志村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2013245401A priority Critical patent/JP6255944B2/ja
Priority to US14/541,260 priority patent/US9613272B2/en
Publication of JP2015103188A publication Critical patent/JP2015103188A/ja
Application granted granted Critical
Publication of JP6255944B2 publication Critical patent/JP6255944B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects

Description

本発明は、画像解析装置、画像解析方法及び画像解析プログラムに関し、特に、画像解析精度の向上に関する。
画像認識の技術として、入力された画像を解析し、画像中に含まれる物体等を特定する画像解析技術が用いられている。このような技術においては、特定するべき物体の画像特徴量を示す参照用の情報と、特定するべき物体を含む可能性のある入力画像中の各部の特徴量とを比較することにより、入力画像中において特定するべき物体が表示されている位置を特定する。
また、上述したような画像認識の技術において、背景の種類ごとに異なる複数の基準パターンを参照し、特定するべき物体の画像中における判定領域と比較することにより、画像中における物体の位置を特定する方法が提案されている(例えば、特許文献1参照)。
特許文献1に開示されているように、画像中に含まれる物体等を特定する際に背景との関係を参照することは、特定結果の高精度化につながる。しかしながら、解析対象の画像には様々なアングルのものがあり、アングルによっては、背景に応じた基準パターンとの比較結果が適切に作用せず、正確な認識結果が得られない場合がある。
本発明は上記実情に鑑みてなされたものであり、画像中に含まれる物体等の特定処理の精度を向上することを目的とする。
上記課題を解決するために、本発明の一態様は、入力された画像において所定の対象物が表示されている部分を特定する画像解析装置であって、入力された画像の特徴値に基づいて前記対象物が表示されている部分を認識する対象認識部と、入力された画像の各部において表示されている空間の属性を識別する空間識別情報を前記画像の各部について生成する空間識別部と、入力された画像の特徴値に基づき、特徴値の類似する類似領域毎に前記画像の領域を分割する特徴分割部と、認識された前記対象物が表示されている部分の周辺における前記類似領域の分布に基づき、前記対象物が表示されている部分の認識結果の正否を判断する認識確定部と認識された前記対象物が表示されている部分の周囲の画像領域のうち、参照するべき前記空間の属性の指定を取得する空間指定取得部とを含み、前記認識確定部は、前記空間識別情報に基づいて前記入力された画像の各部における空間の属性を認識し、前記入力された画像において認識された前記対象物が表示されている部分の周囲の画像領域のうち、指定された前記空間の属性の領域における前記類似領域の分布に基づき、前記対象物が表示されている部分の認識結果の正否を判断することを特徴とする。
また、本発明の他の態様は、入力された画像において所定の対象物が表示されている部分を特定する画像解析方法であって、入力された画像の特徴値に基づいて前記対象物が表示されている部分を認識し、入力された画像の各部において表示されている空間の属性を識別する空間識別情報を前記画像の各部について生成し、入力された画像の特徴値に基づき、特徴値の類似する類似領域毎に前記画像の領域を分割し、認識された前記対象物が表示されている部分の周囲の画像領域のうち、参照するべき前記空間の属性の指定を取得し、前記空間識別情報に基づいて前記入力された画像の各部における空間の属性を認識し、前記入力された画像において認識された前記対象物が表示されている部分の周囲の画像領域のうち、指定された前記空間の属性の領域における前記類似領域の分布に基づき、前記対象物が表示されている部分の認識結果の正否を判断することを特徴とする。
また、本発明の更に他の態様は、入力された画像において所定の対象物が表示されている部分を特定する画像解析プログラムであって、入力された画像の特徴値に基づいて前記対象物が表示されている部分を認識するステップと、入力された画像の各部において表示されている空間の属性を識別する空間識別情報を前記画像の各部について生成するステップと、入力された画像の特徴値に基づき、特徴値の類似する類似領域毎に前記画像の領域を分割するステップと、認識された前記対象物が表示されている部分の周囲の画像領域のうち、参照するべき前記空間の属性の指定を取得するステップと、前記空間識別情報に基づいて前記入力された画像の各部における空間の属性を認識し、前記入力された画像において認識された前記対象物が表示されている部分の周囲の画像領域のうち、指定された前記空間の属性の領域における前記類似領域の分布に基づき、前記対象物が表示されている部分の認識結果の正否を判断するステップとを情報処理装置に実行させることを特徴とする。
本発明によれば、画像中に含まれる物体等の特定処理の精度を向上することができる。
本発明の実施形態に係る画像解析装置のハードウェア構成を示すブロック図である。 本発明の実施形態に係る画像解析装置の機能構成を示すブロック図である。 本発明の実施形態に係る学習結果DBに格納されている情報の例を示す図である。 本発明の実施形態に係る解析対象の画像の例を示す図である。 本発明の実施形態に係る対象認識部による認識結果の例を示す図である。 本発明の実施形態に係る空間識別結果の例を示す図である。 本発明の実施形態に係る特徴分割結果の例を示す図である。 本発明の実施形態に係る特徴分割結果の情報例を示す図である。 本発明の実施形態に係る対象認識動作を示すフローチャートである。 本発明の実施形態に係るクラス分布の算出結果を示す図である。 対象認識部による誤認識の例を示す図である。 本発明の実施形態に係る解析対象の画像の他の例を示す図である。
以下、図面を参照して、本発明の実施形態を詳細に説明する。本実施形態においては、入力された画像を解析して画像に含まれる物体等を認識する画像解析装置において、入力された画像において認識された認識対象物の周囲の画像の特徴量に基づいて認識結果の信頼性を判断する。その際、画像の各領域における“地面”、“垂直領域”、“空”等の空間種別を判定し、その判定結果を信頼性の判断に際して考慮することにより、入力された画像のアングルに因らずに、対象物の周囲の画像の特徴量に基づく信頼性の判断を可能とする。
まず、本実施形態に係る画像解析装置1のハードウェア構成について図1を参照して説明する。図1に示すように、本実施形態に係る画像解析装置1は、一般的なPC(Personal Computer)やサーバ等の情報処理装置と同様の構成を有する。即ち、本実施形態に係る画像解析装置1は、CPU(Central Processing Unit)10、RAM(Random Access Memory)20、ROM(Read Only Memory)30、HDD(Hard Disk Drive)40及びI/F50がバス90を介して接続されている。また、I/F50にはLCD(Liquid Crystal Display)60、操作部70及び専用デバイス80が接続されている。
CPU10は演算手段であり、画像解析装置1全体の動作を制御する。RAM20は、情報の高速な読み書きが可能な揮発性の記憶媒体であり、CPU10が情報を処理する際の作業領域として用いられる。ROM30は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムが格納されている。HDD40は、情報の読み書きが可能な不揮発性の記憶媒体であり、OS(Operating System)や各種の制御プログラム、アプリケーション・プログラム等が格納されている。
I/F50は、バス90と各種のハードウェアやネットワーク等を接続し制御する。LCD60は、ユーザが検査装置4の状態を確認するための視覚的ユーザインタフェースである。操作部70は、キーボードやマウス等、ユーザが画像解析装置1に情報を入力するためのユーザインタフェースである。
専用デバイス80は、画像解析装置1において必要な機能を実現するための専用のハードウェアであり、例えば画像を撮像して画像情報を生成するカメラや、画像解析において必要な処理を高速に実行するASIC(Application Specific Integrated Circuit)等である。
このようなハードウェア構成において、ROM30に格納されたプログラムや、HDD40若しくは図示しない光学ディスク等の記録媒体からRAM20に読み出されたプログラムに従ってCPU10が演算を行うことにより、ソフトウェア制御部が構成される。このようにして構成されたソフトウェア制御部と、ハードウェアとの組み合わせによって、本実施形態に係る画像解析装置1の機能を実現する機能ブロックが構成される。
次に、本実施形態に係る画像解析装置1の機能構成について説明する。図2に示すように、本実施形態に係る画像解析装置1は、情報取得部101、DB選択部102、画像取得部103、学習情報DB104、対象認識部105、空間識別部106、特徴分割部107、空間選択部108及び認識確定部109を含む。
情報取得部101は、操作部70に対するユーザの操作やネットワークを介して入力される情報により、解析対象の画像情報及び画像の解析に対して用いる学習情報の指定を取得する。DB選択部102は、情報取得部101が取得した学習情報の指定に基づき、学習情報DB104に格納されている学習情報のうち、指定された学習情報を選択する。画像取得部103は、情報取得部101が取得した解析対象の画像情報を取得する。
図3は、学習情報DB104に格納されている学習情報の例を示す図である。学習情報DB104においては、図3の“学習イメージ”における「市街地の車」のように、解析対象の画像の状況、即ちシチュエーション毎に、多量の学習用画像を解析した結果がまとめられた情報である。夫々の学習情報には、図3に示すように、“学習ID”、“学習イメージ”、“特徴値”、“指定空間種別”、“対象周辺特徴分布”の情報が含まれる。即ち、学習情報DB104が、学習情報記憶部として機能する。
“学習ID”は、夫々のシチュエーション毎の学習情報を識別する識別子である。“学習イメージ”は、上述したように、夫々のシチュエーションや特定するべき物体を示す情報である。“特徴値”は、特定するべき物体の画像の特徴を示す情報であり、例えばベクトル情報が用いられる。このように学習情報に含まれる“特徴量”と、解析対象の画像から抽出された特徴量とを比較することにより、解析対象の画像における対象の物体の特定が行われる。
“指定空間種別”は、本実施形態の要旨に係る情報であり、夫々のシチュエーション毎の画像において、特定対象の物体が存在する空間を示す情報である。換言すると、画像において特定対象の物体が表示されている画像領域の周辺の画像領域が、主として「地面」、「垂直物」、「空」等、空間の種類のいずれの種類であるかを示す情報である。「市街地の車」というシチュエーションにおいては、特定対象の物体である「車」は、地面のうえに表示されていることが多いと考えられるため、「地面」が指定されている。
“対象周辺特徴分布”は、特定対象の物体の周辺の画像領域の画像の状態を示す情報である。本実施形態に係る“対象周辺特徴分布”においては、画像を構成する各画素の画素値がクラス1〜クラス6までの6段階に分類されており、対象の物体の周辺の画像領域における夫々のクラス毎の割合が格納されている。また、夫々のクラス毎に画像の特徴値の平均値が格納されている。即ち、“対象周辺特徴分布”が、学習情報におけるクラスの分布である学習画像分布として用いられる。
ここで、特定対象の物体の周辺の画像に基づいて特定対象の物体の特定結果の信頼性を確認する処理は従来から用いられている。例えば、人口衛星から撮影されたサテライト画像において車を特定するような場合、車として特定された画像領域のうち、道路から外れた位置にあるものは除外するといった処理である。このような処理は、上述したようなサテライト画像などの特殊な状況においてのみ適用可能である。
これに対して、本実施形態に係る画像解析においては、図3に示すように、“対象周辺特徴分布”が、「地面」のように画像の空間種類に応じて生成されている。これにより、特定対象の画像の周辺の画像領域に基づいて特定精度を確認する処理を、上述したような特殊な画像のみならず、汎用的に利用することが可能となる。
尚、図3の例においては、“指定空間種別”として「地面」のみが指定されているが、複数の空間種別が指定されていても良い。その場合、“対象周辺特徴分布”が複数の空間種別に応じて生成されることとなる。学習情報DB104は、このように夫々のシチュエーション毎に生成されている学習情報のうち、DB選択部102によって選択された学習情報を出力する。
対象認識部105は、画像取得部103が取得した画像を、学習情報DB104が出力する学習情報に基づいて解析し、解析対象の画像において特定対象の物体が表示されている領域を特定する。図4は、本実施形態において解析対象となる画像の例を示す図である。図4に示すように、市街地を走行する車が写された画像が本実施形態における解析対象である。
対象認識部105は、図3において説明した“特徴値”を参照し、解析対象の画像を解析して抽出した特徴値と比較することにより、解析対象の画像において特定するべき物体が表示されている領域を判定する。図5は、対象認識部105による認識結果の例を示す図である。図5の右側上部に示すように、対象認識部105による対象物体の認識結果としては、解析対象の画像に対応する夫々の画素において、特定対象の物体が表示された領域であれば「1」、それ以外の領域であれば「0」が設定された情報が生成される。
また、対象認識部105の認識結果として、図5の右側下部に示すように、特定対象の物体が表示された領域として「1」が付された領域には、夫々の領域を識別するための“ID”及びその領域に特定対象の物体が表示されていることの確からしさを示す“確度”が生成される。この“確度”は、上述した特徴値の一致度合いによって求めることが出来る。このようにして特定された画像領域の信頼性を確認することが、本実施形態に係る要旨の1つである。
空間識別部106は、画像取得部103が取得した画像を解析し、解析対象の画像における空間構造を推定する。図6は、空間識別部106による空間識別処理の結果を示す図である。図6の左側においては、地面として認識された画像領域を実線の斜線で、垂直物として認識された画像領域を破線の斜線で、空として認識された画像領域を一点鎖線の斜線で示している。
図6の右側に示すように、空間識別処理の結果としては、解析対象の画像に対応する夫々の画素において、地面は表示された領域であることを示す「地」、垂直物が表示された領域であることを示す「垂」、空が表示された領域であることを示す「空」が設定された情報が生成される。換言すると、空間識別部106は、入力された画像の各部において表示されている空間の属性を識別する。また、図6に示す情報が、空間識別情報として用いられる。このようにして特定された空間構造を用いることが、本実施形態に係る要旨の1つである。
空間識別部106による空間識別処理としては、公知の様々な方法を用いることが可能であり、例えば、『Geometric Context from a Single Image/Derek Hoiem, Alexei A. Efros, Martial Hebert』において開示された方法を用いることが可能である。
特徴分割部107は、画像取得部103が取得した画像を解析し、解析対象の画像を構成する各画素を、画素値の類似度を基準としたクラス1〜クラス6までの領域に分割する。即ち、特徴分割部107は、入力された画像の特徴値に基づき、特徴値の類似する類似領域毎に画像の領域を分割する。図7は、特徴分割部107による特徴分割処理の結果を示す図である。図7の左側においては、斜線の種類によってクラス1〜クラス6までの領域を示している。また、図7の右側に示すように、特徴分割処理の結果としては、解析対象の画像に対応する夫々の画素において、クラス1〜クラス6のいずれに属する領域であるかを示す情報が生成される。
特徴分割部107による特徴分割処理としては、例えばスーパーピクセルによる領域分割を用いることが出来る。即ち、解析対象の画像の色、テクスチャ、形状等の特徴量を解析し、類似した特徴を有する領域を画素の集合としてラベリングする。本実施形態に係る画像解析装置1においては、図3において説明したように、特徴量としてクラス1〜クラス6までの6段階を用いる。そのため、本実施形態に係る特徴分割部107は、特徴分割処理により、解析対象の画像をクラス1〜クラス6までの領域に分割する。
また、特徴分割部107は、解析対象の画像を解析して分割したクラス1〜クラス6までの夫々の領域の特徴量の平均値を算出し、図8に示すように、Sclass1〜Sclass6として記憶媒体に記憶させる。
空間選択部108は、学習情報DB104が出力する学習情報に基づき、認識確定部109による画像認識処理において参照するべき空間種別を取得する。空間選択部108は、図3において説明した“指定空間種別”を参照し、そこで指定されている値を取得して認識確定部109に通知する。即ち、空間選択部108が、参照するべき空間種別の属性の指定を取得する空間指定取得部として機能する。これにより、認識確定部109においては、解析対象の画像に応じて参照するべき空間種別を認識することが可能となる。また、空間選択部108は、学習情報に含まれる情報のうち、“対象周辺特徴分布”の情報を認識確定部109に通知する。
認識確定部109は、空間識別部106及び特徴分割部107によって生成された情報に基づき、対象認識部105による認識結果の信頼性を確認し、最終的な物体の特定結果を出力する。換言すると、認識確定部109は、対象認識物105による認識結果の正否を判断する。認識確定部109による最終的な物体の特定処理に際して、空間選択部108から通知される空間種別を考慮することが、本実施形態に係る要旨の1つである。
図9を参照して、認識確定部109による物体の特定結果の確認処理について説明する。図9に示すように、認識確定部109は、対象認識部105から図5において説明した認識結果の情報(以降、「認識結果情報」とする)を取得する(S901)。これにより、認識確定部109は、解析対象の画像において対象認識部105により特定された画像領域の位置及び夫々の画像領域の特定結果の確からしさ「P(特定)i」を取得する。ここで、「i」は図5の“ID”を示す値である。
次に、認識確定部109は、特徴分割部107から、図7、図8において説明したクラス分類結果を取得する(S902)。クラス分類結果を取得した認識確定部109は、図8に示す各クラスの特徴値の平均値と、学習情報に含まれる“対象周辺特徴分布”とに基づき、特徴分割部107による特徴分割の確からしさ「P(特徴)k」を算出する(S903)。ここで、「k」はクラス1〜クラス6を示す値である。
図3において説明した学習情報における“対象周辺特徴分布”のクラス1〜クラス6に関連付けられている平均値Sclass1_001〜Sclass6_001は、学習用の画像の特徴量の平均値であり、解析対象の画像の特徴量の平均値とは異なる。従って、S903においては、学習結果と解析結果とのクラスの分類結果の誤差に基づき、クラス分類の確からしさを示す値を算出する。
次に、認識確定部109は、空間識別部106から、図6において説明した空間種別の識別結果を取得する(S904)。空間種別の識別結果を取得した空間識別部106は、図5に示す認識結果情報と、図7に示すクラス分類結果とに基づき、対象認識部105によって特定された物体の領域の周辺の画像領域における各クラスの分布度を算出する(S905)。この際、認識確定部109は、空間選択部108から通知された空間種別の領域のみを対象として、クラスの分布度を算出する。
図7を参照すると、車が表示されている領域の周辺には、実線のみの斜線が付されたクラス2の領域と、実線及び破線の斜線が付されたクラス1の領域と、二重の破線による斜線が付されたクラス4の領域が存在している。従って、対象認識部105によって特定された物体の領域の周辺のクラス分布をそのまま算出すると、図10(a)に示すようにクラス1、クラス2、クラス4に分布が別れることとなる。
これに対して、クラス1、クラス2、クラス4の領域の内、図6に示す空間種別の識別結果において「地面」と識別されている領域は、クラス2の領域のみである。従って、空間種別を、「地面」のみに絞ってクラス分布を算出すると、図10(b)に示すように、クラス2が100%の分布となる。図10(b)に示す分布が、入力された画像において認識された対象物が表示されている部分の周辺におけるクラスの分布である入力画像分布として用いられる。
このように、指定された空間種別によるクラス分布を算出した認識確定部109は、図10(b)に示すように算出したクラス分布と、学習情報の“対象周辺特徴分布”の「地面」の分布情報に基づき、対象認識部105によって特定された物体の領域の周辺の画像領域のクラス分布の確からしさ「P(周辺)k」を算出する(S906)。ここで、「k」はクラス1〜クラス6を示す値である。
このようにして「P(特定)i」、「P(特徴)k」、「P(周辺)k」を夫々算出した認識確定部109は、以下の式(1)のように、上記3の確度に基づいて、総合的な精度Pを算出する(S907)。尚、式(1)の詳細な式は様々な形態が考えらえるが、いずれの場合においても、「P(特定)i」、「P(特徴)k」、「P(周辺)k」夫々の値が大きければ大きい程、Pの値が大きく算出されるような式が用いられる。
そのようにして総合的な精度Pを算出した認識確定部109は、算出された値を予め定められた閾値と比較することにより、その特定結果が正しいか否かを判断する(S908)。即ち、算出されたPの値が予め定められた閾値よりも大きければ、認識確定部109は、その特定結果は正しいと判断し、特定結果として出力する。この際に出力される情報は、例えば、図5の左側上部に示す情報、即ち、解析対象の画像において、特定対象の物体が表示されている領域が示される情報である。算出されたPの値が予め定められた閾値よりも小さければ、その特定結果は誤りであると判断し、認識確定部109は、判断対象の特定結果を破棄する。
図3の学習情報の例における“対象周辺特徴分布”を見ると、クラス2が「60%」と比較的高い値となっている。これに対して、図10(b)に示す周辺画像分布の算出結果においては、クラス2が「100%」として算出されており、上述した「P(周辺)k」の値は比較的高い値が算出される。その結果、上記式(1)によるPの算出結果は比較的高い値となり、S908の閾値比較の判断により、特定結果が肯定されることとなる。
他方、対象認識部105による認識処理によっては、図11に破線で囲む領域で示すように、車が表示されていない領域が誤って特定されてしまう可能性がある。この場合、図11において破線で囲まれている領域の周辺は、図7を参照するとクラス1である。
これに対して、図6の空間種別の識別結果を参照すると、クラス1の領域は「垂直物」の領域であるため、空間種別を「地面」に絞ってS906の周辺画像分布を算出すると、いずれのクラスも0%と算出されることとなる。そのため、「P(周辺)k」の算出結果は非常に低い値となり、上記式(1)によるPiの算出結果も非常に低い値となる。その結果、S908の閾値比較の判断により、特定結果が否定され、図11に示すような特定結果は、誤った特定であると判断される。
ここで、図11に示すような特定結果に対して、本実施形態の特徴的な処理である空間種別の考慮を行わない場合について考える。その場合、上述したように、図11の特定結果の周辺の領域はクラス1であり、クラス分布の算出結果としてはクラス1が100%に近い値となる。
この値に基づいて上述した「P(周辺)k」の値を算出すると、図3に示すように、“対象周辺特徴分布”におけるクラス1の値は「15%」となっており、高い値ではないものの、ある程度の値が算出されることとなる。その結果、Pの算出結果も、上述したように空間種別を考慮した場合よりは高い値となり、S908において参照される閾値を超えてしまう可能性がある。
空間種別を考慮しない場合、図3に示す“対象周辺特徴分布”は「地面」に限らず、特定対象物の周辺の画像領域すべてに基づいて学習されることとなる。その結果、クラス1の値がより大きくなる可能性もあり、上述したように、S908において参照される閾値を超えてしまう可能性がある。
換言すると、入力された画像を解析することにより、画像中に含まれる所定の物体を特定する技術においては、特定対象の画像の周辺の画像を解析することによって、特定結果の精度を確認することが可能であるが、特定対象の物体が撮影された画像であっても、撮影時の状況によって物体の周辺の画像は様々である。
そのような場合に、学習情報の生成時に特定対象の物体の周辺の画像を一様に採用して学習情報を生成すると、図3に示す“対象周辺特徴分布”は、クラス毎に変化の無い、即ち特徴のない状態となってしまう。また、解析対象の画像におけるクラス分布の算出結果も、信頼性のあるものにはならない。
これに対して、上記実施形態のように、画像の撮影時の状況による変化の少ない空間種別を、「市街地の車」等のシチュエーションに応じて、「地面」のように特定しておくことにより、特定結果の確からしさを示す値を計算する際に、特定対象の物体にとって特徴となり得る空間種別の画像のクラスのみが参照され、「P(周辺)k」の値をより高精度に算出することが可能となり、画像中に含まれる物体等の特定処理の精度を向上することができる。
尚、上記実施形態においては、「市街地の車」を例として説明した。この場合、画像の撮影状況によらず特徴的な画像となるのは、一般的にアスファルトが写される地面の領域であるため、“指定空間種別”として「地面」が指定される場合を例としている。しかしながら、これは一例であり、この“指定空間種別”は“学習イメージ”によって様々な設定が考えられる。例えば、「飛行中の飛行機」であれば、“指定空間種別”としては当然「空」が指定されることとなる。また、「森林の動物」のような場合には、背景に森林が写っていることが多いと考えられるため、森林が映る領域となる「垂直物」が指定されることとなる。
尚、上記実施形態においては、空間の属性として、「地面」、「垂直物」、「空」を夫々認識する場合を例として説明した。これは屋外の場合であり、室内の場合、「床」、「垂直物」、「天井」となる。即ち、空間識別部106による空間属性の識別処理は、「地面」や「床」等、空間の下側に相当する「アンダーサイド」、「垂直物」、そして、「空」や「天井」等空間の上側に相当する「アッパーサイド」の識別処理である。
また、上記実施形態においては、対象認識部105によって特定された部分の周辺の画像領域のうち、学習情報において指定されている空間属性の領域について、クラスの分布を参照する場合を例として説明した。この他、例えば画像全体のクラス分布を考慮することが考えらえる。
例えば、図12に示すような画像を解析する場合、画像全体のクラス分布を解析すると、図7において「クラス2」と判定された領域が画像全体に対して占める割合は低いが、車が表示されている部分の周辺において、「地面」と判定される領域における占める割合は非常に高くなる。このような場合、「地面」と判定された領域における「クラス2」の領域は、特定対象物の周囲のクラスとして特徴的なクラスということが出来る。
従って、上述した「P(周辺)k」の計算においては、画像全体に対して占める割合の低いクラス程、「P(周辺)k」の値に大きく寄与するような計算を用いることにより、特定対象物との関係において特徴的な周辺画像を考慮した計算を行うことが可能となる。
このような画像解析装置1は、例えば、監視カメラに利用することが出来る。監視カメラにおいては、カメラによって撮影された画像において人物を特定対象として特定するが、設置環境は様々であるため、設置環境に応じた学習を行う必要がある。これに対して、上述した画像解析装置1を用いる場合、図3に示すように、“指定空間種別”として「地面」が指定された人物についての学習情報があれば、幅広い設置環境に対応することが可能である。
また、画像形成装置1を車載カメラに利用することが可能である。車載カメラにおいては、車前方を撮影することにより前方の車、人物、障害物等を検知するシステムが用いられる。このようなシステムにおいては、例えば建物の一部や街灯等を誤って検知してしまう可能性がある。これに対して、上述した画像形成装置1であれば、例えば“指定空間種別”として「地面」が指定されていることにより、地上に接していない、宙に浮いている物体は検知結果から除外されることとなるため、誤検知を回避することが出来る。
1 画像解析装置
10 CPU
20 RAM
30 ROM
40 HDD
50 I/F
60 LCD
70 操作部
80 専用デバイス
90 バス
101 情報取得部
102 DB選択部
103 画像取得部
104 学習情報DB
105 対象認識部
106 空間識別部
107 特徴分割部
108 空間選択部
109 認識確定部
特開2007−329762公報

Claims (7)

  1. 入力された画像において所定の対象物が表示されている部分を特定する画像解析装置であって、
    入力された画像の特徴値に基づいて前記対象物が表示されている部分を認識する対象認識部と、
    入力された画像の各部において表示されている空間の属性を識別する空間識別情報を前記画像の各部について生成する空間識別部と、
    入力された画像の特徴値に基づき、特徴値の類似する類似領域毎に前記画像の領域を分割する特徴分割部と、
    認識された前記対象物が表示されている部分の周辺における前記類似領域の分布に基づき、前記対象物が表示されている部分の認識結果の正否を判断する認識確定部と
    認識された前記対象物が表示されている部分の周囲の画像領域のうち、参照するべき前記空間の属性の指定を取得する空間指定取得部とを含み、
    前記認識確定部は、前記空間識別情報に基づいて前記入力された画像の各部における空間の属性を認識し、前記入力された画像において認識された前記対象物が表示されている部分の周囲の画像領域のうち、指定された前記空間の属性の領域における前記類似領域の分布に基づき、前記対象物が表示されている部分の認識結果の正否を判断することを特徴とする画像解析装置。
  2. 複数の学習用画像について、前記対象物が表示されている部分の周辺における前記類似領域の分布及び参照するべき前記空間の属性の指定が記憶された学習情報を記憶している学習情報記憶部を含み、
    前記学習情報における前記類似領域の分布は、指定されている前記空間の属性の領域における前記類似領域の分布であり、
    前記認識確定部は、入力された画像において認識された前記対象物が表示されている部分の周辺における前記類似領域の分布である入力画像分布と、前記学習情報における前記類似領域の分布である学習画像分布とに基づいて前記対象物が表示されている部分の認識結果の正否を判断することを特徴とする請求項1に記載の画像解析装置。
  3. 前記認識確定部は、前記学習画像分布において多く分布している類似領域が、前記入力画像分布において多く分布しているほど大きな値が算出される計算を行い、算出された前記値が所定の閾値よりも大きい場合に、前記対象物が表示されている部分の認識結果が正しと判断することを特徴とする請求項2に記載の画像解析装置。
  4. 前記認識確定部は、入力された画像全体における前記類似領域の分布において少なく分布している類似領域が、前記入力画像分布において多く分布しているほど大きな値が算出される計算を行うことを特徴とする請求項3に記載の画像解析装置。
  5. 前記空間識別部は、入力された画像の各部について、空間における下側であるアンダーサイド、上側であるアッパーサイド、アンダーサイドとアッパーサイドとの間に配置された垂直物のいずれかの属性を識別することを特徴とする請求項1または2に記載の画像解析装置。
  6. 入力された画像において所定の対象物が表示されている部分を特定する画像解析方法であって、
    入力された画像の特徴値に基づいて前記対象物が表示されている部分を認識し、
    入力された画像の各部において表示されている空間の属性を識別する空間識別情報を前記画像の各部について生成し、
    入力された画像の特徴値に基づき、特徴値の類似する類似領域毎に前記画像の領域を分割し、
    認識された前記対象物が表示されている部分の周囲の画像領域のうち、参照するべき前記空間の属性の指定を取得し、
    前記空間識別情報に基づいて前記入力された画像の各部における空間の属性を認識し、前記入力された画像において認識された前記対象物が表示されている部分の周囲の画像領域のうち、指定された前記空間の属性の領域における前記類似領域の分布に基づき、前記対象物が表示されている部分の認識結果の正否を判断することを特徴とする画像解析方法。
  7. 入力された画像において所定の対象物が表示されている部分を特定する画像解析プログラムであって、
    入力された画像の特徴値に基づいて前記対象物が表示されている部分を認識するステップと、
    入力された画像の各部において表示されている空間の属性を識別する空間識別情報を前記画像の各部について生成するステップと、
    入力された画像の特徴値に基づき、特徴値の類似する類似領域毎に前記画像の領域を分割するステップと、
    認識された前記対象物が表示されている部分の周囲の画像領域のうち、参照するべき前記空間の属性の指定を取得するステップと、
    前記空間識別情報に基づいて前記入力された画像の各部における空間の属性を認識し、前記入力された画像において認識された前記対象物が表示されている部分の周囲の画像領域のうち、指定された前記空間の属性の領域における前記類似領域の分布に基づき、前記対象物が表示されている部分の認識結果の正否を判断するステップとを情報処理装置に実行させることを特徴とする画像解析プログラム。
JP2013245401A 2013-11-27 2013-11-27 画像解析装置、画像解析方法及び画像解析プログラム Expired - Fee Related JP6255944B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013245401A JP6255944B2 (ja) 2013-11-27 2013-11-27 画像解析装置、画像解析方法及び画像解析プログラム
US14/541,260 US9613272B2 (en) 2013-11-27 2014-11-14 Image analyzing device, image analyzing method, and recording medium storing image analyzing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013245401A JP6255944B2 (ja) 2013-11-27 2013-11-27 画像解析装置、画像解析方法及び画像解析プログラム

Publications (2)

Publication Number Publication Date
JP2015103188A JP2015103188A (ja) 2015-06-04
JP6255944B2 true JP6255944B2 (ja) 2018-01-10

Family

ID=53182698

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013245401A Expired - Fee Related JP6255944B2 (ja) 2013-11-27 2013-11-27 画像解析装置、画像解析方法及び画像解析プログラム

Country Status (2)

Country Link
US (1) US9613272B2 (ja)
JP (1) JP6255944B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6351240B2 (ja) * 2013-11-20 2018-07-04 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
KR101816886B1 (ko) 2014-10-22 2018-01-09 사회복지법인 삼성생명공익재단 호흡 유도 시스템 및 방법
JP6543729B2 (ja) * 2015-12-25 2019-07-10 富士フイルム株式会社 類似損傷検索装置及び類似損傷検索方法
CN111191527B (zh) * 2019-12-16 2024-03-12 北京迈格威科技有限公司 属性识别方法、装置、电子设备及可读存储介质
DE112020006796T5 (de) * 2020-02-26 2022-12-29 Mitsubishi Electric Corporation Inferenzvorrichtung, fahrassistenzvorrichtung, inferenzverfahren und server
CN113074719B (zh) * 2021-03-24 2022-11-25 航天科工空间工程发展有限公司 一种快速可靠的星图识别方法

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITRM20050192A1 (it) * 2005-04-20 2006-10-21 Consiglio Nazionale Ricerche Sistema per la rilevazione e la classificazione di eventi durante azioni in movimento.
JP4640155B2 (ja) 2005-12-15 2011-03-02 ソニー株式会社 画像処理装置および方法、並びにプログラム
JP2007328630A (ja) * 2006-06-08 2007-12-20 Fujitsu Ten Ltd 物体候補領域検出装置、物体候補領域検出方法、歩行者認識装置および車両制御装置
US7860320B2 (en) * 2006-06-26 2010-12-28 Eastman Kodak Company Classifying image regions based on picture location
US7738690B2 (en) * 2006-09-20 2010-06-15 Primax Electronics Ltd. Verification method for determining areas within an image corresponding to monetary banknotes
JP4873554B2 (ja) 2006-12-25 2012-02-08 株式会社リコー 画像配信装置および画像配信方法
JP4928998B2 (ja) 2007-03-16 2012-05-09 株式会社リコー 画像形成装置、及び画像形成方法
JP2009009334A (ja) 2007-06-27 2009-01-15 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
JP5168619B2 (ja) 2007-09-12 2013-03-21 株式会社リコー 画像表示データ生成装置及び画像表示データ生成方法
US8411313B2 (en) 2007-09-14 2013-04-02 Ricoh Company, Limited Image forming apparatus and image reading method for reading an untargeted page of an original
JP5059545B2 (ja) 2007-10-23 2012-10-24 株式会社リコー 画像処理装置及び画像処理方法
JP5033580B2 (ja) 2007-10-31 2012-09-26 株式会社リコー 画像処理装置及び画像処理方法
JP4902499B2 (ja) 2007-11-05 2012-03-21 株式会社リコー 画像表示装置、画像表示方法、および画像表示システム
JP2009118148A (ja) 2007-11-06 2009-05-28 Ricoh Co Ltd 画像表示装置、画像表示方法、画像表示プログラム及び記憶媒体
US8170280B2 (en) * 2007-12-03 2012-05-01 Digital Smiths, Inc. Integrated systems and methods for video-based object modeling, recognition, and tracking
JP2009182530A (ja) 2008-01-29 2009-08-13 Ricoh Co Ltd 業務処理遂行支援装置
JP5157774B2 (ja) 2008-09-17 2013-03-06 株式会社リコー 画像形成装置、画像形成方法およびプログラム
US9355337B2 (en) * 2009-08-25 2016-05-31 Xerox Corporation Consistent hierarchical labeling of image and image regions
JP5712487B2 (ja) 2009-09-04 2015-05-07 株式会社リコー 画像処理装置、画像処理システム、画像処理方法、及びプログラム
JP5482208B2 (ja) 2010-01-06 2014-05-07 株式会社リコー 画像処理装置、画像処理システム、及び画像処理方法
JP5423405B2 (ja) 2010-01-08 2014-02-19 株式会社リコー 画像処理システムおよび画像処理方法
WO2012047202A1 (en) * 2010-10-05 2012-04-12 Utc Fire & Security Corporation System and method for object detection
JP2012137838A (ja) 2010-12-24 2012-07-19 Ricoh Co Ltd 情報処理装置、レイアウト生成方法、およびプログラム
US8483440B2 (en) * 2011-04-13 2013-07-09 Xerox Corporation Methods and systems for verifying automatic license plate recognition results
JP5778983B2 (ja) * 2011-05-17 2015-09-16 キヤノン株式会社 データ処理装置、データ処理装置の制御方法、およびプログラム
JP5477399B2 (ja) 2012-01-30 2014-04-23 カシオ計算機株式会社 情報処理装置、情報処理方法及びプログラム、並びに情報処理システム
JP6119131B2 (ja) 2012-07-12 2017-04-26 株式会社リコー 画像投影装置、画像投影装置の制御プログラム、画像投影装置の制御方法
JP6171319B2 (ja) 2012-12-10 2017-08-02 株式会社リコー 情報処理装置、情報処理方法、情報処理システム及びプログラム
US9165220B2 (en) * 2012-12-18 2015-10-20 Hewlett-Packard Development Company, L.P. Image object recognition based on a feature vector with context information
JP6171353B2 (ja) 2013-01-18 2017-08-02 株式会社リコー 情報処理装置、システム、情報処理方法およびプログラム
US9008428B2 (en) * 2013-01-28 2015-04-14 International Business Machines Corporation Efficient verification or disambiguation of character recognition results
EP2801958B1 (en) * 2013-05-08 2016-09-14 Axis AB Monitoring method and camera
US9117144B2 (en) * 2013-08-14 2015-08-25 Qualcomm Incorporated Performing vocabulary-based visual search using multi-resolution feature descriptors
US9864758B2 (en) * 2013-12-12 2018-01-09 Nant Holdings Ip, Llc Image recognition verification

Also Published As

Publication number Publication date
JP2015103188A (ja) 2015-06-04
US20150146924A1 (en) 2015-05-28
US9613272B2 (en) 2017-04-04

Similar Documents

Publication Publication Date Title
JP6255944B2 (ja) 画像解析装置、画像解析方法及び画像解析プログラム
RU2607774C2 (ru) Способ управления в системе захвата изображения, устройство управления и машиночитаемый носитель данных
JP5713790B2 (ja) 画像処理装置、画像処理方法、及びプログラム
US20180189610A1 (en) Active machine learning for training an event classification
US10216979B2 (en) Image processing apparatus, image processing method, and storage medium to detect parts of an object
EP3220353B1 (en) Image processing apparatus, image processing method, and recording medium
WO2019172059A1 (ja) 区画線認識装置
KR102476022B1 (ko) 얼굴검출 방법 및 그 장치
US10762372B2 (en) Image processing apparatus and control method therefor
JP4724638B2 (ja) オブジェクト検出方法
JP5936561B2 (ja) 画像における外観及びコンテキストに基づく物体分類
JPWO2012046426A1 (ja) 物体検出装置、物体検出方法および物体検出プログラム
KR101406334B1 (ko) 신뢰도와 지연된 결정을 활용한 다중 객체 추적 시스템 및 방법
US20170053172A1 (en) Image processing apparatus, and image processing method
CN108629225B (zh) 一种基于多幅子图与图像显著性分析的车辆检测方法
WO2020137193A1 (ja) 人検出装置および人検出方法
JP2008035301A (ja) 移動体追跡装置
JP7072765B2 (ja) 画像処理装置、画像認識装置、画像処理プログラム、及び画像認識プログラム
KR102260556B1 (ko) 전역 정보와 지역 정보 통합을 통한 딥러닝 기반 주차구획 검출 방법 및 장치
JP2009182624A (ja) 目標追尾装置
JP6384167B2 (ja) 移動体追跡装置及び移動体追跡方法、並びにコンピュータ・プログラム
JP6698058B2 (ja) 画像処理装置
CN115937991A (zh) 人体摔倒识别方法、装置、计算机设备及存储介质
JP2017084006A (ja) 画像処理装置およびその方法
US11373313B2 (en) Image processing apparatus and image processing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171120

R151 Written notification of patent or utility model registration

Ref document number: 6255944

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees