JP2018120642A - 被写体検出装置、被写体検出方法及びプログラム - Google Patents

被写体検出装置、被写体検出方法及びプログラム Download PDF

Info

Publication number
JP2018120642A
JP2018120642A JP2018091270A JP2018091270A JP2018120642A JP 2018120642 A JP2018120642 A JP 2018120642A JP 2018091270 A JP2018091270 A JP 2018091270A JP 2018091270 A JP2018091270 A JP 2018091270A JP 2018120642 A JP2018120642 A JP 2018120642A
Authority
JP
Japan
Prior art keywords
area
region
partial region
input image
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018091270A
Other languages
English (en)
Other versions
JP6580201B2 (ja
Inventor
正雄 山中
Masao Yamanaka
正雄 山中
優和 真継
Masakazu Matsugi
優和 真継
克彦 森
Katsuhiko Mori
克彦 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018091270A priority Critical patent/JP6580201B2/ja
Publication of JP2018120642A publication Critical patent/JP2018120642A/ja
Application granted granted Critical
Publication of JP6580201B2 publication Critical patent/JP6580201B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】より頑健に画像中の主被写体を検出できるようにする。【解決手段】入力画像上のある点(画素)に対して、まず、予め定められた大きさの第1の部分領域と第2の部分領域とを設定する。また、第2の部分領域において第1の情報量を算出し、その大きさに基づいて第3の部分領域を設定する。さらに、第1の部分領域と第2の部分領域とにおける特徴量の統計的分布の相違に基づく顕著度と、第3の部分領域における特徴量が有する情報量とに基づいてスコアを算出する。最終的に、画像上の各点におけるスコアを算出し、所定の統計処理を適用することにより主被写体を検出する。【選択図】図1

Description

本発明は、特に、主被写体を検出するために用いて好適な被写体検出装置、被写体検出方法及びプログラムに関する。
従来、入力画像から主被写体を検出する方法として、例えば特許文献1に記載されているような方法が提案されている。特許文献1に記載の方法では、まず、自動分割アルゴリズムを用いて入力画像を複数の部分領域に分割する。また、得られた部分領域のうちの一つとその他の部分領域との特徴量に対する差分の重み付き和に基づいて当該部分領域における顕著度を算出する。さらに、得られた顕著度に基づいて画像中の主被写体を検出する。
また、入力画像から主被写体を検出する他の方法として、例えば非特許文献1に記載されているような方法も提案されている。非特許文献1に記載の方法では、まず、入力画像から複数種類の特徴量を抽出し、その特徴量に対する多重解像度画像を生成する。また、得られた多重解像度画像の各種類に対して大きさの異なる2つの部分領域を設定し、この2つの部分領域から抽出した特徴量に対する統計的分布の相違(カルバック−ライブラー・ダイバージェンス)に基づいて顕著度を算出する。さらに、多重解像度画像の各種類で得られた顕著度を統合して顕著度画像を生成し、最終的に、得られた顕著度画像に基づいて画像中の主被写体を検出する。
さらに、入力画像から主被写体(またはその部分領域)を検出するその他の方法として、例えば非特許文献2に記載されているような方法も提案されている。非特許文献2に記載の方法では、まず、入力画像から複数種類の特徴量を抽出し、その特徴量に対する多重解像度画像を生成し、多重解像度画像の各種類について大きさの異なる2つの部分領域を設定する。そして、この2つの部分領域から抽出した特徴量に対する統計的分布の相違(スケール重み付き確率分布間距離)と、2つの部分領域のうちの一方から抽出した特徴量に対する情報量(情報エントロピー)との積に基づいて顕著度を算出する。さらに、多重解像度画像の各種類で得られた顕著度を統合することにより顕著度画像を生成し、最終的に、得られた顕著度画像に基づいて画像中の主被写体(またはその部分領域)を検出する。
特開2012−243313号公報
A. Dominik et al., Center-surround Divergence of Feature Statistics for Salient Object Detection, ICCV2011 T. Kadir et al., An affine invariant salient region detector, ECCV2004. 大津展之:判別および最小2 乗法に基づく自動しきい値選定法, 電子通信学会論文誌, J63-D-4 (1980-4), 349.356. Lowe, D.G.: Object recognition from local scale invariant features, Proc. of IEEE International Conference on Computer Vision, pp. 1150.1157(1999). T. Lindeberg (1994). Scale-Space Theory in Computer Vision. Springer. ISBN 0-7923-9418-6. E. Sharon, A. Brandt, and R. Basri, Fast multiscale image segmentation Proc. IEEE Computer Vision and Pattern Recognition, pp. 70-77, 2000.
前述したように、特許文献1及び非特許文献1に記載の方法では、入力画像中の特徴量に対する統計的分布の相違に基づいて顕著度を算出し、得られた顕著度に基づいて画像中の主被写体を検出する。しかしながら、画像中の主被写体が視覚的に顕著でない場合には主被写体の検出精度が低下するという問題がある。
また、非特許文献2に記載の方法では、入力画像中の主被写体の含有する情報量の大きさ(情報エントロピー)を算出し、得られた情報量の大きさ(情報エントロピー)に基づいて画像中の主被写体を検出する。しかしながら、環境的または観測的要因によるノイズの影響を受けやすく、主被写体の検出精度が低下するという問題がある。
本発明は前述の問題点に鑑み、より頑健に画像中の主被写体を検出できるようにすることを目的としている。
本発明に係る被写体検出装置は、入力画像上に、第1の領域と、該第1の領域の周囲を含む第2の領域と、前記第1の領域を含む第3の領域とを設定する設定手段と、前記第1及び第2の領域のそれぞれから同一種類の特徴量を抽出する第1の抽出手段と、前記第1及び第2の領域のそれぞれから抽出された前記同一種類の特徴量の相違に基づいて顕著度を導出する導出手段と、前記第3の領域からエッジ特徴量を抽出する第2の抽出手段と、
前記顕著度と前記エッジ特徴量とに基づいて前記入力画像における主被写体を検出する検出手段と、を有することを特徴とする。
本発明によれば、主被写体が視覚的に顕著でない場合や、環境的または観測的要因によるノイズが生じている場合であっても、より頑健に画像中の主被写体を検出することができる。
実施形態に係る主被写体検出装置の機能構成例を示すブロック図である。 主被写体を識別する処理手順の一例を示すフローチャートである。 第1及び第2の実施形態における第1の部分領域と第2の部分領域との関係を説明するための図である。 第1の実施形態における正方形の第3の部分領域を説明するための図である。 第1の実施形態における矩形の第3の部分領域を説明するための図である。 第1の実施形態における円形の第3の部分領域を説明するための図である。 第1の実施形態における楕円形の第3の部分領域を説明するための図である。 部分領域における特徴量の統計的分布の相違に基づいて顕著度を算出する手順を説明するための図である。 スコアマップから主被写体を検出する手順を説明するための図である。 第2の実施形態において、第3の部分領域を求める手順を説明するための図である。 第2の実施形態における第3の部分領域を説明するための図である。 第3の実施形態における第1の部分領域と第2の部分領域との関係を説明するための図である。
(第1の実施形態)
以下、本発明の第1の実施形態について、図1〜図9を参照しながら説明する。
図1は、本実施形態に係る主被写体検出装置100の機能構成例を示すブロック図である。本実施形態に係る主被写体検出装置100の機能は、不図示の半導体集積回路(LSI)またはCPUが実行するプログラムにより実現される。
図1に示すように、主被写体検出装置100は、第1部分領域設定部101、第2部分領域設定部102、第3部分領域設定部103、顕著度算出部104、情報量算出部105、スコア算出部106、及び識別部107を有する。これらの構成要素は主被写体検出装置100が果たす機能にそれぞれ対応している。
図2は、本実施形態に係る主被写体検出装置100により主被写体を識別する処理手順の一例を示すフローチャートである。以下、図1及び図2を参照しながら本実施形態に係る主被写体検出装置100による処理について説明する。
図2に示すように、主被写体検出装置100は、入力画像上のある点(画素)に対して、まず、予め定められた大きさの第1の部分領域と第2の部分領域とを設定する。また、第2の部分領域において第1の情報量を算出し、その大きさに基づいて第3の部分領域を設定する。さらに、第1の部分領域と第2の部分領域とにおける特徴量の統計的分布の相違に基づく顕著度と、第3の部分領域における特徴量が有する情報量とに基づいてスコアを算出する。最終的に、画像上の各点におけるスコアを算出し、所定の統計処理を適用することにより主被写体を検出する。以下、その詳細について説明する。
まず、入力画像が主被写体検出装置100に入力されると処理を開始し、ステップS201において、入力画像上のすべての点において、後述するステップS202〜S208の処理を終了したか否かを判定する。この判定の結果、入力画像上のすべての点において、処理が終了した場合はステップS209に進み、そうでない場合はステップS202に進む。
次に、ステップS202において、第1部分領域設定部101は、図3に示すように、主被写体検出装置100の外部から入力される入力画像の画像空間上に第1の部分領域301を設定する。具体的には、図3(a)に示すように、正方領域として第1の部分領域301を設定してもよく、図3(b)に示すように、矩形領域として第1の部分領域301を設定してもよい。また、図3(c)に示すように、円形領域として第1の部分領域301を設定してもよく、図3(d)に示すように、楕円領域として第1の部分領域301を設定してもよい。
次に、ステップS203において、第2部分領域設定部102は、図3に示すように、入力画像の画像空間上に第2の部分領域302を設定する。具体的には、図3(a)に示すように、第1の部分領域を包含する正方領域として第2の部分領域302を設定してもよく、図3(b)に示すように、矩形の第1の部分領域を包含する矩形領域として第2の部分領域302を設定してもよい。また、図3(c)に示すように、円形の第1の部分領域を包含する円形領域として第2の部分領域302を設定してもよく、図3(d)に示すように、楕円の第1の部分領域を包含する楕円領域として第2の部分領域302を設定してもよい。
次に、ステップS204において、第2部分領域設定部102は、第2の部分領域における特徴量(輝度値、色成分、エッジ強度など)が有する情報量(以下、第1の情報量)を算出する。ここで、第1の情報量の大きさは、例えば、以下の式(1)によりエントロピーHとして算出する。
Figure 2018120642
式(1)において、Piは、第2の部分領域における特徴量のi番目の階調の生起確率を表し、ある特徴量の階調数が256(=28)の場合、エントロピーHの最大値は8で与えられ、最小値は0で与えられる。
次に、ステップS205において、第3部分領域設定部103は、入力画像上の第2の部分領域における第1の情報量の大きさに基づいて、第3の部分領域を設定する。具体的には、例えば、第1の情報量が大きい場合は、図4(a)に示すように、第1の部分領域301を包含し、かつ第2の部分領域302に包含される相対的に小さな正方領域として第3の部分領域403を設定する。また、第1の情報量が小さい場合は、図4(b)に示すように、第1の部分領域301を包含し、かつ第2の部分領域302に包含される相対的に大きな正方領域として第3の部分領域403を設定すればよい。
第1の部分領域及び第2の部分領域を正方領域として設定した場合には、第3の部分領域の一辺の長さL3は、例えば、第1の部分領域の一辺の長さL1と、第2の部分領域の一辺の長さL2とを用いて、以下の式(2)により算出する。
Figure 2018120642
式(2)によれば、図4における第3の部分領域の一辺の長さL3は、エントロピーHの大きさに応じて、最小値L1から最大値L2までの実数値で与えられる。
なお、図3(b)に示すように第1の部分領域及び第2の部分領域を設定した場合には、以下のように設定する。第1の情報量が大きい場合は、図5(a)に示すように、第1の部分領域301を包含し、かつ第2の部分領域302に包含される相対的に小さな矩形領域として第3の部分領域403を設定する。また、第1の情報量が小さい場合は、図5(b)に示すように、第1の部分領域301を包含し、かつ第2の部分領域302に包含される相対的に大きな矩形領域として第3の部分領域403を設定する。なお、図5における第3の部分領域の長辺の長さL3は、第1の部分領域の長辺の長さL1と、第2の部分領域の長辺の長さL2とを用いて式(2)により算出することができ、短辺についても同様に算出することができる。
また、図3(c)に示すように第1の部分領域及び第2の部分領域を設定した場合には、以下のように設定する。第1の情報量が大きい場合は、図6(a)に示すように、第1の部分領域301を包含し、かつ第2の部分領域302に包含される相対的に小さな円形領域として第3の部分領域403を設定する。また、第1の情報量が小さい場合は、図6(b)に示すように、第1の部分領域301を包含し、かつ第2の部分領域302に包含される相対的に大きな円形領域として第3の部分領域403を設定する。なお、図6における第3の部分領域の径の長さL3は、第1の部分領域の径の長さL1と、第2の部分領域の径の長さL2とを用いて式(2)により算出することができる。
また、図3(d)に示すように第1の部分領域及び第2の部分領域を設定した場合には、以下のように設定する。第1の情報量が大きい場合は、図7(a)に示すように、第1の部分領域301を包含し、かつ第2の部分領域302に包含される相対的に小さな楕円領域として第3の部分領域403を設定する。また、第1の情報量が小さい場合は、図7(b)に示すように、第1の部分領域301を包含し、かつ第2の部分領域302に包含される相対的に大きな楕円領域として第3の部分領域403を設定する。なお、図7における第3の部分領域の長軸の長さL3は、第1の部分領域の長軸の長さL1と、第2の部分領域の長軸の長さL2とを用いて式(2)により算出することができ、短軸についても同様に算出することができる。
次に、ステップS206において、顕著度算出部104は顕著度導出手段として、第1部分領域設定部101で得られた第1の部分領域と、第2部分領域設定部102で得られた第2の部分領域とを用いて顕著度を算出する。具体的には、図8に示すように、各々の部分領域における特徴量の統計的分布の相違に基づいて視覚的な顕著度を算出する。ここで、顕著度は、例えば、以下の式(3)によりヒストグラム・インターセクションHIを用いて算出する。
Figure 2018120642
あるいは、顕著度は、式(4)のようなピアソン・ダイバージェンスDPRを用いて算出してもよい。
Figure 2018120642
また、顕著度は、以下の式(5)により相対ピアソン・ダイバージェンスDRPを用いて算出してもよい。ここでβは0以上1以下の任意の実数値である。
Figure 2018120642
また、顕著度は、以下の式(6)によりカルバック−ライブラー・ダイバージェンスDKLを用いて算出してもよい。
Figure 2018120642
また、顕著度は、以下の式(7)によりバタチャリア距離DBTを用いて算出してもよい。
Figure 2018120642
また、顕著度は、以下の式(8)により距離尺度Dを用いて算出してもよい。
Figure 2018120642
また、顕著度は、以下の式(9)によりDabsを用いて算出してもよい。
Figure 2018120642
ここで、式(3)〜式(9)において、P(i)は、第1の部分領域から抽出した特徴量に対する確率密度Pのi番目の階調の確率を表し、Q(i)は、第2の部分領域から抽出した特徴量に対する確率密度Qのi番目の階調の確率を表す。
次に、ステップS207において、情報量算出部105は、第3部分領域設定部103で得られた第3の部分領域における特徴量(輝度値、色成分、エッジ強度など)が有する情報量(以下、第2の情報量)を算出する。具体的には、第2の情報量は、例えば、第3の部分領域における特徴量の勾配強度を、第3の部分領域の各点で算出し、それらの合計値で与えればよい。ここで、勾配強度は、公知の画像処理フィルタ(Sobelフィルタ、Cannyフィルタ、Laplacianフィルタ、Gaborフィルタなど)を用いて算出すればよい。
次に、ステップS208において、スコア算出部106は、顕著度算出部104で得られた顕著度と、情報量算出部105で得られた第2の情報量とに基づいて、入力画像上の処理対象の点におけるスコア(主被写体があるかどうかを示す尺度)を算出する。ここで、入力画像上の各点におけるスコアは、例えば、顕著度算出部104で得られた顕著度と、情報量算出部105で得られた第2の情報量との積で与えればよい。なお、顕著度算出部104で得られた顕著度と、情報量算出部105で得られた第2の情報量との和をスコアとして与えてもよい。あるいは、顕著度算出部104で得られた顕著度と、情報量算出部105で得られた情報量との積と和との組み合わせをスコアとして与えてもよい。
ステップS209においては、識別部107は、スコア算出部106において算出されたスコアに基づいて、入力画像中の主被写体を検出する。具体的には、まず、例えば図9(a)に示すような入力画像に対して算出された入力画像上の各点におけるスコアを入力画像上に配置したスコアマップ(図9(b)参照)を生成する。そして、得られたスコアマップに対して、非特許文献3に記載の2値化処理、具体的にはクラス内分散を最小化し、クラス間分散を最大化することにより適応的に学習して閾値を設定する手法を適用して、図9(c)に示すような主被写体の候補領域を設定する。さらに、得られた主被写体の候補領域に外接する矩形領域を設定することにより、図9(d)に示すように入力画像中の主被写体を検出し、検出結果を出力する。
このようにして得られた主被写体の検出結果は、主被写体検出装置100を活用する装置に利用される。例えば、デジタルスチルカメラ内において、主被写体として検出された領域にフォーカスを合わせ、当該領域を高画質化するような想定下においては、主被写体検出装置100を制御するデジタルスチルカメラ内のCPU、プログラム等に伝達される。
以上のように本実施形態によれば、視覚的な顕著度と、第3の部分領域における特徴量(輝度値、色成分、エッジ強度など)が有する情報量とに応じたスコアを算出して主被写体を検出する。これにより、主被写体が視覚的に顕著でない場合や、環境的または観測的要因によるノイズが生じている場合であっても、頑健に画像中の主被写体を検出することができる。
(第2の実施形態)
以下、本発明の第2の実施形態について、図10及び図11を参照しながら説明する。なお、主被写体検出装置の構成及び基本的な処理の流れは第1の実施形態と同様であり、本実施形態においては、第1の実施形態との相違箇所のみ説明する。第1の実施形態では、第1の部分領域及び第2の部分領域と重心が一致するように第3の部分領域を設定した。これに対して本実施形態では、第1の部分領域及び第2の部分領域の重心と関係なく、第2の部分領域に包含され、大きさの異なる複数の部分領域として第3の部分領域を設定する点が異なっている。
図2のステップS204においては、第2部分領域設定部102は、第2の部分領域における特徴量(輝度値、色成分、エッジ強度など)が有する情報量(以下、第1の情報量)を算出する。ここで、第1の情報量は、例えば、帯域フィルタの一種である、非特許文献4に記載されているDifference of Gaussian(DoG)を用いて算出する。具体的には、以下の式(10)により、入力画像I(x,y)に対して、ガウシアン関数G(x,y,kσ)を適用して得られた平滑化画像L(x,y,kσ)と、ガウシアン関数G(x,y,σ)を適用して得られた平滑化画像L(x,y,σ)とを算出する。そして、これらの平滑化画像の差分画像D(x,y,σ)を算出する。ここで、(x,y)は、入力画像上における水平方向および垂直方向の座標を表す。また、kはガウシアン・パラメータσの増加率を表し、主被写体検出装置100が想定アプリケーションにおいて許容される計算時間に応じて一意に決定される。
Figure 2018120642
図2のステップS205において設定される第3の部分領域の位置及びその大きさは、例えば、以下のように与えられる。図10に示すように、差分画像D(x,y,σ)における着目画素と近傍画素とを比較する。そして、この比較により得られる極値(極大値及び極小値)又は差分画像D(x,y,σ)における閾値以上の画素値の座標(x,y)に基づき、ガウシアン・パラメータσ(又は、その所定係数倍)を直径とする円形領域を求める。この結果、第3の部分領域は、図11に示すように、第2の部分領域における複数の位置及び大きさの円形領域で与えられる。
あるいは、第3の部分領域の位置及びその大きさを、帯域フィルタの一種である、非特許文献5に記載されているLaplacian of Gaussian(LoG)を用いて算出してもよい。この場合、LoG画像における着目画素と近傍画素とを比較して得られる極値(極大値及び極小値)又はLoG画像における閾値以上の画素値の座標(x,y)に基づき、ガウシアン・パラメータσ(又は、その所定係数倍)を直径とする円形領域で与えられる。
また、第3の部分領域の位置及びその大きさを、帯域フィルタの一種である、公知の画像処理フィルタのガボールフィルタを用いて算出してもよい。この場合、フィルタ出力値における着目画素と周辺画素とを比較して得られた極値(極大値及び極小値)の座標(x,y)に基づき、ガウシアン・パラメータσ(又は、その所定係数倍)を直径とする円形領域で与えられる。
以上のように第3の部分領域を設定すると、その後は第1の実施形態と同様の手順により主被写体を検出することができる。
(第3の実施形態)
以下、本発明の第3の実施形態について、図12を参照しながら説明する。なお、主被写体検出装置の構成及び基本的な処理の流れは第1の実施形態と同様であり、本実施形態においては、第1の実施形態との相違箇所のみ説明する。第1の実施形態では、第1の部分領域と第2の部分領域との間に包含関係があったのに対して、本実施形態では、第1の部分領域と第2の部分領域との間に必ずしも包含関係があるわけではない点が異なっている。
図2のステップS202において、第1部分領域設定部101は、主被写体検出装置100の外部から入力される入力画像上に第1の部分領域を設定する。具体的には、図12(a)に示すように、画像空間上に任意の大きさの円形領域(あるいは楕円領域)を等間隔で配置し、そのうちの一つ(例えば、図12(a)の円形領域A)を第1の部分領域に設定する。
なお、図12(b)に示すように、入力画像上に任意の大きさの円形領域(あるいは楕円領域)を部分的に重複させて等間隔に配置し、そのうちの一つ(例えば、図12(b)の円形領域A)を第1の部分領域に設定してもよい。あるいは、図12(c)に示すように、入力画像上に任意の大きさの円形領域(あるいは楕円領域)をランダムに配置し、そのうちの一つ(例えば、図12(c)の円形領域A)を第1の部分領域に設定してもよい。
あるいは、図12(d)に示すように、入力画像を複数の局所領域に分割し、そのうちの一つ(例えば、図12(d)の局所領域A)を第1の部分領域に設定してもよい。この場合、入力画像における輝度値、色成分、エッジ強度、テクスチャなど特徴量の統計的分布に基づいて複数の局所領域に分割する。ここで、統計的分布とは、例えば、領域内の前記特徴量に対するヒストグラムが単峰性なのか多峰性なのか、あるいは、領域内の前記特徴量に対する情報量が閾値以上か否かなどといった内容である。なお、非特許文献6に記載の方法を用いて入力画像を複数の局所領域に分割してもよい。
次に、図2のステップS203においては、第2部分領域設定部102は、入力画像上に第2の部分領域を設定する。具体的には、図12に示すように、第1部分領域設定部101で設定された第1の部分領域(図12の局所領域A)に隣接する部分領域のうちの任意の一つ(例えば、図12の局所領域B)を第2の部分領域に設定する。
次に、図2のステップS204においては、第1部分領域設定部101は、入力画像上の第1の部分領域における特徴量(輝度値、色成分、エッジ強度など)が有する情報量を算出する。そして、第2部分領域設定部102は、同様に入力画像上の第2の部分領域における特徴量(輝度値、色成分、エッジ強度など)が有する情報量を算出する。
次に、図2のステップS205においては、第3部分領域設定部103は、第1の部分領域における特徴量が有する情報量の大きさと、第2の部分領域における特徴量が有する情報量の大きさとに基づいて、第3の部分領域を設定する。具体的には、例えば、第1の部分領域における情報量の大きさと、第2の部分領域における情報量の大きさとを比較して、第1の部分領域における情報量の方が大きい場合、第1の部分領域を第3の部分領域として設定する。一方、第2の部分領域における情報量の方が大きい場合、第2の部分領域を第3の部分領域として設定する。
ここで、第1の部分領域及び第2の部分領域における情報量の大きさは、例えば、前述した式(1)に示すエントロピーHで与えればよい。あるいは、各々の部分領域における情報量の大きさは、部分領域における特徴量の勾配強度をその部分領域の各点で算出し、それらの合計値で与えてもよい。また、勾配強度は、例えば、公知の画像処理フィルタ(Sobelフィルタ、Cannyフィルタ、Laplacianフィルタ、Gaborフィルタなど)を用いて算出すればよい。
ステップS209においては、識別部107は、スコア算出部106において算出されたスコアに基づいて、入力画像中の主被写体を検出する。具体的には、まず、入力画像に対して、スコア算出部106により、第1部分領域設定部101で得られた第1の部分領域と、第2部分領域設定部102で得られた第2の部分領域とのすべての組み合わせに対するスコアが算出される。
第1及び第2の実施形態では、入力画像上のすべての点に対してステップS201〜S208の処理を繰り返したが、本実施形態では、第1の部分領域及び第2の部分領域のすべての組み合わせに対してステップS201〜S208の処理を繰り返す。スコアの算出方法については第1の実施形態と同様に、顕著度と第2の情報量とを用いて算出する。
そして、識別部107は、すべての組み合わせに対するスコアを画像空間上に配置したスコアマップを生成する。また、得られたスコアマップに対して、前述した非特許文献3に記載の2値化処理を適用することにより、主被写体の候補領域を設定する。さらに、得られた主被写体の候補領域に外接する矩形領域を設定することにより、入力画像中の主被写体を検出する。
以上のように本実施形態によれば、主被写体が視覚的に顕著でない場合や、環境的または観測的要因によるノイズが生じている場合であっても、頑健に画像中の主被写体を検出することができる。
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
101 第1部分領域設定部
102 第2部分領域設定部
103 第3部分領域設定部
104 顕著度算出部
105 情報量算出部
106 スコア算出部
107 識別部

Claims (9)

  1. 入力画像上に、第1の領域と、該第1の領域の周囲を含む第2の領域と、前記第1の領域を含む第3の領域とを設定する設定手段と、
    前記第1及び第2の領域のそれぞれから同一種類の特徴量を抽出する第1の抽出手段と、
    前記第1及び第2の領域のそれぞれから抽出された前記同一種類の特徴量の相違に基づいて顕著度を導出する導出手段と、
    前記第3の領域からエッジ特徴量を抽出する第2の抽出手段と、
    前記顕著度と前記エッジ特徴量とに基づいて前記入力画像における主被写体を検出する検出手段と、
    を有することを特徴とする被写体検出装置。
  2. 前記第3の領域は前記第2の領域の内側の領域であることを特徴とする請求項1に記載の被写体検出装置。
  3. 前記第1の領域、前記第2の領域、及び前記第3の領域は重心が一致することを特徴とする請求項1または2に記載の被写体検出装置。
  4. 前記設定手段は、前記第3の領域を、前記第2の領域から抽出される特徴量の値に基づくサイズで設定することを特徴とする請求項1から3のいずれか1項に記載の被写体検出装置。
  5. 前記同一種類の特徴量は、領域の輝度値の統計的分布であることを特徴とする請求項1から4のいずれか1項に記載の被写体検出装置。
  6. 前記顕著度と前記エッジ特徴量とに基づいてスコアを導出するスコア導出手段を更に有し、
    前記検出手段は前記導出されたスコアに基づいて前記入力画像における主被写体を検出することを特徴とする請求項5に記載の被写体検出装置。
  7. 前記検出手段は、前記スコア導出手段によって前記入力画像上の複数点で導出されたスコアを配置したスコアマップを生成し、前記スコアマップに対する閾値に基づいて前記入力画像における主被写体を検出することを特徴とする請求項6に記載の被写体検出装置。
  8. 入力画像上に、第1の領域と、該第1の領域の周囲を含む第2の領域と、前記第1の領域を含む第3の領域とを設定するステップと、
    前記第1及び第2の領域のそれぞれから同一種類の特徴量を抽出するステップと、
    前記第1及び第2の領域のそれぞれから抽出された前記同一種類の特徴量の相違に基づいて顕著度を導出するステップと、
    前記第3の領域からエッジ特徴量を抽出するステップと、
    前記顕著度と前記エッジ特徴量とに基づいて前記入力画像における主被写体を検出するステップと、
    を有することを特徴とする被写体検出方法。
  9. コンピュータを、請求項1から7のいずれか1項に記載の被写体検出装置として機能させるためのプログラム。
JP2018091270A 2018-05-10 2018-05-10 被写体検出装置、被写体検出方法及びプログラム Active JP6580201B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018091270A JP6580201B2 (ja) 2018-05-10 2018-05-10 被写体検出装置、被写体検出方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018091270A JP6580201B2 (ja) 2018-05-10 2018-05-10 被写体検出装置、被写体検出方法及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014083703A Division JP6338429B2 (ja) 2014-04-15 2014-04-15 被写体検出装置、被写体検出方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2018120642A true JP2018120642A (ja) 2018-08-02
JP6580201B2 JP6580201B2 (ja) 2019-09-25

Family

ID=63045392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018091270A Active JP6580201B2 (ja) 2018-05-10 2018-05-10 被写体検出装置、被写体検出方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6580201B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200028870A (ko) * 2018-09-07 2020-03-17 (주)위지윅스튜디오 단일 영상 기반의 3차원 cg 에셋 생성 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07334673A (ja) * 1994-06-13 1995-12-22 Mitsubishi Electric Corp 目標検出方法及び目標検出装置
JPH08297742A (ja) * 1995-04-25 1996-11-12 Mitsubishi Electric Corp 目標検出方法および目標検出装置
JP2011034311A (ja) * 2009-07-31 2011-02-17 Casio Computer Co Ltd 画像処理装置及び方法
JP2014016688A (ja) * 2012-07-06 2014-01-30 Kddi Corp 顕著性マップを利用した非写実変換プログラム、装置及び方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07334673A (ja) * 1994-06-13 1995-12-22 Mitsubishi Electric Corp 目標検出方法及び目標検出装置
JPH08297742A (ja) * 1995-04-25 1996-11-12 Mitsubishi Electric Corp 目標検出方法および目標検出装置
JP2011034311A (ja) * 2009-07-31 2011-02-17 Casio Computer Co Ltd 画像処理装置及び方法
JP2014016688A (ja) * 2012-07-06 2014-01-30 Kddi Corp 顕著性マップを利用した非写実変換プログラム、装置及び方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200028870A (ko) * 2018-09-07 2020-03-17 (주)위지윅스튜디오 단일 영상 기반의 3차원 cg 에셋 생성 방법
KR102215315B1 (ko) * 2018-09-07 2021-02-15 (주)위지윅스튜디오 단일 영상 기반의 3차원 cg 에셋 생성 방법

Also Published As

Publication number Publication date
JP6580201B2 (ja) 2019-09-25

Similar Documents

Publication Publication Date Title
JP6719457B2 (ja) 画像の主要被写体を抽出する方法とシステム
JP6338429B2 (ja) 被写体検出装置、被写体検出方法及びプログラム
US11282185B2 (en) Information processing device, information processing method, and storage medium
TWI774659B (zh) 圖像文字的識別方法和裝置
US9047529B2 (en) Form recognition method and device
US9053384B2 (en) Feature extraction unit, feature extraction method, feature extraction program, and image processing device
CN110569731B (zh) 一种人脸识别方法、装置及电子设备
WO2021051604A1 (zh) Osd的文字区域的识别方法、装置及存储介质
JP6547386B2 (ja) 画像処理装置及び方法
CN110619333B (zh) 一种文本行分割方法、文本行分割装置及电子设备
CN109948521B (zh) 图像纠偏方法和装置、设备及存储介质
US20160259990A1 (en) Region-of-interest detection apparatus, region-of-interest detection method, and recording medium
JP5656768B2 (ja) 画像特徴量抽出装置およびそのプログラム
TW201432620A (zh) 具有邊緣選擇功能性之影像處理器
CN111259680B (zh) 二维码图像二值化处理方法及装置
CN108960247B (zh) 图像显著性检测方法、装置以及电子设备
JP2017500662A (ja) 投影ひずみを補正するための方法及びシステム
WO2018058573A1 (zh) 对象检测方法、对象检测装置以及电子设备
JP6580201B2 (ja) 被写体検出装置、被写体検出方法及びプログラム
JP4967045B2 (ja) 背景判別装置、方法及びプログラム
JP2016081472A (ja) 画像処理装置、画像処理方法及びプログラム
CN114529570A (zh) 图像分割方法、图像识别方法、用户凭证补办方法及系统
CN112785550A (zh) 图像质量值确定方法、装置、存储介质及电子装置
JP4812743B2 (ja) 顔認識装置、顔認識方法、顔認識プログラムおよびそのプログラムを記録した記録媒体
JP2004151815A (ja) 特定領域抽出方法、特定領域抽出装置、特定領域抽出プログラム及びそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180510

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190827

R151 Written notification of patent or utility model registration

Ref document number: 6580201

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151