JP5846144B2 - 画像領域分割装置、方法、およびプログラム - Google Patents

画像領域分割装置、方法、およびプログラム Download PDF

Info

Publication number
JP5846144B2
JP5846144B2 JP2013053238A JP2013053238A JP5846144B2 JP 5846144 B2 JP5846144 B2 JP 5846144B2 JP 2013053238 A JP2013053238 A JP 2013053238A JP 2013053238 A JP2013053238 A JP 2013053238A JP 5846144 B2 JP5846144 B2 JP 5846144B2
Authority
JP
Japan
Prior art keywords
histogram
image
value
main subject
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013053238A
Other languages
English (en)
Other versions
JP2014178950A (ja
Inventor
雅行 広浜
雅行 広浜
松永 和久
和久 松永
道大 二瓶
道大 二瓶
浩一 中込
浩一 中込
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2013053238A priority Critical patent/JP5846144B2/ja
Publication of JP2014178950A publication Critical patent/JP2014178950A/ja
Application granted granted Critical
Publication of JP5846144B2 publication Critical patent/JP5846144B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Studio Devices (AREA)

Description

本発明は、画像内の前景(主要被写体)とそれ以外の背景を領域分割する装置、方法、およびプログラムに関する。
野山や道端で見かけた花の名前を知りたくなることがある。そこで、撮影等により得た花のディジタル画像より、クラスタリング法を用いて対象物である花の画像を抽出し、その抽出された花の画像より得られる情報を特徴量とする単数または複数の特徴量を求め、その求められた特徴量と、あらかじめデータベースに登録してある各種の植物の特徴量とを統計的手法を用いて解析して野草の種類を判別する技術が提案されている(例えば特許文献1に記載の技術)。
また、主要被写体を含む画像をGraph Cuts法を用いて主要被写体と背景とに分割する従来技術が知られている(例えば非特許文献1、特許文献2に記載の技術)。領域分割を行う場合、主要被写体と背景の関係によりその境界が不明確な部分が存在する可能性があり、最適な領域分割を行う必要がある。そこで、この従来技術では、領域分割をエネルギーの最小化問題としてとらえ、その最小化手法を提案している。この従来技術では、領域分割に適合するようにグラフを作成し、そのグラフの最小カットを求めることにより、エネルギー関数の最小化を行う。この最小カットは、最大フローアルゴリズムを用いることにより、効率的な領域分割計算を実現している。
Graph Cuts法を用いて主要被写体と背景を分割する手法では、画像内の各画素に付与する主要被写体または背景を示す領域ラベルを更新しながら、その領域ラベルと各画素の画素値に基づいて領域分割を行う手法が知られている。この場合例えば、次のようなコスト項を含むエネルギー関数が定義される。まず、主要被写体を示す画像から算出した例えばカラー画素値ごとのヒストグラムの値が大きいほど値が小さくなるコスト項が含まれる。また、背景を示す画像から算出した例えばカラー画素値ごとのヒストグラムの値が大きいほど値が小さくなるコスト項が含まれる。そして、そのエネルギー関数の最小化処理により、画像内で主要被写体と背景が領域分割される(以上、例えば非特許文献1に記載の手法)。
また、Graph Cuts法だけでは主要被写体と背景の分割が難しい場合がある。このため、例えばデジタルカメラやいわゆるスマートフォンなどへの実装では、ユーザが、例えば撮像装置で撮像した画像に対し、認識したい物体(例えば花)が存在するおおよその領域に対して、例えばタッチパネル等の入力装置を用いて矩形枠を指定する機能が実装される。
特開2002−203242号公報 特開2011−35636号公報
しかし、花画像などの場合、上述したようにユーザが矩形枠を指定しても、矩形枠内に花がうまく入るように指定することが難しい場合があり、その場合には、主要被写体と背景領域を誤認しやすくなって、主要被写体と背景の領域分割の精度が低下してしまうという問題点を有していた。
本発明は、ユーザによる簡単な指定で領域分割の精度を向上させることを目的とする。
態様の一例では、画像内で主要被写体と該主要被写体以外の背景を領域分割する装置であって、主要被写体らしさを示す第1のヒストグラムと背景らしさを示す第2のヒストグラムを用いて、前記画像内で前記主要被写体と前記背景を領域分割する領域分割手段と、前記画像内に所定の画素幅を有する帯状の矩形領域の2本が十字に交わって形成される十字枠を表示し、ユーザに前記画像内の主要被写体の領域の中央が前記十字枠の中心領域に位置し、前記主要被写体の領域が前記十字枠の4方向端で囲まれる十字領域に収まるように、前記画像の画角を調整させる画角調整手段と、該画角が調整された前記画像に対して前記領域分割手段による領域分割処理を実行した後、前記画像の前記十字枠内で前記背景に領域分割された画素のうち前記主要被写体らしいと判定される画素の割合を所定の複数種類の色別に算出し、該複数種類の色のうちいずれか2つ以上の分割された十字枠領域で前記主要被写体らしいと判定される画素の割合が所定の閾値に比較して大きくなる色について、該色に対する前記第1のヒストグラムの値が大きくなるように前記第1のヒストグラムを更新するヒストグラム更新手段と、該更新された第1のヒストグラムおよび前記第2のヒストグラムを用いて、前記画像に対して前記領域分割手段による領域分割処理と前記ヒストグラム更新手段による前記第1のヒストグラムの更新処理を繰り返し実行させる制御手段とを備える。
本発明によれば、ユーザによる簡単な指定で領域分割の精度を向上させることが可能となる。
本発明の一実施形態に係る画像領域分割装置のハードウェア構成例を示すブロック図である。 本実施形態による画像領域分割処理の全体処理を示すフローチャートである。 十字枠と画角調整の説明図である。 図2の領域分割処理を示すフローチャートである。 データ項の更新1の処理の説明図である。 領域分割例を示す図である。 データ項の更新2の処理の説明図である。 重み付き有向グラフの説明図である。 ヒストグラムθの説明図である。 uv(Xu ,Xv )の特性図である。 t−linkとn−linkを有するグラフと、領域ラベルベクトルXおよびグラフカットとの関係を、模式的に示した図である。 領域分割処理を示すフローチャートである。 データ項の更新2の処理を示すフローチャートである。
以下、本発明を実施するための形態について図面を参照しながら詳細に説明する。
図1は、本発明の一実施形態に係る画像領域分割装置を実現するデジタルカメラ101のハードウェア構成例を示すブロック図である。
デジタルカメラ101は、撮像レンズ102、補正レンズ103、レンズ駆動ブロック104、絞り兼用シャッタ105、CCD106、垂直ドライバ107、TG(Timing Generator:タイミング発生回路)108、ユニット回路109、DMAコントローラ(以下、DMAという)110、CPU(Central Processing Unit:中央演算処理装置)111、キー入力部112、メモリ113、DRAM(Dynamic Random Access Memory)114、通信部115、DMA(Direct Memory Access)116、画像生成部117、DMA118、DMA119、表示部120、DMA121、圧縮伸張部122、DMA123、フラッシュメモリ124、バス125を備えている。
撮像レンズ102は、複数のレンズ群から構成されるフォーカスレンズ、ズームレンズを含む。
なお、レンズ駆動ブロック104は、図示しない駆動回路を含み、駆動回路はCPU111からの制御信号に従ってフォーカスレンズ、ズームレンズをそれぞれ光軸方向に移動させる。
補正レンズ103は、手ぶれによる像のブレを補正するためのレンズであり、補正レンズ103には、レンズ駆動ブロック104が接続されている。
レンズ駆動ブロック104は、Yaw(ヨー)方向及びPitch(ピッチ)方向に補正レンズ103を移動させることにより手ぶれを補正する。このレンズ駆動ブロック104には、ヨー方向及びピッチ方向に補正レンズ103を移動させるモータ、及びそのモータを駆動させるモータドライバから構成されている。
絞り兼用シャッタ105は、図示しない駆動回路を含み、駆動回路はCPU111から送られてくる制御信号に従って絞り兼用シャッタ105を動作させる。この絞り兼用シャッタ105は、絞り、シャッタとして機能する。
絞りとは、CCD106に入射される光の量を制御する機構のことをいい、シャッタとは、CCD106に光を当てる時間を制御する機構のことをいい、CCD106に光を当てる時間(露光時間)は、シャッタ速度によって変わってくる。
露出量は、この絞り値(絞りの度合い)とシャッタ速度によって定められる。
CCD106は、垂直ドライバ107によって走査駆動され、一定周期毎に被写体像のRGB(赤緑青)値の各色の光の強さを光電変換して撮像信号としてユニット回路109に出力する。この垂直ドライバ107、ユニット回路109の動作タイミングはTG108を介してCPU111によって制御される。
ユニット回路109には、TG108が接続されており、CCD106から出力される撮像信号を相関二重サンプリングして保持するCDS(Correlated Double Sampling)回路、そのサンプリング後の撮像信号の自動利得調整を行なうAGC(Automatic Gain Control)回路、その自動利得調整後のアナログ信号をデジタル信号に変換するA/D(アナログ/デジタル)変換器から構成されており、CCD106によって得られた撮像信号は、ユニット回路109を経た後、DMA110によってベイヤーデータの状態でバッファメモリ(DRAM114)に記憶される。
CPU111は、AE(Automatic Exposure:自動露出)処理、AF(Automatic Focus:自動焦点)処理などを行う機能を有すると共に、デジタルカメラ101の各部を制御するワンチップマイコンである。
特に、本実施形態では、CPU111は、後述する図2、図4、図12、および図13のフローチャートで示される画像分割処理を実行する。
キー入力部112は、半押し操作全押し操作可能なシャッタボタン、モード切替キー、十字キー、SETキー等の複数の操作キーや、タッチパネルを含み、ユーザのキー操作に応じた操作信号をCPU111に出力する。特に、本実施形態では、キー入力部112は、表示部120に表示される十字枠を移動させる操作キーを備える。
メモリ113には、後述する図2、図4、図12、および図13のフローチャートで示される画像分割処理をはじめとして、CPU111がデジタルカメラ101の各部を制御するのに必要な制御プログラム、及び必要なデータが記録されており、CPU111は、それらの制御プログラムに従い動作する。
DRAM114は、CCD106によって撮像された画像データを一時記憶するバッファメモリとして使用されるとともに、CPU111のワーキングメモリとしても使用される。
DMA116は、バッファメモリに記憶されたベイヤーデータの画像データを読み出して画像生成部117に出力するものである。
画像生成部117は、DMA116から送られてきた画像データに対して、画素補間処理、γ補正処理、ホワイトバランス処理などの処理を施すとともに、輝度色差信号(YUVデータ)の生成も行なう。つまり、画像処理を行う部分である。
DMA118は、画像生成部117で画像処理が行われた輝度色差信号の画像データ(YUVデータ)をバッファメモリに記憶させるものである。
DMA119は、バッファメモリに記憶されているYUVデータの画像データを表示部120に出力するものである。
表示部120は、カラーLCD(Liquid Crystal Display:液晶ディスプレイ)とその駆動回路を含み、DMA119から出力された画像データの画像を表示させる。
DMA121は、バッファメモリに記憶されているYUVデータの画像データや圧縮された画像データを圧縮伸張部122に出力したり、圧縮伸張部122により圧縮された画像データや、伸張された画像データをバッファメモリに記憶させたりするものである。
圧縮伸張部122は、画像データの圧縮・伸張(例えば、JPEGやMPEG形式の圧縮・伸張)を行なう部分である。
DMA123は、バッファッメモリに記憶されている圧縮画像データを読み出してフラッシュメモリ124に記録させたり、フラッシュメモリ124に記録された圧縮画像データをバッファメモリに記憶させるものである。
前述したように、CPU111は、メモリ113から、画像分割処理プログラムを読み出し実行する。この結果、例えばユーザが、撮像機構102〜110によって花などを撮像し、キー入力部112で後述するように十字枠による範囲指定をした画像範囲から、花などの主要被写体をそれ以外の背景から分割する画像領域分割処理が実行される。これにより得られた花などの主要被写体領域の画像データは、ユーザが例えば花の種類を検索するために、通信部115から特には図示しないインターネットを経由してインターネットに接続される画像検索サーバコンピュータに送信される。このコンピュータ上で、送られた主要被写体領域の花画像データに基づいて花のデータベースが検索される。その結果検索がヒットした花の図鑑情報が、その花の画像データとともにインターネットを経由して通信部115にて受信され、表示部120に表示される。
なお、上述の画像検索サーバコンピュータのデータベース機能は、デジタルカメラ101に内蔵されてもよい。
図2は、本実施形態による画像領域分割処理の全体動作を示すフローチャートである。このフローチャートの処理は、図4、図12および図13のフローチャートの処理とともに、図1のCPU111が、メモリ113に記憶された制御プログラムを実行する処理として実現される。
まず、CPU111は、十字枠の表示処理を実行する(図2のステップS201)。この処理では、ユーザが、例えば図1の撮像機構102〜110にて撮像し表示部120に表示されるシャッター全押し操作前のいわゆるスルー画像に対して、認識したい物体(例えば花)が存在するおおよその領域に対して、キー入力部112を用いて、十字枠によって範囲指定を行う。
図3(a)は、十字枠の説明図である。CPU111は、表示部120の、スルー画像内に所定の画素幅(数画素〜十数画素程度)を有する帯状の矩形領域301、302の2本が十字に交わって形成される十字枠を表示する。
次に、CPU111は、画角調整処理(画角調整手段の機能)を実行する(図2のステップS202)。ここでは、CPU111は、ユーザにキー入力部112と撮像レンズ102のズーム機構を操作させることにより、表示部120に表示されているスルー画像内の主要被写体である例えば花の領域がステップS201で表示させた十字枠に概略合うように画像の画角を調整させる。
より具体的には、図3(b)に示されるように、ユーザは、スルー画像内の花の領域の中央が十字枠の中心領域303に概略位置し、花の領域が十字枠の4方向端で囲まれる十字領域304に概略収まるように、撮像レンズ102をズームさせるとともに、キー入力部112によって十字枠を上下左右に動かしながら、スルー画像の画角を調整する。
次に、ユーザがキー入力部112のシャッタボタンを半押し撮影することにより、CPU111は、十字枠の中心領域303の画像情報を取得することにより、撮像機構102〜110を制御して、AE(自動露出)処理とAF(自動焦点)処理を実行する(図2のステップS203)。
その後、CPU111は、領域分割処理を実行する(図2のステップS204)。
図4は、図2のステップS204の領域分割処理を示すフローチャートである。
まず、CPU111は、データ項の更新1の処理を実行する(図4のステップS401)。
ここでは、図5に示されるように、CPU111は、表示部120に表示されている十字枠の中心領域303(図3参照)の画素領域を、絶対前景501に設定する。また、図5に示されるように、CPU111は、十字領域304(図3参照)を例えば縦横方向に2割拡大した領域の外側の画素領域を、絶対背景502と設定する。
絶対前景501とは、後述するGraph Cuts法におけるデータ項の前景コストを0、背景コストを最大値に設定することである。また、絶対背景502とは、そのデータ項の背景コストを0、前景コストを最大値に設定することである。
その他の画素領域503は、後述するように、主要被写体らしさを示す学習済みの第1のヒストグラムと、背景らしさを示す学習済みの第2のヒストグラムから設定する。
次に、CPU111は、収束判定処理(図4のステップS403)(制御手段の機能)により収束判定条件が成立するまで、領域分割処理(図4のステップS402)(領域分割手段の機能)とデータ項の更新2の処理(図4のステップS404)(ヒストグラム更新手段の機能)を繰り返し実行する。
まず、図4のステップS402では、領域分割処理が実行されることにより、例えば図6に示されるように、主要被写体領域である前景(主要被写体)の領域601とそれ以外の領域である背景の領域602が分割される。すなわち、前景が切抜きされる。
ここでは、例えばGraph Cuts法により、スルー画像内の各画素に付与する前景または背景を示す領域ラベルを更新しながら、その領域ラベルと各画素の画素値に基づき、前景を示す画像から算出した画素値ごとの第1のヒストグラムの値が大きいほど値が小さくなるコスト項と、背景を示す画像から算出した画素値ごとの第2のヒストグラムの値が大きいほど値が小さくなるコスト項を含むエネルギー関数の最小化処理により、画像内で前景と背景が領域分割される。
Graph Cuts法により領域分割処理の詳細については後述する。
一度領域分割処理が終了した後、収束判定が行われる(図4のステップS403)。この収束判定は、以下のいずれかが満たされたときに、YESの判定結果となる。
・繰り返し回数が一定以上になった
・前回前景とされた領域面積と今回前景とされた領域の差が一定以下になった
ステップS403の判定で収束せず、その判定がNOであった場合、前回のグラフカット処理の状況に応じて、ユーザが指定した十字枠領域矩形枠内の後述するコスト関数gv (Xv )が、次のようにして修正されてデータ更新される(図4のステップS404)。
CPU111は、表示部120に例えば図7(a)のように表示される画角が調整(図2のステップS202)され、領域分割(図4のステップS402で)が行われた、スルー画像上の十字枠領域304を拡大した図7(b)の領域において、十字枠内で背景に領域分割された背景十字枠領域701、702、703、および704を処理対象とする。
CPU111は、背景十字枠領域701、702、703、および704の各領域ごとに、前景らしいと判定される画素の割合を所定の複数種類の色(例えば10色)別に算出する。具体的には、CPU111は、背景十字枠領域701〜704の各領域内の画素ごとに、画素の彩度が所定の彩度閾値に比較して大きく、かつ画素の色に対応する前景らしさを示すヒストグラム(第1のヒストグラム)の値が所定のヒストグラム閾値に比較して大きい場合に、その画素が前景らしいと判定する。そして、CPU111は、その画素の色に対応する前景らしさの画素数を示す計数値をインクリメントし、各背景十字枠領域701〜704内で背景に領域分割された画素についての判定が終了した後に、その各領域内での色ごとの前景らしさの画素数を示す計数値をその領域内で背景に領域分割された画素の総数で除算して得られる値を、その領域内でのその色についての前景らしいと判定される画素の割合として算出する。
次に、CPU111は、複数種類の色のうち分割された背景十字枠領域701〜704のうちのいずれか2つ以上の領域で前景らしいと判定される画素の割合が所定の割合閾値に比較して大きくなる色について、その色に対する前景らしさを示すヒストグラムの値が大きくなるようにその値を更新する。
そして、CPU111は、更新された前景らしさを示すヒストグラム(第1のヒストグラム)と、背景らしさを示すヒストグラム(第2のヒストグラム)を用いて、図4のステップS402の領域分割処理を繰り返し実行させる。
上述したステップS404のデータ項の更新2の処理の詳細については、図13のフローチャートを用いて後述する。
図4のステップS403の判定が収束し、その判定がYESになると、図4のフローチャートで示される図2のステップS204の領域分割処理は終了とし、現在得られている前景領域が最終結果として出力される。
以上のようにして、ユーザは、十字枠を使った簡単な範囲指定操作で、最終的に精度よく花の領域を前景として切り抜くことが可能となる。
以下に、図4のステップS402の領域分割処理について、説明する。
いま、
を、要素Xv が画像Vにおける画素v(1≦v≦V)に対する領域ラベルを示す領域ラベルベクトルであるとする。この領域ラベルベクトルは、例えば、画素vが前景領域内にあれば要素Xv =0、背景領域内にあれば要素Xv =1となるバイナリベクトルである。すなわち、
である。
本実施形態において実行される領域分割処理は、画像Vにおいて、次式で定義されるエネルギー関数E(X)を最小にするような数1式の領域ラベルベクトルXを求める処理である。
エネルギー最小化処理が実行される結果、領域ラベルベクトルX上で領域ラベル値Xv =0となる画素vの集合として、前景領域が得られる。本実施形態の例でいえば、矩形枠内の花の領域である。なお、領域ラベルベクトルX上で領域ラベル値Xv =1となる画素vの集合が、背景領域(矩形枠外も含む)となる。
数3式のエネルギーを最小化するために、次式および図8で示される重み付き有向グラフ(以下「グラフ」と略す)を定義する。
ここで、Vはノード(node)、Eはエッジ(edge)である。このグラフが画像の領域分割に適用される場合は、画像の各画素が各ノードVに対応する。また、画素以外のノードとして、次式および図8中に示される、
と呼ばれる特殊なターミナルが追加される。このソースsを前景領域、シンクtを背景領域に対応付けて考える。また、エッジEは、ノードV間の関係を表現している。周辺の画素との関係を表したエッジEをn−link、各画素とソースs(前景領域に対応)またはシンクt(背景領域に対応)との関係を表したエッジEをt−linkと呼ぶ。
いま、ソースsと各画素に対応するノードとを結ぶ各t−linkを、各画素がどの程度前景領域らしいかを示す関係ととらえる。そして、その前景領域らしさを示すコスト値を、数3式第1項に対応付けて、
と定義する。ここで、θ(c、0)は、画像の前景の領域から算出したカラー画素値cごとのヒストグラム(出現回数)を示す関数データであり、例えば図9(a)に示されるように予め得られている。すなわち、θ(c、0)は、画像の前景らしさを示すヒストグラムである。なお、θ(c、0)の全カラー画素値cにわたる総和は1になるように正規化されているものとする。また、I(v)は、入力画像の各画素vにおけるカラー(RGB)画素値である。数6式において、θ(I(v)、0)の値が大きいほど、コスト値は小さくなる。これは、予め得られている前景領域のカラー画素値の中で出現回数が多いものほど、数6式で得られるコスト値が小さくなって、画素vが前景領域中の画素らしいことを意味し、数3式のエネルギー関数E(X)の値を押し下げる結果となる。
次に、シンクtと各画素に対応するノードとを結ぶ各t−linkを、各画素がどの程度背景領域らしいかを示す関係ととらえる。そして、その背景領域らしさを示すコスト値を、数3式第1項に対応付けて、
と定義する。ここで、θ(c、1)は、画像の背景の領域から算出したカラー画素値cごとのヒストグラム(出現度数)を示す関数データであり、例えば図9(b)に示されるように予め得られている。すなわち、θ(c、1)は、画像の背景らしさを示すヒストグラムである。なお、θ(c、1)の全カラー画素値cにわたる総和は1になるように正規化されているものとする。I(v)は、数6式の場合と同様に、入力画像の各画素vにおけるカラー(RGB)画素値である。数6式において、θ(I(v)、1)の値が大きいほど、コスト値は小さくなる。これは、予め得られている背景領域のカラー画素値の中で出現回数が多いものほど、数7式で得られるコスト値が小さくなって、画素vが背景領域中の画素らしいことを意味し、数3式のエネルギー関数E(X)の値を押し下げる結果となる。
次に、各画素に対応するノードとその周辺画素との関係を示すn−linkのコスト値を、数3式第2項に対応付けて、
と定義する。ここで、dist(u,v)は、画素vとその周辺画素uのユークリッド距離を示しており、κは所定の係数である。また、I(u)およびI(v)は、入力画像の各画素uおよびvにおける各カラー(RGB)画素値である。画素vおよびその周辺画素uの各領域ラベル値Xu およびXv が同一(Xu =Xv )となるように選択された場合における数8式のコスト値は0とされて、エネルギーE(X)の計算には影響しなくなる。一方、画素vとその周辺画素uの各領域ラベル値Xu およびXv が異なる(Xu ≠Xv )ように選択された場合における数8式のコスト値は、例えば図10に示される特性を有する関数特性となる。すなわち、画素vおよびその周辺画素uの各領域ラベル値Xu およびXv が異なっていて、かつ画素vおよびその周辺画素uのカラー画素値の差I(u)−I(v)が小さい場合には、数8式で得られるコスト値が大きくなる。この場合には、数3式のエネルギー関数E(X)の値が押し上げられる結果となる。言い換えれば、近傍画素間で、カラー画素値の差が小さい場合には、それらの画素の各領域ラベル値は、互いに異なるようには選択されない。すなわち、その場合には、近傍画素間では領域ラベル値はなるべく同じになって前景領域または背景領域はなるべく変化しないように、制御される。一方、画素vおよびその周辺画素uの各領域ラベル値Xu およびXv が異なっていて、かつ画素vおよびその周辺画素uのカラー画素値の差I(u)−I(v)が大きい場合には、数8式で得られるコスト値が小さくなる。この場合には、数3式のエネルギー関数E(X)の値が押し下げられる結果となる。言い換えれば、近傍画素間で、カラー画素値の差が大きい場合には、前景領域と背景領域の境界らしいことを意味し、画素vとその周辺画素uとで、領域ラベル値が異なる方向に制御される。
以上の定義を用いて、入力画像の各画素vごとに、数6式によって、ソースsと各画素vとを結ぶt−linkのコスト値(前景領域らしさ)が算出される。また、数7式によって、シンクtと各画素vとを結ぶt−linkのコスト値(背景領域らしさ)が算出される。さらに、入力画像の各画素vごとに、数8式によって、画素vとその周辺例えば8方向の各8画素とを結ぶ8本のn−linkのコスト値(境界らしさ)が算出される。
そして、理論的には、数1式の領域ラベルベクトルXの全ての領域ラベル値の0または1の組合せごとに、各領域ラベル値に応じて上記数6式、数7式、および数8式の計算結果が選択されながら数3式のエネルギー関数E(X)が計算される。そして、全ての組合せの中でエネルギー関数E(X)の値が最小となる領域ラベルベクトルXを選択することにより、領域ラベルベクトルX上で領域ラベル値Xv =0となる画素vの集合として、前景領域を得ることができる。
しかし実際には、領域ラベルベクトルXの全ての領域ラベル値の0または1の組合せ数は、2の画素数乗通りあるため、現実的な時間でエネルギー関数E(X)の最小化処理を計算することができない。
そこで、Graph Cuts法では、次のようなアルゴリズムを実行することにより、エネルギー関数E(X)の最小化処理を現実的な時間で計算することを可能にする。
図11は、上述した数6式、数7式で定義されるt−linkと数8式で定義されるn−linkを有するグラフと、領域ラベルベクトルXおよびグラフカットとの関係を、模式的に示した図である。図11では、理解の容易化のために、画素vは一次元的に示されている。
数3式のエネルギー関数E(X)の第1項の計算で、領域ラベルベクトルX中の領域ラベル値が0となるべき前景領域中の画素では、数6式と数7式のうち、前景領域中の画素らしい場合により小さな値となる数6式のコスト値のほうが小さくなる。従って、ある画素において、ソースs側のt−linkが選択されシンクt側のt−linkがカットされて(図11の1102のケース)、数6式を用いて数3式のE(X)の第1項が計算された場合に、その計算結果が小さくなれば、その画素の領域ラベル値としては0が選択される。そして、そのグラフカット状態が採用される。計算結果が小さくならなければ、そのグラフカット状態は採用されず、他のリンクの探索およびグラフカットが試みられる。
逆に、領域ラベルベクトルX中の領域ラベル値が1となるべき背景領域中の画素では、数6式と数7式のうち、背景領域中の画素らしい場合により小さな値となる数7式のコスト値のほうが小さくなる。従って、ある画素において、シンクt側のt−linkが選択されソースs側のt−linkはカットされて(図11の1103のケース)、数7式を用いて数3式のE(X)の第1項が計算された場合に、その計算結果が小さくなれば、その画素の領域ラベル値としては1が選択される。そして、そのグラフカット状態が採用される。計算結果が小さくならなければ、そのグラフカット状態は採用されず、他のリンクの探索およびグラフカットが試みられる。
一方、数3式のエネルギー関数E(X)の第1項の計算に係る上記グラフカット処理により、領域ラベルベクトルX中の領域ラベル値が0または1で連続すべき前景領域内部または背景領域内部の画素間では、数8式のコスト値が0となる。従って、数8式の計算結果は、エネルギー関数E(X)の第2項のコスト値の計算には影響しない。また、その画素間のn−linkは、数8式がコスト値0を出力するように、カットされずに維持される。
ところが、エネルギー関数E(X)の第1項の計算に係る上記グラフカット処理により、近傍画素間で、領域ラベル値が0と1の間で変化した場合に、それらの画素間のカラー画素値の差が小さければ、数8式のコスト値が大きくなる。この結果、数3式のエネルギー関数E(X)の値が押し上げられる。このようなケースは、同一領域内で第1項の値による領域ラベル値の判定がたまたま反転するような場合に相当する。従って、このようなケースでは、エネルギー関数E(X)の値が大きくなって、そのような領域ラベル値の反転は選択されない結果となる。また、この場合には、数8式の計算結果が、上記結果を維持するように、それらの画素間のn−linkは、カットされずに維持される。
これに対して、エネルギー関数E(X)の第1項の計算に係る上記グラフカット処理により、近傍画素間で、領域ラベル値が0と1の間で変化した場合に、それらの画素間のカラー画素値の差が大きければ、数8式のコスト値が小さくなる。この結果、数3式のエネルギー関数E(X)の値が押し下げられる。このようなケースは、それらの画素部分が前景領域と背景領域の境界らしいことを意味している。従って、このようなケースでは、これらの画素間で領域ラベル値を異ならせて、前景領域と背景領域の境界を形成する方向に制御される。また、この場合には、境界の形成状態を安定化するために、それらの画素間のn−linkがカットされて、数3式の第2項のコスト値が0にされる(図11の1104のケース)。
以上の判定制御処理が、ソースsのノードを起点にして、順次各画素のノードをたどりながら繰り返されることにより、図11の1101で示されるようなグラフカットが実行され、エネルギー関数E(X)の最小化処理が現実的な時間で計算される。この処理の具体的な手法としては、例えば、非特許文献1に記載されている手法を採用することができる。
そして、各画素ごとに、ソースs側のt−linkが残っていれば、その画素の領域ラベル値として0、すなわち前景領域の画素を示すラベルが付与される。逆に、シンクt側のt−linkが残っていれば、その画素の領域ラベル値として1、すなわち背景領域の画素を示すラベルが付与される。最終的に、領域ラベル値が0となる画素の集合として、前景領域が得られる。
図12は、上述した動作原理に基づく図4のステップS402の領域分割処理を示すフローチャートである。
まず、スルー画像から、カラー画素値I(V)が1つずつ読み込まれる(図12のステップS1201)。
次に、ステップS1201で読み込まれた画素が、図4のステップS401で設定された絶対背景502(図5参照)の領域の範囲内の画素であるか否かが判定される(図12のステップS1202)。
ステップS1202の判定がYESの場合には、前述した数6式、数7式、および数8式に基づいて、前景領域らしさを示すコスト値、背景領域らしさを示すコスト値、および境界らしさを示すコスト値が、それぞれ算出される(図12のステップS1203、S1204、およびS1205)。なお、θ(c、0)の初期値は、学習用に用意した複数枚(数百枚程度)の前景の領域から算出される。同様に、θ(c、1)の初期値は、学習用に用意した複数枚(数百枚程度)の背景の領域から算出される。
一方、ステップS1202の判定がNOの場合には、絶対背景502の領域には前景領域はないため、そこが前景領域と判定されないようにするために、前景領域らしさを示すコスト値gv (Xv )が、次式のように一定の大きな値Kとされる。
ここで、Kは、次式に示されるように、任意のピクセルの平滑化項の総和よりも大きい値を設定しておく(以上、図12のステップS1206)。
また、絶対背景502の領域が必ず背景領域と判定されるようにするために、背景領域らしさを示すコスト値gv (Xv )が、次式のように0とされる(図12のステップS1207)。
さらに、絶対背景502の領域は全て背景領域であるため、huv(Xu ,Xv )の値は0とされる(図12のステップS1208)。
以上の処理の後、画像内に処理すべき画素が残っているか否かが判定される(図12のステップS1209)。
処理すべき画素がありステップS1209の判定がYESならば、ステップS1201の処理に戻って、上記処理が繰り返される。
処理すべき画素がなくなりステップS1209の判定がNOになると、画像内の全ての画素について求まったコスト値を用いて、数3式のエネルギー関数E(X)が計算されながら、Graph Cutsアルゴリズムが実行され、前景と背景が領域分割される(ステップS1210)。
図13は、図4のステップS404のデータ項の更新2の処理を示すフローチャートである。
まず、CPU111は、スルー画像上の十字枠(図3の301、302)内の画素(この画素を「画素i」とする)を順次読み込む(図13のステップS1301)。
次に、CPU111は、画素iが図4のステップS402の領域分割処理により、背景に領域分割されているか否か、すなわち、図7(b)の背景十字枠領域701〜704のいずれかであるか否かを判定する(図13のステップS1302)。
なお、以下の処理は、図7(b)の背景十字枠領域701〜704のそれぞれの領域ごとに個別に実行される。
CPU111は、ステップS1302の判定がNOならば、ステップS1306に進んで、次の画素に対する処理が実行される。
CPU111は、ステップS1302の判定がYESならば、まず、背景の数を計数するためのカウンタ変数N(初期値はN=0)が+1される(図13のステップS1303)。
次に、CPU111は、その画素iに対して、前景らしいか否かの判定を行う(図13のステップS1304)。具体的には、CPU111は、画素iの彩度Sat(i)が所定の彩度閾値Sth以上であり、かつ画素iのカラー画素値c(i)(前述したI(v)に対応)に対応する前景らしさを示す前景らしさを示すヒストグラム(第1のヒストグラム)の値θ(c(i),0)が所定のヒストグラム閾値θth以上であるか否かを判定する。彩度が高いということはより花らしい傾向を示している。前景らしさを示すヒストグラムの値θ(c(i),0)が大きいということは、画素iのカラー画素値c(i)が前景の中に現れやすい傾向を示している。
なお、カラー画素値の種類は、適当なカラー数に縮退させて処理するのが望ましい。
CPU111は、ステップS1304の判定がNOならば、ステップS1306の次の画素のための処理に進む。
CPU111は、ステップS1304の判定がYESならば、画素iのカラー画素値c(i)に対応する前景らしいと判定された画素のうちカラー画素値がc(i)である画素数を計数するためのカウンタ変数nc(i)の値を+1する(図13のステップS1305)。
CPU111は、ステップS1305の処理の後、またはステップS1302またはS1304の判定がNOとなった後、次に処理すべき十字枠内の画素があるか否かを判定する(図13のステップS1306)。
CPU111は、次に処理すべき十字枠内の画素がまだありステップS1306の判定がYESの場合には、iを+1して画素iを1つ進める(図13のステップS1307)。そして、CPU111は、ステップS1301の処理に戻り、次の画素iに対して、上記ステップS1301からS1306までの処理を実行する。
CPU111は、次に処理すべき十字枠内の画素がなくなりステップS1306の判定がNOになった場合には、各カラー画素値cごとに、以下の処理を実行する。
CPU111は、カラー画素値cについて、そのカラー画素値cが前景らしいことを示す計数値nc をそれが属する背景十字枠領域(図7の701から704のいずれか)に対応する背景画素の総数Nで除算した結果を、その背景十字枠領域におけるそのカラー画素値cについての前景らしいと判定される画素の割合として算出する。そして、CPU111は、その割合が所定の割合閾値Rthよりも大きく、かつそのような条件が例えば図7の701、702、703,または704の4つのうちのいずれか2つ以上の背景十字枠領域に存在するか否かを判定する(以上、図13のステップS1308)。
CPU111は、ステップS1308の判定がNOならば、前景らしさを示すヒストグラムθ(c,0)は更新せずに、ステップS1312の次のカラー画素値の処理に進む。
CPU111は、ステップS1308の判定がYESならば、カラー画素値cに対応する前景らしさを示すヒストグラムθ(c,0)の値がより大きくなってより前景らしさを示すように、その値を更新する。
具体的には、CPU111は、まず、カラー画素値cに対応する前景らしさを示すヒストグラムθ(c,0)が背景らしさを示すヒストグラムθ(c,1)よりも大きいか否かを判定する(図13のステップS1309)。
CPU111は、図13のステップS1309がYESならば、いままでのカラー画素値cに対応する前景らしさを示すヒストグラムθ(c,0)の値を所定数倍、例えば2倍して、新たな前景らしさを示すヒストグラムθ(c,0)の値に設定する(図13のステップS1310)。
CPU111は、図13のステップS1309がNOならば、いままでのカラー画素値cに対応する背景らしさを示すヒストグラムθ(c,1)の値を所定数倍、例えば2倍して、新たな前景らしさを示すヒストグラムθ(c,0)の値に設定する(図13のステップS1311)。
CPU111は、ステップS1310またはS1311の処理の後、次のカラー画素値cがまだあるか否かを判定する(ステップS1312)。
CPU111は、まだ処理すべてきカラー画素値cがありステップS1312の判定がYESならば、cを+1してカラー画素値cを進める(図13のステップS1313)。その後、CPU111は、ステップS1308の処理に戻り、新たなカラー画素値cに対応する上述したステップS1308からS1312の前景らしさを示すヒストグラムθ(c,0)の更新処理を繰り返し実行する。
CPU111は、処理すべてきカラー画素値cがなくなりステップS1312の判定がNOになると、図13のフローチャートで示される図4のステップS404のデータ項の更新2の処理を終了する。
以上のようにして、図7の背景十字枠領域701〜704の各画素が前景らしいか否かに基づいて、数6式の計算で使用される前景らしさを示すヒストグラムθ(c,0)の値が更新されながら図4のステップS402の領域分割処理が繰り返し実行される。この結果、背景十字枠領域701〜704が例えば前景に含まれる領域であれば、その部分が正しく前景として領域分割されるように、処理を進めることが可能となる。
以上説明した本実施形態では、ユーザは十字枠という簡単な図形を使って例えば花の範囲を指定することが可能となり、同時に精度のよい領域分割処理を実現することが可能となるる。
また、前景らしさを示すヒストグラムθ(c,0)の更新処理において判定される領域は、図7の背景十字枠領域701〜704として示されるように狭い領域でよく、従って判定処理される画素iの数も少ないため、高速な演算処理が可能となる。
前景としては、花に限られず、様々なオブジェクトを採用することができる。
以上の実施形態に関して、更に以下の付記を開示する。
(付記1)
画像内で主要被写体と該主要被写体以外の背景を領域分割する装置であって、
主要被写体らしさを示す第1のヒストグラムと背景らしさを示す第2のヒストグラムを用いて、前記画像内で前記主要被写体と前記背景を領域分割する領域分割手段と、
前記画像内に所定の画素幅を有する帯状の矩形領域の2本が十字に交わって形成される十字枠を表示し、ユーザに前記画像内の主要被写体の領域が前記十字枠に概略合うように前記画像の画角を調整させる画角調整手段と、
該画角が調整された前記画像に対して前記領域分割手段による領域分割処理を実行した後、前記第1のヒストグラムを更新するヒストグラム更新手段と、
該更新された第1のヒストグラムおよび前記第2のヒストグラムを用いて、前記画像に対して前記領域分割手段による領域分割処理と前記ヒストグラム更新手段による前記第1のヒストグラムの更新処理を繰り返し実行させる制御手段と、
を備えることを特徴とする画像領域分割装置。
(付記2)
前記領域分割手段は、
前記画像内の各画素に付与する前記主要被写体または前記背景を示す領域ラベルを更新しながら、該領域ラベルと前記各画素の画素値に基づき、前記主要被写体を示す画像から算出した前記画素値ごとの第1のヒストグラムの値が大きいほど値が小さくなるコスト項と、前記背景を示す画像から算出した前記画素値ごとの第2のヒストグラムの値が大きいほど値が小さくなるコスト項を含むエネルギー関数の最小化処理により、前記画像内で前記主要被写体と前記背景を領域分割することを特徴とする付記1記載の画像領域分割装置。
(付記3)
前記ヒストグラム更新手段は、
前記画像の前記十字枠内で前記背景に領域分割された画素のうち前記主要被写体らしいと判定される画素の割合を所定の複数種類の色別に算出し、該複数種類の色のうちいずれか2つ以上の分割された十字枠領域で前記主要被写体らしいと判定される画素の割合が所定の閾値に比較して大きくなる色について、該色に対する前記第1のヒストグラムの値が大きくなるように該第1のヒストグラムを更新することを特徴とする付記1記載の画像領域分割装置。
(付記4)
前記画角調整手段は、ユーザに、前記画像内の主要被写体の領域の中央が前記十字枠の中心領域に概略位置し、前記主要被写体の領域が前記十字枠の4方向端で囲まれる十字領域に概略収まるように、前記画像の画角を調整させる、
ことを特徴とする付記1記載の画像領域分割装置。
(付記5)
前記ヒストグラム更新手段は、前記画像の前記十字枠内で前記背景に領域分割された画素について、該画素の彩度が所定の閾値に比較して大きく、かつ該画素の色に対応する前記第1のヒストグラムの値が所定の閾値に比較して大きい場合に、該画素が前記主要被写体らしいと判定し、該画素の色に対応する主要被写体らしさの画素数を示す計数値をインクリメントし、前記各十字枠領域内で前記背景に領域分割された画素についての判定が終了した後に、該各十字枠領域内での前記色ごとの前記主要被写体らしさの画素数を示す計数値を該十字枠領域内で前記背景に領域分割された画素の総数で除算して得られる値を、該十字枠領域内での該色についての前記主要被写体らしいと判定される画素の割合として算出する、
ことを特徴とする付記1ないし4のいずれかに記載の画像領域分割装置。
(付記6)
前記ヒストグラム更新手段は、前記色に対する前記第1のヒストグラムの値が大きくなるように該第1のヒストグラムを更新する場合に、該色に対する前記第1のヒストグラムの値が該色に対する前記第2のヒストグラムの値に比較して大きければ、該色に対する第1のヒストグラムの値を所定倍した値を該色に対する新たな第1のヒストグラムの値として更新し、該色に対する前記第1のヒストグラムの値が該色に対する前記第2のヒストグラムの値に比較して大きくなければ、該第2のヒストグラムの値を所定倍した値を該色に対する新たな第1のヒストグラムの値として更新する、
ことを特徴とする付記1ないし5のいずれかに記載の画像領域分割装置。
(付記7)
前記第1のヒストグラムの初期値は、学習用の複数枚の前記主要被写体を示す画像の前記画素値ごとのヒストグラムとして算出し、
前記第2のヒストグラムの初期値は、学習用の複数枚の前記背景を示す画像の前記画素値ごとのヒストグラムとして算出する、
ことを特徴とする付記1ないし6のいずれかに記載の画像領域分割装置。
(付記8)
前記領域分割手段は、Graph Cuts法により前記エネルギー関数の最小化処理を実行する、
ことを特徴とする付記1ないし7のいずれかに記載の画像領域分割装置。
(付記9)
画像内で主要被写体と該主要被写体以外の背景を領域分割する方法であって、
主要被写体らしさを示す第1のヒストグラムと背景らしさを示す第2のヒストグラムを用いて、前記画像内で前記主要被写体と前記背景を領域分割し、
前記画像内に所定の画素幅を有する帯状の矩形領域の2本が十字に交わって形成される十字枠を表示し、ユーザに、前記画像内の主要被写体の領域の中央が前記十字枠の中心領域に概略位置し、前記主要被写体の領域が前記十字枠の4方向端で囲まれる十字領域に概略収まるように、前記画像の画角を調整させ、
該画角が調整された前記画像に対して前記領域分割の処理を実行した後、前記第1のヒストグラムを更新し、
該更新された第1のヒストグラムおよび前記第2のヒストグラムを用いて、前記画像に対して前記領域分割の処理と前記第1のヒストグラムの更新処理を繰り返し実行させる、
ことを特徴とする画像領域分割方法。
(付記10)
画像内で主要被写体と該主要被写体以外の背景を領域分割するコンピュータに、
主要被写体らしさを示す第1のヒストグラムと背景らしさを示す第2のヒストグラムを用いて、前記画像内で前記主要被写体と前記背景を領域分割する領域分割ステップと、
前記画像内に所定の画素幅を有する帯状の矩形領域の2本が十字に交わって形成される十字枠を表示し、ユーザに前記画像内の主要被写体の領域が前記十字枠に概略合うように前記画像の画角を調整させる画角調整ステップと、
該画角が調整された前記画像に対して前記領域分割ステップによる領域分割処理を実行した後、前記第1のヒストグラムを更新するヒストグラム更新ステップと、
該更新された第1のヒストグラムおよび前記第2のヒストグラムを用いて、前記画像に対して前記領域分割ステップによる領域分割処理と前記ヒストグラム更新ステップによる前記第1のヒストグラムの更新処理を繰り返し実行させる制御ステップと、
を実行させるためのプログラム。
101 デジタルカメラ
102 撮像レンズ
103 補正レンズ
104 レンズ駆動ブロック
105 絞り兼用シャッタ
106 CCD
107 垂直ドライバ
108 TG(Timing Generator:タイミング発生回路)
109 ユニット回路
110、116、118、119、121、123 DMA(Direct Memory Access)コントローラ
111 CPU(Central Processing Unit:中央演算処理装置)
112 キー入力部
113 メモリ
114 DRAM(Dynamic Random Access Memory)
115 通信部
117 画像生成部
120 表示部
122 圧縮伸張部
124 フラッシュメモリ
125 バス
301、302 十字枠
303 十字枠の中心領域
304 十字枠領域
501 絶対前景
502 絶対背景
503 その他の領域
601 前景
602 背景
701、702、703、704 背景十字枠領域

Claims (8)

  1. 画像内で主要被写体と該主要被写体以外の背景を領域分割する装置であって、
    主要被写体らしさを示す第1のヒストグラムと背景らしさを示す第2のヒストグラムを用いて、前記画像内で前記主要被写体と前記背景を領域分割する領域分割手段と、
    前記画像内に所定の画素幅を有する帯状の矩形領域の2本が十字に交わって形成される十字枠を表示し、ユーザに前記画像内の主要被写体の領域の中央が前記十字枠の中心領域に位置し、前記主要被写体の領域が前記十字枠の4方向端で囲まれる十字領域に収まるように、前記画像の画角を調整させる画角調整手段と、
    該画角が調整された前記画像に対して前記領域分割手段による領域分割処理を実行した後、前記画像の前記十字枠内で前記背景に領域分割された画素のうち前記主要被写体らしいと判定される画素の割合を所定の複数種類の色別に算出し、該複数種類の色のうちいずれか2つ以上の分割された十字枠領域で前記主要被写体らしいと判定される画素の割合が所定の閾値に比較して大きくなる色について、該色に対する前記第1のヒストグラムの値が大きくなるように前記第1のヒストグラムを更新するヒストグラム更新手段と、
    該更新された第1のヒストグラムおよび前記第2のヒストグラムを用いて、前記画像に対して前記領域分割手段による領域分割処理と前記ヒストグラム更新手段による前記第1のヒストグラムの更新処理を繰り返し実行させる制御手段と、
    を備えることを特徴とする画像領域分割装置。
  2. 前記ヒストグラム更新手段は、前記画像の前記十字枠内で前記背景に領域分割された画素について、該画素の彩度が所定の閾値に比較して大きく、かつ該画素の色に対応する前記第1のヒストグラムの値が所定の閾値に比較して大きい場合に、該画素が前記主要被写体らしいと判定し、該画素の色に対応する主要被写体らしさの画素数を示す計数値をインクリメントし、前記各十字枠領域内で前記背景に領域分割された画素についての判定が終了した後に、該各十字枠領域内での前記色ごとの前記主要被写体らしさの画素数を示す計数値を該十字枠領域内で前記背景に領域分割された画素の総数で除算して得られる値を、該十字枠領域内での該色についての前記主要被写体らしいと判定される画素の割合として算出する、
    ことを特徴とする請求項に記載の画像領域分割装置。
  3. 前記ヒストグラム更新手段は、前記色に対する前記第1のヒストグラムの値が大きくなるように該第1のヒストグラムを更新する場合に、該色に対する前記第1のヒストグラムの値が該色に対する前記第2のヒストグラムの値に比較して大きければ、該色に対する第1のヒストグラムの値を所定倍した値を該色に対する新たな第1のヒストグラムの値として更新し、該色に対する前記第1のヒストグラムの値が該色に対する前記第2のヒストグラムの値に比較して大きくなければ、該第2のヒストグラムの値を所定倍した値を該色に対する新たな第1のヒストグラムの値として更新する、
    ことを特徴とする請求項1又は2に記載の画像領域分割装置。
  4. 前記領域分割手段は、
    前記画像内の各画素に付与する前記主要被写体または前記背景を示す領域ラベルを更新しながら、該領域ラベルと前記各画素の画素値に基づき、前記主要被写体を示す画像から算出した前記画素値ごとの第1のヒストグラムの値が大きいほど値が小さくなるコスト項と、前記背景を示す画像から算出した前記画素値ごとの第2のヒストグラムの値が大きいほど値が小さくなるコスト項を含むエネルギー関数の最小化処理により、前記画像内で前記主要被写体と前記背景を領域分割することを特徴とする請求項1ないし3のいずれかに記載の画像領域分割装置。
  5. 前記第1のヒストグラムの初期値は、学習用の複数枚の前記主要被写体を示す画像の前記画素値ごとのヒストグラムとして算出し、
    前記第2のヒストグラムの初期値は、学習用の複数枚の前記背景を示す画像の前記画素値ごとのヒストグラムとして算出する、
    ことを特徴とする請求項記載の画像領域分割装置。
  6. 前記領域分割手段は、Graph Cuts法により前記エネルギー関数の最小化処理を実行する、
    ことを特徴とする請求項4又は5に記載の画像領域分割装置。
  7. 画像内で主要被写体と該主要被写体以外の背景を領域分割する方法であって、
    主要被写体らしさを示す第1のヒストグラムと背景らしさを示す第2のヒストグラムを用いて、前記画像内で前記主要被写体と前記背景を領域分割し、
    前記画像内に所定の画素幅を有する帯状の矩形領域の2本が十字に交わって形成される十字枠を表示し、ユーザに、前記画像内の主要被写体の領域の中央が前記十字枠の中心領域に位置し、前記主要被写体の領域が前記十字枠の4方向端で囲まれる十字領域に収まるように、前記画像の画角を調整させ、
    該画角が調整された前記画像に対して前記領域分割の処理を実行した後、前記画像の前記十字枠内で前記背景に領域分割された画素のうち前記主要被写体らしいと判定される画素の割合を所定の複数種類の色別に算出し、該複数種類の色のうちいずれか2つ以上の分割された十字枠領域で前記主要被写体らしいと判定される画素の割合が所定の閾値に比較して大きくなる色について、該色に対する前記第1のヒストグラムの値が大きくなるように記第1のヒストグラムを更新し、
    該更新された第1のヒストグラムおよび前記第2のヒストグラムを用いて、前記画像に対して前記領域分割の処理と前記第1のヒストグラムの更新処理を繰り返し実行させる、
    ことを特徴とする画像領域分割方法。
  8. 画像内で主要被写体と該主要被写体以外の背景を領域分割するコンピュータに、
    主要被写体らしさを示す第1のヒストグラムと背景らしさを示す第2のヒストグラムを用いて、前記画像内で前記主要被写体と前記背景を領域分割する領域分割ステップと、
    前記画像内に所定の画素幅を有する帯状の矩形領域の2本が十字に交わって形成される十字枠を表示し、ユーザに前記画像内の主要被写体の領域の中央が前記十字枠の中心領域に位置し、前記主要被写体の領域が前記十字枠の4方向端で囲まれる十字領域に収まるように、前記画像の画角を調整させる画角調整ステップと、
    該画角が調整された前記画像に対して前記領域分割ステップによる領域分割処理を実行した後、前記画像の前記十字枠内で前記背景に領域分割された画素のうち前記主要被写体らしいと判定される画素の割合を所定の複数種類の色別に算出し、該複数種類の色のうちいずれか2つ以上の分割された十字枠領域で前記主要被写体らしいと判定される画素の割合が所定の閾値に比較して大きくなる色について、該色に対する前記第1のヒストグラムの値が大きくなるように前記第1のヒストグラムを更新するヒストグラム更新ステップと、
    該更新された第1のヒストグラムおよび前記第2のヒストグラムを用いて、前記画像に対して前記領域分割ステップによる領域分割処理と前記ヒストグラム更新ステップによる前記第1のヒストグラムの更新処理を繰り返し実行させる制御ステップと、
    を実行させるためのプログラム。
JP2013053238A 2013-03-15 2013-03-15 画像領域分割装置、方法、およびプログラム Expired - Fee Related JP5846144B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013053238A JP5846144B2 (ja) 2013-03-15 2013-03-15 画像領域分割装置、方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013053238A JP5846144B2 (ja) 2013-03-15 2013-03-15 画像領域分割装置、方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2014178950A JP2014178950A (ja) 2014-09-25
JP5846144B2 true JP5846144B2 (ja) 2016-01-20

Family

ID=51698816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013053238A Expired - Fee Related JP5846144B2 (ja) 2013-03-15 2013-03-15 画像領域分割装置、方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5846144B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012058952A (ja) * 2010-09-08 2012-03-22 Olympus Imaging Corp 類似画像検索装置、カメラ、類似画像検索方法、およびプログラム

Also Published As

Publication number Publication date
JP2014178950A (ja) 2014-09-25

Similar Documents

Publication Publication Date Title
KR102277048B1 (ko) 미리보기 사진 블러링 방법 및 장치 및 저장 매체
US9288392B2 (en) Image capturing device capable of blending images and image processing method for blending images thereof
JP4862930B2 (ja) 画像処理装置、画像処理方法及びプログラム
US8472747B2 (en) Image composition device, image composition method, and storage medium storing program
JP4947136B2 (ja) 画像処理装置、画像処理方法及びプログラム
US20180293735A1 (en) Optical flow and sensor input based background subtraction in video content
JP6198389B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
JP5673624B2 (ja) オブジェクト検索装置、方法、およびプログラム
JP2010183460A (ja) 撮像装置およびその制御方法
US20220318958A1 (en) Image processing apparatus and image processing method
JP5846144B2 (ja) 画像領域分割装置、方法、およびプログラム
JP2023090492A (ja) 画像処理装置および画像処理方法、撮像装置
JP5131399B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2014119725A (ja) 露出、焦点制御装置、方法、およびプログラム
JP2017130106A (ja) データ処理装置、撮像装置、およびデータ処理方法
JP5375420B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP5287965B2 (ja) 画像処理装置、画像処理方法及びプログラム
US11843867B2 (en) Imaging apparatus, imaging method, and storage medium for correcting brightness of an image based on a predetermined value of exposure
JP6044130B2 (ja) 画像領域分割装置、方法、およびプログラム
JP2017182668A (ja) データ処理装置、撮像装置、及びデータ処理方法
JP5962491B2 (ja) 画角調整装置、方法、およびプログラム
JP6003383B2 (ja) 画像処理装置、撮像装置、および画像処理プログラム
US8818094B2 (en) Image processing apparatus, image processing method and recording device recording image processing program
JP5789330B2 (ja) 撮像装置およびその制御方法
WO2019013215A1 (ja) 補正装置、撮像装置、補正装置の制御方法、および制御プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140929

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151027

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151109

R150 Certificate of patent or registration of utility model

Ref document number: 5846144

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees