JP2013120498A - シルエット補正方法及びシルエット補正システム - Google Patents

シルエット補正方法及びシルエット補正システム Download PDF

Info

Publication number
JP2013120498A
JP2013120498A JP2011268287A JP2011268287A JP2013120498A JP 2013120498 A JP2013120498 A JP 2013120498A JP 2011268287 A JP2011268287 A JP 2011268287A JP 2011268287 A JP2011268287 A JP 2011268287A JP 2013120498 A JP2013120498 A JP 2013120498A
Authority
JP
Japan
Prior art keywords
pixel
person
pixels
background
color information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011268287A
Other languages
English (en)
Other versions
JP5816069B2 (ja
Inventor
Katsuhiko Ueda
勝彦 植田
Yoshiaki Shirai
良明 白井
Nobutaka Shimada
伸敬 島田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Rubber Industries Ltd
Dunlop Sports Co Ltd
Original Assignee
Sumitomo Rubber Industries Ltd
Dunlop Sports Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Rubber Industries Ltd, Dunlop Sports Co Ltd filed Critical Sumitomo Rubber Industries Ltd
Priority to JP2011268287A priority Critical patent/JP5816069B2/ja
Priority to US13/707,218 priority patent/US8824787B2/en
Priority to KR1020120142374A priority patent/KR101982352B1/ko
Priority to CN201210556368.7A priority patent/CN103150720B/zh
Publication of JP2013120498A publication Critical patent/JP2013120498A/ja
Application granted granted Critical
Publication of JP5816069B2 publication Critical patent/JP5816069B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

【課題】人物と背景とのラベル付けを補正して精度の良い人物のシルエットを得る。
【解決手段】人物又は背景にラベル付けされて人物のシルエットが抽出されたフレームについて、対象領域のピクセルのラベル付けを変更してシルエットを補正する方法である。対象領域に含まれるピクセルのうち、人物にラベル付けされたピクセルを用いて人物ヒストグラムを作成するステップと、背景にラベル付けされたピクセルを用いて背景ヒストグラムを作成するステップと、各ピクセルの人物の色情報に対する類似度及び背景の色情報に対する類似度をそれぞれ表す第1の接続コストを計算するステップと、対象領域の各ピクセルについて、隣接するピクセルとの差分値を用いて隣接ピクセル間の色情報の連続性を表す第2の接続コストを計算するステップと、第1及び第2の接続コストの和が最小となるカットに基づいて対象領域のピクセルのラベル付けをやり直す補正ステップとを含む。
【選択図】図1

Description

本発明は、人物と背景とが撮影されたフレームの各ピクセルを、人物又は背景のいずれかに正しくラベル付けして精度の良い人物のシルエットを抽出するのに役立つシルエット補正方法及びシルエット補正システムに関する。
ゴルフの技量向上のためには、適切なゴルフスイングの習得が重要である。このような目的のために、ゴルフスイングする人物の動画を撮影し、この動画から例えばアドレスやトップの状態のフレーム(静止画)を取り出し、各フレームを画像処理してゴルファのシルエットを抽出し、該シルエットに基づいてスイング診断する試みがなされている。この例のように、人物と背景とが撮影されたフレームから、人物のシルエットだけを抽出したい場合が多々ある。
人物と背景とが撮影されたフレームから人物のシルエットだけを抽出する場合、フレーム中の各ピクセルが、人物又は背景にラベル付けされる。そして、人物にラベル付けされたピクセルだけを表示することにより、前記シルエットを得ることができる。このような方法について、本件出願人は、すでに下記特許文献1を提案している。
特開2011−78069号公報
上記特許文献の技術では、それなりの精度が確保されてはいるが、人物のシルエットにノイズが含まれているという問題がある。
本発明は、以上のような問題点に鑑み案出されたもので、ラベル付けされたピクセルを補正することにより、シルエット等に含まれるノイズを減らすことができるシルエット補正方法及びシルエット補正システムを提供することを主たる目的としている。
本発明のうち請求項1記載の発明は、人物と背景とが撮影されたフレームの各ピクセルが、人物又は背景のいずれかにラベル付けされて前記人物のシルエットが抽出されたフレームについて、前記フレームの少なくとも一部の対象領域のピクセルの前記ラベル付けを変更してシルエットを補正するシルエット補正方法であって、前記対象領域に含まれるピクセルのうち、人物にラベル付けされたピクセルを用いて、頻度をピクセル数としかつ階級をピクセルの色情報とした人物ヒストグラムを作成するステップと、前記対象領域に含まれるピクセルのうち、背景にラベル付けされたピクセルを用いて、頻度をピクセル数としかつ階級をピクセルの色情報とした背景ヒストグラムを作成するステップと、前記対象領域の各ピクセルの色情報と、前記人物ヒストグラム及び背景ヒストグラムとを用いて、各ピクセルの人物の色情報に対する類似度及び背景の色情報に対する類似度をそれぞれ表す第1の接続コストを計算するステップと、前記対象領域の各ピクセルについて、隣接するピクセルとの差分値を用いて隣接ピクセル間の色情報の連続性を表す第2の接続コストを計算するステップと、前記各ピクセルを節点としかつ前記第1の接続コスト及び第2の接続コストを枝として生成されたグラフを、第1の接続コスト及び第2の接続コストの和が最小となるように2分割するカットを計算し、該カットに基づいて前記対象領域のピクセルのラベル付けをやり直す補正ステップとを含むことを特徴とする。
また請求項2記載の発明は、前記第1の接続コストは、下式で計算されることを特徴とする。
Ph(I)(x,y)=nh(I)(C(I)(x,y))×λ/th
Pb(I)(x,y)=nb(I)(C(I)(x,y))×λ/tb
ただし、符号は、次の通りである。
Ph(I)(x,y):座標x,yかつ色情報(I)を有するピクセルの人物の色情報に対する第1の接続コスト
nh(I)(C(I)(x,y)):人物ヒストグラムにおいて対象ピクセルの色情報C(I)(x,y)を有するピクセルの頻度
th:対象領域内で人物にラベル付けされたピクセルの総数
Pb(I)(x,y):座標x,yかつ色情報(I)を有するピクセルの背景の色情報に対する第1の接続コスト
nb(I)(C(I)(x,y)):背景ヒストグラムにおいて対象ピクセルの色情報C(I)(x,y)を有するピクセルの頻度
tb:対象領域内で背景にラベル付けされたピクセルの総数
λ:定数
また請求項3記載の発明は、前記第2の接続コストは、下式で計算されることを特徴とする。
Pd=k×ε/Dp
Pd:対象のピクセルの第2の接続コスト
k:定数
ε:定数であり、対象のピクセルが人物のシルエットの境界に位置するピクセルである場合は0よりも大かつ1よりも小の数、それ以外のピクセルである場合は1
Dp:対象のピクセルとその周囲のピクセルとの差分値
また請求項4記載の発明は、背景から人物にラベル付けが変更されたピクセルについては、前記ピクセルの頻度nb(I)(C(I)(x,y))に1よりも大きい定数を乗じて背景の色情報に対する類似度を高めて、再度、第1及び第2の接続コストを計算して前記補正ステップを行うことを特徴とする。
また請求項5記載の発明は、前記補正ステップ前のシルエットと、前記補正ステップ後のシルエットとの論理積画像を表示するステップをさらに含むことを特徴とする。
また請求項6記載の発明は、人物と背景とが撮影されたフレームの各ピクセルが、人物又は背景のいずれかにラベル付けされて前記人物のシルエットが抽出されたフレームについて、前記フレームの少なくとも一部の対象領域のピクセルの前記ラベル付けを変更してシルエットを補正するシルエット補正システムであって、前記フレームのピクセル情報を記憶するメモリ、及び、演算部を具え、前記演算部は、前記対象領域に含まれるピクセルのうち、人物にラベル付けされたピクセルを用いて、頻度をピクセル数としかつ階級をピクセルの色情報とした人物ヒストグラムを作成する人物ヒストグラム作成部と、前記対象領域に含まれるピクセルのうち、背景にラベル付けされたピクセルを用いて、頻度をピクセル数としかつ階級をピクセルの色情報とした背景ヒストグラムを作成する背景ヒストグラム作成部と、前記対象領域の各ピクセルの色情報と、前記人物ヒストグラム及び背景ヒストグラムとを用いて、各ピクセルの人物の色情報に対する類似度及び背景の色情報に対する類似度をそれぞれ表す第1の接続コストを計算する第1の接続コスト計算部と、前記対象領域の各ピクセルについて、隣接するピクセルとの差分値を用いて隣接ピクセル間の色情報の連続性を表す第2の接続コストを計算する第2の接続コスト計算部と、前記各ピクセルを節点としかつ前記第1の接続コスト及び第2の接続コストを枝として生成されたグラフを、第1の接続コスト及び第2の接続コストの和が最小となるように2分割するカットを計算し、該カットに基づいて前記対象領域のピクセルのラベル付けをやり直す補正部とを含むことを特徴とする。
本発明では、人物と背景とが撮影されたフレームの各ピクセルが、人物又は背景のいずれかにラベル付けされて前記人物のシルエットが抽出された後、前記フレームの少なくとも一部の対象領域のピクセルの前記ラベル付けを変更してシルエットを補正する補正ステップが行われる。
前記補正ステップに先立ち、各ピクセルについて、2つの接続コストを計算するステップが行われる。前記2つの接続コストは、各ピクセルの人物の色情報に対する類似度及び背景の色情報に対する類似度をそれぞれ表す第1の接続コストと、隣接ピクセル間の色情報の連続性を表す第2の接続コストとを含んでいる。そして、補正ステップでは、各ピクセルを節点としかつ第1の接続コスト及び第2の接続コストを枝としてグラフを生成し、前記グラフを、2分割するカットが計算される。該カットは、前記グラフにおいて、第1の接続コスト及び第2の接続コストの和を最小とするものである。そして、該カットに基づいて前記対象領域のピクセルのラベル付けがやり直される。
以上の処理により、本発明では、人物の色情報に対する類似度が低く、かつ、隣接するピクセル間で連続性が低いピクセルが一方のカットへ、背景の色情報に対する類似度が低く、かつ、隣接するピクセル間で連続性が低いピクセルが他方のカットへと区分される。従って、本発明によれば、先に得られたラベル付けに含まれていたノイズを低減させ、シルエット抽出の正確性が高められる。
人物と背景とが撮影されたフレームの一例を示す。 図1のフレームを前処理して得られた人物のシルエットの一例である。 本実施形態のシルエット抽出システムの概念図である。 演算部のブロック図である。 本実施形態のシルエット抽出方法のフローチャートである。 フレームの対象領域を説明する線図である。 本実施形態の人物ヒストグラムである。 本実施形態の背景ヒストグラムである。 第1の接続コストを説明するヒストグラムである。 フレーム内のピクセルの平面配列図である。 第2の接続コストを説明するための3×3のピクセル配列図を用いたグラフである。 グラフのカットを説明する線図である。 最終処理のフローチャートである。 実施例1の原画像である。 図14の人物のシルエットであり、(a)は前処理だけをしたもの、(b)はその補正後のものである。 実施例2の原画像である。 図16の人物のシルエットであり、(a)は前処理だけをしたもの、(b)は補正後のものである。
以下、本発明の実施の一形態が図面に基づき説明される。
図1には、ゴルフクラブを持ってアドレスした状態にある人物hと、ゴルフ練習場の背景bとが一緒に撮影された二次元の画像のフレームF1が示されている。このフレームF1は、例えば、デジタルスチルカメラによる撮像、又は動画からのフレーム出力によって作成される。
前記フレームF1は、各々色情報を持ったピクセルの集合体である。このようなフレームF1に対して、例えば、前記特許文献1に記載されるシルエット抽出方法のような画像処理が施される(以下、このような画像処理を「前処理」ということがある。)。これにより、フレームF1の各ピクセルは、人物h又は背景bのいずれかのラベルが付される。
図2には、人物hにラベル付けされたピクセルのみを黒で表示したフレームF2が示される。このように、人物hと背景bとが一緒に撮影されたフレームF1から、アドレス状態の人物hのシルエットSを抽出することができる。この人物のシルエットSは、例えばスイング診断などに用いられる。なお、前処理は、上記特許文献1の方法のみならず、種々の方法が採用され得る。
図2に例示されるように、前記シルエットSには、背景bの一部がノイズNとして含まれ得る。また、人物hとしてラベル付けされるべきピクセルが、背景bにラベル付けされる場合もあり、これもノイズである。本発明では、人物のシルエットSが抽出されたフレームF2について、該フレームFの少なくとも一部の対象領域のピクセルの前記ラベル付けを変更してシルエットを正しい形に補正するものである。
本発明を実施するシルエット補正システムは、図3に示されるように、本質的にはコンピュータ1で構成され、演算部2、メモリ3、及び記憶部4を含む。
前記メモリ3は、例えばRAM等が用いられる。前記記憶部には、磁気ディスク等の不揮発性の記憶媒体が用いられる。
前記演算部2は、各種の計算を行うもので、例えばCPUが用いられる。また、図4に示されるように、演算部2は、人物ヒストグラム作成部2a、背景ヒストグラム作成部2b、第1の接続コスト計算部2c、第2の接続コスト計算部2d、及び、補正部2eを含む。
図5には、本実施形態のシステム1によって行われるシルエット補正方法の処理手順が記載される。なお、先に説明されたように、前処理として、フレームの各ピクセルについて、人物又は背景の一回目のラベル付けが既に完了しているものとする。また、本実施形態では、スイング診断のために、より精度の高いゴルファのシルエットを得ることを目的としている。
本実施形態では、先ず、対象となるフレームF2に、補正を行う対象領域が設定される(ステップS1)。本実施形態では、図6に示されるように、3つの対象領域A乃至Cが設定される。これらの3つの対象領域A乃至Cは、概ね、ピクセルの輝度や色相といった色情報が類似しているものをまとめて一つの領域として決定されるのが望ましい。この設定は、ユーザによって適宜入力される。
本実施形態において、前記対象領域Aは、フレームの上側の領域である。この領域Aは、フレームのy座標値が一定値以下(この実施形態ではya以下)のピクセルが対象となる。この対象領域Aは、人物hの上半身と、背景bのうちの遠視野部分とを多く含む。
本実施形態において、前記対象領域Bは、対象領域Aの下方の領域かつ対象領域Cを除く部分である。この領域は、背景Bの近視野部分をより多く含む領域である。
前記対象領域Cは、人物hの足元周辺を含む矩形の領域である。該領域は、ピクセルの座標を指定することにより設定される。
そして、上記各対象領域A乃至Cについて、以降の処理がそれぞれ独立して行われる。なお、対象領域をどのように設定するかは、任意であり、上記の例以外にも、フレームに表れるシルエットSに応じて種々設定されるのは言うまでもない。また、対象領域は、補正したい範囲として、フレームF2の全域であっても良いし、ノイズNが多く含まれる特定の領域だけであっても良い。
次に、演算部2の人物ヒストグラム作成部2aが、前記対象領域A乃至Cそれぞれについて、人物hにラベル付けされたピクセルだけを用いて、人物ヒストグラムNhを作成する(ステップS2)。
図7には、人物ヒストグラムNhの一例が示される。この人物ヒストグラムNhは、頻度をピクセル数とし、かつ、階級をピクセルの色情報としたものである。ヒストグラムの色情報(I)には、輝度、HSV又はRGBなど、色を定量化しうる種々のパラメータが用いられる。なお、フレームF2のピクセルには、このような色情報が含まれていない。従って、人物ヒストグラムは、図1に示したように、シルエットSが抽出された元のフレームF1の原画像のピクセルの色情報を用いて作成される。また、図7から明らかなように、人物ヒストグラムNhは、各対象領域A乃至Cそれぞれについて作成される。即ち、図7の曲線Aは対象領域Aの人物ヒストグラム、曲線Bは対象領域Bの人物ヒストグラム、曲線Cは対象領域Cの人物ヒストグラムをそれぞれ示す。
次に、演算部2の背景ヒストグラム作成部2bが、前記対象領域A乃至Cそれぞれについて、背景bにラベル付けされたピクセルだけを用いて、背景ヒストグラムNbを作成する(ステップS2)。
図8には、背景ヒストグラムNbの一例が示される。この背景ヒストグラムNbは、人物ヒストグラムNh同様、頻度をピクセル数とし、かつ、階級をピクセルの色情報としたものである。また、背景ヒストグラムの色情報(I)には、輝度、HSV又はRGB、など、種々のパラメータが用いられる。なお、フレームF2のピクセルには、このような色情報が含まれていない。従って、背景ヒストグラムNhも、シルエットSが抽出された元のフレームF1の原画像のピクセルの色情報を用いて作成される。また、図8から明らかなように、背景ヒストグラムNhも、各対象領域A乃至Cそれぞれについて作成される。即ち、図8の曲線Aは対象領域Aの背景ヒストグラム、曲線Bは対象領域Bの背景ヒストグラム、曲線Cは対象領域Cの背景ヒストグラムをそれぞれ示す。
なお、図7及び図8の人物ヒストグラムNh及び背景ヒストグラムNbは、いずれも平滑化処理が施されているが、この処理は任意である。また、ヒストグラムの階級の色情報(I)としてHSV等の色情報(H,S,V)が採用された場合、ヒストグラムの曲線は、その構成要素であるH(色相)、S(彩度)、V(明度)のパラメータ毎に作成される。
次に、演算部2の第1の接続コスト計算部2cにより、対象領域の各ピクセルについて、第1の接続コストPh及びPbが計算される(ステップS3)。
第1の接続コストPh及びPbとは、対象領域の各ピクセルの色情報(I)と、人物ヒストグラムNh及び背景ヒストグラムNbとを用い、各ピクセルの人物の色情報に対する類似度及び背景の色情報に対する類似度をそれぞれ表すパラメータである。つまり、一つのピクセルについて2つの第1の接続コストPh及びPbが計算される。該第1の接続コストは、本実施形態では、下式を用いて計算される。
Ph(I)(x,y)=nh(I)(C(I)(x,y))×λ/th
Pb(I)(x,y)=nb(I)(C(I)(x,y))×λ/tb
ただし、符号は、次の通りである。
Ph(I)(x,y):座標x,yかつ色情報(I)を有するピクセルの人物の色情報に対する第1の接続コスト
nh(I)(C(I)(x,y)):人物ヒストグラムにおいて対象ピクセルの色情報C(I)(x,y)を有するピクセルの頻度
th:対象領域内で人物にラベル付けされたピクセルの総数
Pb(I)(x,y):座標x,yかつ色情報(I)を有するピクセルの背景の色情報に対する第1の接続コスト
nb(I)(C(I)(x,y)):背景ヒストグラムにおいて対象ピクセルの色情報C(I)(x,y)を有するピクセルの頻度
tb:対象領域内で背景にラベル付けされたピクセルの総数
λ:定数で本実施形態では10000
図9には、このような第1の接続コストを解説するための人物又は背景ヒストグラムが示される。判定対象となっているピクセルの階級がa、その頻度がbの場合、そのピクセルの第1の接続コストは、人物の色情報に対するものではPh=b・λ/thで、背景の色情報に対するものではPb=b・λ/tbでそれぞれ計算される。階級がcの場合、頻度はbmaxとなり、第1の接続コストは最大値をとる。
第1の接続コストは、任意のピクセルについて、人物(又は背景)の色情報との類似度を表す。つまり、第1の接続コストが大きいほど、そのピクセルの色情報が、人物(又は背景)のヒストグラムにおいて最頻度の色に近くなる。逆に言えば、第1の接続コストが小さいピクセルほど、人物(又は背景)のヒストグラムにおいて最頻度の色から遠ざかり、人物又は背景)、ノイズの可能性が高まる。なお、計算された第1の接続コストの各値は、例えば、メモリ3又は記憶部4に記憶される。
次に、演算部2の第2の接続コスト計算部2dにより、対象領域の各ピクセルについて、第2の接続コストPdが計算される(ステップS4乃至S7)。
第2の接続コストPdは、対象領域の各ピクセルについて、隣接するピクセルとの差分値を用いて隣接ピクセル間の色情報の連続性を表すパラメータである。本実施形態では、対象ピクセルの第2の接続コストPdは、下式で計算される(ステップS6、S7)。
Pd=k×ε/Dp …(3)
Dp:対象のピクセルと隣接するピクセルとの色の差分値(≠0)
k:定数で本実施形態では10000
ε:定数であり、対象のピクセルが人物のシルエットの境界に位置するピクセルである場合は0よりも大かつ1よりも小の数で本実施形態では0.5、それ以外のピクセルである場合は1とする
前記隣接するピクセルとの色の差分値Dpは、隣接するピクセル間の色距離で計算される。図10に示されるように、対象ピクセルがC0の場合、該対象ピクセルC0と上、右、下及び左で隣接する4つのピクセルC1乃至C4についての差分値Dp1乃至Dp4の4つが計算される。
Dp1(C0、C1)
Dp2(C0、C2)
Dp3(C0、C3)
Dp4(C0、C4)
例えば、ピクセルの色情報(I)がHSVである場合、一方のピクセルの色相H1、彩度S1、明度V1の色ベクトルをC1とし、他方のピクセルの色相H2、彩度S2、明度V2の色ベクトルをC2とすると、それらの色距離D(C1,C2)は、下式で計算される。
D(C1,C2)=aΔH’+bΔS’+cΔV’
上記式において、符号は次の通りである。
a,b,c:定数で、本実施形態ではa=5.1、b=2.25及びc=2.65
ΔH’=ΔH/4.0
ΔS’=ΔS/2.0
ΔV’=ΔV/2.0
ΔH=√{(X1−X22+(Y1−Y22
ΔS=|S1/100−S2/100|
ΔV=|V1/100−V2/100|
1=S'avgcos(H1×3.6)
1=S'avgsin(H1×3.6)
2=S'avgcos(H2×3.6)
2=S'avgsin(H2×3.6)
S'avg=(S1'+S2')/2
1'=log10(S1/100×99+1.0)
2'=log10(S2/100×99+1.0)
また、本発明では、背景と人物との境界を計算するステップ(カットを計算するステップ)を含んでいる(後述)。このため、第2の接続コストは、色の連続性が低いほど、その値が小さくなるように調整されることが計算上望ましい。本実施形態においては、このような観点より、第2の接続コストの計算には、前記色距離が逆数として用いられる。これにより、隣接するピクセルとの色距離が大きいピクセル、換言すれば、人物と背景との境目にあると考えられるピクセルほど、第2の接続コストが小さくなるように見積もられる。
なお、前処理において、人物にラベル付けされたピクセルの中でも背景と隣設している「境目」のピクセルの周辺のピクセルに対する色距離は、境目以外のピクセルのそれよりも大きくなり、ひいては第2の接続コストが小さくなる可能性が高い。本実施形態では、このような境目のピクセルについては、人物と背景との可能性が高いと考えられるので、1未満の定数εを掛けてさらに第2の接続コストを小さく見積もっている(ステップS6)。
次に、演算部2の補正部2eは、第1の接続コストPh、Pb及び第2の接続コストPdを用いてグラフを生成する(ステップS8)。
図11には、全体の一部である3×3のピクセルについての生成されたグラフの一例が示されている。図12は、そのフロー図(ネットワーク図)である。図11において、各ピクセルは四角のセルで示され、グラフにおいて節点を構成する。
また、節点である各ピクセルは、人物ヒストグラムを用いて計算された人物の色情報に対する第1の接続コストPh(破線)、背景ヒストグラムを用いて計算された背景の色情報に対する第1の接続コストPb(ジグザグ線)、及び、隣接するピクセルとの連続性を示す第2の接続コストPd(二重線)で接続される。これらの接続コストPh、Pb及びPdは、グラフ上において、各節点を接続する枝に相当する。つまり、グラフは、各ピクセルを節点としかつ第1の接続コストPh、Pb及び第2の接続コストPdを枝として生成される。
また、補正部2eは、前記グラフに対して、第1の接続コストPh、Pb及び第2の接続コストPdの和が最小となるカットを計算し、該最小カットに基づいて前記対象領域のピクセルのラベル付けを行う(ステップS8)。
上記グラフ(全節点集合)を、ソースtを含む節点集合(例えば、人物としてラベル付けされるピクセル群)と、シンクsを含む節点集合(例えば、背景としてラベル付けされるピクセル群)の2つに分割したものがカット(S,T)である。ソースtの点からシンクsの点に流れるフローの合計を、そのカットの容量といい、存在しうるカットの中で容量が最小のものは、その容量と最大フローが一致する。これがフローネットワークにおける最適化問題での最大フロー最小カット理論である。
本実施形態では、下式のようなエネルギ関数E(L)を定義し、このエネルギ関数が最小となるフローが求められる。
E(L)=ΣPhi+ΣPbj+ΣPd(m,n)
ただし、符号は次の通りである。
Phi:節点iでの人物の色情報に対する第1の接続コスト
Pbj:節点jでの背景の色情報に対する第1の接続コスト
i,j∈Pであり、i≠j
P:全節点集合
Pd(m,n)::節点mとnの対象ピクセルの第2の接続コスト
m,n∈Pであり、m≠n
(Pdは全ての組合せでカットされるとは限らない)
図12には、上記エネルギ関数を説明するためのグラフをさらに簡略化したフロー図が示されている。ソースsの節点からシンクtの節点までのフローにおいて、例えば、実線で表されるカット1では枝Vi(Li=0)を3つ、枝Vi(Li=1)を4つ、及び、枝V2(Li,Lj)を3つ通る。他方、二点鎖線で表されるカット2では、枝Vi(Li=0)を6つ、枝Vi(Li=1)を1つ、及び、枝Vi(Li,Lj)を1つ通る。
各枝には、それぞれ接続コストが割り当てられている。この例では、枝Vi(Li=1)には人物の第1の接続コストPhが、枝Vi(Li=0)には背景の第1の接続コストPbが、枝Vi(Li,Lj)には第2の接続コストPdがそれぞれ割り当てられており、その値も枝毎に異なっている。従って、カット1及びカット2のエネルギ関数の値は、各枝Vi(Li=0)、Vi(Li=1)及びVi(Li,Lj)が持っている接続コストの値によって異なったものになる。本発明では、このエネルギ関数の値が最小となるカットが、例えば最大フロー最小カットアルゴリズムを用いて計算される。
前記グラフから、前記エネルギ関数が最小となるカットを求めることにより、対象領域について、人物にラベル付けされるピクセルと、背景にラベル付けされるピクセルとの境界を生成することができる。即ち、ステップS8により、人物の色情報に対する類似度が低く、かつ、隣接するピクセル間で連続性が低いピクセルが例えばソースtのカットへ、背景の色情報に対する類似度が低く、かつ、隣接するピクセル間で連続性が低いピクセルが例えばシンクsのカットへと区分される。
次に、補正部2eは、前記カットに基づいて、各ピクセルのラベル付けをやり直す。具体的には、前記カットによって、ソースt(人物)に含まれるピクセルを人物にラベル付けする(ステップS10)。他方、シンクs(背景)に含まれるピクセルを背景にラベル付けする(ステップS11)。これにより、対象領域のピクセルのラベル付けがやり直されるシルエットが補正される。
次に、補正部2eは、最終処理を行う(ステップS11)。最終処理の手順は、図13に示される。本実施形態の最終処理は、各ピクセルについて、補正ステップ前のラベルと、補正ステップ後のラベルとが比較される(ステップS111乃至S114)。補正ステップの前後において、各ピクセルのラベル付けに関して、次のパターンがある。
ケース1 補正前:人物 → 補正後:人物
ケース2 補正前:背景 → 補正後:背景
ケース3 補正前:人物 → 補正後:背景
ケース4 補正前:背景 → 補正後:人物
補正部2eは、上記ケース1及び2の場合(ステップS111、S112)、ピクセルのラベル付けの変更は行わない(ステップS115及び116)。
また、補正部2eは、上記ケース3の場合(ステップS113)、ピクセルのラベルを、人物から背景に変更する(ステップS117)。
さらに、補正部2eは、上記ケース4の場合、ピクセルのラベルを、人物には変更せず、背景のままとする(ステップS118)。
本発明のシルエット補正方法に先立って行われる前処理は、上記特許文献1にも記載されているように、例えば、人体を確実に含んだ広い範囲にマスク処理を施し、その外側の領域の明らかに背景と考えられるピクセルに基づいて「背景」のラベル付けが行われる。そして、この背景と同じような情報を持ったピクセルを検索して、マスク内にラベル付けが行われている。従って、前処理では、背景のラベル付けは、人物のラベル付けよりも正確である可能性が高い。そこで、本実施形態では、この前処理の信頼性を優先し、前処理で背景にラベル付けされていたピクセルが、補正ステップによって人物にラベル付けされた場合でも、先の前処理の結果を優先し、ラベル付けの変更は行わないものとしている。
次に、補正部2eは、全てのピクセルについての処理が終えたか否かを判断し(ステップS119)、終えていない場合には、全てが処理されるまでステップS111乃至118を繰り返す。
ステップS119で全てのピクセルが処理されたと判定された場合、補正部2eは、補正前の人物のシルエットと、補正後の人物のシルエットとの論理積画像を表示することが望ましい(ステップS120)。これによって、双方の判断結果を考慮して、より精度の高いシルエット抽出が可能になる。
本発明は、上記実施形態以外にも、種々の実施形態で実施されうる。例えば、ラベル付けが変更されたピクセルの中に、前処理で背景にラベル付けされていたピクセルが、補正ステップによって人物にラベル付けされたピクセルが含まれている場合、再度、補正ステップを実行させ、その結果を最終のラベル付けとすることもできる。この場合、補正部2eは、新たに人物にラベルが変更されたピクセルについてのみ、背景の色情報に対する第1の接続コストPbの計算に際して、ピクセルの頻度nb(I)(C(I)(x,y))に1よりも大きい定数(この実施形態では2)を乗じて背景の色情報に対する類似度を高めて、第1及び第2の接続コストを計算し直して前記補正ステップを行うことが望ましい。これは、先の前処理の信頼性を尊重すべく、背景の色情報に対する類似度を高めるためである。
以上、本発明について種々説明したが、本発明のシルエット補正方法及びシステムは、上記実施形態に限定されることなく、種々の態様に変更して実施することができるのは言うまでもない。
[実施例1:図14〜図15]
図14は、背景とスイングのインパクト状態にある人物とを含む画像フレーム(640×320)の原画像である。図15(a)は、先の特許文献1に記載された前処理で人物のシルエット抽出したものである。図15(a)のシルエットでは、背中や腰付近に、背景の一部がノイズNとなって人物にラベル付けされているのが分かる。図15(b)には、本発明に従うシルエット補正処理を施したものである。この実施例1では、上記ノイズが綺麗に取り除かれているのが分かる。
[実施例2:図16〜図17]
図16は、背景とスイングのテークバック状態の人物とを含む画像フレーム(640×320)の原画像である。図17(a)は、上記同様、先の特許文献1に記載された前処理で人物のシルエット抽出したものである。図17(a)のシルエットでは、背中及び腹付近に、背景の一部がノイズNとなって人物にラベル付けされているのが分かる。図17(b)には、本発明に従うシルエット補正処理を施したものである。この実施例2では、上記ノイズが綺麗に取り除かれているのが分かる。
1 シルエット抽出システム
2 携帯電話機
3 サーバー
4 カメラ
5、8 メモリ
7 演算部

Claims (6)

  1. 人物と背景とが撮影されたフレームの各ピクセルが、人物又は背景のいずれかにラベル付けされて前記人物のシルエットが抽出されたフレームについて、前記フレームの少なくとも一部の対象領域のピクセルの前記ラベル付けを変更してシルエットを補正するシルエット補正方法であって、
    前記対象領域に含まれるピクセルのうち、人物にラベル付けされたピクセルを用いて、頻度をピクセル数としかつ階級をピクセルの色情報とした人物ヒストグラムを作成するステップと、
    前記対象領域に含まれるピクセルのうち、背景にラベル付けされたピクセルを用いて、頻度をピクセル数としかつ階級をピクセルの色情報とした背景ヒストグラムを作成するステップと、
    前記対象領域の各ピクセルの色情報と、前記人物ヒストグラム及び背景ヒストグラムとを用いて、各ピクセルの人物の色情報に対する類似度及び背景の色情報に対する類似度をそれぞれ表す第1の接続コストを計算するステップと、
    前記対象領域の各ピクセルについて、隣接するピクセルとの差分値を用いて隣接ピクセル間の色情報の連続性を表す第2の接続コストを計算するステップと、
    前記各ピクセルを節点としかつ前記第1の接続コスト及び第2の接続コストを枝として生成されたグラフを、第1の接続コスト及び第2の接続コストの和が最小となるように2分割するカットを計算し、該カットに基づいて前記対象領域のピクセルのラベル付けをやり直す補正ステップとを含むことを特徴とするシルエット補正方法。
  2. 前記第1の接続コストは、下式で計算される請求項1記載のシルエット補正方法。
    Ph(I)(x,y)=nh(I)(C(I)(x,y))×λ/th
    Pb(I)(x,y)=nb(I)(C(I)(x,y))×λ/tb
    ただし、符号は、次の通りである。
    Ph(I)(x,y):座標x,yかつ色情報(I)を有するピクセルの人物の色情報に対する第1の接続コスト
    nh(I)(C(I)(x,y)):人物ヒストグラムにおいて対象ピクセルの色情報C(I)(x,y)を有するピクセルの頻度
    th:対象領域内で人物にラベル付けされたピクセルの総数
    Pb(I)(x,y):座標x,yかつ色情報(I)を有するピクセルの背景の色情報に対する第1の接続コスト
    nb(I)(C(I)(x,y)):背景ヒストグラムにおいて対象ピクセルの色情報C(I)(x,y)を有するピクセルの頻度
    tb:対象領域内で背景にラベル付けされたピクセルの総数
    λ:定数
  3. 前記第2の接続コストは、下式で計算される請求項1又は2記載のシルエット補正方法。
    Pd=k×ε/Dp
    Pd:対象のピクセルの第2の接続コスト
    k:定数
    ε:定数であり、対象のピクセルが人物のシルエットの境界に位置するピクセルである場合は0よりも大かつ1よりも小の数、それ以外のピクセルである場合は1
    Dp:対象のピクセルとその周囲のピクセルとの差分値
  4. 背景から人物にラベル付けが変更されたピクセルについては、前記ピクセルの頻度nb(I)(C(I)(x,y))に1よりも大きい定数を乗じて背景の色情報に対する類似度を高めて、再度、第1及び第2の接続コストを計算して前記補正ステップを行うことを特徴とする請求項2に記載のシルエット補正方法。
  5. 前記補正ステップ前のシルエットと、前記補正ステップ後のシルエットとの論理積画像を表示するステップをさらに含む請求項1乃至4のいずれかに記載のシルエット補正方法。
  6. 人物と背景とが撮影されたフレームの各ピクセルが、人物又は背景のいずれかにラベル付けされて前記人物のシルエットが抽出されたフレームについて、前記フレームの少なくとも一部の対象領域のピクセルの前記ラベル付けを変更してシルエットを補正するシルエット補正システムであって、
    前記フレームのピクセル情報を記憶するメモリ、及び、演算部を具え、
    前記演算部は、前記対象領域に含まれるピクセルのうち、人物にラベル付けされたピクセルを用いて、頻度をピクセル数としかつ階級をピクセルの色情報とした人物ヒストグラムを作成する人物ヒストグラム作成部と、
    前記対象領域に含まれるピクセルのうち、背景にラベル付けされたピクセルを用いて、頻度をピクセル数としかつ階級をピクセルの色情報とした背景ヒストグラムを作成する背景ヒストグラム作成部と、
    前記対象領域の各ピクセルの色情報と、前記人物ヒストグラム及び背景ヒストグラムとを用いて、各ピクセルの人物の色情報に対する類似度及び背景の色情報に対する類似度をそれぞれ表す第1の接続コストを計算する第1の接続コスト計算部と、
    前記対象領域の各ピクセルについて、隣接するピクセルとの差分値を用いて隣接ピクセル間の色情報の連続性を表す第2の接続コストを計算する第2の接続コスト計算部と、
    前記各ピクセルを節点としかつ前記第1の接続コスト及び第2の接続コストを枝として生成されたグラフを、第1の接続コスト及び第2の接続コストの和が最小となるように2分割するカットを計算し、該カットに基づいて前記対象領域のピクセルのラベル付けをやり直す補正部とを含むことを特徴とするシルエット補正システム。
JP2011268287A 2011-12-07 2011-12-07 シルエット補正方法及びシルエット補正システム Active JP5816069B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2011268287A JP5816069B2 (ja) 2011-12-07 2011-12-07 シルエット補正方法及びシルエット補正システム
US13/707,218 US8824787B2 (en) 2011-12-07 2012-12-06 Silhouette correction method and system and silhouette extraction method and system
KR1020120142374A KR101982352B1 (ko) 2011-12-07 2012-12-07 실루엣 보정 방법 및 시스템과 실루엣 묘출 방법 및 시스템
CN201210556368.7A CN103150720B (zh) 2011-12-07 2012-12-07 轮廓校正方法和系统以及轮廓提取方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011268287A JP5816069B2 (ja) 2011-12-07 2011-12-07 シルエット補正方法及びシルエット補正システム

Publications (2)

Publication Number Publication Date
JP2013120498A true JP2013120498A (ja) 2013-06-17
JP5816069B2 JP5816069B2 (ja) 2015-11-17

Family

ID=48773111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011268287A Active JP5816069B2 (ja) 2011-12-07 2011-12-07 シルエット補正方法及びシルエット補正システム

Country Status (1)

Country Link
JP (1) JP5816069B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015075920A (ja) * 2013-10-09 2015-04-20 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
JP2019028888A (ja) * 2017-08-02 2019-02-21 日本放送協会 カラー情報拡大器およびカラー情報推定器、ならびに、それらのプログラム
JP2019029938A (ja) * 2017-08-02 2019-02-21 日本放送協会 誤差計算器およびそのプログラム
US10373357B2 (en) 2015-04-10 2019-08-06 Samsung Electronics Co., Ltd. Device and method for displaying screen based on event

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6015024737; 松尾賢治: '"Grabcut適用結果の形状類似性に着目した対話不要の画像領域分割"' 情報処理学会研究報告[DVD-ROM] Vol.2010-CVIM-171,No.19, 20100415, 社団法人情報処理学会 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015075920A (ja) * 2013-10-09 2015-04-20 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
CN104580883A (zh) * 2013-10-09 2015-04-29 卡西欧计算机株式会社 图像处理装置、图像处理方法
US9679386B2 (en) 2013-10-09 2017-06-13 Casio Computer Co., Ltd. Image processing device capable of segmenting an image into plural areas
CN104580883B (zh) * 2013-10-09 2018-05-29 卡西欧计算机株式会社 图像处理装置、图像处理方法以及记录介质
US10373357B2 (en) 2015-04-10 2019-08-06 Samsung Electronics Co., Ltd. Device and method for displaying screen based on event
JP2019028888A (ja) * 2017-08-02 2019-02-21 日本放送協会 カラー情報拡大器およびカラー情報推定器、ならびに、それらのプログラム
JP2019029938A (ja) * 2017-08-02 2019-02-21 日本放送協会 誤差計算器およびそのプログラム

Also Published As

Publication number Publication date
JP5816069B2 (ja) 2015-11-17

Similar Documents

Publication Publication Date Title
CN108122208A (zh) 用于对对象分割的前景掩模校正的图像处理设备和方法
CN111383232B (zh) 抠图方法、装置、终端设备及计算机可读存储介质
US8824787B2 (en) Silhouette correction method and system and silhouette extraction method and system
Gui et al. A new method for soybean leaf disease detection based on modified salient regions
WO2019071976A1 (zh) 基于区域增长和眼动模型的全景图像显著性检测方法
JP5816069B2 (ja) シルエット補正方法及びシルエット補正システム
JP2020129276A (ja) 画像処理装置、画像処理方法、およびプログラム
US9002140B2 (en) Image processing apparatus, method, and program
CN109255783B (zh) 一种多人图像上的人体骨骼关键点的位置排布检测方法
KR20170046140A (ko) 얼굴 이미지 편집 방법 및 디바이스
US11321960B2 (en) Deep learning-based three-dimensional facial reconstruction system
US9965881B2 (en) Method for generating image and image generation system
CN111723687A (zh) 基于神经网路的人体动作识别方法和装置
CN108109148A (zh) 图像立体分配方法、移动终端
JP5872395B2 (ja) 領域分割装置
JP2012113438A (ja) 姿勢推定装置および姿勢推定プログラム
KR20190084426A (ko) 병변 스크리닝 장치 및 방법
CN115222895B (zh) 图像生成方法、装置、设备以及存储介质
Wang et al. Exposure fusion using a relative generative adversarial network
US11922649B2 (en) Measurement data calculation apparatus, product manufacturing apparatus, information processing apparatus, silhouette image generating apparatus, and terminal apparatus
JP6392739B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2022147713A (ja) 画像生成装置、学習装置、及び、画像生成方法
JP6416741B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP6389452B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP2022092685A (ja) 三次元形状モデル生成装置、三次元形状モデル生成方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140924

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150908

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150925

R150 Certificate of patent or registration of utility model

Ref document number: 5816069

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250