JP2019102008A - 領域判定装置及びそのプログラム - Google Patents

領域判定装置及びそのプログラム Download PDF

Info

Publication number
JP2019102008A
JP2019102008A JP2017235718A JP2017235718A JP2019102008A JP 2019102008 A JP2019102008 A JP 2019102008A JP 2017235718 A JP2017235718 A JP 2017235718A JP 2017235718 A JP2017235718 A JP 2017235718A JP 2019102008 A JP2019102008 A JP 2019102008A
Authority
JP
Japan
Prior art keywords
pixel
area
pixel value
background
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017235718A
Other languages
English (en)
Inventor
秀樹 三ツ峰
Hideki Mitsumine
秀樹 三ツ峰
寛史 盛岡
Hirofumi Morioka
寛史 盛岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2017235718A priority Critical patent/JP2019102008A/ja
Publication of JP2019102008A publication Critical patent/JP2019102008A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】領域判定精度を向上させた領域判定装置を提供する。【解決手段】映像合成装置1は、映像記憶部10と、各画素の画素値を直線にフィッティングする直線近似部20と、背景モデルを生成する背景モデル生成部30と、背景モデルを記憶する背景モデル記憶部40と、背景モデルを更新する背景モデル更新部50と、背景モデルを用いて、撮影映像の被写体領域、影領域、半影領域及び背景領域を判定する判定部60と、部品映像記憶部70と、映像合成部80とを備える。【選択図】図1

Description

本発明は、領域判定装置及びそのプログラムに関する。
従来より、背景差分法は、固定カメラの映像から、動いている被写体と背景とを分離する手法として知られている。背景差分法の基本原理は、予め撮影した背景のみの映像と現在の映像との間で座標毎の画素値の差分値を求め、その大きさを基準として、背景領域であるか被写体領域(動物体領域)であるかを判定するものである。この基本原理では、被写体が背景に落とした影により、影部分が背景でないと誤判定されることがあり、領域判定精度が低下する。
そこで、従来の背景差分法を拡張した手法が提案されている(非特許文献1,2)。非特許文献1に記載の手法は、背景モデルをデータベース化し、背景の各画素に複数の背景モデルを持たせるものである。この手法は、背景モデルを追加することや、背景モデルの闊値(ボックス)を拡大することで、明るさが変化する場合、木の葉が揺れる場合、ある座標の画素が別の被写体に表す場合にも対応できる。また、非特許文献2に記載の手法は、明度変化を統計的に処理することで、被写体が背景に落とす影にも対応できる。
Kyungnam Kim, Thanarat H.Chalidabhongse, David Harwood, Larry Davis,"Real-time foreground-background segmentation using codebook model," AVSS '09 Sixth IEEE International Conference on Advanced Video and Signal Based Survei11ance, PP,454 森田順也,岩井儀雄,谷内田正彦,"室内における背景と物体の分離",情報処理学会研究報告 CVIM, PP9-16,2002
しかし、非特許文献1,2に記載の手法は、照明の色温度が変化すること、つまり、時間の経過に伴って環境光の色が変化することを考慮しておらず、領域判定精度が低下するという問題がある。
そこで、本発明は、領域判定精度を向上させた領域判定装置及びそのプログラムを提供することを課題とする。
前記した課題に鑑みて、本発明に係る領域判定装置は、動いている被写体を固定カメラで撮影した所定時間分の撮影映像に含まれる被写体領域、影領域、半影領域及び背景領域を判定する領域判定装置であって、直線近似部と、背景モデル生成部と、背景モデル更新部と、被写体領域判定部と、影領域判定部と、半影領域判定部と、背景領域判定部とを備える構成とした。
かかる構成によれば、領域判定装置は、直線近似部によって、所定時間分の学習映像から各時刻で同一座標の画素の画素値を取得し、取得した当該同一座標の画素毎に、各時刻の画素の画素値を直交RGB色空間内の直線で近似する。
そして、領域判定装置は、背景モデル生成部によって、学習映像の画素毎に、直交RGB色空間の原点を始点として予め設定した環境光反射ベクトル、及び、環境光反射ベクトルの終点から直線を延長した位置までの主光源反射ベクトルからなる背景モデルを生成する。
ここで、被写体領域が日向に位置する場合、反射光は、重み付けた主光源反射ベクトルと環境光反射ベクトルで表される(但し、重み係数は、0〜1の間で照明条件に応じて変化)。一方、被写体領域が日陰に位置する場合、反射光は、環境光反射ベクトルのみで表される。そして、これら反射光の強度が、撮影映像の被写体輝度に影響を及ぼす。例えば、被写体領域が日向から日陰に移動すると、反射光は、重み付けた主光源反射ベクトルと環境光反射ベクトルとを加えたものから環境光反射ベクトルに変化し、環境光反射ベクトルが支配的となる。
背景モデルとは、主光源反射ベクトルや環境光反射ベクトルを用いて、照明条件による色や輝度の変動をモデル化したものである。
照明条件には、例えば、日向や日陰といった影の有無、光の入射角の変化、天候の変化、主光源の遮蔽の有無といったものが含まれる。
領域判定装置は、背景モデル更新部によって、各時刻の撮影映像から同一座標の画素を観測画素として取得し、取得した観測画素の画素値うち、原点に最も近い画素値に直線上で最寄の画素値を最近画素値、及び、原点から最も遠い画素値に直線上で最寄の画素値を最遠画素値として更新する。
このように、領域判定装置は、照明条件の変化に対して頑健となるように背景モデルを更新(学習)する。
領域判定装置は、被写体領域判定部によって、観測画素の画素値が、主光源反射ベクトル上で最近画素値と最遠画素値との間の背景判定基準線分から予め設定した距離以上離れる場合、観測画素を被写体領域の画素と判定する。
そして、領域判定装置は、影領域判定部によって、最近画素値から原点までの基準方向で原点から所定距離の基準位置を予め設定し、観測画素の画素値が、環境光反射ベクトル又は主光源反射ベクトルで基準位置から最近画素値までの範囲に含まれる場合、観測画素を影領域の画素と判定する。
領域判定装置は、半影領域判定部によって、基準方向で最近画素値から所定距離の半影判定位置を予め設定し、観測画素の画素値が、背景判定基準線分上で最近画素値から半影判定位置までの範囲に含まれる場合、観測画素を半影領域の画素と判定する。
領域判定装置は、背景領域判定部によって、観測画素の画素値が、背景判定基準線分上で半影判定位置から最遠画素値までの範囲に含まれる場合、観測画素を背景領域の画素と判定する。
このように、領域判定装置は、更新した背景モデルを用いることで、領域判定精度を向上させることができる。
本発明によれば、以下のような優れた効果を奏する。
本発明に係る領域判定装置は、主光源反射ベクトル及び環境光反射ベクトルを用いて、照明条件による色や輝度の変動をモデル化する。そして、領域判定装置は、背景モデルを更新し、その背景モデルを用いることで、領域判定精度を向上させることができる。
本発明の第1実施形態に係る映像合成装置の構成を示すブロック図である。 半影領域及び影領域を説明する説明図である。 学習映像を説明する説明図である。 背景モデルの第1例を説明する説明図である。 背景モデルの第2例を説明する説明図である。 背景モデルにおける物体反射光の変動範囲を説明する説明図であり、(a)は図4の背景モデルに対応し、(b)が図5の背景モデルに対応する。 撮影映像を説明する説明図である。 最近画素値及び最遠画素値の更新と被写体領域の判定とを説明する説明図である。 影領域、半影領域及び背景領域の判定を説明する説明図である。 領域判定を説明する説明図であり、(a)は判定対象の撮影映像であり、(b)は背景モデルである。 映像合成を説明する説明図である。 図1の映像合成装置の動作を示すフローチャートである。 本発明の第2実施形態に係る映像合成装置の構成を示すブロック図である。 合成情報の生成を説明する説明図である。 図13の映像合成装置の動作を示すフローチャートである。
以下、本発明の各実施形態について、適宜図面を参照しながら詳細に説明する。なお、各実施形態において、同一の手段及び同一の処理には同一の符号を付し、説明を省略した。
(第1実施形態)
[映像合成装置の概略]
図1を参照し、本発明の第1実施形態に係る映像合成装置(領域判定装置)1の概略について説明する。
スポーツ競技において、時間の経過とともに、選手がどのようにフィールドで移動したか、どのように体を捌いたのかといったことを、番組の視聴者に直感的に伝えることが困難である。特に、選手の動きが速い場合、この問題は顕著となる。
この問題に対処すべく、番組制作においては、カメラワークやスローモーションでの表示などの工夫が行われている。その工夫の一つが、連続写真風に表示するマルチモーションという手法である。このマルチモーションは、固定カメラの撮影映像から、動いている被写体を切り出し、背景映像に、時間経過により得られる被写体を合成することで、被写体の動きを直感的に理解できるように表示する。
しかし、従来の背景差分法では、影領域の判定精度が不十分で、違和感のあるマルチモーション表現に留まっていた。そこで、本実施形態では、映像合成装置1をマルチモーションに適用することとして説明する。特に屋外における競技場でのスポーツ競技では、広く上に開けた施設であり、日中、主光源である太陽が支配的である半面、天空光が一様な青空や曇などで単純な環境光となることが多く、映像合成装置1には好条件である。
映像合成装置1は、ビデオカメラ2で撮影した撮影映像の被写体領域、影領域、半影領域及び背景領域を判定するものである。
ビデオカメラ(固定カメラ)2は、動いている被写体を同一画角で撮影するものである。このビデオカメラ2は、姿勢及びズームを変更せずに被写体を撮影し、図1に示すように、その撮影映像を映像合成装置1に出力する。
<被写体領域、影領域、半影領域、背景領域>
図2を参照し、撮影映像の被写体領域、影領域、半影領域及び背景領域について説明する。
図2に示すように、ビデオカメラ2で屋外の被写体90を撮影する場合を考える。このとき、主光源が光源91となり、環境光が天空光となる。
ここで、被写体90を撮影する際、光源91による影ができる。この影は、周囲の半影領域92と、半影領域92より中心側に位置する影領域93とを有する。
被写体領域とは、被写体90の領域のことである。
半影領域92とは、被写体90の影が薄い領域のことである。
影領域93とは、被写体90の影が濃い領域のことである。
背景領域とは、被写体領域、半影領域92及び影領域93以外の領域のことである。
[映像合成装置の構成]
図1に戻り、映像合成装置1の構成について説明する。
図1に示すように、映像合成装置1は、映像記憶部10と、直線近似部20と、背景モデル生成部30と、背景モデル記憶部40と、背景モデル更新部50と、判定部60と、部品映像記憶部70と、映像合成部80とを備える。
映像記憶部10は、ビデオカメラ2から入力された所定時間分の撮影映像を記憶するデータベースである。例えば、映像記憶部10としては、一般的なHDD(Hard Disk Drive)、SSD(Solid State Drive)等の記憶装置があげられる。
また、映像記憶部10は、撮影映像V(図7)と共に、学習映像Fを記憶してもよい。本実施形態では、映像記憶部10は、図3に示すように、時刻t=1,2,3,…,Tの学習映像F(F,F,F,…,F)を記憶する。
学習映像Fとは、後記する背景モデルを生成するための映像のことである。ここで、学習映像Fは、水平方向にx個、垂直方向にy個の画素P(j,k)で構成されている。このj,kは、それぞれ、学習映像Fの水平座標及び垂直座標を表す(但し、0≦j≦x−1、0≦k≦y−1)。
なお、学習映像は、特に制限されないが、処理簡略化のため、撮影映像と同一画素数の映像とすることが好ましい。例えば、ビデオカメラ2がスポーツ競技を撮影した映像の一部を学習映像Fとし、残りを撮影映像としてもよい。
直線近似部20は、映像記憶部10に記憶されている学習映像から各時刻で同一座標の画素の画素値を取得し、取得した同一座標の画素毎に、各時刻の画素の画素値を直交RGB色空間内の直線で近似するものである。そして、直線近似部20は、近似した直線を背景モデル生成部30に出力する。
なお、直線近似部20の詳細は、後記する。
背景モデル生成部30は、直線近似部20から入力された直線を用いて、背景モデルを生成するものである。そして、背景モデル生成部30は、生成した背景モデルを背景モデル記憶部40に書き込む。
<背景モデル及びその生成>
図4〜図6を参照し、背景モデル及びその生成について説明する(適宜図1参照)。
背景モデルMは、図4に示すように、環境光反射ベクトルEV、及び、主光源反射ベクトルMVで構成されている。この背景モデルMは、学習映像Fの画素P毎に生成するので、画素Pと同数のx×y個存在する。画素P(j,k)の背景モデルをM(j,k)とする。図4の背景モデルM(0,0)は、学習映像F,…,Fの画素P(0,0),…,P(0,0)に対応する。また、図5の背景モデルM(j,k)は、学習映像F,…,Fの画素P(j,k),…,P(j,k)に対応する。
直交RGB色空間は、直交する3軸で画素のRGB値を表す3次元の色空間であり、原点Oが黒色を表している。
環境光反射ベクトルEVは、直交RGB色空間の原点Oを始点として予め設定したベクトルである。この環境光反射ベクトルEVは、環境光のみの反射光ベクトルである。ここで、直線近似部20が求めた直線から原点Oに線分を伸ばし、その線分と原点Oとを結んだ方向が、環境光反射ベクトルEVの方向となる。
主光源反射ベクトルMVは、直交RGB色空間の原点Oから、直線近似部20が求めた直線だけ延長した位置までのベクトルである。この主光源反射ベクトルMVは、主光源のみの反射光ベクトルである。
また、主光源反射ベクトルMVは、主光源反射ベクトルMVの始点を環境光反射ベクトルEVの終点に移動させたベクトルである。
図6(a)及び図6(b)に示すように、背景モデルMは、直交RGB色空間の原点Oを始点とする環境光反射ベクトルEVと、環境光反射ベクトルEVの終点に連結した主光源反射ベクトルMVとからなる。ここで、環境光反射ベクトルEVと、主光源反射ベクトルMVと、原点O及び主光源反射ベクトルMVの終点を結ぶ直線(破線で図示)とで囲まれた領域(ハッチングで図示)に着目する。すると、背景モデルMでは、照明条件に応じて物体反射光Lがこの領域内を移動する(つまり、物体反射光Lの画素がこの領域内の画素値となる)。このように、背景モデルMは、主光源反射ベクトルMV及び環境光反射ベクトルEVを用いて、照明条件による色や輝度の変動をモデル化したものである。
以下、背景モデルMの生成について説明する。
直線近似部20は、学習映像Fから各時刻で同一座標の画素Pの画素値を取得し、取得した同一座標の画素P毎に、各時刻の画素Pの画素値を直交RGB色空間内の直線で近似する。
例えば、直線近似部20は、図3の学習映像F,…,Fのそれぞれから、左上画素P(0,0),…,P(0,0)の画素値を取得する。そして、直線近似部20は、取得した全ての左上画素P(0,0)の画素値を直線にフィッティング(近似)する。例えば、フィッティングの手法としては、最小二乗法をあげることができる。
また、直線近似部20は、図3の学習映像F,…,Fのそれぞれから、画素P(j,k),…,P(j,k)の画素値を取得する。そして、直線近似部20は、取得した全ての画素P(j,k)の画素値を最小二乗法により直線にフィッティングする。
続いて、背景モデル生成部30は、学習映像Fの画素P毎に、環境光反射ベクトルEV、及び、環境光反射ベクトルEVの終点から直線を延長した位置までの主光源反射ベクトルMVからなる背景モデルMを生成する。具体的には、背景モデル生成部30は、環境光反射ベクトルEVの終点に主光源反射ベクトルMVを連結させて、画素P(0,0)の背景モデルM(0,0)を生成する。さらに、背景モデル生成部30は、画素P(0,0)と同様、画素P(j,k)の背景モデルM(j,k)を生成する。
なお、直線近似部20及び背景モデル生成部30は、学習映像Fの全画素Pに対して処理を行う。
図1に戻り、映像合成装置1の構成について、説明を続ける。
背景モデル記憶部40は、背景モデルMを記憶するデータベースである。例えば、背景モデル記憶部40としては、一般的なHDD、SSD等の記憶装置があげられる。
背景モデル更新部50は、背景モデル記憶部40に記憶されている背景モデルMを更新するものである。
<背景モデルの更新>
図7,図8を参照し、背景モデルMの更新について説明する(適宜図1参照)。
背景モデル更新部50は、図7に示すように、映像記憶部10に記憶されている時刻t=1,2,3,…,Tの学習映像V(V,V,V,…,V)から、同一座標(j,k)の画素を観測画素Q(j,k),Q(j,k),Q(j,k),…,Q(j,k)として取得する。
そして、背景モデル更新部50は、取得した観測画素Q(j,k)の画素値うち、背景モデルM(j,k)において、最近画素値Qmin及び最遠画素値Qmaxを更新する。この最近画素値Qmin及び最遠画素値Qmaxは、後記する背景判定基準線分を主光源反射ベクトルMVに設定するときの基準になる。
ここで、時刻t=1の観測画素Q(j,k)が原点Oに近い側の端点に最寄の画素値を有し、時刻t=2の観測画素Q(j,k)が原点Oから遠い側の端点に最寄の画素値を有する場合を考える。この場合、背景モデル更新部50は、図8に示すように、背景モデル記憶部40の背景モデルM(j,k)について、観測画素Q(j,k)の画素値を最近画素値Qminとして更新する。さらに、背景モデル更新部50は、観測画素Q(j,k)の画素値を最遠画素値Qmaxとして更新する。
その後、背景モデル更新部50は、観測画素Q(j,k)を判定部60に出力する。
なお、背景モデル更新部50は、撮影映像Vの全観測画素Qに対して処理を行う。
図1に戻り、映像合成装置1の構成について、説明を続ける。
判定部60は、背景モデル記憶部40の背景モデルMを参照し、観測画素Q(j,k)が、被写体領域、影領域、半影領域又は背景領域の何れに属するか判定するものである。図1に示すように、判定部60は、被写体領域判定部61と、影領域判定部63と、半影領域判定部65と、背景領域判定部67とを備える。
<被写体領域の判定>
被写体領域判定部61は、図8に示すように、観測画素Q(j,k)の画素値が、背景判定基準線分BLから予め設定した距離D1以上離れる場合、観測画素Q(j,k)を被写体領域の画素と判定するものである。この背景判定基準線分BLは、主光源反射ベクトルMV上で最近画素値Qminと最遠画素値Qmaxとの間の線分である。
つまり、被写体領域判定部61は、観測画素Q(j,k)の画素値が、背景判定基準線分BLから距離D1までの範囲αから外れる場合、観測画素Q(j,k)を被写体領域の画素と判定する。
なお、図8では、範囲αを矩形状の領域として図示したが、RGB色空間内において、この範囲αは、背景判定基準線分BLを中心とした円筒形状の領域となる。
観測画素Q(j,k)が被写体領域の場合、被写体領域判定部61は、観測画素Q(j,k)と、観測画素Q(j,k)が被写体領域であることを示すフラグ(例えば、‘1’)とを関連付けて、部品映像記憶部70に書き込む。
観測画素Q(j,k)が被写体領域の画素でない場合、判定部60は、観測画素Q(j,k)が影領域の画素であるかを判定する。
このようにして、被写体領域判定部61は、被写体領域の観測画素Q(j,k)を、はずれ値として背景領域の判定処理から除外する。
<影領域の判定>
影領域判定部63は、図9に示すように、観測画素Q(j,k)の画素値が、環境光反射ベクトルEV又は主光源反射ベクトルMVで基準位置SPから最近画素値Qminまでの範囲に含まれる場合、観測画素Q(j,k)を影領域の画素と判定するものである。
まず、影領域判定部63は、最近画素値Qminから原点Oまでの基準方向SDに沿って、原点Oから所定距離L1に基準位置SPを設定する。この距離L1は、経験則により任意に設定可能である。
ここで、影領域、半影領域又は背景領域を判定する際、ビデオカメラ2のノイズや画素値が離散的であることから、観測画素Q(j,k)の画素値が、環境光反射ベクトルEV又は主光源反射ベクトルMVの上から外れることがある。そこで、影領域判定部63は、観測画素Q(j,k)の画素値が、環境光反射ベクトルEV又は主光源反射ベクトルMVから予め設定した距離D2以内の場合、観測画素Q(j,k)を影領域の画素と判定することとした(但し、距離D1>距離D2)。
つまり、影領域判定部63は、観測画素Q(j,k)の画素値が、基準方向SDに沿って基準位置SPから最近画素値Qminまでの間、かつ、環境光反射ベクトルEV又は主光源反射ベクトルMVから距離D2までの範囲β1に含まれる場合、観測画素Q(j,k)を影領域の画素と判定する。
なお、図9では、範囲β1〜β3を矩形状の領域として図示したが、RGB色空間内において、この範囲β1〜β3は、環境光反射ベクトルEVや主光源反射ベクトルMVを中心とした円筒形状の領域となる。
観測画素Q(j,k)が影領域の画素の場合、影領域判定部63は、観測画素Q(j,k)と、この観測画素Q(j,k)が影領域であることを示すフラグ(例えば、‘2’)とを関連付けて、部品映像記憶部70に書き込む。
観測画素Q(j,k)が影領域の画素でない場合、判定部60は、観測画素Q(j,k)が半影領域の画素であるかを判定する。
<半影領域の判定>
半影領域判定部65は、観測画素Q(j,k)の画素値が、背景判定基準線分BL上で最近画素値Qminから半影判定位置までの範囲に含まれる場合、観測画素Q(j,k)を半影領域の画素と判定するものである。
まず、半影領域判定部65は、基準方向SDに沿って、最近画素値Qminから所定距離L2の半影判定位置HPを予め設定する。この距離L2は、経験則により任意に設定可能である。
また、半影領域判定部65は、影領域判定部63と同様、背景判定基準線分BLから距離D2以内の場合、観測画素Q(j,k)を半影領域の画素と判定する。
つまり、半影領域判定部65は、観測画素Q(j,k)の画素値が、基準方向SDに沿って最近画素値Qminから半影判定位置HPまでの間、かつ、背景判定基準線分BLから距離D2までの範囲β2に含まれる場合、観測画素Q(j,k)を半影領域の画素と判定する。
観測画素Q(j,k)が半影領域の画素の場合、半影領域判定部65は、観測画素Q(j,k)と、この観測画素Q(j,k)が半影領域であることを示すフラグ(例えば、‘3’)とを関連付けて、部品映像記憶部70に書き込む。
観測画素Q(j,k)が半影領域の画素でない場合、判定部60は、観測画素Q(j,k)が背景領域の画素であるかを判定する。
<背景領域の判定>
背景領域判定部67は、観測画素Q(j,k)の画素値が、背景判定基準線分BL上で半影判定位置から最遠画素値Qmaxまでの範囲に含まれる場合、観測画素Q(j,k)を背景領域の画素と判定するものである。
ここで、背景領域判定部67は、影領域判定部63と同様、背景判定基準線分BLから距離D2以内の場合、観測画素Q(j,k)を背景領域の画素と判定する。
つまり、背景領域判定部67は、観測画素Q(j,k)の画素値が、基準方向SDに沿って半影判定位置HPから最遠画素値Qmaxまでの間、かつ、背景判定基準線分BLから距離D2までの範囲β3に含まれる場合、観測画素Q(j,k)を背景領域の画素と判定する。
観測画素Q(j,k)が背景領域の画素の場合、背景領域判定部67は、観測画素Q(j,k)と、この観測画素Q(j,k)が背景領域であることを示すフラグ(例えば、‘4’)とを関連付けて、部品映像記憶部70に書き込む。
なお、判定部60は、座標(j,k)の観測画素Qだけでなく、撮影映像Vの全観測画素Qに対して処理を行うことは言うまでもない。
<領域判定の具体例>
図10を参照し、判定部60による領域判定の具体例を説明する(適宜図1参照)。
図10(a)に示すように、撮影映像V(V,V,V)では、被写体90が左から右に動いている。そこで、この撮影映像Vで同一座標の観測画素Q(Q,Q,Q)が、どのように領域判定されるか説明する。
影領域判定部63は、図10(b)に示すように、観測画素Qが範囲β1に含まれるので、観測画素Qを影領域の画素と判定する。
被写体領域判定部61は、観測画素Qが、範囲α,β1〜β3の何れにも含まれないので、観測画素Qを被写体領域の画素と判定する。
背景領域判定部67は、観測画素Qが範囲β3に含まれるので、観測画素Qを背景領域の画素と判定する。
なお、図10(b)では、図面を見やすくするため、背景モデルMの一部を図示した。
図1に戻り、映像合成装置1の構成について、説明を続ける。
部品映像記憶部70は、判定部60の判定結果として、撮影映像Vの観測画素Qの画素値と、この観測画素Qの領域を示すフラグとを記憶するデータベースである。言い換えるなら、部品映像記憶部70は、撮影映像Vを、被写体領域、影領域、半影領域、背景領域等の部品映像毎に分割して記憶する。例えば、部品映像記憶部70としては、一般的なHDD、SSD等の記憶装置があげられる。
映像合成部80は、部品映像記憶部70に記憶された撮影映像Vを合成し、マルチモーション映像を生成するものである。そして、映像合成部80は、生成したマルチモーション映像を出力する。
<映像合成の具体例>
図11を参照し、映像合成の具体例について説明する(適宜図1参照)。
映像合成部80は、図11(a−1)の撮影映像V,Vの背景領域、半影領域、影領域、被写体領域の順で上書き合成することで、マルチモーション映像を生成する。
被写体領域と半影領域及び影領域とについては、異なる時間で抽出された重複部分が生じる。そこで、映像合成部80は、図11(a−2)の被写体領域と、図11(a−3)の半影領域及び影領域を分離する。そして、映像合成部80は、半影領域の画素の画素値を加重平均し、背景領域に合成する。さらに、映像合成部80は、影領域の画素の画素値を加重平均し、背景領域に合成する。最後に、映像合成部80は、被写体領域を時間順に背景領域に合成する。これにより、図11(a−4)に示すように、影領域の前後関係に不整合が生じることがなく、視聴者に違和感を与えることがない。
一方、従来手法では、図11(b−2)に示すように半影領域や影領域を分離しないので、図11(b−3)に示すように、被写体90の前面に影が合成されるといった影領域の前後関係に不整合が生じ、視聴者に違和感を与えてしまう。
[映像合成装置の動作]
図12を参照し、映像合成装置1の動作について説明する(適宜図1参照)。
ここでは、学習映像F及び撮影映像Vが映像記憶部10に記憶されていることとする。
図12に示すように、直線近似部20は、時刻1,…,Tの学習映像Fから同一座標の画素Pの画素値を取得する(ステップS1)。
直線近似部20は、取得した同一座標の画素P毎に、各時刻の画素Pの画素値を直交RGB色空間内の直線で近似する。そして、背景モデル生成部30は、直線近似部20が近似した直線を用いて、背景モデルMを生成する(ステップS2)。
映像合成装置1は、カウンタiが1,…,Tの間、ステップS3〜S10までの処理を繰り返す(ステップS3)。
映像合成装置1は、映像記憶部10から、時刻iの撮影映像Vを読み出す(ステップS4)。
映像合成装置1は、カウンタjが1,…の間、x、カウンタkが1,…,yの間、ステップS5〜S9までの処理を繰り返す(ステップS5)。なお、x,yは、それぞれ、予め設定した撮影映像Vの水平最大画素数、垂直最大画素数である。
背景モデル更新部50は、時刻iの撮影映像Vから座標(j,k)の観測画素Qを取得する(ステップS6)。
背景モデル更新部50は、観測画素Q(j,k)の背景モデルMにおいて、最近画素値及び最遠画素値を更新する(ステップS7)。
判定部60は、観測画素Q(j,k)が、被写体領域、影領域、半影領域又は背景領域の何れか判定する。
具体的には、被写体領域判定部61は、観測画素Q(j,k)の画素値が範囲α(図8)から外れる場合、観測画素Q(j,k)を被写体領域の画素と判定する。
また、影領域判定部63は、観測画素Q(j,k)の画素値が範囲β1(図9)に含まれる場合、観測画素Q(j,k)を影領域の画素と判定する。
そして、半影領域判定部65は、観測画素Q(j,k)の画素値が範囲β2(図9)に含まれる場合、観測画素Q(j,k)を半影領域の画素と判定する。
さらに、背景領域判定部67は、観測画素Q(j,k)の画素値が範囲β3(図9)に含まれる場合、観測画素Q(j,k)を背景領域の画素と判定する(ステップS8)。
映像合成装置1は、カウンタj,kをインクリメントする(ステップS9)。
映像合成装置1は、カウンタiをインクリメントする(ステップS10)。
映像合成部80は、撮影映像の背景領域、半影領域、影領域、被写体領域の順で上書き合成することで、マルチモーション映像を生成する(ステップS11)。
[作用・効果]
以上のように、映像合成装置1は、主光源反射ベクトルMV及び環境光反射ベクトルEVを用いて、照明条件による色や輝度の変動を、背景モデルMとしてモデル化する。そして、映像合成装置1は、背景モデルMの性質により背景モデルMを更新し、その背景モデルMを用いることで、領域判定精度を向上させることができる。
すなわち、映像合成装置1は、時間の経過に伴って環境光の色が変化することの影響を背景モデルMに逐次更新する。そして、映像合成装置1は、頑健に被写体領域の抽出を可能とするので、合成映像の品質を向上させることができる。さらに、映像合成装置1は、背景領域や影領域の抽出精度の向上により、映像表現の自由度を拡大することができる。
(第2実施形態)
[映像合成装置の構成]
図13を参照し、本発明の第2実施形態に係る映像合成装置1Bの構成について、第1実施形態と異なる点を説明する。
映像合成装置1Bは、外部で映像合成を行うための合成情報を生成する点が、第1実施形態と異なる。
図13に示すように、映像合成装置1Bは、映像記憶部10と、直線近似部20と、背景モデル生成部30と、背景モデル記憶部40と、背景モデル更新部50と、判定部60と、部品映像記憶部70と、映像合成部80と、合成情報生成部81とを備える。
なお、合成情報生成部81以外の各手段は、第1実施形態と同様のため、説明を省略する。
合成情報生成部81は、背景モデル生成部30に記憶されている背景モデルMを参照し、灰色世界仮説を前提として、合成情報を生成するものである。そして、合成情報生成部81は、生成した合成情報を外部(例えば、映像処理装置)に出力する。
なお、灰色世界仮説とは、物体の平均色が灰色になるという仮説のことである。
<合成情報の生成>
図14を参照し、合成情報の生成について説明する(適宜図1参照)。
ここでは、説明を簡易にするため、異なる3座標の観測画素Q〜Qの背景モデルMを扱うこととする。
合成情報生成部81は、図14(a)に示すように、それぞれの背景モデルMから背景判定基準線分BL〜BLを抽出し、同一の直交RGB色空間に配置する。ここで、背景判定基準線分BL〜BLの端点をそれぞれ、最近画素値Qmin1〜Qmin3、最遠画素値Qmax1〜Qmax3とする。
次に、合成情報生成部81は、図14(b)に示すように、最遠画素値Qmax1〜Qmax3を、最遠画素値Qmax1〜Qmax3の平均位置に合わせるように背景判定基準線分BL〜BLを移動させる。そして、合成情報生成部81は、移動後の背景判定基準線分BL〜BLにおいて、最近画素値Qmin1〜Qmin3の平均を求める。
次に、合成情報生成部81は、図14(c)に示すように、最近画素値Qmin1〜Qmin3の平均QAveを求め、この平均QAveが始点となるように背景判定基準線分BL〜BLを移動させる。そして、合成情報生成部81は、移動後の背景判定基準線分BL〜BLにおいて、最遠画素値Qmax1〜Qmax3の平均を求める。
次に、合成情報生成部81は、原点Oから、求めた最近画素値Qmin1〜Qmin3の平均までのベクトルを環境光ベクトルとして生成する。さらに、合成情報生成部81は、原点Oから最遠画素値Qmax1〜Qmax3の平均までのベクトルを主光源ベクトルとして生成する。
[映像合成装置の動作]
図15を参照し、映像合成装置1Bの動作について説明する(適宜図13参照)。
なお、ステップS1〜S11の処理は、第1実施形態と同様のため、説明を省略する。
図15に示すように、合成情報生成部81は、背景モデル生成部30に記憶されている背景モデルMを参照し、合成情報を生成する。
具体的には、合成情報生成部81は、最遠画素値Qmaxを同一位置に合わせたときの最近画素値Qminの平均、及び、最近画素値Qminの平均QAveを始点とした最遠画素値Qmaxの平均を求める。そして、合成情報生成部81は、原点Oから最近画素値Qminの平均までの環境光ベクトル、及び、原点Oから最遠画素値Qmaxの平均までの主光源ベクトルを合成情報として生成する(ステップS12)。
[作用・効果]
以上のように、映像合成装置1Bは、第1実施形態と同様、領域判定精度を向上させることができる。さらに、映像合成装置1Bは、灰色世界仮説を前提として合成情報を生成するので、外部で映像合成を行う場合でも、領域判定精度を向上させることができる。
(変形例)
以上、本発明の各実施形態を詳述してきたが、本発明は前記した各実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
前記した各実施形態では、背景領域が変化しないことを想定しているが、本発明は、背景領域が変化する場合(例えば、木の葉が揺れる場合)にも適用することができる。
この場合、直線近似部は、学習映像の各画素の画素値をクラスタリングし、クラスタ毎に最小二乗法によるフィッティングを行う。ここで、クラスタリングの手法としては、例えば、Mean Shift法があげられ、処理時間を短縮できるので、K-means法、X-means法等を用いることが好ましい。
その後、被写体領域判定部、影領域判定部、半影領域判定部及び背景領域判定部は、クラスタ毎の直線に対して判定を行えばよい。
前記した各実施形態では、映像合成装置を独立したハードウェアとして説明したが、本発明は、これに限定されない。例えば、本発明は、コンピュータが備えるCPU、メモリ、ハードディスク等のハードウェア資源を、前記した映像合成装置として協調動作させる
映像合成プログラムで実現することもできる。このプログラムは、通信回線を介して配布してもよく、CD−ROMやフラッシュメモリ等の記録媒体に書き込んで配布してもよい。
本発明は、動画コンテンツの映像合成に利用することができる。また、本発明は、監視カメラによる移動物体の検知や統計情報抽出の前処理に利用することができる。
1,1B 映像合成装置(領域判定装置)
2 ビデオカメラ(固定カメラ)
10 映像記憶部
20 直線近似部
30 背景モデル生成部
40 背景モデル記憶部
50 背景モデル更新部
60 判定部
61 被写体領域判定部
63 影領域判定部
65 半影領域判定部
67 背景領域判定部
70 部品映像記憶部
80 映像合成部
81 合成情報生成部
90 被写体
91 光源
92 半影領域
93 影領域

Claims (6)

  1. 動いている被写体を固定カメラで撮影した所定時間分の撮影映像に含まれる被写体領域、影領域、半影領域及び背景領域を判定する領域判定装置であって、
    所定時間分の学習映像から各時刻で同一座標の画素の画素値を取得し、取得した当該同一座標の画素毎に、前記各時刻の画素の画素値を直交RGB色空間内の直線で近似する直線近似部と、
    前記学習映像の画素毎に、前記直交RGB色空間の原点を始点として予め設定した環境光反射ベクトル、及び、前記環境光反射ベクトルの終点から前記直線を延長した位置までの主光源反射ベクトルからなる背景モデルを生成する背景モデル生成部と、
    各時刻の前記撮影映像から同一座標の画素を観測画素として取得し、取得した当該観測画素の画素値うち、前記背景モデルにおいて、前記直線で前記原点に近い側の端点に最寄の画素値を最近画素値、及び、前記直線で前記原点から遠い側の端点に最寄の画素値を最遠画素値として更新する背景モデル更新部と、
    前記観測画素の画素値が、前記主光源反射ベクトル上で前記最近画素値と前記最遠画素値との間の背景判定基準線分から予め設定した距離以上離れる場合、前記観測画素を前記被写体領域の画素と判定する被写体領域判定部と、
    前記最近画素値から前記原点までの基準方向で前記原点から所定距離の基準位置を予め設定し、前記観測画素の画素値が、前記環境光反射ベクトル又は前記主光源反射ベクトルで前記基準位置から前記最近画素値までの範囲に含まれる場合、前記観測画素を前記影領域の画素と判定する影領域判定部と、
    前記基準方向で前記最近画素値から所定距離の半影判定位置を予め設定し、前記観測画素の画素値が、前記背景判定基準線分上で前記最近画素値から前記半影判定位置までの範囲に含まれる場合、前記観測画素を前記半影領域の画素と判定する半影領域判定部と、
    前記観測画素の画素値が、前記背景判定基準線分上で前記半影判定位置から前記最遠画素値までの範囲に含まれる場合、前記観測画素を前記背景領域の画素と判定する背景領域判定部と、
    を備えることを特徴とする領域判定装置。
  2. 前記影領域判定部は、前記観測画素の画素値が、前記基準位置から前記最近画素値までの範囲に含まれ、前記環境光反射ベクトル又は前記主光源反射ベクトルから予め設定した距離以内の場合、前記観測画素を前記影領域の画素と判定することを特徴とする請求項1に記載の領域判定装置。
  3. 前記半影領域判定部は、前記観測画素の画素値が、前記最近画素値から前記半影判定位置までの範囲に含まれ、前記背景判定基準線分から予め設定した距離以内の場合、前記観測画素を前記半影領域の画素と判定することを特徴とする請求項1又は請求項2に記載の領域判定装置。
  4. 前記背景領域判定部は、前記観測画素の画素値が、前記半影判定位置から前記最遠画素値までの範囲に含まれ、前記背景判定基準線分から予め設定した距離以内の場合、前記観測画素を前記背景領域の画素と判定することを特徴とする請求項1から請求項3の何れか一項に記載の領域判定装置。
  5. 前記最遠画素値を当該最遠画素値の平均に合わせたときの各背景判定基準線分の最近画素値の平均を求め、前記最近画素値の平均を始点とした各背景判定基準線分の最遠画素値の平均を求め、前記原点から前記最近画素値の平均までの環境光ベクトル、及び、前記原点から前記最遠画素値の平均までの主光源ベクトルを表した合成情報を生成する合成情報生成部、をさらに備えることを特徴とする請求項1から請求項4の何れか一項に記載の領域判定装置。
  6. コンピュータを、請求項1から請求項5の何れか一項に記載の領域判定装置として機能させるための領域判定プログラム。
JP2017235718A 2017-12-08 2017-12-08 領域判定装置及びそのプログラム Pending JP2019102008A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017235718A JP2019102008A (ja) 2017-12-08 2017-12-08 領域判定装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017235718A JP2019102008A (ja) 2017-12-08 2017-12-08 領域判定装置及びそのプログラム

Publications (1)

Publication Number Publication Date
JP2019102008A true JP2019102008A (ja) 2019-06-24

Family

ID=66977005

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017235718A Pending JP2019102008A (ja) 2017-12-08 2017-12-08 領域判定装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP2019102008A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080031526A1 (en) * 2006-08-03 2008-02-07 Tandent Vision Science, Inc. Methods for discriminating moving objects in motion image sequences

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080031526A1 (en) * 2006-08-03 2008-02-07 Tandent Vision Science, Inc. Methods for discriminating moving objects in motion image sequences

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"揺れと影に頑健な屋外背景差分法の提案", 電子情報通信学会技術研究報告 VOL.116 NO.366, JPN6021044291, 8 December 2016 (2016-12-08), ISSN: 0004634394 *
DAWEI LI, LIHONG XU, AND ERIK D. GOODMAN: "Illumination-Robust Foreground Detection in a Video Surveillance System", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, vol. 23, no. 10, JPN7021004785, 29 January 2013 (2013-01-29), US, pages 1637 - 1650, XP011528515, ISSN: 0004634395, DOI: 10.1109/TCSVT.2013.2243649 *

Similar Documents

Publication Publication Date Title
US11238644B2 (en) Image processing method and apparatus, storage medium, and computer device
US8698913B2 (en) Color correction device, color correction method, dynamic camera color correction device, and video search device using the same
US11765321B2 (en) Intelligent video surveillance system and method
WO2019128507A1 (zh) 图像处理方法、装置、存储介质及电子设备
US10824910B2 (en) Image processing method, non-transitory computer readable storage medium and image processing system
JP2014178957A (ja) 学習データ生成装置、学習データ作成システム、方法およびプログラム
JP5263694B2 (ja) 物体位置推定用情報作成装置、物体位置推定用情報作成方法およびプログラム
US20180357819A1 (en) Method for generating a set of annotated images
US20210248427A1 (en) Method and system of neural network object recognition for image processing
US10992902B2 (en) Aspect ratio conversion with machine learning
JP2014089626A (ja) 画像検出装置及び制御プログラム並びに画像検出方法
GB2467804A (en) Method and system for foreground detection using multi-modality fusion graph cut
JP2008501172A (ja) 画像比較方法
KR20090087670A (ko) 촬영 정보 자동 추출 시스템 및 방법
US11676252B2 (en) Image processing for reducing artifacts caused by removal of scene elements from images
JP2018124890A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
CN111402412A (zh) 数据采集方法及装置、设备、存储介质
US11812154B2 (en) Method, apparatus and system for video processing
KR20130024007A (ko) 영상 촬영 장치 및 그 제어 방법
JP7092615B2 (ja) 影検出装置、影検出方法、影検出プログラム、学習装置、学習方法、及び学習プログラム
JP2016058840A (ja) 撮像装置、画像処理装置、撮像方法及びプログラム
EP2807631B1 (en) Device and method for detecting a plant against a background
JP2019102008A (ja) 領域判定装置及びそのプログラム
KR20180069312A (ko) 라이트 필드 동영상을 이용한 물체 추적 방법 및 장치
WO2019085496A1 (en) Feedback based scanning system and methods

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220105

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220607