JP6709761B2 - 画像処理装置、画像処理方法及び画像処理プログラム - Google Patents

画像処理装置、画像処理方法及び画像処理プログラム Download PDF

Info

Publication number
JP6709761B2
JP6709761B2 JP2017157006A JP2017157006A JP6709761B2 JP 6709761 B2 JP6709761 B2 JP 6709761B2 JP 2017157006 A JP2017157006 A JP 2017157006A JP 2017157006 A JP2017157006 A JP 2017157006A JP 6709761 B2 JP6709761 B2 JP 6709761B2
Authority
JP
Japan
Prior art keywords
image
foreground
image processing
transparency
frame image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017157006A
Other languages
English (en)
Other versions
JP2019036848A (ja
Inventor
真理子 山口
真理子 山口
喜秀 外村
喜秀 外村
長田 秀信
秀信 長田
高田 英明
英明 高田
日高 浩太
浩太 日高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017157006A priority Critical patent/JP6709761B2/ja
Publication of JP2019036848A publication Critical patent/JP2019036848A/ja
Application granted granted Critical
Publication of JP6709761B2 publication Critical patent/JP6709761B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Studio Circuits (AREA)

Description

本発明は、動画像から前景領域を抜き出すビデオマッティングの技術に関する。
マッティングは、画像から被写体(前景)を切り抜き別背景と違和感なく合成する技術である。前景をF、背景をB、前景の透明度(アルファ値)をα(0≦α≦1)とすると、合成画像の各画素Iは次式で表される。
I=αF+(1−α)B
従来、様々なマッティング方法が提案されている。例えば、KNN(K nearest neighbors:K近傍法)マッティングでは、ある注目画素iは他のk個の類似画素(KNN(i))の線形近似から導出できると仮定し、アルファ値を求めている。
KNNを用いたビデオマッティングは、1枚の画像から前景を切り抜くマッティング技術を拡張したものであり、動画像から動いている被写体を切り抜く技術である。
Dingzeyu Li, Qifeng Chen, and Chi-Keung Tang, "Motion-Aware KNN Laplacian for Video Matting", ICCV '13 Proceedings of the 2013 IEEE International Conference on Computer Vision, IEEE Computer Society, December 2013, pp. 3599-3606
ビデオマッティングにおいて、フレーム画像の一枚一枚をマッティング処理した場合、ノイズや近似計算の誤差からフレーム間でアルファ値が変化し、前景画像の縁がちらつくフリッカと呼ばれる現象が発生することがある。
この問題に対して、非特許文献1では、KNNマッティングにおいて1枚のフレーム画像の特徴ベクトルを用いてラプラシアン行列を作成していたものを、複数のフレーム画像を同時に用いてラプラシアン行列を作成することでフリッカの発生を抑えた。
しかしながら、非特許文献1の技術では、参照するフレーム画像の数に従って行列のサイズが増大するため、計算量が膨大となってしまうという問題があった。例えば、参照するフレーム画像の数が1である場合、つまり2枚のフレーム画像を用いる場合、1枚のフレーム画像の画素数をNとすると、必要な行列の大きさは2N×2Nとなる。
本発明は、上記に鑑みてなされたものであり、ビデオマッティングにおいてフリッカの発生を抑えるとともに、処理速度を向上させることを目的とする。
第1の本発明に係る画像処理装置は、動画像から前景画像を切り出す画像処理装置であって、前記動画像を構成するフレーム画像と当該フレーム画像において既知の前景及び背景を示す情報を入力する入力手段と、前記フレーム画像と前記既知の前景及び背景を示す情報を用いてK近傍法に基づくマッティングで用いるラプラシアン行列を導出するラプラシアン行列導出手段と、処理対象のフレーム画像と前のフレーム画像との間で透明度が変化しないと推定される静止領域を判別する静止領域判別手段と、前記K近傍法に基づくマッティングに前記静止領域の制約を加えて前記前景画像の透明度を算出する透明度算出手段と、前記前景画像の透明度を用いて前記前景画像を切り出す出力手段と、を有することを特徴とする。
第2の本発明に係る画像処理方法は、動画像から前景画像を切り出す画像処理装置によって実行される画像処理方法であって、前記動画像を構成するフレーム画像と当該フレーム画像において既知の前景及び背景を示す情報を入力するステップと、前記フレーム画像と前記既知の前景及び背景を示す情報を用いてK近傍法に基づくマッティングで用いるラプラシアン行列を導出するステップと、処理対象のフレーム画像と前のフレーム画像との間で透明度が変化しないと推定される静止領域を判別するステップと、前記K近傍法に基づくマッティングに前記静止領域の制約を加えて前記前景画像の透明度を算出するステップと、前記前景画像の透明度を用いて前記前景画像を切り出すステップと、を有することを特徴とする。
第3の本発明に係る画像処理プログラムは、上記画像処理装置の各手段としてコンピュータを動作させることを特徴とする。
本発明によれば、ビデオマッティングにおいてフリッカの発生を抑えるとともに、処理速度を向上させることができる。
本実施形態の画像処理装置の構成を示す機能ブロック図である。 本実施形態の画像処理装置の処理の流れを示すフローチャートである。 注目画素とフレーム画像内の各画素との類似度を示す図である。 k個の類似画素の類似度を示す図である。 類似性行列の例を示す図である。 k個の類似画素の類似度の総和を示す図である。 類似度の総和を対角化した対角行列の例を示す図である。 ラプラシアン行列の例を示す図である。 静止領域を判別し、静止領域に対する対角行列を導出する処理の流れを示すフローチャートである。
以下、本発明の実施の形態について図面を用いて説明する。
図1は、本実施形態の画像処理装置1の構成を示す機能ブロック図である。
画像処理装置1は、入力部11、類似性行列計算部12、静止領域判別部13、透明度計算部14、及び出力部15を備える。画像処理装置1が備える各部は、演算処理装置、記憶装置等を備えたコンピュータにより構成して、各部の処理がプログラムによって実行されるものとしてもよい。このプログラムは画像処理装置1が備える記憶装置に記憶されており、磁気ディスク、光ディスク、半導体メモリ等の記録媒体に記録することも、ネットワークを通して提供することも可能である。
入力部11は、動画像を構成する一連のフレーム画像とフレーム画像の既知情報である前景領域(絶対前景)と背景領域(絶対背景)に属する画素情報を入力する。画素情報は、例として、trimapと呼ばれるフレーム画像の各画素に対して前景、背景、又は未知のラベルを付与した画像などでもよく、あるいはインタラクションによってユーザが既知の前景及び背景を指定したスクリブルを用いてもよい。
類似性行列計算部12は、現在フレーム画像について、KNNに基づくマッティングで用いるラプラシアン行列を導出する。
静止領域判別部13は、現在フレーム画像と前のフレーム画像との間でアルファ値が変化しないと推定される静止領域を判別する。静止領域は、フレーム画像間で対応する画素の変化が小さく、フレーム画像間で対応する画素が互いに同一のアルファ値を持つと思われる領域である。静止領域の判別には、オプティカルフロー、輝度値差分の閾値によるクラスタリング、パーティクルフィルタを利用できる。
透明度計算部14は、ラプラシアン行列に既知領域(絶対前景・絶対背景)の制約を加えるとともに、さらに、静止領域の制約を加えた式を用いてアルファ値を求める。透明度計算部14が用いる式については後述する。
出力部15は、求めたアルファ値に従ってフレーム画像から前景画像を切り出す。
次に、本実施形態の画像処理装置1の動作について説明する。
図2は、本実施形態の画像処理装置1の処理の流れを示すフローチャートである。
入力部11は、フレーム画像とtrimapを入力する(ステップS11)。
類似性行列計算部12は、従来のKNNマッティングと同様に、類似性行列Aを求め、ラプラシアン行列Lを導出する(ステップS12)。
ここで、KNNマッティングについて説明する。KNNマッティングでは、ある注目画素iは他のk個の類似画素(KNN(i))の線形近似から導出できるという仮定に基づき、アルファ値は次式として表される。
Figure 0006709761
ここで、k(i,j)は、特徴により重み付けされた線形カーネル関数であり、Xは特徴ベクトルである。k(i,j)により位置iと位置jのアルファ値の類似度が得られる。類似性行列をA=[k(i,j)]とし、Diを対角化したものをDとすると、次式となるαが導出したい全ての画素のアルファ値のベクトルである。
Figure 0006709761
上記の式は解が不定となるため、従来のKNNマッティングではtrimap等既知領域の制約を加えた次式によりαを導出する。
Figure 0006709761
ここで、vは、trimap等により制約として与えられた各画素のアルファ値をベクトル化したものである。絶対前景の画素のアルファ値は1となる。絶対背景及び未知領域の画素のアルファ値は0となる。上記式のDは、vを対角化した対角行列である。λは、trimap等の制約の影響を調節する係数である。
図3〜8を用いて、類似性行列計算部12によるラプラシアン行列Lの導出を具体的に説明する。図3〜8では簡単のために1枚のフレーム画像が14画素で構成されているものとする。
注目画素iとフレーム画像内の各画素との類似度を計算し、上位k個(例えばk=5)の類似画素を抽出する(図3)。
k個の類似画素の対応箇所に類似度を代入する(図4)。
すべての画素に対して上記の処理を繰り返し、類似性行列Aを導出する(図5)。フレーム画像の画素数をNとすると、類似性行列Aの大きさはN×Nとなる。
また、注目画素iのk個の類似画素の類似度の総和Diを算出し(図6)、対角行列Dの注目画素iに対応する箇所にDiを代入して対角行列Dを導出する(図7)。
そして、D−A=Lとなるラプラシアン行列Lを導出する(図8)。
以上の処理により、ラプラシアン行列Lが得られる。
図2に戻り、静止領域判別部13は、静止領域を判別し、静止領域に対する対角行列Dsを導出する(ステップS13)。
図9は、静止領域を判別し、対角行列Dsを導出する処理の流れを示すフローチャートである。本実施形態では、フレーム画像間の輝度値の差分を用いて静止領域を判別する。静止領域の判別の前処理として、現フレーム画像と前フレーム画像をグレースケール化し、N×Nの空の行列Dsを用意しておく。
フレーム画像間で同位置にある画素の輝度値の差分を取る(ステップS21)。
差分の絶対値が閾値(例えば100)以下であり(ステップS22のYES)、かつ未知領域の画素である場合(ステップS23のYES)、対角行列Dsの対応箇所の数値を1とする(ステップS24)。
差分の絶対値が閾値を超えている場合(ステップS22のNO)、又は既知領域の画素である場合(ステップS23のNO)、対角行列Dsの対応箇所の数値を0とする(ステップS25)。
ステップS21〜S25の処理をフレーム画像内のすべての画素について行う(ステップS26)。
以上の処理により、静止領域に対する対角行列Dsが得られる。
図2に戻り、透明度計算部14は、ラプラシアン行列にtrimap等既知領域の制約を加えるとともに、フレーム間の静止領域の制約を加えた次式を用いてアルファ値を計算する(ステップS14)。
Figure 0006709761
ここで、Dm,Dsは制約となる対応画素が1となる対角行列、vm,vsは制約として与えるアルファ値、λm,λsはそれぞれの影響を調整する係数である。より具体的には、vmはtrimap等の制約により与えられた各画素のアルファ値(絶対前景の画素は1、その他の画素は0)をベクトル化したものである。Dmは、vmを対角化した対角行列である。Dsは、静止領域判別部13で得られた静止領域に対する対角行列である。vsは、前フレームのアルファ値をベクトル化したものであり、静止領域と判別された画素に対応する箇所には前フレームのアルファ値を入れる。本実施形態では、λm=1000,λs=10として、trimap等で指定された絶対前景をフレーム間で判別した静止領域よりも信頼した。
出力部15は、透明度計算部14の導出したアルファ値を用いて、現フレーム画像から前景画像を切り出して出力する(ステップS15)。
本実施形態の画像処理方法を用いることで、従来のKNNマッティングに比べてフリッカを抑制できることが確認できた。また、本実施形態の画像処理方法は、非特許文献1の方法よりも約2倍の処理速度であった。
以上説明したように、本実施の形態によれば、静止領域判別部13が動画像のフレーム画像間の静止領域を判別し、フレーム間情報を加法型に分解することで、アルファ値を求めるために必要な行列のサイズを増大させることなく、複数のフレームを考慮してアルファ値を求めることができる。その結果、ビデオマッティングにおいてフリッカの発生を抑えるとともに、処理速度を向上させることができる。
1…画像処理装置
11…入力部
12…類似性行列計算部
13…静止領域判別部
14…透明度計算部
15…出力部

Claims (5)

  1. 動画像から前景画像を切り出す画像処理装置であって、
    前記動画像を構成するフレーム画像と当該フレーム画像において既知の前景及び背景を示す情報を入力する入力手段と、
    前記フレーム画像と前記既知の前景及び背景を示す情報を用いてK近傍法に基づくマッティングで用いるラプラシアン行列を導出するラプラシアン行列導出手段と、
    処理対象のフレーム画像と前のフレーム画像との間で透明度が変化しないと推定される静止領域を判別する静止領域判別手段と、
    前記K近傍法に基づくマッティングに前記静止領域の制約を加えて前記前景画像の透明度を算出する透明度算出手段と、
    前記前景画像の透明度を用いて前記前景画像を切り出す出力手段と、
    を有することを特徴とする画像処理装置。
  2. 前記静止領域判別手段は、前景及び背景が既知でない画素について静止領域であるか否かを判別することを特徴とする請求項1に記載の画像処理装置。
  3. 動画像から前景画像を切り出す画像処理装置によって実行される画像処理方法であって、
    前記動画像を構成するフレーム画像と当該フレーム画像において既知の前景及び背景を示す情報を入力するステップと、
    前記フレーム画像と前記既知の前景及び背景を示す情報を用いてK近傍法に基づくマッティングで用いるラプラシアン行列を導出するステップと、
    処理対象のフレーム画像と前のフレーム画像との間で透明度が変化しないと推定される静止領域を判別するステップと、
    前記K近傍法に基づくマッティングに前記静止領域の制約を加えて前記前景画像の透明度を算出するステップと、
    前記前景画像の透明度を用いて前記前景画像を切り出すステップと、
    を有することを特徴とする画像処理方法。
  4. 前記静止領域を判別するステップは、前景及び背景が既知でない画素について静止領域であるか否かを判別することを特徴とする請求項3に記載の画像処理方法。
  5. 請求項1又は2に記載の画像処理装置の各手段としてコンピュータを動作させることを特徴とする画像処理プログラム。
JP2017157006A 2017-08-16 2017-08-16 画像処理装置、画像処理方法及び画像処理プログラム Active JP6709761B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017157006A JP6709761B2 (ja) 2017-08-16 2017-08-16 画像処理装置、画像処理方法及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017157006A JP6709761B2 (ja) 2017-08-16 2017-08-16 画像処理装置、画像処理方法及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2019036848A JP2019036848A (ja) 2019-03-07
JP6709761B2 true JP6709761B2 (ja) 2020-06-17

Family

ID=65636016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017157006A Active JP6709761B2 (ja) 2017-08-16 2017-08-16 画像処理装置、画像処理方法及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP6709761B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4304578B2 (ja) * 2003-03-31 2009-07-29 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
JP4419500B2 (ja) * 2003-09-30 2010-02-24 セイコーエプソン株式会社 静止画像生成装置、静止画像生成方法、静止画像生成プログラム、および静止画像生成プログラムを記録した記録媒体
BRPI1008024A2 (pt) * 2009-02-10 2016-03-15 Thomson Licensing produção de superfície fosca de vídeo com base em propagação de restrição de primeiro plano-segundo plano
JP6355333B2 (ja) * 2013-12-27 2018-07-11 キヤノン株式会社 撮像装置、画像処理装置、画像処理方法、プログラム
CN105654458A (zh) * 2014-11-14 2016-06-08 华为技术有限公司 图像处理的方法及装置

Also Published As

Publication number Publication date
JP2019036848A (ja) 2019-03-07

Similar Documents

Publication Publication Date Title
CN111327945B (zh) 用于分割视频的方法和装置
JP4725690B2 (ja) 映像識別子抽出装置
EP4156017A1 (en) Action recognition method and apparatus, and device and storage medium
CN105184763B (zh) 图像处理方法和装置
CN106331723B (zh) 一种基于运动区域分割的视频帧率上变换方法及系统
CN110796662B (zh) 一种实时的语义视频分割方法
JP2009147807A (ja) 画像処理装置
KR20150032822A (ko) 이미지를 필터링하기 위한 방법 및 장치
JP2003032688A (ja) 動画像の前景背景領域分離方法、及びその方法を用いた条件付画素補填による動画像符号化方法
US8526674B2 (en) Motion-based, multi-stage video segmentation with motion boundary refinement
US10990826B1 (en) Object detection in video
Bae et al. Dual-dissimilarity measure-based statistical video cut detection
Zhang et al. Spatiotemporal saliency detection based on maximum consistency superpixels merging for video analysis
JP5644505B2 (ja) 照合加重情報抽出装置
JP5914046B2 (ja) 画像処理装置および画像処理方法
JP2014110020A (ja) 画像処理装置、画像処理方法および画像処理プログラム
He et al. Iterative transductive learning for automatic image segmentation and matting with RGB-D data
JP6709761B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
Bairagi et al. Texture-based medical image compression
Yang et al. Depth map reconstruction and rectification through coding parameters for mobile 3D video system
Zhu et al. Improved accuracy of superpixel segmentation by region merging method
JP2007156954A (ja) 信頼度テーブル作成方法、オプティカルフロー推定方法、信頼度テーブル作成装置、オプティカルフロー推定装置、及びプログラム
US9471992B2 (en) Moving image processing apparatus, moving image processing method, and computer product
Goel et al. IamAlpha: Instant and Adaptive Mobile Network for Alpha Matting.
WO2024013893A1 (ja) 物体検出装置、物体検出方法、及び物体検出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200519

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200525

R150 Certificate of patent or registration of utility model

Ref document number: 6709761

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150