JP3551908B2 - 背景スプライトと前景オブジェクトの分離方法、及びその装置 - Google Patents

背景スプライトと前景オブジェクトの分離方法、及びその装置 Download PDF

Info

Publication number
JP3551908B2
JP3551908B2 JP2000287550A JP2000287550A JP3551908B2 JP 3551908 B2 JP3551908 B2 JP 3551908B2 JP 2000287550 A JP2000287550 A JP 2000287550A JP 2000287550 A JP2000287550 A JP 2000287550A JP 3551908 B2 JP3551908 B2 JP 3551908B2
Authority
JP
Japan
Prior art keywords
image
foreground
background
sprite
macroblock
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000287550A
Other languages
English (en)
Other versions
JP2002118843A (ja
Inventor
久美 秦泉寺
重樹 岡田
裕 渡辺
小林  直樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000287550A priority Critical patent/JP3551908B2/ja
Publication of JP2002118843A publication Critical patent/JP2002118843A/ja
Application granted granted Critical
Publication of JP3551908B2 publication Critical patent/JP3551908B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、MPEG−4のオブジェクト符号化の中のスプライト符号化において、背景スプライトと前景オブジェクトを分離する技術に関する。
【0002】
特に、MPEG−4においてVersion 1 Main Profileでビデオオブジェクト毎に符号化する「オブジェクト符号化」において、背景オブジェクトをパノラマ画像で表現する(スプライト符号化)によりサポートされる前景オブジェクトと背景スプライトを分離抽出する技術に関する。
【0003】
また、本発明は、MPEG−4での任意形状オブジェクト表現であるテクスチャマップと形状マスクのうちの、形状マスクを生成する前景の形状マスク抽出技術に関する。
【0004】
【従来の技術】
本明細書の説明において、便宜上、動物体を前景オブジェクト、背景パノラマを背景スプライトと記す。
【0005】
背景スプライトと前景オブジェクトを分離する技術に関連し、従来の前景オブジェクトの抽出に関する技術としては、第1に、一定色で作られた背景の前面に人物等を配置して、人物等前景をクロマキー処理して抜き出す方法がある。
【0006】
また、第2に、予め手動でおおまかな輪郭を指定し、その周囲の画素を前景か背景か判断する方法がある。
【0007】
また、第3に、固定カメラの下で撮影された画像において、フレーム間差分によって動領域輪郭を特定し、その内側を前景、外側を背景と判断する方法がある。
【0008】
従来の背景スプライトの抽出に関する技術としては、第1に、スプライト作成に共通の前処理として、隣接フレーム間のグローバルモーションを算出し、それを基準座標からの変換(絶対グローバルモーション)を計算する。その後、絶対グローバルモーションで位置合わせされた各フレームは時間方向にメディアン、平均値をとる方法がある。
【0009】
また、第2に、前処理後、絶対グローバルモーションを用いて位置合わせをし、そのままオーバライト(上書き)、もしくは、アンダーライト(画素の決定されていないところだけ、埋めていく)する方法がある。
【0010】
しかしながら、上記従来の前景オブジェクトを抽出する第1の方法は、既存の映像には適用できないという問題と、クロマキー用の大掛りな装置を必要とするという問題がある。
【0011】
また、上記従来の前景オブジェクトを抽出する第2の方法は、人手を介する必要があり、リアルタイムアプリケーションには不適切であるという問題がある。
【0012】
また、上記従来の前景オブジェクトを抽出する第3の方法は、フレーム間差分を基本としているため、カメラの動き(パン、チルトなど)がある場合に、前景オブジェクトの輪郭情報が得られないという問題がある。また、カメラの動きをキャンセルするようなフレームの位置合わせ処理を行って、差分をとったとしても、カメラの動きを完全にキャンセルできないために、前景オブジェクト以外のところにも差分値が現れ、前景オブジェクトの輪郭の特定が困難になるという問題がある。
【0013】
また、上記従来の背景スプライトを抽出する第1の方法は、多少なりともグローバルモーションに誤差があると、位置合わせが微妙にずれて、スプライトの品質を悪化させるという問題がある。
【0014】
また、上記従来の背景スプライトを抽出する第2の方法は、スプライトの画質はよいものの、一番手前にくる画像の前景がそのままスプライトに残ってしまうという問題がある。
【0015】
次に、MPEG−4での任意形状オブジェクト表現であるテクスチャマップと形状マスクのうちの、形状マスクとしての前景オブジェクト形状を生成する従来技術について説明する。
【0016】
従来の前景オブジェクト生成方法として、背景画像と任意の画像の差分を閾値処理し、ある閾値より大きい差分を得られる座標を動物体と見做し、前景画像とする技術がある。まず、この生成された前景オブジェクトを符号化する方法としてのMPEG−4のオブジェクト符号化について説明する。
【0017】
MPEG−4においては、任意形状の前景オブジェクトを符号化できる。一つの前景オブジェクトは、一対のテクスチャマップと形状マスクで表現できる。形状マスクには、透過度も考慮した多値形状、透過度は考慮しない2値形状の2種類あるが、ここでは、2値形状のみを想定する。テクスチャマップは、オブジェクトの存在する場所に従来方式(MPEG1、2等)における輝度(Y信号)及び色差信号(Cb、Cr信号)が充てられるものである。形状マスクはオブジェクトの存在する部分に255の値が、また、それ以外の部分に0の値が充てられるものである。ある画素(座標)において、テクスチャに3種類、形状に1種類の計4種類の画素値が充てられる。ここでは、区別するために、それぞれをテクスチャ画素、形状画素と呼ぶことにする。テクスチャ画素は0から255の値をとる。また、形状画素は0もしくは255の値をとる。図1(a)にテクスチャ表現の例を、図1(b)に形状マスク表現の例を示す。
【0018】
MPEG−4の形状符号化について以下に説明する。なお、以下で説明する内容はMPEG−4における形状符号化として当業者に知られているものである。(詳しくは、参考文献「MPEG−4のすべて」pp.38 〜116 工業調査会編)
形状の符号化はs画素×s画素のマクロブロック単位で行われる。マクロブロックは任意の8×8画素、16×16画素など任意の大きさでよい。形状符号化にはロスレス(可逆)、ロッシー(非可逆)の2通りの方法がある。一番粗いロッシー符号化では、形状がマクロブロック単位まで近似され、符号量は一番少ない。図2に、従来のマクロブロック化の例を示す。
【0019】
同図(a)は、元の形状を示し、同図(b)は、一番粗いロッシーの符号化の背景画像を用いた前景オブジェクト抽出における、マクロブロック化の典型例を示す。具体的にはマクロブロック内の画素において、その半分以上の画素が255の値をとる場合、即ち、マクロブロックの半分以上の面積をオブジェクト形状が占める場合、そのマクロブロック内すべての形状画素が255の値をとる。それ以外の場合は、マクロブロック内すべての形状画素値を0にするというものである。
【0020】
以下に、MPEG−4オブジェクト符号化を用いた例を示す。もともとの画像を前景オブジェクトと背景オブジェクトに切り分け、さらに、背景オブジェクトをスプライトと呼ばれる一枚のパノラマ静止画像(以下、背景スプライトと記す)で表現する。そして、前景オブジェクトに対し形状とテクスチャの符号化を行い、背景スプライトはMPEG−4スプライト符号化(前述の参考文献「MPEG−4のすべて」を参照)を行う。こうすることで、画像を前景オブジェクトと背景スプライトに切り分けずにMPEG−4のシンプルプロファイルの符号化(従来のMC+DCTをベースにした符号化)を行った場合と比べて、同程度の画質をより少ない符号量で達成することが可能である。
【0021】
しかしながら、上記従来のMPEG−4形状符号化には、以下のような問題がある。
【0022】
第1に、ロスレス符号化及び精度の高いロッシー符号化では、形状が複雑な場合、形状符号量が多くなる。特に、前景オブジェクトを自動生成する場合はこの傾向にある。
【0023】
第2に、ロスレス符号化及び精度の高いロッシー符号化では、形状の復号にパディングというテクスチャ画素を補填する処理があり、これは復号処理に多大なコストがかかる。ソフトウェアで実時間復号を実現する場合に問題となる。
【0024】
第3に、一番符号量の少ないロッシー符号化では、上記の2つの問題は回避できるものの、形状がオブジェクト内部にまで浸食し、図2(b)に示すように見た目に妨害となるという問題がある。
【0025】
第4に、前景に対してMPEG−4オブジェクト符号化、背景に対してスプライト符号化を用いた場合には、劇的な符号量削減ができるのは、前景部分の全画像に対する面積比率がある程度以下の場合であり、それ以上の場合はかえって符号量が増大するという問題がある。
【0026】
【発明が解決しようとする課題】
本発明は上記の点に鑑みてなされたものであり、その第1の目的は、クロマキーなどの大掛りな仕掛けを必要とせず、人手を介さず、全自動処理で前景オブジェクトと背景スプライトを抽出することを可能とし、更に、カメラの動きの影響を受けないロバストな処理手法を実現し、前景のない品質のよい背景スプライトを作成することが可能な前景オブジェクト・背景スプライト分離抽出方法及び装置及び前景オブジェクト・背景スプライト分離抽出プログラムを格納した記憶媒体を提供することである。
【0027】
本発明の第2の目的は、予め算出された背景画像と任意の画像との差分を用いた前景の形状マスク抽出において、前景の浸食が少なく、かつ、形状符号量の少ないマクロブロックベースの形状近似を行うことが可能な前景の形状マスク抽出方法及び装置及び前景の形状マスク抽出プログラムを格納した記憶媒体を提供することを目的とする。また、本発明の更なる目的は、前景面積比率を制御することが可能な前景の形状マスク抽出方法及び装置及び前景の形状マスク抽出プログラムを格納した記憶媒体を提供することである。
【0028】
【課題を解決するための手段】
上記の第1の目的を達成するために、本発明は次のように構成される。
【0029】
本発明は、動画像から前景オブジェクトと背景スプライト画像を抽出するための前景オブジェクト・背景スプライト分離抽出方法において、動画像における基準フレームと任意のフレームの座標系の変換を行うグローバルモーションを算出し、任意のフレームの原画像を前記グローバルモーションを用いて基準フレームの座標である基準座標にマッピングし、同じ座標に所属する複数の画素値から該座標の画素値を求め、前景オブジェクトを消去した仮スプライト(パノラマ画像)を作成し、任意のフレームにおいて、前記仮スプライトから前記グローバルモーションで切り出された画像と前記原画像の差分が所定の閾値以上の部分を前景オブジェクト画像、それ以外の部分を背景画像として切り出し、任意のフレームにおいて、前記背景画像を前記グローバルモーションを用いて前記基準座標にマッピングし、画素値が決定されていない基準座標のみ新しい画素を挿入するか、又は、画素を上書きすることにより、背景スプライトを生成し、背景スプライトとして出力する。
【0030】
上記の方法において、生成された前記背景スプライトから前記グローバルモーションで切り出された画像と前記原画像の差分が、所定の閾値以上の部分を前景オブジェクト画像として出力する処理を更に行うようにしてもよい。
上記の第1の目的に対応する発明によれば、グローバルモーションを算出し、任意のフレームの原画像を当該グローバルモーションを用いて基準フレームの座標にマッピングし、同じ座標に属する複数の画素値から座標の画素値を求め、前景オブジェクトを消去した仮スプライトを作成し、あるフレームにおいて仮スプライトからグローバルモーションで切り出された画像を原画像の差分が所定の閾値以上の部分を前景オブジェクト画像とし、それ以外を背景画像として切り出して基準座標にマッピングし、画素値が決定されていない基準座標のみ新しい画素を挿入するか、前景オブジェクトを削除してしまったフレームをオーバーライトすることにより、前景スプライトを生成することが可能となる。
【0031】
また、前景オブジェクトの抽出により、スプライトから切り出される画像と対象となる画像の差分(背景差分)を用いることで、グローバルモーションのずれや雑音に対してロバストにスプライトを抽出することが可能となる。
【0032】
上記の第2の目的を達成するために、本発明は第1に次のように構成することができる。
【0033】
本発明は、動画像符号化の中のオブジェクト符号化における前景の形状マスク抽出方法であり、前景部分を第1の値、背景部分を第2の値で表現した前景マスク画像を入力し、前記前景マスク画像の前景部分がマクロブロック内に、第1の所定の値n(n≧1)画素以上あるかを判定し、該第1の所定の値の画素以上の前景部分がある場合にはマクロブロック内の形状画素値を全て第1の値に変換する第1の過程と、前記第1の過程において、形状画素に第1の値が付与されたマクロブロック近傍のマクロブロックに、第2の所定の値m(m<n)画素以上の前景部分がある場合には、そのマクロブロック内の形状画素値を全て第1の値に変換し、前景の形状マスクを出力する第2の過程とからなる。
【0034】
また、上記構成において、一度背景として判定されたマクロブロックを入力し、入力された背景のマクロブロックと原画像との差分処理を行い、2値化処理し、差分情報と2値情報を用いて、前記第1の過程と、前記第2の過程を実行し、前記差分処理の結果、差分が所定の閾値以上の画素を含むマクロブロックを前景とし、該マクロブロックの画素値を第1の値に変換するようにしてもよい。
【0035】
これにより前景を回復することが可能となる。
【0036】
また、上記の第2の目的に対応する第1の発明は、次のように個数マップを用いた発明として構成することもできる。
【0037】
本発明は、動画像符号化の中のオブジェクト符号化における前景の形状マスク抽出方法であり、前景マスク画像を入力し、前記前景マスク画像の前景部分の画素数をマクロブロック毎に算出して個数マップを作成し、前景マップを初期化し、マクロブロック毎に前記個数マップの値が第1の所定の値n(n≧1)以上であるか否かを判定し、あるマクロブロックに対応する前記個数マップの値が該第1の所定の値以上である場合には、前記前景マップにおける該マクロブロックに対応する位置に所定の値を設定する第1の過程と、前記第1の過程において、前記所定の値が設定された前記前景マップの位置に対応するマクロブロックの近傍のマクロブロック毎に、前記個数マップの値が第2の所定の値m(m<n)以上であるか否かを判定し、あるマクロブロックに対応する前記個数マップの値が該第2の所定の値以上である場合には、前記前景マップにおける該マクロブロックに対応する位置に前記所定の値を設定し、該前景マップの値から前景の形状マスクを生成して出力する第2の過程とからなる。
【0038】
また、上記の第2の目的を達成するために、本発明は第2に次のように構成することができる。
【0039】
本発明は、予め算出された背景画像と任意の画像との差分を用いて前景の形状マスクを抽出する前景の形状マスク抽出方法において、前記背景画像と前記任意の画像について、画素毎に絶対差分を計算し、差分画像を求める過程と、該差分画像をマクロブロックに分割して、該マクロブロックにおいて、エネルギーマップを初期化する過程と、前記マクロブロックにおけるエネルギー値を算出する過程と、前記差分画像における各マクロブロックのエネルギー値の平均値を求める過程と、前記任意の画像のサイズに対する前景マスクのサイズの割合である前景率を算出し、前景の形状マスクを生成する前景制御算出過程とからなる。
【0040】
また、前記前景率制御算出過程において、前記マクロブロックにおけるエネルギー値をエネルギー値の平均値で除し、その値がα(α≧1.0)以下であれば0に変更し、前記エネルギー値の最大値を算出して第1の所定の値とし、該第1の所定の値より小さい値を第2の所定の値とし、前景マップを初期化し、仮の前景マップを初期化し、前記エネルギー値が前記第1の所定の値以上のマクロブロックの全てについて、前記仮の前景マップに所定の値を設定し、前記仮の前景マップの値が前記所定の値の数をカウントし、カウント値を全マクロブロック数で除した値が予め決められている第3の所定の値よりも大きい場合には、前記マップの値から最終の前景形状マスクを生成して出力し、そうでない場合には、前記仮の前景マップの値を前記前景マップにコピーし、前記仮の前景マップに前記所定の値が設定されているマクロブロックの近傍において、前記第2の所定の値以上のエネルギーがあるマクロブロックを前景とみなし、仮の前景マップに前記所定の値を設定する処理を、該仮の前景マップの該所定の値の数を全マクロブロック数で除した値が前記第3の所定の値よりも大きくなるまで行い、前記前景マップから前景の形状マスクを生成して出力し、若しくは、前記処理を所定回数行った後に前記除した値が前記第3の所定の値よりも大きくならない場合には、前記仮の前景マップの値を前記前景マップにコピーし、前記第1及び第2の所定の値を更新して前記仮の前景マップを初期化する処理以降の処理を行う。
【0041】
また、上記の第2の目的を達成するために、本発明は第3に次のように構成することができる。
【0042】
本発明は、予め算出された背景画像と任意の画像との差分を用いて前景の形状マスクを抽出する前景の形状マスク抽出方法であり、前記差分から算出したマクロブロックのエネルギー値が第1の所定の値以上である場合、そのマクロブロックを前景とする第1の過程と、前景と判断されたマクロブロックの近傍のマクロブロックについて、マクロブロックのエネルギー値が第2の所定の値以上である場合、そのマクロブロックを前景とする第2の過程とを有する。
【0043】
また、前記第2の過程を所定の回数行うようにしてもよい。
【0044】
また、本発明は、予め算出された背景画像と任意の画像との差分を用いて前景の形状マスクを抽出する前景の形状マスク抽出方法において、前記背景画像と前記任意の画像との差分から各マクロブロックのエネルギー値と、その平均値を算出する過程と、各マクロブロックにおけるエネルギー値をその平均値で除し、その値が所定の値以下であれば0に変更する過程と、各マクロブロックのエネルギー値が第1の所定の値以上である場合、そのマクロブロックを前景とする過程と、前景と判断されたマクロブロックの近傍のマクロブロックについて、マクロブロックのエネルギー値が第2の所定の値以上である場合、そのマクロブロックを前景とする処理を所定回数繰り返して行う過程とを有するようにしてもよい。
【0045】
第2の目的に対応する上記3つの発明によれば、マクロブロックにおける前景領域を表す形状画素数又はマクロブロックのエネルギー値が各々所定の値以上である場合、そのマクロブロック全体を前景と見做し、さらに、前景と判断されたマクロブロックの近傍のマクロブロックについて、別の値を用いて同様の判断を行う。これは、上記第2の目的に対応する第2の発明では前景と見なされたマクロブロックの数がある値を超えるまで行われる。
【0046】
これにより、領域形状が単純化されるため、MPEG−4符号化におけるオブジェクト符号化を行った場合に符号量を少なく抑えることができる。また、抽出されたオブジェクトに穴が無いため、良好な見た目を与える効果がある。
【0047】
本発明の他の特徴及び利点は、添付の図面を用いた以下の説明により明らかになる。
【0048】
【発明の実施の形態】
最初に、第1の目的に対応した発明について説明する。まず、図3を用いて第1の目的に対応した発明の原理について説明する。
【0049】
本発明は、動画像から前景オブジェクトと背景スプライト画像を抽出するための前景オブジェクト・背景スプライト分離抽出方法であり、まず、動画像における基準フレームと任意のフレームの座標系の変換を行うグローバルモーションを算出し(ステップ1)、任意のフレームの原画像をグローバルモーションを用いて基準フレームの座標である基準座標にマッピングし(ステップ2)、同じ座標に所属する複数の画素値から該座標の画素値を求め(ステップ3)、前景オブジェクトを消去した仮スプライト(パノラマ画像)を作成し(ステップ4)、任意のフレームにおいて、仮スプライトからグローバルモーションで切り出された画像と原画像の差分が所定の閾値以上の部分を前景オブジェクト画像、それ以外の部分を背景画像として切り出し(ステップ5、6)、任意のフレームにおいて、背景画像をグローバルモーションを用いて基準座標にマッピングし(ステップ7)、画素値が決定されていない基準座標のみ新しい画素を挿入して背景スプライトを生成し、背景スプライトとして出力する(ステップ8)。
【0050】
[第1の実施例]
次に、本発明の第1の実施例について説明する。この実施例は本発明の第1の目的に対応する実施例である。
【0051】
図4は、本発明の前景オブジェクト・背景スプライト分離抽出装置の構成を示す図である。
【0052】
同図に示す前景オブジェクト・背景スプライト分離抽出装置は、グローバルモーション算出部1、仮スプライト生成部2、前景オブジェクト抽出部3、及び背景スプライト生成部4から構成される。
【0053】
グローバルモーション算出部1は、入力された原画像(動画像)における基準フレームと任意のフレームの座標系の変換(グローバルモーション)を算出する。
【0054】
仮スプライト生成部2は、原画像とグローバルモーション算出部1からグローバルモーションが入力され、任意のフレームの原画像を当該グローバルモーションを用いて基準フレームの座標(基準座標)にマッピングし、同じ座標に所属する複数の画素値から当該座標の画素値を求め、前景オブジェクトを消去したスプライト(パノラマ画像)を作成する。
【0055】
前景オブジェクト抽出部3は、原画像とグローバルモーション算出部1からグローバルモーション及び、仮スプライト生成部2から仮スプライトが入力され、当該仮スプライトからグローバルモーションで切り出された画像と原画像の差分がある閾値以上の部分を前景オブジェクト画像、それ以外を背景画像として切り出す。
【0056】
背景スプライト生成部4は、グローバルモーションと前景オブジェクト抽出部3から背景画像が入力され、任意のフレームにおいて、前述の背景画像をグローバルモーションによって基準座標にマッピングし、画素値が決定されていない基準座標にのみ新しい画素を挿入して、背景スプライトを生成する。このように、画素値が決定されていない基準座標にのみ新しい画素を挿入して、背景スプライトを生成する方法をアンダーライトと称する。なお、背景画像の画素を背景スプライトにそのまま上書きするオーバーライトによる方法で生成することもできる。
【0057】
これにより、前景オブジェクト画像及びぼけのない背景スプライトを自動的に抽出することができる。なお、生成された背景スプライトの中で、埋まらない部分が生ずることがあるが、これは前景のある部分であるので問題ない。
【0058】
次に、図4における構成及び動作をより詳細に説明する。
【0059】
図4におけるグローバルモーション算出部1は、任意のフレームにおける基準フレームのグローバルモーション(カメラモーションなど一組のパラメータで画像全体を表す動き、大局的な動き)を算出する。グローバルモーションは、一般に、座標系の変換行列で表現することができる。以下にその例を示す。
【0060】
基準フレームの座標系(x0,y0)と、あるフレームAの座標系(x1,y1)間の座標変換は、以下の式(1)のとおり、
【0061】
【数1】
Figure 0003551908
で表現される。
【0062】
【数2】
Figure 0003551908
上記で算出されたグローバルモーションは、仮スプライト生成部2の入力の一つとなる。
【0063】
仮スプライト生成部2は、図5に示すように、時間メディアン統合部21を有する。時間メディアン統合部21は、各々のフレームにグローバルモーションを用いて各フレームの画像を基準フレームの座標系(基準座標)にマッピングする。さらに、同じ座標にマッピングされた複数の画素に関しては、画素値のメディアン値(中央値)を仮スプライトのその座標の値として選択する。こうして仮スプライトが生成される。メディアン値を選択することで、仮スプライトは前景オブジェクトのないパノラマ画像として抽出される。動物体領域がその座標値画素の半分より少なければ、メディアンをとることで動物体を反映する画素は選択されないので、動領域のないスプライトを生成することができる。
【0064】
仮スプライト生成部3で生成された前景のない仮スプライトは、前景オブジェクト抽出部3に入力される。
【0065】
前景オブジェクト抽出部3は、原画像とグローバルモーション算出部1で得られたグローバルモーションと、仮スプライト生成部2で得られた仮スプライトを入力として、前景オブジェクト画像と原画像から前景を消去した背景画像をフレーム毎に出力する。
【0066】
図6は、本発明の第1の実施例の前景オブジェクト抽出部3の構成を示す。同図に示す前景オブジェクト抽出部3は、切り出し部31、差分画像生成部32、差分対応部33、マスク処理部34から構成される。
【0067】
切り出し部31は、仮スプライトと任意のフレームにおけるグローバルモーションが入力され、仮スプライトから画像を切り出す。この画像をGM画像という。
【0068】
差分画像生成部32は、任意のフレームにおいて、切り出し部31で切り出されたGM画像と原画像が入力され、差分画像を出力する。当該差分は、GM画像と原画像の対応する座標における画素値の絶対差分値を採択する。
【0069】
差分対応部33は2値化画像を出力する。ここでは、差分画像が差分画像生成部32から入力され、ある閾値よりも差分値が高いものを1、それ以外を0として、1、0からなる2値化画像を出力する。
【0070】
マスク処理部34は、原画像と、差分対応部33から2値化画像が入力され、2値化画像の画素値1に対応する部分を原画像の値、それ以外は、0を採択した前景オブジェクト画像を出力する。また、2値画像の画素値0に対応する部分を原画像の値に、それ以外は0を採択した背景画像を出力する。この背景画像は背景スプライト生成部4の入力となる。
【0071】
背景スプライト生成部4には、前景オブジェクト抽出部3から背景画像が入力され、グローバルモーション算出部1からグローバルモーションが入力される。背景スプライト生成部4は、図7に示すオーバーライト/アンダーライト統合部41を有する。
【0072】
図7は、本発明の第1の実施例の背景スプライト生成部の構成を示す図である。オーバーライト/アンダーライト統合部41は、グローバルモーションと前述の背景画像を入力し、背景画像のこの画像をグローバルモーションと座標値から計算される基準座標の座標にマッピングする。オーバーライト/アンダーライト統合部41は、オーバーライト又はアンダーライトの方法を用いて上記の処理を行う。例えば、アンダーライトのときには、基準座標においてまだ画素値が確定していない座標(画素値未確定領域)のみ、値を挿入し、画素値確定とする。このようにして図8に示すような画素値確定領域を背景スプライトとして生成する。
【0073】
すなわち、図8に示すように、画素値未確定領域に同図における右上から画像を張り付けることにより画素値が順次確定する。左下の部分は、現フレームであり、新たに画素を確定する領域を示している。このように、画素値の決定していない部分を埋めていく処理を行う。
【0074】
上記のように、仮の背景スプライトを作成し、それに基づき、画面ごとの前景と背景を分離した後、この分離後の背景を元に目的の背景スプライトを生成することによって、クリアでぼけのない背景スプライトを得ることができる。
【0075】
[第2の実施例]
図9は、本発明の第2の実施例の抽出装置の構成を示す図である。この実施例は第1の目的に対応する別の実施例である。同図に示す前景オブジェクト・背景スプライト分離抽出装置は、グローバルモーション算出部11、仮スプライト生成部12、前景オブジェクト抽出部13、背景スプライト生成部14、及び前景オブジェクト抽出部15から構成される。同図に示す前景オブジェクト・背景スプライト分離抽出装置は、図4に示す構成の最後に前景オブジェクト抽出部15を付加したものであり、その前段までのグローバルモーション算出部11、仮スプライト生成部12、前景オブジェクト抽出部13、背景スプライト生成部14は、図4の構成要素と同一の機能を有し、同じ処理を行うものとする。但し、前景オブジェクト抽出部13では、最終的な前景オブジェクト画像は出力しない。
【0076】
前景オブジェクト抽出部15は、背景スプライト生成部14で算出された背景スプライトとグローバルモーション、原画像を入力して、前景オブジェクト画像を出力する。前景オブジェクト抽出部15は、前述の図4の前景オブジェクト抽出部3及び図9の前景オブジェクト抽出部13と同様の処理を行う。
【0077】
このように、前景オブジェクト抽出処理を2回行うことによって、背景スプライトに前景が残らなくなる。これは以下の理由による。
【0078】
すなわち、仮スプライトから切り出されたGM画像と原画像との差分から前景を算出した時、動領域の一部が抽出されない場合も考えられる。この領域が背景スプライトに反映された場合、背景スプライト、及び合成時に背景スプライトから切り出されたGM画像の品質を劣化させる。ここで、もう一度、生成された背景スプライトと原画像とを用いて前景を求めると、背景の誤抽出部分と前景の正しい部分の差分の値が大きくなる。従って、この部分が前景となり背景の誤抽出を隠す効果があり、背景スプライトに前景が残らなくなる。
【0079】
上述のように、第1及び第2の実施例によれば、クロマキーなどの大掛りな装置を必要としない。また、既存の映像にも適用できる。
【0080】
また、自動的に前景オブジェクト画像及び背景スプライトを取得することができるため人手を介さない。
【0081】
また、グローバルモーションのずれや雑音にロバストに前景を抽出することができる。
【0082】
さらに、前景が残らず、クリアで高品質のスプライトを生成することができる。
【0083】
次に、本発明の第2の目的に対応した発明について、第3〜第5の実施例を用いて説明する。
【0084】
なお、これから説明する第2の目的に対応する発明は、第1及び第2の実施例を用いて説明した第1の目的に対応する発明における前景オブジェクト抽出部に適用することができる。すなわち、第1の実施例で説明した図6の前景オブジェクト抽出部におけるマスク処理部34において、入力された2値化画像に対して後述する初期マクロブロック近似処理及び拡張マクロブロック近似処理を行い形状マスクを生成することにより、従来より少ない形状符号量で見た目の良好な前景オブジェクト画像を抽出することが可能となる。
【0085】
まず、第3〜第5の実施例に共通する概念について説明する。第3〜第5の実施例では、前景の形状マスクを求めることを目的とし、そのために、まず、背景画像と任意の画像の差分を算出する。図10(A)、(B)を用いて背景画像と任意の画像の差分を算出する例について説明する。
【0086】
図10(A)は、通常の背景画像と任意の画像の差分を算出する例を示す図であり、図10(B)は、MPEG−4符号化において、背景画像の代わりに背景スプライトが用意された場合の適用例を示す図である。背景スプライトから任意の画像の背景部分を切り出し、任意の画像との差分をとる。本発明は、通常の背景画像もしくは、背景スプライトを用いた場合の両方に適用できる。
【0087】
次に、上記のようにして求めた差分画像から前景の形状マスクを求める方法の概念について図11(a)〜(c)を用いて説明する。
【0088】
同図(a)は、元の形状を表し、同図の一つのマトリックスは、バウンディングボックスを示す。バウンディングボックスとは、MPEG−4においてオブジェクトを包含する16画素の倍数の画素数を1辺に持つ最小の面積の領域である。また、本発明の実施例では16画素×16画素のブロックをマクロブロックと呼ぶ。なお、マクロブロックは任意の8×8画素など任意の大きさでよい。
【0089】
同図(b)は、従来の方法を示し、一番粗いロッシー符号化による形状を示す。同図において、マクロブロック内にオブジェクトが半分以上ある場合には、255、それ以外は0を与えるため、同図(a)に示す元の形状に対して、前景の形状に著しい浸食が見られる。
【0090】
本発明では、2段階のマクロブロック化(第1次マクロブロック化、第2次マクロブロック化)を行うことにより形状マスクを抽出する。ここで、マクロブロック化とは、マクロブロック単位に前景か背景かを判断し、前景と判断されたマクロブロックの形状画素値に例えば255を与える処理をいう。
【0091】
本発明ではまず所定の方法により、ある条件を満たした場合にマクロブロック全体を前景と見做す。この処理を第1次マクロブロック化又は初期マクロブロック近似処理と呼ぶ。さらに、最初にマクロブロック近似され、前景と判断されたマクロブロックの近傍(例えば上下左右の4近傍)のマクロブロックについて、所定の方法にて同様の判断を下す。この処理を第2次マクロブロック化又は拡張マクロブロック近似処理と呼ぶ。
【0092】
上記の処理を図11(c)を用いて説明する。
【0093】
同図(c)のaは、前述の初期マクロブロック近似処理によりマクロブロック化された領域を示し(第1次マクロブロック化領域)、bは、前述の拡張マクロブロック近似処理によりマクロブロック化された領域を示す(第2次マクロブロック化領域)。初期マクロブロック近似処理は、例えば、同図(a)に示す元の形状の形状画素数がマクロブロック内に第1の所定の値以上あればマクロブロック内の全ての形状画素に255を、それ以外は0を形状画素値として与える。また、拡張マクロブロック近似処理は初期マクロブロック近似処理で255を与えられたマクロブロックの近傍のマクロブロック内に元の形状の形状画素数が第2の所定の値以上あれば形状画素値を255に置換するものである。後述するように、形状画素数の代わりにマクロブロックのエネルギー値を用いることもできる。なお、上記の例では4近傍の例を示したが、近傍であれば4近傍に限られず、例えば、8近傍であってもよい。
【0094】
図11(c)から分かるように、本発明では、元の形状(図11(a))に対して浸食が少なくなる。以下、第3〜第5の実施例を用いて第2の目的に対応する発明について具体的に説明する。
【0095】
[第3の実施例]
まず、図12、図13を用いて第3の実施例の概要について説明する。図12は、本発明の処理概要を説明するための図である。本発明は、動画像符号化の中のオブジェクト符号化における前景の形状マスク抽出方法であり、前景部分を255、背景部分を0で表現した前景マスク画像を入力し、前景マスク画像の前景部分の形状画素数がマクロブロック内に、第1の所定の値n(n≧1)画素以上あるかを判定し、255又は0を付与し(ステップ11)、255が付与された近傍のブロックに、第2の所定の値m(m<n)以上の形状画素数の前景部分がある場合には、マクロブロックの形状画素値を全て255に変換し、形状マスクを出力する(ステップ12)。
【0096】
図13は、第3の実施例における形状マスク抽出装置の構成図である。本形状マスク抽出装置は、前景部分を255、背景部分を0で表現した前景マスク画像を入力し、前景マスク画像の前景部分の形状画素数がマクロブロック内に、第1の所定の値n(n≧1)以上あるかを判定し、255又は0を付与する第1のマクロブロック化部51と、第1のマクロブロック化部51において、255が付与された近傍のブロックに、第2の所定の値m(m<n)以上の形状画素数の前景部分がある場合には、形状画素値を255に変換し、前景の形状マスクを出力する第2のマクロブロック化部52からなる。
【0097】
次に、各部について詳細に説明する。
【0098】
上述のように、図13に示す形状マスク抽出装置は、第1次マクロブロック化部51と第2次マクロブロック化部52から構成される。
【0099】
第1次マクロブロック化部51には、前景候補マスク(前景形状の候補)とバウンディングボックスが入力される。第1次マクロブロック化部51は、前景マスク画像の前景部分の形状画素数がマクロブロック内に第1の所定の値n画素以上あれば、マクロブロック内の画素に255を、それ以外は0を与える。
【0100】
第2次マクロブロック化部52は、第1次マクロブロック化部51で255を与えられたマクロブロックの近傍のマクロブロックに対して、第2の所定の値m(第1の所定の値n>第2の所定の値m)以上の形状画素数の前景部分を持つマクロブロックがあれば、形状画素値を255に置換する。
【0101】
これにより、第1次マクロブロック化部51において形状が矩形近似され、第2次マクロブロック化部52は、第1次マクロブロック化部51において、255を与えられたマクロブロックの近傍のマクロブロックに対して、形状を矩形近似し、出力として第2次マクロブロック化部52からマクロブロック化された形状マスク(MB化形状マスク)が出力される。
【0102】
以下、上記の装置構成と動作についてより詳細に説明する。
【0103】
ここでは、動画像において、背景画像が予め与えられている場合、背景画像と原画像の差分領域を前景オブジェクトとする例を示す。また、前述の図13の構成に対して、一度背景として判定された動画像を前景として回復するための構成を付加した例を説明する。
【0104】
図14は、第3の実施例の形状マスク抽出装置の詳細構成を示す図である。同図において、図13と同一構成部分には同一符号を付す。
【0105】
同図に示す形状マスク抽出装置は、背景差分部61、2値化部62、第1次マクロブロック化部51、第2次マクロブロック化部52、及び前景回復部65から構成される。
【0106】
背景差分部61は、原画像とGM画像を入力として、原画像と背景画像の差分を抽出し、2値化部62に転送する。
【0107】
2値化部62は、背景の差分を2値化し、前景部分に255を与え、背景部分に0を与える。これを前景候補マスクとして第1次マクロブロック化部51に転送する。
【0108】
第1次マクロブロック化部51及び第2次マクロブロック化部52では、2値化部62からの2値情報に基づき、形状が矩形近似される。
【0109】
前景回復部65は、この時点で0を与えられたマクロブロックに関して、差分情報がある閾値以上ある画素を含むマクロブロックは前景とみなし、値を255に置換する。
【0110】
これにより、一度背景として判定されたマクロブロックを前景に回復することが可能となる。
【0111】
[第3’の実施例]
さて、上記の第3の実施例では、マクロブロックが前景か否かによってマクロブロック内の全ての形状画素値を255又は0とするが、下記のように前景マップ(Vmap(i,j))を用いて処理を行うこともできる。ここで、(i,j)は任意のマクロブロックの位置を示し、前景マップ(Vmap(i,j))は、前景と判定されたマクロブロックに対して1、それ以外のマクロブロックに対して0の値を持つ。以下、第3’の実施例について、第3の実施例と異なる点を中心に説明する。
【0112】
図15は、背景の差分を2値化し、前景候補マスクを算出した後からの処理を示すフローチャートである。
【0113】
前景候補マスクが与えられると、まず、各マクロブロック内の前景候補画素すなわち、値が255である形状画素の個数を計算する(ステップ15)。この計算の結果をNmap(i,j)(これを個数マップと呼ぶ。)とする。Nmap(i,j)は、各マクロブロック(i,j)毎に前景候補画素の個数を有する。
【0114】
次に、前景マップを初期化する。すなわち、Vmap(i,j)=0とする(ステップ16)。
【0115】
続いて、第3の実施例と同様の方法により、第1次マクロブロック化(ステップ17)、第2次マクロブロック化(ステップ18)を行う。ただし、第3’の実施例では、前景と判定されたマクロブロックの位置における前景マップ(Vmap(i,j))の値を1とする。
【0116】
次に、前景マップの値により前景の形状マスクを生成して出力する(ステップ19)。形状マスクは、前景マップが1であるマクロブロック内の形状画素全てを255、前景マップが0であるマクロブロック内の形状画素全てを0とすることで得られる。
【0117】
なお、第3の実施例、及び第3’の実施例では、形状画素値として255、0を用いたが、255、0等の値は従来の技術で説明した形状マスク表現を用いた場合の値の例であり、形状マスクの表現方法に応じてどのような値もとり得る。
【0118】
上述のように、第3の実施例及び第3’の実施例に係る本発明によれば、オブジェクトの核となる部分とその周囲をマクロブロック化し、マクロブロック内における前景領域の形状画素数が、所定の数以上であるときに、そのマクロブロックは前景領域に属するとするので、通常の形状符号化をする場合に較べて、マクロブロック単位に前景か否かを指定するだけでよく、形状符号量が少なくて済むという効果を奏する。なお、実験の結果では、1/5〜1/10の形状符号量となった。
【0119】
また、前景の浸食も少ない形状を表現することができる。
【0120】
[第4の実施例]
次に、第4の実施例について説明する。これは第3の実施例と同様、本発明の第2の目的に対応する実施例である。
【0121】
まず、図16を用いて第4の実施例に係る本発明の原理について説明する。
【0122】
図16は、本発明の原理を説明するための図である。本発明は、予め算出された背景画像と任意の画像との差分を用いて動物体を反映した動領域を抽出する前景の形状マスク抽出方法である。まず、背景画像と任意の画像について、画素毎に絶対差分を計算し、絶対差分画像として出力する(ステップ21)。次に、任意の画像のサイズに対する前景マスクのサイズの割合である前景率を算出し、前景の形状マスクを生成する(ステップ22)。
【0123】
次に、第4の実施例についてより詳細に説明する。
【0124】
図17は、本発明の形状マスク抽出装置の構成を示す。
【0125】
同図に示す形状マスク抽出装置は、差分計算部71、前景率制御算出部72から構成される。
【0126】
差分計算部71は、背景画像と任意の画像について画素毎に絶対差分値を計算し、絶対差分画像として、前景率制御算出部72に出力する。
【0127】
前景率制御算出部72は、任意の前景率(画像のサイズに対する、前景の形状マスクのサイズの割合)の前景の形状マスクを算出する。当該前景率制御算出部72は、マクロブロック近似処理により前景の形状マスクを算出する。
本発明の第4の実施例の前景形状のマクロブロック近似処理について、図11(c)を用いて説明する。
【0128】
まず、第1の所定の値でマクロブロック化する。これは、後述するマクロブロックのエネルギー値が第1の所定の値以上である場合、マクロブロック全体を前景と見做す。前述したように、この処理を初期マクロブロック近似処理と呼ぶ。図11(c)では、初期マクロブロック近似処理により求められた領域を第1次マクロブロック化領域として示している。さらに、最初にマクロブロック近似され、前景と判断されたマクロブロックの近傍(例えば、上下左右の4近傍)のマクロブロックについて、第2の所定の値にて同様の判断を下す。前述したよう、この処理を拡張マクロブロック近似処理と呼ぶ。図11(c)では、拡張マクロブロック近似処理により求められた領域を第2次マクロブロック化領域として示している。
【0129】
拡張マクロブロック近似処理は、直前処理でマクロブロック化されたマクロブロックの周辺4近傍を常にターゲットとする。この初期マクロブロック近似処理、拡張マクロブロック近似処理は、前景マクロブロック数が予め定めた最大前景比率Th3を超えるまで繰り返す。超えた時点で、超える直前の処理において、前景と判断された領域を最終的な前景とする。
【0130】
図18は、本発明の第4の実施例の差分計算部と前景率制御算出部の処理のフローチャートである。最初に以下の説明における表記について説明する。
【0131】
(i,j)は、任意のマクロブロックの位置で、例えば、マクロブロックの大きさをs画素×s画素、画像サイズを縦h×横w画素とすると、0≦j≦h/s−1、0≦i≦w/s−1の値を取る。また、(l,m)は任意のマクロブロック内における座標値で0≦l≦s−1,0≦m≦s−1の値をとる。
【0132】
E(i,j):差分画像の座標(i,j)のマクロブロックにおけるエネルギーマップ;
N:マクロブロック内の画素数(s×s);
If (l,m):任意画像の座標(i,j)のマクロブロック内の座標(l,m)における画素値;
Is (l,m):背景画像の座標(i,j)のマクロブロック内の座標(l,m)における画素値;
Eave :差分画像におけるエネルギーの平均値;
M:差分画像におけるマクロブロックの数;
Emax :差分画像における最大エネルギー値;
MAX():()内の数列から最大値を算出する関数;
Th1 :マクロブロック近似における第1の所定の値;
Th2 :マクロブロック近似における第2の所定の値;
Vmap (i,j):座標(i,j)における前景マップ、前景部分に1、それ以外に0;
V’map (i,j):座標(i,j)における前景仮マップ、前景部分に1、それ以外に0;
Count():()内の1の個数を算出する関数;
Th3 :第3の所定の値、最大前景比率;
kstep:最大値から引算される値;
ステップ101) 初期化処理を行う。具体的には、差分画像をs画素×s画素からなるマクロブロックという処理単位に分割し、各々のマクロブロックにおいて、エネルギーマップに0の値を入れて初期化する。さらに、第3の所定の値Th3 、パラメータkstepの値を、例えば次のように設定する。
【0133】
E(i,j)=0,kstep=1,Th3 =0.15
ステップ102) 各エネルギーマップを計算する。背景画像と任意の画像に対応するマクロブロックにおいて、各対象画像の差分絶対値を求め、その総和をマクロブロック内の画素数(N)で除した値をそのマクロブロックにおけるエネルギー値として算出する。なお、本明細書においては、下記に示す式で算出される値をエネルギー値と称している。
【0134】
【数3】
Figure 0003551908
または、次式に示すように差分自乗値の平方根を求め、マクロブロック内の画素数で除した値を用いてもよい。
【0135】
【数4】
Figure 0003551908
ステップ103) 差分画像において、各マクロブロックのエネルギー値の平均を求める。
【0136】
【数5】
Figure 0003551908
ステップ104) 各マクロブロックのエネルギー値をエネルギー平均値で除し、これがα(α≧1.0)以下であれば、0に変更する。
【0137】
【数6】
Figure 0003551908
ステップ105) エネルギー値の最大値を算出する。
【0138】
Emax =MAX(E(i,j))
ステップ106) 第1の所定の値Th1 、第2の所定の値Th2 を設定する。第1の所定の値Th1 は、エネルギー値の最大値、第2の所定の値Th2 は、第1の所定の値Th1 を2で除した値を設定する(なお、第2の所定の値Th2 は、第1の所定の値Th1 より小さい値であればどのような値であっても構わない)。
【0139】
Th1 =Emax ,Th2 =Th1 /2
ステップ107) 前景マップを初期化する。
【0140】
Vmap (i,j)=0
ステップ108) 仮の前景マップを初期化する。
【0141】
V’map (i,j)=0
ステップ109) 初期マクロブロック近似処理を行う。エネルギー値が第1の所定の値Th1 以上のマクロブロックすべてについて仮の前景マップに1をたてる。
【0142】
if(E(i,j)≧Th1 )V’map (i,j)=1
ステップ110) 仮の前景マップ中の1の数をカウントし、それを全マクロブロック数で除した値が第3の所定の値Th3 よりも大きい場合は、前景マップの値により最終の前景形状マスクを生成して出力し、すべての処理を終了する。最終前景形状マスクは、前景マップが1であるマクロブロック内の画素全てを255、前景マップが0であるマクロブロック内の画素全てを0とすることで得られる。
【0143】
if(Count(V’map (i,j)/M≧Th3 )) END
ステップ111) 仮の前景マップの値を前景マップにコピーする。
【0144】
Vmap (i,j)=V’map (i,j)
ステップ112) 拡張マクロブロック処理を最大n回行うループに入る。
【0145】
I=0
ステップ113) 拡張マクロブロック処理を行う。具体的には、仮の前景マップに1がたつマクロブロックの近傍において、第2の所定の値Th2 以上のエネルギーがあるマクロブロックを前景とみなし、仮の前景マップに1をたてる。
【0146】
if(V’map (i,j−1)=1∪V’map (i,j+1)=1∪V’map (i+1,j)=1∪V’map (i−1,j)=1)
if(E(i,j)≧Th2 )V’map (i,j)=1
ステップ114) 仮の前景マップ中の1の数をカウントし、それを全マクロブロック数で除した値が第3の所定の値よりも大きい場合は、前景マップの値により最終前景マスクを生成し、出力し、すべての処理を終了する。
【0147】
if(Count(V’map (i,j))/M≧Th3 )END
ステップ115) ループ回数がある回数nを超えたら拡張マクロブロック近似処理のループを抜ける。超えない場合にはステップ113に移行する。
【0148】
I++,if(I<n)
ステップ116) 仮の前景マップの値を前景マップにコピーする。
【0149】
Vmap (i,j)=V’map (i,j)
ステップ117) 第1の所定の値Th1 、第2の所定の値Th2 を下記のように更新する。
【0150】
Th1 =Emax −kstep,Th2 =Th1 /2
上記のステップ108からステップ117の処理を繰り返す。なお、上記の処理では、前景比率が第3の所定の値より大きくなったときに、ステップ109〜ステップ117のループを終了し、前景の形状マスクを出力して処理を終了する。ここで、前景比率が第3の所定の値より大きくならない場合を考慮して、第1の所定の値が予め設定した値より小さくなった時点でループを抜け、その時点での前景の形状マスクを出力して終了するようにしてもよい。
【0151】
上述のように、本発明によれば、領域形状が単純化されるため、MPEG−4符号化における任意形状符号化を用いたオブジェクト符号化に比べて形状符号量を少なく抑えることができる。
【0152】
また、抽出されたオブジェクトに穴が無いため、良好な見た目を与える効果がある。
【0153】
さらに、前景率が大き過ぎると、かえって符号量が増大するが、前景率を一定以下の値に制限できるため、MPEG−4符号化した場合、符号量を少なくすることができる。
【0154】
[第5の実施例]
次に、第5の実施例について説明する。これも本発明の第2の目的に対応する実施例である。
【0155】
図19は第5の実施例における形状マスク抽出装置の構成を示す図であり、本抽出装置は差分計算部81、前景抽出部82を有する。
【0156】
この構成において、背景画像と任意の画像は差分計算部81で画素毎に絶対差分値が計算され、絶対差分画像として出力される。その絶対差分画像は前景抽出部82に入力され、ここで前景オブジェクトを算出する。
【0157】
第5の実施例における前景形状のマクロブロック近似処理の様子は図11(c)に示したものと同様であり、第4の実施例と同様、マクロブロックのエネルギー値を基に第1の所定の値を用いて初期マクロブロック近似処理を行い、第2の所定の値を用いて拡張マクロブロック近似処理を行う。ただし、第5の実施例では最大前景比率(Th3)を用いた処理(閾値処理)を行わない。すなわち、第5の実施例における処理は、第3の実施例における処理とほぼ同様であるが、エネルギー値を用いる点と、拡張マクロブロック近似処理を複数回行い得る点が第3の実施例と異なる。
【0158】
図20は、本発明の第5の実施例の差分計算部と前景抽出部の処理のフローチャートである。最初に以下の説明における表記について説明する。
(i,j)は、任意のマクロブロックの位置で、例えば、マクロブロックの大きさをs画素×s画素、画像サイズを縦h×横w画素とすると、0≦j≦h/s−1、0≦i≦w/s−1の値を取る。また、(l,m)は任意のマクロブロック内における座標値で、マクロブロックの大きさを縦横s画素とすると、0≦l≦s−1,0≦m≦s−1の値をとる。
【0159】
E(i,j):差分画像の座標(i,j)のマクロブロックにおけるエネルギーマップ;
N:マクロブロック内の画素数(s×s);
If (l,m):任意画像の座標(i,j)のマクロブロック内の座標(l,m)における画素値;
Is (l,m):背景画像の座標(i,j)のマクロブロック内の座標(l,m)における画素値;
Eave :差分画像におけるエネルギーの平均値;
M:差分画像におけるマクロブロックの数;
Emax :差分画像における最大エネルギー値;
Th1’ :マクロブロック近似における第1の所定の値;
Th2’ :マクロブロック近似における第2の所定の値;
Vmap (i,j):座標(i,j)における前景マップ、前景部分に1、それ以外に0;
ステップ201)初期化処理を行う。具体的には、差分画像をs画素×s画素から成るマクロブロックに分割し、各々のマクロブロックにおいて、エネルギーマップに0の値を入れて初期化する。
【0160】
E(i,j)=0
ステップ202)各エネルギーマップを計算する。背景画像と任意の画像の対応するマクロブロックにおいて、以下に示すように、各対応画素の絶対差分または差分自乗の平方根を求め、その総和をマクロブロック内の画素数(例えば16画素×16画素のマクロブロックであれば256)で除した値をそのマクロブロックにおけるエネルギー値として算出する。
【0161】
【数7】
Figure 0003551908
または、
【0162】
【数8】
Figure 0003551908
ステップ203)差分画像において,各マクロブロックのエネルギー値の平均を求める。
【0163】
【数9】
Figure 0003551908
ステップ204)各マクロブロックのエネルギー値をエネルギー平均値で除し、これがα(α≧1.0)以下のエネルギーをすべて0とする。
【0164】
【数10】
Figure 0003551908
ステップ205)前景マップを初期化する。
【0165】
Vmap (i,j)=0
ステップ206)第1の所定の値Th1’を設定する。(例えばTh1’=20)
ステップ207)第1の所定の値Th1’で初期マクロブロック近似処理を行う。エネルギー値が第1の所定の値Th1’以上のマクロブロック全てについて前景マップに1を立てる。
【0166】
if(E(i,j)≧Th1’ ) Vmap (i,j)=1
ここで、全てのマクロブロックがTh1’以上の値を持たない場合は前景が抽出されないことになる。
【0167】
ステップ208)第2の所定の値Th2’を設定する。(例えばTh2’=Th1’/4)
ステップ209)ループ回数を初期化する。
【0168】
k=0
ステップ210〜212)第2の所定の値Th2’で拡張マクロブロック近似をn回行う。拡張マクロブロック近似処理は、初期マクロブロック近似処理の結果、前景マップに1がたつマクロブロックの近傍において、第2の所定の値Th2’以上のエネルギーがあるマクロブロックを前景とみなし、前景マップに1を立てる。具体的な計算方法は第4の実施例と同様である。
【0169】
ループ回数がn回になるとループを抜け、前景の形状マスクを生成、出力して処理を終了する。前景マップから形状マスクを求める方法は第4の実施例で説明した通りである。
【0170】
第5の実施例によっても、第3、4の実施例と同様に、領域形状が単純化されるため、MPEG−4符号化における任意形状符号化を用いたオブジェクト符号化に比べて形状符号量を少なく抑えることができる。また、抽出されたオブジェクトに穴が無いため、良好な見た目を与える効果がある。
【0171】
上記各実施例における処理をプログラムとして実現し、コンピュータに接続されるディスク装置、フロッピーディスク、CD−ROM等の可搬記憶媒体に格納しておき、本発明を実施する際にインストールすることにより、容易に本発明を実現できる。
【0172】
各実施例におけるプログラムを実行させるコンピュータの構成例を図21に示す。このコンピュータは、CPU(中央処理装置)101、メモリ102、入力装置103、表示装置104、CD−ROMドライブ105、ハードディスク106、通信処理装置107を有する。CPU101は装置の全体を制御する。メモリ102はCPU101で処理するデータやプログラムを保持する。入力装置103はキーボードやマウス等、データを入力するための装置である。表示装置104はディスプレイ等の装置である。CD−ROMドライブ105はCD−ROM等を駆動し、読み書きを行う。ハードディスク106には、プログラムやデータが格納される。通信処理装置107により他のコンピュータ等とネットワークを介して通信を行なうことが可能となる。本発明の処理を実行するプログラムは、コンピュータに予めインストールされていてもよいし、例えばCD−ROMに格納され、CD−ROMドライブ105を介してハードディスク106にロードするようにしてもよい。プログラムが起動されると、所定のプログラム部分がメモリ102に展開され、処理が実行される。
【0173】
なお、本発明は、上記の実施例に限定されることなく、特許請求の範囲内で種々変更・応用が可能である。
【0174】
【発明の効果】
上記のように、第1の目的に対応した発明によれば、仮の背景スプライトを作成し、それに基づき、画面ごとの前景と背景を分離した後、この分離後の背景を元に目的の背景スプライトを生成することによって、クリアでぼけのない背景スプライトを得ることができる。また、グローバルモーションのずれや雑音に対してロバストにスプライトを抽出することが可能となる。
【0175】
また、第2の目的に対応した発明によれば、領域形状が単純化されるため、MPEG−4符号化におけるオブジェクト符号化を行った場合に符号量を少なく抑えることができる。また、抽出されたオブジェクトに穴が無いため、良好な見た目を与える効果がある。
【0176】
【図面の簡単な説明】
【図1】MPEG−4における画像表現を説明するための図である。
【図2】従来技術においての形状のマクロブロック近似を説明するための図である。
【図3】第1の目的に対応する発明の原理を説明するための図である。
【図4】第1の実施例における前景オブジェクト・背景スプライト分離抽出装置の構成を示す図である。
【図5】第1の実施例における仮スプライト生成部の構成図である。
【図6】第1の実施例における前景オブジェクト抽出部の構成図である。
【図7】第1の実施例における背景スプライト生成部の構成図である。
【図8】第1の実施例におけるオーバーライト/アンダーライト統合部の動作を説明するための図である。
【図9】第2の実施例における前景オブジェクト・背景スプライト分離抽出装置の構成を示す図である。
【図10】本発明の実施例で用いられる差分画像を説明するための図である。
【図11】前景形状のマクロブロック近似処理を説明するための図である。
【図12】第3の実施例に係る発明の原理を説明するための図である。
【図13】第3の実施例における前景の形状抽出装置の主要構成を示す図である。
【図14】第3の実施例における前景の形状抽出装置の構成を示す図である。
【図15】第3’の実施例を説明するための図である。
【図16】第4の実施例に係る発明の原理を説明するための図である。
【図17】第4の実施例における前景の形状抽出装置の構成を示す図である。
【図18】第4の実施例の差分計算部と前景率制御算出部の処理のフローチャートである。
【図19】第5の実施例における前景の形状抽出装置の構成を示す図である。
【図20】第5の実施例の差分計算部と前景抽出部の処理のフローチャートである。
【図21】コンピュータの構成例を示す図である。
【符号の説明】
1、11 グローバルモーション算出部
2、12 仮スプライト生成部
3、13 前景オブジェクト抽出部
4、14 背景スプライト生成部
15 前景オブジェクト抽出部
21 時間メディアン統合部
31 切り出し部
32 差分画像生成部
33 差分対応部
34 マスク処理部
41 オーバーライト/アンダーライト統合部
51 第1次マクロブロック化部
52 第2次マクロブロック化部
61 背景差分部
62 2値化部
65 前景回復部
71 差分計算部
72 前景率制御算出部
81 差分計算部
82 前景抽出部
101 CPU(中央処理装置)
102 メモリ
103 入力装置
104 表示装置
105 CD−ROMドライブ
106 ハードディスク
107 通信処理装置

Claims (6)

  1. 動画像から前景オブジェクトと背景スプライト画像を抽出するための前景オブジェクト・背景スプライト分離抽出方法において、
    動画像における基準フレームと任意のフレームの座標系の変換を行うグローバルモーションを算出し、
    任意のフレームの原画像を前記グローバルモーションを用いて基準フレームの座標である基準座標にマッピングし、同じ座標に所属する複数の画素値のメディアン値を座標の値とする、前景オブジェクトを消去した仮スプライト(パノラマ画像)を作成し、
    任意のフレームにおいて、前記仮スプライトから前記グローバルモーションで切り出された画像と前記原画像の差分が所定の閾値以上の部分を前景オブジェクト画像、それ以外の部分を背景画像として切り出し、
    任意のフレームにおいて、前記背景画像を前記グローバルモーションを用いて前記基準座標にマッピングし、画素値が決定されていない基準座標のみ新しい画素を挿入するか、又は、画素を上書きすることにより、背景スプライトを生成し、背景スプライトとして出力することを特徴とする前景オブジェクト・背景スプライト分離抽出方法。
  2. 生成された前記背景スプライトから前記グローバルモーションで切り出された画像と前記原画像の差分が、所定の閾値以上の部分を前景オブジェクト画像として出力する処理を更に行う請求項1記載の前景オブジェクト・背景スプライト分離抽出方法。
  3. 動画像から前景オブジェクトと背景スプライト画像を抽出するための前景オブジェクト・背景スプライト分離抽出装置であって、
    動画像における基準フレームと任意のフレームの座標系の変換を行うグローバルモーションを算出するグローバルモーション算出手段と、
    任意のフレームの原画像を前記グローバルモーションを用いて基準フレームの座標である基準座標にマッピングし、同じ座標に所属する複数の画素値のメディアン値を座標の値とする、前景オブジェクトを消去した仮スプライト(パノラマ画像)を作成する仮スプライト生成手段と、
    任意のフレームにおいて、前記仮スプライトから前記グローバルモーションで切り出された画像と前記原画像の差分が所定の閾値以上の部分を前景オブジェクト画像、それ以外の部分を背景画像として切り出す前景オブジェクト抽出手段と、
    任意のフレームにおいて、前記背景画像を前記グローバルモーションを用いて前記基準座標にマッピングし、画素値が決定されていない基準座標のみ新しい画素を挿入するか、又は、画素を上書きすることにより、背景スプライトを生成し、背景スプライトとして出力する背景スプライト生成手段とを有することを特徴とする前景オブジェクト・背景スプライト分離抽出装置。
  4. 前記背景スプライト生成手段で生成された前記背景スプライトから、前記グローバルモーションで切り出された画像と前記原画像の差分が、所定の閾値以上の部分を前景オブジェクト画像として出力する第2の前景オブジェクト抽出手段を更に有する請求項3記載の前景オブジェクト・背景スプライト分離抽出装置。
  5. 動画像から前景オブジェクトと背景スプライト画像を抽出するための前景オブジェクト・背景スプライト分離抽出プログラムを格納した記憶媒体であって、
    動画像における基準フレームと任意のフレームの座標系の変換を行うグローバルモーションを算出するグローバルモーション算出プロセスと、
    任意のフレームの原画像を前記グローバルモーションを用いて基準フレームの座標である基準座標にマッピングし、同じ座標に所属する複数の画素値のメディアン値を座標の値とする、前景オブジェクトを消去した仮スプライト(パノラマ画像)を作成する仮スプライト生成プロセスと、
    任意のフレームにおいて、前記仮スプライトから前記グローバルモーションで切り出された画像と前記原画像の差分が所定の閾値以上の部分を前景オブジェクト画像、それ以外の部分を背景画像として切り出す前景オブジェクト抽出プロセスと、
    任意のフレームにおいて、前記背景画像を前記グローバルモーションを用いて前記基準座標にマッピングし、画素値が決定されていない基準座標のみ新しい画素を挿入するか、又は、画素を上書きすることにより、背景スプライトを生成し、背景スプライトとして出力する背景スプライト生成プロセスとをコンピュータに実行させることを特徴とする前景オブジェクト・背景スプライト分離抽出プログラムを格納した記憶媒体。
  6. 前記背景スプライト生成プロセスで生成された前記背景スプライトから、前記グローバルモーションで切り出された画像と前記原画像の差分が、所定の閾値以上の部分を前景オブジェクト画像として出力する第2の前景オブジェクト抽出プロセスを更にコンピュータに実行させる請求項5記載の前景オブジェクト・背景スプライト分離抽出プログラムを格納した記憶媒体。
JP2000287550A 1999-09-24 2000-09-21 背景スプライトと前景オブジェクトの分離方法、及びその装置 Expired - Fee Related JP3551908B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000287550A JP3551908B2 (ja) 1999-09-24 2000-09-21 背景スプライトと前景オブジェクトの分離方法、及びその装置

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP27114399 1999-09-24
JP27114299 1999-09-24
JP2000-232226 2000-07-31
JP11-271143 2000-07-31
JP11-271142 2000-07-31
JP2000232226 2000-07-31
JP2000287550A JP3551908B2 (ja) 1999-09-24 2000-09-21 背景スプライトと前景オブジェクトの分離方法、及びその装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003371845A Division JP3988712B2 (ja) 1999-09-24 2003-10-31 前景の形状マスク抽出方法、及びその装置

Publications (2)

Publication Number Publication Date
JP2002118843A JP2002118843A (ja) 2002-04-19
JP3551908B2 true JP3551908B2 (ja) 2004-08-11

Family

ID=27478913

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000287550A Expired - Fee Related JP3551908B2 (ja) 1999-09-24 2000-09-21 背景スプライトと前景オブジェクトの分離方法、及びその装置

Country Status (1)

Country Link
JP (1) JP3551908B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1388815A3 (en) 2002-04-25 2005-11-16 Microsoft Corporation Segmented layered image system
US7110596B2 (en) 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
KR100682929B1 (ko) 2004-03-05 2007-02-15 삼성전자주식회사 그레이 알파채널을 포함한 영상 부호화/복호화장치 및 방법
CN113379691B (zh) * 2021-05-31 2022-06-24 南方医科大学 一种基于先验引导的乳腺病灶深度学习分割方法

Also Published As

Publication number Publication date
JP2002118843A (ja) 2002-04-19

Similar Documents

Publication Publication Date Title
US6977664B1 (en) Method for separating background sprite and foreground object and method for extracting segmentation mask and the apparatus
US5854856A (en) Content based video compression system
KR101396618B1 (ko) 이동 물체 경계 추출
EP2088554A2 (en) Image decoding and encoding apparatus
EP2230856A2 (en) Method for up-sampling images
CN112184585B (zh) 一种基于语义边缘融合的图像补全方法及系统
US7440613B2 (en) Binary mask interpolation
JP2010218548A (ja) 仮想画像を合成する方法
JPH1056643A (ja) 任意の対象物を収録している動画像の符号化及び復号化装置
KR20080050491A (ko) 시간 예측을 위한 분류 필터링
EP2549754A1 (en) Method and apparatus for reframing and encoding an original video signal
Borges et al. Fractional super-resolution of voxelized point clouds
US20070064275A1 (en) Apparatus and method for compressing images
JP5676610B2 (ja) 画像シーケンスの関心領域に基づくアーティファクト低減のためのシステム及び方法
CN116012232A (zh) 图像处理方法、装置及存储介质、电子设备
CN113538270A (zh) 一种人像背景虚化方法和装置
CN114049278A (zh) 图像美颜处理方法、装置、存储介质与电子设备
JP2002522836A (ja) 静止画像生成方法および装置
JP3551908B2 (ja) 背景スプライトと前景オブジェクトの分離方法、及びその装置
CN110766117B (zh) 一种二维码的生成方法及系统
Koochari et al. Exemplar-based video inpainting with large patches
US20090274394A1 (en) Image processing method, image processing apparatus, and computer readable storage medium
JP3988712B2 (ja) 前景の形状マスク抽出方法、及びその装置
JP2024513815A (ja) シーンに関連付けられたマンハッタンレイアウトを推定するための方法、装置及びコンピュータプログラム
CN112364200B (zh) 一种类脑成像的方法、装置、设备及存储介质

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040406

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040419

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110514

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120514

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140514

Year of fee payment: 10

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees