JP2002044519A - 動画像内オブジェクト抽出方法及び装置 - Google Patents
動画像内オブジェクト抽出方法及び装置Info
- Publication number
- JP2002044519A JP2002044519A JP2000225735A JP2000225735A JP2002044519A JP 2002044519 A JP2002044519 A JP 2002044519A JP 2000225735 A JP2000225735 A JP 2000225735A JP 2000225735 A JP2000225735 A JP 2000225735A JP 2002044519 A JP2002044519 A JP 2002044519A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- alpha data
- moving image
- mode
- overwrite
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 82
- 238000000605 extraction Methods 0.000 claims abstract description 108
- 238000012545 processing Methods 0.000 claims abstract description 50
- 230000033001 locomotion Effects 0.000 claims description 48
- 230000008569 process Effects 0.000 claims description 10
- 238000002360 preparation method Methods 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 8
- 238000001514 detection method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000010422 painting Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/272—Means for inserting a foreground image in a background image, i.e. inlay, outlay
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/24—Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/60—Solid state media
- G11B2220/61—Solid state media wherein solid state memory is used for storing A/V content
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Studio Circuits (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Closed-Circuit Television Systems (AREA)
Abstract
ータを上書きしてしまうことなく、正しいアルファデー
タを生成できる動画像内オブジェクト抽出装置を提供す
る。 【解決手段】動画像内の物体領域を表すアルファデータ
をフレーム毎に生成するアルファデータ生成部7と、生
成されたアルファデータを記憶する記憶部3と、記憶部
3に記憶されたアルファデータについてフレーム毎に上
書き許可モードまたは上書き不許可モードのいずれかの
モードを設定するモード設定部6と、現処理フレームに
ついてモード設定部6で設定されたモードが上書き許可
モードまたは上書き不許可モードのいずれかを判定し、
上書き許可モードのときのみアルファデータ生成部7に
現処理フレームのアルファデータを新たに生成せしめて
記憶部3に記憶されている現処理フレームと同一フレー
ムのアルファデータ上に上書きする制御を行う制御部8
を有する。
Description
域を表すアルファデータをフレーム毎に生成することで
動画像内のオブジェクトを抽出する方法及び装置に関す
る。
抽出することは、動画像を物体毎に編集・加工したり、
動画像の背景を別の背景に置き換えたりする処理を行う
ために有用である。
物体領域と背景領域とで互いに異なる画素値(アルファ
値)を持つ画像を原画像と併せて用意する。このような
アルファ値から構成される画像のデータをアルファデー
タと呼び、このアルファデータをフレーム毎に生成する
処理を動画像内オブジェクト抽出と呼ぶ。アルファデー
タは、原画像データとは別のデータであったり、原画像
データに含まれるように構成される場合もある。後者の
場合、画素毎にR値、G値、B値に加えA値(アルファ
値)を設定するフォーマットが用いられることが多い。
法として、クロマキー法がある。クロマキー法では、予
め登録した色を背景色とし、画像データ中で背景色と近
い色を持つ画素の領域を背景領域、それ以外の色の画素
の領域を物体領域とそれぞれ判定する。アドビ社の「プ
レミア」という画像処理ソフトには、クロマキー法によ
り動画像から物体を抽出する機能が備えられている。
ずあるフレームの画像を表示し、その背景上の画素をユ
ーザがクリックすることで背景色を登録する。次に、背
景か否かの判定を行うための閾値を設定した後、この閾
値と背景色を用いて動画像シーケンス全体からフレーム
毎に物体を自動抽出する。しかし、クロマキー法では処
理対象画像の背景に多くの色が存在していたり、物体に
背景と同じ色があると正しく物体を抽出することができ
ないという問題がある。
めに、任意の背景上にある物体を抽出する方法として
は、本発明者らが“フレーム間差分とブロックマッチン
グを併用した動画像の物体抽出”(三本杉,井田,渡
邊、第5回 画像センシングシンポジウム 講演論文集、
C-4,PP.61-66,June 1999)で開示した、差分法とブロ
ックマッチング法を併用するハイブリッド法と呼ばれる
方法がある。このハイブリッド法では、まず動画像の最
初のフレームにおいてユーザが抽出したい物体のアルフ
ァデータをマニュアル操作で設定する。2フレーム目以
降では、設定された最初のフレームのアルファデータを
基にして物体の動きなどを追跡しながら、アルファデー
タを自動生成する。その際、動き検出のための動きベク
トルの探索範囲や、フレーム間差分に対して設定される
物体か背景かの判定のための閾値などの抽出パラメータ
をユーザがマニュアル操作で設定する。
は、前述のプレミアと同様に最初のフレームにおいて抽
出パラメータを設定し、2フレーム目以降では同じパラ
メータを用いて物体抽出を行う方法が考えられる。この
方法では、あるフレームまでは正確に物体抽出ができて
も、それ以降のフレームでは正しく物体抽出を行うこと
ができなくなることがある。ハイブリッド法が対象とす
るような任意の背景を持つ画像では、物体抽出に必要な
抽出パラメータがフレームの経過によって変化するから
である。
ームの抽出結果や物体の動きを利用して物体抽出を行う
方法では、抽出に失敗したフレームについては抽出パラ
メータを切り替えて抽出をやり直し、アルファデータを
上書きする必要がある。しかし、ある抽出パラメータで
物体抽出に失敗したフレームについて、別の抽出パラメ
ータで物体抽出を行っても、必ずしも正しい抽出が行わ
れるとは限らず、既に正しく物体抽出が行われたフレー
ムが、抽出に失敗したアルファデータによって上書きが
なされてしまうことがある。特に、現処理フレームとは
別のフレームのアルファデータと物体の動きを利用する
物体抽出法では、同じ抽出パラメータであっても、別の
フレームのアルファデータの状況によって現処理フレー
ムでの物体抽出結果が変化してしまう。従って、単に抽
出パラメータを記憶保持しておいても、既に得られたア
ルファデータを再現できるわけではない。
のフレームで設定した抽出パラメータ2フレーム目以降
でも用いて物体抽出を行うことでアルファデータを生成
し、物体抽出に失敗したとき抽出パラメータを変更した
後に抽出し直して既に得られたアルファデータ上に上書
きする従来の動画像内オブジェクト抽出技術では、既に
正しく物体抽出がなされたフレームが抽出に失敗したア
ルファデータにより上書きされて失われてしまう場合が
あった。
てアルファデータを生成できる動画像内オブジェクト抽
出方法及び装置を提供することを目的とする。
ブリッド法を用いた場合に、既に物体抽出に成功したフ
レームのアルファデータを上書きしてしまうことなく、
正しいアルファデータを生成できる動画像内オブジェク
ト抽出方法及び装置を提供することにある。
め、本発明では動画像内の物体領域を表すアルファデー
タが動画像のフレーム毎に生成され、この生成されたフ
レーム毎のアルファデータについて上書き許可モードま
たは上書き不許可モードのいずれかのモードがそれぞれ
設定される。現処理フレームについて設定されたモード
が上書き許可モードまたは上書き不許可モードのいずれ
であるかが判定され、上書き許可モードのときは現処理
フレームのアルファデータが新たに生成される。そし
て、この新たに生成されたアルファデータが現処理フレ
ームと同一フレームの既に生成されたアルファデータ上
に上書きされる。判定されたモードが上書き不許可モー
ドのときは、現処理フレームについて新たなアルファデ
ータの生成を行うことなく処理が進められるか、あるい
は処理が終了する。
功したフレームのアルファデータを上書きしてしまうこ
となく、フレーム毎にアルファデータを生成できる。
メータを用いてフレーム毎にそれぞれ複数のアルファデ
ータが生成され、フレーム毎にこれら異なるパラメータ
に基づいて生成された複数のアルファデータのうちの一
つが選択される。
及び動画像全体の少なくとも一つの動きを示す動きパラ
メータが入力され、この動きパラメータを用いてフレー
ム毎にアルファデータが生成される。
施の形態を説明する。 (動画像内オブジェクト抽出装置の全体構成)図1は、
本発明の一実施形態に係る動画像内オブジェクト抽出装
置の構成を示している。この動画像内オブジェクト抽出
装置は、例えばパーソナルコンピュータを用いて実現さ
れ、大きく分けてキーボード及びマウスのようなポイン
ティングデバイスを含む入力部1と、CPU2と、ハー
ドディスク装置やメモリなどの記憶部3、及び液晶ディ
スプレイやCRTモニタなどの表示部4から構成され
る。
装置を実現する要素としてアルファデータ設定部5、モ
ード設定部6、アルファデータ生成部7及び制御部8が
設けられており、アルファデータ設定部5とモード設定
部6の機能は入力部1によって実現され、アルファデー
タ生成部7と制御部8の機能はCPU2によって実現さ
れている。
用するユーザによるマニュアル操作によって、動画像の
例えば最初のフレームのアルファデータが設定される。
設定されたアルファデータは、制御部8による制御下で
記憶部3に書き込まれる。モード設定部6では、ユーザ
によるマニュアル操作で、または自動的に動画像のフレ
ーム毎に上書き許可モード・上書き非許可モードのいず
れかのモードが制御部8に対して設定される。アルファ
データ生成部7では、制御部8による制御下で記憶部3
に記憶されている既処理フレームのアルファデータを用
いて、現処理フレームのアルファデータが生成される。
制御部8は、アルファデータ生成部7の制御と記憶部3
の書き込み/読み出し制御を行う。
ついて)図2は、動画像内オブジェクト抽出時の表示部
4での表示画面の具体例を示している。同図に示される
ように、表示画面10には動画像表示レーン11、フレ
ームポインタ12、画像表示ウィンドウ13、表示フレ
ーム切替ボタン類14、アルファデータデータ設定ボタ
ン15、フィッティングボタン16、物体抽出ボタン1
7及びモード設定レーン18が配置されている。
する各フレームの画像がフレーム順に縮小表示される。
フレーム数が多いときは、適当に間引いて表示される。
動画像表示レーン11のうち、フレームポインタ12に
よって指し示される位置のフレームの画像が画像表示ウ
ィンドウ13に大きく表示される。表示フレーム切り替
えボタン類14のいずれかをクリックすることによっ
て、画像表示ウィンドウ13上で「動画再生」、「再生
停止」、「1フレーム前に移動」、「1フレーム後に移
動」、「最初のフレームに移動」、「最後のフレームに
移動」といった操作ができ、それに合わせてフレームポ
インタ12も自動的に移動する。
ることにより、画像表示ウィンドウ13に表示される画
像のフレームが切り替わる。そこで、まず最初のフレー
ム(動画像表示レーン11の左端のフレーム)の画像を
画像表示ウィンドウ13に表示した状態で、物体入力と
背景入力の2種類の入力切り替えを行うためのアルファ
データ設定ボタン15をクリックすることで、物体ペン
あるいは背景ペンを選択し、その物体ペンあるいは背景
ペンによって画像表示ウィンドウ13内で物体領域や背
景領域を塗る。これは図1のアルファデータ設定部5で
の設定操作に相当し、これにより大まかなアルファデー
タが設定される。
クすることで、例えば自己相似モデルによってアルファ
データの輪郭が動画像内の物体の輪郭にフィッティング
される。この後、物体抽出ボタン17をクリックするこ
とで、ハイブリッド法によってそれ以降のフレームのア
ルファデータが生成される。この生成されたアルファデ
ータに基づいて、物体抽出画像が画像表示ウィンドウ1
3内に表示される。この物体抽出画像は、例えば背景部
分を所定の色で塗りつぶすか、所定の色で半透明に塗り
つぶした形態をとるものとする。このとき、動画像表示
レーン11で表示される画像も左から順に元の動画像に
代えて物体抽出画像に切り替わり、フレームポインタ1
2もそれに合わせて右側に移動する。物体抽出画像が最
後のフレームに到達すると、物体抽出は終了する。
物体抽出が成功しているとは限らないので、ユーザはフ
レームポインタ12などを用いながら、物体抽出画像を
表示して結果を確認する。そして、この物体抽出画像の
表示から物体抽出が成功した区間のフレームに対して
は、モード設定レーン18においてマウスでドラッグす
るなどにより指定して、斜線で示すように上書き不許可
モードを設定し、それ以外の物体抽出が成功しなかった
区間のフレームに対しては、上書き許可モードを設定す
る。これは図1のモード設定部6での操作に相当する。
ルファデータを用いて現処理フレームのアルファデータ
を生成する方法では、一度物体抽出に失敗すると、それ
が以降のフレームにも影響し、連続して物体抽出に失敗
する傾向がある。従って、物体抽出に成功するフレーム
と抽出に失敗するフレームは、図2の上書き不許可モー
ドと上書き許可モードの区間にそれぞれ示したように、
いずれも連続することが多い。
フレームを画像表示ウィンドウ13に表示し、アルファ
データ設定ボタン15で選択した物体ペンあるいは背景
ペンや、フィッティングボタン16を用いて修正を加え
る。この後、物体抽出ボタン17を再度クリックするこ
とにより、以降のフレームのアルファデータが自動生成
され、上書き許可モードのフレームのアルファデータが
記憶部3上で上書きされる。この場合、物体抽出に失敗
した最初のフレームを修正することになるので、以降の
フレームでは高い確率で正しく物体抽出を行うことがで
きる。
マニュアル操作を軽減するために、物体抽出に成功した
と推定されるフレームを自動的に上書き不許可モードに
設定する方法を用いてもよい。例えば、ハイブリッド法
における動きベクトル検出時の誤差が小さい、動きの影
響が少ない、物体の輪郭線の両側の画素値の段差が大き
い、といったフレームについては、物体抽出が成功した
と見なして上書き不許可モードに自動的に設定する。ユ
ーザは、その設定結果が正しいかどうかをモード設定レ
ーン18の表示から確認し、誤っていれば適宜修正す
る。
ついて)次に、図3〜図6に示すフローチャートを用い
て、本実施形態における動画像内オブジェクト抽出の種
々の処理手順について説明する。
画像の最初のフレームのアルファデータが設定され、さ
らにアルファデータ生成部7で動画像の処理対象の全フ
レームのアルファデータが生成されて記憶部4に記憶さ
れた後の処理を示している。まず、動画像のフレーム毎
に上書き許可モードか上書き不許可モードのいずれかの
モードが設定される(ステップS11)。具体的には、
例えばユーザが図2に示した表示画面10の画像表示ウ
ィンドウ13上で、アルファデータを用いて表示される
物体抽出画像からアルファデータの出来映えをフレーム
毎に確認し、物体抽出が正しくなされているフレームで
は上書き不許可モードに、そうでないフレームでは上書
き許可モードに設定する。このモード設定の具体的な手
法については、後に詳しく述べる。
方法としては、前述したようにハイブリッド法における
動きベクトル検出時の誤差が小さい、動きの影響が少な
い、物体の輪郭線の両側の画素値の段差が大きいといっ
たフレームについては上書き不許可モードとし、それ以
外のフレームは上書き許可モードとするように自動的に
モード設定を行ってもよい。
レームが上書き許可モードか否かが判定され(ステップ
S12)、上書き許可モードであったときは、アルファ
データ生成部7で該当フレームのアルファデータが生成
される(ステップS13)。ステップS12において上
書き許可モードでないとき、つまり上書き不許可モード
であったときはステップS14に進み、全てのフレーム
の処理が終了したか否かが判定され、未処理のフレーム
が残っているときは、次のフレームを現処理フレームと
してステップS12〜S14の処理が繰り返される。こ
れにより2フレーム目以降が順次処理される。ステップ
S14で最後のフレームと判定されたときは、動画像内
オブジェクト抽出処理は終了する。
部5により動画像の最初のフレームのアルファデータが
設定され、さらにアルファデータ生成部7で動画像の処
理対象の全フレームのアルファデータが生成されて記憶
部4に記憶された後の処理を示している。ステップS2
1のモード設定処理、ステップS22の上書き許可/不
許可判定処理、ステップS23のアルファデータ生成処
理及びステップS24の全フレーム終了判定処理は、図
3の場合と基本的に同様であるが、ステップS22にお
いて上書き不許可と判定した場合に、次のフレームに処
理を進めず、フレームが残っていても直ちに動画像内オ
ブジェクト抽出処理を終了する点が図3と異なってい
る。
フレームのみから物体抽出を行う場合には、物体抽出を
行いたい区間だけ上書き許可モードにしておくことで、
区間の終端に達した時点で動画像内オブジェクト抽出処
理を自動的に終了することができる。
ファデータ生成処理について示している。まず、予め定
められた異なる複数の抽出パラメータを用いて、フレー
ム毎に複数のアルファデータが同時に生成される(ステ
ップS31)。次に、全てのフレームについてアルファ
データ生成処理が終了したか否かが判定され(ステップ
S32)、アルファデータ未生成のフレームが残ってい
るときは、次のフレームを現処理フレームとしてステッ
プS31の処理が繰り返される。ステップS32で最後
のフレームと判定されたときは、フレーム毎に複数個ず
つ生成されたアルファデータの中から、例えばユーザに
よって一つずつ選択されたアルファデータが最終的にア
ルファデータ生成部7の出力として以後の処理に用いら
れる。
アルファデータ生成処理について示している。まず、物
体抽出に用いられる動きパラメータが設定される(ステ
ップS41)。動きパラメータは、例えばユーザが表示
画面上で物体や背景や画面全体の動きの方向及び大きさ
の少なくとも一方を入力した結果から算定される。この
動きパラメータの具体的な設定方法については、後に詳
しく説明する。
ラメータを用いてアルファデータが生成される(ステッ
プS42)。そして、全てのフレームのアルファデータ
生成処理が終了したか否かが判定され(ステップS4
3)、アルファデータ未生成のフレームが残っていると
きは、次のフレームを現処理フレームとしてステップS
42の処理が繰り返されることにより、全てのフレーム
について、設定された動きパラメータを用いたアルファ
データの生成が行われる。
に、アルファデータ設定部5での具体的な設定方法につ
いて説明する。アルファデータ設定の具体的な手法とし
ては、例えば表示画面10の画像表示ウィンドウ13上
で最初のフレームの画像を表示し、この画像をユーザが
見ながら画像内の所望の物体をマウスのポインタなどを
用いて塗りつぶし、その塗りつぶした領域を物体領域と
してアルファデータを設定する方法が最も簡単である。
た色を半透明で表示するようにすれば、塗りつぶした領
域内の物体の画像を確認できるので、確実に所望の物体
領域のアルファデータを生成することができるという利
点がある。物体領域に色を付けるのではなく、背景領域
に色を付けるようにしても、物体の画像を良く認識する
ことができる。
す操作が煩雑であるときは、大まかな塗りつぶしを行っ
た後に、本発明者らが“自己相似法による輪郭線のフィ
ッティング(井田,三本杉、第5回 画像センシングシ
ンポジウム 講演論文集、C-15,PP.115-120,June 199
9)”で提案した自己相似モデル法を用いて、自動的に
アルファデータの輪郭を物体の輪郭にフィッティングす
れば、少ない手間でアルファデータを設定することがで
きる。
7(a)に示すように制御点(〇印で示す)を持つ輪郭
線を表示し、これらの制御点をマウスのポインタでドラ
ッグすることにより移動させ、輪郭線を図7(b)に示
すように所望の物体を近似するように変形させるように
すると、物体の形状によってはより簡単にアルファデー
タを設定することができる。この場合は、輪郭線の内側
を物体領域としてアルファデータを設定することにな
る。また、物体の輪郭線上を適当な間隔を空けて次々と
クリックすることで、クリックした点を制御点として順
にスプライン曲線などで滑らかに連結することにより輪
郭線を設定し、アルファデータを設定する方法でもよ
く、比較的簡単にアルファデータを設定できる。
所定形状のテンプレートを複数種類か用意しておき、そ
れらを物体21の部分を覆うように配置することで、ア
ルファデータを設定することもできる。図8の例では、
4つの楕円22,23,24,25によって物体21を
覆っている。楕円の画面20からはみ出した領域は廃棄
される。これらの楕円22,23,24,25の和を物
体領域としてフィッティングを行う。この場合、例えば
図8に示したように物体が人間の上半身であって、頭部
を囲む楕円22を配置した瞬間に、フィッティングボタ
ン16をクリックせずとも自動的にフィッティングを行
うようにすれば、物体の抽出結果を確認しながら楕円の
配置作業を進めることができる。
楕円23を用いてフィッティングを行い、その結果と先
に楕円22を用いた結果の和を物体領域として表示す
る。以下、楕円24,25を配置する場合についても同
様である。この際、既に正しく設定された輪郭部分がそ
の後の処理で変更されないように、別に用意する岩垣禁
止ペンでなぞっておくようにする。上書き禁止ペンでな
ぞられた部分のアルファデータは、上書きされないよう
にすれば、せっかく正確に入力した輪郭を綾ままって上
書きしてしまうことがなくなる。上書き禁止ペンでなぞ
られた部分については、一目で分かるように別の色で半
透明に着色しておくことが望ましい。
のようにしてアルファデータ設定部5で最初のフレーム
のアルファデータが設定され、記憶部3に書き込まれた
後、この最初のフレームのアルファデータと画像データ
が記憶部3から読み出されてアルファデータ生成部5に
送られる。アルファデータ生成部5では、例えば先に述
べたハイブリッド法によって2フレーム以降のフレーム
のアルファデータが生成される。
データのフレーム間の動き検出を行い、その動き検出結
果に基づき既処理フレームのアルファデータについて変
形(動き補償)を施すことで、動き補償に基づくアルフ
ァデータが作られる。これと同時に、記憶部3から読み
出された画像データのフレーム間差分が大きい部分を物
体領域とすることで、差分に基づくアルファデータが作
られる。そして、画面の部分毎に、動き補償によるアル
ファデータと差分によるアルファデータのいずれかのよ
り適切な方を適応的に選択することで、現処理フレーム
のアルファデータが最終的に生成される。
レーム毎に順次生成され、必要に応じて記憶部3に書き
込まれ、また必要に応じて記憶部3から読み出されて表
示部4で画像として表示される。
なアルファデータの生成方法では、全てのフレームのア
ルファデータが一度で正確に生成されるとは限らず、例
えば幾つかのフレームで物体抽出に失敗し、実際の物体
とは大きく隔たったアルファデータが生成されることも
あり得る。そのようなときは、物体抽出に失敗したフレ
ームにおいてアルファデータ設定部5を用いてマニュア
ル操作でアルファデータを再度入力した後に物体抽出を
し直し、物体抽出に失敗したフレームの記憶部3に記憶
されているアルファデータを上書きするようにする。
フレームのアルファデータについては記憶部3で上書き
されないように、ユーザによってモード設定部6を用い
てフレーム毎に上書き許可モードと上書き不許可モード
のいずれかのモードに設定される。
で判定され、上書き許可モードが設定されたフレームで
は、アルファデータ設定部5によって設定されるか、あ
るいはアルファデータ生成部7で生成され、記憶部3に
記憶されている当該フレームのアルファデータが制御部
8による制御下で上書きされるが、上書き不許可モード
が設定されたフレームでは上書きはなされない。
の自動抽出によるアルファデータの生成がフレーム順に
進み、上書き不許可モードが設定されたフレームに達す
ると、そのフレームを飛ばして次に上書き許可モードが
設定されているフレームのアルファデータの生成が行わ
れるか(図3)、または移動物体抽出処理はそこで終了
する(図4)。また、上書き不許可モードが設定された
フレームでは物体抽出処理を省略し、記憶部3に記憶さ
れているアルファデータが当該フレームで抽出されたも
のと見なして処理を進めてもよい。
図9を用いてモード設定部6でのモード設定の他の方法
について説明する。図9は、図2に示したようなモード
設定レーン18を用いずに、動画像表示レーン11上で
モード設定を行う例である。すなわち、図9(a)に示
すように動画像表示レーン11に対してユーザの指示に
より抽出開始ポインタと抽出終了ポインタを設定し、こ
れら抽出開始ポインタと抽出終了ポインタの間のフレー
ムを上書き許可モードとし、それ以外のフレームを上書
き不許可モードとする。この状態でユーザが図2の物体
抽出ボタン17をクリックすると、抽出開始ポインタが
指し示すフレームから物体抽出が始まり、抽出終了ポイ
ンタが指し示すフレームで物体抽出が終了する。
すフレームより時間的に前のフレームに抽出終了ポイン
タを設定した例であり、この場合にはフレームの時間順
とは逆順で物体抽出が行われることになる。
終了ポインタにより上書き許可開始フレームと上書き不
許可終了フレームを指定してもよいし、上書き不許可開
始フレームと上書き不許可開始フレームを指定すること
によっても、上書き不許可モードと上書き許可モードの
設定を行うことができる。
モード設定の他の方法について説明する。図10では、
図2に示したような動画像表示レーン11を11A,1
1B,11Cで示すように複数列設定し、これらの各動
画像表示レーン11A,11B,11Cでそれぞれ異な
る抽出パラメータを用いて同時に物体抽出を行った結果
を表示する。
の探索範囲、フレーム間差分に対して物体領域か背景領
域かを判定する際に用いる閾値、動き補償に基づくアル
ファデータか、差分に基づくアルファデータのいずれを
適応的に選択する際に用いる閾値などである。これら抽
出パラメータの値を固定しておくと、これまで述べたよ
うに、あるフレームでは正しく物体領域が抽出される
が、別のフレームでは抽出に失敗することがある。
ラメータを用いて物体検出を行った結果を異なる複数の
動画像表示レーン11A,11B,11C上に並べて表
示しておく。ユーザは、フレーム毎に動画像表示レーン
11A,11B,11Cのうち最も正確に物体が抽出さ
れたレーンを選び、そのレーン上の画像をクリックする
ようにする。図10では、選択された画像が〇印で示さ
れている。
しないために、単一の抽出パラメータ値で物体抽出がで
きる場合でも、最適な抽出パラメータを見出すことが困
難な場合がある。これに対しては、例えば抽出パラメー
タを物体抽出の途中でも変更可能にすることで、最適な
抽出パラメータを探る方法が考えられる。抽出パラメー
タがユーザによって変更されたら、そのフレーム以降は
変更後の抽出パラメータを用いて物体抽出が行われるよ
うにする。ユーザは1回目の物体抽出では抽出結果を確
認しながら抽出パラメータを適宜変更して抽出パラメー
タの最適な値を探る。この方法によると動的に抽出パラ
メータを切り替えることができるので、短時間で最適な
抽出パラメータを見出すことが可能である。そして、2
回目以降はその最適な抽出パラメータの値に固定して、
全フレームまたは抽出に失敗したフレームの抽出をやり
直すことができる。
て)ハイブリッド法では物体や背景の動きを自動的に検
出するが、予めそれらの動きが分かっていれば、アルフ
ァデータ生成時に動き方向の情報を用いることで処理量
を少なくしたり、動き検出精度の向上を図ることができ
る。図6に示したアルファデータ生成手順は、この考え
を応用してステップS41で動きパラメータを設定した
後に、この動きパラメータを用いてアルファデータを生
成している。
時に物体の動く方向などをユーザがマニュアル操作で入
力する例を示している。最初のフレームの画像を表示し
ている段階で、ユーザが物体32上をマウスでドラッグ
して物体32の動き方向33を入力する。また、動画像
を撮像するカメラにパニングがあったために背景31が
動く場合には、背景31の動き方向34を同様に入力す
る。
3,34についてのみ動きベクトル探索を行うようにす
れば、全方向について動きベクトル探索を行うよりも動
き検出のための処理量を削減でき、また入力された動き
の周辺だけで細かく動きベクトルを探索すれば、処理量
を増やさずにより正確な動き検出が可能となる。その結
果、物体抽出の処理時間を短縮でき、あるいは抽出精度
を高めることができる。
画像内の物体を確実に抽出してアルファデータを生成で
き、特にハイブリッド法などで物体抽出を行う場合に、
既に物体抽出に成功したフレームのアルファデータを上
書きしてしまうことなく、正しいアルファデータを生成
することができる。
内オブジェクト抽出装置の概略構成を示すブロック図
時の表示画面例を示す図
データ生成後の処理例を示すフローチャート
データ生成後の他の処理例を示すフローチャート
例を示すフローチャート
処理例を示すフローチャート
輪郭線の設定と変形によるアルファデータ設定方法につ
いて説明する図
ァデータ設定部でのテンプレートを用いたアルファデー
タ設定方法について説明する図
ード設定方法の他の例を説明する図
ータを用いてアルファデータを生成する方法について説
明する図
生成する方法について説明する図
Claims (8)
- 【請求項1】動画像内の物体領域を表すアルファデータ
を該動画像のフレーム毎に順次生成するオブジェクト抽
出を行う動画像内オブジェクト抽出方法において、 前記フレーム毎に前記アルファデータを生成するアルフ
ァデータ生成ステップと、 前記アルファデータ生成ステップで生成された前記フレ
ーム毎のアルファデータについて上書き許可モードまた
は上書き不許可モードのいずれかのモードをそれぞれ設
定するモード設定ステップと、 現処理フレームについて前記モード設定ステップで設定
されたモードが上書き許可モードまたは上書き不許可モ
ードのいずれかを判定するモード判定ステップとを有
し、 前記モード判定ステップで判定されたモードが上書き許
可モードのときは、前記アルファデータ生成ステップで
前記現処理フレームのアルファデータを新たに生成し
て、現処理フレームと同一フレームの既に生成されたア
ルファデータ上に上書きすることを特徴とする動画像内
オブジェクト抽出方法。 - 【請求項2】前記モード判定ステップで判定されたモー
ドが上書き不許可モードのときは、前記現処理フレーム
について新たなアルファデータの生成を行うことなく処
理を進めるか、処理を終了することを特徴とする請求項
1記載の動画像内オブジェクト抽出方法。 - 【請求項3】前記モード設定ステップは、前記動画像を
構成する複数のフレームの画像をフレーム順に表示する
動画像表示レーン上で利用者が上書き許可モードまたは
上書き不許可モードの区間を指定するか、上書き許可開
始フレームと上書き許可終了フレームまたは上書き不許
可開始フレームと上書き不許可開始フレームを指定する
ことにより、前記上書き許可モードまたは上書き不許可
モードの設定を行うことを特徴とする請求項1記載の動
画像内オブジェクト抽出方法。 - 【請求項4】動画像内の物体領域を表すアルファデータ
を該動画像のフレーム毎に順次生成するオブジェクト抽
出を行う動画像内オブジェクト抽出方法において、 互いに異なる複数のパラメータを用いてフレーム毎にそ
れぞれ複数のアルファデータを生成するアルファデータ
生成ステップと、 前記フレーム毎に前記アルファデータ生成ステップで生
成された複数のアルファデータのうちの一つを選択する
選択ステップとを有することを特徴とする動画像内オブ
ジェクト抽出方法。 - 【請求項5】動画像内の物体領域を表すアルファデータ
を該動画像のフレーム毎に順次生成するオブジェクト抽
出を行う動画像内オブジェクト抽出方法において、 前記動画像内の物体、背景及び動画像全体の少なくとも
一つの動きを示す動きパラメータを入力する動きパラメ
ータ入力ステップと、 入力された前記動きパラメータを用いて前記フレーム毎
にアルファデータを生成するアルファデータ生成ステッ
プとを有することを特徴とする動画像内オブジェクト生
成方法。 - 【請求項6】動画像内の物体領域を表すアルファデータ
を該動画像のフレーム毎に順次生成するオブジェクト抽
出を行う動画像内オブジェクト抽出装置において、 前記フレーム毎に前記アルファデータを生成するアルフ
ァデータ生成手段と、 前記アルファデータ生成手段で生成されたアルファデー
タを記憶する記憶手段と、 前記フレーム毎に前記記憶手段に記憶されたアルファデ
ータについて上書き許可モードまたは上書き不許可モー
ドのいずれかのモードを設定するモード設定手段と、 現処理フレームについて前記モード設定手段で設定され
たモードが上書き許可モードまたは上書き不許可モード
のいずれかを判定し、上書き許可モードのときのみ前記
アルファデータ生成手段に前記現処理フレームのアルフ
ァデータを新たに生成せしめて前記記憶手段に記憶され
ている現処理フレームと同一フレームのアルファデータ
上に上書きする制御を行う制御手段とを有することを特
徴とする動画像内オブジェクト抽出装置。 - 【請求項7】動画像内の物体領域を表すアルファデータ
を該動画像のフレーム毎に順次生成するオブジェクト抽
出を行う動画像内オブジェクト抽出装置において、 互いに異なる複数のパラメータを用いてフレーム毎にそ
れぞれ複数のアルファデータを生成するアルファデータ
生成手段と、 前記フレーム毎に前記アルファデータ生成ステップで生
成された複数のアルファデータのうちの一つを選択する
選択手段とを有することを特徴とする動画像内オブジェ
クト抽出装置。 - 【請求項8】動画像内の物体領域を表すアルファデータ
を該動画像のフレーム毎に順次生成するオブジェクト抽
出を行う動画像内オブジェクト抽出方法において、 前記動画像内の物体、背景及び動画像全体の少なくとも
一つの動きを示す動きパラメータを入力する動きパラメ
ータ入力手段と、 入力された前記動きパラメータを用いて前記フレーム毎
にアルファデータを生成するアルファデータ生成手段と
を有することを特徴とする動画像内オブジェクト生成装
置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000225735A JP3802322B2 (ja) | 2000-07-26 | 2000-07-26 | 動画像内オブジェクト抽出方法及び装置 |
EP01306361A EP1211639A3 (en) | 2000-07-26 | 2001-07-25 | Method and apparatus for extracting object from video image |
US09/911,474 US20020051009A1 (en) | 2000-07-26 | 2001-07-25 | Method and apparatus for extracting object from video image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000225735A JP3802322B2 (ja) | 2000-07-26 | 2000-07-26 | 動画像内オブジェクト抽出方法及び装置 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005317425A Division JP2006127530A (ja) | 2005-10-31 | 2005-10-31 | 動画像内オブジェクト抽出方法及び装置 |
JP2005317424A Division JP2006120170A (ja) | 2005-10-31 | 2005-10-31 | 動画像内オブジェクト抽出方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002044519A true JP2002044519A (ja) | 2002-02-08 |
JP3802322B2 JP3802322B2 (ja) | 2006-07-26 |
Family
ID=18719459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000225735A Expired - Fee Related JP3802322B2 (ja) | 2000-07-26 | 2000-07-26 | 動画像内オブジェクト抽出方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20020051009A1 (ja) |
EP (1) | EP1211639A3 (ja) |
JP (1) | JP3802322B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007074731A (ja) * | 2005-09-07 | 2007-03-22 | Fuji Xerox Co Ltd | 3次元マルチカメラビデオ監視支援システム、3次元マルチカメラビデオ監視支援方法、3次元マルチカメラビデオ監視支援プログラム |
US7409075B2 (en) | 2003-02-14 | 2008-08-05 | Sony Corporation | Image processing apparatus and method, program, and recording medium |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3764364B2 (ja) * | 2000-10-31 | 2006-04-05 | 株式会社東芝 | 画像特徴点検出方法、画像処理方法、及びプログラム |
JP2004038746A (ja) * | 2002-07-05 | 2004-02-05 | Toshiba Corp | 画像編集方法および画像編集システム |
JP4068485B2 (ja) * | 2002-09-30 | 2008-03-26 | 株式会社東芝 | 画像合成方法、画像合成装置、画像合成プログラム |
US20040066398A1 (en) * | 2002-10-03 | 2004-04-08 | Koninklijke Philips Electronics N.V | System and method for removing, trimming and bookmarking images of an ultrasound image sequence |
JP4200960B2 (ja) * | 2004-10-01 | 2008-12-24 | ソニー株式会社 | 編集装置及び編集方法並びにプログラム |
JP2006260401A (ja) * | 2005-03-18 | 2006-09-28 | Toshiba Corp | 画像処理装置、方法、およびプログラム |
JP2009194595A (ja) * | 2008-02-14 | 2009-08-27 | Sony Corp | 放送システム、送信装置、送信方法、受信装置、受信方法、提示装置、提示方法、プログラム、及び記録媒体 |
WO2010002921A1 (en) | 2008-07-01 | 2010-01-07 | Yoostar Entertainment Group, Inc. | Interactive systems and methods for video compositing |
US10332560B2 (en) | 2013-05-06 | 2019-06-25 | Noo Inc. | Audio-video compositing and effects |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5404316A (en) * | 1992-08-03 | 1995-04-04 | Spectra Group Ltd., Inc. | Desktop digital video processing system |
US6055335A (en) * | 1994-09-14 | 2000-04-25 | Kabushiki Kaisha Toshiba | Method and apparatus for image representation and/or reorientation |
US5781188A (en) * | 1996-06-27 | 1998-07-14 | Softimage | Indicating activeness of clips and applying effects to clips and tracks in a timeline of a multimedia work |
TR199700058A2 (xx) * | 1997-01-29 | 1998-08-21 | Onural Levent | Kurallara dayalı hareketli nesne bölütlemesi. |
US7184100B1 (en) * | 1999-03-24 | 2007-02-27 | Mate - Media Access Technologies Ltd. | Method of selecting key-frames from a video sequence |
US6665342B1 (en) * | 1999-07-02 | 2003-12-16 | International Business Machines Corporation | System and method for producing a still image representation of a motion video |
US6785329B1 (en) * | 1999-12-21 | 2004-08-31 | Microsoft Corporation | Automatic video object extraction |
US6654483B1 (en) * | 1999-12-22 | 2003-11-25 | Intel Corporation | Motion detection using normal optical flow |
JP2001197366A (ja) * | 2000-01-12 | 2001-07-19 | Hitachi Ltd | 画像合成方法及び画像合成プログラムを記録した記録媒体 |
US6925602B1 (en) * | 2000-03-20 | 2005-08-02 | Intel Corporation | Facilitating access to digital video |
US6731799B1 (en) * | 2000-06-01 | 2004-05-04 | University Of Washington | Object segmentation with background extraction and moving boundary techniques |
-
2000
- 2000-07-26 JP JP2000225735A patent/JP3802322B2/ja not_active Expired - Fee Related
-
2001
- 2001-07-25 US US09/911,474 patent/US20020051009A1/en not_active Abandoned
- 2001-07-25 EP EP01306361A patent/EP1211639A3/en not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7409075B2 (en) | 2003-02-14 | 2008-08-05 | Sony Corporation | Image processing apparatus and method, program, and recording medium |
JP2007074731A (ja) * | 2005-09-07 | 2007-03-22 | Fuji Xerox Co Ltd | 3次元マルチカメラビデオ監視支援システム、3次元マルチカメラビデオ監視支援方法、3次元マルチカメラビデオ監視支援プログラム |
Also Published As
Publication number | Publication date |
---|---|
EP1211639A2 (en) | 2002-06-05 |
EP1211639A3 (en) | 2004-04-21 |
US20020051009A1 (en) | 2002-05-02 |
JP3802322B2 (ja) | 2006-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7304650B2 (en) | Video object clipping method and apparatus | |
CN110650368A (zh) | 视频处理方法、装置和电子设备 | |
US20040125115A1 (en) | Strobe image composition method, apparatus, computer, and program product | |
US20190228263A1 (en) | Training assistance using synthetic images | |
JPH07152895A (ja) | 画像処理方法及び装置 | |
JP2005123824A (ja) | 映像オブジェクト軌跡合成装置、その方法及びそのプログラム | |
US20070071319A1 (en) | Method, apparatus, and program for dividing images | |
JP2002044519A (ja) | 動画像内オブジェクト抽出方法及び装置 | |
WO2017081839A1 (ja) | 移動体追跡方法、移動体追跡装置、およびプログラム | |
US6621924B1 (en) | Contour extraction apparatus, a method thereof, and a program recording medium | |
JP5251410B2 (ja) | カメラワーク算出プログラム、撮像装置及びカメラワーク算出方法 | |
KR20150023602A (ko) | 화상 처리 장치, 화상 처리 방법 및 기억 매체 | |
JPH06309426A (ja) | しきい値入力方法 | |
JP2001274973A (ja) | 顕微鏡画像合成装置、顕微鏡画像合成方法、顕微鏡画像合成処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2006127530A (ja) | 動画像内オブジェクト抽出方法及び装置 | |
US6337916B1 (en) | Modifying image data | |
CN113906731B (zh) | 一种视频处理方法和装置 | |
US6806878B2 (en) | Graphic editing apparatus for adding or deleting curve to/from graphics by interactive processing | |
WO2022116459A1 (zh) | 三维模型构建方法、装置、设备、存储介质及计算机程序 | |
CN114816190A (zh) | 视频跟踪处理方法、装置、电子设备及存储介质 | |
JP2000231431A (ja) | データ入力方法、データ入力装置、およびデータ入力プログラムを格納する記録媒体、ならびに映像データ操作方法、映像データ操作装置、および映像データ操作プログラムを格納する記録媒体 | |
JPH1153562A (ja) | 時系列データ生成装置および方法、曲線編集装置および方法、並びにプログラムを記録した記録媒体 | |
JP2006120170A (ja) | 動画像内オブジェクト抽出方法及び装置 | |
Liu et al. | Robust AAM building for morphing in an image-based facial animation system | |
JPH11195042A (ja) | 動画像アンカー作成システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050906 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051031 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060427 |
|
LAPS | Cancellation because of no payment of annual fees |