JP2005513929A - 画像のシーケンスにおける主要な動きを推定する方法 - Google Patents
画像のシーケンスにおける主要な動きを推定する方法 Download PDFInfo
- Publication number
- JP2005513929A JP2005513929A JP2003555818A JP2003555818A JP2005513929A JP 2005513929 A JP2005513929 A JP 2005513929A JP 2003555818 A JP2003555818 A JP 2003555818A JP 2003555818 A JP2003555818 A JP 2003555818A JP 2005513929 A JP2005513929 A JP 2005513929A
- Authority
- JP
- Japan
- Prior art keywords
- motion
- regression
- image
- images
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/144—Movement detection
- H04N5/145—Movement estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
− 単純化されたパラメトリック表現
ui = tx+k・xi
vi = ty+k・yi
ただし、
tx,ty 動きの平行移動成分を表すベクトルの成分
k 動きのズーム成分を特徴付ける発散のファクタ
に基づいて動きをモデル化するステップと、
− x,y,uおよびvがそれぞれ変数xi,yi,uiおよびviの軸を表す時、平面(x,u)および(y,v)によって定められる2つの動き表現空間の各々においてロバストな線形回帰を行い回帰直線を得るステップと、
− この回帰直線の傾きと原点における縦座標とに基づいてパラメタtx,tyおよびkを計算するステップも実行するという特徴を有する。
図1は、「ズーム」に相応する理論的な動きベクトルの場を示しており、
図2は、背景の主要な動きが「パニング」形であるシーンに相応する理論的な動きベクトルの場を示しており、これはまたこの主要な動きとは異なる動きにしたがう副次的なオブジェクトを有しており、
図3は、本発明で使用される動きベクトルの表現空間を示しており、
図4は、本発明で使用される表現空間の中央におけるズーム運動に対する理論的なベクトルの分布を示しており、
図5は、本発明で使用される表現空間における画像のグローバルな斜めの平行移動に対する理論的なベクトルの分布を示しており、
図6は、本発明で使用される表現空間において平行移動とズームとが組み合わされた動きに対する理論的なベクトルの分布を示しており、
図7は、本発明で使用される表現空間における静的なシーン(ゼロモーション)に対する理論的なベクトルの分布を示しており、
図8は、主要な動きを検出する方法のフローチャートを示している。
(ui,vi)t :座標(xi,yi)tを有する画像平面のピクセルに関連する見掛け上の動きベクトルの成分、
(xg,yg)t :カメラによって2Dシーンとして撮影された、3Dシーンの近似に対する基準点の座標、この基準点は、画像の座標(0,0)tを有する点とみなされる、
(tx,ty)t :動きの平行移動成分を表すベクトル、
k :動きのズーム成分を表す発散項、
θ :カメラの軸のまわりの動きの回転角である。
− いくつかのオブジェクトが主要な動きとは異なる副次的な動きにしたがうオブジェクトが画像にいくつか存在すること、
− オブジェクトの物理的動きを表さない動きベクトルが存在することを無視しなければならない。殊に、圧縮されたビデオストリームにおいて転送される動きベクトルは、動き補償の後、転送される残りの情報を最小化することを目的として計算されているのであり、映像化されたシーンを構成するオブジェクトの実際の動きを示すことを目的としてはいないのである。
(a0,b0)は、空間ui = f(xi)において計算される回帰直線のパラメタであり、εuiは、相応する残余誤差であり、
(a1,b1)は、空間vi = f(yi)において計算される回帰直線のパラメタであり、εuiは、相応する残余誤差である。
− 図4については中央がズームされた場合のデータの分布、
− 図5については斜めの平行移動の場合のデータの分布、
− 図6については中央を外れたズーム(ズームと平行移動とを組み合わせた動き)の場合のデータの分布、
− 図7については動きがない場合のデータの分布がそれぞれ示されている。
− 静止、
− 純粋な平行移動、
− 純粋なズーム、
− ズームが組み合わされた平行移動
に分類される。
Claims (10)
- 座標xi,yiを有する画像の要素に対して、成分ui,viを有する1つまたは複数の動きベクトルを定める、画像に関連する動きのベクトル場の計算(1)を行って、画像のシーケンスにおける主要な動きを推定する方法において、
さらに以下のステップ、すなわち、
− 単純化されたパラメトリック表現
ui = tx+k・xi
vi = ty+k・yi
ただし、
tx,ty 動きの平行移動成分を表すベクトルの成分
k 動きのズーム成分を特徴付ける発散のファクタ
に基づいて動きをモデル化するステップ(2)と、
− x,y,uおよびvがそれぞれ変数xi,yi,uiおよびviの軸を表す時、平面(x,u)および(y,v)によって定められる2つ動きの表現空間の各々にて、ロバストな線形回帰を行って回帰直線を得るステップ(3)と、
− 該回帰直線の傾きと原点における縦座標とに基づいて前記パラメタtx,tyおよびkを計算するステップ(4,5)とを実行することを特徴とする、
画像のシーケンスにおける主要な動きを推定する方法。 - 前記のロバストな回帰(3)は、least median of the square方式であり、
当該方式では、直線jについて座標xi,uiまたはyi,viを有するi番目の残差をri,jとするとき、残差の2乗からなる集合の最も小さい中央値を供給する直線を、直線jの集合から探索する、
請求項1に記載の方法。 - 前記の残差の2乗の最小中央値に対する探索(3)を所定数の直線に行い、ここで当該の各直線は、考察する動きの表現空間にてランダムに抜き出したサンプルのペアによってそれぞれ定められている、
請求項2に記載の方法。 - 前記のロバストな線形回帰(3)の後、第2のロバストでない線形回帰を行って、動きのモデルのパラメタの推定が一層精確にできるようにする、
請求項1に記載の方法。 - 前記の第2の線形回帰により、前記の第1のロバストな回帰から得た回帰の残差が所定の上回る表現空間の点を除外する、
請求項3に記載の方法。 - 各表現空間で計算した回帰直線(4)の方向係数が等しいか否かをテスト(5)し、
ここで当該テストは、第1に各表現空間にて別個に2つの回帰を行うことによって得られた残差の2乗の和と、第2に前記の2つの表現空間のサンプルの集合にグローバルな傾きの回帰を行うことによって得られた残差の2乗の和との比較に基づいており、
このテストの結果がイエスの場合、各表現空間にて得られた回帰直線の方向係数の算術平均によって前記モデルのパラメタkを推定する、
請求項1に記載の方法。 - 前記の主要な動きを、tx,tyおよびkの値に依存して、
平行移動、ズーム、平行移動とズームとの組み合わせ、静止画像
のカテゴリのうちの1つに分類する、
請求項1に記載の方法。 - MPEG−1,MPEG−2またはMPEG−4圧縮標準に準拠したアルゴリズムのような動き補償を使用した圧縮アルゴリズムによって考察される、ビデオシーケンスのエンコーディングから前記の動きベクトル場を得る、
請求項1に記載の方法。 - 画像のシーケンスにおける主要な動きを推定する方法の使用において、
キー画像の選択に適用され、
計算したパラメタtx,tyまたはkに関連する情報の、複数の画像にわたる総計の関数として1画像が選択されることを特徴とする、
請求項1に記載の方法の使用。 - 座標xi,yiを有する画像の要素に対して、成分ui,viを有する1つまたは複数の動きベクトルを定める、画像に関連する動きのベクトル場を計算する回路(1)を含む、画像のシーケンスにおける主要な動きを推定する装置において、
該装置は、また以下を行うための計算手段を含む、すなわち、
− 単純化されたパラメトリック表現
ui = tx+k・xi
vi = ty+k・yi
ただし、
tx,ty 動きの平行移動成分を表すベクトルの成分
k 動きのズーム成分を表す発散のファクタ
に基づいて動きをモデル化し(2)、
− x,y,uおよびvがそれぞれ変数xi,yi,uiおよびviの軸を表す時、平面(x,u)および(y,v)によって定められる2つ動きの表現空間の各々にて、ロバストな線形回帰を行って回帰直線を得て(3)、
− 該回帰直線の傾きと原点における縦座標とに基づいて前記パラメタtx,tyおよびkを計算する(4,5)ための計算手段と含むことを特徴とする、
画像のシーケンスにおける主要な動きを推定する装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR01/16466 | 2001-12-19 | ||
FR0116466A FR2833797B1 (fr) | 2001-12-19 | 2001-12-19 | Procede d'estimation du mouvement dominant dans une sequence d'images |
PCT/FR2002/004316 WO2003055228A1 (fr) | 2001-12-19 | 2002-12-12 | Procede d'estimation du mouvement dominant dans une sequence d'images |
Publications (4)
Publication Number | Publication Date |
---|---|
JP2005513929A true JP2005513929A (ja) | 2005-05-12 |
JP2005513929A6 JP2005513929A6 (ja) | 2005-08-04 |
JP2005513929A5 JP2005513929A5 (ja) | 2006-01-19 |
JP4880198B2 JP4880198B2 (ja) | 2012-02-22 |
Family
ID=8870690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003555818A Expired - Fee Related JP4880198B2 (ja) | 2001-12-19 | 2002-12-12 | 画像のシーケンスにおける主要な動きを推定する方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20050163218A1 (ja) |
EP (1) | EP1468568A1 (ja) |
JP (1) | JP4880198B2 (ja) |
KR (1) | KR100950617B1 (ja) |
CN (1) | CN100411443C (ja) |
AU (1) | AU2002364646A1 (ja) |
FR (1) | FR2833797B1 (ja) |
MX (1) | MXPA04005991A (ja) |
WO (1) | WO2003055228A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009128208A1 (ja) * | 2008-04-16 | 2009-10-22 | 株式会社日立製作所 | 動画像符号化装置、動画像復号化装置、動画像符号化方法、および動画像復号化方法 |
JP2018529270A (ja) * | 2015-08-24 | 2018-10-04 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 動きベクトル場の符号化方法、復号方法、符号化装置、および復号装置 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003244192A1 (en) * | 2003-06-25 | 2005-01-13 | Nokia Corporation | Image data compression parameter value controlling digital imaging device and image data compression parameter value decision method |
CN101023676B (zh) * | 2004-07-20 | 2012-06-27 | 高通股份有限公司 | 用于时间视频压缩中运动矢量预测的方法和设备 |
FR2875662A1 (fr) | 2004-09-17 | 2006-03-24 | Thomson Licensing Sa | Procede de visualisation de document audiovisuels au niveau d'un recepteur, et recepteur apte a les visualiser |
EP2204772A1 (en) * | 2005-11-30 | 2010-07-07 | Nikon Corporation | Image processing method, image processing program, image processing device, and imaging device |
JP5259726B2 (ja) | 2007-11-30 | 2013-08-07 | ドルビー ラボラトリーズ ライセンシング コーポレイション | モーション推定の時間的平滑化 |
JP5039921B2 (ja) * | 2008-01-30 | 2012-10-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 圧縮システム、プログラムおよび方法 |
US20110170604A1 (en) * | 2008-09-24 | 2011-07-14 | Kazushi Sato | Image processing device and method |
TWI477144B (zh) * | 2008-10-09 | 2015-03-11 | Htc Corp | 影像調整參數計算方法及裝置,及其電腦程式產品 |
CN101726256B (zh) * | 2008-10-27 | 2012-03-28 | 鸿富锦精密工业(深圳)有限公司 | 从影像轮廓中搜寻拐点的计算机系统及方法 |
CN102377992B (zh) * | 2010-08-06 | 2014-06-04 | 华为技术有限公司 | 运动矢量的预测值的获取方法和装置 |
JP2012084056A (ja) * | 2010-10-14 | 2012-04-26 | Foundation For The Promotion Of Industrial Science | 物体検出装置 |
US9442904B2 (en) * | 2012-12-21 | 2016-09-13 | Vmware, Inc. | Systems and methods for applying a residual error image |
US9939253B2 (en) * | 2014-05-22 | 2018-04-10 | Brain Corporation | Apparatus and methods for distance estimation using multiple image sensors |
US20210049793A1 (en) * | 2018-02-02 | 2021-02-18 | Koninklijke Philips N.V. | Correcting standardized uptake values in pre-treatment and post-treatment positron emission tomography studies |
KR20190110858A (ko) | 2018-03-21 | 2019-10-01 | 삼성전자주식회사 | 이미지 데이터 처리 방법 및 이를 위한 장치 |
CN111491183B (zh) * | 2020-04-23 | 2022-07-12 | 百度在线网络技术(北京)有限公司 | 一种视频处理方法、装置、设备及存储介质 |
US11227396B1 (en) * | 2020-07-16 | 2022-01-18 | Meta Platforms, Inc. | Camera parameter control using face vectors for portal |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0181034B1 (ko) * | 1995-03-18 | 1999-05-01 | 배순훈 | 특징점 기반 움직임 추정을 이용한 움직임 벡터 검출 방법 및 장치 |
US5802220A (en) * | 1995-12-15 | 1998-09-01 | Xerox Corporation | Apparatus and method for tracking facial motion through a sequence of images |
ES2186863T3 (es) * | 1996-01-22 | 2003-05-16 | Matsushita Electric Ind Co Ltd | Procedimiento para codificar y decodificar datos de imagen digital. |
JP2002536746A (ja) * | 1999-02-01 | 2002-10-29 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 動画シーケンスを表す記述子とその記述子を使用する画像検索システム |
EP1050850A1 (en) * | 1999-05-03 | 2000-11-08 | THOMSON multimedia | Process for estimating a dominant motion between two frames |
EP1050849B1 (en) * | 1999-05-03 | 2017-12-27 | Thomson Licensing | Process for estimating a dominant motion between two frames |
US6865582B2 (en) * | 2000-01-03 | 2005-03-08 | Bechtel Bwxt Idaho, Llc | Systems and methods for knowledge discovery in spatial data |
JP3681342B2 (ja) * | 2000-05-24 | 2005-08-10 | 三星電子株式会社 | 映像コーディング方法 |
WO2002003256A1 (en) * | 2000-07-05 | 2002-01-10 | Camo, Inc. | Method and system for the dynamic analysis of data |
US7499077B2 (en) * | 2001-06-04 | 2009-03-03 | Sharp Laboratories Of America, Inc. | Summarization of football video content |
-
2001
- 2001-12-19 FR FR0116466A patent/FR2833797B1/fr not_active Expired - Fee Related
-
2002
- 2002-12-12 JP JP2003555818A patent/JP4880198B2/ja not_active Expired - Fee Related
- 2002-12-12 US US10/499,560 patent/US20050163218A1/en not_active Abandoned
- 2002-12-12 EP EP02805377A patent/EP1468568A1/fr not_active Withdrawn
- 2002-12-12 AU AU2002364646A patent/AU2002364646A1/en not_active Abandoned
- 2002-12-12 KR KR1020047009616A patent/KR100950617B1/ko not_active IP Right Cessation
- 2002-12-12 MX MXPA04005991A patent/MXPA04005991A/es active IP Right Grant
- 2002-12-12 WO PCT/FR2002/004316 patent/WO2003055228A1/fr active Application Filing
- 2002-12-12 CN CNB028258886A patent/CN100411443C/zh not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009128208A1 (ja) * | 2008-04-16 | 2009-10-22 | 株式会社日立製作所 | 動画像符号化装置、動画像復号化装置、動画像符号化方法、および動画像復号化方法 |
JP2018529270A (ja) * | 2015-08-24 | 2018-10-04 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 動きベクトル場の符号化方法、復号方法、符号化装置、および復号装置 |
US11102501B2 (en) | 2015-08-24 | 2021-08-24 | Huawei Technologies Co., Ltd. | Motion vector field coding and decoding method, coding apparatus, and decoding apparatus |
Also Published As
Publication number | Publication date |
---|---|
EP1468568A1 (fr) | 2004-10-20 |
FR2833797B1 (fr) | 2004-02-13 |
US20050163218A1 (en) | 2005-07-28 |
CN100411443C (zh) | 2008-08-13 |
CN1608380A (zh) | 2005-04-20 |
KR100950617B1 (ko) | 2010-04-01 |
AU2002364646A1 (en) | 2003-07-09 |
WO2003055228A1 (fr) | 2003-07-03 |
FR2833797A1 (fr) | 2003-06-20 |
MXPA04005991A (es) | 2004-09-27 |
KR20040068291A (ko) | 2004-07-30 |
JP4880198B2 (ja) | 2012-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4880198B2 (ja) | 画像のシーケンスにおける主要な動きを推定する方法 | |
JP2005513929A6 (ja) | 画像のシーケンスにおける主要な動きを推定する方法 | |
Deng et al. | Unsupervised segmentation of color-texture regions in images and video | |
Ebdelli et al. | Video inpainting with short-term windows: application to object removal and error concealment | |
US8897512B1 (en) | Video hashing system and method | |
US20020176625A1 (en) | Method for segmenting multi-resolution video objects | |
Kalirajan et al. | Moving object detection for video surveillance | |
US20080253617A1 (en) | Method and Apparatus for Determining the Shot Type of an Image | |
Farin | Evaluation of a feature-based global-motion estimation system | |
Li et al. | Structuring lecture videos by automatic projection screen localization and analysis | |
Heuer et al. | Global motion estimation in image sequences using robust motion vector field segmentation | |
Li et al. | Detection of blotch and scratch in video based on video decomposition | |
JPH10301948A (ja) | 画像および映像検索方法 | |
Benedek et al. | Detection of object motion regions in aerial image pairs with a multilayer Markovian model | |
JP2004348741A (ja) | 画像の比較方法、方法を実行するためのプログラムを記憶するコンピュータ可読記憶媒体、および方法を実行する装置 | |
Babu et al. | Compressed domain video retrieval using object and global motion descriptors | |
Linnemann et al. | Temporally consistent soccer field registration | |
Zhu et al. | Occlusion registration in video-based augmented reality | |
Chien et al. | Efficient video segmentation algorithm for real-time MPEG-4 camera system | |
Wei et al. | Multiple feature clustering algorithm for automatic video object segmentation | |
Cheng et al. | A fast global motion estimation for moving objects segmentation using moment-preserving technique | |
Ling-Yu et al. | Foreground segmentation using motion vectors in sports video | |
Miah et al. | MeNToS: Tracklets association with a space-time memory network | |
Minetto et al. | Reliable detection of camera motion based on weighted optical flow fitting. | |
Mochamad et al. | Semi-automatic video object segmentation using LVQ with color and spatial features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051124 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081010 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090113 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090120 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090210 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090218 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090310 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090317 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090410 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090722 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100726 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100726 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100729 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100729 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111201 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |