CN1592420A - 用于分割压缩的活动图像的活动对象的方法 - Google Patents

用于分割压缩的活动图像的活动对象的方法 Download PDF

Info

Publication number
CN1592420A
CN1592420A CNA2004100644522A CN200410064452A CN1592420A CN 1592420 A CN1592420 A CN 1592420A CN A2004100644522 A CNA2004100644522 A CN A2004100644522A CN 200410064452 A CN200410064452 A CN 200410064452A CN 1592420 A CN1592420 A CN 1592420A
Authority
CN
China
Prior art keywords
motion
piece
external block
final profile
extract
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004100644522A
Other languages
English (en)
Other versions
CN1316828C (zh
Inventor
金真熙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN1592420A publication Critical patent/CN1592420A/zh
Application granted granted Critical
Publication of CN1316828C publication Critical patent/CN1316828C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/543Motion estimation other than block-based using regions

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种用于对压缩的活动图像编码的方法,其包括从压缩的活动图像中分割局部运动块,处理局部运动块的外部块,从处理的外部块恢复局部运动块的最终轮廓,并且恢复最终轮廓内的颜色。

Description

用于分割压缩的活动图像的活动对象的方法
技术领域
本发明涉及对压缩的移动图像的编码,并且具体的说涉及分割压缩的活动图像的活动对象和根据运动图象专家组4(MPEG-4)标准对压缩的活动图像进行转换和编码。
背景技术
通常,多媒体数据具有大容量但是在通信带宽上受限。因此,使用数据压缩来发送/接收多媒体数据。数据压缩意味着采用用于以较小尺寸表示信息的方法,并且恢复意味着采用用于解压数据的方法。
MPEG-4标准是为多媒体通信创建的基于内容的编码压缩方法。另外,因为MPEG-4具有高压缩效率并且以非常低的比特速率发送数据,所以移动多媒体应用使用MPEG-4。此外,使用MPEG-4来发送或存储大容量数字音频/视频数据。但是,MPEG-4标准仍然处于起步阶段。
基于对象的编码是MPEG-4的一个特性。基于对象的编码处理分割对象,并且分配一些比特给较为重要的对象,由此高效地压缩视频数据。
现有的压缩/解压方法恢复整个图像,并且组合运动信息和颜色及亮度信息。但是,解压整个图像需要很长时间。另外,处理整个图像需要的计算量被不利地增加了。
发明内容
因此,本发明的一个目的是解决上述问题和其它的问题。
本发明的另一目的是自动分割压缩的活动图像的活动对象,从而使用MPEG-4对压缩的活动图像进行转换和编码。
为了这些这些和其它优点并与本发明的目的一致,如在这里体现和广泛地描述的,本发明提供了一种用于分割压缩的活动图像的活动对象的新颖方法,其包括从压缩的活动图像分割出局部运动块,处理该局部运动块的外部块,从该处理的外部块确定该局部运动块的最终轮廓并且恢复该最终轮廓内的颜色。
本发明的其它优点、目的和特征将在随后的说明中部分地描述,经过以下检验或从本发明的实践中学习,上述优点、目的和特征对于本领域的普通技术人员来说是显而易见的。本发明的目的和优点可以如所附权利要求书中所特别指出的来实现和获得。
附图说明:
将参考附图详细描述本发明,在附图中相似的数字表示相似的元素,其中:
图1是一流程图,示出了用于根据本发明分割压缩的活动图像的活动对象的方法;
图2是一总体视图,示出了由图1的方法处理的图像;
图3是一详细流程图,示出了用于根据本发明分割压缩的活动图像的活动对象的方法;
图4是一总体视图,示出了在根据本发明的多个块之间的连接。
具体实施方式
下面将详细描述本发明的优选实施例,在附图中示出了其实例。
图像的对象分割信息,即,在不同对象之间的边界表面或对象轮廓的信息可以产生三维模型表示单元。根据在对象之间的同质性或异质性来分割图像的对象可以从该图像中获得目标对象。另外,可以对包括多种信息的活动图像编码。例如,可以合成多种对象-单元多媒体元素来组成活动图像。
根据本发明,首先以特定间隔使用帧的运动向量来确定活动对象的轮廓,并且之后对部分运动块解码。
更为详细地说,图1是一流程图,示出了用于根据本发明分割压缩的活动图像的活动对象的方法。如图所示,分割局部运动块(步骤S10),处理外部块(步骤S20),确定最终轮廓(步骤S30),并且恢复在最终轮廓内的颜色(步骤S40)。图3更详细地示出了这些特征。
现在转到图2,其示出了由图1的方法处理的图像。
如图2所示,通过在一图像中将预先确定尺寸的运动区域分割为局部运动块来形成第一图像10,其中通过从压缩的活动图像解码特定帧来获得该图像。随着分割该运动区域的开始,分割出无运动的背景块和活动的人物(对象)块。
之后,通过从该局部运动块中提取外部块而获得第二图像20。根据外部块处理指定多个外部块之间的连接,比如垂直的、水平的、上右下左对角的、以及上左下右对角的连接。结果,以阶梯的形状显示外部块。第三图像30是从外部块提取的轮廓。该轮廓指示人物(对象)的形状。
第四图像40是最终对象,即,通过恢复轮廓内的颜色获得的目标活动对象。该人物实际上除了无运动的背景以外从第一图像中提取出来的。
接下来,图3是一详细流程图,示出了用于根据本发明分割压缩的活动图像的活动对象的方法。
如图所示,通过以特定间隔来解码帧的方式,从压缩的活动图像提取运动向量(S100)。之后,通过对提取的运动向量进行预处理和照相机运动补偿处理来提取运动区域(S110)。
预处理过程限制了过度分割并且使用例如高斯滤波或由Perona和Malik提出的各向异性扩散来平滑图像,以减少噪声。高斯滤波是用于平滑图像以减少噪声的预处理过程。但是,高斯滤波还平滑边沿,使得可以移去边沿或改变它的位置。Perona和Malik的各向异性扩散平滑内部区域并且移去噪声而不平滑边沿。补偿过程区分照相机的运动与对象的运动,以改进向量的可靠性。
另外,将预先确定尺寸的运动区域确定为局部运动块(S120)并且提取该局部运动块的外部块(S130)。此外,恢复提取的外部块的原始图像并且描述多个块之间的连接(S140)。这里,将连接描述为链条形式的垂直的、水平的、上右下左对角的和上左下右对角的连接。
使用链条链接组合多个块并设置多个外部块之间的连接,并且提取对应于连接方向的边缘。实质上通过外部块处理来显示对象的形状。
为了描述在多个块之间的连接,检查和相应块相邻的八个块的连接方向。如果如图4所示的外部运动块存在,则通过组合四个比特值来描述每个块的连接信息。
如果相邻块的数量和方向大于二,则可以通过比特组合来设置多个块连接方向。仅使用所描述的信息来检测相应块在所描述方向上的边缘。例如,当多个块之间的连接是0×06(00000110)时,意味着该块和相邻的块在垂直和上右下左对角方向上连接。当检测到块内的边缘时,仅在垂直和上右下左对角方向上提取该边缘。
根据在多个外部块之间的连接来提取对应于多个块的连接方向的方向边缘(directional edge)(S150)。之后通过选择提取的边缘作为ACM(主动轮廓模型)理论的起始点并且对对象轮廓做ACM逼近(ACM-approximating)来确定最终轮廓(S160)。通过以解码最终轮廓内的块来恢复最终轮廓内的颜色,确定并分割具有完整形状和颜色的活动对象(S170)。
ACM被称为蛇形模型,因为它的搜索形状类似于蛇的运动。它是可以跟踪对象的轮廓的可变形模型。此外,ACM是平衡内部力和外部力的能量函数类型,并且使用公式将对象的轮廓显示为一组表示图像的轮廓的点。在起始阶段预先指定搜索区域。
因此,根据本发明,通过分割活动对象和通过以特定间隔解码帧中的运动向量以及通过处理部分获得的块的图像,该用于分割压缩的活动图像的活动对象的方法减少了对象分割时间。
此外,对于提取边缘以选择ACM起始点,在多个块的连接方向上提取方向边缘,从而改进了对象轮廓提取的精确性。
对于计算机领域的普通技术人员来说很明显,可以使用通用数字计算机或根据本说明书的教导而编程的微处理器来实现本发明。对于软件领域的普通技术人员来说很明显,根据本公开的教导,熟练的编程者可以很容易的制备合适的软件编码。
对于本领域的普通技术人员来说很明显,还可以通过制备特定用途集成电路或通过互联现有组成电路的合适网络来实现本发明。本发明包括计算机程序产品,该计算机程序产品是包括用于对计算机编程以执行本发明的处理的指令的存储介质。该存储介质可以包括(但是不限于)任意类型的盘,包括软盘、光盘、CD-ROM以及磁-光盘、ROM、RAM、EPROM、EEPROM、磁或光卡,或任意类型的适于存储电子指令的介质。
前述实施例和优点仅是示例性的并且不是限制本发明。本教导可以很容易的应用到其它类型的设备。本发明的说明只是示意性的,并且不限制权利要求的范围。对于本领域普通技术人员来说很明显可以有很多替代、修改和变更。

Claims (18)

1.一种对压缩的活动图象编码的方法,其包括:
从压缩的活动图像分割局部运动块;
处理该局部运动块的外部块;
根据该处理的外部块来确定该局部运动块的最终轮廓;以及
恢复该最终轮廓内的颜色。
2.如权利要求1所述的方法,进一步包括:
根据运动图像专家组4(MPEG-4)标准转换该压缩的活动图像。
3.如权利要求1所述的方法,其中,分割该局部运动块的步骤包括:
通过以特定的间隔解码压缩的活动图象的帧来提取运动向量;
通过对该提取的运动向量进行预处理和照相机运动补偿处理来检测运动区域;
在该检测的运动区域中确定和分割局部运动块。
4.如权利要求3所述的方法,其中,该预处理过程使用高斯滤波或各向异性扩散。
5.如权利要求3所述的方法,其中,该照相机运动补偿处理包括:
区分照相机的运动与对象的运动,以改进提取的运动向量的可靠性。
6.如权利要求1所述的方法,其中,处理外部块的步骤包括:
提取局部运动块的外部块;以及
描述提取的块之间的连接。
7.如权利要求6所述的方法,其中,通过恢复该外部块的原始图像,将该连接描述为垂直的、水平的、上右下左对角的和上左下右对角的连接。
8.如权利要求6所述的方法,其中,根据在多个块之间的所描述的连接,以链条的形式连接该多个块。
9.如权利要求1所述的方法,其中确定该最终轮廓的步骤包括:
提取外部块内的方向边缘;以及
选择提取的边缘作为主动轮廓模型(ACM)理论的起始点,并且对方向边缘进行ACM逼近。
10.如权利要求9所述的方法,其中,从在该多个外部块之间的连接提取出该方向边缘。
11.如权利要求1所述的方法,其中,通过解码最终轮廓内的块来执行颜色恢复。
12.一种根据运动图象专家组4(MPEG-4)标准对压缩的活动图像进行转换和编码的方法,其包括:
通过以特定的间隔解码压缩的活动图象的帧来提取运动向量;
通过对该提取的运动向量进行预处理和照相机运动补偿处理并分割局部运动块来检测运动区域;
提取和连接该分割的局部运动块中的外部块;
从该外部块提取方向边缘,并且根据该提取的边缘确定活动对象的最终轮廓;以及
通过解码该最终轮廓内的块来恢复该最终轮廓内的颜色。
13.如权利要求12所述的方法,其中,该预处理使用高斯滤波或各向异性扩散。
14.如权利要求13的所述方法,其中,该照相机运动补偿的步骤包括:
区分照相机的运动与对象的运动,以改进提取的运动向量的可靠性。
15.如权利要求12的所述方法,其中,根据在该多个块之间描述的连接以链条形式连接外部块。
16.如权利要求15的所述方法,其中,通过恢复该外部块的原始图像,将该连接描述为垂直的、水平的、上右下左对角的、和上左下右对角的连接。
17.如权利要求12所述的方法,其中,该方向边缘是对应于多个块的连接方向的边缘。
18.如权利要求12所述的方法,其中,通过选择提取的边缘作为主动轮廓模型(ACM)理论的起始点,并且对方向边缘进行ACM逼近来确定最终轮廓。
CNB2004100644522A 2003-08-26 2004-08-26 用于分割压缩的活动图像的活动对象的方法 Expired - Fee Related CN1316828C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR59175/2003 2003-08-26
KR20030059175A KR100575733B1 (ko) 2003-08-26 2003-08-26 압축 동영상의 움직임 객체 분할 방법

Publications (2)

Publication Number Publication Date
CN1592420A true CN1592420A (zh) 2005-03-09
CN1316828C CN1316828C (zh) 2007-05-16

Family

ID=34101847

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100644522A Expired - Fee Related CN1316828C (zh) 2003-08-26 2004-08-26 用于分割压缩的活动图像的活动对象的方法

Country Status (5)

Country Link
US (1) US20050047665A1 (zh)
EP (1) EP1511322A1 (zh)
JP (1) JP2005073280A (zh)
KR (1) KR100575733B1 (zh)
CN (1) CN1316828C (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104871542A (zh) * 2012-09-20 2015-08-26 索尼电脑娱乐公司 运动画面压缩装置、图像处理装置、运动画面压缩方法、图像处理方法、以及运动画面压缩文件的数据结构
CN106482636A (zh) * 2015-08-31 2017-03-08 株式会社三丰 图像测量装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007133685A (ja) * 2005-11-10 2007-05-31 Toshiba Corp 移動体輪郭抽出装置および方法
KR20130056998A (ko) * 2011-11-23 2013-05-31 엘지전자 주식회사 디지털 비디오 레코더 및 이를 이용한 객체 추적 방법
WO2017037900A1 (ja) * 2015-09-02 2017-03-09 三菱電機株式会社 情報処理装置及び情報処理方法及び情報処理プログラム
CN105469361B (zh) * 2015-12-24 2018-12-04 努比亚技术有限公司 一种局部图像处理方法和装置
KR101995411B1 (ko) * 2017-12-14 2019-07-02 주식회사 아이미마인 신체 모델 생성 장치 및 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3679426B2 (ja) * 1993-03-15 2005-08-03 マサチューセッツ・インスティチュート・オブ・テクノロジー 画像データを符号化して夫々がコヒーレントな動きの領域を表わす複数の層とそれら層に付随する動きパラメータとにするシステム
US5819035A (en) * 1995-10-20 1998-10-06 Matsushita Electric Industrial Co., Ltd. Post-filter for removing ringing artifacts of DCT coding
JP2000013643A (ja) * 1998-06-18 2000-01-14 Sony Corp ノイズ低減装置および方法、映像信号処理装置、並びに動き検出方法
KR100301113B1 (ko) * 1998-08-05 2001-09-06 오길록 윤곽선 추적에 의한 동영상 객체 분할 방법
US6377710B1 (en) * 1998-11-25 2002-04-23 Xerox Corporation Method and apparatus for extracting the skeleton of a binary figure by contour-based erosion
US6546117B1 (en) * 1999-06-10 2003-04-08 University Of Washington Video object segmentation using active contour modelling with global relaxation
WO2004013810A1 (en) * 2002-07-31 2004-02-12 Koninklijke Philips Electronics N.V. System and method for segmenting

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104871542A (zh) * 2012-09-20 2015-08-26 索尼电脑娱乐公司 运动画面压缩装置、图像处理装置、运动画面压缩方法、图像处理方法、以及运动画面压缩文件的数据结构
CN104871542B (zh) * 2012-09-20 2018-01-30 索尼电脑娱乐公司 运动画面压缩装置、图像处理装置、运动画面压缩方法、图像处理方法
US10244238B2 (en) 2012-09-20 2019-03-26 Sony Interactive Entertainment Inc. Moving picture compression apparatus, image processing apparatus, moving picture compression method, image processing method, and data structure of moving picture compression file
CN106482636A (zh) * 2015-08-31 2017-03-08 株式会社三丰 图像测量装置
CN106482636B (zh) * 2015-08-31 2020-09-22 株式会社三丰 图像测量装置

Also Published As

Publication number Publication date
CN1316828C (zh) 2007-05-16
US20050047665A1 (en) 2005-03-03
JP2005073280A (ja) 2005-03-17
KR20050021086A (ko) 2005-03-07
EP1511322A1 (en) 2005-03-02
KR100575733B1 (ko) 2006-05-03

Similar Documents

Publication Publication Date Title
KR100556832B1 (ko) 영상정보 검색을 위한 비선형 양자화 및 유사도 매칭 방법
CN1110016C (zh) 降低环状噪声的信号适应性滤波方法和信号自适应滤波器
US6600786B1 (en) Method and apparatus for efficient video processing
CN108513131B (zh) 一种自由视点视频深度图感兴趣区域编码方法
EP2297935B1 (en) High dynamic range texture compression
US20020176625A1 (en) Method for segmenting multi-resolution video objects
US9106892B2 (en) Image compression based on parameter-assisted inpainting
JPH07121700A (ja) 画像データの表現方法および復元方法
CN112954393A (zh) 一种基于视频编码的目标跟踪方法、系统、存储介质及终端
CN111432210A (zh) 一种基于填充的点云属性压缩方法
WO2007124084A1 (en) Vision-based compression
CN107657228A (zh) 视频场景相似性分析方法及系统、视频编解码方法及系统
US10708601B2 (en) Methods and apparatuses for encoding and decoding superpixel borders
CN1592420A (zh) 用于分割压缩的活动图像的活动对象的方法
CN101237581B (zh) 基于运动特征的h.264压缩域实时视频对象分割方法
CN1926879A (zh) 视频信号编码器、视频信号处理器、视频信号分发系统及其操作方法
CN107682699B (zh) 一种近无损图像压缩方法
JP2978039B2 (ja) 動画像のカット画面検出方法
Liu et al. Edge-based inpainting and texture synthesis for image compression
Hesseler et al. Mpeg-2 compressed-domain algorithms for video analysis
EP1067801B1 (en) Edge detecting and image encoding method and apparatus
Decombas et al. Seam carving for semantic video coding
MXPA05001204A (es) Metodo para comprimir datos digitales de una secuencia de video que comprende planos alternados.
CN113613017B (zh) 一种三维帧间预测改进v-pcc帧间预测的方法
Yomdin et al. Normal forms representation: a technology for image compression

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070516

Termination date: 20170826

CF01 Termination of patent right due to non-payment of annual fee