CN1115647C - 用来对视频信号中的轮廓图象编码的方法和装置 - Google Patents

用来对视频信号中的轮廓图象编码的方法和装置 Download PDF

Info

Publication number
CN1115647C
CN1115647C CN96119949A CN96119949A CN1115647C CN 1115647 C CN1115647 C CN 1115647C CN 96119949 A CN96119949 A CN 96119949A CN 96119949 A CN96119949 A CN 96119949A CN 1115647 C CN1115647 C CN 1115647C
Authority
CN
China
Prior art keywords
contour
segment
profile
straight
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN96119949A
Other languages
English (en)
Other versions
CN1171019A (zh
Inventor
金镇宪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fengye Vision Technology Co., Ltd.
Original Assignee
Daewoo Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daewoo Electronics Co Ltd filed Critical Daewoo Electronics Co Ltd
Publication of CN1171019A publication Critical patent/CN1171019A/zh
Application granted granted Critical
Publication of CN1115647C publication Critical patent/CN1115647C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/20Contour coding, e.g. using detection of edges
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种轮廓图象编码方法,将一个视频帧分为多个块并检测轮廓块,还求出包括在每个轮廓块里的每个轮廓段上的多个顶点并且在每个轮廓块的每个轮廓段上的顶点的基础上对轮廓图象进行编码。

Description

用来对视频信号中的轮廓图象编码的方法和装置
本发明涉及一种对视频信号中的轮廓图象编码的方法和装置;更具体地,涉及一种能够减小逼近轮廓图象的计算复杂度的改进后的轮廓编码方法和装置。
在诸如可视电话,电话会议和高清晰度电视系统的数字可视系统中,由于视频帧信号中的视频行信号包括一序列称作象素值的数字数据,需要大量的数字数据来确定每个视频帧信号。然而,由于传统的传送信道的可用频率带宽是有限的,为了通过它传送大量的数字数据,特别是在象可视电话和电话会系统这样的低比特率视频信号编码器的情况下。使用各种数据压缩技术来压缩或减小数据量是必要的。
用于低比特率编码系统的对视频信号编码的技术之一是被称为面向对象的分析合成编码技术(参见,Michael Hotter,“Object-Oriented Analysis-Synthesis Coding Based on Moving Two-Dimensional objects”载于Signal processing:Image Communication,2,No.4,pp.409-428(十二月,1990))。
按照面向对象的分析合成编码技术,输入视频图象被分为目标;并且通过不同的编码信道来处理定义每个目标的动作、轮廓及象素数据的三组参数。
具体地,在处理一个目标的轮廓图象的过程中,轮廓信息对于目标形状的分析和合成是重要的。用来表示轮廓信息的分类编码方法是循环编码技术。尽管来用循环编码技术可以没有任何遗迭地对轮廓信息忠实地编码,但为了表示它就需要大量的数据。
考虑到这一点,已提出几种技术来逼近轮廓,例如多边形逼近法和B-样条逼近法。多边形逼的法的缺点之一是轮廓表示得折线粗略。另一方面,B-样条逼近法能够更精确地表示轮廓;但它要求高阶多项式来减小逼近误差,由此增加了视频编码器的总计算复杂度。
用来改进与表示的粗糙度和总计算复杂度相关问题的技术之一是采用了多边形逼近法和离散正弦变换(DST)的轮廓逼近法。该技术在共有未决申请中得到了说明,其美国流水号08/423,604,1995年4月17日申请,题目为“A CONTOUR APPROXI MATION APPARATUS FOR REPRESENTING A CONTOUR OF ANOBJECT”。然而,由于上述技术对超过一帧的轮廓图象进行多边表逼近和DST,当处理复杂的轮廓图象时,仍然希望进一步减小轮廓逼近的计算复杂度。
因而,本发明的首要目的是提供一种能够减小轮廓逼近的计算复杂度的轮廓编码方法和装置。
根据本发明,提供一种对包含在视频信号的一个视频帧中的目标的轮廓图象进行编码的方法,其中轮廓图象包括多个轮廓象素,轮廓象素表示落在轮廓图象上的象素,包括下列步骤:
(a)将视频帧分为多个块,每个块分别包括K×L个象素(K,L是正整数);
(b)检测轮廓块,在每个轮廓块里包括一个或更多的轮廓象素;及
(c)在逐轮廓块的基础上对轮廓图象编码。
通过下面对所给的优选实施例连同附图的说明,本发明的上述及其他目的和特点将变得清楚,其中:
图1描述了根据本发明的轮廓编码装置的方框图;
图2是说明确定轮廓块的示意图;
图3示出了根据本发明的初始顶点的确定过程;
图4说明的是对轮廓片段的示例性多边形逼近过程;以及
图5说明的是代表两个顶点之间相应轮廓段的线段的在采样点的误差。
参照图1,所示的是发明的轮廓编码装置10的方框图,用于对包含在视频信号的一个视频帧中的目标的轮廓图象编码。
轮廓编码装置10包括一个轮廓块检测器100,一个初始顶点确定功能块110,一个多边形逼近功能块120,一个采样和误差检测功能块130,一个变换和量化(DST & Q)功能块140及一个轮廓编码器150。
包含在视频帧中的一个目标的轮廓图象数据被输入到轮廓块检测器100中,其中轮廓图象数据表示轮廓象素的位置信息,轮廓象素表示落在目标的轮廓上的象素。
在轮廓块检测器100里,视频帧首先被各自分为多个K×L个象素(K,L是正整数)的块,并且检测轮廓块,其中轮廓块是指至少包含一个轮廓象素的块。例如,如图2所示,落在阴影区20的每一个块都包括了视频帧40中的轮廓30的一部分并且被称作轮廓块。包括在每个轮廓块里的轮廓象素的位置信息然后被送到初始顶点确定功能块110中。
初始顶点确定功能块110检测每个轮廓块中每个轮廓段的两个端点,并且选择检测出的两个端点作为相应轮廓段的初始顶点,其中轮廓段表示在轮廓块中连续轮廓象素的集合。
参照图3,其所示的图形说明了在初始顶点确定功能块110中进行的初始顶点确定过程。如图3所示,如果在轮廓块M中有开环轮廓段33和35,则两个端点A和B被确定为轮廓段33的初始顶点以及两个端点C和D被选作轮廓段35的初始顶点。如果轮廓块中的轮廓段是一个封闭环,则同传统的多边形逼近技术一样选择那种轮廓段上的两个最远点作为初始顶点。在轮廓段仅由一个轮廓象素构成的情况下,就不为这种轮廓段确定初始顶点。在为每个包括多于一个轮廓象素的轮廓段确定初始顶点后,代表这种轮廓段的初始顶点的位置信息的初始顶点数据以及代表组成轮廓段的轮廓象素的位置数据的轮廓段数据被传送到多边形逼近功能块120中。
在每个轮廓段的初始顶点数据和轮廓段数据的基础上,多边形逼近功能块120使用传统的用线段拟合轮廓段的逼近算法来逼近每个轮廓段。
参照图4,说明了按照多边形逼近技术对示范性轮廓段33的分段过程。
首先,在轮廓段33的初始顶点A和B之间划一直线段AB并且求出从轮廓段33上的最远点到直线段AB的距离DMAX。如果直线段AB和最远点,例如E之间的距离DMAX大于预定的阈值,则E点被选为附加顶点并且分别划出用A和B连接E点的直线段AE和EB。重复这一过程直到每个直线段的DMAX变为小于预定的阈值。
附加顶点的数目由预定阈值决定,并且当预定阈值变得小时,以编码效率为代价,用直线段表示轮廓段会变得更精确。
再参照图1,多边形逼近功能块120通过线路L10将代表每个轮廓段的包括初始顶点和附加顶点,例如A,B和E的顶点位置的顶点信息提供给采样和误差检测功能块130及轮廓编码器150,同时每个轮廓段的轮廓段数据通过线路L20供应给采样和误差检测功能块130。
在采样和误差检测功能块130里,在轮廓段内的两个顶点之间为每条直线段选择N个等间距的采样点,N为正整数;并且在顶点信息和轮廓段数据的基础上计算N个采样点的每一个目的逼近误差,其中采样点的逼近误差代表了采样点直线段和轮廓段之间的距离。
图5所示是表示直线段AE与相应的轮廓段之间的逼近误差的示范图。每个逼近误差d1到d4代表从直线段AE上每个采样点S1到S4与相应的轮廓段的距离,其中在顶点A和E的逼近误差都是“0”。在本发明的优选实施例中,为使接收端的译码器能够识别由每个逼近误差所表示的轮廓段部分,也就是轮廓象素,驻留在直线段的哪一侧,每个逼近误差包括有以预定方式确定的符号。然后每个直线段的一组逼近误差被送到变换和量化功能块140中。
变换和量化功能块140首先采用例如离散正弦变换(DST)将每组逼近误差变换为一组变换系数,其中每个组的逼近误差可能包括在N个采样点的和每条直线段的两个顶点的逼近误差或者只包括在N个采样点的逼近误差。然后使用公知的量化方法将该组变换系数量化,并且一组与每条直线段相应的已量化的变换系数被提供给轮廓编码器150做进一步处理。
在轮廓编码器150中,使用JPEC(联合摄影专家组(Joint Photographic Experts Group))的二进制算术码对每组已量化的变换系数编码,同时由于顶点是弱相关的(are sparsely correlated),使用例如没有压缩的定长码对来自多边形逼近功能块120的顶点信息编码。包括编码后的量化变换系数及顶点信息的编码数字信号被发送到发射器去发射。
尽管本发明参照特定的实施例得以说明,对该领域的普通技术人员显而易见的是,在没有背离下面权利要求书所确定的本发明的精神和范围的情况下可以作出各种改变和修改。

Claims (6)

1、一种对包含在一个视频信号的视频帧中的一个目标的轮廓图象进行编码的方法,其中该轮廓图象包括多个轮廓象素,轮廓象素表示落在轮廓图象上的象素,包括下列步骤:
(a)将视频帧分为多个块,每个块分别包括KxL个象素,其中K,L是正整数;
(b)检测轮廓块,在每个轮廓块里包括一个或更多的轮廓象素;及
(c)在一个轮廓块一个轮廓块的基础上对轮廓图象编码,
其中所述的步骤(c)包括下列步骤:
(c1)确定包括在每个轮廓块里的每个轮廓段上的多个顶点,所述的每个轮廓段表示包括在每个轮廓块里的一组连续轮廓象素,
所述的步骤(c1)步骤下列步骤:
(c11)确定每个轮廓段上的两个顶点;及
(c12)找出每个轮廓段上的附加顶点,直到所述每个轮廓段与连接所述轮廓段上的两个相邻顶点的每条直线段之间的最大距离小于预定阈值;
(c2)在每个轮廓段上的顶点的基础上对轮廓图象编码,
所述的步骤(c2)包括下列步骤:
(c21)确定连接每个轮廓段上的两个相邻顶点的每条直线段上的采样点的预定数目;
(c22)计算在每个采样点的和在每条直线段上的顶点上的误差,误差表示直线段与它相应的轮廓段之间的距离;
(c23)将一组误差变换为一组变换系数;
(c24)将该组变换系数转换为一组量化的变换系数;及
(c25)对该组量化的变换系数编码。
2、按照权利要求1的方法,其中该组误差包括每条直线段上的采样点的误差。
3、按照权利要求1的方法,其中该组误差包括采样点的和每条直线段上的顶点的误差。
4、一种用于对包含在一个视频信号的视频帧中的一个目标的轮廓图象进行编码的装置,其中该轮廓图象包括多个轮廓象素,轮廓象素表示落在轮廓图象上的象素,该装置包括:
用来将视频帧分为多个块的装置,每个块各自包括K×L个象素,其中K,L是正整数;
用来检测轮廓块的装置,在每个轮廓块里包括一个或更多的轮廓象素;及
用来在一个轮廓块一个轮廓块的基础上对轮廓图象编码的装置,
其中所述的轮廓图象编码装置包括:
用来确定包括在每个轮廓块里的每个轮廓段上的多个顶点的装置,所述的每个轮廓段表示包括在每个轮廓块里的一组连续轮廓象素;及
用来在每个轮廓段上的顶点的基础上对轮廓图象编码的装置;
所述顶点确定装置包括:
用来确定每个轮廓段上的两个顶点的装置;
用来找出每个轮廓段上的附加顶点的装置,直到所述每个轮廓段与连接所述轮廓段上的两个相邻顶点的每条直线段之间的最大距离小于预定阈值;
所述的轮廓图象编码装置包括:
用来确定连接每个轮廓段上的两个相邻顶点的每条直线段上的采样点的预定数目的装置;
用来计算在每个采样点的和每条直线段上的顶点上的误差的装置,误差表示直线段和与它相应的轮廓段之间的距离;
用来将一组误差变换为一组变换系数的装置;
用来将该组变换系数转换为一组量化的变换系数的装置;
用来对该组量化的变换系数编码的装置。
5、按照权利要求4的装置,其中该组误差包括每条直线段上的采样点的误差。
6、按照权利要求4的装置,其中该组误差包括采样点的和每条直线段上的顶点的误差。
CN96119949A 1996-07-11 1996-10-03 用来对视频信号中的轮廓图象编码的方法和装置 Expired - Fee Related CN1115647C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1019960027949A KR100209132B1 (ko) 1996-07-11 1996-07-11 블럭-기반 물체 윤곽 부호화 방법
KR27949/1996 1996-07-11

Publications (2)

Publication Number Publication Date
CN1171019A CN1171019A (zh) 1998-01-21
CN1115647C true CN1115647C (zh) 2003-07-23

Family

ID=36686714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96119949A Expired - Fee Related CN1115647C (zh) 1996-07-11 1996-10-03 用来对视频信号中的轮廓图象编码的方法和装置

Country Status (7)

Country Link
US (1) US5870501A (zh)
EP (1) EP0818929B1 (zh)
JP (1) JP3917691B2 (zh)
KR (1) KR100209132B1 (zh)
CN (1) CN1115647C (zh)
DE (1) DE69635836T2 (zh)
IN (1) IN189247B (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100212552B1 (ko) * 1996-12-23 1999-08-02 전주범 이산적 사인 변환을 이용한 윤곽선 영상 신호 부호화 방법 및 그 장치
KR100239303B1 (ko) * 1997-01-21 2000-01-15 전주범 윤곽선 영상의 초기정점 부호화 방법
KR100295798B1 (ko) * 1997-07-11 2001-08-07 전주범 스케일러빌리티를구현한이진현상신호부호화장치
IL134182A (en) 2000-01-23 2006-08-01 Vls Com Ltd Method and apparatus for visual lossless pre-processing
US6753929B1 (en) 2000-06-28 2004-06-22 Vls Com Ltd. Method and system for real time motion picture segmentation and superposition
US6744818B2 (en) 2000-12-27 2004-06-01 Vls Com Ltd. Method and apparatus for visual perception encoding
WO2003021970A1 (en) * 2001-09-04 2003-03-13 Faroudja Cognition Systems, Inc. Low bandwidth video compression
US7099518B2 (en) * 2002-07-18 2006-08-29 Tektronix, Inc. Measurement of blurring in video sequences
US20040131117A1 (en) * 2003-01-07 2004-07-08 Sheraizin Vitaly S. Method and apparatus for improving MPEG picture compression
US7639892B2 (en) * 2004-07-26 2009-12-29 Sheraizin Semion M Adaptive image improvement
US7903902B2 (en) 2004-07-26 2011-03-08 Sheraizin Semion M Adaptive image improvement
US7526142B2 (en) * 2005-02-22 2009-04-28 Sheraizin Vitaly S Enhancement of decompressed video
JP4408836B2 (ja) * 2005-05-30 2010-02-03 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP4844449B2 (ja) * 2006-04-17 2011-12-28 日本ビクター株式会社 動画像符号化装置、方法、プログラム、動画像復号化装置、方法、およびプログラム
JP4475680B2 (ja) * 2009-07-14 2010-06-09 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP5016723B2 (ja) 2011-02-24 2012-09-05 任天堂株式会社 画像認識プログラム、画像認識装置、画像認識システム、および画像認識方法
JP4967065B2 (ja) 2011-02-24 2012-07-04 任天堂株式会社 画像処理プログラム、画像処理装置、画像処理システム、および画像処理方法
JP5026604B2 (ja) 2011-02-24 2012-09-12 任天堂株式会社 画像認識プログラム、画像認識装置、画像認識システム、および画像認識方法
JP2011134343A (ja) * 2011-02-24 2011-07-07 Nintendo Co Ltd 画像処理プログラム、画像処理装置、画像処理システム、および画像処理方法
JP5178860B2 (ja) 2011-02-24 2013-04-10 任天堂株式会社 画像認識プログラム、画像認識装置、画像認識システム、および画像認識方法
CN110751896A (zh) * 2019-10-15 2020-02-04 北京龙软科技股份有限公司 一种矿山等值线相关专题图绘制等值线注记的方法和装置
CN113132744A (zh) * 2021-03-22 2021-07-16 广州虎牙科技有限公司 直播弹幕的处理方法、模型、电子装置及计算机存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5947666A (ja) * 1982-09-13 1984-03-17 Dainippon Screen Mfg Co Ltd 2値画像のデ−タ圧縮方法
JPS6461870A (en) * 1987-09-01 1989-03-08 Fujitsu Ltd Method for detecting crack distribution of ridge line of fingerprint image
US4951140A (en) * 1988-02-22 1990-08-21 Kabushiki Kaisha Toshiba Image encoding apparatus
US5335298A (en) * 1991-08-19 1994-08-02 The United States Of America As Represented By The Secretary Of The Army Automated extraction of airport runway patterns from radar imagery
FR2695497A1 (fr) * 1992-09-09 1994-03-11 Philips Electronique Lab Dispositif de codage d'images fixes.
US5638986A (en) * 1992-11-06 1997-06-17 Fluilogic Systems Oy Method and equipment for dosing small amounts of liquid quantitatively
KR970003799B1 (ko) * 1993-12-29 1997-03-21 양승택 영상 프레임차를 이용한 영상신호 전송장치
US5594504A (en) * 1994-07-06 1997-01-14 Lucent Technologies Inc. Predictive video coding using a motion vector updating routine
JP3038143B2 (ja) * 1994-12-29 2000-05-08 現代電子産業株式会社 映像機器の物体別形状情報の減縮装置及びその減縮方法並びに多角近似化方法
KR0181059B1 (ko) * 1995-03-18 1999-05-01 배순훈 물체의 윤곽을 나타내기 위한 윤곽 근사장치
KR0181052B1 (ko) * 1995-03-31 1999-05-01 배순훈 고화질 영상 시스템의 영역 분할 장치
KR100209798B1 (ko) * 1995-04-08 1999-07-15 전주범 확장-내삽을 이용한 윤곽선 물체의 부호화 장치

Also Published As

Publication number Publication date
JP3917691B2 (ja) 2007-05-23
DE69635836D1 (de) 2006-04-27
DE69635836T2 (de) 2006-08-03
US5870501A (en) 1999-02-09
IN189247B (zh) 2003-01-18
EP0818929A3 (en) 2000-08-23
EP0818929A2 (en) 1998-01-14
JPH1079942A (ja) 1998-03-24
EP0818929B1 (en) 2006-02-22
KR980013430A (ko) 1998-04-30
KR100209132B1 (ko) 1999-07-15
CN1171019A (zh) 1998-01-21

Similar Documents

Publication Publication Date Title
CN1115647C (zh) 用来对视频信号中的轮廓图象编码的方法和装置
CN1130919C (zh) 用于编码包含在视频信号中的区域的轮廓的装置
CN1129320C (zh) 改进的用于表示目标轮廓的轮廓近似方法
CN1110956C (zh) 用于表示物体轮廓的轮廓近似装置
CN1170316A (zh) 用于对视频信号中的对象的轮廓进行编码的方法和装置
CN1177258A (zh) 用于对目标轮廓的视频信号进行编码的方法和装置
CN1133329C (zh) 根据轮廓运动估算技术对目标轮廓进行编码的方法和设备
CN1110959C (zh) 对视频信号中的目标轮廓进行编码的方法及装置
EP0806742B1 (en) Adaptive contour coding
CN1196642A (zh) 用于自适应编码一目标的轮廓的方法和装置
CN1151678C (zh) 对于视频信号中的目标轮廓图象进行编码的方法和装置
CN1150489C (zh) 编码一帧内多个轮廓的方法及装置
CN1156170C (zh) 用于对一目标的轮廓编码的方法和装置
CN1062701C (zh) 用于编码目标轮廓的装置
CN1133326C (zh) 采用顶点编码技术的目标轮廓编码方法及设备
CN1180974A (zh) 对视频信号中的目标轮廓图象进行编码的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20030919

Patentee after: Daewoo Electronics Co., Ltd.

Patentee before: Daewoo Electronics Co., Ltd.

ASS Succession or assignment of patent right

Owner name: FENGYE VISION TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: DAEWOO ELECTRONICS CO., LTD.

Effective date: 20130418

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130418

Address after: Ontario

Patentee after: Fengye Vision Technology Co., Ltd.

Address before: Seoul, South Kerean

Patentee before: Daewoo Electronics Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20030723

Termination date: 20151003

EXPY Termination of patent right or utility model