CN1106764C - 对视频信号中的轮廓图象编码的自适应轮廓编码方法 - Google Patents

对视频信号中的轮廓图象编码的自适应轮廓编码方法 Download PDF

Info

Publication number
CN1106764C
CN1106764C CN96106941A CN96106941A CN1106764C CN 1106764 C CN1106764 C CN 1106764C CN 96106941 A CN96106941 A CN 96106941A CN 96106941 A CN96106941 A CN 96106941A CN 1106764 C CN1106764 C CN 1106764C
Authority
CN
China
Prior art keywords
profile
contour
pixel
coding
contour image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN96106941A
Other languages
English (en)
Other versions
CN1164802A (zh
Inventor
金镇宪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fengye Vision Technology Co., Ltd.
Original Assignee
Daewoo Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daewoo Electronics Co Ltd filed Critical Daewoo Electronics Co Ltd
Publication of CN1164802A publication Critical patent/CN1164802A/zh
Application granted granted Critical
Publication of CN1106764C publication Critical patent/CN1106764C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/20Contour coding, e.g. using detection of edges
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Abstract

一种对视频帧中的轮廓图象进行自适应编码的轮廓编码方法,它以轮廓图象的大小和复杂度为基础,能够提高再现轮廓图象的质量。首先确定输入的轮廓图象的大小和复杂度。随后使用第一和第二轮廓编码方法对轮廓图象进行编码,由此分别产生第一和第二轮廓编码数据。并且,根据轮廓图象的大小和复杂度来选择第一和第二轮廓编码数据作为已编码的轮廓图象数据。

Description

对视频信号中的轮廓图象编码的 自适应轮廓编码方法
本发明涉及一种视频信号编码方法;更具体地,涉及一种基于轮廓图象的大小及复杂性对视频信号的视频帧中的轮廓图象进行自适应编码的方法。
在诸如可视电话、电话会议和高清晰度电视系统这样的数字视频系统中,由于视频帧信号包含有被称作象素值的数字化数据,需要大量的数字化数据以确定各视频帧信号。然而由于常规发送信道的可用频带宽度是有限的,为了通过其发送大量的数字化数据,使用各种数据压缩技术来压缩或减少数据量是必要的,特别是在象可视电话和电话会议系统这样的低比特率视频信号编码器中。
对低比特率编码系统中的视频信号进行编码的技术之一就是被称作面向目标的分析合成编码技术(参见Michael Hotter著《基于运动的二维目标的面向目标的分析合成编码》,Signal Processing:Image Communication,2,No.4,409~428页(1990年12月)。
根据面向目标的分析合成编码技术,输入的视频图象被分为若干个目标且三组用来确定各目标的运动轮廓和象素数据的参数通过不同的编码信道被处理。
在处理一个目标的轮廓图象时,轮廓信息对于目标外形的分析和合成是重要的。用来表示轮廓信息的常规编码方案之一就是链式编码技术。在链式编码技术中,尽管轮廓信息没有损失,但所需要的比特量是很大的。
为了克服这一缺陷,已提出几种技术来对轮廓进行近似,例如多边形近似法和B-仿样函数近似法。同多边形近似法相比,B-仿样函数近似法有可能得到更准确的表现,其中它使用了高次多项式来减少近似误差。然而,B-仿样函数近似法会增大视频编码器的整体计算复杂度。
为改进增大的计算复杂度这一问题,一种使用了多边形近似法和离散正弦变换(DST)的轮廓编码技术被提了出来。在一份共有未决申请中说明了这一技术,其中国专利申请号为95116451.1,1995年9月7日递交,题目为“用来再现目标轮廓的改进的轮廓近似方法”。然而,在处理复杂的轮廓图象时,上述使用多边形近似法和DST的技术会产生一个与它的原始轮廓象很不一致的重构图象。
因此,本发明的主要目的是提供一种用于编码器的方法,它以轮廓图象的大小和复杂度为基础,对视频信号的视频帧中的轮廓图象进行适当的编码,从而提高视频帧中重构轮廓图象的质量。
按照本发明,提供一种对视频信号的视频帧中所包括的目标的轮廓图象进行自适应编码的方法,其中视频帧被分为多个块,每个块包含K×L个象素(K,L是正整数),轮廓图象由多个轮廓象素组成,轮廓象素是指位于轮廓上的象素。上述方法由下列步骤构成:(a)检测轮廓块的数目,每个轮廓块中包含一个或多个轮廓象素;(b)计算所选轮廓象素处的轮廓曲率,从而基于所计算的曲率来确定平均曲率,基中所谓所选轮廓象素处的轮廓曲率是指穿过该象素的两条直线之间的角度变化,该两条直线中的每一条都穿过所选轮廓象素和另一轮廓象素,和位于沿着轮廓方向离开所选象素的多个预定轮廓象素处的另一轮廓象素;(c)将轮廓块数和平均曲率分别与第一和第二预定阈值相比较;(d)如果轮廓块数小于第一预定阈值并且平均曲率大于或等于第二预定阈值,就使用第一轮廓编码方法对轮廓图象编码;(e)如果轮廓块数大于或等于第一预定阈值或者平均曲率小于第二预定阈值,就使用第二轮廓编码方法对轮廓图象编码,其中,所选用的第一轮廓编码方法与第二轮廓编码方法相比,能够更精确地再现轮廓图象。
结合下列附图,通过对优选实施例的进一步说明,本发明的上述和其他目的及特征会变得更为清楚:
图1是一个根据本发明的轮廓编码装置的方框图;
图2是定义轮廓块的示意图;
图3是说明曲率计算过程的放大图。
参见图1,示有一根据本发明的用来对视频信号的视频帧中的目标的轮廓图象进行自适应编码的轮廓编码装置10的方框图。
包含在视频帧中的目标的轮廓图象数据被并行输入到大小检测单元110,复杂度检测单元130,第一轮廓编码单元200和第二轮廓编码单元300中,其中,轮廓图象数据代表了轮廓象素的位置信息,轮廓象素是指位于轮廓上的象素。
在大小检测单元110中,视频帧首先被分为多个K×L个象素的块(K,L为正整数),因此,轮廓块的数目得以确定,各轮廓块是指其中至少包含了一个轮廓象素的块。正如图2中所示,位于阴影区20中的每一个块同视频帧40中的轮廓30部分重叠,这些块就被称为轮廓块。
然后,轮廓块数输入到第一比较单元120,其中,这一数目同第一预定阈值TH1相比较。如果该数目大于或等于第一阈值TH1,即,如果轮廓图象的大小被认为很大的话,则第一比较单元120输出一逻辑高信号;反之,则输出一逻辑低信号。
与此同时,复杂度检测单元130计算所选轮廓象素处的曲率,并确定轮廓的平均曲率。
参见图3,示有一说明了在复杂度检测单元130里所进行的曲率计算过程的放大示意图。首先,一个轮廓象素,例如T2,被选作目标象素,并且它的在轮廓30的两边的两个第N个象素,例如邻近轮廓象素的第6个象素,即T1和T3被确定下来。然后,两条直线穿过目标象素T2和它的两个第N个邻近轮廓象素T1和T3。穿过目标象素T2的两条直线之间的角度变化被定义为目标象素T2处的轮廓曲率。在本发明的优选实施例中,所有轮廓象素都被选作目标象素。然而,为了减轻计算负担,也可以是每个第P个轮廓象素被选作为目标象素,P是大于1的整数。而后,剩余目标象素的轮廓曲率以上述同样的方法进行计算。
当所有目标象素的轮廓曲率确定之后,轮廓的平均曲率依下式计算: C M = 1 M Σ i = 1 M θ i 2 - - - ( 1 ) 其中,CM表示平均曲率;M是目标象素数;θi表示每个目标象素处的曲率。
回到图1,在第二比较单元140中,在复杂度检测单元130所确定的平均曲率CM同第二预定阈值TH2相比较。如果平均曲率CM大于或等于第二阈值TH2,即如果轮廓图象被确定为相当复杂,则第二比较单元140向控制单元150提供一逻辑低信号;反之,则提供一逻辑高信号。
在控制单元150中,来自两个比较单元120和140的信号进行逻辑组合,如果来自两个比较单元120和140的信号都是逻辑低,即如果轮廓被认为是小而复杂,则产生一逻辑低控制信号送往开关单元400。反之,即如果轮廓图象被认为是大或简单,则产生一逻辑高控制信号送往开关单元400。
同时,在第一和第二轮廓编码单元200和300中,轮廓图象数据被编码。
具体地说,在第一轮廓编码单元200中,例如使用常规的链式编码方法,轮廓图象数据被编码,并提供给开关单元400作为第一编码数据,其中连续轮廓象素间的方向矢量被编码。例如,通常使用的链式编码方案采用8个方向矢量,它们能被3位码字编码。在链式编码中,典型地,起始轮廓象素地址信息后紧接一串码字。
另一方面,在第二轮廓编码单元300中,轮廓图象数据被编码,例如使用多边形近似法和DST方法,结果编码数据作为第二编码数据提供给开关单元400,其中,轮廓图象数据首先使用多边形近似法来近似,原始轮廓图象与近似的轮廓图象之间的误差使用DST来计算;使用诸如不压缩的固定长度码对多边形近似的结果进行编码;然后,使用诸如JPEG(联合图象专家组)的二进制算术码对DST的结果进行编码。前述中国专利申请No.95116451.1,详细说明了多边形近似法和DST技术,该申请于1995年9月7日递交,题目为“用于再现目标轮廓的改进的轮廓近似方法”,在此引入作为参考。
响应于来自控制单元150的控制信号,开关单元400选择,或者是第一编码数据,或者是第二编码数据作为编码的轮廓图象数据。也就是说,如果提供给其的是逻辑低控制信号,则第一编码数据被送到发送器(未示出)去发送,如果提供给其的是逻辑高控制信号,则发送第二编码数据。
结果,视频帧中较小且较复杂的轮廓图象通过链式编码方法在第一轮廓编码单元200中进行编码,同时,视频帧中较大或较简单的轮廓图象通过采用多边形近似及DST的轮廓编码方法在第二轮廓编码单元300中被选择进行编码。
本发明仅以某一优选实施例进行说明,但在不脱离由权利要求书中提出的本发明的精神和保护范围的前提下,可以对本发明作一些其它修改和变化。

Claims (4)

1、一种对视频信号的视频帧中的目标的轮廓图象进行自适应编码的方法,其中视频帧被分为多个块,每个块包含K×L个象素(K,L为正整数),且轮廓图象由多个轮廓象素组成,这些轮廓象素是指位于轮廓上的象素,该方法由以下步骤构成:
(a1)使用第一和第二轮廓编码方法对轮廓图象进行编码,由此分别提供第一和第二编码的轮廓数据,第一编码的轮廓数据同第二编码的轮廓数据相比,能够更精确地表现轮廓图象;
(b1)检测轮廓块的数目,每个轮廓块中包含一个或多个轮廓象素;
(C1)将轮廓块数同第一预定阈值相比较;
(d1)计算所选轮廓象素处的轮廓曲率,从而在计算的曲率基础上确定平均曲率,其中,所选轮廓象素处的轮廓曲率是指穿过该象素的两条直线间的角度变化,两条直线的每一条都穿过前述所选轮廓象素和另一轮廓象素,该另一轮廓象素则位于沿着轮廓的一方向离开所选象素的多个预定轮廓象素处;
(e1)将平均曲率同第二预定阈值相比较;及
(f1)如果轮廓块数小于第一预定阈值并且平均曲率大于或等于第二预定阈值,则选用第一编码的轮廓数据,反之,则选用第二编码的轮廓数据,由此提供选定的编码的轮廓数据作为已编码的轮廓图象数据。
2、根据权利要求1的方法,其中所述的第一轮廓编码方法是一种链式编码方法。
3、根据权利要求2的方法,其中所述的第二轮廓编码方法包括多边形近似法和离散正弦变换方法。
4、根据权利要求3的方法,其中所述的平均曲率定义为: C M = 1 M Σ i = 1 M θ i 2 其中,CM表示平均曲率;M是所选轮廓象素的数目;θi表示每一个所选轮象素处的曲率。
CN96106941A 1996-05-08 1996-07-03 对视频信号中的轮廓图象编码的自适应轮廓编码方法 Expired - Lifetime CN1106764C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR14969/96 1996-05-08
KR1019960014969A KR0181075B1 (ko) 1996-05-08 1996-05-08 적응 윤곽선 부호화 방법
KR14969/1996 1996-05-08

Publications (2)

Publication Number Publication Date
CN1164802A CN1164802A (zh) 1997-11-12
CN1106764C true CN1106764C (zh) 2003-04-23

Family

ID=19458006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96106941A Expired - Lifetime CN1106764C (zh) 1996-05-08 1996-07-03 对视频信号中的轮廓图象编码的自适应轮廓编码方法

Country Status (7)

Country Link
US (1) US5774596A (zh)
EP (1) EP0806742B1 (zh)
JP (1) JP3819482B2 (zh)
KR (1) KR0181075B1 (zh)
CN (1) CN1106764C (zh)
DE (1) DE69620586T2 (zh)
IN (1) IN188128B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5881175A (en) * 1996-06-07 1999-03-09 Daewoo Electronics Co., Ltd. Method and apparatus for encoding an image signal by using the contour signal thereof
JP3602659B2 (ja) * 1996-08-05 2004-12-15 株式会社リコー 濃淡値文書画像からの特徴抽出方法及び特徴抽出装置
KR100239309B1 (ko) * 1997-01-15 2000-01-15 전주범 변형된 정점 부호화를 이용한 윤곽선 부호화 방법 및 그 장치
US5912991A (en) * 1997-02-07 1999-06-15 Samsung Electronics Co., Ltd. Contour encoding method using error bands
KR100229545B1 (ko) * 1997-04-11 1999-11-15 전주범 윤곽선 영상 부호화에서의 윤곽선 복호화 장치
KR19990008977A (ko) * 1997-07-05 1999-02-05 배순훈 윤곽선 부호화 방법
KR100295798B1 (ko) * 1997-07-11 2001-08-07 전주범 스케일러빌리티를구현한이진현상신호부호화장치
US5949425A (en) * 1997-11-25 1999-09-07 Terrain Experts, Inc. Terrain representation with polygonal seams
JPH11308610A (ja) * 1998-04-02 1999-11-05 Daewoo Electronics Co Ltd 映像信号適応的符号化装置
WO2010147529A1 (en) * 2009-06-16 2010-12-23 Telefonaktiebolaget L M Ericsson (Publ) Methods and arrangements for image processing
CN105678326B (zh) * 2015-12-31 2019-12-10 华南理工大学 一种基于曲率的二维目标轮廓的编码方法
WO2017143988A1 (en) 2016-02-26 2017-08-31 Versitech Limited Shape-adaptive model-based codec for lossy and lossless compression of images
CN110662048A (zh) * 2018-06-28 2020-01-07 华为技术有限公司 一种图像编码方法以及设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0613212B2 (ja) * 1983-10-03 1994-02-23 株式会社写研 文字画像デ−タの処理方法
JP2806961B2 (ja) * 1989-02-22 1998-09-30 株式会社リコー 画像符号化方法
CN1033110C (zh) * 1992-09-01 1996-10-23 寅市和男 文字数据、词符-插图数据的输入输出装置及其方法
KR100365555B1 (ko) * 1994-10-19 2003-08-27 마츠시타 덴끼 산교 가부시키가이샤 화상부호화/복호화장치

Also Published As

Publication number Publication date
JP3819482B2 (ja) 2006-09-06
DE69620586D1 (de) 2002-05-16
JPH09311941A (ja) 1997-12-02
CN1164802A (zh) 1997-11-12
KR970078037A (ko) 1997-12-12
EP0806742A1 (en) 1997-11-12
IN188128B (zh) 2002-08-24
KR0181075B1 (ko) 1999-04-01
US5774596A (en) 1998-06-30
EP0806742B1 (en) 2002-04-10
DE69620586T2 (de) 2002-11-07

Similar Documents

Publication Publication Date Title
CN1106764C (zh) 对视频信号中的轮廓图象编码的自适应轮廓编码方法
CN1124042C (zh) 利用轮廓运动估算技术编码视频信号中目标轮廓的方法
CN1110959C (zh) 对视频信号中的目标轮廓进行编码的方法及装置
CN1115647C (zh) 用来对视频信号中的轮廓图象编码的方法和装置
CN1131875A (zh) 改进的用于表示目标轮廓的轮廓近似方法
CN109982092B (zh) 基于多分支循环卷积神经网络的hevc帧间快速方法
CN1170316A (zh) 用于对视频信号中的对象的轮廓进行编码的方法和装置
CN1133329C (zh) 根据轮廓运动估算技术对目标轮廓进行编码的方法和设备
CN116912257B (zh) 基于深度学习的混凝土路面裂缝识别方法及存储介质
CN1147156C (zh) 用于自适应编码一目标的轮廓的方法和装置
CN1151678C (zh) 对于视频信号中的目标轮廓图象进行编码的方法和装置
CN1146248C (zh) 用于使用时间相关编码一个目标轮廓的方法和设备
KR19980085643A (ko) 주위 화소값의 적응 임계치를 이용한 이진 영상 보간 방법
CN1131878A (zh) 编码带有静止目标的图象信号的装置
CN1150489C (zh) 编码一帧内多个轮廓的方法及装置
CN113784147A (zh) 一种基于卷积神经网络的高效视频编码方法及系统
CN1156170C (zh) 用于对一目标的轮廓编码的方法和装置
CN1062701C (zh) 用于编码目标轮廓的装置
CN1133326C (zh) 采用顶点编码技术的目标轮廓编码方法及设备
CN118509607B (zh) 一种基于边缘计算的实时视频处理和智能分析方法
Kaup et al. Polygonal shape descriptors-an efficient solution for image retrieval and object localization
KR100195700B1 (ko) 윤곽선 부호기의 특징점 추출방법 및 그 장치
KR0153997B1 (ko) 데이타 코드북을 이용한 비트플랜 압축전송장치
CN115119046A (zh) 一种参考像素集的图像编解码方法、装置及系统
KR100296339B1 (ko) 화상 데이터 부호화 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20030523

Patentee after: Daewoo Electronics Co., Ltd.

Patentee before: Daewoo Electronics Co., Ltd.

ASS Succession or assignment of patent right

Owner name: FENGYE VISION TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: DAEWOO ELECTRONICS CO., LTD.

Effective date: 20130419

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130419

Address after: Ontario

Patentee after: Fengye Vision Technology Co., Ltd.

Address before: Seoul, South Kerean

Patentee before: Daewoo Electronics Co., Ltd.

CX01 Expiry of patent term

Granted publication date: 20030423

EXPY Termination of patent right or utility model