CN1124745C - 运用w-正交变换的视频图像压缩方法 - Google Patents

运用w-正交变换的视频图像压缩方法 Download PDF

Info

Publication number
CN1124745C
CN1124745C CN 00126721 CN00126721A CN1124745C CN 1124745 C CN1124745 C CN 1124745C CN 00126721 CN00126721 CN 00126721 CN 00126721 A CN00126721 A CN 00126721A CN 1124745 C CN1124745 C CN 1124745C
Authority
CN
China
Prior art keywords
image
orthogonal transform
frames
compression
interframe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 00126721
Other languages
English (en)
Other versions
CN1358030A (zh
Inventor
王国秋
Original Assignee
ZHONGXIN DIGITAL TECHN CO Ltd HUNAN
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZHONGXIN DIGITAL TECHN CO Ltd HUNAN filed Critical ZHONGXIN DIGITAL TECHN CO Ltd HUNAN
Priority to CN 00126721 priority Critical patent/CN1124745C/zh
Publication of CN1358030A publication Critical patent/CN1358030A/zh
Application granted granted Critical
Publication of CN1124745C publication Critical patent/CN1124745C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种用于运动图像(数字视频)数据压缩或解压缩的方法,利用W-正交变换对图像序列中连续的若干帧在时间轴上进行处理,消除帧间信息冗余。本发明包括以下步骤:对运动图像按一定步长M分组;对每组中的M帧图像进行W-正交变换,得到M帧新图像;根据压缩比的要求和M帧新图像的不同重要性,进行目标比特分配;对M帧新图像分别进行编码。本发明的帧间处理方法运算非常简单,可以软件实现实时压缩,用硬件实现则实现成本更低、运算速度更快。

Description

运用w-正交变换的视频图像压缩方法
技术领域:
本发明涉及一种视频图像压缩或解压方法,更确切地说,涉及一种视频(运动)图像帧间编码方法,并涉及到用于帧间去冗变换的w-正交变换。
背景技术:
在数字化时代,无论是数据保存还是数据传输,对它们的有效压缩是必须的,尤其视频信息更是如此。所以,数据压缩技术一直是IT技术里的关键技术之一。
视频压缩技术的研究应用已超过了二十年。二十年来,视频压缩技术的应用是成功的。在通信领域,产生了H.261、H.263等国际标准;对于单帧图像,也有JPEG标准。MPEG-1标准为VCD的普及打下了良好的基础,MPEG-2是DVD的压缩标准,它也是一些国家和地区未来的HDTV的压缩标准。然而,技术是在不断进步的。就在MPEG-2标准建立不久,基于小波的图像压缩技术显示了强大的生命力。在最近定稿的MPEG-4里,已产生了基于小波技术的静止图像压缩算法,它对JPEG形成了严重的挑战。JPEG2000标准正在制定之中。基于小波技术的视频压缩技术也是研究的热点。
MPEG-x(x=1或2)的算法由两部份构成,一是帧内压缩算法,一是帧间压缩算法。帧内压缩算法就是JPEG的算法,帧间预测编码采用一种基于块匹配的运动估计及补偿算法。它的基本模式是,先帧内压缩,再帧间压缩,即先空间后时间。运动补偿算法的搜索时间开销很大,在理论上也不严密,在恢复图像中,常有错位的感觉,因而不适合象远程医疗这类的精细压缩,况且它的压缩率也不是很理想,象一部DVD电影,普通光盘需要6至8张。该算法的特点是:编码和解码算法不对称,编码复杂,解码相对要简单。从而编码必须用ASIC来实现。现在最快的微机也无法实时编码。
视频图像每秒25或30帧,因而前后几帧的图像内容存在很多相同或基本相同的部分,这种冗余是大家都认识到的。关键是利用的方法不一样,MPEG根据前一帧预测后面的帧,或者根据前一帧和后一帧预测中间的帧。它寻找“相同的部分”的算法是非常复杂的,这是MPEG压缩编码不能用软件实现,而必须购买几千上万元的压缩卡的原因。
另一方面,在军事应用领域,如军队图像、视频的通信等,用于对边境突发情况、热点地区的监控,也非常需要对于视频图像的压缩或解压方法。但是这种可能用于军事领域的通信编码体制显然不适宜公开,这样有利于通讯保密,即使敌对势力破解了我方的信道编码,也无法解压我们的图像、视频。这也是建立我军自己的编码体系的重大意义。
发明内容:
本发明的目的在于为基于小波的帧内压缩的视频压缩提供一种帧间压缩处理算法,消除运动图像临近的若干帧之间的冗余信息,该算法可适用于军用和民用。
本发明的技术方案如下:
本发明之视频图像帧间压缩编码法包括以下步骤:
(a)对运动图像按一定步长M分组,M为帧数:
(b)对每组中的M帧图像进行W-正交变换,得到M帧新图像;
(c)根据压缩比的要求和M帧新图像的不同重要性,进行目标比特分配;
(d)对M帧新图像分别进行编码。
在以上所述的本发明之视频图像帧间压缩编码法中,所述步骤(a)的M可取2、3、4、5、6、7、8。
在以上所述的本发明之视频图像压缩编码法中,所述步骤(b)之正交变换为(M=4): Y 1 = 1 2 ( X 1 + X 2 + X 3 + X 4 ) Y 2 = 1 5 ( 3 X 1 + X 2 - X 3 - 3 X 4 ) Y 3 = 1 2 ( X 1 - X 2 - X 3 + X 4 ) Y 4 = 1 5 ( X 1 - 3 X 2 + 3 X 3 - X 4 )
其中的X1,X2,X3,X4为相邻的四幅图像,经变换后所得到的图像Y1,Y2,Y3,Y4,称为伪图像组。
在以上所述的本发明之视频图像压缩编码法中,所述步骤(b)之正交变换,M=5时为: Y 1 = 1 5 ( X 1 + X 2 + X 3 + X 4 + X 5 ) Y 2 = 1 10 ( 2 X 1 + X 2 - X 4 - 2 X 5 ) Y 3 = 1 14 ( 2 X 1 - X 2 - 2 X 3 - X 4 + 2 X 5 ) Y 4 = 1 10 ( X 1 - 2 X 2 + 2 X 4 - X 5 ) Y 5 = 1 70 ( X 1 - 4 X 2 + 6 X 3 - 4 X 4 + X 5 )
其中的X1,X2,X3,X4,X5为相邻的四幅图像,经变换后得到的图像Y1,Y2,Y3,Y4,Y5称为伪图像组。
上述步骤(c)中之比特分配采用根据压缩比查经验表的方法确定。
本发明应用于视频图像帧间压缩或解压处理,利用w-正交变换对图像序列中连续的若干帧在时间轴上进行处理,能够消除运动图像临近的若干帧之间的冗余信息。本发明的帧间处理方法的处理运算非常简单,可以软件实现实时压缩,甚至在微机上同时压缩多路视频信号。当然本发明的算法也可以用硬件实现,那样实现成本更低、运算速度更快。
本发明可以应用于军事领域,用于军队图像、视频的通信等,对边境突发情况、热点地区的监控等。本发明有利于建立我军自己的视频图像编码体系。
附图说明:
图1是本发明对运动图像之压缩模型示意图;
图2是MPEG算法中的帧之示意图。
具体实施方式:
本发明应用于视频图像帧间压缩和解压处理,利用W-正交变换图像序列中的连续若干帧在时间轴上进行处理,以消除运动图像临近的若干帧之间的冗余信息。其编码方法包括下述步骤:
(a)对运动图像按一定步长M分组,M为帧数;
(b)对每组中的M帧图像进行W-正交变换,得到M帧新图像;
(c)根据压缩比的要求和M帧新图像的不同重要性,进行目标比特分配;
(d)对M帧新图像分别进行编码。
上述步骤(a)中,M可取2、3、4、5、6、7、8。
本发明采用M=4或M=5,作为其对应的正交变换即W-正交变换的两种实施例。由于图像的时间轴上的采样不能有太久的延迟,帧间变换不宜采用正交小波变换。一种可能的选择是用离散余弦变换(DCT),但它的计算会有一些问题。本发明采用一种更有效的、类似DCT的变换(暂时称之为W-正交变换,因为这类变换是本发明之发明人最先发现),它既有高的效率,也有快速算法。W矩阵是多项式基下压缩变换性能最好的矩阵,DCT是三角函数基下压缩变换性能最好的矩阵,两者没有哪个好哪个差一说。当信源更合适用多项式来描述时,W变换更好;当信源更合适用三角函数来描述时,DCT就好一些。W-正交变换只需要整数加法。DCT是不可能通过如此的变化来加速解码算法的。只要算法设计得好,在运动图像中加入这样的变换后,不会增加太多的时间开销,肯定比运动补偿算法简单。
当M=4时, Y 1 = 1 2 ( X 1 + X 2 + X 3 + X 4 ) Y 2 = 1 5 ( 3 X 1 + X 2 - X 3 - 3 X 4 ) Y 3 = 1 2 ( X 1 - X 2 - X 3 + X 4 ) Y 4 = 1 5 ( X 1 - 3 X 2 + 3 X 3 - X 4 )
M=4的W变换对应一个4阶正交矩阵: A = 1 / 2 1 / 2 1 / 2 1 / 2 3 / 2 5 1 / 2 5 - 1 / 2 5 - 3 / 2 5 1 / 2 - 1 / 2 - 1 / 2 1 / 2 1 / 2 5 - 3 / 2 5 3 / 2 5 - 1 / 2 5 , - - - ( 1 )
在此给出消失矩的定义,定义:设给定了n个数a1,a2,...,an。如果 Σ i a i i r = 0 , 就称a1,a2,...,an有r+1阶消失矩。消失矩大,压缩效果好。
在矩阵(1)中,第一行是直流分量,第二行有1阶消失矩,第三行有2阶消失矩,第四行有3阶消失矩。它的计算量小于DCT的。四阶DCT矩阵是: 1 2 1 1 1 1 2 + 2 2 2 - 2 2 - 2 - 2 2 - 2 + 2 2 1 - 1 - 1 1 2 - 2 2 - 2 + 2 2 2 + 2 2 - 2 - 2 2 , - - - ( 2 ) 它无法整数化,也没有消失矩性质。如果四阶矩阵的相关性还不够,可以考虑5阶矩阵,即M=5: 1 5 1 5 1 5 1 5 1 5 2 10 1 10 0 - 1 10 - 2 10 2 14 - 1 14 - 2 14 - 1 14 2 14 1 10 - 2 10 0 2 10 - 1 10 1 70 - 4 70 6 70 - 4 70 1 70 , - - - ( 3 ) 它同样有消失矩性质,能够类似上述的4阶矩阵那样整数化。 Y 1 = 1 5 ( X 1 + X 2 + X 3 + X 4 + X 5 ) Y 2 = 1 10 ( 2 X 1 + X 2 - X 4 - 2 X 5 ) Y 3 = 1 14 ( 2 X 1 - X 2 - 2 X 3 - X 4 + 2 X 5 ) Y 4 = 1 10 ( X 1 - 2 X 2 + 2 X 4 - X 5 ) Y 5 = 1 70 ( X 1 - 4 X 2 + 6 X 3 - 4 X 4 + X 5 )
这有利于算法的计算机软件和ASIC实现。
完成图像组的伪图像变换后,对伪图像分别采用小波变换,把它们当作静止图像来处理。但是这几副图对解压图像不是同等重要的。第一幅最重要,最后的最不重要。在以上所述的本发明之视频图像压缩编码法中,所述步骤(c)比特分配采用根据压缩比查经验表的方法确定。对M=4,可取第一幅50%,第二幅25%,第三、第四幅各12.5%。
然后进行步骤(d),即对M帧新图像根据分配到的码率大小,分别进行量化编码。这里量化编码可以采用常规的零树编码或者子带编码,也可以用本发明人的另一项正在申请专利的帧内量化编码方法。
以下结合附图进一步说明本发明。
本发明提出运动图像新的压缩模型,即从运动图像的起始帧开始,以n幅为一组,先在时间轴上对图像作一个w-正交变换,形成一个新的n幅“图像”组(称为伪图像组),如图1所示。在伪图像组里面,“图像”的重要程度有一个自然排序,第一幅最重要,第二幅次之,…,最后一幅最次。由伪图像组的第一幅就能得到图像组的一个近似恢复,由伪图像组的头两幅就能得到图像组的一个更精确的近似恢复,当然,由全体伪图像就得到了原图像组的精确恢复。
运动图像的测试比较复杂,比较的指标也很多,完全公正的测试方法是很难找的。除了同样有压缩比和信噪比外,另一个重要指标是算法的采样延迟。在MPEG算法里,采样延迟实际上是9帧。在这9帧里,实际上只有两帧是原始帧(1帧),P帧是由两端的I帧内插而成,B帧是由I帧和P帧内插而成,如图2所示。
由于帧间的相关性很强,冗余度大,当处理的图像组里的图像多时,压缩比自然会提高,但采样延迟加大,实现算法时的缓存增加,加大了硬件成本。
在本发明的算法中,M=4时,是以4帧为一组分组的。这样,算法没有充分挖掘压缩比,但采样延迟减少了一半以上,硬件实现时缓存减少了一半以上,降低了硬件成本。即使如此,本发明的图像质量和压缩比不仅没有降低,反而双高,即在压缩比高于MPEG的同时,信噪比还远远高于MPEG的。以本发明人的采集的这一段视频为例。当压缩比为27倍时,本发明算法的平均峰值信噪比为41.40(Y),39.5(UV),而MPEG的只有31.3(Y),34.5(UV)。本发明的算法压缩到60倍时,峰值信噪比均下降2dB左右。
实际视觉质量相差没有这样大。这反映了MPEG算法的另一个特点,它不能对图像作高保真压缩。所以,在远程医疗诊断这类系统中,MPEG算法是不能用的,因为它里面的大部分图像有“人造成份”。而本发明提出帧间压缩处理算法能对图像作高保真压缩,有实用性。

Claims (5)

1、一种运用W-正交变换的视频图像帧间压缩编码方法,该方法包括下述步骤:
(a)对运动图像按一定步长M分组,M为帧数;
(b)对每组中的M帧图像进行W-正交变换,得到M帧新图像;
(c)根据压缩比的要求和M帧新图像的不同重要性,进行目标比特分配;
(d)对M帧新图像分别进行编码。
2、根据权利要求1所述的运用W-正交变换的视频图像帧间压缩编码方法,其特征在于其中所述步骤(a)的M可取2、3、4、5、6、7、8中之任一数。
3、根据权利要求1所述的运用W-正交变换的视频图像帧间压缩编码方法,其特征在于其中所述步骤(b)之正交变换,M=4时为: Y 1 = 1 2 ( X 1 + X 2 + X 3 + X 4 ) Y 2 = 1 5 ( 3 X 1 + X 2 - X 3 - 3 X 4 ) Y 3 = 1 2 ( X 1 - X 2 - X 3 + X 4 ) Y 4 = 1 5 ( X 1 - 3 X 2 + 3 X 3 - X 4 )
其中的X1,X2,X3,X4为相邻的四幅图像,经变换后得到的图像Y1,Y2,Y3,Y4称为伪图像组。
4、根据权利要求1所述的运用W-正交变换的视频图像帧间压缩编码方法,其特征在于其中所述步骤(b)之正交变换,M=5时为: Y 1 = 1 5 ( X 1 + X 2 + X 3 + X 4 + X 5 ) Y 2 = 1 10 ( 2 X 1 + X 2 - X 4 - 2 X 5 ) Y 3 = 1 14 ( 2 X 1 - X 2 - 2 X 3 - X 4 + 2 X 5 ) Y 4 = 1 10 ( X 1 - 2 X 2 + 2 X 4 - X 5 ) Y 5 = 1 70 ( X 1 - 4 X 2 + 6 X 3 - 4 X 4 + X 5 )
其中的X1,X2,X3,X4,X5为相邻的四幅图像,经变换后得到的图像Y1,Y2,Y3,Y4,Y5称为伪图像组。
5、根据权利要求1所述的运用W-正交变换的视频图像帧间压缩编码方法,其特征在于所述步骤(c)中之比特分配采用根据压缩比查经验表的方法确定。
CN 00126721 2000-12-05 2000-12-05 运用w-正交变换的视频图像压缩方法 Expired - Fee Related CN1124745C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 00126721 CN1124745C (zh) 2000-12-05 2000-12-05 运用w-正交变换的视频图像压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 00126721 CN1124745C (zh) 2000-12-05 2000-12-05 运用w-正交变换的视频图像压缩方法

Publications (2)

Publication Number Publication Date
CN1358030A CN1358030A (zh) 2002-07-10
CN1124745C true CN1124745C (zh) 2003-10-15

Family

ID=4592018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 00126721 Expired - Fee Related CN1124745C (zh) 2000-12-05 2000-12-05 运用w-正交变换的视频图像压缩方法

Country Status (1)

Country Link
CN (1) CN1124745C (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3041850B1 (fr) * 2015-09-30 2018-05-25 Vogo Procede d'encodage de flux de donnees video basees sur des groupements d'images (gop)

Also Published As

Publication number Publication date
CN1358030A (zh) 2002-07-10

Similar Documents

Publication Publication Date Title
CN100355288C (zh) 图象数据的自适应可变长度编码方法
RU2417518C2 (ru) Эффективное кодирование и декодирование блоков преобразования
US9077960B2 (en) Non-zero coefficient block pattern coding
WO2004015998A1 (en) System and method for rate-distortion optimized data partitioning for video coding using backward adaptation
CN1207633A (zh) 图象序列编码方法和解码方法
CN1536890A (zh) 动态影像的适应性去交错方法及装置
CN1633812A (zh) 视频图片的全局运动补偿
CN101883284B (zh) 基于背景建模和可选差分模式的视频编/解码方法及系统
CN1229324A (zh) 对视频信号进行编码的方法及装置
CN1482810A (zh) 通过参考离散余弦变换系数来估计运动的方法及其装置
CN1539239A (zh) 帧间编码的方法和装置
CN1622634A (zh) 转换压缩的视频分辨率的装置和方法
CN100348053C (zh) 利用运动图像的电子水印的错误隐蔽方法
CN1124745C (zh) 运用w-正交变换的视频图像压缩方法
CN1825894A (zh) 全相位余弦双正交变换及其对jpeg的改进方法
Rao et al. Evaluation of lossless compression techniques
CN100426866C (zh) 全相位沃尔什双正交变换及其对jpeg的改进方法
CN1822050A (zh) 全相位反余弦双正交变换及其对jpeg的改进方法
CN1396769A (zh) 运动图像信息的压缩方法及其系统
CN1173574C (zh) 利用数字信号处理器实现小波视频编码和解码的方法
CN1246019A (zh) 用于从编码高分辨率视频信号中产生解码低分辨率视频信号的系统
CN1568011A (zh) 一种基于运动联合图像专家组的图像帧间增强方法
Agaian et al. The application of logical transforms to lossless image compression using Boolean minimization
CN1419378A (zh) 数字视频信号的压缩方法及装置
CN1622632A (zh) 一种实现缩放的视频解码方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: WANG GUOQIU

Free format text: FORMER OWNER: ZHONGXIN DIGITAL TECHN CO., LTD, HUNAN

Effective date: 20060331

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20060331

Address after: 410073 Hunan province Changsha Kaifu District, Jiayuan Indus court 13 Building No. 403

Patentee after: Wang Guoqiu

Address before: 12 building 27, news tower, 410005 Furong Road, Changsha, Hunan

Patentee before: Zhongxin Digital Techn Co., Ltd, Hunan

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20081212

Address after: Floor 7, building MO, torch City, Changsha hi tech Industrial Development Zone, Hunan

Patentee after: Hunan Qitai Information Technology Co., Ltd.

Address before: Hunan province Changsha Kaifu District, Jiayuan Indus court 13 Building No. 403

Patentee before: Wang Guoqiu

ASS Succession or assignment of patent right

Owner name: HUNAN QITAI INFORMATION TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: WANG GUOQIU

Effective date: 20081212

ASS Succession or assignment of patent right

Owner name: WANG GUOQIU

Free format text: FORMER OWNER: HUNAN CHNTEK TECHNOLOGIES CO., LTD.

Effective date: 20100908

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 410080 7/F, BUILDING MO, HUOJUCHENG, HIGH-TECH. INDUSTRY DEVELOPMENT AREA, HUNAN PROVINCE TO: 410073 NO.13-403, WUTONGYUAN, KEDAJIAYUAN, KAIFU DISTRICT, CHANGSHA CITY, HUNAN PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20100908

Address after: 410073 Hunan province Changsha Kaifu District, garden Indus court No. 13-403

Patentee after: Wang Guoqiu

Address before: 7, building 410080, building MO, torch City, Changsha hi tech Industrial Development Zone, Hunan, China

Patentee before: Hunan Qitai Information Technology Co., Ltd.

ASS Succession or assignment of patent right

Owner name: HUNAN HUAGUAN DIGITAL TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: WANG GUOQIU

Effective date: 20101110

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 410073 NO.13-403, WUTONGYUAN, KEDAJIAYUAN, KAIFU DISTRICT, CHANGSHA CITY, HU NAN PROVINCE TO: 410006 INSIDE OF CHANGSHA CEC SOFTWARE PARK, NO.39, JIANSHAN ROAD, YUELU DISTRICT, CHANGSHA CITY, HU NAN PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20101110

Address after: 410006, Changsha Electric Power Software Park, No. 39, pointed mountain road, Hunan, Changsha, Yuelu District

Patentee after: Hunan Huaguan Digital Technology Co., Ltd.

Address before: 410073 Hunan province Changsha Kaifu District, garden Indus court No. 13-403

Patentee before: Wang Guoqiu

ASS Succession or assignment of patent right

Owner name: WANG GUOQIU

Free format text: FORMER OWNER: HU NAN HUAGUAN DIGITAL TECHNOLOGY CO., LTD.

Effective date: 20130106

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 410006 CHANGSHA, HUNAN PROVINCE TO: 410073 CHANGSHA, HUNAN PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20130106

Address after: 410073 Hunan province Changsha Kaifu District, garden Indus court 13-403

Patentee after: Wang Guoqiu

Address before: 410006, Changsha Electric Power Software Park, No. 39, pointed mountain road, Hunan, Changsha, Yuelu District

Patentee before: Hunan Huaguan Digital Technology Co., Ltd.

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20031015

Termination date: 20131205