CN102695050A - 一种基于景象配准技术的视频压缩方法 - Google Patents

一种基于景象配准技术的视频压缩方法 Download PDF

Info

Publication number
CN102695050A
CN102695050A CN2011100709866A CN201110070986A CN102695050A CN 102695050 A CN102695050 A CN 102695050A CN 2011100709866 A CN2011100709866 A CN 2011100709866A CN 201110070986 A CN201110070986 A CN 201110070986A CN 102695050 A CN102695050 A CN 102695050A
Authority
CN
China
Prior art keywords
field picture
image
video
frame
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011100709866A
Other languages
English (en)
Inventor
鞠怡明
于起峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUZHOU GALAXY ELECTRONIC TECHNOLOGY Co Ltd
Original Assignee
SUZHOU GALAXY ELECTRONIC TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUZHOU GALAXY ELECTRONIC TECHNOLOGY Co Ltd filed Critical SUZHOU GALAXY ELECTRONIC TECHNOLOGY Co Ltd
Priority to CN2011100709866A priority Critical patent/CN102695050A/zh
Publication of CN102695050A publication Critical patent/CN102695050A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于景象配准技术的视频压缩方法,包括编码方法和解码方法,本发明的基于景象配准技术的视频压缩方法是利用计算机图像识别领域的景象配准技术对视频数据流进行压缩编码的方法,其基本思路是在上一帧图像的基础上进行补充和修改,形成新的一帧图像,而与上一帧图像中的有用相同部分就不再传输或存储了。它属于无损压缩,其本身可以完成独立的压缩,也可以对现有其它视频压缩方法做补充,以实现在不损失视频原始数据的情况下实现更高压缩比的视频压缩方法。

Description

一种基于景象配准技术的视频压缩方法
技术领域
本发明涉及计算机技术、图像编解码技术等领域,具体的涉及一种基于景象配准技术的视频压缩方法。
背景技术
视频流是由连贯的图像组成。每幅图称为一帧。当每秒钟变换25帧以上时人眼就分辨不出帧与帧之间的间断了。
在现实生活里,视频流中相邻帧的内容绝大部分都是相近的,这样人眼看到的是连贯的视频。如果下一帧的图像与上一帧图像完全不同,那是在换场景。所以,视频流中绝大多数的帧与上一帧都是相近的。
由于视频数据量很大,如果不对视频数据进行压缩,其存储和传输耗用的硬件资源都是无法承受的。
目前流行的视频数据压缩技术中已经有在上一帧图像的基础上做补充和修改以得到新一帧图像的方法。但是其要求是图像中绝大部分是不动的。比如新闻广播中播音员的表情和口部是变化的,但其背景是不变的。
发明内容
为克服现有技术中的不足,本发明旨在提供一种基于景象配准技术的视频压缩方法,该视频压缩方法中不需要图像中绝大部分不动,其背景是可以变化的,适用范围比现有方法宽很多。
为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
一种基于景象配准技术的视频压缩方法,包括编码方法和解码方法;
所述编码方法包括以下处理步骤:
步骤101)将第一帧图像作为基准帧,不对该第一帧图像做处理;
步骤102)在第二帧图像中至少选择两个区域与第一帧图像的相近区域做配准计算,得到第二帧图像相对于第一帧图像的形变参数;
步骤103)将第二帧图像按照配准计算出来的形变参数做变形,得到第二帧图像的修正图像,记为A图像;
步骤104)将第一帧图像与A图像相减,以得到第二帧图像相对于第一帧图像的变化部分;
步骤105)将步骤104计算出来的变化部分的数据与步骤102配准计算的结果一起形成第二帧图像要传输的数据;
步骤106)用A图像更新第一帧图像,用第三帧图像更新第二帧图像,以此类推,重复的从步骤102开始执行
优选的,在步骤102中,选用第二帧图像的五个区域,包括第二帧图像的中间区域和四个角的区域。
优选的,步骤104中,相减的结果是O表示第二帧图像没有变化,相减的结果不为0表示第二帧图像有变化。
优选的,如果所选用的区域都无法配准,说明第二帧图像是换了场景,要重新发送初始图,用另一种指示编码来标记。
进一步的,所述解码方法包括以下处理步骤:
步骤201)接收第一帧图像作为基准帧;
步骤202)接收第二帧图像,根据接收的图像定义,判断接收到的第二帧图像是一帧完整的新帧还是用于修改和补充上一帧图像的修改数据;
步骤203)如果第二帧图像是一帧完整的新帧,那将其定义为第一帧图像,转去执行步骤202,如果接收的第二帧图像是用于补充和修改上一帧图像的数据,则转去执行步骤204;
步骤204)在基准帧图像的基础上利用第二帧图像送来的数据做补充和修改以得到第二帧图像的修正图像,记为B图像;
步骤205)用B图像代替基础帧转到步骤202,循环进行,从而实现了图像的解码。
与现有技术相比,本发明具有以下有益效果:
本发明的基于景象配准技术的视频压缩方法是利用计算机图像识别领域的景象配准技术对视频数据流进行压缩编码的方法,其基本思路是在上一帧图像的基础上进行补充和修改,形成新的一帧图像,而与上一帧图像相同部分就不再传输或存储了。它属于无损压缩,其本身可以完成独立的压缩,也可以对现有其它视频压缩方法做补充,以实现在不损失视频原始数据的情况下实现更高压缩比的视频压缩方法。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由以下实施例及其附图详细给出。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了本发明的基于景象配准技术的视频压缩方法的编码流程图。
图2示出了本发明的基于景象配准技术的视频压缩方法的解码流程图。
图3示出了本发明的第一帧图像的示意图。
图4示出了本发明的第二帧图像与第一帧图像的关系示意图。
图5示出了本发明的一实施例的示意图。
图6示出了图5中揭示的实施例的等效示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
参见图1所示,一种基于景象配准技术的视频压缩方法,包括编码方法和解码方法;
所述的编码方法包括以下处理步骤:
步骤101)将第一帧图像作为基准帧,不对该第一帧图像做处理;
步骤102)在第二帧图像中至少选择两个区域与第一帧图像的相近区域做配准计算,得到第二帧图像相对于第一帧图像的形变参数;
步骤103)将第二帧图像按照配准计算出来的形变参数做变形,得到第二帧图像的修正图像,记为A图像;
步骤104)将第一帧图像与A图像相减,以得到第二帧图像相对于第一帧图像的变化部分;
步骤105)将步骤104计算出来的变化部分的数据与步骤102配准计算的结果一起形成第二帧图像要传输的数据;
步骤106)用A图像更新第一帧图像,用第三帧图像更新第二帧图像,以此类推,重复的从步骤102开始执行
优选的,在步骤102中,选用第二帧图像的五个区域,包括第二帧图像的中间区域和四个角的区域。
优选的,步骤104中,相减的结果是O表示第二帧图像没有变化,相减的结果不为O表示第二帧图像有变化。
优选的,如果所选用的区域都无法配准,说明第二帧图像是换了场景,要重新发送初始图,用另一种指示编码来标记。
进一步的,参见图2所示,所述解码方法包括以下处理步骤:
步骤201)接收第一帧图像作为基准帧;
步骤202)接收第二帧图像,根据接收的图像定义,判断接收到的第二帧图像是一帧完整的新帧还是用于修改和补充上一帧图像的修改数据;
步骤203)如果第二帧图像是一帧完整的新帧,那将其定义为第一帧图像,转去执行步骤202,如果接收的第二帧图像是用于补充和修改上一帧图像的数据,则转去执行步骤204;
步骤204)在基准帧图像的基础上利用第二帧图像送来的数据做补充和修改以得到第二帧图像的修正图像,记为B图像;
步骤205)用B图像代替基础帧转到步骤202,循环进行,从而实现了图像的解码。
以下结合本发明的基于景象配准技术的视频压缩方法的原理做进一步详细的说明:
参见图3、图4所示,第一帧图像中的A图到第二帧图像时发生了位置、缩放或旋转等形变,其正常视觉角度和尺寸为B图。A图和B图之间大部分内容都是相同的(上图为了说明原图的移动故意夸大了A图的变化量)。如果我们在A图的基础上去掉B图以外多余的部分,补充不足部分,就可以得到一幅完整的第二帧图像。第二帧图像的传输量就是需要补充的部分,而不是全部图像数据,从而达到降低数据传输量的目的。
这样的数据传输量占整个图像的多少比例呢?
参见图5所示,假设原C图是一个飞机的俯视图,长度为a,宽度为b,在一秒钟内飞机旋转30°,这样的图像变换已经很剧烈了。那么假设视频是30帧/s,则当前帧与上一帧旋转了1°。为简单起见,参见图6所示,为简化计算视需要补充的三角形是两个等腰三角形,夹角是1°,边长一个是a,一个是b。。两个三角形的面积之和与总面积的比率就是压缩比率。
设三角形的高度h,则有:h=a×sin1°
三角形的面积=a×h/2=a^2×sin1°/2
两个三角形的面积之和=a^2×sin1°/2+b^2×sin1°/2
需要传输的部分占整个图像数据量的比例r是:
r=(a^2×sin1°/2+b^2×sin1°/2)/a×b=sin1°/2×(a^2+b^2)/a×b
再做简化,图像是正方形,则a=b,进而有r=sin1°=0.01745。压缩率是1/r=57倍。
再核算一下流量情况:
以640×480标准清晰度为目标,采用8:2:2的YUV格式,一个像素用12位数据。按每秒30帧计算。如果不压缩,该视频流的数据流量为:640×480×12×30=111Mbps。如果按照57倍的压缩,减为1.95Mbps。如果采用MJPEG格式,JPEG压缩比为55倍以上,则传输的数据量是35Kbps。
本发明的基本思路是修改上一帧图像而得到下一帧图像。网络传输的数据只是修改图像所需要的信息,而不是重新传输一幅图像。这样就较少了数据的传输量,并且保持了图像无损伤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于景象配准技术的视频压缩方法,包括编码方法和解码方法,其特征在于,所述编码方法包括以下处理步骤:
步骤101)将第一帧图像作为基准帧,不对该第一帧图像做处理;
步骤102)在第二帧图像中至少选择两个区域与第一帧图像的相近区域做配准计算,得到第二帧图像相对于第一帧图像的形变参数;
步骤103)将第二帧图像按照配准计算出来的形变参数做变形,得到第二帧图像的修正图像,记为A图像;
步骤104)将第一帧图像与A图像相减,以得到第二帧图像相对于第一帧图像的变化部分;
步骤105)将步骤104计算出来的变化部分的数据与步骤102配准计算的结果一起形成第二帧图像要传输的数据;
步骤106)用A图像更新第一帧图像,用第三帧图像更新第二帧图像,以此类推,重复的从步骤102开始执行。
2.根据权利要求1所述的基于景象配准技术的视频压缩方法,其特征在于,所述解码方法包括以下处理步骤;
步骤201)接收第一帧图像作为基准帧;
步骤202)接收第二帧图像,根据接收的图像定义,判断接收到的第二帧图像是一帧完整的新帧还是用于修改和补充上一帧图像的修改数据;
步骤203)如果第二帧图像是一帧完整的新帧,那将其定义为第一帧图像,转去执行步骤202,如果接收的第二帧图像是用于补充和修改上一帧图像的数据,则转去执行步骤204;
步骤204)在基准帧图像的基础上利用第二帧图像送来的数据做补充和修改以得到第二帧图像的修正图像,记为B图像;
步骤205)用B图像代替基础帧转到步骤202,循环进行,从而实现了图像的解码。
3.根据权利要求1或2所述的基于景象配准技术的视频压缩方法,其特征在于,在步骤102中,选用第二帧图像的五个区域,包括第二帧图像的中间区域和四个角的区域。
4.根据权利要求1或2所述的基于景象配准技术的视频压缩方法,其特征在于:步骤104中,相减的结果是O表示第二帧图像没有变化,相减的结果不为O表示第二帧图像有变化。
CN2011100709866A 2011-03-23 2011-03-23 一种基于景象配准技术的视频压缩方法 Pending CN102695050A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011100709866A CN102695050A (zh) 2011-03-23 2011-03-23 一种基于景象配准技术的视频压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011100709866A CN102695050A (zh) 2011-03-23 2011-03-23 一种基于景象配准技术的视频压缩方法

Publications (1)

Publication Number Publication Date
CN102695050A true CN102695050A (zh) 2012-09-26

Family

ID=46860313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100709866A Pending CN102695050A (zh) 2011-03-23 2011-03-23 一种基于景象配准技术的视频压缩方法

Country Status (1)

Country Link
CN (1) CN102695050A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102984518A (zh) * 2012-11-30 2013-03-20 刘庆国 一种vnc图像传输数据处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001025006A (ja) * 1999-07-07 2001-01-26 Mitsubishi Electric Corp 動画像符号化装置
CN101217655A (zh) * 2008-01-04 2008-07-09 广东威创视讯科技股份有限公司 一种数据压缩处理方法
CN101335893A (zh) * 2007-05-25 2008-12-31 辉达公司 数据帧序列的有效编码/解码

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001025006A (ja) * 1999-07-07 2001-01-26 Mitsubishi Electric Corp 動画像符号化装置
CN101335893A (zh) * 2007-05-25 2008-12-31 辉达公司 数据帧序列的有效编码/解码
CN101217655A (zh) * 2008-01-04 2008-07-09 广东威创视讯科技股份有限公司 一种数据压缩处理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102984518A (zh) * 2012-11-30 2013-03-20 刘庆国 一种vnc图像传输数据处理方法
CN104869410A (zh) * 2012-11-30 2015-08-26 刘庆国 一种vnc图像传输数据处理方法
CN102984518B (zh) * 2012-11-30 2015-09-30 河北电信设计咨询有限公司 一种vnc图像传输数据处理方法
CN104869410B (zh) * 2012-11-30 2017-09-22 中国石油大学(华东) 一种vnc图像传输数据处理方法

Similar Documents

Publication Publication Date Title
CN103493490B (zh) 非线性视觉动态范围残留量化器
CN101707714B (zh) 多画面视频会议的图像处理方法和设备
Yuan et al. Spatial and temporal consistency-aware dynamic adaptive streaming for 360-degree videos
CN106331711B (zh) 一种基于网络特征与视频特征的动态码率控制方法
CN107087163B (zh) 一种提升hdr视频主观质量的编码方法
CN103179405A (zh) 一种基于多级感兴趣区域的多视点视频编码方法
JP2017513318A (ja) 改善されたスクリーンコンテンツおよび混合コンテンツの符号化
CN110324708A (zh) 视频处理方法、终端设备及计算机存储介质
CN108810530A (zh) 一种基于人眼视觉系统的avc码率控制方法
CN104994382B (zh) 一种感知率失真的优化方法
CN105227955B (zh) 超高清低延时视频码率控制方法
CN107040771B (zh) 一种针对全景视频的编码优化方法
CN106303521B (zh) 一种基于感知敏感度的hevc率失真优化方法
CN102137258A (zh) 一种立体视频码率控制方法
CN110225343A (zh) 一种视频编码的码率控制方法及装置
CN104159095B (zh) 一种多视点纹理视频和深度图编码的码率控制方法
CN102164281B (zh) 一种基于视觉显著度模型的视频编码码率控制方法
CN116760965B (zh) 全景视频编码方法、装置、计算机设备和存储介质
CN102420987A (zh) 基于分层b帧结构的码率控制的自适应比特分配方法
CN101404765A (zh) 一种交互式多视点视频编码方法
CN102695050A (zh) 一种基于景象配准技术的视频压缩方法
CN114556940A (zh) 视频编解码器中的质量与计算复杂度之间的可调整的折衷
CN104244008B (zh) 一种深度视频编码方法
CN103260090B (zh) 一种用于p2p三维流媒体系统中的视频段调度及传输方法
CN107071449B (zh) 一种转码系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120926