CN106954070A - 一种滑动像素块整数dct核心矩阵变换运动补偿器及方法 - Google Patents

一种滑动像素块整数dct核心矩阵变换运动补偿器及方法 Download PDF

Info

Publication number
CN106954070A
CN106954070A CN201710290944.0A CN201710290944A CN106954070A CN 106954070 A CN106954070 A CN 106954070A CN 201710290944 A CN201710290944 A CN 201710290944A CN 106954070 A CN106954070 A CN 106954070A
Authority
CN
China
Prior art keywords
block
integer dct
mcer
core matrix
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710290944.0A
Other languages
English (en)
Other versions
CN106954070B (zh
Inventor
陈朝阳
李小魁
武兴会
闫絮
黄应利
邱建文
宋雪洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan Institute of Engineering
Original Assignee
Henan Institute of Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan Institute of Engineering filed Critical Henan Institute of Engineering
Priority to CN201710290944.0A priority Critical patent/CN106954070B/zh
Publication of CN106954070A publication Critical patent/CN106954070A/zh
Application granted granted Critical
Publication of CN106954070B publication Critical patent/CN106954070B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提出了一种滑动像素块整数DCT核心矩阵变换运动补偿器及方法,当前帧生成器与第一整数DCT核心矩阵变换器相连接,第一整数DCT核心矩阵变换器、第二整数DCT核心矩阵变换器均与块搜索匹配器相连接,块搜索匹配器分别与MCER编码器和重建帧生成器相连接,MCER编码器与MCER解码器相连接,MCER解码器与重建帧生成器相连接,重建帧生成器与重建帧扩展器相连接,重建帧扩展器与第二整数DCT核心矩阵变换器相连接。本发明可以保证在DCT变换意义上的最佳匹配,在接下来的帧差DCT变换和量化、熵编码后,有较高的压缩率和较小的传输比特率,在视频接收译码端获得更高质量的解码视频。

Description

一种滑动像素块整数DCT核心矩阵变换运动补偿器及方法
技术领域
本发明涉及数字视频压缩编码的技术领域,具体涉及一种滑动像素块整数DCT核心矩阵变换运动补偿器及方法,通过整数DCT核心矩阵变换的方法进行运动补偿的像素块匹配搜索,实现数字视频的较高压缩率编码。
背景技术
现有的主流数字视频压缩编码标准,比如H.265和MPEG4都采用帧内编码和帧间编码相结合的压缩方法,其中,帧间编码方法分为两个步骤:第一步通过时间域的运动补偿去除时间冗余,而后在MCER(Motion Compensated Error Residual,运动补偿残差)编码步骤中去除空间和变换域冗余,MCER编码一般包括DCT(Discrete Cosine Transform,离散余弦变换)变换编码和熵编码。
运动预测补偿需要在前一重建帧中搜索对应目标块,所搜索到的对应目标块和当前帧中的搜索块的差值构成MCER帧差块,运动补偿的目标是使得MCER帧差块能量最小化,第二步利用MCER帧差块的DCT变换、量化和熵编码试图达到较大的压缩率,然后在解码器端重建出质量最好的MCER。现有的运动搜索算法包括穷尽运动搜索、基于梯度的运动估计、分层或树形搜索、下采样搜索等,这些搜索算法都是在时域中搜索,按照均方差、平均绝对差或像素差分类等标准判断搜索块与目标块是否匹配。之后对时域MCER帧差块进行DCT变换、量化和熵编码,量化和熵编码是针对DCT变换后的变换域系数进行处理。为了利于工程实现,整数DCT变换已经取代了浮点的DCT变换,在MPEG-4标准和H.264标准扩展部分和H.265标准中得到了应用。
因为,编码器中的量化和熵编码针对的是MCER帧差块能量,只有当MCER帧差的能量较小时,才有较高的压缩率、较小的输出数据速率,然而时域的运动预测补偿搜索匹配不能保证MCER帧差DCT变换后的系数能量尽量小。为了得到更小的量化前能量,就需要采用频域的运动补偿搜索匹配,现有的整数DCT变换可分为整数DCT核心矩阵变换和缩放因子矩阵结合量化两个阶段,考虑到工程实现中的运算量限制因素和通信传输速率控制中量化步长的动态变化,本发明采用整数DCT核心矩阵变换进行频域的运动补偿搜索匹配,为了进行整像素精度的运动补偿搜索匹配,需要对前一重建帧进行滑动像素块扩展。
发明内容
为了得到DCT变换后最小的像素块DCT变换系数能量,从而在后续的量化和熵编码中实现尽可能大的压缩比,需要搜索块和目标块在DCT变换域上的运动补偿匹配,本发明提出一种滑动像素块整数DCT核心矩阵变换运动补偿器及方法,支持整像素精度运动补偿搜索匹配。
本发明的技术方案是:一种滑动像素块整数DCT核心矩阵变换运动补偿器,包括当前帧生成器、第一整数DCT核心矩阵变换器、块搜索匹配器、MCER编码器、重建帧生成器、重建帧扩展器、第二整数DCT核心矩阵变换器和MCER解码器,当前帧生成器与第一整数DCT核心矩阵变换器相连接,第一整数DCT核心矩阵变换器和第二整数DCT核心矩阵变换器均与块搜索匹配器相连接,块搜索匹配器分别与MCER编码器和重建帧生成器相连接,MCER编码器与MCER解码器相连接,MCER解码器与重建帧生成器相连接,重建帧生成器与重建帧扩展器相连接,重建帧扩展器与第二整数DCT核心矩阵变换器相连接。
所述当前帧生成器将输入的视频处理成帧图像的格式,并将当前帧图像划分成4×4或8×8的像素块,然后依次将当前帧图像内的像素块传送至第一整数DCT核心矩阵变换器;所述第一整数DCT核心矩阵变换器对当前帧生成器传送来的像素块进行相应的整数DCT核心矩阵变换,像素块变换为4×4或8×8的频域块称为搜索块。
所述块搜索匹配器使用第一整数DCT核心矩阵变换器输出的搜索块在第二整数DCT核心矩阵变换器产生的滑动扩展重建帧整数DCT核心矩阵变换系数目标块帧中以4×4或8×8的块为单位进行运动补偿搜索匹配,匹配准则为均方差、平均绝对差或像素差分类度量,匹配输出结果为频域MCER和运动矢量,其中频域MCER为目标块和搜索块的对应元素差值,运动矢量为搜索块对应的时域块左上角元素坐标和匹配目标块的块坐标的差值,其中运动矢量送到重建帧生成器,频域MCER送到MCER编码器进行编码。
所述匹配准则按照上述匹配准则,在目标块帧中找出和搜索块差别最小的目标块作为匹配目标块。
所述重建帧生成器利用块搜索匹配器输出的运动矢量对前一重建帧的相应像素块运动平移,之后和MCER解码器输出的像素块的MCER相加;所述重建帧扩展器对重建帧生成器产生的重建帧进行滑动像素块的扩展,产生扩展重建帧;所述第二整数DCT核心矩阵变换器对重建帧扩展器中的滑动像素块进行整数DCT核心矩阵变换,产生目标块帧,其中各4×4或8×8目标块的块坐标是目标块在目标块帧中的行编号和列编号。
所述MCER编码器对块搜索匹配器输出的频域MCER进行编码,编码包括乘以整数DCT变换中的缩放因数矩阵、量化和熵编码;所述MCER解码器对MCER编码器输出的编码信息进行相应的熵解码、反量化和逆整数DCT变换。
其工作方法的步骤如下:
步骤一:重建帧扩展器将相比当前帧的前一重建帧中除边缘像素外的所有像素依次向右和向下滑动扩展为b×b大小的像素块,b∈{4,8};
步骤二:将滑动扩展后的前一重建帧按b×b的大小分块;
步骤三:利用第二整数DCT核心矩阵变换器依次对滑动扩展后的前一重建帧中的所有分块进行整数DCT核心矩阵变换,产生目标块帧,其中被搜索匹配的目标块的大小为b×b;
步骤四:当前帧生成器将当前帧按b×b的大小分块,选择当前帧中的第一个分块;
步骤五:第一整数DCT核心矩阵变换器对选择的当前帧中的分块进行b×b整数DCT核心矩阵变换,并将变换系数的组成块作为搜索块;
步骤六:块搜索匹配器用搜索块在步骤三中产生的目标块帧中按b×b的块单位搜索匹配的目标块,输出频域MCER和运动矢量,频域MCER是匹配目标块和搜索块的对应元素差值,运动矢量是搜索块对应的时域块左上角元素坐标和匹配目标块的块坐标的差值;
步骤七:将块搜索匹配器生成的运动矢量和频域MCER分别输送至重建帧生成器和MCER编码器,MCER解码器进行解码后传送至重建帧生成器,重建帧生成器进行重建帧的生成;
步骤八:如果不是当前帧的最后一个搜索块,则选择下一个搜索块,转到步骤五;如果是当前帧的最后一个搜索块,则选择下一视频帧作为当前帧,转步骤一。
所述步骤一中重建帧进行滑动扩展的方法为:
设重建帧大小为p×q,即重建帧中的像素为{xij|i∈[1,…,p],j∈[1,…,q]};
则重建帧中的任一行像素为:{xm1,xm2,xm3,…,xm(p-d),…,xmp|1≤m≤p};任一列像素为:{x1n,x2n,x3n,…,x(q-d)n,…,xqn|1≤n≤q},m和n分别表示重建帧的第m行和第n列;
对前一重建帧进行滑动扩展,滑动扩展后重建帧中的像素为:{ykl|1≤k≤b×(p-b+1),1≤l≤b×(q-b+1)},滑动扩展后重建帧的大小为:[b×(p-b+1)]×[b×(q-b+1)],并且其中,表示下取整操作,k,l分别表示滑动扩展后重建帧中像素的行坐标和列坐标。
所述第一整数DCT核心矩阵变换器和第二整数DCT核心矩阵变换器为4×4像素块整数DCT核心矩阵变换或8×8像素块整数DCT核心矩阵变换,所述4×4像素块整数DCT变换的核心矩阵变换为:
其中,为待变换的目标像素块,Y是变换结果;
所述8×8像素块整数DCT变换的核心矩阵变换为:Y=CXCT
其中,Y是变换结果;
为待变换的目标像素块;
CT是C的转置矩阵。
本发明可以保证在DCT变换意义上的最佳匹配,在接下来的帧差DCT变换和量化后,有较高的压缩率和较小的发送比特率,在视频接收译码端获得更高质量的解码视频。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的结构示意图。
图2为本发明的工作流程图。
图3为本发明的效果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种滑动像素块整数DCT核心矩阵变换运动补偿器,包括当前帧生成器101、第一整数DCT核心矩阵变换器102、块搜索匹配器103、MCER编码器104、重建帧生成器105、重建帧扩展器106、第二整数DCT核心矩阵变换器107和MCER解码器108,当前帧生成器101与第一整数DCT核心矩阵变换器102相连接,第一整数DCT核心矩阵变换器102和第二整数DCT核心矩阵变换器107均与块搜索匹配器103相连接,块搜索匹配器103分别与MCER编码器104和重建帧生成器105相连接,MCER编码器104与MCER解码器108相连接,MCER解码器108与重建帧生成器105相连接,重建帧生成器105与重建帧扩展器106相连接,重建帧扩展器106与第二整数DCT核心矩阵变换器107相连接。
当前帧生成器101将输入的视频处理成帧图像的格式,并将当前帧图像划分成4×4或8×8的像素块,然后依次将当前帧图像内的像素块传送至第一整数DCT核心矩阵变换器102。彩色图像的RGB或YUV 3个分量分别进行处理。所述第一整数DCT核心矩阵变换器102对当前帧生成器101传送来的像素块进行相应的整数DCT核心矩阵变换,即对于b×b的像素块,b∈{4,8}进行整数DCT核心矩阵变换,变换后的同样大小的频域块称为搜索块。
为了进行像素精度的频域块搜索匹配,重建帧扩展器106需要将前一重建帧中的像素二维滑动扩展为像素块,即重建帧中的除边缘外的每个像素作为像素块的左上角像素,和其右边、下边的像素一起组成b×b大小的像素块,b∈{4,8},然后再进行像素块的整数DCT核心矩阵变换。
重建帧进行二维滑动扩展的方法为:重建帧大小为p×q,即重建帧中的像素为{xij|i∈[1,…,p],j∈[1,…,q]};则重建帧中的任一行像素为:{xm1,xm2,xm3,…,xm(p-d),…,xmp|1≤m≤p};任一列像素为:{x1n,x2n,x3n,…,x(q-d)n,…,xqn|1≤n≤q},m和n分别表示重建帧的第m行和第n列;
对前一重建帧进行滑动扩展,滑动扩展后重建帧中的像素为:{ykl|1≤k≤b×(p-b+1),1≤l≤b×(q-b+1)},即滑动扩展后重建帧的大小为:[b×(p-b+1)]×[b×(q-b+1)],并且其中,表示下取整操作,k,l分别表示滑动扩展后重建帧中像素的行坐标和列坐标。
然后将滑动扩展后的前一重建帧按b×b的大小分块。
其中,b可选4或8,b的选择需和MCER编码器104、MCER解码器105中的逆整数DCT变换和整数DCT核心矩阵变换中的分块尺寸一致;
利用第二整数DCT核心矩阵变换器107依次对滑动扩展后的前一重建帧中的所有分块进行整数DCT变换,产生目标块帧,其中被搜索匹配的目标块的大小为b×b,按照从上到下、从左到右的顺序对目标块编号,其行编号和列编号作为目标块的块坐标。
块搜索匹配器103使用搜索块在第二整数DCT核心矩阵变换器107产生的目标块帧中以b×b块为单位进行穷尽或分层搜索匹配,匹配准则为均方差、平均绝对差或像素差分类度量方法,输出频域MCER和运动矢量,频域MCER即匹配目标块和搜索块的对应元素差值,运动矢量是搜索块对应的时域块左上角元素坐标和匹配目标块块坐标的差值,其中运动矢量送到重建帧生成器105,频域MCER送到MCER编码器104进行编码。
重建帧生成器105利用块搜索匹配器103输出的运动矢量对前一重建帧的相应像素块运动平移,之后和MCER解码器108输出的像素块的MCER按照对应位置像素值相加。所述重建帧扩展器106对重建帧生成器105产生的重建帧进行二维滑动像素块的扩展,产生扩展重建帧。所述第二整数DCT变换器107对重建帧扩展器106中的扩展重建帧进行分块的整数DCT核心矩阵变换,产生目标块帧。
分块大小为b×b,b可选4或8,第一整数DCT核心矩阵变换器102和第二整数DCT核心矩阵变换器107为4×4像素块整数DCT变换或8×8像素块整数DCT所述4×4像素块整数DCT核心矩阵变换为:
其中,为待变换的目标像素块,Y是变换结果;
所述8×8像素块整数DCT核心矩阵变换为:Y=CXCT
其中,Y是变换结果;
为待变换的目标像素块;
CT是C的转置矩阵。
MCER编码器104对块搜索匹配器103输出的频域MCER进行编码,编码包括乘以整数DCT变换中的缩放因数矩阵、量化和熵编码;所述MCER解码器108对MCER编码器104输出的编码信息进行相应的熵解码、反量化和逆整数DCT变换。
如图2所示,本发明运动补偿器的工作方法的步骤如下:
步骤一:重建帧扩展器106将相比当前帧的前一重建帧中除边缘像素外的所有像素依次向右和向下滑动扩展为b×b大小的像素块,b∈{4,8}。
重建帧进行滑动扩展的方法为:
设重建帧大小为p×q,即重建帧中的像素为{xij|i∈[1,…,p],j∈[1,…,q]};则重建帧中的任一行像素为:{xm1,xm2,xm3,…,xm(p-d),…,xmp|1≤m≤p};任一列像素为:{x1n,x2n,x3n,…,x(q-d)n,…,xqn|1≤n≤q},m和n分别表示重建帧的第m行和第n列;
对前一重建帧进行滑动扩展,滑动扩展后重建帧中的像素为:{ykl|1≤k≤b×(p-b+1),1≤l≤b×(q-b+1)},即滑动扩展后重建帧的大小为:[b×(p-b+1)]×[b×(q-b+1)],并且其中,表示下取整操作,k,l分别表示滑动扩展后重建帧中像素的行坐标和列坐标。
步骤二:将扩展后的前一重建帧按b×b的大小分块。
其中,b可选4或8,b的选择需和MCER编码器104、MCER解码器105中的逆整数DCT变换和整数DCT核心矩阵变换中的分块尺寸一致。
步骤三:利用第二整数DCT核心矩阵变换器107依次对扩展后的前一重建帧中的所有分块进行整数DCT核心矩阵变换,产生目标块帧,其中被搜索匹配的目标块的大小为b×b。
4×4像素块整数DCT变换的核心矩阵变换为:
其中,为待变换的目标像素块,Y是变换结果;
8×8像素块整数DCT变换的核心矩阵变换为:Y=CXCT
其中,Y是变换结果;
为待变换的目标像素块;
CT是C的转置矩阵。
步骤四:当前帧生成器101将当前帧按b×b的大小分块,选择当前帧中的第一个分块。
步骤五:第一整数DCT核心矩阵变换器102对选择的当前帧中的分块进行b×b整数DCT变换,并将变换系数的组成块作为搜索块。
b×b整数DCT变换的方法与步骤3一样。
步骤六:块搜索匹配器103用搜索块在步骤三中整数DCT变换后的扩展重建帧中按b×b的块单位搜索匹配的目标块,输出频域MCER和运动矢量,频域MCER即匹配目标块和搜索块的对应元素差值,运动矢量是搜索块对应的时域块左上角元素坐标和匹配目标块块坐标的差值。
在搜索中,可按照均方差标准、平均绝对差标准判断目标块和搜索块是否匹配。匹配准则按照上述匹配准则,在目标块帧中找出和搜索块差别最小的目标块作为匹配目标块。搜索块、目标块的整数DCT核心矩阵变换类型需和MCER编码器中选择的整数DCT变换类型一致。
步骤七:将块搜索匹配器103生成的运动矢量和频域MCER分别输送至重建帧生成器105和MCER编码器104,MCER解码器108进行解码后传送至重建帧生成器105,重建帧生成器105进行重建帧的生成。
MCER编码器104对块搜索匹配器103输出的频域MCER进行编码,编码包括乘以整数DCT变换中的缩放因数矩阵、量化和熵编码;所述MCER解码器108对MCER编码器104输出的编码信息进行相应的熵解码、反量化和逆整数DCT变换,MCER解码器108输出时域的MCER值,才能用于重建帧的生成。
步骤八:如果不是当前帧的最后一个搜索块,则选择下一个搜索块,转到步骤五;如果是当前帧的最后一个搜索块,则选择下一视频帧作为当前帧,转步骤一。
采用FOOTBALL的YUV测试视频,分块大小为4×4,穷尽搜索窗口为16×16时,本发明和传统时域搜索匹配的性能对比如图3所示,可以看到相比传统时域搜索方法,本发明比传统方法更稳定,PSNR性能提高0.8dB,即性能提高了20%。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种滑动像素块整数DCT核心矩阵变换运动补偿器,其特征在于,包括当前帧生成器(101)、第一整数DCT核心矩阵变换器(102)、块搜索匹配器(103)、MCER编码器(104)、重建帧生成器(105)、重建帧扩展器(106)、第二整数DCT核心矩阵变换器(107)和MCER解码器(108),当前帧生成器(101)与第一整数DCT核心矩阵变换器(102)相连接,第一整数DCT核心矩阵变换器(102)和第二整数DCT核心矩阵变换器(107)均与块搜索匹配器(103)相连接,块搜索匹配器(103)分别与MCER编码器(104)和重建帧生成器(105)相连接,MCER编码器(104)与MCER解码器(108)相连接,MCER解码器(108)与重建帧生成器(105)相连接,重建帧生成器(105)与重建帧扩展器(106)相连接,重建帧扩展器(106)与第二整数DCT核心矩阵变换器(107)相连接。
2.根据权利要求1所述的滑动像素块整数DCT核心矩阵变换运动补偿器,其特征在于,所述当前帧生成器(101)将输入的视频处理成帧图像的格式,并将当前帧图像划分成4×4或8×8的像素块,然后依次将当前帧图像内的像素块传送至第一整数DCT核心矩阵变换器(102);所述第一整数DCT核心矩阵变换器(102)对当前帧生成器(101)传送来的像素块进行相应的整数DCT核心矩阵变换,像素块变换为4×4或8×8的频域块称为搜索块。
3.根据权利要求2所述的滑动像素块整数DCT核心矩阵变换运动补偿器,其特征在于,所述块搜索匹配器(103)使用第一整数DCT核心矩阵变换器(102)输出的搜索块在第二整数DCT核心矩阵变换器(107)产生的滑动扩展重建帧整数DCT核心矩阵变换系数目标块帧中以4×4或8×8的块为单位进行运动补偿搜索匹配,匹配准则为均方差、平均绝对差或像素差分类度量,匹配输出结果为频域MCER和运动矢量,其中频域MCER为目标块和搜索块的对应元素差值,运动矢量为搜索块对应的时域块左上角元素坐标和匹配目标块的块坐标的差值,其中运动矢量送到重建帧生成器(105),频域MCER送到MCER编码器(104)进行编码。
4.根据权利要求3所述的滑动像素块整数DCT核心矩阵变换运动补偿器,其特征在于,所述匹配准则按照上述匹配准则,在目标块帧中找出和搜索块差别最小的目标块作为匹配目标块。
5.根据权利要求3所述的滑动像素块整数DCT核心矩阵变换运动补偿器,其特征在于,所述重建帧生成器(105)利用块搜索匹配器(103)输出的运动矢量对前一重建帧的相应像素块运动平移,之后和MCER解码器(108)输出的像素块的MCER相加;所述重建帧扩展器(106)对重建帧生成器(105)产生的重建帧进行滑动像素块的扩展,产生扩展重建帧;所述第二整数DCT核心矩阵变换器(107)对重建帧扩展器(106)中的滑动像素块进行整数DCT核心矩阵变换,产生目标块帧,其中各4×4或8×8目标块的块坐标是目标块在目标块帧中的行编号和列编号。
6.根据权利要求3所述的滑动像素块整数DCT核心矩阵变换运动补偿器,其特征在于,所述MCER编码器(104)对块搜索匹配器(103)输出的频域MCER进行编码,编码包括乘以整数DCT变换中的缩放因数矩阵、量化和熵编码;所述MCER解码器(108)对MCER编码器(104)输出的编码信息进行相应的熵解码、反量化和逆整数DCT变换。
7.根据权利要求3所述的滑动像素块整数DCT核心矩阵变换运动补偿器,其特征在于,其工作方法的步骤如下:
步骤一:重建帧扩展器(106)将相比当前帧的前一重建帧中除边缘像素外的所有像素依次向右和向下滑动扩展为b×b大小的像素块,b∈{4,8};
步骤二:将滑动扩展后的前一重建帧按b×b的大小分块;
步骤三:利用第二整数DCT核心矩阵变换器(107)依次对滑动扩展后的前一重建帧中的所有分块进行整数DCT核心矩阵变换,产生目标块帧,其中被搜索匹配的目标块的大小为b×b;
步骤四:当前帧生成器(101)将当前帧按b×b的大小分块,选择当前帧中的第一个分块;
步骤五:第一整数DCT核心矩阵变换器(102)对选择的当前帧中的分块进行b×b整数DCT核心矩阵变换,并将变换系数的组成块作为搜索块;
步骤六:块搜索匹配器(103)用搜索块在步骤三中产生的目标块帧中按b×b的块单位搜索匹配的目标块,输出频域MCER和运动矢量,频域MCER是匹配目标块和搜索块的对应元素差值,运动矢量是搜索块对应的时域块左上角元素坐标和匹配目标块的块坐标的差值;
步骤七:将块搜索匹配器(103)生成的运动矢量和频域MCER分别输送至重建帧生成器(105)和MCER编码器(104),MCER解码器(108)进行解码后传送至重建帧生成器(105),重建帧生成器(105)进行重建帧的生成;
步骤八:如果不是当前帧的最后一个搜索块,则选择下一个搜索块,转到步骤五;如果是当前帧的最后一个搜索块,则选择下一视频帧作为当前帧,转步骤一。
8.根据权利要求7所述的滑动像素块整数DCT核心矩阵变换运动补偿器,其特征在于,所述步骤一中重建帧进行滑动扩展的方法为:
设重建帧大小为p×q,即重建帧中的像素为{xij|i∈[1,…,p],j∈[1,…,q]};
则重建帧中的任一行像素为:{xm1,xm2,xm3,…,xm(p-d),…,xmp|1≤m≤p};任一列像素为:{x1n,x2n,x3n,…,x(q-d)n,…,xqn|1≤n≤q},m和n分别表示重建帧的第m行和第n列;
对前一重建帧进行滑动扩展,滑动扩展后重建帧中的像素为:{ykl|1≤k≤b×(p-b+1),1≤l≤b×(q-b+1)},滑动扩展后重建帧的大小为:[b×(p-b+1)]×[b×(q-b+1)],并且其中,表示下取整操作,k,l分别表示滑动扩展后重建帧中像素的行坐标和列坐标。
9.根据权利要求7所述的滑动像素块整数DCT核心矩阵变换运动补偿器,其特征在于,所述第一整数DCT核心矩阵变换器(102)和第二整数DCT核心矩阵变换器(107)为4×4像素块整数DCT核心矩阵变换或8×8像素块整数DCT核心矩阵变换,所述4×4像素块整数DCT变换的核心矩阵变换为:
Y = ( 1 1 1 1 2 1 - 1 - 2 1 - 1 - 1 1 1 - 2 2 1 x 00 x 01 x 02 x 03 x 10 x 11 x 12 x 13 x 20 x 21 x 22 x 23 x 30 x 31 x 32 x 33 1 2 1 1 1 1 - 1 - 2 1 - 1 - 1 2 1 - 2 1 - 1 ) ,
其中,为待变换的目标像素块,Y是变换结果;
所述8×8像素块整数DCT变换的核心矩阵变换为:Y=CXCT
其中,Y是变换结果;
为待变换的目标像素块;
CT是C的转置矩阵。
CN201710290944.0A 2017-04-28 2017-04-28 一种滑动像素块整数dct核心矩阵变换运动补偿器及方法 Active CN106954070B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710290944.0A CN106954070B (zh) 2017-04-28 2017-04-28 一种滑动像素块整数dct核心矩阵变换运动补偿器及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710290944.0A CN106954070B (zh) 2017-04-28 2017-04-28 一种滑动像素块整数dct核心矩阵变换运动补偿器及方法

Publications (2)

Publication Number Publication Date
CN106954070A true CN106954070A (zh) 2017-07-14
CN106954070B CN106954070B (zh) 2023-04-11

Family

ID=59476026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710290944.0A Active CN106954070B (zh) 2017-04-28 2017-04-28 一种滑动像素块整数dct核心矩阵变换运动补偿器及方法

Country Status (1)

Country Link
CN (1) CN106954070B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107249130A (zh) * 2017-07-24 2017-10-13 河南工程学院 一种用于数字视频编解码的3乘3整数dct变换量化器
CN115174908A (zh) * 2022-06-30 2022-10-11 北京百度网讯科技有限公司 视频编码的变换量化方法、装置、设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1455599A (zh) * 2002-05-02 2003-11-12 微软公司 图像和视频编码的2-d变换
WO2006034603A1 (en) * 2004-09-28 2006-04-06 Huawei Technologies Co., Ltd Video image encoding method
CN101389028A (zh) * 2008-10-15 2009-03-18 北京航空航天大学 一种基于空域分解的视频帧内编码方法
US20110228854A1 (en) * 2008-11-24 2011-09-22 Electronics And Telecommunications Research Institute Apparatus and method for encoding/decoding a video signal
CN206698375U (zh) * 2017-04-28 2017-12-01 河南工程学院 一种滑动像素块整数dct核心矩阵变换运动补偿器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1455599A (zh) * 2002-05-02 2003-11-12 微软公司 图像和视频编码的2-d变换
WO2006034603A1 (en) * 2004-09-28 2006-04-06 Huawei Technologies Co., Ltd Video image encoding method
CN101389028A (zh) * 2008-10-15 2009-03-18 北京航空航天大学 一种基于空域分解的视频帧内编码方法
US20110228854A1 (en) * 2008-11-24 2011-09-22 Electronics And Telecommunications Research Institute Apparatus and method for encoding/decoding a video signal
CN206698375U (zh) * 2017-04-28 2017-12-01 河南工程学院 一种滑动像素块整数dct核心矩阵变换运动补偿器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
欧建平,皇甫堪,楼生强: "基于整数变换的全零块判决方法" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107249130A (zh) * 2017-07-24 2017-10-13 河南工程学院 一种用于数字视频编解码的3乘3整数dct变换量化器
CN107249130B (zh) * 2017-07-24 2023-04-07 河南工程学院 一种用于数字视频编解码的3乘3整数dct变换量化器
CN115174908A (zh) * 2022-06-30 2022-10-11 北京百度网讯科技有限公司 视频编码的变换量化方法、装置、设备以及存储介质
CN115174908B (zh) * 2022-06-30 2023-09-15 北京百度网讯科技有限公司 视频编码的变换量化方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN106954070B (zh) 2023-04-11

Similar Documents

Publication Publication Date Title
US20180115787A1 (en) Method for encoding and decoding video signal, and apparatus therefor
CN101980537B (zh) 一种基于对象和分形的双目立体视频压缩编解码方法
CN101980538B (zh) 一种基于分形的双目立体视频压缩编解码方法
CN101779463B (zh) 用于处理图像的方法以及相应的电子设备
US20180213239A1 (en) Motion Vector Dependent Spatial Transformation in Video Coding
JP2013502624A (ja) メディアデータ符号化用8点変換
CN1864177B (zh) 视频编码和解码方法及其相应设备
CN107205156B (zh) 通过缩放的运动矢量预测
CN105474642A (zh) 使用频域差对图像集合进行重新编码
US8331454B2 (en) Integer transform function for video compression systems
JP5909149B2 (ja) 色変換装置、符号化器および復号器ならびにそれらのプログラム
US11917156B2 (en) Adaptation of scan order for entropy coding
US8908767B1 (en) Temporal motion vector prediction
US9693057B2 (en) Integer transform video compression system, method and computer program product
CN104937934A (zh) 图像边界邻域中的自回归像素预测
US10382758B2 (en) Transform block-level scan order selection for video coding
JP7431752B2 (ja) ビデオ符号化、ビデオ復号化方法、装置、コンピュータ装置及びコンピュータプログラム
CN106954070B (zh) 一种滑动像素块整数dct核心矩阵变换运动补偿器及方法
CN206698375U (zh) 一种滑动像素块整数dct核心矩阵变换运动补偿器
KR20180136481A (ko) 디지털 이미지를 디코딩하기 위한 방법, 코딩 방법, 디바이스들, 및 연관된 컴퓨터 프로그램들
CN1848960B (zh) 使用非标准化矢量量化编码器的符合视频标准的残差编码
CN102263952B (zh) 一种基于对象的快速双目立体视频分形压缩与解压缩方法
CN102263954A (zh) 一种基于对象的快速分形视频压缩与解压缩方法
Dong et al. A novel distributed compressive video sensing based on hybrid sparse basis
JP6254851B2 (ja) 並列符号化装置および並列復号装置ならびにそれらのプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant