CN111556319B - 一种基于矩阵分解的视频编码方法 - Google Patents

一种基于矩阵分解的视频编码方法 Download PDF

Info

Publication number
CN111556319B
CN111556319B CN202010408636.5A CN202010408636A CN111556319B CN 111556319 B CN111556319 B CN 111556319B CN 202010408636 A CN202010408636 A CN 202010408636A CN 111556319 B CN111556319 B CN 111556319B
Authority
CN
China
Prior art keywords
matrix
line
columns
coding
transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010408636.5A
Other languages
English (en)
Other versions
CN111556319A (zh
Inventor
朱策
刘翼鹏
丁可可
邓玲玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010408636.5A priority Critical patent/CN111556319B/zh
Publication of CN111556319A publication Critical patent/CN111556319A/zh
Application granted granted Critical
Publication of CN111556319B publication Critical patent/CN111556319B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Abstract

本发明属于视频编码技术领域,具体涉及一种基于矩阵分解的视频编码方法。本发明的方法,主要是对视频编码过程中变换量化的步骤进行改进,基于矩阵分解的方法,将变换矩阵分解成4*4矩阵,并将预测过程中得到的残差矩阵也进行同样的分解,从而简化残差矩阵的变换过程,实现快捷地,无损失地进行残差矩阵的变换,进而提高编码的速度。

Description

一种基于矩阵分解的视频编码方法
技术领域
本发明属于视频编码技术领域,具体涉及一种基于矩阵分解的视频编码方法。
背景技术
视频编码包括:预测、变换量化和熵编码过程。如图1所示,输入的原始视频序列经过预测后得到残差信号,目的是去除图片间的空间冗余,它利用已编码的重建信息作为参考信息进行预测,然后残差信号经过变换使残差信号的能量更一步集中,接下来进行量化,对高频信号采用更大的量化步长,而对于低频信号使用更小的量化步长,保证图像基本信息没有损失。最后是熵编码过程,它将非二进制编码信息编码为二进制信息。
虽然最新的编码器能够获得很好的压缩比,视频质量的损失也很小,但是因为复杂度太高,实时性不足,大部分企业仍旧倾向于使用更早版本的编码器,而不使用复杂度高的编码器。
发明内容
本发明的目的,就是针对上述问题,提出一种可以提高编码速度的基于矩阵分解的视频编码方法。
本发明的技术方案为:一种基于矩阵分解的视频编码方法,包括以下步骤:
S1、输入视频后,获取每一帧的像素矩阵,定义为大小为M*N的矩阵,然后进行逐帧处理,将当前正在处理的帧记为F;
S2、将帧F划分为不同大小的块,对每一块进行预测,获得预测像素值Prx,y,再根据原始像素值Orx,y,得到残差矩阵R:
R=Orx,y-Prx,y
S3、对残差矩阵R进行变换量化:
对变换矩阵T进行分解,设变换矩阵T为DCT-4矩阵:
Figure BDA0002492364500000011
或DST-4矩阵:
Figure BDA0002492364500000021
Ti(j)表示矩阵第i行第j列的元素;
将2N*2N大小的变换矩阵T,分解为4*4大小的小型矩阵,每个矩阵包含原矩阵的16个元素,分别位于第i行,第j列;第2N-1+1-i行,第j列;第2N-1+i行,第j列;第2N+1-i行,第j列;第i行,第2N-1+1-j列;第2N-1+1-i行,第2N-1+1-j列;第2N-1+i行,第2N-1+1-j列;第2N+1-i行,第2N-1+1-j列;第i行,第2N-1+j列;第2N-1+1-i行,第2N-1+j列;第2N-1+i行,第2N-1+j列;第2N+1-i行,第2N-1+j列;第i行,第2N+1-j列;第2N-1+1-i行,第2N+1-j列;第2N-1+i行,第2N+1-j列;第2N+1-i行,第2N+1-j列;共将2N*2N大小的变换矩阵分解为2N-2*2N-2个4*4矩阵;
将残差矩阵R按照相同的方式分解为4*4大小的矩阵,得到2N-2*2N-2个4*4矩阵;
计算T·R得到变换之后的残差矩阵Rtr,其中上标tr表示矩阵R经过变换。
将变换之后的残差矩阵进行量化:
Figure BDA0002492364500000022
其中Quantx,y是量化结果,Round表示进行四舍五入,step表示量化步长;
S4、对量化结果进行熵编码:
将变换块分解成4*4大小,然后扫描系数,从最后一个系数开始扫描,每一个4*4块扫描过程变成一个一维数组,然后对一维数组进行编码,首先编码一维数组的最后一个非零系数的位置,然后编码其它非零系数的位置,最后再对非零系数的幅值进行编码,全部完成之后输出码流。
本发明的有益效果为,相对现有技术,本发明能够更快捷地,无损失地进行残差矩阵的变换,从而有效提高了编码速度。
附图说明
图1为视频编码过程示意图。
具体实施方式
下面对本发明的技术方案进行详细说明,以便于本领域内技术人员的理解。
本发明的方法包括以下步骤:
S1、输入视频
输入视频包含f0帧,每帧都是一个大小为M*N的矩阵,记录着每一个位置的像素值。在视频编码过程中,会一帧一帧一次进行处理,正在处理的帧记为F,是一个记录当前帧所有像素值的大小为M*N的矩阵。
S2、预测
当前帧会划分成不同大小的块,每一块都会根据周围像素或者参考帧的参考块来进行预测,预测方法分为帧内预测和帧间预测:
对于帧内预测,假定编码块大小为m*n,对编码块内的每一个像素点的预测值可以通过编码块上方一行和左侧一列的像素值得到,假设上方一行像素值为refx,0,左侧一列像素值为ref0,y,则编码块内每一个点的预测像素值Prx,y大小为:
Prx,y=((n*((m-y)·refx,0+y·ref0,m+1)+m*((n-x)·ref0,y+x·refn+1,0)+m*n)>>(log2m+log2n+1) (公式1)
对于帧间预测,在参考帧中找到参考块referencex,y,参考块的像素值大小就作为编码块的预测像素值:
Prx,y=referencex,y (公式2)
帧间预测如果采用双向预测,则有两个参考块reference1x,y和reference2x,y,编码块的预测像素值可以由下式表达:
Figure BDA0002492364500000031
其中d1是编码块与参考块reference1的距离(相隔的帧数),d2是编码块与参考块reference2的距离。
根据预测像素值和原始像素值可以得到残差矩阵R(残差系数):
R=Orx,y-Prx,y (公式4)
S3、变换量化
1.分解变换矩阵T
变换矩阵T是视频编码领域里已经设定好的固定的矩阵,本方法针对其中的两种变换核进行分解,DCT-4矩阵表示如下:
Figure BDA0002492364500000041
DST-4矩阵表示如下:
Figure BDA0002492364500000042
Ti(j)表示矩阵第i行第j列的元素。
对于2N*2N大小的变换矩阵T,分解为4*4大小的小型矩阵,每个矩阵包含原矩阵的16个元素,分别位于第i行,第j列;第2N-1+1-i行,第j列;第2N-1+i行,第j列;第2N+1-i行,第j列;第i行,第2N-1+1-j列;第2N-1+1-i行,第2N-1+1-j列;第2N-1+i行,第2N-1+1-j列;第2N+1-i行,第2N-1+1-j列;第i行,第2N-1+j列;第2N-1+1-i行,第2N-1+j列;第2N-1+i行,第2N-1+j列;第2N+1-i行,第2N-1+j列;第i行,第2N+1-j列;第2N-1+1-i行,第2N+1-j列;第2N-1+i行,第2N+1-j列;第2N+1-i行,第2N+1-j列;共将2N*2N大小的变换矩阵分解为2N-2*2N-2个4*4矩阵。
2.分解残差矩阵R
残差矩阵R是和变换矩阵T一样大小的矩阵,将其按照与变换矩阵同样的分解方法分解为4*4大小的矩阵,得到2N-2*2N-2个4*4矩阵。
3.计算T·R过程中的中间变量
视频编码通过变换技术来将残差矩阵投射到变换域,以减少码率。
在对残差矩阵进行变换的过程中,可以采用以下方法,利用分块矩阵的计算方法计算T·R,其中每一步都是计算两个4*4矩阵的乘积,得到中间变量计算方法如下:
Figure BDA0002492364500000051
k0i=b*(r1i+r2i+r3i+r4i) (公式8)
k1i=(-a-b)*(r2i+r3i) (公式9)
k2i=(d-b)*(r1i+r4i) (公式10)
k3i=(c-b)*(r1i+r3i) (公式11)
k4i=(-c-b)*(r3i+r4i) (公式12)
m0i=k0i+k2i+k3i+(a+b-c-d)*r1i (公式13)
m1i=k0i+k1i+k4i+(a+b+c-d)*r2i (公式14)
m2i=k0i+k1i+k3i+(a+b-c+d)*r3i (公式15)
m3i=k0i+k2i+k4i+(-a+b+c-d)*r4i (公式16)
其中k0i,k1i,k2i,k3i,k4i都是中间变量,先保存下来,(i=1,2,3,4)。
4.利用得到的中间变量,累加得到残差矩阵经过变换后的结果,如果是对进行4*4矩阵进行变换,则前文中的m0i,m1i,m2i,m3i是4*4大小的残差矩阵最终的变换结果,不需要再进行累加。对于其它大小的残差矩阵,计算方式如下:
8*8残差矩阵的变换结果如下:
第一行第i列的值为:temp0+k1,3i+k2,4i+(t11+t14-t15-t18)r1i+(-t16+t12-t17+t13)r3i; (公式17)
第四行第i列的值为:temp1+k1,4i+k2,3i+(t11+t14+t15-t18)r4i+(-t16-t12-t17+t13)r2i; (公式18)
第五行第i列的值为:temp1+k1,3i+k2,4i+(t11+t14-t15+t18)r5i+(t16-t12+t17+t13)r7i; (公式19)
第八行第i列的值为:temp0+k1,4i-k2,3i+(-t11+t14+t15-t18)r1i+(-t16+t12+t17-t13)r6i; (公式20)
其中
temp0=k1,0i+k1,1i-k2,0i-k2,2i (公式21)
temp1=k1,0i+k1,2i+k2,0i+k2,1i (公式22)
同理,对其余四行计算方法如下:
temp2=-k3,0i-k3,2i+k4,0i+k4,1i (公式23)
temp3=k3,0i+k3,1i+k4,0i+k4,2i; (公式24)
第二行第i列的值为:temp2+k4,3i-k3,4i+(t13+t12-t17-t16)r1i+(t15+t18+t11+t14)r3i; (公式25)
第三行第i列的值为:temp3+k4,4i+k3,3i+(t13-t12+t17-t16)r4i+(-t15+t18-t11-t14)r2i; (公式26)
第六行第i列的值为:temp3+k4,3i+k3,4i+(-t13-t12-t17-t16)r5i+(-t1s+t18+t11+t14)r7i; (公式27)
第七行第i列的值为:temp2+k4,4i-k3,3i+(t13+t12-t17+t16)r8i+(-t15+t18-t11+t14)r6i; (公式28)
k是在四次4*4矩阵乘法中计算得到的中间变量,k的下标中左侧数字代表其是第几次矩阵乘法,右侧数字代表其是第i列的第几个中间变量,t为变换矩阵T中的元素,t的下标表示其在变换矩阵T中的位置,r为残差矩阵中的残差值,r的下标表示其在残差矩阵R中的位置,八行结果组合起来就是变换之后的残差矩阵Rtr。16*16和32*32残差矩阵的计算方法与8*8残差矩阵计算方式一致。
残差矩阵变换完成后进行量化,量化过程如下:
Figure BDA0002492364500000061
其中Quantx,y是量化结果,Round表示进行四舍五入,step表示量化步长。
S4、熵编码
对量化结果(量化系数)的熵编码如下:
将变换块分解成4*4大小,然后扫描系数,(4*4块内部的扫描方式和4*4块的扫描方式一致),扫描的方式有对角扫描,水平扫描和垂直扫描。从最后一个系数开始扫描,每一个4*4块扫描过程变成一个一维数组,然后对一维数组进行编码。首先编码一维数组的最后一个非零系数的位置,然后编码其它非零系数的位置,最后再对非零系数的幅值进行编码。全部完成之后输出码流。
为了证明本发明的有效性,通过如下表1对本发明的编码耗时与VTM3.0(VVC新提出的一个编码器)进行对比:
表1实施例得到的编码耗时对比
Figure BDA0002492364500000071
可以看出对所有序列,采用本发明的方法后,复杂度均得到减少。

Claims (1)

1.一种基于矩阵分解的视频编码方法,其特征在于,包括以下步骤:
S1、输入视频后,获取每一帧的像素矩阵,定义为大小为M*N的矩阵,然后进行逐帧处理,将当前正在处理的帧记为F;
S2、将帧F划分为不同大小的块,对每一块进行预测,获得编码块内每一个点的预测像素值Prx,y,再根据原始像素值Orx,y,得到残差矩阵R:
R=Orx,y-Prx,y
S3、对残差矩阵R进行变换量化:
对变换矩阵T进行分解,设变换矩阵T为DCT-4矩阵:
Figure FDA0003337505630000011
或DST-4矩阵:
Figure FDA0003337505630000012
Ti(j)表示矩阵第i行第j列的元素;
将2N*2N大小的变换矩阵T,分解为4*4大小的小型矩阵,每个矩阵包含原矩阵的16个元素,分别位于第i行,第j列;第2N-1+1-i行,第j列;第2N-1+i行,第j列;第2N+1-i行,第j列;第i行,第2N-1+1-j列;第2N-1+1-i行,第2N-1+1-j列;第2N-1+i行,第2N-1+1-j列;第2N+1-i行,第2N-1+1-j列;第i行,第2N-1+j列;第2N-1+1-i行,第2N-1+j列;第2N-1+i行,第2N-1+j列;第2N+1-i行,第2N-1+j列;第i行,第2N+1-j列;第2N-1+1-i行,第2N+1-j列;第2N-1+i行,第2N+1-j列;第2N+1-i行,第2N+1-j列;共将2N*2N大小的变换矩阵分解为2N-2*2N-2个4*4矩阵;
将残差矩阵R按照相同的方式分解为4*4大小的矩阵,得到2N-2*2N-2个4*4矩阵;
计算T·R得到变换之后的残差矩阵Rtr,其中上标tr表示残差矩阵已经过变换;
将变换之后的残差矩阵进行量化:
Figure FDA0003337505630000021
其中Quantx,y是量化结果,Round表示进行四舍五入,step表示量化步长;
S4、对量化结果进行熵编码:
将变换块分解成4*4大小,然后扫描系数,从最后一个系数开始扫描,每一个4*4块扫描过程变成一个一维数组,然后对一维数组进行编码,首先编码一维数组的最后一个非零系数的位置,然后编码其它非零系数的位置,最后再对非零系数的幅值进行编码,全部完成之后输出码流。
CN202010408636.5A 2020-05-14 2020-05-14 一种基于矩阵分解的视频编码方法 Active CN111556319B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010408636.5A CN111556319B (zh) 2020-05-14 2020-05-14 一种基于矩阵分解的视频编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010408636.5A CN111556319B (zh) 2020-05-14 2020-05-14 一种基于矩阵分解的视频编码方法

Publications (2)

Publication Number Publication Date
CN111556319A CN111556319A (zh) 2020-08-18
CN111556319B true CN111556319B (zh) 2021-12-17

Family

ID=72004697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010408636.5A Active CN111556319B (zh) 2020-05-14 2020-05-14 一种基于矩阵分解的视频编码方法

Country Status (1)

Country Link
CN (1) CN111556319B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111988630A (zh) * 2020-09-11 2020-11-24 北京锐马视讯科技有限公司 视频传输方法和装置、设备及存储介质
CN112218071B (zh) * 2020-09-30 2024-01-30 北京达佳互联信息技术有限公司 视频编码方法、装置、存储介质及电子设备
CN112243125B (zh) * 2020-10-20 2022-07-12 浙江大华技术股份有限公司 视频编码方法以及电子设备、存储装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008035842A1 (en) * 2006-09-20 2008-03-27 Electronics And Telecommunications Research Institute Apparatus and method for encoding and decoding using alternative converter according to the correlation of residual signal
CN109495745A (zh) * 2018-11-20 2019-03-19 北京工业大学 一种基于逆量化/逆变换的无损压缩解码方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6614428B1 (en) * 1998-06-08 2003-09-02 Microsoft Corporation Compression of animated geometry using a hierarchical level of detail coder
CN100473161C (zh) * 2005-09-09 2009-03-25 海信集团有限公司 基于avs的4×4离散余弦变换的快速并行装置及其方法
CN101562747B (zh) * 2009-05-19 2010-08-25 华中科技大学 一种视频编码预测残差块的分解及重建方法
US9378185B2 (en) * 2010-09-30 2016-06-28 Texas Instruments Incorporated Transform and quantization architecture for video coding and decoding
CN103096056B (zh) * 2011-11-08 2015-11-25 华为技术有限公司 矩阵编码方法与装置及解码方法与装置
CN105530518B (zh) * 2014-09-30 2019-04-26 联想(北京)有限公司 一种视频编码、解码方法及装置
CN105791867B (zh) * 2016-03-23 2019-02-22 北京大学 基于边界自适应变换的优化视频数据编码方法
US10893274B2 (en) * 2016-05-12 2021-01-12 Lg Electronics Inc. Method for processing video signal on basis of arbitrary partition transform
EP3591973A4 (en) * 2017-03-22 2020-03-18 Huawei Technologies Co., Ltd. METHOD AND APPARATUS FOR DECODING VIDEO DATA AND METHOD AND APPARATUS FOR ENCODING VIDEO DATA
CN107071474B (zh) * 2017-04-13 2019-10-11 西安电子科技大学 基于satd复用的hevc帧内预测方法
WO2020003740A1 (ja) * 2018-06-29 2020-01-02 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008035842A1 (en) * 2006-09-20 2008-03-27 Electronics And Telecommunications Research Institute Apparatus and method for encoding and decoding using alternative converter according to the correlation of residual signal
CN109495745A (zh) * 2018-11-20 2019-03-19 北京工业大学 一种基于逆量化/逆变换的无损压缩解码方法

Also Published As

Publication number Publication date
CN111556319A (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
CN111556319B (zh) 一种基于矩阵分解的视频编码方法
EP2280548B1 (en) Method for decoding a stream of coded data representative of a sequence of images and method for coding a sequence of images
US20230319323A1 (en) Video Coding With Embedded Motion
CN1125568C (zh) 预测图像解码方法以及预测图像编码方法
JP5566529B2 (ja) 辞書を用いてビデオをコード化する方法
US6650708B1 (en) Video signal encoding apparatus
EP1983759A1 (en) Estimation of separable adaptive interpolation filters for hybrid video coding
GB2492333A (en) Video coding using spatial transform skip modes
JPH01188086A (ja) 画像信号の符号化方法
WO2010074170A1 (ja) 画像復号装置及び画像符号化装置
EP1932100A2 (en) Reduced dimension wavelet matching pursuits coding and decoding
KR20130056190A (ko) 변환 영역 필터들을 인코딩 및 디코딩하기 위한 방법들 및 장치들
JP2001136526A5 (zh)
EP1499114A2 (en) Noise reduction apparatus
US20130208790A1 (en) Picture coding and decoding
CN109672891B (zh) Jpeg图像的无损二次压缩方法
KR20050106490A (ko) 움직임 벡터의 컴포넌트에 관한 부분을 고려하여 비디오이미지를 코딩하는 방법
KR20080004855A (ko) 문맥 기반 적응적 가변 길이 부호화 인코더 및 디코더,문맥 기반 적응성 가변 길이 부호화하는 방법과 복호화하는방법 및 이를 이용한 동영상 전송 시스템.
CN1825894A (zh) 全相位余弦双正交变换及其对jpeg的改进方法
US20150023410A1 (en) Method for simultaneously coding quantized transform coefficients of subgroups of frame
KR100711025B1 (ko) 동영상 표준 부호화 방식의 성능 향상을 위한 잔여신호 필터링 방법
Choi et al. Frequency-aware learned image compression for quality scalability
CN113347425A (zh) 信息处理方法及装置、设备、存储介质
CN111131834A (zh) 可逆自编码器、编解码方法以及图像压缩方法、装置
Manjanaik et al. Intra frame coding for advanced video coding standard H. 264 to control PSNR and reduce bit rate using Gaussian pulse

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant