CN118200579A - 一种shvc可伸缩视频编码方法、装置及可读储存介质 - Google Patents

一种shvc可伸缩视频编码方法、装置及可读储存介质 Download PDF

Info

Publication number
CN118200579A
CN118200579A CN202410306024.3A CN202410306024A CN118200579A CN 118200579 A CN118200579 A CN 118200579A CN 202410306024 A CN202410306024 A CN 202410306024A CN 118200579 A CN118200579 A CN 118200579A
Authority
CN
China
Prior art keywords
image
video coding
scalable video
shvc
pass filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410306024.3A
Other languages
English (en)
Inventor
李远源
李建
程旗
冉红林
秦康
李迪
罗旭纬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Jiuzhou Electric Group Co Ltd
Original Assignee
Sichuan Jiuzhou Electric Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Jiuzhou Electric Group Co Ltd filed Critical Sichuan Jiuzhou Electric Group Co Ltd
Priority to CN202410306024.3A priority Critical patent/CN118200579A/zh
Publication of CN118200579A publication Critical patent/CN118200579A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种SHVC可伸缩视频编码方法、装置及可读储存介质,涉及SHVC视频编码领域,其中,编码方法包括:在发射端和接收端,基于子带编码技术,对数字图像进行分解和重构;所述对数字图像进行分解和重构借助数字滤波器实现,也称为数字图像的离散二维小波变换;本发明,在面对不同的网络带宽和用户需求时,可以按照不同的需求将基本层以及增强层进行解码,灵活性很高,能适应不同分辨率的设备和网络环境进行流畅高效的视频传输。

Description

一种SHVC可伸缩视频编码方法、装置及可读储存介质
技术领域
本发明涉及SHVC视频编码领域,具体涉及一种适用于低分辨率设备和网络信号较差的环境的SHVC可伸缩视频编码方法,相比于工业界常用的子带编码滤波器,该发明采用阶数更高的滤波器组,该滤波器在低分辨率以及网络质量差的环境下能保留更多图像信息,而在高分辨率以及良好网络环境下,该滤波器的效果同样良好。
背景技术
本节中的陈述仅提供与本公开相关的背景信息,并且可能不构成现有技术。
如今电子设备广泛普及,家家户户都有智能手机和电视,互联网得到广泛发展。人们可以随时随地通过网络观看视频,还能通过一些视频平台进行视频传播。视频编码在网络视频、直播娱乐、线上会议这些领域被广泛应用。然而,不同形式的移动设备可能导致人们的屏幕分辨率、处理器性能、存储空间存在差异,同时还存在网络带宽、网络信号质量不同的情况。对此,为了满足人们不同的设备条件和需求,需要更灵活的视频编码方式。高效可伸缩视频编码通过子带编码原理将视频信号分为一个基本层信号和多个数量可变的增强层信号来进行编码传输,面对不同的网络带宽和用户需求时,可以按照不同的需求将基本层以及增强层进行解码,灵活性很高。可伸缩视频编码拥有良好的容错性以及可伸缩的视频码流,能适应不同网络带宽进行流畅高效的视频传输,在实际生活中对视频传输方面具有重要作用。
高效可伸缩视频编码将视频信号分为一个基本层信号和多个数量可变的增强层信号来进行编码传输,在低分辨率设备以及网络质量差的情况下只解码基本层或者一层的增强层信号,目前广泛应用的子带编码滤波器在这种情况下会损失一部分图像信息。
发明内容
本发明的目的在于:针对现有技术中存在的问题,提供了一种SHVC可伸缩视频编码方法、装置及可读储存介质,解决了上述问题。
本发明的技术方案如下:
一种SHVC可伸缩视频编码方法,包括:
在发射端和接收端,基于子带编码技术,对数字图像进行分解和重构。
进一步地,所述对数字图像进行分解和重构借助数字滤波器实现,也称为数字图像的离散二维小波变换。
进一步地,所述数字图像的离散二维小波变换分别从图像的行和列两个方向进行。
进一步地,对数字图像进行分解,包括:
步骤1:对数字图像的每一行分别进行低通和高通滤波;
步骤2:提取图片中每一行的一维信号来与低通、高通滤波器进行卷积;
步骤3:对信号进行2倍下采样,得到N×(N/2)的图片;
步骤4:提取N×(N/2)的图片中的每一列进行高通、低通滤波处理,同样的对滤波结果进行2倍下采样,就会得到(N/2)×(N/2)的图片。
进一步地,在步骤S3中,滤波输出的结果会在下采样时隔空去掉。
进一步地,对图像的行进行的低通滤波,会保留低频的信息,即图像中灰度值差异不大的信息,会使得滤波后的图像灰度值变得模糊,在列方向的低通滤波同样如此,保留低频信息,这样得到的图像就是原始图像的近似压缩;
对图像的每一行低通滤波之后再对列高通滤波,会保留列方向的高频信号,即相邻像素点之间灰度值变化大的点,这样每一行之间灰度值的变化就更加明显了,称为水平细节;
对图像进行高通滤波,会保留每一行的高频分量,即灰度值变化大的点,然后进行列方向的低通滤波会模糊行之间的变化,得到的结果称为垂直细节;
对图像每一行进行高通滤波之后再进行列的高通滤波,得到的就是既不水平也不垂直的变化,即对角细节。
进一步地,所述对数字图像进行重构,包括:
步骤A:先对小波变换分解成的各个子带图像按列方向进行上采样;
步骤B:按照与之前分解时对称的顺序进行滤波,得到N×N/2的图像;
步骤C:将得到N×N/2的图像,在行方向上进行上采样;
步骤D:各自按照各自之前分析过程对应进行滤波,得到N×N的图像;
步骤E:将得到的N×N的图像相加,即完成图像的重构。
进一步地,所述步骤A,包括:每行相邻像素点之间插0。
一种SHVC可伸缩视频编码装置,包括:存储器、处理器以及存储在存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的一种SHVC可伸缩视频编码方法的步骤。
一种计算机可读储存介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述的一种SHVC可伸缩视频编码方法的步骤。
与现有的技术相比本发明的有益效果是:
1、一种SHVC可伸缩视频编码方法、装置及可读储存介质,在面对不同的网络带宽和用户需求时,可以按照不同的需求将基本层以及增强层进行解码,灵活性很高,能适应不同分辨率的设备和网络环境进行流畅高效的视频传输。
2、一种SHVC可伸缩视频编码方法、装置及可读储存介质,其信息熵反映图像携带的信息量的大小,经过分解的图像信息熵相较更低,传输相同信息时,能节省更多的频谱资源和存储空间,图像压缩性能进一步提升。
3、一种SHVC可伸缩视频编码方法、装置及可读储存介质,其峰值信噪比大于40dB,滤波器性能优良,图像重建误差约为0,能实现图像的无损传输。
附图说明
图1为系统结构示意图;
图2为图像分解过程流程图;
图3为图像重构过程流程图;
图4为滤波器幅频响应曲线。
具体实施方式
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
下面结合实施例对本发明的特征和性能作进一步的详细描述。
实施例一
需要说明的是,子带编码是一种对图像进行多分辨率分析的重要数字图像处理技术。
如图1所示,以信号的频率谱为基础,将输入信号分解成不同的频带分量,然后再对不同频带的分量进行采样,采样后的信号会进行量化,然后再编码成码流来传输信息。
在接收端,码流分解为不同子带,各子带进行解码,解码后的信号需要进行滤波处理,最后把各个子带滤波处理后的信号相加来重建原始信号。
通过子带编码,一幅数字图像可以被分解成为一系列较小子信号的集合,称为子带,通过一定方式将子带处理并相互结合,可以将原始图像无失真地重构出来,通过对子带信号的进一步分解可以获得原始图像的不同分辨率版本,达成不同分辨率信号同步传输的目的。
在本实施例中,具体的,请参阅图1-3,一种SHVC可伸缩视频编码方法,包括:
在发射端和接收端,基于子带编码技术,对数字图像进行分解和重构。
在本实施例中,具体的,所述对数字图像进行分解和重构借助数字滤波器实现,也称为数字图像的离散二维小波变换;数字图像信号在计算机中通过二维数组表示,所以对图像进行小波变换就需要进行二维小波处理。
在本实施例中,具体的,所述数字图像的离散二维小波变换分别从图像的行和列两个方向进行,如图2所示。
在本实施例中,具体的,对数字图像进行分解,包括:
步骤1:对数字图像的每一行分别进行低通和高通滤波;
步骤2:提取图片中每一行的一维信号来与低通、高通滤波器进行卷积;
步骤3:对信号进行2倍下采样,在这个过程中,滤波输出的结果会在下采样时隔空去掉得到N×(N/2)的图片;
步骤4:提取N×(N/2)的图片中的每一列进行高通、低通滤波处理,同样的对滤波结果进行2倍下采样,就会得到(N/2)×(N/2)的图片。
在本实施例中,需要说明的是,图2中对图像的行进行的低通滤波,会保留低频的信息,即图像中灰度值差异不大的信息,这样会使得滤波后的图像灰度值变得模糊,在列方向的低通滤波同样如此,保留低频信息,这样得到的图像就是原始图像的近似压缩;
对图像的每一行低通滤波之后再对列高通滤波,会保留列方向的高频信号,即相邻像素点之间灰度值变化大的点,这样每一行之间灰度值的变化就更加明显了,称为水平细节;
对图像进行高通滤波,会保留每一行的高频分量,即灰度值变化大的点,然后进行列方向的低通滤波会模糊行之间的变化,得到的结果称为垂直细节;
对图像每一行进行高通滤波之后再进行列的高通滤波,得到的就是既不水平也不垂直的变化,即对角细节。
在本实施例中,具体的,如图3所示,所述对数字图像进行重构,包括:
步骤A:先对小波变换分解成的各个子带图像按列方向进行上采样,即每行相邻像素点之间插0;
步骤B:按照与之前分解时对称的顺序进行滤波,得到N×N/2的图像;
步骤C:将得到N×N/2的图像,在行方向上进行上采样;
步骤D:各自按照各自之前分析过程对应进行滤波,得到N×N的图像;
步骤E:将得到的N×N的图像相加,即完成图像的重构。
即在进行重构时,先对小波变换分解成的各个子带图像按列方向进行上采样,即每行相邻像素点之间插0,这样可以得到N×N/2的图像,然后按照与之前分解时对称的顺序进行滤波,对于行低通列高通的子带,先进行列方向的高通滤波,滤波得到的信号与行低通列低通经过上采样和列方向低通滤波的图像相加得到的N×N/2的图像。另外两个子带类似进行处理也得到N×N/2的图像。这两个N×N/2的图像在行方向上进行上采样然后各自按照各自之前分析过程对应进行滤波,得到N×N的图像。将两个N×N的图像相加就能完成原始图像的重构。
本实施例还提出了一种SHVC可伸缩视频编码装置,包括:存储器、处理器以及存储在存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的一种SHVC可伸缩视频编码方法的步骤;优选地,所述计算机程序,并可以在终端设备,例如个人电脑上运行。
本实施例还提出了一种计算机可读储存介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述的一种SHVC可伸缩视频编码方法的步骤;然而,本发明的装置不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
在本实施例中,还需要说明的是,小波变换的核心是分析和综合滤波器组,如何获取满足不同需求且性能优良的分析综合滤波器组是人们不断研究的重点。
根据线性相位的任意数值的滤波器簇通用格型结构可以推导得到长度为(8,8)的小波变换对应的低通、高通滤波器的传递函数以及尺度因子。将完美重建条件通过尺度因子带入,并基于误差函数求解PRF数值,设置不同的区间值和权重因子值,最终得到了重建误差约为0、无混叠现象的完美重建滤波器组。
具体的,滤波器系数如下:
B组滤波器:滤波器标识:PRF(8,8)
h0=(6304,-12104,-7090,78426,78426,-7090,-12104,6304)/(512*256);
h1=(2328,-4470,-16575,55760,-55760,16575,4470,-2328)/(512*256);
g0=(-2328,-4470,16575,55760,55760,16575,-4470,-2328)/(256*256);
g1=(6304,12104,-7090,-78426,78426,7090,-12104,-6304)/(256*256);
目前工业界常用的滤波器组为:
A组滤波器:滤波器标识:PRF(2,2)
h0=(1,1)/2;
h1=(1,-1)/2;
g0=(1,1)/1;
g1=(-1,1)/1;
滤波器的频谱响应曲线如图4所示。经对比可发现(见表1),B组滤波器在低通滤波部分虽然响应不算平稳,但通带面积较大,可以保留更多的主要信息,高通滤波器阻带较长,没有明显起伏,接近理想滤波器响应。而A组滤波器通带和阻带的过渡部分太长,会导致一部分信息在滤波时被两个子带同时保留,信息重复利用,图像压缩时效率不高。B组滤波器的低通响应不太符合理想响应,但是这样的特性在滤波过程中会保留更多的信息,在面对网络质量不好以及分辨率较低的设备时,传输的视频信号只会解码基本层,此时传输的信息更多,可能会有更好的效果。
表1各项性能指标对比
A组 B组 原始图片
平均像素值 9.027375 7.630131 96.319031
信息熵 5.399bit 4.701bit 7.475bit
峰值信噪比 37.260dB 42.072dB
以上所述实施例仅表达了本申请的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请技术方案构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。
提供本背景技术部分是为了大体上呈现本发明的上下文,当前所署名的发明人的工作、在本背景技术部分中所描述的程度上的工作以及本部分描述在申请时尚不构成现有技术的方面,既非明示地也非暗示地被承认是本发明的现有技术。

Claims (10)

1.一种SHVC可伸缩视频编码方法,其特征在于,包括:
在发射端和接收端,基于子带编码技术,对数字图像进行分解和重构。
2.根据权利要求1所述的一种SHVC可伸缩视频编码方法,其特征在于,所述对数字图像进行分解和重构借助数字滤波器实现,也称为数字图像的离散二维小波变换。
3.根据权利要求2所述的一种SHVC可伸缩视频编码方法,其特征在于,所述数字图像的离散二维小波变换分别从图像的行和列两个方向进行。
4.根据权利要求3所述的一种SHVC可伸缩视频编码方法,其特征在于,对数字图像进行分解,包括:
步骤1:对数字图像的每一行分别进行低通和高通滤波;
步骤2:提取图片中每一行的一维信号来与低通、高通滤波器进行卷积;
步骤3:对信号进行2倍下采样,得到N×(N/2)的图片;
步骤4:提取N×(N/2)的图片中的每一列进行高通、低通滤波处理,同样的对滤波结果进行2倍下采样,就会得到(N/2)×(N/2)的图片。
5.根据权利要求4所述的一种SHVC可伸缩视频编码方法,其特征在于,在步骤S3中,滤波输出的结果会在下采样时隔空去掉。
6.根据权利要求4所述的一种SHVC可伸缩视频编码方法,其特征在于,对图像的行进行的低通滤波,会保留低频的信息,即图像中灰度值差异不大的信息,会使得滤波后的图像灰度值变得模糊,在列方向的低通滤波同样如此,保留低频信息,这样得到的图像就是原始图像的近似压缩;
对图像的每一行低通滤波之后再对列高通滤波,会保留列方向的高频信号,即相邻像素点之间灰度值变化大的点,这样每一行之间灰度值的变化就更加明显了,称为水平细节;
对图像进行高通滤波,会保留每一行的高频分量,即灰度值变化大的点,然后进行列方向的低通滤波会模糊行之间的变化,得到的结果称为垂直细节;
对图像每一行进行高通滤波之后再进行列的高通滤波,得到的就是既不水平也不垂直的变化,即对角细节。
7.根据权利要求1所述的一种SHVC可伸缩视频编码方法,其特征在于,所述对数字图像进行重构,包括:
步骤A:先对小波变换分解成的各个子带图像按列方向进行上采样;
步骤B:按照与之前分解时对称的顺序进行滤波,得到N×N/2的图像;
步骤C:将得到N×N/2的图像,在行方向上进行上采样;
步骤D:各自按照各自之前分析过程对应进行滤波,得到N×N的图像;
步骤E:将得到的N×N的图像相加,即完成图像的重构。
8.根据权利要求7所述的一种SHVC可伸缩视频编码方法,其特征在于,所述步骤A,包括:每行相邻像素点之间插0。
9.一种SHVC可伸缩视频编码装置,包括:存储器、处理器以及存储在存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-8中任意一项所述的一种SHVC可伸缩视频编码方法的步骤。
10.一种计算机可读储存介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8中任意一项所述的一种SHVC可伸缩视频编码方法的步骤。
CN202410306024.3A 2024-03-18 2024-03-18 一种shvc可伸缩视频编码方法、装置及可读储存介质 Pending CN118200579A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410306024.3A CN118200579A (zh) 2024-03-18 2024-03-18 一种shvc可伸缩视频编码方法、装置及可读储存介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410306024.3A CN118200579A (zh) 2024-03-18 2024-03-18 一种shvc可伸缩视频编码方法、装置及可读储存介质

Publications (1)

Publication Number Publication Date
CN118200579A true CN118200579A (zh) 2024-06-14

Family

ID=91411591

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410306024.3A Pending CN118200579A (zh) 2024-03-18 2024-03-18 一种shvc可伸缩视频编码方法、装置及可读储存介质

Country Status (1)

Country Link
CN (1) CN118200579A (zh)

Similar Documents

Publication Publication Date Title
US5974181A (en) Data compression system, method, and apparatus
Jasmi et al. Comparison of image compression techniques using huffman coding, DWT and fractal algorithm
US6643406B1 (en) Method and apparatus for performing linear filtering in wavelet based domain
KR100664928B1 (ko) 비디오 코딩 방법 및 장치
US8306340B2 (en) Fast codec with high compression ratio and minimum required resources
EP0866618A2 (en) Adaptive filtering for use with data compression and signal reconstruction
Hou et al. Complex SAR image compression based on directional lifting wavelet transform with high clustering capability
Taquet et al. Near-lossless and scalable compression for medical imaging using a new adaptive hierarchical oriented prediction
US7630568B2 (en) System and method for low-resolution signal rendering from a hierarchical transform representation
Kolekar et al. An introduction to wavelet-based image processing and its applications
US6934420B1 (en) Wave image compression
US8989278B2 (en) Method and device for coding a multi dimensional digital signal comprising original samples to form coded stream
CN118200579A (zh) 一种shvc可伸缩视频编码方法、装置及可读储存介质
T Hashim et al. Color image compression using DPCM with DCT, DWT and quadtree coding scheme
Wu et al. Comparisons of Threshold EZW and SPIHT Wavelets Based Image Compression Methods
Elamaran et al. Comparison of wavelet filters in image coding and denoising using embedded zerotree wavelet algorithm
Viswanath et al. Wavelet to DCT transcoding in transform domain
Egger et al. Arbitrarily-shaped wavelet packets for zerotree coding
Dumitrescu et al. Image compression and noise reduction through algorithms in wavelet domain
CN115358954B (zh) 一种注意力引导的特征压缩方法
CN111246205B (zh) 基于方向双四元数滤波器组的图像压缩方法
Jayanthi et al. Multi Wavelet Based Image Compression for Tele-Medical Applications
KR100854726B1 (ko) 역 이산 웨이블릿 변환을 이용한 이미지 복원 방법 및 장치
Arya Devi et al. Compression of gray scale images using linear prediction on wavelet coefficients
Hashimoto et al. Tile boundary artifact reduction algorithms for tile size conversion of wavelet image

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination