CN110493597B - 一种高效感知视频编码优化方法 - Google Patents

一种高效感知视频编码优化方法 Download PDF

Info

Publication number
CN110493597B
CN110493597B CN201910624886.XA CN201910624886A CN110493597B CN 110493597 B CN110493597 B CN 110493597B CN 201910624886 A CN201910624886 A CN 201910624886A CN 110493597 B CN110493597 B CN 110493597B
Authority
CN
China
Prior art keywords
distortion
video
perceptual
perceived
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910624886.XA
Other languages
English (en)
Other versions
CN110493597A (zh
Inventor
王瀚漓
吴秀哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201910624886.XA priority Critical patent/CN110493597B/zh
Publication of CN110493597A publication Critical patent/CN110493597A/zh
Application granted granted Critical
Publication of CN110493597B publication Critical patent/CN110493597B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本发明涉及一种高效感知视频编码优化方法,该方法以感知失真作为客观失真衡量指标优化HEVC编码器,包括以下步骤:1)建立基于HVS特性的感知失真模型;2)基于所述感知失真模型拟合获得感知失真所对应的码率,进而推导lambda算子,建立基于感知失真的率失真模型;3)基于所述基于感知失真的率失真模型优化HEVC编码器的编码参数。与现有技术相比,本发明具有低复杂度、高鲁棒性与高效率等优点,且能在一定程度上保持视频的感知质量。

Description

一种高效感知视频编码优化方法
技术领域
本发明涉及视频编码领域,尤其是涉及一种高效感知视频编码优化方法。
背景技术
随着大数据时代的来临和移动智能设备的普及,越来越多的人在腾讯视频、优酷土豆、爱奇艺等视频资源网站上在线观看视频,或在虎牙直播、映客直播等视频直播网站上分享自己的生活。而随着在线视频的数量和在线视频用户的数量急剧上升,如何高效编码、传输、解码视频成了一个巨大的挑战。2013年初,新一代视频编码标准——高效视频编码标准(High Efficiency Video Coding,HEVC)的提出较前一代视频编码标准H.264/AVC节省了至少一倍的码率。HEVC标准中灵活的编码结构、编码技巧同时也带来了大量模式选择的问题。在模式、参数选择当中,编码代价小的模式或参数才是理想的模式或参数。编码代价主要研究的是视频质量和编码比特数的权衡关系。传统视频编码使用客观视频质量评价作为视频失真的测量,而视频或图像最终的接收端是人眼,人类视觉系统(Human VisualSystem,HVS)在评价视频失真上和客观视频质量评价标准并不总是完全相符。为此,基于HVS特性的主观视频质量成为了多媒体领域中一个热门的研究方向之一。而在视频编码中,当基于客观视频质量评价标准的研究达到一定高度和瓶颈时,将主观视频质量评价标准引入整个HEVC编码框架中成为了提升编码效率中的一个新颖且高效的方式。
通常来说,感知视频编码的研究可以分为两大类。第一类是对图像、视频进行预处理。即在编码之前先使用预处理算法处理待编码的图像、视频。预处理方式会首先识别出待编码图像或帧中人眼敏感的区域和非敏感的区域,对待非敏感区域,通常会使用滤波器去除高频信息部分,仅保留相对重要的低频信息,即识别出视觉显著的感兴趣区域(RegionsOf Interest,ROI),在基本保留符合人眼视觉特性的信息前提下,尽量减少编码量。这类方法的好处是和编码器类型无关、通用性好、可移植性强,同时,这类方法仅仅考虑了预处理过程的特性,而忽视了编码器端的特性。另一类则是直接作用在编码器端和解码器端的算法。比如最直接的方式就是重新定义视频质量衡量标准来模拟HVS的特性。常见的有结构性相似性指数(Structural SIMilarity index,SSIM)及其衍生的优化算法。然而,SSIM系列的算法衡量的是两幅图像在结构上的相似性,研究的是图像级别的失真,而忽略了细颗粒度的图像信息。
发明内容
本发明的目的在于克服上述现有技术存在的缺陷而提供一种高效率、高鲁棒性的基于感知权值均方差的高效视频编码优化方法及编码方法,通过消除视频信息中的感知冗余来进一步提高已有的视频压缩标准的编码效率。
本发明的目的可以通过以下技术方案来实现:
一种高效视频编码优化方法,该方法以感知失真作为客观失真衡量指标优化HEVC编码器,包括以下步骤:
1)建立基于HVS特性的感知失真模型;
2)基于所述感知失真模型拟合获得感知失真所对应的码率,进而推导lambda算子,建立基于感知失真的率失真模型;
3)基于所述基于感知失真的率失真模型优化HEVC编码器的编码参数。
进一步地,所述步骤1)中,利用在时间域、空间域上的视频背景掩蔽调制效应建立基于HVS特性的感知失真模型。
进一步地,所述基于HVS特性的感知失真模型表示为:
Figure BDA0002126764570000021
其中,MSEf表示滤波后的均方差,α、β表示常数参数,RT表示时间域上的混乱度,RS表示空间域上的混乱度。
进一步地,所述步骤2)中,构建基于感知失真的率失真模型具体包括:
201)根据基于HVS特性的感知失真模型获得每个量化区间内的失真模型;
202)通过数据拟合,获得每个量化区间内感知码率模型;
203)建立lambda算子自适应计算模型;
204)基于步骤201)-203)构建基于感知失真的率失真模型。
进一步地,所述每个量化区间内的失真模型表示为:
Figure BDA0002126764570000031
其中,q表示量化参数,α、β表示常数参数。
进一步地,所述每个量化区间内感知码率模型表示为:
Figure BDA0002126764570000032
其中,σ、ω为常数参数,
Figure BDA0002126764570000033
θ=β·ln12。
进一步地,所述lambda算子自适应计算模型表示为:
Figure BDA0002126764570000034
进一步地,在计算当前帧的编码参数时,同时利用先前的信息,即:
Figure BDA0002126764570000035
Figure BDA0002126764570000036
其中,σn、ωn为第n帧的编码参数,σn-1、ωn-1为第n-1帧的编码参数,
Figure BDA0002126764570000037
Figure BDA0002126764570000038
为调整后的第n帧的编码参数,η表示先前信息的权重:
Figure BDA0002126764570000039
其中,y表示常数参数。
与现有技术相比,本发明具有如下有益效果:
一、高鲁棒性与普适性:本发明通过基于HVS特性的感知失真模型的定义及数据拟合获得基于所述感知失真的率失真模型,所使用的高效视频压缩标准(HEVC)下的官方视频序列数据集内容广泛丰富,保证了样本间各项特征的充分差异性。
二、高编码效率:本发明对HEVC编码器进行优化,优化后的HEVC编码器具有较高的编码效率。
本发明考虑细颗粒度的图像信息,在图像块级别上实现编码优化。实验中从客观码率节省和主观质量评价两个方面进行评估,在HEVC官方视频序列数据集上均表现优良,在随机存取模式和低延迟模式下平均分别可以节省20.39%和30.19%的码率,且编码后的视频的主观质量无可察觉性下降,超过同类其他方法。
附图说明
图1为本发明的流程示意图;
图2为算法一、总算法在不同Qp下的主观实验的Z值,其中,(2a)为Qp=22下算法一的Z值,(2b)为Qp=22下总算法的Z值,(2c)为Qp=27下算法一的Z值,(2d)为Qp=27下总算法的Z值,(2e)为Qp=32下算法一的Z值,(2f)为Qp=32下总算法的Z值,(2g)为Qp=37下算法一的Z值,(2h)为Qp=37下总算法的Z值。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,本发明提供一种高效视频编码优化方法,该方法以感知失真作为客观失真衡量指标,在HEVC框架下提出一个基于感知权值均方差(Perceptually WeightedMean Squared Error,PWMSE)的高效视频编码优化技术,并逐帧优化HEVC编码器的编码参数。该方法包括以下步骤:
1)利用在时间域、空间域上的视频背景掩蔽调制效应,建立基于HVS(人眼视觉系统,Human Visual System)特性的感知失真模型;
2)基于所述感知失真模型拟合获得感知失真所对应的码率,进而推导lambda算子,建立基于感知失真的率失真(Rate-Distortion Optimization,RDO)模型;
3)基于所述基于感知失真的率失真模型优化HEVC编码器的编码参数。
步骤1)中,对即将编码的视频帧的失真图像用一个低通滤波器处理以模拟视觉信号处理过程,计算得到基于HVS特性的感知失真,具体包括以下步骤:
11)设计频域上的对比敏感度函数(Contrast Sensitivity Function,CSF),量化HVS对初始视觉信号处理的过程,模拟人眼对不同位置失真的感知能力,量化HVS对初始视觉信号处理:
H(f)=(a+b·f)e-c·f
其中,f表示频域上的信息,a、b、c表示常数参数,e表示自然常数;
12)针对每个执行DCT变换的单元(Transform Unit,TU)进行滤波:
Figure BDA0002126764570000041
其中,Ci表示DCT变换前的系数,h表示变换滤波器,
Figure BDA0002126764570000042
表示DCT变换后的系数;
将原有的MSE经过步骤11)、12)的滤波得到MSEf
13)定义时间域上的混乱度,衡量视频背景的掩蔽效应:
Figure BDA0002126764570000051
其中,H、W分别表示图像的高度和宽度,p(i,j)、o(i,j)分别表示预测图像和原始图像在(i,j)的像素值;
14)定义空间域上的混乱度,衡量视频背景的掩蔽效应:
Figure BDA0002126764570000052
其中,
Figure BDA0002126764570000053
表示块内像素的平均值;
15)基于11)、12)、13)、14)的结果,建立符合人眼对失真的直观感受的失真模型:
Figure BDA0002126764570000054
其中,MSEf表示滤波后的均方差,α、β表示常数参数。
所述步骤2)中,通过数据拟合构建基于感知失真的率失真模型,建立lambda及率失真计算公式。率失真优化技术在视频编码中主要担当编码控制的角色,其本质是编码参数选择优化技术。不同的编码参数可以得到不同的率失真性能,最优编码方案就是在编码系统定义的所有编码参数中使用能够使系统性能最优的参数值,而率失真优化便是基于率失真优化理论选择最优的编码参数。在HEVC编码方案中,将这一约束问题,利用拉格朗日优化方法转化为一个等价的无约束问题:
minJ,J=D+λ·R
其中,J为率失真代价,D为采用某种编码参数编码所产生的失真,R为相应编码参数编码需要的码率,λ为拉格朗日乘数,基于已编码帧的率失真进行计算,取率失真代价最低的编码参数为最优编码参数。
步骤2)具体包括以下步骤:
21)基于数据拟合推导出新提出的PWMSE失真模型和码率之间的关系:
Figure BDA0002126764570000055
22)推导每个量化区间内时间域上的混乱度:
Figure BDA0002126764570000056
23)推导每个量化区间内空间域上的混乱度:
Figure BDA0002126764570000061
24)推导每个量化区间内的新提出的PWMSE失真模型,其中q表示量化参数:
Figure BDA0002126764570000062
定义,
θ=β·ln12
Figure BDA0002126764570000063
25)根据感知失真-码率数据拟合出每个量化区间内感知码率模型:
Figure BDA0002126764570000064
其中,σ、ω为常数参数,由最早编码的视频帧计算得出;
26)设计lambda算子自适应计算模型:
Figure BDA0002126764570000065
Dprop、Rprop、λprop代入公式J=D+λ·R,进行编码参数。
在实际视频编码时,先进行两帧编码,之后就能通过这两对率失真值采用步骤21)中的公式计算下一帧的参数ω1和σ1,而计算出来的参数就可以应用在下一帧的编码中。同样的,可以计算出ω2,ω3,...,ωn和σ2,σ3,...,σn。同时,为了减轻场景切换或者I帧与非I帧切换对参数计算带来的剧变效应,在计算当前帧的参数时,同时利用了先前的信息,即
Figure BDA0002126764570000066
Figure BDA0002126764570000067
参数η表示先前信息的权重:
Figure BDA0002126764570000068
为了验证本发明方法的性能,设计了以下实验。
在HEVC官方视频序列公开数据集上应用本方法进行感知编码,其中测试序列包含416×240、832×480、1280×720、1920×1080四种分辨率且序列长度为100帧的16种视频,视频编码配置包括了Random Access和Low Delay,参与实验的算法有2种,包括算法一(只包含了滤波,即只计算到了公式12))和总算法,参考方法为官方原始HM模型提供的编码方法,在给定的四个常用测试量化参数(22,27,32,37)条件下进行实验,采用如公式(1)的码率节省和如公式(2)的ΔPWMSE值作为评价标准。结果如表1-表17所示,在感知失真下降的可接受的范围内,总算法对编码效率的优化显著优于算法一,并且,总算法随机存取(Random Access)模式和低延迟(Low Delay)模式下都能有效地节省了编码比特率。
Figure BDA0002126764570000071
ΔPWMSE=PWMSEprop.-PWMSEanc.    (2)
其中,PWMSEanc.和Banc.分别代表使用HEVC标准编码器时得到的PWMSE值和比特率,PWMSEprop.和Bprop.则代表使用本发明编码视频时得到的PWMSE值和比特率。
表1 HEVC官方测试序列数据集
编号 视频序列 分辨率
A BQTerrace 1920×1080
B Cactus 1920×1080
C Kimono 1920×1080
D ParkScene 1920×1080
E BasketballDrill 832×480
F BQMall 832×480
G PartyScene 832×480
H RaceHorses 832×480
I BasketballPass 416×240
J BlowingBubbles 416×240
K BQSquare 416×240
L RaceHorses 416×240
M FourPeople 1280×720
N Johny 1280×720
O Vidyo1 1280×720
P Vidyo3 1280×720
表2 RA模式下1920×1080分辨率节省的bitrate
Figure BDA0002126764570000072
Figure BDA0002126764570000081
表3 RA模式下832×480分辨率节省的bitrate
Figure BDA0002126764570000082
表4 RA模式下416×240分辨率节省的bitrate
Figure BDA0002126764570000083
Figure BDA0002126764570000091
表5 RA模式下1280×720分辨率节省的bitrate
Figure BDA0002126764570000092
表6 LD模式下1920×1080分辨率节省的bitrate
Figure BDA0002126764570000093
Figure BDA0002126764570000101
表7 LD模式下832×480分辨率节省的bitrate
Figure BDA0002126764570000102
表8 LD模式下416×240分辨率节省的bitrate
Figure BDA0002126764570000103
Figure BDA0002126764570000111
表9 LD模式下1280×720分辨率节省的bitrate
Figure BDA0002126764570000112
表10 RA模式下分辨率1920×1080的ΔPWMSE
Figure BDA0002126764570000113
Figure BDA0002126764570000121
表11 RA模式下分辨率832×480的ΔPWMSE
Figure BDA0002126764570000122
表12 RA模式下分辨率416×240的ΔPWMSE
Figure BDA0002126764570000131
表13 RA模式下分辨率1280×720的ΔPWMSE
Figure BDA0002126764570000132
Figure BDA0002126764570000141
表14 LD模式下分辨率1920×1080的ΔPWMSE
Figure BDA0002126764570000142
表15 RA模式下分辨率832×480的ΔPWMSE
Figure BDA0002126764570000143
Figure BDA0002126764570000151
表16 RA模式下分辨率416×240的ΔPWMSE
Figure BDA0002126764570000152
表17 RA模式下分辨率1280×720的ΔPWMSE
Figure BDA0002126764570000153
Figure BDA0002126764570000161
进一步,本发明做了一系列的主观实验来验证所提出的算法的有效性。每一个视频类中随机选取两个视频序列作为代表,因此,总共共有八个视频序列用于主观实验测试中,包括Kimono1,ParkScene,BQMall,PartyScene,RaceHorses,BasketballPass,Vidyo1和Vidyo3。总共共有20名测试者参与了本次测试。重构的视频序列分别有两个优化算法产生,分别是算法一和总算法。编码视频总共涵盖四个编码参数,22、27、32和37。衡量标准采用主观多媒体视频质量衡量标准(Subjective Assessment of Multimedia Video Quality,SAMVQ)。具体来说,同一个源视频产生的一对视频序列(一个是通过HEVC编码器编码生成的标准视频,另一个是相应的优化算法编码生成的视频)在屏幕上以随意的顺序播放,并且每次实验的实验时间不能超过30分钟。接着,测试者被要求评估每一个视频的质量,并打出分数,这些分数是连续的。最终的数据会利用Z检验来判断优化算法处理后的视频与原视频之间是否存在着显著差异。具体来说,首先建立假设,假设优化算法处理后的视频与原视频之间不存在显著差异,即对优化算法处理视频的分数与被标准编码器编码后重构的视频的分数之间没有显著差异。
其次,针对算法j,设测试者i对视频k打的分数为uijk,则针对算法j下视频k的被打出的平均分为
Figure BDA0002126764570000162
N表示测试者的人数。针对标准编码器重构出的视频k的被打出的分数uiok的平均分为
Figure BDA0002126764570000163
接着,计算Z值
Figure BDA0002126764570000164
其中,
Figure BDA0002126764570000171
其中,标准差Sjk可以由下式计算,Sok同理。
Figure BDA0002126764570000172
最后,且取置信水平为95%,比较计算出来的Z值和阈值1.96的关系。当Z值小于阈值时,对应的视频可以被认为和标准编码器重构出来的视频没有明显差别。由莫斯科州立大学图像多媒体实验室所开发的MSU感知视频质量工具被用来实现本次主观实验,具体测试视频如下:
表18视频编号
编号 视频序列 分辨率
1 Kimono 1920×1080
2 ParkScene 1920×1080
3 BQMall 832×480
4 PartyScene 832×480
5 BasketballPass 416×240
6 RaceHorses 416×240
7 Vidyo1 1280×720
8 Vidyo3 1280×720
数据如图2所示,虚线标注的是阈值1.96。从图2可以直观看出,各优化算法处理视频的分数与被标准编码器编码后重构的视频的分数之间没有显著差异,这表明:经优化算法编码后的视频主观感知质量与标准编码器编码重构后的视频主观感知质量基本相同。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (2)

1.一种高效感知视频编码优化方法,其特征在于,该方法以感知失真作为客观失真衡量指标优化HEVC编码器,包括以下步骤:
1)建立基于HVS特性的感知失真模型;
2)基于所述感知失真模型拟合获得感知失真所对应的码率,进而推导lambda算子,建立基于感知失真的率失真模型;
3)基于所述基于感知失真的率失真模型优化HEVC编码器的编码参数;
利用在时间域、空间域上的视频背景掩蔽调制效应建立基于HVS特性的感知失真模型,所述基于HVS特性的感知失真模型表示为:
Figure FDA0004119823170000011
其中,MSEf表示滤波后的均方差,α、β表示常数参数,RT表示时间域上的混乱度,RS表示空间域上的混乱度;
构建基于感知失真的率失真模型具体包括:
201)根据基于HVS特性的感知失真模型获得每个量化区间内的失真模型;
202)通过数据拟合,获得每个量化区间内感知码率模型;
203)建立lambda算子自适应计算模型;
204)基于步骤201)-203)构建基于感知失真的率失真模型;
所述每个量化区间内的失真模型表示为:
Figure FDA0004119823170000012
其中,q表示量化参数,α、β表示常数参数;
所述每个量化区间内感知码率模型表示为:
Figure FDA0004119823170000013
其中,σ、ω为编码参数,
Figure FDA0004119823170000014
θ=β·ln12;
所述lambda算子自适应计算模型表示为:
Figure FDA0004119823170000015
所述时间域上的混乱度RT的表达式为:
Figure FDA0004119823170000016
其中,H、W分别表示图像的高度和宽度,p(i,j)、o(i,j)分别表示预测图像和原始图像在(i,j)的像素值;
所述空间域上的混乱度RS的表达式为:
Figure FDA0004119823170000021
其中,
Figure FDA0004119823170000027
表示块内像素的平均值。
2.根据权利要求1所述的高效感知视频编码优化方法,其特征在于,在计算当前帧的编码参数时,同时利用先前的信息,即:
Figure FDA0004119823170000022
Figure FDA0004119823170000023
其中,σn、ωn为第n帧的编码参数,σn-1、ωn-1为第n-1帧的编码参数,
Figure FDA0004119823170000024
Figure FDA0004119823170000025
为调整后的第n帧的编码参数,η表示先前信息的权重:
Figure FDA0004119823170000026
其中,γ表示常数参数。
CN201910624886.XA 2019-07-11 2019-07-11 一种高效感知视频编码优化方法 Active CN110493597B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910624886.XA CN110493597B (zh) 2019-07-11 2019-07-11 一种高效感知视频编码优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910624886.XA CN110493597B (zh) 2019-07-11 2019-07-11 一种高效感知视频编码优化方法

Publications (2)

Publication Number Publication Date
CN110493597A CN110493597A (zh) 2019-11-22
CN110493597B true CN110493597B (zh) 2023-04-28

Family

ID=68545986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910624886.XA Active CN110493597B (zh) 2019-07-11 2019-07-11 一种高效感知视频编码优化方法

Country Status (1)

Country Link
CN (1) CN110493597B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113099226B (zh) * 2021-04-09 2023-01-20 杭州电子科技大学 面向智慧法院场景的多层次感知视频编码算法优化方法
CN113949872A (zh) * 2021-11-09 2022-01-18 华侨大学 一种基于3D-Gradient引导的屏幕内容视频编码码率控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105763876A (zh) * 2015-12-21 2016-07-13 中国计量学院 一种基于时域失真波动和感兴趣区域的视频质量评价方法
CN106534862A (zh) * 2016-12-20 2017-03-22 杭州当虹科技有限公司 一种视频编码方法
CN109451310A (zh) * 2018-11-21 2019-03-08 北京航空航天大学 一种基于显著性加权的率失真优化方法及装置
CN109997360A (zh) * 2016-11-23 2019-07-09 交互数字Vc控股公司 基于感知度量分类对视频进行编码和解码的方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8224102B2 (en) * 2005-04-08 2012-07-17 Agency For Science, Technology And Research Method for encoding a picture, computer program product and encoder
CN103918262B (zh) * 2011-06-14 2017-11-10 王舟 基于结构相似度的码率失真优化感知视频编码方法和系统
US9237343B2 (en) * 2012-12-13 2016-01-12 Mitsubishi Electric Research Laboratories, Inc. Perceptually coding images and videos

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105763876A (zh) * 2015-12-21 2016-07-13 中国计量学院 一种基于时域失真波动和感兴趣区域的视频质量评价方法
CN109997360A (zh) * 2016-11-23 2019-07-09 交互数字Vc控股公司 基于感知度量分类对视频进行编码和解码的方法和装置
CN106534862A (zh) * 2016-12-20 2017-03-22 杭州当虹科技有限公司 一种视频编码方法
CN109451310A (zh) * 2018-11-21 2019-03-08 北京航空航天大学 一种基于显著性加权的率失真优化方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
An HVS-based adaptive computational complexity reduction scheme for H.264/AVC video encoder using prognostic early mode exclusion;Muhammad Shafique .et al;《Proceedings of the Conference on Design, Automation and Test in Europe》;20100331;全文 *
Efficiency of the human observer detecting random signals in random backgrounds;S. Park, E. Clarkson, M. A. Kupinski and H. H. Barrett;《J. Opt. Soc. America A》;20050131;全文 *
Perceptually Adaptive Lagrange Multiplier for Rate-Distortion Optimization in H.264;Chang Sun .et al;《 Future Generation Communication and Networking (FGCN 2007)》;20080107;全文 *

Also Published As

Publication number Publication date
CN110493597A (zh) 2019-11-22

Similar Documents

Publication Publication Date Title
Ma et al. Reduced-reference video quality assessment of compressed video sequences
CN106358040B (zh) 一种基于显著性的码率控制比特分配方法
WO2013143396A1 (zh) 一种数字视频质量控制方法及其装置
Keimel et al. No-reference video quality metric for HDTV based on H. 264/AVC bitstream features
US20200068200A1 (en) Methods and apparatuses for encoding and decoding video based on perceptual metric classification
CN111083477B (zh) 基于视觉显著性的hevc优化算法
CN108900838B (zh) 一种基于hdr-vdp-2失真准则的率失真优化方法
CN109286812B (zh) 一种hevc视频质量估计方法
CN103051901A (zh) 视频数据编码装置和视频数据编码方法
CN110493597B (zh) 一种高效感知视频编码优化方法
Li et al. Joint optimization for SSIM-based CTU-level bit allocation and rate distortion optimization
CN103634601A (zh) 基于结构相似度的高效视频编码感知码率控制优化方法
Xu et al. Consistent visual quality control in video coding
Nami et al. Juniper: A jnd-based perceptual video coding framework to jointly utilize saliency and JND
CN116916036A (zh) 视频压缩方法、装置及系统
KR100621003B1 (ko) 디지털 영상 데이터의 복호화 방법
Liu et al. Gated context model with embedded priors for deep image compression
CN112040231B (zh) 一种基于感知噪声信道模型的视频编码方法
Wu et al. Rate-perceptual-distortion optimization (RpDO) based picture coding—Issues and challenges
Bosse et al. Neural network guided perceptually optimized bit-allocation for block-based image and video compression
Huang No-reference video quality assessment by HEVC codec analysis
Kirmemis et al. A Practical Approach for Rate-Distortion-Perception Analysis in Learned Image Compression
EP2243299B1 (en) Method and device for compressing an image and storage medium carrying an image compressed by said method
KR20040107850A (ko) 동영상 압축 부호화기의 왜곡 최적화 장치 및 방법
CN1338235A (zh) 基于分段的视频压缩编码的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant