CN108769677B

CN108769677B - 一种基于感知的高动态范围视频动态范围可分级编码方法

Info

Publication number: CN108769677B
Application number: CN201810547533.XA
Authority: CN
Inventors: 蒋刚毅; 陈璐俊; 郁梅; 彭宗举; 陈芬
Original assignee: Ningbo University
Current assignee: Beijing Blue Diamond Culture Media Co ltd; Dragon Totem Technology Hefei Co ltd
Priority date: 2018-05-31
Filing date: 2018-05-31
Publication date: 2021-07-30
Anticipated expiration: 2038-05-31
Also published as: CN108769677A

Abstract

本发明涉及一种基于感知的高动态范围视频动态范围可分级编码方法，并利用视觉感知去除编码冗余，提高了动态范围可分级编码的效率。首先，提出了基于色调映射的动态范围可分级模型，将HDR视频分解成为一个SDR视频和多个RSFs序列；然后，考虑感知特性分别提出基于信息熵分析和内容分割两种方案，根据SDR视频帧内容对RSFs进行感知滤波处理；最后，在解码端重建在MDR显示设备上显示的SDR视频和HDR视频。本方法与此前的研究工作相比，考虑了色调映射操作在视频编码中的影响，并结合感知特性更好地处理了RSFs。实验结果表明，所提出方法能有效提高编码性能。

Description

一种基于感知的高动态范围视频动态范围可分级编码方法

技术领域

本发明涉及视频编解码技术领域，尤其是涉及一种基于感知的高动态范围视频动态范围可分级编码方法。

背景技术

高动态范围(High Dynamic Range,HDR)视频能更真实地反映现实场景，为用户带来更真实的视觉体验，是数字媒体领域的新研究热点。传统视频系统中的显示设备主要采用8bit 标准动态范围(Standard Dynamic Rang,SDR)显示器，不能直接显示HDR视频，需要通过色调映射(Tone Mapping,TM)技术在SDR显示设备上呈现HDR效果。虽然现有少数HDR显示设备可显示HDR效果，但它们的动态范围参差不齐，有10bit、12bit等。在现有HDR 视频编码传输中，同一HDR视频流难以同时满足多动态范围(Multiple Dynamic Range,MDR) 显示终端的需求，这就要求视频系统服务端要在HDR视频编码过程中，充分考虑终端用户 MDR特性，并结合TM基于感知来实现HDR视频的动态范围可分级编码。

SDR视频一般以8bit量化深度存储，动态范围固定不变。现有的视频可分级编码技术主要考虑了时间、空间和质量上的可分级性，以满足用户对不同帧率、图像分辨率和图像质量等级调整的需求。2014年10月，视频编码联合协作小组(Joint Collaborative Teamon Video Coding,JCT-VC)在高性能视频编码(High Efficiency Video Coding,HEVC)标准基础上，发布了可分级视频编码(Scalable High Efficiency Video Coding,SHVC)标准。主要对可分级编码特有编码工具、解码过程进行了改进，其中“Scalable Main”和“Scalable Main10”档次分别实现了SDR视频和HDR视频在时空及质量上的可分级编码。2015年2月，为了提高SHVC对HDR 视频的压缩性能，动态图像专家组(Moving PictureExperts Group,MPEG)发起了技术征求稿 (Call for Evidence,CfE)，希望通过扩展HEVC标准、添加新技术以实现HDR和宽色域(Wide Color Gamut,WCG)视频的高效编码。在HDR视频发展和推广过程中，相关标准制定方近年来也对HDR视频相关技术做了诸多优化性研究。

尽管现有HEVC的扩展版本能对HDR视频进行编码，但其只能单一地编码固定动态范围的视频，在动态范围可分级性方面具有很大的局限性，且没有考虑到显示终端的TM过程在编码过程中的影响。为此，一些学者也提出了HDR视频编码的新方案。Rusanovskyy等提出了采用动态范围调整(Dynamic Range Adjustment,DRA)后向兼容编码方式对HDR视频进行编码，与非后向兼容编码方式相比，其性能有所提升；Mir等提出了双层后向兼容HDR视频编码的改进方案，并与单层HLG性能进行比较。但现有的后向兼容编码方式仍存在不足，它们只能满足高低两种动态范围用户的需求，未能实现不同动态范围级视频的联合编码。考虑到MDR用户显示设备特性和视觉感知特性，还需要结合TM和人眼感知来实现用户端显示设备友好兼容HEVC标准的高效HDR视频编码。此外，现在市场上已有8bit、10bit、12 bit不同动态范围的显示设备，未来还会出现更高动态范围的HDR显示设备。因此，为了实现面向MDR用户显示终端的HDR视频编码传输，并兼容HEVC标准，研究结合TM的HDR 视频动态范围可分级编码方法是一个满足MDR用户HDR视频流服务需求的有效途径。

发明内容

本发明所要解决的技术问题是提供一种基于感知的高动态范围视频动态范围可分级编码方法，该方法在考虑了MDR用户显示设备特性和视觉感知特性的同时，结合了TM和人眼感知，并兼容HEVC标准，从而实现HDR视频不同动态范围级的联合编码。

本发明所采用的技术方案是，一种基于感知的高动态范围视频动态范围可分级编码方法，该方法包括以下步骤：

①、将输入的HDR视频经过基于感知量化(PQ)的转换处理，获得12bit量化深度的HDR 视频序列；

②、通过建立一种基于色调映射的动态范围可分级的模型(TM-DRSM)，将一个HDR视频帧分解为一个SDR基本帧和多个残差信号帧(RSFs)，残差信号帧能表示相邻两个动态范围级之间的差异信息，同时记录原始残差信号帧的最大、最小值；

③、结合HDR视频内容特性和人眼感知特性，对HDR视频内容进行提取；

④、结合提取的视频内容对残差信号帧进行感知滤波处理，去除残差信号帧中的不可感知冗余；

⑤、将处理后的残差信号帧序列与SDR序列分别通过统一的HEVC编码器，编码成动态范围分级的视频码流，同时编码传输RSFs的最大、最小值，以辅助解码端HDR视频重建；

⑥、在解码端通过TM-DRSM的逆过程，解码重建得到不同动态范围量化深度的SDR和 HDR视频，以实现HDR视频内容能适应在多用户端MDR显示设备上显示。

本发明的有益效果是：提出了一种基于感知的高动态范围视频动态范围可分级编码方法，该方法通过提出一种基于色调映射的动态范围可分集模型TM-DRSM，将HDR视频流分解成为一个标准动态范围SDR视频和多个残差信号帧RSFs序列，形成动态范围分级的码流，从而满足多用户MDR显示终端的需求；同时，结合SDR帧进行信息熵分析和内容分割两种方案对 RSFs进行感知滤波处理，提高RSFs的编码效率，进一步提高编码方法的效率。

作为优先，在步骤①中，基于感知量化(PQ)的转换处理的具体过程为：

①-1、将原始OpenEXR格式的HDR-RGB图像数据通过感知量化(PQ)的非线性函数转换到感知域的R’G’B’；

①-2、经由一个3×3的转换矩阵实现从R’G’B’到Y’CbCr的颜色空间转换；

①-3、将转换后得到的数据量化到比特深度12bit的整型数据，即：

其中，(Y’,Cb,Cr)表示经颜色空间转换得到的4:4:4浮点型数据，(DY’,DCb,DCr)表示量化后的整型数据，Clip3(·)表示两个方向限制(即0～2^b-1)的裁剪函数，219*2^b-8表示亮度尺度，2^b-4表示亮度信号偏移量，224*2^b-8表示色度尺度，2^b-1表示色差信号偏移量，b表示量化深度，Round(·)表示舍入取整函数；

①-4、将4:4:4的色度格式采样为4:2:0的色度格式，并转换得到4:2:0色度格式的12bit 的Y’CbCr视频序列，以匹配后续的HEVC编码系统。

作为优先，在步骤②中，建立一种基于色调映射的动态范围可分级的模型(TM-DRSM) 的具体步骤为：

②-1、将动态范围表示为12bit的视频序列V_HDR12经过一次色调映射操作，得到动态范围表示为10bit的视频序列V_HDR10，该过程可以表示为：V_HDR10(x,y)＝TM(V_HDR12(x,y))，继而再经过一次色调映射操作，可到标准动态范围8bit的视频序列V_SDR8，该过程可以表示为：V_SDR8(x,y)＝TM(V_HDR10(x,y))，其中，V_SDR8(x,y)和V_HDR10(x,y)分别表示8bit和10bit视频帧中坐标位置(x,y)处的像素值，TM(·)表示色调映射操作；

②-2、取V_HDR10，在编码端采用HEVC Main10扩展的配置对V_HDR10进行编码和解码，再经过一次逆色调映射操作，获得与V_HDR12相同动态范围级的V_HDR12’，即： V_HDR12'(x,y)＝iTM(V_HDR10(x,y))，其中，V_HDR12’(x,y)表示V_HDR10(x,y)经过逆色调映射后在 (x,y)处的像素值，iTM(·)表示逆色调映射操作，将V_HDR12与V_HDR12’作差得到RSF_2o，即： S_RSF2o＝V_HDR12(x,y)-V_HDR12'(x,y)；

②-3、取V_SDR8，在编码端采用HEVC基本配置对V_SDR8进行编码和解码，再经过一次逆色调映射操作，获得与VHDR10相同动态范围级的VHDR10’，即：V_HDR10'(x,y)＝iTM(V_SDR8(x,y))，其中，V_HDR10’(x,y)表示V_SDR8(x,y)经过逆色调映射后在(x,y)处的像素值，iTM(·)表示逆色调映射操作，将V_HDR10与V_HDR10’作差得到RSF₁o，即：S_RSF1o＝V_HDR10(x,y)-V_HDR10'(x,y)；

②-4、对RSF_1o和RSF_2o进行均匀量化处理，量化深度与SDR视频保持一致，从而得到2个残差信号帧，即RSF₁和RSF₂，S_RSF1＝Quant(Norm(S_RSF1o))， S_RSF2＝Quant(Norm(S_RSF2o))，其中，S_RSF1、S_RSF2分别表示8bit到10bit的RSF₁和10bit 到12bit的RSF₂，Norm(·)表示归一化处理，即将初始残差信号帧RSFso中的任意数值转化为[0,1]之间的归一化数据，Quant(·)表示均匀量化过程，即对归一化的残差数据进一步量化到可进行普通编码的数据范围，即8bit位深。

作为优先，在步骤③中，对HDR视频内容进行提取的方法为：基于信息熵计算的细节内容提取法，或者基于K-means聚类的内容分割法。

作为优先，在步骤③中，采用基于信息熵计算的细节内容提取法对HDR视频内容进行提取的具体方法为：通过对整个视频帧分块的方式，计算各图像块的信息量，用熵值替代该图像块的中心像素值，并依次滑动图像块窗口，可形成该视频帧的信息熵图。在N*N (测试实验中取N＝65，因最大编码单元LCU＝64*64)的图像块中，有k个灰度级，其中第i(i∈0,…,k-1)级灰度出现的概率为P_i，则它所含的熵(信息量)为 I(i)＝P_ilog(1/P_i)＝-P_ilog(P_i)，整个图像块熵的计算为

在计算过程中，首行首列像素点为起始点的N*N图像块中，中心像素点位置存放该图像块的熵值，通过固定步长为p的窗口滑动，动态计算当前N*N图像块的熵，并存储生成 SDR视频内容的信息熵图模板。

作为优先，在步骤③中，采用基于K-means聚类的内容分割法对HDR视频内容进行提取的具体方法为：用K-means聚类的方法对SDR视频内容进行分簇，选取迭代5次以实现聚类稳定性，再通过形态学原理用圆盘型结构元素对聚类结果图进行膨胀，从而减少零碎图像块实现对SDR视频内容进行分割。

作为优先，步骤④中，结合视频内容对RSFs进行感知滤波处理的方法为：基于信息熵分析的自适应滤波处理法，或者基于内容分割的自适应滤波处理法。

作为优先，步骤④中，基于信息熵分析的自适应滤波处理法具体为：在设计自适应中值滤波器时，考虑上信息熵在视频内容各区域的数值大小，自适应调节滤波窗口，在平滑冗余噪声的同时保留动态范围级间差异信息，在图像块中将初始滤波窗口设置为3*3，即W_min＝3，其实际大小根据所在图像区域内的熵值大小自适应调整，即：

其中，W_min＝3表示初始窗口设置为3*3， W_max设置为19，H(i,j)表示以该像素点为中心的图像块的熵值，H_max表示该图像块邻域为N内的熵值最大值，H_min表示该图像块邻域为N内的熵值最小值。

作为优先，步骤④中，基于内容分割的自适应滤波处理法具体步骤为：(a)、设p_ij为(i, j)处的像素值，W_ij为当前滤波窗口半径大小，p_max、p_min和p_med分别为W_ij窗口中的灰度最大值、最小值和中值，W_max为预设的最大窗口半径，若p_min＜p_med＜p_max，则执行步骤(b)，否则增大窗口W_ij+＝2；若W_ij<W_max，则重复步骤(a)，否则输出p_ij；(b)、若 p_min＜p_ij＜p_max，则输出p_ij，否则输出p_med，其中，W_ij的初始值设为3。

作为优先，步骤⑥中，通过基于色调映射的动态范围可分级的模型(TM-DRSM)的逆过程进行HDR视频重建的具体步骤为：

⑥-1、面向8bit显示设备的SDR视频V_RSDR8，其由SDR视频码流HEVC解码器直接解码得到；

⑥-2、面向10bit和12bit显示设备的HDR视频V_RHDR10和V_RHDR12，V_RHDR10和V_RHDR12可由DRSM的逆过程重建得到，即

其中，V_RHDR10(x,y)和V_RHDR12(x,y)分别表示重建的10bit和12bit 视频帧中坐标位置(x,y)处的像素值，V_RSDR8(x,y)表示8bit的SDR解码视频帧在坐标位置(x,y) 处的像素值，若视频帧的分辨率为L*W，则{(x,y)|x＝0,1,2,…,L-1,y＝0,1,2,…,W-1}；Q_inv(p) 表示像素值p的反量化过程，b取8，p_max和p_min从SEI信息中获得。

附图说明

图1为本发明方法的实现框图；

图2为基于色调映射的动态范围可分级模型TM-DRSM示意图(以BalloonFestival序列第1帧为例)；

图3为解码重建过程示意图；

图4为实验采用的HDR视频测试序列图；

图5为SDR视频内容及其对应的信息熵模板图(以BalloonFestival序列第1帧为例)；

图5(a)为SDR视频内容图；

图5(b)为SDR视频的的信息熵图；

图6为基于K-means聚类的内容分割图；

图6(a)为序列BalloonFestival的SDR视频帧图；

图6(b)为序列BalloonFestival的聚类效果图；

图6(c)为序列BalloonFestival的内容分割图；

图6(d)为序列SunRise的SDR视频帧图；

图6(e)为序列SunRise的聚类效果图；

图6(f)为序列SunRise的内容分割图；

图6(g)为序列Market3的SDR视频帧图；

图6(h)为序列Market3的聚类效果图；

图6(i)为序列Market3的内容分割图；

图7为基于内容分割的自适应滤波处理示意图(以BalloonFestival序列第1帧为的RSF₁例)；

图7(a)为序列BalloonFestival视频内容的内容分割掩模图；

图7(b)为序列BalloonFestival的第一帧的RSF₁内容；

图7(c)为序列BalloonFestival的纹理复杂区域的自适应滤波处理图；

图7(d)为序列BalloonFestival的纹理平坦区域的自适应滤波处理图；

图8为两种感知滤波方案与HM-16.9平台相比HDR视频的率失真(R-D)曲线图；

图8(a)为序列BalloonFestival 10bit的率失真性能曲线对比图；

图8(b)为序列BalloonFestival 12bit的率失真性能曲线对比图；

图8(c)为序列SunRise 10bit的率失真性能曲线对比图；

图8(d)为序列SunRise 12bit的率失真性能曲线对比图；

图8(e)为序列Market3 10bit的率失真性能曲线对比图；

图8(f)为序列Market3 12bit的率失真性能曲线对比图。

具体实施方式

以下参照附图并结合具体实施方式来进一步描述发明，以令本领域技术人员参照说明书文字能够据以实施，本发明保护范围并不受限于该具体实施方式。

本发明涉及一种基于感知的高动态范围视频动态范围可分级编码方法，其将输入的HDR 视频经过基于感知量化(PQ)的转换处理，获得12bit量化深度的HDR视频序列，该格式与HEVC所能兼容的编码格式一致；然后，为了更好地满足MDR用户的需求，更贴近显示终端的特性，发挥多个RSFs的增强性，提出了一种基于色调映射的动态范围可分级的模型(TM-DRSM)，该模型可通过色调映射操作，将一个HDR视频帧分解成为一个SDR视频帧和多个RSFs；此外，为了提高RSFs的编码性能，结合HDR视频内容特性和人眼感知特性，根据SDR视频帧内容对RSFs进行了感知滤波处理，去除RSFs中的不可感知冗余，同时，将RSFs量化前的最大、最小值作为SEI进行编码传输，以辅助解码端HDR视频的重建；最后，在解码端解码动态范围分级的码流，再通过TM-DRSM 的逆过程，重建得到不同量化深度、且适应在多动态范围显示设备上显示的SDR视频和HDR视频。

图1为本发明的一种基于感知的高动态范围视频动态范围可分级编码方法总体实现框图，其具体实现步骤如下：

①、将输入的HDR视频经过基于PQ的转换处理，获得12bit量化深度的HDR视频序列，具体为：

①-1、将原始OpenEXR格式的HDR-RGB图像数据通过PQ的非线性函数转换到感知域的R’G’B’；

①-3、将转换后的数据量化到比特深度12bit的整型数据，

①-4、将4:4:4的色度格式下采样为4:2:0的色度格式，并转换得到4:2:0色度格式的12bit 的Y’CbCr视频序列，以匹配后续的HEVC编码系统。

②、通过建立一种基于色调映射的动态范围可分级的模型(TM-DRSM)，如图2所示，将一个HDR视频帧分解为一个SDR基本帧和多个残差信号帧(RSFs)，RSFs能表示相邻两个动态范围级之间的差异信息，同时记录原始RSFs的最大、最小值；建立TM-DRSM的具体步骤：

②-1、将动态范围表示为12bit的视频序列(V_HDR12)经过一次色调映射操作， V_HDR10(x,y)＝TM(V_HDR12(x,y))，得到动态范围表示为10bit的视频序列(V_HDR10)，继而再经过一次色调映射操作，V_SDR8(x,y)＝TM(V_HDR10(x,y))，可到标准动态范围8bit的视频序列 (V_SDR)，其中，V_SDR8(x,y)和V_HDR10(x,y)分别表示8bit和10bit视频帧中坐标位置(x,y) 处的像素值，TM(·)表示色调映射操作。；

②-2、取V_HDR10在编码端采用HEVC Main10扩展的配置进行编码和解码，再经过一次逆色调映射操作，V_HDR12'(x,y)＝iTM(V_HDR10(x,y))，获得与V_HDR12相同动态范围级的V_HDR12’，两者作差得到RSF_2o，S_RSF2o＝V_HDR12(x,y)-V_HDR12'(x,y)，其中，V_HDR12’(x,y)表示V_HDR10(x,y) 经过逆色调映射后在(x,y)处的像素值，iTM(·)表示逆色调映射操作；

②-3、取V_SDR在编码端采用HEVC基本配置进行编码和解码，再经过一次逆色调映射操作，V_HDR10'(x,y)＝iTM(V_SDR8(x,y))，获得与V_HDR10相同动态范围级的V_HDR10’，两者作差得到RSF_1o，S_RSF1o＝V_HDR10(x,y)-V_HDR10'(x,y)，其中，V_HDR10’(x,y)表示V_SDR8(x,y)经过逆色调映射后在(x,y)处的像素值，iTM(·)表示逆色调映射操作；

②-4、对RSF_1o和RSF_2o进行均匀量化处理，量化深度与SDR视频保持一致，从而得到2个残差信号帧，即RSF₁和RSF₂，S_RSF1＝Quant(Norm(S_RSF1o))， S_RSF2＝Quant(Norm(S_RSF2o))，其中，S_RSF1、S_RSF2分别表示8bit到10bit的RSF₁和10bit 到12bit的RSF₂，Norm(·)表示归一化处理，即将初始残差信号帧RSFso中的任意数值转化为[0,1]之间的归一化数据；Quant(·)表示均匀量化过程，即对归一化的残差数据进一步量化到可进行普通编码的数据范围，即8bit位深。

③、结合HDR视频内容特性和人眼感知特性，提出了两种方案能够对HDR视频内容进行提取，方案一为：基于信息熵计算的细节内容提取法，通过对整个视频帧分块的方式，计算各图像块的信息量，用熵值替代该图像块的中心像素值，并依次滑动图像块窗口，可形成该视频帧的信息熵图。在N*N(测试实验中取N＝65，因最大编码单元 LCU＝64*64)的图像块中，有k个灰度级，其中第i(i∈0,…,k-1)级灰度出现的概率为P_i，则它所含的熵(信息量)为I(i)＝P_ilog(1/P_i)＝-P_ilog(P_i)，整个图像块熵的计算为

在计算过程中，首行首列像素点为起始点的N*N图像块中，中心像素点位置存放该图像块的熵值，通过固定步长为p的窗口滑动，动态计算当前N*N图像块的熵，并存储生成SDR视频内容的信息熵图模板；方案二为：基于 K-means聚类的内容分割，用K-means聚类的方法对SDR视频内容进行分簇，选取迭代5次以实现聚类稳定性，再通过形态学原理用圆盘型结构元素对聚类结果图进行膨胀，从而减少零碎图像块实现对SDR视频内容进行分割；

④、结合视频内容对RSFs进行感知滤波处理，提出了两种方案能够去除RSFs中的不可感知冗余，方案一为：基于信息熵分析的自适应滤波处理，自适应中值滤波器在设计时考虑了信息熵在视频内容各区域的数值大小，自适应调节滤波窗口，在平滑冗余噪声的同时保留动态范围级间差异信息。在图像块中将初始滤波窗口设置为3*3，即W_min＝3，其实际大小根据所在图像区域内的熵值大小自适应调整，

其中， W_min＝3表示初始窗口设置为3*3，W_max设置为19，H(i,j)表示以该像素点为中心的图像块的熵值，H_max表示该图像块邻域为N内的熵值最大值，H_min表示该图像块邻域为N 内的熵值最小值；方案二为：基于内容分割的自适应滤波处理，设p_ij为(i,j)处的像素值， W_ij为当前滤波窗口半径大小，p_max、p_min和p_med分别为W_ij窗口中的灰度最大值、最小值和中值，W_max为预设的最大窗口半径。其算法基本步骤如下：(a)若p_min＜p_med＜p_max，则执行(b)，否则增大窗口W_ij+＝2；若W_ij<W_max，则重复(a)，否则输出p_ij；(b)若 p_min＜p_ij＜p_max，则输出p_ij，否则输出p_med，其中，W_ij的初始值设为3；

⑤、将处理后的RSFs序列与SDR序列分别通过统一的HEVC编码器，编码成动态范围分级的视频码流，同时编码传输RSFs的最大、最小值，以辅助解码端HDR视频重建；

⑥、如图3所示，在解码端通过TM-DRSM的逆过程，解码重建得到不同动态范围量化深度的SDR和HDR视频，以实现HDR视频内容能适应在多用户端MDR显示设备上显示；

⑥-1、面向8bit显示设备的SDR视频V_RSDR8，由SDR视频码流HEVC解码器直接解码得到；

⑥-2、面向10bit和12bit显示设备的HDR视频V_RHDR10和V_RHDR12，可由DRSM的逆过程重建得到，即：

其中，V_RHDR10(x,y)和V_RHDR12(x,y)分别表示重建的10bit和12bit视频帧中坐标位置(x,y)处的像素值，V_RSDR8(x,y)表示8bit的SDR解码视频帧在坐标位置(x,y)处的像素值，若视频帧的分辨率为L*W，则{(x,y)|x＝0,1,2,…,L-1,y＝0,1,2,…,W-1}；Q_inv(p)表示像素值p的反量化过程，b取8，p_max和p_min从SEI信息中获得。

图2中，TM-DRSM中涉及到的动态范围压缩与扩展方法，均采用由JCT-VC提供，并已编入HDRTools v0.13工具包的色调映射与逆色调映射曲线gamma2.6。

以下为对本发明的编码方法进行测试，以证明本发明的编码方法的有效性和可行性。测试所采用的HDR视频测试序列均来自于公认的测试数据库，由MPEG提供，分别是BalloonFestival、SunRise和Market3，分辨率大小为1920×1080，原始帧图像格式为OpenEXR，其首帧内容如图4所示。

图5为SDR视频内容及其对应的信息熵模板图(以BalloonFestival序列第1帧为例)。在计算过程中，首行首列像素点为起始点的N*N图像块中，中心像素点位置存放该图像块的熵值，通过固定步长为p的窗口滑动，动态计算当前N*N图像块的熵，并存储，生成SDR视频内容的信息熵图模板。在模板图中，可清晰记录视频内容中的结构、纹理等细节信息，信息熵越大表示纹理越丰富，即在滤波处理时的窗口设置需更小。

图6(a)～(i)为基于K-means聚类的内容分割图。图(a)(d)(g)分别为BalloonFestival序列、 SunRise序列和Market3序列的SDR视频内容，图(b)(e)(h)分别为图(a)(d)(g)的聚类分割标签图，其中白色区域表示纹理复杂区域，黑色区域表示纹理相对平坦区域，图(c)(f)(i) 分别为图(b)(e)(h)经形态学处理后的分区掩模图，用于后续RSFs感知滤波处理。

图7为基于内容分割的自适应滤波处理示意图(以BalloonFestival序列第1帧的RSF₁为例)。图(a)为SDR视频内容的内容分割掩模图，图(b)为BalloonFestival序列第一帧的RSF₁内容，图(c)为纹理复杂区域的滤波处理图，图(d)为纹理平坦区域的滤波处理图。

表1为所提出方法与原始参考平台比较的BD-rate结果。其中，Proposed_enp表示基于信息熵自适应滤波处理的方法所重建10bit和12bit HDR视频的结果，Proposed_km表示基于内容分割自适应滤波处理方法的结果。Proposed_enp方案中，编码重建10bit和12bit HDR视频的编码性能与原始参考平台相比，分别节省了22.70％和26.70％，平均节省 24.70％；Proposed_km方案中，编码重建10bit和12bit HDR视频的编码性能与原始参考平台相比，分别节省了31.17％和33.77％，平均节省32.47％。

表1

图8(a)～(f)为根据HDR-VDP-2.2质量指标和码率消耗绘制的率失真曲线。这里，将 HM-16.9直接按不同级别配置编码的方法记为Pro1，对TM-DRSM分级产生的所有序列直接编码的方法记为Pro2，基于信息熵计算的自适应滤波处理方法记为Pro3，基于图像分割的自适应滤波处理方法记为Pro4。虽然Pro1的总体码率消耗少，但其重建HDR视频的质量较低，总体率失真性能劣于其他方案，且其操作繁琐，不能实现MDR用户显示设备的友好兼容性；虽然Pro2的重建结果更接近原始HDR视频，但其码率消耗较大，在编码过程中存在较大的冗余；Pro3与Pro4两种方案的率失真性能差不多，Pro4相对更优。

Claims

1.一种基于感知的高动态范围视频动态范围可分级编码方法，其特征在于，该方法包括以下步骤：

①、将输入的HDR视频经过基于感知量化的转换处理，获得12bit量化深度的HDR视频序列；

②、通过建立一种基于色调映射的动态范围可分级的模型TM-DRSM，将一个HDR视频帧分解为一个SDR基本帧和多个残差信号帧RSFs，RSFs能表示相邻两个动态范围级之间的差异信息，同时记录原始残差信号帧的最大、最小值；

建立TM-DRSM的具体步骤为：

②-2、取V_HDR10，在编码端采用HEVC Main10扩展的配置对V_HDR10进行编码和解码，再经过一次逆色调映射操作，获得与V_HDR12相同动态范围级的V_HDR12’，即：V_HDR12'(x,y)＝iTM(V_HDR10(x,y))，其中，V_HDR12’(x,y)表示V_HDR10(x,y)经过逆色调映射后在(x,y)处的像素值，iTM(·)表示逆色调映射操作，将V_HDR12与V_HDR12’作差得到RSF_2o，即：S_RSF2o＝V_HDR12(x,y)-V_HDR12'(x,y)；

②-3、取V_SDR8，在编码端采用HEVC基本配置对V_SDR8进行编码和解码，再经过一次逆色调映射操作，获得与V_HDR10相同动态范围级的V_HDR10’，即：V_HDR10'(x,y)＝iTM(V_SDR8(x,y))，其中，V_HDR10’(x,y)表示V_SDR8(x,y)经过逆色调映射后在(x,y)处的像素值，iTM(·)表示逆色调映射操作，将V_HDR10与V_HDR10’作差得到RSF_1o，即：S_RSF1o＝V_HDR10(x,y)-V_HDR10'(x,y)；

②-4、对RSF_1o和RSF_2o进行均匀量化处理，量化深度与SDR视频保持一致，从而得到2个残差信号帧，即RSF₁和RSF₂，S_RSF1＝Quant(Norm(S_RSF1o))，S_RSF2＝Quant(Norm(S_RSF2o))，其中，S_RSF1、S_RSF2分别表示8bit到10bit的RSF₁和10bit到12bit的RSF₂，Norm(·)表示归一化处理，即将初始残差信号帧RSFs_o中的任意数值转化为[0,1]之间的归一化数据，Quant(·)表示均匀量化过程，即对归一化的残差数据进一步量化到可进行普通编码的数据范围，即8bit位深；

③、结合HDR视频内容特性和人眼感知特性，对HDR视频内容进行提取，对HDR视频内容进行提取的方法包括基于信息熵计算的细节内容提取法，或者基于K-means聚类的内容分割法，采用基于信息熵计算的细节内容提取法对HDR视频内容进行提取的具体方法为：通过对整个视频帧分块的方式，计算各图像块的信息量，用熵值替代该图像块的中心像素值，并依次滑动图像块窗口，可形成该视频帧的信息熵图。在N*N的图像块中，有k个灰度级，其中第i(i∈0,…,k-1)级灰度出现的概率为P_i，则它所含的熵为I(i)＝P_ilog(1/P_i)＝-P_ilog(P_i)，整个图像块熵的计算为

在计算过程中，首行首列像素点为起始点的N*N图像块中，中心像素点位置存放该图像块的熵值，通过固定步长为p的窗口滑动，动态计算当前N*N图像块的熵，并存储生成SDR视频内容的信息熵图模板；

④、结合提取的视频内容对RSFs进行感知滤波处理，去除RSFs中的不可感知冗余；结合视频内容对RSFs进行感知滤波处理的方法为：基于信息熵分析的自适应滤波处理法，或者基于内容分割的自适应滤波处理法；所述的基于信息熵分析的自适应滤波处理法具体为：在设计自适应中值滤波器时，考虑上信息熵在视频内容各区域的数值大小，自适应调节滤波窗口，在平滑冗余噪声的同时保留动态范围级间差异信息，在图像块中将初始滤波窗口设置为3*3，即W_min＝3，其实际大小根据所在图像区域内的熵值大小自适应调整，

其中，W_min＝3表示初始窗口设置为3*3，W_max设置为19，H(i,j)表示以(i,j)处的像素点为中心的图像块的熵值，H_max表示该图像块邻域为N内的熵值最大值，H_min表示该图像块邻域为N内的熵值最小值；所述的基于内容分割的自适应滤波处理法具体步骤为：(a)、设p_ij为(i,j)处的像素值，W_ij为当前滤波窗口半径大小，p_max、p_min和p_med分别为W_ij窗口中的灰度最大值、最小值和中值，W_max为预设的最大窗口半径，若p_min＜p_med＜p_max，则执行步骤(b)，否则增大窗口W_ij+＝2；若W_ij<W_max，则重复步骤(a)，否则输出p_ij；(b)、若p_min＜p_ij＜p_max，则输出p_ij，否则输出p_med，其中，W_ij的初始值设为3。

⑤、将处理后的RSFs序列与SDR序列分别通过统一的HEVC编码器，编码成动态范围分级的视频码流，同时编码传输残差信号帧的最大、最小值，以辅助解码端HDR视频重建；

⑥、在解码端通过TM-DRSM的逆过程，解码重建得到不同动态范围量化深度的SDR和HDR视频，以实现HDR视频内容能适应在多用户端MDR显示设备上显示。

2.根据权利要求1所述的一种基于感知的高动态范围视频动态范围可分级编码方法，其特征在于，在步骤①中，基于感知量化的转换处理的具体过程为：

①-1、将原始OpenEXR格式的HDR-RGB图像数据通过感知量化的非线性函数转换到感知域的R’G’B’；

①-4、将4:4:4的色度格式采样为4:2:0的色度格式，并转换得到4:2:0色度格式的12bit的Y’CbCr视频序列，以匹配后续的HEVC编码系统。

3.根据权利要求1所述的一种基于感知的高动态范围视频动态范围可分级编码方法，其特征在于，所述的采用基于K-means聚类的内容分割法对HDR视频内容进行提取的具体方法为：用K-means聚类的方法对SDR视频内容进行分簇，选取迭代5次以实现聚类稳定性，再通过形态学原理用圆盘型结构元素对聚类结果图进行膨胀，从而减少零碎图像块实现对SDR视频内容进行分割。

4.根据权利要求1所述的一种基于感知的高动态范围视频动态范围可分级编码方法，其特征在于，步骤⑥中，通过TM-DRSM的逆过程进行HDR视频重建的具体步骤为：