CN113784175B - 一种hdr视频转换方法、装置、设备及计算机存储介质 - Google Patents
一种hdr视频转换方法、装置、设备及计算机存储介质 Download PDFInfo
- Publication number
- CN113784175B CN113784175B CN202110883118.3A CN202110883118A CN113784175B CN 113784175 B CN113784175 B CN 113784175B CN 202110883118 A CN202110883118 A CN 202110883118A CN 113784175 B CN113784175 B CN 113784175B
- Authority
- CN
- China
- Prior art keywords
- frame
- video
- sdr
- hdr video
- hdr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 36
- 238000012545 processing Methods 0.000 claims abstract description 53
- 230000006870 function Effects 0.000 claims abstract description 44
- 230000004913 activation Effects 0.000 claims abstract description 27
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 238000004590 computer program Methods 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 17
- 230000000149 penetrating effect Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 abstract description 10
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000003062 neural network model Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
- H04N21/234309—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
-
- G06T5/92—
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440218—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/01—Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20208—High dynamic range [HDR] image processing
Abstract
本申请提供一种HDR视频转换方法、装置、设备及计算机存储介质。涉及视频处理技术领域,方法包括:对待处理的SDR视频进行抽帧处理,得到SDR视频中包含的J帧SDR视频帧,J为大于1的整数;分别将J帧SDR视频帧输入已训练的全卷积模型中处理,输出J帧HDR视频帧,全卷积模型包括N个卷积核大小为1×1的卷积层,N个卷积层中穿插设置有N‑1个激活函数,N为大于等于3的整数;将J帧HDR视频帧进行合帧处理,得到与SDR视频对应的HDR视频。本申请使用的模型结构简单且参数量相对较少,能够有效降低HDR视频转换任务的计算成本,提高计算效率,加快视频处理的速度。
Description
技术领域
本申请属于视频处理技术领域,尤其涉及一种HDR视频转换方法、装置、设备及计算机存储介质。
背景技术
随着高动态范围(High Dynamic Range,HDR)拍摄和视频显示技术的成熟,HDR视频也逐渐发展起来。相较于传统的标准动态范围(Standard Dynamic Range,SDR)视频,HDR视频具有更大的动态范围、更宽广的色域,能够展现出更高的对比度和更加丰富的色彩,因此,在许多消费级超高清(Ultra-high definition,UHD)电视上设置了播放HDR视频的功能用于HDR视频的播放。但是,目前能够拍摄真正符合HDR视频标准的拍摄设备尚未普及,因此,如何将拍摄的大量SDR视频转换为HDR视频,成为目前的热门问题。
目前,一般采用基于神经网络的方法或HDR图片转换算法将SDR视频转换为HDR视频。但已提出的神经网络模型的复杂度较高,计算量较大。HDR图片转换方法需要先把视频帧从视频编码格式转换为图像编码格式,然后对图像编码格式的数据进行HDR转换后重新转回视频编码格式,得到HDR视频,处理方法也较为复杂。
发明内容
本申请实施例提供一种HDR视频转换方法、装置、终端设备及存储介质,可以解决HDR视频转换过程中方法复杂、计算成本高的问题。
第一方面,本申请实施例提供了一种HDR视频转换方法,该方法包括:对待处理的SDR视频进行抽帧处理,得到所述SDR视频中包含的J帧SDR视频帧,J为大于1的整数;
分别将J帧所述SDR视频帧输入已训练的全卷积模型中处理,输出J帧HDR视频帧,所述全卷积模型包括N个卷积核大小为1×1的卷积层,N个所述卷积层中穿插设置有N-1个激活函数,N为大于等于3的整数;
将所述J帧HDR视频帧进行合帧处理,得到与所述SDR视频对应的HDR视频。
在本申请提供的HDR视频转换方法中,使用本申请提供的全卷积模型实现HDR视频转换任务,由于全卷积模型由卷积核大小为1×1的N个卷积层及穿插设置的N-1个激活函数构成,模型结构简单且使用的参数量相对较少,能够有效降低HDR视频转换任务的计算成本,提高计算效率,加快视频处理的速度。
可选地,3≤N≤10。
可选地,所述激活函数为非线性激活函数。
可选地,对待处理的SDR视频进行抽帧处理,得到所述SDR视频中包含的J帧SDR视频帧,包括:采用抽帧工具对所述SDR视频帧进行抽帧处理,得到所述J帧SDR视频帧;
所述将所述J帧HDR视频帧进行合帧处理,得到与所述SDR视频对应的HDR视频,包括:
采用所述抽帧工具对所述J帧HDR视频帧进行合帧处理,得到与所述SDR视频对应的HDR视频。
可选地,所述全卷积模型的训练方式包括:
利用预设的训练集和预设的损失函数对初始的全卷积模型进行迭代训练,得到所述全卷积模型;
所述训练集包括多个SDR视频帧样本以及与所述SDR视频帧样本对应的HDR视频帧样本。
所述预设的损失函数用于描述预测的HDR视频帧和所述HDR视频帧样本之间的L2损失,所述预测的HDR视频帧为所述全卷积模型对所述SDR视频帧样本进行处理得到的。
第二方面,本申请实施例提供了一种HDR视频转换装置,该装置包括:抽帧单元,用于对待处理的SDR视频进行抽帧处理,得到所述SDR视频中包含的J帧SDR视频帧,J为大于1的整数;
处理单元,用于分别将J帧所述SDR视频帧输入已训练的全卷积模型中处理,输出J帧HDR视频帧,所述全卷积模型包括N个卷积核大小为1×1的卷积层,N个所述卷积层中穿插设置有N-1个激活函数,N为大于或者等于3的正整数;
合帧单元,用于将所述J帧HDR视频帧进行合帧处理,得到与所述SDR视频对应的HDR视频。
可选地,3≤N≤10。
可选地,所述激活函数为非线性激活函数。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述第一方面中任一项的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项的方法。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面和第一方面的各可能的实施方式所带来的有益效果的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的HDR和SDR色域表示范围的示意图;
图2是本申请一实施例提供的一种HDR视频转换方法的一个实施例的流程图;
图3是本申请一实施例提供的HDR视频转换的全卷积模型的架构图;
图4是本申请一实施例提供的一种HDR视频转换装置的示意图;
图5是本申请一实施例提供的一种终端设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
相较于标准动态范围(Standard Dynamic Range,SDR),高动态范围(HighDynamic Range,HDR)的动态范围更大且色域范围具有更宽广,由于HDR的色域广、动态范围大,因此,HDR视频能够展现出对比度更高和色彩更加丰富的视频。
如图1所示为HDR和SDR色域表示范围的示意图,其中,BT.709和BT.2020都是ITU(国际电信联盟)发布的电视参数标准,DCI-P3是美国电影工业为数字电影院所制定的色域标准,多用来测试投影机所能覆盖的色彩范围。就色域范围来讲,在图1所示的DCI-P3、BT.709和BT.2020中范围最大的是BT.2020,DCI-P3的色域范围次之,BT.709所表示的色域范围最小。
通常SDR视频采用BT.709色域,而HDR视频采用的是色域更为宽广的BT.2020色域,在实际应用HDR视频也会采用DCI-P3色域。就同一视频而言,无论HDR视频采用BT.2020色域还是DCI-P3色域,HDR视频展现出对比度和色彩都要优于SDR视频。
除此之外,在编码格式上,SDR视频通常采用的是8比特编码,而HDR视频采用的是16比特编码或者10比特编码的编码格式,编码格式所采用的比特位越大,视频呈现出来的对比度越高、色域范围广。
随着HDR视频的拍摄及显示技术的逐渐成熟,越来越多的播放设备支持HDR视频的播放。因此,如何将SDR视频转换为HDR视频,成为当前的热门问题。
目前,采用基于神经网络的方法或HDR图片转换算法将SDR视频转换为HDR视频。但已提出的神经网络模型的复杂度较高,计算量较大。例如,常使用生成对抗网络实现SDR视频转换HDR视频,其中生成对抗网络使用的网络参数达到了1.06M(其中,M是数量级“百万”的缩写符号),有的网络参数甚至达到了2.87M,网络参数越多,设计的网络越复杂,计算量越大。而HDR图片转换方法需要先把视频帧从视频编码格式转换为图像编码格式,然后对图像编码格式的数据进行HDR转换后重新转回视频编码格式,得到HDR视频,处理方法也较为复杂。
针对现有的HDR视频转换方法复杂、计算成本高的问题,本申请提供一种全卷积模型,能够实现HDR视频转换任务。其中,全卷积模型是由卷积核大小为1×1的N个卷积层及穿插设置的N-1个激活函数构成,模型结构简单且使用的参数量相对较少,能够有效降低HDR视频转换任务的计算成本,提高计算效率,加快视频处理的速度。
一般来说,卷积核大小为1×1的卷积层一般在实现特定功能的复杂的神经网络模型中用作升/降维功能,即增加或者减少特征图的通道数,从而提升该神经网络模型的计算效率。而在本申请中,经试验发现,通过将卷积核大小为1×1的卷积层与激活函数进行简单的叠加,构建的全卷积模型,能够实现HDR视频转换任务,并且取得良好的转换效果。
下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
参见图2,为本申请提供的一种HDR视频转换方法的一个实施例的流程图。该方法的执行主体可以是视频处理设备。其中,视频处理设备可以是智能手机、平板电脑、摄像机等移动终端设备,还可以是台式电脑、机器人、服务器等能够处理视频数据的终端设备。如图2所示,该方法包括:
S101,对待处理的SDR视频进行抽帧处理,得到SDR视频中包含的J帧SDR视频帧,J为大于3的整数。
其中,待处理的SDR视频可以是拍摄、下载或者是从本地存储区域中读取的完整的视频,也可以是从完成的视频中截取的SDR视频片段。
示例性的,可以采用抽帧工具对待处理的SDR视频进行抽帧。例如,采用FFmpeg(Fast Forward mpeg)工具对待处理的SDR视频进行抽帧。
S102,分别将J帧SDR视频帧输入已训练的全卷积模型中处理,输出J帧HDR视频帧,全卷积模型包括N个卷积核大小为1×1的卷积层,N个卷积层中穿插设置有N-1个激活函数,N为大于等于3的整数。
其中,激活函数可以是非线性激活函数,能够增加全卷积模型的非线拟合能力,提高全卷积模型的灵活度。示例性的,该激活函数可以是ReLU激活函数。
N的设置可以根据实际精度要求来设置。
示例性的,设置N=3,如图3所示,全卷积模型包括3层卷积核大小为1×1的卷积层及穿插设置在3层卷积层中的2个ReLU激活函数。分别将K帧SDR视频输入如图3所示的全卷积模型进行处理,即可得到对应的K帧HDR视频帧。
下面结合如下表1,对图3所示全卷积模型的性能进行说明:
表1
模型 | Params | PSNR | SSIM | SR-SIM | ΔE<sub>ITP</sub> | HDR-VDP3 |
ResNet | 1.37M | 37.32 | 0.9720 | 0.9950 | 9.02 | 8.391 |
Pixel2Pixel | 11.38M | 25.80 | 0.8777 | 0.9871 | 44.25 | 7.136 |
CycleGAN | 11.38M | 21.33 | 0.8496 | 0.9595 | 77.74 | 6.941 |
HDRNet | 482K | 35.73 | 0.9664 | 0.9957 | 11.52 | 8.462 |
CSRNet | 36K | 35.04 | 0.9625 | 0.9955 | 14.28 | 8.400 |
Ada-3DLUT | 594K | 36.22 | 0.9658 | 0.9967 | 10.89 | 8.423 |
Deep SR-ITM | 2.87M | 37.10 | 0.9686 | 0.9950 | 9.24 | 8.233 |
JSI-GAN | 1.06M | 37.01 | 0.9694 | 0.9928 | 9.36 | 8.169 |
全卷积模型 | 5K | 36.14 | 0.9643 | 0.9961 | 10.43 | 8.035 |
表1中,残差网络(ResNet)、环形生成对抗网络(CycleGAN)和像素到像素生成网络(Pixel 2Pixel)是用于图像到图像的转换(image-to-image traslation)的算法模型。高动态范围网络(High Dynamic Range Net,HDRNet)、条件序列图像修饰网络(ConditionalSequential Retouching Network,CSRNet)和自适应3D查找表(Adaptive 3D lookuptable。Ada-3DLUT)网络是用于图像修饰(photo retouching)的算法模型。深度超分辨联合逆色调映射方法(Deep super-resolution inverse tone-mapping,Deep SR-ITM)和超分辨联合逆色调映射生成对抗网络(GAN-Based Joint Super-Resolution and InverseTone-Mapping,JSI-GAN)是用于SDR视频到HDR视频转换的算法模型。
从表1可以看出,当N=3时,激活函数采用ReLU激活函数时,本申请提供的全卷积网络模型的参数量不到5K(其中,K是数量级“千”的缩写符号)个,在参数量上远小于表1中列举的其他算法模型。因此,具备高效的处理效率。
且全卷积网络模型在峰值信噪比(Peak Signal to Noise Ratio,PSNR)、结构相似性度量指标(structural similarity index measure,SSIM)、基于光谱残差的相似度度量指标(spectral residual based similarity index measure,SR-SIM)、色彩保真度ΔEITP、高动态范围可见差异预测(High Dynamic Range Visible Difference Predictor,HDR-VDP3)等性能指标上也具备良好的实验效果。
当然,N具体可以取值在3到10之间。例如,当N=5时,全卷积模型的参数量不到13K,在表1所列举的算法模型中,在参数量上通样具备优势,属于高效的模型。且当N=5时,全卷积模型的PSNR=36.15,SSIM=0.9642,SR_SIM=0.9963,ΔEITP=10.43,HDR-VDP=38.032。可见,在其他性能,也具备良好的实验效果。
值得说明的是,本实施例中全卷积模型的训练方式包括:利用预设的训练集和预设的损失函数对初始的全卷积模型进行迭代训练,得到上述全卷积模型;其中,训练集包括多个SDR视频帧样本以及与上述SDR视频帧样本对应的HDR视频帧样本。示例性的,SDR视频样本及其对应的HDR视频样本,可以从公开的视频网站中获取SDR视频样本及对应的HDR视频样本。也可以对同一RAW数据格式的视频分别进行SDR和HDR处理,得到SDR视频样本及其对应的HDR视频样本。还可以分别利用SDR相机和HDR相机在同一场景下,分别拍摄对应的SDR视频样本和HDR视频样本。
在获取到SDR视频样本及其对应的HDR视频样本之后,分别对SDR视频样本及其对应的HDR视频样本进行抽帧处理,得到多个SDR视频帧样本以及在时序上和空间上与多个SDR视频帧样本一一对应的HDR视频帧样本。
本实施例中采用L2作为全卷积模型训练的预设损失函数。预设的损失函数用于描述预测的HDR视频帧和HDR视频帧样本之间的损失,其中预测的HDR视频帧为全卷积模型对SDR视频帧样本进行处理得到的。
S103,将J帧HDR视频帧进行合帧处理,得到与SDR视频对应的HDR视频。
值得说明的是,经上述全卷积模型处理后得到的J帧HDR视频帧是与从待处理的SDR视频中提取的J帧SDR格式的图像数据对应的HDR格式的图像数据,由于HDR视频为了能够适配更高对比度和色域范围,其采用的是16比特编码,因此,经全卷积模型处理后输出的J帧HDR视频帧是16比特编码或者10比特编码的图像数据,相较于8比特编码的图像数据,16比特编码或者10比特编码的图像数据显示的图像数据更亮。
应该理解的,可以采用抽帧工具对经HDR视频转换模型处理后得到的J帧HDR视频帧进行合帧,例如,采用FFmpeg工具对J帧HDR视频帧进行合帧。
在执行HDR视频转任务时,现有的模型往往在利用抽帧工具完成抽帧之后,需要将抽帧得到的SDR视频帧转换成8比特YUV编码帧,才能进行处理。处理后得到的YUV序列文件也需要进行格式转换,得到HDR视频。
而本申请实施例提供全卷积神经网络,利用抽帧工具抽帧得到SDR视频帧可以直接输入全卷积神经网络中处理,得到的HDR视频帧也可以直接合帧得到HDR视频。与现有的模型,本申请提供的方法无需多次将待处理的SDR视频转换成其他格式的数据,相应的,经神经网络模型处理后,也不需要多次将其他格式的数据转换成HDR数据,降低了方法的复杂度。
基于同一发明构思,作为对上述方法的实现,本申请实施例提供了一种HDR视频转换装置,该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。
如图4所示,本申请提供一种HDR视频转换装置,上述装置200包括:
抽帧单元201,用于对待处理的SDR视频进行抽帧处理,得到所述SDR视频中包含的J帧SDR视频帧,J为大于1的整数;
处理单元202,用于分别将J帧SDR视频帧输入已训练的全卷积模型中处理,输出J帧HDR视频帧,全卷积模型包括N个卷积核大小为1×1的卷积层,N个卷积层中穿插设置有N-1个激活函数,N为大于或者等于3的正整数。
合帧单元203,用于将J帧HDR视频帧进行合帧处理,得到与SDR视频对应的HDR视频。
可选地,3≤N≤10。
可选地,激活函数为非线性激活函数。
可选地,对待处理的SDR视频进行抽帧处理,得到SDR视频中包含的J帧SDR视频帧,包括:采用FFmpeg工具对SDR视频帧进行抽帧处理,得到J帧SDR视频帧;
将J帧HDR视频帧进行合帧处理,得到与SDR视频对应的HDR视频,包括:采用FFmpeg工具对J帧HDR视频帧进行合帧处理,得到与SDR视频对应的HDR视频。
可选地,全卷积模型的训练方式包括:
利用预设的训练集和预设的损失函数对初始的全卷积模型进行迭代训练,得到全卷积模型;
训练集包括多个SDR视频帧样本以及与SDR视频帧样本对应的HDR视频帧样本。
预设的损失函数用于描述预测的HDR视频帧和HDR视频帧样本之间的L2损失,预测的HDR视频帧为全卷积模型对SDR视频帧样本进行处理得到的。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
基于同一发明构思,本申请实施例还提供了一种终端设备。图5为本申请实施例提供的终端设备的示意图,如图5所示,本实施例提供的终端设备300包括:存储器302和处理器301,存储器302用于存储计算机程序;处理器301用于在调用计算机程序时执行上述方法实施例所述的方法,例如图2所示的步骤S101至步骤S103。或者,所述处理器301执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如图4所示单元201至单元203的功能。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器302中,并由所述处理器301执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。
本领域技术人员可以理解,图5仅仅是终端设备的示例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所述处理器301可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器302可以是所述终端设备的内部存储单元,例如终端设备的硬盘或内存。所述存储器302也可以是所述终端设备的外部存储设备,例如所述终端设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器302还可以既包括所述终端设备的内部存储单元也包括外部存储设备。所述存储器302用于存储所述计算机程序以及所述终端设备所需的其它程序和数据。所述存储器302还可以用于暂时地存储已经输出或者将要输出的数据。
本实施例提供的终端设备可以执行上述方法实施例,其实现原理与技术效果类似,此处不再赘述。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例所述的方法。
本申请实施例还提供一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现上述方法实施例所述的方法。
本申请实施例还提供一种芯片系统,包括处理器,所述处理器与存储器耦合,所述处理器执行存储器中存储的计算机程序,以实现上述方法实施例所述的方法。其中,所述芯片系统可以为单个芯片,或者多个芯片组成的芯片模组。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random AccessMemory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在本申请中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
在本申请的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
此外,在本申请中,除非另有明确的规定和限定,术语“连接”、“相连”等应做广义理解,例如可以是机械连接,也可以是电连接;可以是直接连接,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定、对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (10)
1.一种HDR视频转换方法,其特征在于,包括:
对待处理的SDR视频进行抽帧处理,得到所述SDR视频中包含的J帧SDR视频帧,J为大于1的整数;
分别将J帧所述SDR视频帧输入已训练的全卷积模型中处理,输出J帧HDR视频帧,所述全卷积模型包括N个卷积核大小为1×1的卷积层,N个所述卷积层中穿插设置有N-1个激活函数,N为大于等于3的整数;
将所述J帧HDR视频帧进行合帧处理,得到与所述SDR视频对应的HDR视频。
2.根据权利要求1所述的方法,其特征在于,3≤N≤10。
3.根据权利要求1所述的方法,其特征在于,所述激活函数为非线性激活函数。
4.根据权利要求1所述的方法,其特征在于,对待处理的SDR视频进行抽帧处理,得到所述SDR视频中包含的J帧SDR视频帧,包括:
采用抽帧工具对所述SDR视频帧进行抽帧处理,得到所述J帧SDR视频帧;
所述将所述J帧HDR视频帧进行合帧处理,得到与所述SDR视频对应的HDR视频,包括:
采用所述抽帧工具对所述J帧HDR视频帧进行合帧处理,得到与所述SDR视频对应的HDR视频。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述全卷积模型的训练方式包括:
利用预设的训练集和预设的损失函数对初始的全卷积模型进行迭代训练,得到所述全卷积模型;
所述训练集包括多个SDR视频帧样本以及与所述SDR视频帧样本对应的HDR视频帧样本;
所述预设的损失函数用于描述预测的HDR视频帧和所述HDR视频帧样本之间的L2损失,所述预测的HDR视频帧为所述全卷积模型对所述SDR视频帧样本进行处理得到的。
6.一种HDR视频转换装置,其特征在于,包括:
抽帧单元,用于对待处理的SDR视频进行抽帧处理,得到所述SDR视频中包含的J帧SDR视频帧,J为大于1的整数;
处理单元,用于分别将J帧所述SDR视频帧输入已训练的全卷积模型中处理,输出J帧HDR视频帧,所述全卷积模型包括N个卷积核大小为1×1的卷积层,N个所述卷积层中穿插设置有N-1个激活函数,N为大于等于3的整数;
合帧单元,用于将所述J帧HDR视频帧进行合帧处理,得到与所述SDR视频对应的HDR视频。
7.根据权利要求6所述的装置,其特征在于,3≤N≤10。
8.根据权利要求6所述的装置,其特征在于,所述激活函数为非线性激活函数。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110883118.3A CN113784175B (zh) | 2021-08-02 | 2021-08-02 | 一种hdr视频转换方法、装置、设备及计算机存储介质 |
PCT/CN2021/137979 WO2023010749A1 (zh) | 2021-08-02 | 2021-12-14 | 一种hdr视频转换方法、装置、设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110883118.3A CN113784175B (zh) | 2021-08-02 | 2021-08-02 | 一种hdr视频转换方法、装置、设备及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113784175A CN113784175A (zh) | 2021-12-10 |
CN113784175B true CN113784175B (zh) | 2023-02-28 |
Family
ID=78836564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110883118.3A Active CN113784175B (zh) | 2021-08-02 | 2021-08-02 | 一种hdr视频转换方法、装置、设备及计算机存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113784175B (zh) |
WO (1) | WO2023010749A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113781319A (zh) * | 2021-08-02 | 2021-12-10 | 中国科学院深圳先进技术研究院 | 一种hdr视频转换方法、装置、设备及计算机存储介质 |
CN113781322A (zh) * | 2021-08-02 | 2021-12-10 | 中国科学院深圳先进技术研究院 | 一种色域映射方法、装置、终端设备及存储介质 |
CN113784175B (zh) * | 2021-08-02 | 2023-02-28 | 中国科学院深圳先进技术研究院 | 一种hdr视频转换方法、装置、设备及计算机存储介质 |
CN114422718B (zh) * | 2022-01-19 | 2022-12-13 | 北京百度网讯科技有限公司 | 一种视频转换方法、装置、电子设备及存储介质 |
CN116704926A (zh) * | 2022-02-28 | 2023-09-05 | 荣耀终端有限公司 | 帧数据显示方法、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447907A (zh) * | 2018-09-20 | 2019-03-08 | 宁波大学 | 一种基于全卷积神经网络的单图像增强方法 |
CN111292264A (zh) * | 2020-01-21 | 2020-06-16 | 武汉大学 | 一种基于深度学习的图像高动态范围重建方法 |
CN112102166A (zh) * | 2020-08-26 | 2020-12-18 | 上海交通大学 | 一种联合超分辨率、色域扩展和逆色调映射方法及设备 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190080440A1 (en) * | 2017-09-08 | 2019-03-14 | Interdigital Vc Holdings, Inc. | Apparatus and method to convert image data |
WO2019112085A1 (en) * | 2017-12-06 | 2019-06-13 | Korea Advanced Institute Of Science And Technology | Method and apparatus for inverse tone mapping |
CN108681991A (zh) * | 2018-04-04 | 2018-10-19 | 上海交通大学 | 基于生成对抗网络的高动态范围反色调映射方法及系统 |
US10997690B2 (en) * | 2019-01-18 | 2021-05-04 | Ramot At Tel-Aviv University Ltd. | Method and system for end-to-end image processing |
CN111145097B (zh) * | 2019-12-31 | 2023-09-01 | 华为技术有限公司 | 图像处理方法、装置和图像处理系统 |
CN112200719B (zh) * | 2020-09-27 | 2023-12-12 | 咪咕视讯科技有限公司 | 图像处理方法、电子设备及可读存储介质 |
CN113784175B (zh) * | 2021-08-02 | 2023-02-28 | 中国科学院深圳先进技术研究院 | 一种hdr视频转换方法、装置、设备及计算机存储介质 |
-
2021
- 2021-08-02 CN CN202110883118.3A patent/CN113784175B/zh active Active
- 2021-12-14 WO PCT/CN2021/137979 patent/WO2023010749A1/zh unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447907A (zh) * | 2018-09-20 | 2019-03-08 | 宁波大学 | 一种基于全卷积神经网络的单图像增强方法 |
CN111292264A (zh) * | 2020-01-21 | 2020-06-16 | 武汉大学 | 一种基于深度学习的图像高动态范围重建方法 |
CN112102166A (zh) * | 2020-08-26 | 2020-12-18 | 上海交通大学 | 一种联合超分辨率、色域扩展和逆色调映射方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113784175A (zh) | 2021-12-10 |
WO2023010749A1 (zh) | 2023-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113784175B (zh) | 一种hdr视频转换方法、装置、设备及计算机存储介质 | |
JP6582062B2 (ja) | 画素の前処理および符号化 | |
US9501818B2 (en) | Local multiscale tone-mapping operator | |
JP6516851B2 (ja) | 画素の前処理および符号化 | |
WO2023010754A1 (zh) | 一种图像处理方法、装置、终端设备及存储介质 | |
RU2710873C2 (ru) | Способ и устройство для декодирования цветного изображения | |
US8675984B2 (en) | Merging multiple exposed images in transform domain | |
EP3051488A1 (en) | A method and apparatus for inverse-tone mapping a picture | |
WO2023010750A1 (zh) | 一种图像颜色映射方法、装置、终端设备及存储介质 | |
CN111738951B (zh) | 图像处理方法及装置 | |
JP2002185776A (ja) | 小サイズ画像処理エンジン | |
CN112203085A (zh) | 图像处理方法、装置、终端和存储介质 | |
US20170339316A1 (en) | A method and device for estimating a color mapping between two different color-graded versions of a sequence of pictures | |
CN113781319A (zh) | 一种hdr视频转换方法、装置、设备及计算机存储介质 | |
Zhang et al. | Multi-scale-based joint super-resolution and inverse tone-mapping with data synthesis for UHD HDR video | |
CN112203086A (zh) | 图像处理方法、装置、终端和存储介质 | |
CN111738950A (zh) | 图像处理方法及装置 | |
CN113781322A (zh) | 一种色域映射方法、装置、终端设备及存储介质 | |
US10602109B2 (en) | Method and arrangements for HDR encoding | |
US7283073B2 (en) | System for speeding up the arithmetic coding processing and method thereof | |
CN102118616A (zh) | 图片解码方法及图片解码器 | |
CN106954074B (zh) | 一种视频数据处理方法和装置 | |
CN108933945B (zh) | 一种gif图片的压缩方法、装置及存储介质 | |
CN117221740A (zh) | 一种图片的处理方法及相关设备 | |
CN113395459A (zh) | 动态范围调整系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |