CN109003282B

CN109003282B - 一种图像处理的方法、装置及计算机存储介质

Info

Publication number: CN109003282B
Application number: CN201810847581.0A
Authority: CN
Inventors: 陈冠男
Original assignee: BOE Technology Group Co Ltd
Current assignee: BOE Technology Group Co Ltd
Priority date: 2018-07-27
Filing date: 2018-07-27
Publication date: 2022-04-29
Anticipated expiration: 2038-07-27
Also published as: CN109003282A; US20200034667A1; US10929720B2

Abstract

一种图像处理的方法、装置及计算机存储介质，包括：分割第一静态图像中的第一特征区域，并将分割出的第一特征区域通过二值掩膜输出；基于输出的二值掩膜，将第一静态图像和第一动态图像的图像帧进行融合，获得第二动态图像。本发明实施例提升了图像融合的显示效果。

Description

一种图像处理的方法、装置及计算机存储介质

技术领域

本文涉及但不限于多媒体技术，尤指一种图像处理的方法、装置及计算机存储介质。

背景技术

近些年来，很多研究机构和企业都在图像分割和融合领域进行了大量的资源投入，并且获得了一系列的成果，这些成果在军事，交通，商业，医疗等行业也有了很多的应用。而随着深度学习的兴起，图像分割与融合算法均突破了传统算法的瓶颈，有了长足的发展，基于深度学习算法架构的一些应用，都显著的改善了分割效果。图像分割技术是在数字图像处理中应用非常广泛的技术。分割技术要求根据指定目标的特征，在复杂的图像内容中，将指定目标识别分割出来。图像融合技术主要应用于图像增强领域，其目标是将其他图像中的结构特征合成到目标图像中，且合成边界连续自然，能达到增强图像信息或添加图像内容的目的。目前，融合技术在安防，医疗，娱乐等领域发挥着重要作用。

目前，对包括夜晚和有浓雾的天空等进行图像分割和融合处理，融合获得的图像效果不佳。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本发明实施例提供一种图像处理的方法、装置及计算机存储介质，能够提升图像融合的显示效果。

本发明实施例提供了一种图像处理的方法，包括：

分割第一静态图像中的第一特征区域，并将分割出的第一特征区域通过二值掩膜输出；

基于输出的二值掩膜，将第一静态图像和第一动态图像的图像帧进行融合，获得第二动态图像。

可选的，所述分割第一静态图像中的第一特征区域包括：

通过预设的深度卷积神经网络对所述第一静态图像进行处理，从所述第一静态图像中分割出所述第一特征区域。

可选的，所述通过预设的深度卷积神经网络对所述第一静态图像进行处理包括：

基于视觉几何组VGG-19预训练网络提取所述第一静态图像两个或两个以上不同尺度的语义特征层；

采用预设的优化网络RefineNet，对提取的所有语义特征层进行学习；

通过所述优化网络将学习获得的各尺度下的特征进行合并和插值处理；

通过合并和插值处理后的特征进行所述优化网络的训练，以对所述第一静态图像的第一特征区域进行预测和分割，并通过二值掩膜输出分割出的所述第一特征区域。

可选的，分割获得所述第一特征区域之前，所述方法还包括：

将预设的损失函数作为目标函数，对所述深度卷积神经网络进行训练处理；

其中，所述损失函数为：

所述I_ij’为预测的所述第一静态图像的第一特征区域；所述I_ij为所述第一特征区域的实际分割区域；所述H为图像矩阵的行数，所述W为图像矩阵的列数；所述i为像素的具体行坐标，j为像素的具体列坐标。

可选的，所述将第一静态图像和第一动态图像的图像帧进行融合之前，所述方法还包括：

对所述第一动态图像的图像帧序列进行分解；

基于输出的二值掩膜，确定所述第一特征区域；

将第一动态图像分解为红绿蓝RGB通道；

计算分解的各通道的均值后，合成主色调参考图I_ref；

对第一静态图像中的第二特征区域图像I_gd预设尺度的高斯模糊处理后，获得模糊图像I_blur；

根据下式对所述第二特征区域图像I_gd进行颜色校正：

I_cal＝I_gd*α+I_gd*(I_ref/I_blur)*(1-α)；

其中，所述第二特征区域包括：所述第一静态图像中除所述第一特征区域外的其他区域；α为校正比例系数，0≤α≤1。

另一方面，本发明实施例还提供一种图像处理的装置，包括：分割模块和融合模块；其中，

分割模块用于：分割第一静态图像中的第一特征区域，并将分割出的第一特征区域通过二值掩膜输出；

融合模块用于：基于输出的二值掩膜，将第一静态图像和第一动态图像的图像帧进行融合，获得第二动态图像。

可选的，所述分割模块用于分割第一静态图像中的第一特征区域包括：

可选的，所述分割模块具体用于：

可选的，所述装置还包括误差处理单元，用于：

其中，所述损失函数为：

可选的，所述装置还包括校正单元，用于：

对所述第一动态图像的图像帧序列进行分解；

基于输出的二值掩膜，确定所述第一特征区域；

将第一动态图像分解为红绿蓝RGB通道；

计算分解的各通道的均值后，合成主色调参考图I_ref；

根据下式对所述第二特征区域图像I_gd进行颜色校正：

I_cal＝I_gd*α+I_gd*(I_ref/I_blur)*(1-α)；

再一方面，本发明实施例还提供一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行上述图像处理的方法。

与相关技术相比，本申请技术方案包括：分割第一静态图像中的第一特征区域，并将分割出的第一特征区域通过二值掩膜输出；基于输出的二值掩膜，将第一静态图像和第一动态图像的图像帧进行融合，获得第二动态图像。本发明实施例提升了图像融合的显示效果。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本发明的技术方案，并不构成对本发明技术方案的限制。

图1为本发明实施例图像处理的方法的流程图；

图2为本发明实施例深度卷积神经网络的处理流程示意图；

图3为本发明实施例优化网络的结构示意图；

图4为本发明实施例残差卷积单元的组成结构示意图；

图5为本发明实施例链式残差池化单元的组成结构示意图；

图6为本发明实施例融合处理的流程示意图；

图7为本发明实施例图像处理的装置的结构框图；

图8为本发明应用示例图像处理过程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图1为本发明实施例图像处理的方法的流程图，如图1所示，包括：

步骤101、分割第一静态图像中的第一特征区域，并将分割出的第一特征区域通过二值掩膜输出；

需要说明的是，二值掩膜为相关技术中对需要区分的区域赋值不同的参数；例如、对第一特征区域赋值为1，对第一静态图像中的除第一特征区域以外的其他区域赋值为0，经过上述赋值处理，可以直接高效的区分第一特征区域。

可选的，本发明实施例所述分割第一静态图像中的第一特征区域包括：

可选的，本发明实施例所述通过预设的深度卷积神经网络对所述第一静态图像进行处理包括：

需要说明的是，提取所述第一静态图像语义特征层包括提取第一静态图像不同尺度下的语义特征层本领域技术人员可以根据相关理论确定各个尺度；图2为本发明实施例深度卷积神经网络的处理流程示意图，如图2所示，将第一静态图像输入VGG-19网络，并从中获得第4、8、12、16卷积层所输出的特征，作为1/2尺度，1/4尺度，1/8尺度和1/16尺度的语义特征层，传送到RefineNet中进行处理。本发明采用RefineNet网络对不同尺度的特征层进行进一步处理，输出分割的第一特征区域的二值化掩膜图像。

可选的，本发明实施例所述优化网络包括以下部分或全部单元：残差卷积单元、融合模块和链式残差池化单元。

需要说明的是，本发明实施例网络RefineNet主要由残差卷积单元(Residualconvuint)、融合模块(Fusion，包括用于特征提取的卷积层(CONV3*3，每个CONV相当于一组神经元，用来存储神经网络的单元参数，但CONV具有神经元局部权值共享的特点，因此适合于图像这种结构化信息处理)、上采样和融合(SUM))和链式残差池化单元(Chain residualpooling)构成。不同尺度的特征分别经过残差卷积单元，可以提取对应尺度下的全局特征，然后进入融合模块进行不同尺度的特征融合，最后经过链式残差池化层提取低频背景的语义特征，转换(CONV3*3)并输出(OUTPUT)大尺度下的语义特征。本发明实施例深度卷积神经网络中进行的上采样各优化网络中所采用的上采样的处理为相同的处理方法，主要用于进行插值操作，为本领域技术人员公知的技术，在此不做赘述。本发明实施例各个组成部分中的CONV所进行了处理相同，所配置的参数通过训练进行自适应调整。本发明实施例各个组成部分中的SUM所进行了处理相同，所配置的参数通过训练进行自适应调整。

图3为本发明实施例优化网络的结构示意图，如图3所示，包括：对不同尺度的特征层划分为低尺度层(Low scale layer)和高尺度层(High scale layer)后，通过残差卷积单元(Residual convuint)提取对应尺度下的全局特征；其以图2为例，1/16层为低尺度层；相对的，1/8层属于高尺度层；提取的全局特征进入融合模块进行不同尺度的特征融合后，链式残差池化单元(Chain residual pooling)提取低频背景的语义特征，输出大尺度下的语义特征。图4为本发明实施例残差卷积单元的组成结构示意图，如图4所示，低尺度层和高尺度层输入时，通过激活层(Relu)对卷积层的参数进行非线性处理；卷积层(CONV)，对前一层的输出特征图像进行特征抽取；正则化层(BN)，当深度网络进行训练时，该层可以对网络参数进行正则化，防止训练过程中产生梯度爆炸。融合(SUM)层用于进行融合处理。图5为本发明实施例链式残差池化单元的组成结构示意图，如图5所示，图5中，池化层(Pooling)，对输出特征图像做低频滤波处理；其他各个组件的处理与图4相同，相关参数可以通过训练网络进行自适应的调整。

另外，本发明实施例在训练过程中，直接导入VGG-19的预目标函数，可以节省训练时间。另外，本发明利用天空分割数据集(skyFinder)数据集进行训练与测试，训练集与测试集的比例可以为9：1。本发明使用随机梯度下降法对网络进行训练，学习率设置为1^e-4。skyFinder数据集有46个场景，8万余帧图片；训练时，每次迭代过程会从每个场景随机抽取20帧图片进行训练，即每次迭代抽取900帧图片进行训练，训练100次迭代，会有90000帧次图像参与训练。而在参与训练的图像中，某些图像会被抽取多次，某些图像则不会被抽取。这样可以防止出现过拟合的情况。

步骤102、基于输出的二值掩膜，将第一静态图像和第一动态图像的图像帧进行融合，获得第二动态图像。

可选的，本发明实施例分割获得所述第一特征区域之前，本发明实施例方法还包括：

其中，所述损失函数为：

可选的，所述将第一静态图像和第一动态图像的图像帧进行融合之前，本发明实施例方法还包括：

对所述第一动态图像的图像帧序列进行分解；

根据所述第一动态图像的主色调，对所述第一静态图像的第二特征区域的图像帧进行颜色校正；

其中，所述第二特征区域包括：所述第一静态图像中除所述第一特征区域外的其他区域。

可选的，本发明实施例对所述第一静态图像的第二特征区域的图像帧进行颜色校正包括：

基于输出的二值掩膜，确定所述第一特征区域；

将第一动态图像分解为红绿蓝RGB通道；

计算分解的各通道的均值后，合成主色调参考图I_ref；

根据下式对所述第二特征区域图像I_gd进行颜色校正：

I_cal＝I_gd*α+I_gd*(I_ref/I_blur)*(1-α)；

其中，α为校正比例系数，0≤α≤1。

可选的，本发明实施例第一静态图像包括天空区域的风景图像；第一特征区域包括天空区域；第一动态图像为动态天空图像。

需要说明的是，第一特征区域为天空区域时，本发明实施例第二特征区域可以是除天空区域外的其他区域，也可以是地面区域，可以由本领域技术人员根据图像融合的要求进行分析确定。

可选的，本发明实施例将第一静态图像和第一动态图像的图像帧进行融合包括：将所述第一静态图像和所述第一动态图像的图像帧，通过拉普拉斯金字塔进行融合。

需要说明的是，拉普拉斯金字塔融合方法是将待融合的两帧图像分别做拉普拉斯金字塔分解，且分解层数相同。二值掩膜图像做高斯金字塔分解，分解层数与拉普拉斯金字塔一致；然后在每一层，将对应的待融合图像按该层的掩膜图像进行比例融合，融合公式如下：

其中，l代表金字塔层数，

分别代表该层的待融合图像I1和I2，以及对应的掩膜图像Mask；各层图像融合后，将其进行拉普拉斯金字塔重构，最后得到融合结果；图6为本发明实施例融合处理的流程示意图，如图6所示，包括：待融合图像1(可以是第一静态图像)和待融合图像2(可以是第一动态图像)分别拉普拉斯金字塔进行分解处理，二值掩膜图像通过高斯金字塔分解；图像各层按二值掩膜进行图像比例融合；对融合的各层图像，采用拉普拉斯金字塔重构后，输出融合获得的图像。

图7为本发明实施例图像处理的装置的结构框图，如图7所示，包括：分割模块701和融合模块702；其中，

分割模块701用于：分割第一静态图像中的第一特征区域，并将分割出的第一特征区域通过二值掩膜输出；

可选的，本发明实施例分割模块701用于分割第一静态图像中的第一特征区域包括：

可选的，本发明实施例分割模块701具体用于：

需要说明的是，提取所述第一静态图像语义特征层包括提取第一静态图像不同尺度下的语义特征层本领域技术人员可以根据相关理论确定各个尺度；例如，将第一静态图像输入VGG-19网络，并从中获得第4、8、12、16卷积层所输出的特征，作为1/2尺度，1/4尺度，1/8尺度和1/16尺度的语义特征层，传送到RefineNet中进行处理。

可选的，本发明实施例优化网络包括以下部分或全部单元：残差卷积单元、融合单元和链式残差池化单元。

需要说明的是，本发明实施例网络RefineNet主要由残差卷积单元(Residualconvuint)、融合单元(Fusion)和链式残差池化单元(Chain residual pooling)构成。不同尺度的特征分别经过残差卷积单元，可以提取对应尺度下的全局特征，然后进入融合单元进行不同尺度的特征融合，最后经过链式残差池化层提取低频背景的语义特征，输出大尺度下的语义特征。

可选的，本发明实施例装置还包括误差处理单元703，用于：

其中，所述损失函数为：

所述I_ij’为预测的所述第一静态图像的第一特征区域；所述I_ij为所述第一特征区域的实际分割区域；

可选的，本发明实施例装置还包括校正单元704，用于：

对所述第一动态图像的图像帧序列进行分解；

根据所述第一动态图像的主色调，对所述第一静态图像的第二特征区域的图像帧进行颜色校正。

可选的，本发明实施例校正单元用于对所述第一静态图像的第二特征区域的图像帧进行颜色校正包括：

基于输出的二值掩膜，确定所述第一特征区域；

将第一动态图像分解为红绿蓝RGB通道；

计算分解的各通道的均值后，合成主色调参考图I_ref；

根据下式对所述第二特征区域图像I_gd进行颜色校正：

I_cal＝I_gd*α+I_gd*(I_ref/I_blur)*(1-α)；

其中，α为校正比例系数，0≤α≤1。

本发明实施例还提供一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行上述图像处理的方法。

以下通过应用示例对本发明实施例方法进行清楚详细的说明，应用示例仅用于陈述本发明，并不用于限定本发明的保护范围。

应用示例

图8为本发明应用示例图像处理过程示意图，如图8所示，本发明应用示例可以将输入的带天空区域的静态风景图像(第一静态图像)，进行天空区域(第一特征区域)分割，将分割出的天空区域用二值掩膜的方式输出。同时，对动态天空图像(第一动态图像)的图像帧序列进行分解，并参考静态风景图像的天空区域的主色调进行颜色校正。将输入的动态天空图像的图像帧与静态风景图像，以二值掩膜为参考，进行拉普拉斯金字塔融合。最后将融合的各图像帧序列合成为动态帧序列，达到让静态风景图“动起来”的目的。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的每个模块/单元可以采用硬件的形式实现，例如通过集成电路来实现其相应功能，也可以采用软件功能模块的形式实现，例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明不限制于任何特定形式的硬件和软件的结合。

虽然本发明所揭露的实施方式如上，但所述的内容仅为便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式及细节上进行任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种图像处理的方法，其特征在于，包括：

基于输出的二值掩膜，将第一静态图像和第一动态图像的图像帧进行融合，获得第二动态图像；

所述将第一静态图像和第一动态图像的图像帧进行融合之前，所述方法还包括：

对所述第一动态图像的图像帧序列进行分解；

基于输出的二值掩膜，确定所述第一特征区域；

将所述第一动态图像分解为红绿蓝RGB通道；

计算分解的各通道的均值后，合成主色调参考图I_ref；

对所述第一静态图像中的第二特征区域图像I_gd预设尺度的高斯模糊处理后，获得模糊图像I_blur；

根据下式对所述第二特征区域图像I_gd进行颜色校正：

I_cal＝I_gd*α+I_gd*(I_ref/I_blur)*(1-α)；

2.根据权利要求1所述的方法，其特征在于，所述分割第一静态图像中的第一特征区域包括：

3.根据权利要求2所述的方法，其特征在于，所述通过预设的深度卷积神经网络对所述第一静态图像进行处理包括：

4.根据权利要求3所述的方法，其特征在于，分割获得所述第一特征区域之前，所述方法还包括：

其中，所述损失函数为：

5.一种图像处理的装置，其特征在于，包括：分割模块、融合模块和校正单元；其中，

融合模块用于：基于输出的二值掩膜，将第一静态图像和第一动态图像的图像帧进行融合，获得第二动态图像；

校正单元，用于：

对所述第一动态图像的图像帧序列进行分解；

基于输出的二值掩膜，确定所述第一特征区域；

将第一动态图像分解为红绿蓝RGB通道；

计算分解的各通道的均值后，合成主色调参考图I_ref；

根据下式对所述第二特征区域图像I_gd进行颜色校正：

I_cal＝I_gd*α+I_gd*(I_ref/I_blur)*(1-α)；

6.根据权利要求5所述的装置，其特征在于，所述分割模块用于分割第一静态图像中的第一特征区域包括：

7.根据权利要求6所述的装置，其特征在于，所述分割模块具体用于：

8.根据权利要求7所述的装置，其特征在于，所述装置还包括误差处理单元，用于：

其中，所述损失函数为：

9.一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1～4中任一项所述的图像处理的方法。