发明内容
本发明的目的是提供一种多曝光融合图像的视觉质量评估方法,以解决上述现有技术存在的问题,充分利用MEF图像的结构性、自然性和色彩性,大大提高了多曝光融合图像视觉质量评估的准确性。
为实现上述目的,本发明提供了如下方案:本发明提供一种多曝光融合图像的视觉质量评估方法,包括以下步骤:
提取多曝光融合图像的结构特征,其中,所述结构特征用于描述多曝光融合图像经过多曝光融合算法后的结构失真;
提取所述多曝光融合图像的自然性特征,其中,所述自然性特征用于描述多曝光融合图像经过多曝光融合算法后不自然的失真现象;
提取所述多曝光融合图像的色彩特征,其中,所述色彩特征用于描述多曝光融合图像经过多曝光融合算法后的色彩失真;
构建质量回归模型,利用所述质量回归模型对所述结构特征、所述自然性特征和所述色彩特征进行聚合,评估所述多曝光融合图像的视觉质量。
可选地,提取多曝光融合图像的结构特征包括:
测量所述多曝光融合图像的曝光程度,区分曝光异常,其中,所述曝光异常包括曝光过度和曝光不足;
对所述多曝光融合图像进行处理,获取若干伪多曝光融合图像,计算所述多曝光融合图像与所述伪多曝光融合图像的梯度相似图;
基于所述曝光异常和梯度相似图,获取曝光加权的梯度相似度;
利用NSS模型,对所述多曝光融合图像的梯度域进行统计,获取多曝光融合图像的结构失真的补偿特征;
将所述多曝光融合图像进行分块,计算每个多曝光融合图像块的块熵值,基于所述块熵值,获得熵分布特征;
基于所述梯度相似图、所述结构失真的补偿特征和所述熵分布特征,获得所述多曝光融合图像的结构特征。
可选地,测量所述多曝光融合图像的曝光程度,区分曝光异常包括:
测量所述多曝光融合图像的归一化像素强度,计算所述归一化像素强度与预设值的距离,区分曝光异常。
可选地,所述梯度相似图的计算方法为:
其中,Gs为梯度相似图,G为伪多曝光融合图像梯度图,GI为多曝光融合图像梯度图,C1为常数。
可选地,所述曝光加权的梯度相似度为:
其中,Ge为曝光加权的梯度相似度,Gs为梯度相似图,E1为曝光图。
可选地,提取所述多曝光融合图像的自然性特征包括:
将所述多曝光融合图像转换为灰度图像,计算所述灰度图像的去均值对比度归一化系数,利用NSS模型对所述灰度图像的去均值对比度归一化系数进行统计,获得全局自然度特征;
计算图像的亮度、对比度的损失特征;
基于所述图像的亮度、对比度的损失特征和所述全局自然度特征,获取所述多曝光融合图像的自然性特征。
可选地,提取所述多曝光融合图像的色彩特征包括:
基于所述多曝光融合图像的RGB颜色通道,获取对色色彩空间,计算所述对色色彩空间的对比度能量,获得所述多曝光融合图像的色彩特征。
可选地,所述对色色彩空间的对比度能量的计算方法为:
其中,g∈{T
1,T
2},
和
分别为MEF图像的红绿通道和黄蓝通道;
χ为校正和归一化所有滤波器响应的对比增益,θ
g为噪声阈值,ε为ρ(I
g)的最大值,ρ(I
g)为色彩通道的梯度。
可选地,构建所述质量回归模型时,采用随机森林算法。
本发明公开了以下技术效果:
本发明提供的多曝光融合图像的视觉质量评估方法,考虑了多曝光融合图像的结构性、自然性和色彩性,并提取这三个方面对应的特征,并利用回归模型将上述特征聚合进行质量预测。本发明从多曝光融合图像多方位的失真表象分析出发,全方面地对多曝光融合图像进行了失真表征,在预测多曝光融合图像的视觉质量任务中体现了较大的潜力,在不增加算法复杂度的前提下提高了多曝光融合图像的视觉质量评估性能。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明提供一种多曝光融合图像的视觉质量评估方法。本实施例中的多曝光融合(MEF)图像是由多幅具有不同曝光级别的图像生成的,变换过程中不可避免地会引入各种失真。由于MEF图像由具有不同曝光级别的多个图像融合,权重分配过程将引入一些伪影,例如细节损失、结构退化、不自然和颜色失真。图3展示了三种不同MEF算法生成的MEF图像,它们显示了不同的视觉效果。由Merten算法生成的图3(a)的平均意见分数(MOS)最高,质量最好。除了过度暴光部分(即洞穴入口外),相对来说细节信息保存完好。此外,它还有比图3(b)与图3(c)更丰富的颜色信息,看起来更自然。由拉曼算法生成的图3(b)给人类最初的感觉就是一个黑暗的场景。由此可见,亮度下降也会导致细节和颜色信息的丢失。通过局部能量加权生成的MEF图像图3(c)显示了适当的亮度,但失去了场景的自然度,并且在墙壁和石头周围引入了一些伪影。因此,结构、自然度和颜色信息是影响MEF图像视觉质量的主要因素。
如图1-2所示,评估方法包括以下步骤:
S1、提取多曝光融合图像的结构特征,结构特征用于描述多曝光融合图像经过多曝光融合算法后的结构失真。
结构信息通常承载着场景的基本视觉内容,人类视觉系统(HVS)对提取结构进行视觉感知具有很强的适应性。对于一幅MEF图像,畸变引入总是会破坏其结构信息,如曝光异常(即过度曝光或曝光不足)。因此,可以通过测量结构信息是否被损坏来感知MEF图像的视觉质量,尤其是对于过曝光和欠曝光区域。
首先,需要测量MEF图像的曝光程度,以区分过度曝光和曝光不足的区域。给定一个MEF图像I,MEF图像I对应的曝光图EI可以通过测量MEF图像I的归一化像素强度和常数0.5之间的距离来计算。具体而言,当归一化像素强度接近0或1时,相应的像素被视为曝光不足或曝光过度。因此,EI可以定义为如式(1)所示:
其中,EI为曝光图,τ为高斯函数的标准方差,Iy为多曝光融合图像的归一化像素强度。
图4显示了图3中三个MEF图像对应的曝光图。与图3相比,可以发现较亮的区域是曝光不足或曝光过度的区域,较暗的区域代表正常曝光区域。梯度作为一种有效的结构信息特征,被用来描述结构损失现象。为了进一步测量异常曝光对获取梯度信息的影响,通过对原始的MEF图像进行变暗和变亮来获得一系列假MEF图像(伪MEF图像),表示为If,如式(2)所示:
If=I·C (2)
其中,If为一系列假MEF图像(伪MEF图像),I为真实的MEF图像,C为常数。
其中C∈{1/3.5,1/5,1/6.5,3.5,5,6.5}。之后,可以生成六个伪MEF图像。计算伪MEF图像的梯度图G,如式(3)所示:
其中,P
x为沿水平方向的Prewitt算子,P
y为沿垂直方向的Prewitt算子,
表示卷积算子。此外,原始的真实MEF图像的梯度图也由式(3)获得,表示为G
I。
设Gs为G和GI的相似图,通过计算Gs来量化异常曝光对获取梯度信息的影响。Gs的计算方法如式(4)所示:
其中,C1是一个常数,以避免零分母,本实施例中,被设置为10-8。
由于过度曝光和曝光不足区域的失真更容易被人眼感知,因此将梯度相似图Gs与曝光图EI相结合以使失真感知更加准确。因此,结合曝光加权的梯度相似度定义为如式(5)所示:
其中,Ge为曝光加权的梯度相似度。
并且,Ge的维度与伪MEF图像的数量一致,在本实施例中,Ge是描述MEF图像结构损失的6维特征。
从统计学的角度来看,梯度域中使用NSS模型来表示MEF图像的结构变化。具体而言,梯度图GI通过局部去均值和除法归一化来处理,以获得去均值对比度归一化(MSCN)系数,如式(6)所示:
其中,
为G
I在(i,j)位置上的MSCN系数,μ(i,j)和δ(i,j)分别为G
I(i,j)的局部均值和标准偏差。
不同程度的结构畸变必然会影响GI的MSCN系数分布。由于该分布具有类似高斯的外观,因此利用广义高斯分布(GGD)来匹配MSCN系数(对GI的MSCN系数建模),并且数学表达式如式(7)所示:
其中,β为尺度参数,
Γ(·)为gamma函数,参数α和σ
2分别为高斯分布的形状和方差,e为常数(自然对数的底数),f(·)为广义高斯分布函数,l为输入的MSCN系数。
在本实施例中,α和σ2是另一种描述MEF图像结构损失的2维特征。
此外,还需要计算相邻MSCN系数的成对乘积以捕捉相邻像素的关系。在四个方向上处理MSCN系数,表示为如式(8)所示:
其中,H(i,j),V(i,j),D1(i,j)与D2(i,j)分别为沿水平、垂直、主对角线与次对角线方向处理的结果。
利用非对称广义高斯分布拟合每个成对乘积,如式(9)-(10)所示:
其中,Γ(·)为gamma函数。v为控制分布形状的形状参数,
和
分别为控制模式两侧扩展的比例参数,k为沿四个方向的MSCN系数,β
l与β
r分别为左尺度与右尺度参数,
为非对称广义高斯分布的平均值。
上述参数υ、
和
构成感知全局结构失真的补偿特征。最终结果为在四个方向上计算的补偿特征形成16维特征向量。
另一方面,结构损失现象还包含细节信息的损失,细节信息可以通过熵来度量。具体的,将MEF图像划分为8×8的块,计算每个MEF图像块的熵值,获得局部熵eb,通过局部熵以感知局部细节信息变化。最后根据熵获得上述局部熵的分布情况,局部熵分布的值被表示为如式(11)所示:
其中,e为代表局部熵分布的值,m是每个MEF图像的块数,p(·)是第m块熵值的概率密度。
此外,还计算局部熵的平均值和标准偏差来测量整体细节损失,分别表示为em和es。最后,e、em和es被整合形成另一组三维结构特征。
S2、提取多曝光融合图像的自然性特征,其中,自然性特征用于描述多曝光融合图像经过多曝光融合算法后不自然的失真现象。
通常,高质量的MEF图像具有自然的外观。MEF算法可能会破坏空间域中的自然统计规律。从全局的角度来看自然性可以通过基于NSS的模型来量化。对于MEF图像,将其转换为灰度图像Ir,然后根据公式(6)计算灰度图像Ir的MSCN系数。此外,利用公式(7)中定义的GGD模型对灰度图像Ir的MSCN系数进行建模,用于捕捉统计特性,获得形状和方差参数,并将形状和方差参数作为第一组全局自然度特征。
从另一个角度来看,自然度也受到整体亮度和对比度的影响,而亮度和对比度又会受到欠曝和过曝条件的严重影响。一般来说图像强度的均值和标准差可以表示图像的亮度和对比度,熵也可以描述亮度的失真。因此,这些矩特征(平均值和标准差)和熵特征被应用于建立NSS模型,用于捕捉失真过程中的自然度变化。其中,高斯概率密度函数用于拟合均值和标准差,如式(12)-(13)所示:
其中,a和s分别为均值和标准差。da和ds分别为当a和s给定时,MEF图像呈现自然的概率,ξa、τa、ξs、τs均为常数。公式(12)和公式(13)中的参数ξa设为26.063,τa设为118.559,ξs设为12.858,τs设为57.274。
此外,熵特征由极值概率密度函数拟合,极值概率密度函数定义为如式(14)所示:
其中,o是灰度MEF图像Ir的熵值,do是给定o时MEF图像呈现自然的概率,ξo和τo为常数。参数ξo为0.258,参数τo为7.54。
因此,da、d s和do形成了第二组全局自然性特征。结合第一组特征,共使用5维特征来描述MEF图像的自然度。
S3、提取多曝光融合图像的色彩特征,其中,色彩特征用于描述多曝光融合图像经过多曝光融合算法后的色彩失真。
丰富的色彩信息对于一幅优秀的MEF图像是非常重要的,这说明它具有合适的色彩饱和度和逼真的场景色度。由于不同的人并不总是关注相同的事情,不同的MEF算法中的权重分配过程则可能会侧重图像内容的不同部分。如图3所示,不同的侧重会带来不同的失真。无论如何,颜色失真测量是必要和正确的。在以前的工作中,已经证明HVS对对色色彩空间(opponent color space)敏感。对色色彩空间(opponent color space)是由RGB颜色空间中的红(R)、绿(G)、蓝(B)颜色通道获得的。RGB颜色空间向对色色彩空间的变换过程表示为T1=R-G,T2=(R+G)/2-B,T1是获得的红绿通道,T2是获得的黄蓝通道。
根据两个变换的通道,利用它们的组合来表示MEF图像的色彩度Ct。具体定义如式(15)所示:
其中,
和
分别代表T
1和T
2的方差,
和
分别为T
1和T
2的均值。
从图3可以看出,过度曝光和曝光不足都会随着对比度的降低而影响图像色彩的表现。因此,在对色色彩空间中计算对比度能量以感知颜色失真。设Ce为计算得到的对比度能量,如式(16)所示:
其中,g∈{T
1,T
2},
和
分别为MEF图像I的红绿通道和黄蓝通道。
χ为校正和归一化所有滤波器响应的对比增益,ε为ρ(I
g)的最大值,θ
g为噪声阈值。
最后,计算Ce的平均值作为除Ct之外的另一个特征。实际上,根据对色色彩空间,两个通道执行对比度能量计算过程,可获得2维特征。
此外,为了获得更全面的色彩失真感知,NSS模型也在两个对色色彩通道中执行。具体地说,T1和T2分别用公式(6)和公式(7)中定义的MSCN系数计算和GGD模型来处理。获得的形状和方差参数构成4维色彩特征。
S4、特征聚合和质量回归。
通过上述对结构、自然度和色彩度分析共提取了39维特征,分别表示为SF、NF和CF。根据获得的质量敏感特征,学习特征与人类主观得分之间的映射关系,以达到质量预测的目的。作为一个有效的回归的方式,使用随机森林(RF)来汇集高维特征用于指示MEF图像的质量。具体表达式如式(17)所示:
Q=η(F) (17)
其中,Q为MEF图像的最终质量分数,η(·)为通过RF实现的映射函数,F为最终所有特征的向量,F={SF,NF,CF}。
具体过程为:(1)选取一部分MEF图像作为RF回归模型的训练集,提取训练集的结构、自然度和色彩特征,利用RF训练所提取特征与训练集中相对应的人类主观得分之间的映射关系,形成质量回归模型;
(2)选取剩下的MEF图像作为测试集,提取测试集的结构、自然度和色彩特征,输入(1)中所获得的质量回归模型,获取预测质量分数。
为验证本发明所提出的质量评估方法的性能,本实施例中将本方法与其他方法进行结果验证。
该验证过程选用一个开放的MEF主观评估数据库,该数据库由136张MEF图像组成,涉及一些不同的场景。相应的感知质量分数由众多观察者主观测试获得,即人类主观分数,并从中获得每个MEF图像的MOS值。这些MEF图像由不同类型的MEF算法生成,136幅MEF图像来自17幅源多次曝光图像,如图5所示。
三个标准的性能评价标准被用来评价该方法的性能,包括Person线性相关系数(PLCC),斯皮尔曼秩次相关系数(SROCC)和均方根误差(RMSE)。具体来说,PLCC、SROCC和RMSE分别用于评估预测精度、预测单调性和预测误差。此外,PLCC应经过五参数逻辑回归计算,其定义如式(18)所示:
其中,Qf为拟合后的分数,λ1,λ2,λ3,λ4,λ5为拟合参数,可通过MATLAB软件中的nlinfit函数得到。在计算PLCC值时,将输入(即预测分数Q)替换为Qf。
一个优秀的质量评估方法总是应该具有较高的PLCC值和SROCC值,较低的RMSE值。为了获得一个稳健的标准,本实施例中使用了17折交叉验证来测试本发明所提出的评估方法。具体来说,将MEF图像数据库分为17个子集,其中16个用于训练,其余用于测试。最后,当所有场景的训练/测试周期结束时,获得所有循环周期中上述性能指标的平均值。
为了验证本方法的性能,本实施例中使用了两类已在其他图像上证明有效的基于NR的方法进行性能比较。第一类包含10种为普通图像设计的方法,分别为DIIVINE,BLIND-II,BRISQUE,CurveletQA,GradLog,ConstrastQA,GLBP,OG,NIQMC和SCORER。第二类包含三种为色调映射图像设计的方法,称为TM-NRIQA,包括BTMQI、HIGRADE-1、HIGRADE-2。所有的比较方法都是基于学习的方法,经过17次交叉验证以获得所有方法对于MEF图像的质量预测性能,这与所提出的方法一致。以确保结果没有偏差,比较方法的性能都是通过运行作者发布的原始代码获得的。
表1给出了总体性能比较结果。为了突出最佳表现,其PLCC、SROCC和RMSE的数值以粗体显示。显而易见,所提出的BMEFIQA方法比其他比较方法具有更好的性能,验证了其有效性。从表1中,可以得出一些观察结果。一方面,大多数2D NRIQA方法表现出较差的性能,除了GradLog,PLCC和SROCC最差的业绩指标分别只有0.163和0.113。造成这一现象的原因大致可以概括如下:一是MEF图像的失真呈现出不同于普通2D图像的特征,例如语义理解困难和过度曝光时的颜色恶化和曝光不足。第二,GradLog方法将梯度振幅图与高斯响应的拉普拉斯算子相结合来感知结构信息,可以很好地描述MEF图像的结构失真。因此,它的性能优于其他比较的2D NRIQA方法。另一方面,与2D NRIQA相比方法,TM-NRIQA方法获得了更好的性能。这可以归因于色调映射图像的失真似乎类似于MEF图像。然而,这样的结果也应该改进,以更准确地预测MEF图像的质量。所提出的BMEFIQA方法考虑了MEF图像三个方面的特性,促使其获得优于竞争方法的性能。
表1
为了更直观地比较不同方法的性能,图6显示了14种NR-IQA方法的客观预测分数和MOS值的散点图。它们在整个MEF数据库中进行计算,散点由逻辑函数拟合。这些散点越靠近拟合线,性能越好。从该图中可以观察到,与其他NRIQA方法相比,本发明提出的方法的预测分数与MOS值的相关性更高。
从上述性能比较中,已证明所提出的BMEFIQA方法具有良好的质量预测能力。然而,对于个别特征,它们在整体方法中所起的作用仍然是模棱两可的。为实现该目的,利用个体特征SF、NF、CF及其不同组合来训练相应的回归模型,分别预测MEF图像的质量。如表2所示,得到的回归模型写为Model-t,t∈{1,2,.,7},表示单个特征的数量及其可能的组合。其各自的表现结果也在表2中给出。可以发现:首先,在个体特征中,与自然度特征NF和颜色特征CF相比,结构特征SF表现出较强的性能。对于整体表现,SF贡献最大。第二,在不同的组合中,SF和CF的组合产生最佳性能。CF本身的性能虽然比较弱,但与NF结合使用时性能有所提升,说明它提供了很好的辅助效果。第三,当所有SF、NF和CF特征结合在一起时,可以获得最佳性能,可以让使SF、NF和CF特征可以相互补充。
表2
在块熵计算过程中,由于不同的块大小可能会影响质量预测性能,因此应确定块大小以获得最佳性能。在实验中,测试了不同块大小下的性能,如表3所示。具体来说,块大小从8到64不等,给出了相应的PLCC、SROCC和RMSE值。此外,还计算了不同块大小下的运行时间。从结果中,可以观察到PLCC、SROCC值和运行时间随着块大小的增加而减少。综合考虑,块大小设置为8。
表3
在实际应用中,除了性能之外,效率对于方法也很重要。因此,表4中报告了所提出的方法和其他竞争方法在MEF数据库中所有MEF图像的平均实现时间。所有原码均在Windows 10 1.80GHz英特尔酷睿i7-8565UCPU上实现,带8GB RAM和NVIDIA MX 150,使用MATLAB 2017b。从表4可以发现,所提出的BMEFIQA方法具有适中的执行时间。
表4
在本发明中,提出了一种新的NR-IQA方法来处理MEF图像的质量预测任务。具体来说,所提出的评估方法考虑了MEF图像的结构性、自然性和色彩性,并提取这三个方面对应的特征。通过前一部分的性能比较,所提出的方法显示了其在预测MEF图像质量方面的潜力。它可以在没有提供参考信息的情况下在应用终端中用于监控质量。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。