CN113269698A - 基于Actor-Critic模型的低曝光静脉图像增强方法 - Google Patents

基于Actor-Critic模型的低曝光静脉图像增强方法 Download PDF

Info

Publication number
CN113269698A
CN113269698A CN202110560691.0A CN202110560691A CN113269698A CN 113269698 A CN113269698 A CN 113269698A CN 202110560691 A CN202110560691 A CN 202110560691A CN 113269698 A CN113269698 A CN 113269698A
Authority
CN
China
Prior art keywords
image
filtering
actor
vein
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110560691.0A
Other languages
English (en)
Other versions
CN113269698B (zh
Inventor
王军
袁静波
李玉莲
潘在宇
申政文
陈晓玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology CUMT
Original Assignee
China University of Mining and Technology CUMT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology CUMT filed Critical China University of Mining and Technology CUMT
Priority to CN202110560691.0A priority Critical patent/CN113269698B/zh
Publication of CN113269698A publication Critical patent/CN113269698A/zh
Application granted granted Critical
Publication of CN113269698B publication Critical patent/CN113269698B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30101Blood vessel; Artery; Vein; Vascular
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于Actor‑Critic模型的低曝光静脉图像增强方法,设计对比度,饱和度,白平衡,曝光和色调曲线函数滤波器,通过Actor‑Critic模型选取最优的一组图像滤波顺序和参数,并利用其对低曝光静脉图像进行滤波操作,输出每个滤波操作对应图像并提取细节信息,叠加到最后一层滤波器处理后的图像中,最终输出增强的静脉图像。本发明公开的基于Actor‑Critic的低曝光静脉图像增强模型,可以自动选择图像编辑滤波顺序和参数,实现低曝光静脉图像光照信息的恢复和对比度的增强,并且通过提取滤波处理过程中各滤波器输出图像的互补静脉细节信息,解决了全局图像处理造成的静脉细节丢失的问题,达到低曝光静脉图像增强的效果。

Description

基于Actor-Critic模型的低曝光静脉图像增强方法
技术领域
本发明属于身份识别技术,尤其涉及一种基于Actor-Critic模型的低曝光静脉图像增强方法。
背景技术
在近红外光照射下,静脉血管中的血红蛋白会吸收大量近红外光,而以骨骼和脂肪为主要成分的其他生物组织则无法对其产生吸收,从而形成静脉血管灰暗而背景明亮的静脉图像。在一些外部因素的影响下,除了静脉血管吸收近红外光形成较暗的阴影,其它背景区域也呈现灰暗的状态,使得静脉纹络和背景区域没有明显的区分,静脉图像的对比度较低。因此首次提出基于Actor-Critic模型的低曝光静脉图像增强方法,通过图像处理的方法对低曝光静脉图像进行增强,恢复图像的光照信息,并且在保证静脉细节信息不丢失的情况下,增强静脉图像的对比度。
基于直方图均衡化或规定化的方法对处理的数据不加选择,容易放大噪声而抑制真正有用的信息或是处理后图像不自然甚至偏色;同态滤波方法容易降低小范围光照突变区域的对比度、容易在亮度陡变的图像边缘处引入光晕且需要整幅图像输入而无法实现流处理;基于Retinex理论的方法采用高斯滤波器进行滤波,计算量较大且容易引起偏色问题,虽然可以通过其他手段补救,却进一步增加了计算复杂度。
发明内容
本发明的目的在于提供一种基于Actor-Critic模型的低曝光静脉图像增强方法,解决了全局图像处理造成的静脉细节丢失的问题,达到低曝光静脉图像增强的效果。
实现本发明目的的技术解决方案为:一种基于Actor-Critic模型的低曝光静脉图像增强方法,包括以下步骤:
步骤S1、在采集K幅正常光照下的人体手背静脉图像,100<K<10000,使用伽马变化和添加高斯噪声模拟低光照环境对上述人体手背静脉图像逐张进行处理合成低曝光手背静脉图像,构成K组图像对,对上述正常光照下的人体手背静脉图像和低曝光手背静脉图像逐一进行有效区域提取,得到像素大小为h×w的2K幅静脉图像,构成训练集。
步骤S2、将饱和度、白平衡、色调曲线、对比度函数和曝光函数设置成可微的图像滤波器。
步骤S3、构建静脉图像增强的Actor-Critic模型:
所述Actor-Critic模型包括Critic网络、判别器网络和两个Actor网络,两个Actor网络用于选取滤波顺序和参数;Critic网络用于获取图像状态的奖励值;判别器网络用于判断图像质量,作为奖励值计算的辅助。
步骤S4、利用Actor-Critic模型训练图像滤波器得到的一组最优滤波顺序和参数:
将训练集中的正常光照下的人体手背静脉图像作为标签图像,将低曝光手背静脉图像作为输入图像,通过Actor-Critic模型对图像滤波器中的饱和度、白平衡、色调曲线、对比度函数和曝光函数曲线的滤波顺序和参数进行迭代更新;通过判别器网络判断滤波处理后的图像与标签图像之间的差距,将上述差距输入到Critic网络得到图像的奖励值,指导Actor网络对滤波顺序和滤波参数的训练,得到一组最优滤波顺序和参数。
步骤S5、采集M幅低曝光的人体手背静脉图像,100<M<1000;对上述低曝光的人体手背静脉图像逐一进行有效区域提取,得到像素大小为h×w的M幅静脉图像,作为测试集。
步骤S6、利用Actor-Critic模型训练图像滤波器得到的一组最优滤波顺序和参数对测试集进行滤波操作,输出每个滤波操作对应图像,并提取每个滤波操作对应图像的互补静脉细节信息。
步骤S7、将提取到的互补静脉细节信息叠加到Actor-Critic模型选取的滤波操作中最后一次滤波操作处理后的图像,最终输出增强后的静脉图像。
本发明与现有技术相比,其显著优点在于:
(1)首次将Actor-Critic模型用于增强低曝光静脉图像,可以通过网络训练的方式选取可微滤波器的顺序和参数,避免人工选取参数的繁琐性,提高滤波器的鲁棒性和泛化能力;
(2)网络可以在选取到一组最优的滤波顺序和参数之后,输出对应的滤波处理结果,保留每层滤波后的细节信息用于图像细节增强;
(3)构建静脉图像细节提取模块,提取滤波处理过程中各滤波器输出图像的静脉细节信息,解决全局图像处理造成的静脉细节丢失的问题,进一步增强低曝光静脉图像;
(4)图像一般在不同亮度下包含不同的细节信息,每个滤波操作对应的输出图像包含不同的细节信息,因此将提取到的细节信息叠加到最后一层滤波器处理后的图像中,可以保留更多的细节信息,有更好的图像恢复与增强效果。
附图说明
图1为基于Actor-Critic的低曝光静脉图像增强模型图。
图2为数据集中部分低曝光和正常曝光静脉图像,其中图(a)为Data-1中部分低曝光和正常曝光的手背静脉图像,图(b)为Data-2中部分低曝光和正常曝光手背静脉图像。
图3为Data-1中网络选取的一组最优滤波处理过程图,其中(a)是原始图像,(b)-(f)是滤波处理后的静脉图像。
图4为Data-2中网络选取的一组最优滤波处理过程图,其中(a)是原始图像,(b)-(f)是滤波处理后的静脉图像。
图5为Data-1中手背静脉细节增强图,其中(a)为滤波组增强后静脉图像,(b)为滤波过程中提取到的细节图,(c)为细节增强后的图像。
图6为Data-2中手掌静脉细节增强图。其中(a)为滤波组增强后静脉图像,(b)为滤波过程中提取到的细节图,(c)为细节增强后的图像。
具体实施方式
下面结合附图对本发明作进一步详细描述。
结合图1,本发明所述的一种基于Actor-Critic模型的低曝光静脉图像增强方法,步骤如下:
步骤S1、在采集K幅正常光照下的人体手背静脉图像,100<K<10000,使用伽马变化和添加高斯噪声模拟低光照环境对上述人体手背静脉图像逐张进行处理合成低曝光手背静脉图像,对上述正常光照下的人体手背静脉图像和低曝光手背静脉图像逐一进行有效区域提取,得到像素大小为h×w的2K幅静脉图像,构成训练集。
步骤S2、将饱和度、白平衡、色调曲线、对比度函数和曝光函数设置成可微的图像滤波器,使用Actor-Critic网络训练对滤波参数进行更新,自动寻找适合当前图像的滤波顺序和参数,避免人工选取参数的问题。选取的5种图像编辑滤波函数增强低曝光静脉图像中,饱和度、白平衡和对比度函数较为相似,其主要的思想是通过训练的参数,设置增强后图像和原始图像之间的线性插值,如下式所示:
po=(1-p)·pI+p·g(pI)
其中,pI是输入的原始图像,po是处理之后的输出图像。p表示图像的像素点,g(·)是图像增强函数。对于不同的滤波操作,增强后图像的图像不同。其中对比度函数的计算公式如下:
Con(pI)=1/2·(1-cos(π×(Lum(pI))))
Figure BDA0003078844650000041
其中,Con(pI)是对比度增强函数,照明函数Lum(p)=0.27pr+0.67pg+0.06pb。pr、pg、pb表示图像像素的RGB通道。g(pI)=HVStoRGB(H(pI),S(S(pI,V(pI)).V(pI)),H、S、V表示图像像素的HVS通道。
饱和度函数S(s,v)的计算公式如下:
S(s,v)=s+(1-s)×(0.5-|0.5-v|)×0.8
白平衡函数W(pI)的计算公式如下:
W(pI)=RGB(Lum(pI),Lum(pI),Lum(pI))
曝光函数和颜色曲线与上述三种通过像素之间的映射关系训练参数的方式不同,曝光函数曲线如式所示:
po=2EpI
其中,E表示曝光值。
色调曲线函数f(X)计算公式如下:
Figure BDA0003078844650000042
其中,X∈[0,1]表示输入的色调值,f(X)为分段函数,函数共有L个参数,表示为{e0,e1,…,eL-1},l表示函数处理的第l个参数,参数的和为
Figure BDA0003078844650000043
函数的分段点表示为(l/L,Tl/TL)。
步骤S3、构建静脉图像增强的Actor-Critic模型:
所述Actor-Critic模型包括Critic网络、判别器网络和两个Actor网络,两个Actor网络用于选取滤波顺序和参数;Critic网络用于获取图像状态的奖励值;判别器网络用于判断图像质量,作为奖励值计算的辅助。
进一步地,在构建Actor-Critic模型时,将饱和度、白平衡、色调曲线、对比度函数和曝光函数滤波操作作为强化学习中的行为,执行完一组滤波操作之后的图像作为强化学习中的一种状态。Actor-Critic网络中滤波的处理轨迹t定义为:
t=(s0,a0,s1,a1,…,sk,ak,…,sN,aN)
其中s代表滤波处理后的图像状态,a代表滤波操作,k是执行滤波动作的第k次,N是执行滤波动作的第N次,sk表示第k次的滤波状态,ak表示第k次的滤波动作,sN表示第N次的滤波状态,aN表示第N次的滤波动作。
Actor-Critic网络在不同的状态下得到不同的奖励值,实现滤波参数的更新,最终目标是在决策的过程中选择出一组能使奖励值最大的最优滤波处理策略。奖励值与静脉图像的质量成正相关,奖励值最大时静脉图像质量最佳,定义
Figure BDA0003078844650000054
是在经过滤波操作得到滤波状态sk时的奖励值:
Figure BDA0003078844650000051
其中γ∈[0,1]是一个折现因子,k′表示经过滤波处理的步骤数量,r表示滤波的奖励值函数。通过Critic网络评估获取滤波处理策略,定义Critic网络的目标函数J(π)为:
Figure BDA0003078844650000052
其中s0是输入图像状态,E是期望值,S0是输入的训练集,π是最优的滤波处理策略,t为滤波处理的轨迹。Critic网络的训练目标是使目标函数J(π)的值最大,训练时在不同的状态转移中寻找到最大的奖励值,使判别器网络收敛,得到质量最好的静脉图像;状态和状态-动作对的预期总折现奖励由状态值函数V和动作值函数Q定义:
Figure BDA0003078844650000053
Figure BDA0003078844650000061
其中s代表滤波处理后的图像状态,a代表滤波操作,a0表示初始的滤波操作,
Figure BDA0003078844650000062
表示在经过滤波操作得到滤波状态sN时的奖励值。
在Actor-Critic模型中,滤波操作过程分两部分进行,分别是滤波顺序的选择和滤波参数的更新,其中滤波顺序的选择为离散过程,滤波参数的更新为连续过程;Actor-Critic模型中的一个Actor网络用于选择合适的滤波顺序,另一个Actor网络用于训练合适的滤波参数。用于滤波顺序选择的Actor网络的梯度计算公式为:
Figure BDA0003078844650000063
用于滤波参数优化的Actor网络的梯度计算公式为:
Figure BDA0003078844650000064
其中,s表示经当前选择的滤波处理后的图像状态,a2z表示滤波操作的选择,a2z+1表示滤波参数的更新。两部分策略决定表示为π=(π12),其中π1表示滤波器选择a2z的策略,π2表示滤波参数优化操作a2z+1的策略。θ表示两个Actor网络的参数,θ1表示滤波操作选择的训练参数,θ2表示滤波参数更新的训练参数。
Figure BDA0003078844650000065
表示梯度更新,J(πθ)表示Actor的目标函数,Q表示状态值函数;ρπ是状态分布系数,定义如下:
Figure BDA0003078844650000066
其中,γ∈[0,1]是一个折现因子,P′表示当前状态为sk的概率,n表示某个具体的图像状态。
Actor-Critic模型中的Critic网络,用于评价滤波处理的优劣,得到图像的奖励值。Critic网络的状态值函数与Actor网络的相同,Critic网络的动作-值函数表示为:
Figure BDA0003078844650000067
其中,E是期望值;π表示最优的滤波处理策略;t为滤波处理的轨迹;s代表滤波处理后的图像状态,s0表示当前的图像状态为输入图像;a代表滤波操作,a0表示初始的滤波操作;Vπ表示状态值函数;r表示滤波的奖励值函数;P表示状态-动作对的概率;
将Qπ代入用于滤波参数更新的Actor网络的梯度训练公式,作为π2的监督信号用于训练网络,Critic网络的目标函数Lv为:
Figure BDA0003078844650000071
其中,v表示Critic网络的训练参数,s代表滤波处理后的图像状态,ρπ表示状态分布系数,a表示滤波操作,π(s)表示得到状态s的策略集,δ表示TD策略评估。TD策略评估用来衡量一个策略的优劣,使Critic网络进行参数更新,其表达式为:
δ=r(s,a)+γV(P(s,a))-V(s)
其中r表示滤波的奖励值函数,γ∈[0,1]是一个折现因子,P表示状态-动作对的概率,V表示状态值函数。
Actor-Critic模型中的判别器网络用于判断滤波处理后的图像与目标图像之间的差距,作为奖励值计算的辅助。判别器通过对抗损失函数来更新的参数,使滤波处理结果不断接近目标图像。对抗损失函数设置为滤波处理后图像与目标图像的概率分布EMD,从而在训练过程中保持网络的稳定性,并且避免梯度消失现象,判别器的损失函数Lw定义为:
Figure BDA0003078844650000072
其中,s表示经当前选择的滤波处理后的图像状态,ρπ是状态分布系数,targetdataset表示目标图像数据集,D表示判别器网络得到的损失值。利用判别器的损失计算网络的奖励值,用于判断滤波动作和图像处理状态的优劣,故Actor网络的损失函数Lactor为:
Lactor=-E[D(s)]
使用判别器网络的损失值作为奖励的负值来影响Actor网络的训练,使经Actor网络处理的图像结果更加接近目标图像。
步骤S4、利用Actor-Critic模型训练图像滤波器得到的一组最优滤波顺序和参数,具体如下:
将训练集中的正常光照下的人体手背静脉图像作为标签图像,将低曝光手背静脉图像作为输入图像,通过Actor-Critic模型对图像滤波器中的饱和度、白平衡、色调曲线、对比度函数和曝光函数曲线的滤波顺序和参数进行迭代更新。通过判别器网络判断滤波处理后的图像与标签图像之间的差距,将上述差距输入到Critic网络得到图像的奖励值,指导Actor网络对滤波顺序和滤波参数的训练,得到一组最优滤波顺序和参数。
步骤S5、采集M幅低曝光的人体手背静脉图像,100<M<1000;对上述低曝光的人体手背静脉图像逐一进行有效区域提取,得到像素大小为h×w的M幅静脉图像,作为测试集。
步骤S6、为了表示每个滤波操作对应图像的互补静脉细节信息,使用像素的梯度反映图像像素密度的变化值,每个滤波操作对应图像的水平方向和竖直方向梯度值的计算公式如下:
(Gradeh,Gradev)=(Ii+1,j-Ii,j,Ii,j+1,-Ii,j)
其中Gradeh和Gradev分别表示水平和竖直方向的梯度值,I表示输入的图像,i和j分别对应表示图像像素点的横坐标和纵坐标。
利用Actor-Critic模型训练图像滤波器得到的一组最优滤波顺序和参数对测试集进行滤波操作,输出每个滤波操作对应图像。由于输出了每个滤波操作对应图像,其中包含了中间处理过程的图像,中间处理过程的图像增强程度不一,细节信息的丰富程度也不同,通过划分图像亮暗区域来提取中间处理过程的不同图像的细节,使不同亮度的区域增强程度不同,达到更准确的增强效果;图像亮暗区域的划分和不同区域的梯度权重计算如下式所示:
Figure BDA0003078844650000081
Figure BDA0003078844650000082
其中p表示图像的像素点,T1(p)是图像中暗区域的梯度权重,TN(p)是图像中亮区域的梯度权重,Y1(p)是图像的暗区域的像素亮度值,YN(p)是图像亮区域的像素亮度值,θ1和θN为图像亮暗区域划分的阈值。
根据图像中暗区域和亮区域的梯度权重的平均值构建梯度矢量场,其中水平方向的重建Vh(p)为:
Figure BDA0003078844650000091
其中u表示不同滤波操作后的图像,N代表输入的图像数量;Pr表示图像像素点p右边的像素点;Gradeh表示水平方向的梯度值;T1()是图像中暗区域的梯度权重,TN()是图像中亮区域的梯度权重;
二次损失函数定义为:
Figure BDA0003078844650000092
其中第一项是平滑项,在细节层产生作用,它的值接近0。第二项是保真度项,用于保留更多的细节信息,参数μ控制向量场光滑程度,μ设置为0.5。Ld为细节项,Vh表示梯度矢量场的水平方向值,x表示坐标轴的x方向,y表示坐标轴的y方向,定义边缘归一化项
Figure BDA0003078844650000093
为:
Figure BDA0003078844650000094
其中q代表梯度敏感值,ε是一个常数。
步骤S7、将提取到的互补静脉细节信息叠加到Actor-Critic模型选取的滤波操作中最后一次滤波操作处理后的图像,达到静脉图像细节增强的效果,静脉图像细节增强过程表示为:
Figure BDA0003078844650000095
其中,I为滤波处理后的图像,I′为经细节增强后得到的图像,Ld为提取到的细节项。最终输出增强的静脉图像。
实施例1
本发明所述的基于Actor-Critic模型的低曝光静脉图像增强方法,步骤如下:
步骤S1、为了验证本方法的有效性,采用自制静脉数据集(Data-1)和公开数据集PTUPalmvein(Data-2),并使用ROI提取方法提取数据集中静脉图像的有效区域,得到像素大小为512*800的静脉图像。在使用处理过的Data-1数据集时,使用2000张正常曝光的手背静脉图像,以及2000张采用伽马变化和添加高斯噪声处理合成的低曝光手背静脉图像作为训练集。使用处理过的Data-2数据集时,由于此数据集为公开数据集,无法自行采集,故使用数据集的前两个部分共800张正常曝光的手掌静脉图像,800张合成的低曝光手掌静脉图像作为训练集。经ROI处理后的部分静脉图像如图2所示。
步骤S2、将饱和度、白平衡、色调曲线、对比度函数和曝光函数设置成可微的图像滤波器。选取一组滤波函数作为神经网络的层,其中filter1为图像饱和度调整,filter2为图像对比度调整,filter3为图像色调调整,filter4为图像曝光调整,filter5为白平衡处理。
步骤S3、构建静脉图像增强的Actor-Critic模型:
所述Actor-Critic模型包括一个Critic网络、一个判别器网络和两个Actor网络。Actor-Critic模型的网络结构包括4个大小为4×4,步长为2×2的卷积层和2个全连接层。两个Actor网络用于选择滤波操作和滤波参数,由于Actor网络是基于策略梯度的强化学习网络,故使用策略梯度更新参数,为了加快网络的收敛速度,两部分网络使用交叉方式同时训练。由于滤波操作的选择是一个离散过程,偏导数不容易计算,使得梯度不能反向传播。因此滤波选择的Actor网络的目标函数使用蒙特卡洛策略梯度训练。因为所用的滤波器都是可微的,所以滤波参数的优化可以直接使用梯度下降法。各个部分网络的学习率设置不同,其中Actor网络的学习率设置为1.5×10-5、Critic网络的学习率设置为5×10-5,判别器网络的学习率设置为5×10-4。滤波操作选择策略网络π1使用softmax激活函数,滤波参数更新策略网络π2使用tanh激活函数。在训练过程中,还需要策略评估来衡量一个策略的好坏,这里使用TD策略评估,使用策略评估来更新Critic网络的参数。在训练过程中判别器损失值作为奖励的负值来影响Actor网络的训练,使经Actor网络处理的图像结果更加接近目标图像。
步骤S4、利用Actor-Critic模型训练图像滤波器得到的一组最优滤波顺序和参数:
使用Actor-Critic模型训练图像滤波器对滤波参数进行更新,自动寻找适合当前图像的滤波顺序和参数,避免人工选取参数的问题。经过滤波处理之后,Data-1的增强结果如图3所示,Data-2的增强结果如图4所示,两图均为Actor-Critic模型选取的一组最优的滤波处理顺序和参数。由图可知,由于静脉图像色彩比较单一,所以滤波处理的效果较多集中在对光照及静脉轮廓信息的处理上。对Data-1手背静脉图像进行增强之后,静脉图像的轮廓信息保留较完整,由低曝光图像到正常曝光的静脉图像中,静脉图像的对比度失真较小。但是,当个体的静脉血管比较细时,使用全局处理的方式容易导致静脉细节信息的丢失。如图4中第3行的静脉图像,在处理之后,静脉图像出现虚化的现象,导致静脉图像静脉信息的丢失。对Data-2手掌静脉图像进行增强之后,图像的光照成分基本恢复,且图像的对比度明显得到增强。由于Data-2数据集正常光照的时候部分存在底色偏红的情况,在对其进行低光照图像处理的时候没有改变其本身的图像构成,故恢复出来的图像呈现偏红色的情况。总的来说,Actor-Critic模型能够参照正常曝光的图像,实现光照恢复的同时能够在人眼视觉层面提高图像的对比度,对静脉图像进行了有效增强。
步骤S5、采用自制静脉数据集(Data-1)和公开数据集PTUPalmvein(Data-2)并使用ROI提取方法提取数据集中静脉图像的有效区域,得到像素大小为512*800的静脉图像。在使用处理过的Data-1数据集时,使用300张低曝光的手背静脉图像作为测试集,验证模型的有效性。使用处理过的Data-2数据集时,使用数据集第三部分合成的400张低曝光手掌静脉图像作为测试集。经ROI处理后的部分静脉图像如图2所示。
步骤S6、在对低曝光静脉图像的增强过程中,由于使用基于全局图像的滤波函数处理容易导致静脉细节信息的丢失,故在Actor-Critic模型训练图像滤波器得到的一组最优滤波顺序和参数对测试集进行滤波操作之后,对每一次滤波操作后的静脉图像进行细节提取。在整体亮度较低的图像中,局部较亮的区域包含较多的细节信息;相反,在整体亮度较高的图像中,局部较暗的区域包含较多的细节信息。因此,在滤波过程中提取静脉细节信息能取得较好的效果。通过设置阈值的方式来判断像素属于暗区域还是亮区域,亮度阈值为θ1和θN。经过实验,将亮度阈值θ1和θN设置为127取得的细节提取效果最好。对于静脉细节信息的提取主要是结合静脉图像的光照强度变化,对不同亮度的静脉图像区域,针对性地提取静脉的细节信息。
S7、将提取到的互补静脉细节信息叠加到Actor-Critic模型选取的滤波操作中最后一次滤波操作处理后的图像,最终输出增强的静脉图像。处理结果如图5和图6所示。由图可知,细节增强在视觉层面上增强了静脉图像的细节信息,经过静脉细节增强之后,静脉图像的对比度得到提升,静脉结构的拓扑结构和静脉图像的一些细微的血管信息也得到相应的增强,表明提出的静脉细节增强算法的有效性。

Claims (8)

1.一种基于Actor-Critic模型的低曝光静脉图像增强方法,其特征在于,步骤如下:
步骤S1、在采集K幅正常光照下的人体手背静脉图像,100<K<10000,使用伽马变化和添加高斯噪声模拟低光照环境对上述人体手背静脉图像逐张进行处理合成低曝光手背静脉图像,构成K组图像对,对上述正常光照下的人体手背静脉图像和低曝光手背静脉图像逐一进行有效区域提取,得到像素大小为h×w的2K幅静脉图像,构成训练集;
步骤S2、将饱和度、白平衡、色调曲线、对比度函数和曝光函数设置成可微的图像滤波器;
步骤S3、构建静脉图像增强的Actor-Critic模型:
所述Actor-Critic模型包括Critic网络、判别器网络和两个Actor网络,两个Actor网络用于选取滤波顺序和参数;Critic网络用于获取图像状态的奖励值;判别器网络用于判断图像质量,作为奖励值计算的辅助;
步骤S4、利用Actor-Critic模型训练图像滤波器得到的一组最优滤波顺序和参数:
将训练集中的正常光照下的人体手背静脉图像作为标签图像,将低曝光手背静脉图像作为输入图像,通过Actor-Critic模型对图像滤波器中的饱和度、白平衡、色调曲线、对比度函数和曝光函数曲线的滤波顺序和参数进行迭代更新;通过判别器网络判断滤波处理后的图像与标签图像之间的差距,将上述差距输入到Critic网络得到图像的奖励值,指导Actor网络对滤波顺序和滤波参数的训练,得到一组最优滤波顺序和参数;
步骤S5、采集M幅低曝光的人体手背静脉图像,100<M<1000;对上述低曝光的人体手背静脉图像逐一进行有效区域提取,得到像素大小为h×w的M幅静脉图像,作为测试集;
步骤S6、利用Actor-Critic模型训练图像滤波器得到的一组最优滤波顺序和参数对测试集进行滤波操作,输出每个滤波操作对应图像,并提取每个滤波操作对应图像的互补静脉细节信息;
步骤S7、将提取到的互补静脉细节信息叠加到Actor-Critic模型选取的滤波操作中最后一次滤波操作处理后的图像,最终输出增强后的静脉图像。
2.根据权利要求1所述的基于Actor-Critic模型的低曝光静脉图像增强方法,其特征在于,步骤S3中,在构建Actor-Critic模型时,将饱和度、白平衡、色调曲线、对比度函数和曝光函数滤波操作作为强化学习中的行为,执行完一组滤波操作之后的图像作为强化学习中的一种状态;Actor-Critic网络中滤波的处理轨迹t定义为:
t=(s0,a0,s1,a1,…,sk,ak,…,sN,aN)
其中s代表滤波处理后的图像状态,a代表滤波操作,k是执行滤波动作的第k次,N是执行滤波动作的第N次,sk表示第k次的滤波状态,ak表示第k次的滤波动作,sN表示第N次的滤波状态,aN表示第N次的滤波动作;
Actor-Critic网络在不同的状态下得到不同的奖励值,实现滤波参数的更新,最终目标是在决策的过程中选择出一组能使奖励值最大的最优滤波处理策略;奖励值与静脉图像的质量成正相关,奖励值最大时静脉图像质量最佳;定义
Figure FDA0003078844640000026
是在经过滤波操作得到滤波状态sk时的奖励值:
Figure FDA0003078844640000021
其中γ∈[0,1]是一个折现因子,k′表示经过滤波处理的步骤数量,r表示滤波的奖励值函数;通过Critic网络评估获取滤波处理策略,定义Critic网络的目标函数J(π)为:
Figure FDA0003078844640000022
其中s0是输入图像状态,E是期望值,S0是输入的训练集,π是最优的滤波处理策略,t为滤波处理的轨迹;Critic网络的训练目标是使目标函数J(π)的值最大,训练时在不同的状态转移中寻找到最大的奖励值,使判别器网络收敛,得到质量最好的静脉图像;状态和状态-动作对的预期总折现奖励由状态值函数V和动作值函数Q定义:
Figure FDA0003078844640000023
Figure FDA0003078844640000024
其中s代表滤波处理后的图像状态,a代表滤波操作,a0表示初始的滤波操作,
Figure FDA0003078844640000025
表示在经过滤波操作得到滤波状态sN时的奖励值。
3.根据权利要求1所述的基于Actor-Critic模型的低曝光静脉图像增强方法,其特征在于,步骤S3中,在Actor-Critic模型中,滤波操作过程分两部分进行,分别是滤波顺序的选择和滤波参数的更新,其中滤波顺序的选择为离散过程,滤波参数的更新为连续过程;Actor-Critic模型中的一个Actor网络用于选择合适的滤波顺序,另一个Actor网络用于训练合适的滤波参数;用于滤波顺序选择的Actor网络的梯度计算公式为:
Figure FDA0003078844640000031
用于滤波参数优化的Actor网络的梯度计算公式为:
Figure FDA0003078844640000032
其中,s表示经当前选择的滤波处理后的图像状态,a2z表示滤波操作的选择,a2z+1表示滤波参数的更新;两部分策略决定表示为π=(π12),其中π1表示滤波器选择a2z的策略,π2表示滤波参数优化操作a2z+1的策略;θ表示两个Actor网络的参数,θ1表示滤波操作选择的训练参数,θ2表示滤波参数更新的训练参数;
Figure FDA0003078844640000033
表示梯度更新,J(πθ)表示Actor的目标函数,Q表示状态值函数;ρπ是状态分布系数,定义如下:
Figure FDA0003078844640000034
其中,γ∈[0,1]是一个折现因子,P′表示当前状态为sk的概率,n表示某个具体的图像状态。
4.根据权利要求1所述的基于Actor-Critic模型的低曝光静脉图像增强方法,其特征在于,步骤S3中Actor-Critic模型中的Critic网络,用于评价滤波处理的优劣,得到图像的奖励值;Critic网络的状态值函数与Actor网络的相同,Critic网络的动作-值函数表示为:
Figure FDA0003078844640000035
其中,E是期望值;π表示最优的滤波处理策略,t为滤波处理的轨迹;s代表滤波处理后的图像状态,s0表示当前的图像状态为输入图像;a代表滤波操作,a0表示初始的滤波操作;Vπ表示状态值函数;r表示滤波的奖励值函数;P表示状态-动作对的概率;
将Qπ代入用于滤波参数更新的Actor网络的梯度训练公式,作为π2的监督信号用于训练网络;Critic网络的目标函数Lv为:
Figure FDA0003078844640000041
其中,v表示Critic网络的训练参数,s代表滤波处理后的图像状态,ρπ表示状态分布系数,a表示滤波操作,π(s)表示得到状态s的策略集,δ表示TD策略评估;TD策略评估用来衡量一个策略的优劣,使Critic网络进行参数更新,其表达式为:
δ=r(s,a)+γV(P(s,a))-V(s)
其中r表示滤波的奖励值函数,γ∈[0,1]是一个折现因子,P表示状态-动作对的概率,V表示状态值函数。
5.根据权利要求1所述的基于Actor-Critic模型的低曝光静脉图像增强方法,其特征在于,步骤S3中的判别器网络用于判断滤波处理后的图像与目标图像之间的差距;判别器通过对抗损失函数来更新的参数,使滤波处理结果不断接近目标图像;对抗损失函数设置为滤波处理后图像与目标图像的概率分布EMD,从而在训练过程中保持网络的稳定性,并且避免梯度消失现象;判别器的损失函数Lw定义为:
Figure FDA0003078844640000042
其中,s表示经当前选择的滤波处理后的图像状态,ρπ是状态分布系数,target dataset表示目标图像数据集,D表示判别器网络得到的损失值;利用判别器的损失计算网络的奖励值,用于判断滤波动作和图像处理状态的优劣,故Actor网络的损失函数Lactor为:
Lactor=-E[D(s)]
使用判别器网络的损失值作为奖励的负值来影响Actor网络的训练,使经Actor网络处理的图像结果更加接近目标图像。
6.根据权利要求1所述的基于Actor-Critic模型的低曝光静脉图像增强方法,其特征在于:
为了表示每个滤波操作对应图像的互补静脉细节信息,使用像素的梯度反映图像像素密度的变化值,每个滤波操作对应图像的水平方向和竖直方向梯度值的计算公式如下:
(Gradeh,Gradev)=(Ii+1,j-Ii,j,Ii,j+1,-Ii,j)
其中Gradeh和Gradev分别表示水平和竖直方向的梯度值,I表示输入的图像,i和j分别对应表示图像像素点的横坐标和纵坐标。
7.根据权利要求1所述的基于Actor-Critic模型的低曝光静脉图像增强方法,其特征在于:步骤S6中利用Actor-Critic模型训练图像滤波器得到的一组最优滤波顺序和参数对测试集进行滤波操作,输出每个滤波操作对应图像,具体如下:
由于输出了每个滤波操作对应图像,其中包含了中间处理过程的图像;中间处理过程的图像增强程度不一,细节信息的丰富程度也不同,通过划分图像亮暗区域来提取中间处理过程的不同图像的细节,使不同亮度的区域增强程度不同,达到更准确的增强效果;图像亮暗区域的划分和不同区域的梯度权重计算如下式所示:
Figure FDA0003078844640000051
Figure FDA0003078844640000052
其中p表示图像的像素点,T1(p)是图像中暗区域的梯度权重,TN(p)是图像中亮区域的梯度权重,Y1(p)是图像的暗区域的像素亮度值,YN(p)是图像亮区域的像素亮度值,θ1和θN为图像亮暗区域划分的阈值;
根据图像中暗区域和亮区域的梯度权重的平均值构建梯度矢量场,其中水平方向的重建Vh(p)为:
Figure FDA0003078844640000053
其中u表示不同滤波操作后的图像,N代表输入的图像数量;Pr表示图像像素点p右边的像素点;Gradeh表示水平方向的梯度值;T1()是图像中暗区域的梯度权重,TN()是图像中亮区域的梯度权重;
二次损失函数定义为:
Figure FDA0003078844640000061
其中第一项是平滑项,在细节层产生作用,它的值接近0;第二项是保真度项,用于保留更多的细节信息;参数μ控制向量场光滑程度,μ设置为0.5;Ld为细节项;Vh表示梯度矢量场的水平方向值;x表示坐标轴的x方向,y表示坐标轴的y方向;
Figure FDA0003078844640000062
表示边缘归一化项,定义为:
Figure FDA0003078844640000063
其中q代表梯度敏感值,ε是一个常数。
8.根据权利要求1所述的基于Actor-Critic模型的低曝光静脉图像增强方法,其特征在于,步骤S7中,将提取到的互补静脉细节信息以像素梯度的形式叠加到经过Actor-Critic模型训练得到的最优滤波策略处理后的图像上,达到静脉图像细节增强的效果,静脉图像细节增强过程表示为:
Figure FDA0003078844640000064
其中,I为滤波处理后的图像,I′为经细节增强后得到的图像,Ld为提取到的细节项。
CN202110560691.0A 2021-05-21 2021-05-21 基于Actor-Critic模型的低曝光静脉图像增强方法 Active CN113269698B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110560691.0A CN113269698B (zh) 2021-05-21 2021-05-21 基于Actor-Critic模型的低曝光静脉图像增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110560691.0A CN113269698B (zh) 2021-05-21 2021-05-21 基于Actor-Critic模型的低曝光静脉图像增强方法

Publications (2)

Publication Number Publication Date
CN113269698A true CN113269698A (zh) 2021-08-17
CN113269698B CN113269698B (zh) 2022-01-04

Family

ID=77232541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110560691.0A Active CN113269698B (zh) 2021-05-21 2021-05-21 基于Actor-Critic模型的低曝光静脉图像增强方法

Country Status (1)

Country Link
CN (1) CN113269698B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113902689A (zh) * 2021-09-24 2022-01-07 中国科学院深圳先进技术研究院 一种血管中心线提取方法、系统、终端以及存储介质
CN114900619A (zh) * 2022-05-06 2022-08-12 北京航空航天大学 一种自适应曝光驱动相机摄影水下图像处理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101626454A (zh) * 2009-04-10 2010-01-13 黄宝华 一种增强视频可视性的方法
CN110598763A (zh) * 2019-08-27 2019-12-20 南京云计趟信息技术有限公司 一种图像识别方法、装置及终端设备
CN110874578A (zh) * 2019-11-15 2020-03-10 北京航空航天大学青岛研究院 一种基于强化学习的无人机视角车辆识别追踪方法
US20200143208A1 (en) * 2018-11-05 2020-05-07 Royal Bank Of Canada Opponent modeling with asynchronous methods in deep rl

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101626454A (zh) * 2009-04-10 2010-01-13 黄宝华 一种增强视频可视性的方法
US20200143208A1 (en) * 2018-11-05 2020-05-07 Royal Bank Of Canada Opponent modeling with asynchronous methods in deep rl
CN110598763A (zh) * 2019-08-27 2019-12-20 南京云计趟信息技术有限公司 一种图像识别方法、装置及终端设备
CN110874578A (zh) * 2019-11-15 2020-03-10 北京航空航天大学青岛研究院 一种基于强化学习的无人机视角车辆识别追踪方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUANMING HU等: "Exposure: A White-Box Photo Post-Processing Framework", 《ACM TRANSACTIONS ON GRAPHICS》 *
郭业才,周腾威: "基于深度强化对抗学习的图像增强方法", 《扬州大学学报(自然科学版)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113902689A (zh) * 2021-09-24 2022-01-07 中国科学院深圳先进技术研究院 一种血管中心线提取方法、系统、终端以及存储介质
CN114900619A (zh) * 2022-05-06 2022-08-12 北京航空航天大学 一种自适应曝光驱动相机摄影水下图像处理系统
CN114900619B (zh) * 2022-05-06 2023-05-05 北京航空航天大学 一种自适应曝光驱动相机摄影水下图像处理系统

Also Published As

Publication number Publication date
CN113269698B (zh) 2022-01-04

Similar Documents

Publication Publication Date Title
CN107527332B (zh) 基于改进Retinex的低照度图像色彩保持增强方法
CN113269698B (zh) 基于Actor-Critic模型的低曝光静脉图像增强方法
CN109859147A (zh) 一种基于生成对抗网络噪声建模的真实图像去噪方法
CN110889812A (zh) 一种多尺度融合图像特征信息的水下图像增强方法
CN110009574B (zh) 一种低动态范围图像逆向生成高动态范围图像的方法
CN111415304A (zh) 基于级联深度网络的水下视觉增强方法和装置
CN115393227A (zh) 基于深度学习的微光全彩视频图像自适应增强方法及系统
CN115100093A (zh) 一种基于梯度滤波的医学图像融合方法
CN113284061A (zh) 一种基于梯度网络的水下图像增强方法
CN111462002B (zh) 一种基于卷积神经网络的水下图像增强与复原方法
Yan et al. A novel biologically-inspired method for underwater image enhancement
Tang et al. A local flatness based variational approach to retinex
CN107169942B (zh) 一种基于鱼类视网膜机制的水下图像增强方法
CN114972102A (zh) 基于全局变对比度增强和局部校正的水下图像增强方法
CN117541520A (zh) 一种基于最优化算法的低耦合Retinex模型的水下图像增强方法
CN116630198A (zh) 一种结合自适应伽马校正的多尺度融合水下图像增强方法
CN115760630A (zh) 一种低照度图像增强方法
CN114821021A (zh) 一种联合多通道均衡与多尺度融合的水下图像增强方法
CN114998173A (zh) 基于局部区域亮度调节的空间环境高动态范围成像方法
CN114119433A (zh) 一种基于贝塞尔曲线的暗图像处理方法
CN113920136A (zh) 一种改进的暗通道先验去雾算法
CN112686825A (zh) 一种基于fpga的地面浓雾场景灰度图像去雾方法
CN110796607B (zh) 一种基于视网膜大脑皮层理论的深度学习低光照图像增强方法
Fan et al. Underwater image enhancement algorithm combining color correction and multi-scale fusion
CN116843582B (zh) 基于深度学习的2cmos相机的去噪增强系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant