CN114187186A

CN114187186A - 一种纸质化验单图像预处理方法及系统

Info

Publication number: CN114187186A
Application number: CN202111248315.4A
Authority: CN
Inventors: 郝怀博; 李登旺; 黄浦; 吴冰; 左玉伟; 陈萍
Original assignee: Shandong Normal University
Current assignee: Shandong Normal University
Priority date: 2021-10-26
Filing date: 2021-10-26
Publication date: 2022-03-15
Anticipated expiration: 2041-10-26
Also published as: CN114187186B

Abstract

本发明公开一种纸质化验单图像预处理方法及系统，包括：构建包括背景估计子网络、阴影去除子网络和折痕去除子网络的化验单图像预处理模型；对纸质化验单图像采用背景估计子网络进行特征学习，得到全局背景色以及背景和非背景像素的空间分布特征，以此构建阴影注意力图；根据原始纸质化验单图像、全局背景色和阴影注意力图对阴影去除子网络训练后得到无阴影图像；根据无阴影图像采用背景估计子网络构建折痕注意力图，并根据无阴影图像和折痕注意力图对折痕去除子网络训练后，得到无阴影无折痕的化验单图像。提高图像视觉质量和可读性，并确保对具有不同特征的化验单图像具有较好的效果以及鲁棒性。

Description

一种纸质化验单图像预处理方法及系统

技术领域

本发明涉及图像处理技术领域，特别是涉及一种纸质化验单图像预处理方法及系统。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息，不必然构成在先技术。

目前，纸质化验单依然是医院检查报告的主要载体，但是不易保存。随着手机的普及，人们更倾向于使用手机摄像头拍摄来保存纸质文档，但是这样做往往会存在问题。例如，文档的几何形状可能会由于拍照角度而发生失真，还有可能因为光源被遮挡而形成阴影，特别地，当纸质化验单本身已存在折痕时，其页面光照分布不均匀问题尤其突出。上述问题会导致化验单的视觉质量和可读性变差，降低后续OCR(Optical CharacterRecognition，光学字符识别)提取信息的准确率。

针对手机拍摄的化验单图像失真问题，传统上多使用人工启发式算法解决图像阴影和折痕等失真问题，但是这对拥有不同特征的图像不具有鲁棒性。文档图像通常具有恒定的背景颜色，基于这一观察提出一种估计局部图像块中背景和文本颜色的技术。随后，将这些局部背景颜色估计与全局参考相匹配以生成阴影图，并使用此阴影图校正原始图像生成最终无阴影图。如文献Bako S,Darabi S,Shechtman E,et al.Removing shadows fromimages of documents[C]//Asian Conference on Computer Vision.Springer,Cham,2016:173-183。

除此之外，还有方法是通过图像材料的二维边界来校正几何和光度(阴影)失真，使用边界插值可以计算校正映射以同时消除常见的几何变形。此外，可以使用相同的插值框架来估计本征照明图像，这个估计的照明图像与原始图像一起可用于去除阴影。如文献，Brown M S,Tsoi Y C.Geometric and shading correction for images of printedmaterials using boundary[J].IEEE Transactions on Image Processing,2006,15(6):1544-1554。

目前，基于深度学习还未提出有效的统一方法同时去除各种文档失真问题，大多数技术专注于提出某种失真问题的解决方案。如文献，Li X,Zhang B,Liao J,etal.Document rectification and illumination correction using a patch-based CNN[J].ACM Transactions on Graphics(TOG),2019,38(6):1-11。使用深度学习的方法分别提出两个卷积神经网络来解决文档图像几何和光照失真，但是光照矫正网络对图像阴影和折痕的处理效果不好。

发明内容

为了解决上述问题，本发明提出了一种纸质化验单图像预处理方法及系统，去除纸质化验单图像的阴影和折痕，通过背景估计子网络提取化验单全局背景色特征，同时还学习背景与非背景像素的空间分布特征，以此构建阴影注意力图；结合卷积神经网络和堆叠的条件生成对抗网络生成去除阴影和折痕的化验单图像，提高图像视觉质量和可读性，并确保对具有不同特征的化验单图像具有较好的效果以及鲁棒性。

为了实现上述目的，本发明采用如下技术方案：

第一方面，本发明提供一种纸质化验单图像预处理方法，包括：

构建包括背景估计子网络、阴影去除子网络和折痕去除子网络折痕去除子网络的化验单图像预处理模型；

对纸质化验单图像采用背景估计子网络进行特征学习，得到全局背景色以及背景和非背景像素的空间分布特征，以此构建阴影注意力图；

根据原始纸质化验单图像、全局背景色和阴影注意力图对阴影去除子网络训练后得到无阴影图像；

根据无阴影图像采用背景估计子网络构建折痕注意力图，并根据无阴影图像和折痕注意力图对折痕去除子网络训练后，得到无阴影无折痕的化验单图像。

作为可选择的实施方式，所述背景估计子网络进行特征学习时，以有监督学习方式进行训练，以预测的全局背景色和原始图像间的损失为损失函数L_BE；具体为：

其中，b_i为真实图像下的全局背景色，Ψ_BE为背景估计子网络的映射，S_i为第i个原始纸质化验单图像，N为图像总数目。

作为可选择的实施方式，对所述阴影去除子网络进行训练时的损失函数L_SR为：

L_SR＝λ₁L_fata+λ₂L_GAN

其中，

其中，S_i为第i个原始纸质化验单图像，R_i为第i个原始纸质化验单图像的真实无阴影图像，

为第i个原始纸质化验单图像的无阴影图像，D为图像数据集，λ₁和λ₂为权重。

作为可选择的实施方式，对所述折痕去除子网络进行训练时的损失函数L_CR为：

L_CR＝λ₁L_data+λ₂L_GAN+λ₃L_VGG

其中，

其中，T_i为第i个原始纸质化验单图像的无阴影无折痕图像，R_i为第i个原始纸质化验单图像的真实无阴影图像，

为第i个原始纸质化验单图像的无阴影图像，D为图像数据集，λ₁、λ₂和λ₃为权重。

作为可选择的实施方式，所述背景估计子网络采用注意力机制，以根据注意力的不同生成阴影注意力图和折痕注意力图。

作为可选择的实施方式，根据Grad-CAM方法对全局背景色以及背景和非背景像素的空间分布特征进行编码后得到阴影注意力图。

作为可选择的实施方式，所述阴影去除子网络和折痕去除子网络均采用条件生成对抗网络，所述阴影去除子网络以原始纸质化验单图像、全局背景色和阴影注意力图为输入数据，以无阴影图像为真实图像进行训练；所述折痕去除子网络无阴影图像和折痕注意力图为输入数据，以无阴影无折痕图像为真实图像进行训练。

第二方面，本发明提供一种纸质化验单图像预处理系统，包括：

模型构建模块，被配置为构建包括背景估计子网络、阴影去除子网络和折痕去除子网络的化验单图像预处理模型；

注意力模块，被配置为对纸质化验单图像采用背景估计子网络进行特征学习，得到全局背景色以及背景和非背景像素的空间分布特征，以此构建阴影注意力图；

去阴影模块，被配置为根据原始纸质化验单图像、全局背景色和阴影注意力图对阴影去除子网络训练后得到无阴影图像；

去折痕模块，被配置为根据无阴影图像采用背景估计子网络构建折痕注意力图，并根据无阴影图像和折痕注意力图对折痕去除子网络训练后，得到无阴影无折痕的化验单图像。

第三方面，本发明提供一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成第一方面所述的方法。

第四方面，本发明提供一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成第一方面所述的方法。

与现有技术相比，本发明的有益效果为：

本发明提供一种基于条件生成对抗学习的纸质化验单图像预处理方法，主要针对纸质化验单图像进行去噪，包括去除阴影和折痕；通过背景估计子网络提取化验单全局背景色特征，同时还学习背景与非背景像素的空间分布特征，以此构建阴影注意力图；结合卷积神经网络和堆叠的条件生成对抗网络生成去除阴影和折痕的化验单图像，提高图像视觉质量和可读性，提高后续OCR操识别准确率，在多重阴影情况下依然具有较好的鲁棒性。

本发明去除化验单图像阴影和折痕的方法，通过使用浅层卷积神经网络作为背景估计模块提取化验单图像全局背景颜色特征，且采用注意力机制可以重点关注敏感区域，更易于模型训练收敛。

本发明去除化验单图像阴影和折痕的方法，利用类似U-Net网络作为条件生成对抗网络的生成器，结合浅层卷积神经网络和堆叠的条件生成对抗网络构建化验单图像预处理模型，条件生成对抗网络生成器使用类似U-Net结构并带有跳跃连接，在提取对象高层次特征时，同样也更好地提取图像的低层次特征；最后再利用包括像素级损失、生成对抗网络损失和VGG感知损失的多项损失策略促进训练收敛，从而提高生成图像的质量。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1为本发明实施例1提供的纸质化验单图像预处理方法流程图；

图2为本发明实施例1提供的阴影去除子网络的生成器结构示意图；

图3为本发明实施例1提供的阴影去除子网络鉴别器结构示意图；

图4为本发明实施例1提供的折痕去除子网络结构示意图。

具体实施方式

下面结合附图与实施例对本发明做进一步说明。

应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

实施例1

如图1所示，本实施例提供一种纸质化验单图像预处理方法，包括：

S1：构建包括背景估计子网络、阴影去除子网络和折痕去除子网络的化验单图像预处理模型；

S2：对纸质化验单图像采用背景估计子网络进行特征学习，得到全局背景色以及背景和非背景像素的空间分布特征，以此构建阴影注意力图；

S3：根据原始纸质化验单图像、全局背景色和阴影注意力图对阴影去除子网络训练后得到无阴影图像；

S4：根据无阴影图像采用背景估计子网络构建折痕注意力图，并根据无阴影图像和折痕注意力图对折痕去除子网络训练后，得到无阴影无折痕的化验单图像。

在本实施例中，还包括利用像素级损失、生成对抗网络损失和VGG感知损失的多项损失策略促进模型收敛，以得到最终处理后的无阴影无折痕化验单图像。

本实施例基于深度学习方法去除化验单图像的阴影区域和折痕，使用浅层卷积神经网络作为背景估计模块提取化验单图像全局背景颜色信息，利用U-Net作为条件生成对抗网络生成器的主干网络，结合浅层卷积神经网络和堆叠的条件生成对抗网络构建化验单图像预处理模型。

化验单图像预处理模型包括三个子网络，即：背景估计子网络(BackgroundEstimationNetwork,BE-Net)、阴影去除子网络(ShadowRemoval Network,SR-Net)、折痕去除子网络(Crease Removal Network,CR-Net)；

其中，所述背景估计子网络学习全局背景颜色特征，以及背景与非背景像素的空间分布特征，并利用Grad-Cam将之编码为阴影注意力图Attention map；对于纸质化验单图像，阴影和折痕是重点关注的局部对象，因此本实施例引入注意力机制，重点关注感兴趣的特征区域，且对于不同的输入图像生成注意力重点不同的注意力图。

所述阴影去除子网络和折痕去除子网络均为条件生成对抗神经网络，二者的生成器均采用了类似U-Net的网络结构并带有跳跃连接，在提取化验单图像高维特征时，同样更好地提取图像的低维特征(例如几何形状、背景颜色和光照信息)，同时将低维特征与高维特征结合后，更好地生成去除噪声的图像。

具体地，对于带有折痕和阴影的原始输入图像，经过背景估计子网络提取编码信息生成阴影注意力图；将原始图像、全局背景颜色特征和阴影注意力图经过阴影去除子网络后，得到无阴影图像；将无阴影图像再次经过背景估计子网络提取编码信息得到折痕注意力图；依次连接无阴影图和折痕注意力图用来训练折痕去除子网络，利用折痕去除子网络生成最终校正后的图像；此外，本实施例还利用包括像素级损失、生成对抗网络损失和VGG感知损失的多项损失策略促进训练收敛，从而提高生成图像的质量。

具体地，给定图像数据集D，

其中，S表示原始图像，R表示无阴影图像(Ground truth)，T表示无阴影无折痕图像(Ground truth)，b表示全局背景色(Ground truth)，N表示图像总数目。

采用

以有监督学习方式训练背景估计子网络BE-Net，采用训练后的BE-Net估计全局背景颜色

和阴影注意力图

即，

其中，Ψ_BE表示背景估计子网络的映射。

将原始图像S和

作为输入数据，无阴影图像R作为真实图像，采用

训练阴影去除子网络SR-Net，得到无阴影图像

即，

其中，Ψ_SR表示阴影去除子网络的映射。

根据无阴影图像

采用背景估计子网络BE-Net得到折痕注意力图

将无阴影图像

和

作为输入数据，无阴影无折痕图像T作为真实图像，采用

训练折痕去除子网络CR-Net，得到效果类似扫描的去噪化验单图像，即，

其中，Ψ_CR表示折痕去除子网络的映射。

具体地，所述背景估计子网络BE-Net包括四层卷积层、全局最大池化层和全连接层，如图1所示，其中，最后一层卷积层输出特征维度为128，经过全局最大池化层后可以唯一确定全连接层的输入维度也为128，由此带来的好处是输入图像的尺寸可以为任意大小。

背景估计子网络学习提取图像的全局背景颜色，同时，BE-Net的卷积层还学习背景与非背景的空间分布特征；然后利用Grad-CAM方法从最后一层卷积层提取梯度生成与输入图像尺寸一致的Attention Map；Attention Map中的每个数值反映对应像素点属于背景的概率大小。

需要注意的是，图1中化验单图像为待处理的图像，本实施例是对纸质化验单图像的折痕和阴影进去去噪，所以图1中所示出的化验单图像中的文字不清楚不影响对本实施例方案的理解。

背景估计子网络以有监督学习方式进行训练，损失函数为预测全局背景颜色和Ground truth的L1损失之和，即，

具体地，所述阴影去除子网络SR-Net是条件生成对抗网络，生成器采用类似U-Net网络结构并带有跳跃连接，如图2所示，提取图像低维几何信息，以及通过跳跃连接结合高维语义信息；其中，收缩路径(左侧)和扩展路径(右侧)各有3层使用相同的层次结构，以此减少参数量；鉴定器如图3所示，鉴别器复用了生成器收缩路径的基本组件，主要用来提取图像的特征，从而鉴别真假图像。

所述阴影去除子网络的损失函数为：

L_SR＝λ₁L_data+λ₂L_GAN#(6)

其中，L_data指预测的去除阴影图像

与ground truthR_i的像素级L1损失；L_GAN指去除阴影子网络的损失。

其中，

具体地，所述折痕去除子网络CR-Net是条件生成对抗网络，其结构和阴影去除子网络结构相同，不同点在于输入数据和损失函数；VGG19网络使用19层网络结构，具体结构如图4所示，去除全连接层和softmax，取第五次最大池化层输出作为VGG19网络输出，减少全连接层带来的巨大参数量问题。

所述折痕去除子网络的损失函数为：

L_CR＝λ₁L_data+λ₂L_GAN+λ₃L_VGG#(9)

其中，

实施例2

本实施例提供一种纸质化验单图像预处理系统，包括：

此处需要说明的是，上述模块对应于实施例1中所述的步骤，上述模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例1所公开的内容。需要说明的是，上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。

在更多实施例中，还提供：

一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成实施例1中所述的方法。为了简洁，在此不再赘述。

应理解，本实施例中，处理器可以是中央处理单元CPU，处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC，现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如，存储器还可以存储设备类型的信息。

一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成实施例1中所述的方法。

实施例1中的方法可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

本领域普通技术人员可以意识到，结合本实施例描述的各示例的单元即算法步骤，能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.一种纸质化验单图像预处理方法，其特征在于，包括：

构建包括背景估计子网络、阴影去除子网络和折痕去除子网络的化验单图像预处理模型：

2.如权利要求1所述的一种纸质化验单图像预处理方法，其特征在于，所述背景估计子网络进行特征学习时，以有监督学习方式进行训练，以预测的全局背景色和原始图像间的损失为损失函数L_BE；具体为：

3.如权利要求1所述的一种纸质化验单图像预处理方法，其特征在于，对所述阴影去除子网络进行训练时的损失函数L_SR为：

L_SR＝λ₁L_data+λ₂L_GAN

其中，

4.如权利要求1所述的一种纸质化验单图像预处理方法，其特征在于，对所述折痕去除子网络进行训练时的损失函数L_CR为：

L_CR＝λ₁L_data+λ₂L_GAN+λ₃L_VGG

其中，

5.如权利要求1所述的一种纸质化验单图像预处理方法，其特征在于，所述背景估计子网络采用注意力机制，以根据注意力的不同生成阴影注意力图和折痕注意力图。

6.如权利要求1所述的一种纸质化验单图像预处理方法，其特征在于，根据Grad-CAM方法对全局背景色以及背景和非背景像素的空间分布特征进行编码后得到阴影注意力图。

7.如权利要求1所述的一种纸质化验单图像预处理方法，其特征在于，所述阴影去除子网络和折痕去除子网络均采用条件生成对抗网络，所述阴影去除子网络以原始纸质化验单图像、全局背景色和阴影注意力图为输入数据，以无阴影图像为真实图像进行训练；所述折痕去除子网络无阴影图像和折痕注意力图为输入数据，以无阴影无折痕图像为真实图像进行训练。

8.一种纸质化验单图像预处理系统，其特征在于，包括：

9.一种电子设备，其特征在于，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，用于存储计算机指令，所述计算机指令被处理器执行时，完成权利要求1-7任一项所述的方法。