CN113591832A

CN113591832A - 图像处理模型的训练方法、文档图像处理方法及设备

Info

Publication number: CN113591832A
Application number: CN202110959149.2A
Authority: CN
Inventors: 杨腾飞; 吴亚军
Original assignee: Hangzhou Shucheng Technology Co ltd
Current assignee: Hangzhou Shucheng Technology Co ltd
Priority date: 2021-08-20
Filing date: 2021-08-20
Publication date: 2021-11-02
Anticipated expiration: 2041-08-20
Also published as: CN113591832B

Abstract

本申请提供一种图像处理模型的训练方法、文档图像处理方法及设备。该方法包括：在多张无噪白底黑字图像中分别加入噪声，得到多张有噪白底黑字图像；将有噪白底黑字图像与多张背景图分别进行融合，得到多张样本文档图像，多张背景图为多种不同的场景图像；对无噪白底黑字图像进行反色处理，得到无噪黑底白字图像；将样本文档图像和无噪黑底白字图像进行一一对应，得到训练样本集，训练样本集包括：多组样本图像，每组样本图像包括：一张样本文档图像和对应的无噪黑底白字图像；根据训练样本集进行模型训练，得到图像处理模型，以对输入的文档图像进行去噪和黑白化处理。本申请训练的图像处理模型能更好地保留文字内容，可同时处理多个文档图像。

Description

图像处理模型的训练方法、文档图像处理方法及设备

技术领域

本申请涉及图像处理领域，具体而言，涉及一种图像处理模型的训练方法、文档图像处理方法及设备。

背景技术

随着社会的高速发展，各种高新技术层出不穷。图像作为一种可传递大量信息的载体，在诸多领域被广泛的应用。但是，图像在数字化和传输过程中会受到成像设备和外部环境噪声的影响，导致图像的可视化效果变差，影响到对图像中有效信息的提取。例如，在现实场景中，为获取文档图像，会对文档图像进行电子扫描、拍照等处理，处理时的场景可能会对文档图像有一定的干扰，使得文档图像变得模糊不清，并不能够完整清楚地展示图像中的文字内容，因此，需要对获取到的文档图像进行处理，以清楚地展示文档图像中的文字内容。

但现有的图像去噪方法，仅仅只是对噪声图像进行去噪，使得图像变得清晰一些，并不改变原图像的显示结构，泛化能力弱，无法对来自不同场景的图像进行去噪。在处理文档图像时，会将一个文档图像看做一个整体进行去噪清晰化处理，并不能针对性地处理文档图像中的文字内容，依然无法清楚地展示文档图像中的文字内容。

发明内容

本发明的目的在于，针对上述现有技术中的不足，提供一种图像处理模型的训练方法、文档图像处理方法及设备，以解决现有技术中，无法清楚地展示文档图像中的文字内容等问题。

为实现上述目的，本申请实施例采用的技术方案如下：

第一方面，本申请实施例提供一种图像处理模型的训练方法，该方法包括：

在多张无噪白底黑字图像中分别加入噪声，得到多张有噪白底黑字图像；

将所述有噪白底黑字图像与多张背景图分别进行融合，得到多张样本文档图像，其中，所述多张背景图分别为多种不同的场景图像；

对所述无噪白底黑字图像进行反色处理，得到无噪黑底白字图像；

将所述样本文档图像和所述无噪黑底白字图像进行一一对应，得到训练样本集，所述训练样本集包括：多组样本图像，每组样本图像包括：一张样本文档图像和对应的无噪黑底白字图像；

根据所述训练样本集进行模型训练，得到图像处理模型，以对输入的文档图像进行去噪和黑白化处理。

可选地，所述在多张无噪白底黑字图像中分别加入噪声，得到多张有噪白底黑字图像，包括：

分别采用至少一组噪声参数，在所述无噪的白底黑字图像中加入噪声，得到至少一组所述有噪白底黑字图像，每组所述有噪高清的白底黑字图像对应一组噪声参数。

可选地，所述无噪白底黑字图像为无噪高清的白底黑字图像，相应的，所述有噪白底黑字图像为有噪高清的白底黑字图像；

所述将所述有噪白底黑字图像与多张背景图分别进行融合，得到多张样本文档图像，包括：

对所述有噪高清的白底黑字图像进行滤波，得到有噪模糊的白底黑字图像；

将所述有噪模糊的白底黑字图像与所述多张背景图分别进行融合，得到多张所述样本文档图像。

可选地，所述对所述有噪高清的白底黑字图像进行滤波，得到有噪模糊的白底黑字图像，包括：

分别采用至少一组滤波参数，对所述有噪高清的白底黑字图像进行滤波，得到至少一组所述有噪模糊的白底黑字图像，每组所述有噪模糊的白底黑字图像对应一组滤波参数。

可选地，所述将所述有噪白底黑字图像与多张背景图分别进行融合，得到所多张样本文档图像之前，所述方法还包括：

采用至少一组权重参数，将所述有噪的白底黑字图像与每张所述背景图进行融合，得到至少一组所述样本文档图像，每组所述样本文档图像对应一组权重参数。

可选地，所述根据所述训练样本集进行模型训练，得到图像处理模型之前，所述方法还包括：

依次采用不同的多种图像编辑方式对所述训练样本集中的各组样本图像进行编辑处理，得到多组不同的编辑样本图像；

将所述多组不同的编辑样本图像增加至所述训练样本集中。

可选地，所述根据所述训练样本集进行模型训练，得到图像处理模型，所述方法包括：

将所述训练样本集分成多个批次的样本图像，每个批次的样本图像包括多组样本图像；

将所述多个批次的样本图像进行多次模型训练，得到所述文档图像处理模型。

可选地，所述根据所述训练样本集进行模型训练，得到图像处理模型还包括：

对所述多组样本图像中的样本文档图像和无噪黑底白字图像均进行灰度转换，得到多组样本灰度图像；

根据所述多组样本灰度图像进行模型训练，得到所述图像处理模型，以对输入的文档图像对应的灰度图像进行去噪和黑白化处理。

第二方面，本申请实施例提供一种文档图像处理方法，该方法包括：

获取待处理文档图像；

采用预先训练的图像处理模型，对所述待处理文档图像进行去噪和黑白化处理，得到所述待处理文档图像对应的黑底白字图像；其中，所述图像处理模型，为采用上述第一方面中任一所述的图像处理模型的训练方法得到的模型；

对所述黑底白字图像进行反色变换，得到所述目标文档图像对应的白底黑字图像。

第三方面，本申请实施例提供一种电子设备，包括：处理器、存储器，所述存储器存储可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序，以执行上述第一方面的图像处理模型的训练方法的步骤。

相对于现有技术而言，本申请具有以下有益效果：

本申请实施例提供一种图像处理模型的训练方法，首先在多张无噪白底黑字图像中分别加入噪声，得到多张有噪白底黑字图像；将所述有噪白底黑字图像与多张背景图分别进行融合，得到多张样本文档图像，其中，所述多张背景图分别为多种不同的场景图像；对所述无噪白底黑字图像进行反色处理，得到无噪黑底白字图像；将所述样本文档图像和所述无噪黑底白字图像进行一一对应，得到训练样本集，所述训练样本集包括：多组样本图像，每组样本图像包括：一张样本文档图像和对应的无噪黑底白字图像；根据所述训练样本集进行模型训练，得到图像处理模型，以对输入的文档图像进行去噪和黑白化处理。本申请通过对无噪声白底黑字文档图像添加噪声并与实际场景的背景图进行融合，训练得到图像处理模型，使用该模型对文档图像处理，相较于传统方法能更多更好的保留文字印刷体的纹理细节，可同时处理多个文档图像，泛化能力强。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的图像处理模型的训练方法的一种流程示意框图；

图2为本申请实施例提供的一种图像处理模型的训练方法中一种扩充训练样本集的流程示意图；

图3为本申请实施例提供的一种图像处理模型的训练方法中另一种扩充训练样本集的流程示意图；

图4为本申请实施例提供的一种图像处理模型的训练方法中另一种扩充训练样本集的流程示意图；

图5为本申请实施例提供的一种图像处理模型的训练方法中另一种扩充训练样本集的流程示意图；

图6为本申请实施例提供的一种图像处理模型的训练方法中一种高精度地训练模型的流程示意图；

图7为本申请实施例提供的一种图像处理模型的训练方法中一种高效地训练模型的流程示意图；

图8为本申请实施例提供的一种文档图像处理方法流程示意图；

图9为本申请实施例提供的一种图像处理模型的训练装置的示意图；

图10为本申请实施例提供的一种文档图像处理装置的示意图；

图11为本申请实施例提供的一种电子设备的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

在本发明的描述中，需要说明的是，若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，或者是该发明产品使用时惯常摆放的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，若出现术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

需要说明的是，在不冲突的情况下，本发明的实施例中的特征可以相互结合。

为实现对文档图像的处理，使得处理后的图像可清楚展示文档图像中的文字内容，本申请的方案中，提供一种图像处理模型的训练方法，得到图像处理模型，继而采用训练得到的图像处理模型，对文档图像的去噪和黑白化处理，得到文档图像对应的白底黑字图像，以清楚展示文档图像中的文字内容。

如下先通过具体示例，对本申请实施例所提供的图像处理模型的训练方法进行解释说明。图1为本申请实施例提供的一种图像处理模型的训练方法流程示意图，该方法的执行主体可以是计算机设备，该计算机设备可以为具有计算处理功能的设备，如台式电脑、笔记本电脑、平板电脑等。

如图1所示，该方法包括：

S101、在多张无噪白底黑字图像中分别加入噪声，得到多张有噪白底黑字图像。

在执行S101之前，可先获取多张无噪白底黑字图像，并将获取到的多张无噪白底黑字图像作为标签集。示例的，针对每张无噪白底黑字图像，可采用预设的噪声参数，在每张无噪白底黑字图像中加入预设类型的噪声，例如高斯噪声，得到加噪后的一张有噪白底黑字图像。

S102、将有噪白底黑字图像与多张背景图分别进行融合，得到多张样本文档图像。

其中，多张背景图分别为多种不同的场景图像。在执行S102之前，可先获取来自多个不同场景的场景图像，其中，每张背景图为一个实际场景中不带印刷体的图像，即场景中的非文档图像。每张背景图中含有对应场景中的实际噪声、底色或者纹理信息等。

示例地，可将有噪白底黑字图像与每张背景图进行融合，得到一张样本文档图像，该一张样本文档图像实际为该每张背景图对应场景的仿真文档图像，即近似于对应场景的文档图像。

S103、对无噪白底黑字图像进行反色处理，得到无噪黑底白字图像。

在实际应用中，可采用预设的反色工具或软件，对该无噪白底黑字图像进行反色处理，以将该无噪白底黑字图像中的白色背景变为黑色背景，将该无噪白底黑字图像中的黑色文字变为白色文字，如此，即可得到该无噪黑底白字图像。

S104、将样本文档图像和无噪黑底白字图像进行一一对应，得到训练样本集，训练样本集包括：多组样本图像，每组样本图像包括：一张样本文档图像和对应的无噪黑底白字图像。

经过上述S101-S103的处理，针对每张无噪白底黑字图像，得到了多张样本文档图像，而每张无噪白底黑字图像具有对应的无噪黑底白字图像，如此针对上述得到的多张样本文档图像，以及多张无噪黑底白字图像进行一一对应，实现样本图像的对应分组，得到训练样本集。

S105、根据训练样本集进行模型训练，得到图像处理模型，以对输入的文档图像进行去噪和黑白化处理。

在实际应用场景中，可根据训练样本集，采用预设的网络架构进行模型训练，得到满足该网络架构的图像处理模型，例如U2-Net网络的图像处理模型。由于上述训练样本集中每组样本图像具有添加有噪声且与背景图融合的样本文档图像，保证了训练得到的图像处理模型，可实现对文档图像的去噪，并且，由于在得到样本文档图像的时候，针对每张有噪白底黑字图像与来自多个不同场景的多张背景图进行融合得到的，因此，保证了训练得到的图像处理模型，可实现来自多个不同场景中的文档图像的去噪处理；其次，由于训练样本集中每组样本图像还具有经反色处理后的无噪黑底白字图像，可使得训练得到的图像处理模型可实现文档图像的黑白化处理。

综上，本申请提供的图像处理模型的训练方法，通过在多张无噪白底黑字图像中分别加入噪声，得到多张有噪白底黑字图像；将所述有噪白底黑字图像与多张背景图分别进行融合，得到多张样本文档图像，其中，所述多张背景图分别为多种不同的场景图像；对所述无噪白底黑字图像进行反色处理，得到无噪黑底白字图像；将所述样本文档图像和所述无噪黑底白字图像进行一一对应，得到训练样本集，所述训练样本集包括：多组样本图像，每组样本图像包括：一张样本文档图像和对应的无噪黑底白字图像；根据所述训练样本集进行模型训练，得到图像处理模型，以对输入的文档图像进行去噪和黑白化处理。从而使得在对多种不同底色背景的文档图像进行去噪处理时，可同时处理大批量文档图像，更加清楚地展示文档图像中的文字内容。

在上述图1所示的图像处理模型的训练方法的基础上，本申请实施例还提供了一种上述图像处理模型的训练方法中扩充训练样本集的实现方法。可选的，如上所示方法步骤S101中，在多张无噪白底黑字图像中分别加入噪声，得到多张有噪白底黑字图像包括：

分别采用至少一组噪声参数，在无噪高清的白底黑字图像中加入噪声，得到至少一组有噪白底黑字图像，每组有噪高清的白底黑字图像对应一组噪声参数。

也就是说，在本申请实施例中，可采用一组噪声参数对无噪高清的白底黑字图像进行加噪，还可采用多组噪声参数对无噪高清的白底黑字图像进行加噪。如下结合附图对采用多组噪声参数进行加载，继而对扩充训练样本集的实现方法进行示例说明。图2为本申请实施例提供的一种图像处理模型的训练方法中一种扩充训练样本集的流程示意图，如图2所示，S101中在多张无噪白底黑字图像中分别加入噪声，得到多张有噪白底黑字图像可包括：

S201、采用预设的噪声参数，在多张无噪白底黑字图像中加入噪声，得到有噪白底黑字图像。

示例的，针对每张无噪白底黑字图像，可采用预设的噪声参数，在每张无噪白底黑字图像中加入预设类型的噪声，例如高斯噪声，得到加噪后的一张有噪白底黑字图像，对多张无噪白底黑字图像完成加入预设类型的噪声后，得到多张有噪白底黑字图像。

S202、改变噪声参数。

在实际应用中，改变噪声参数可以是用户手动选择噪声参数进行更改，也可以是根据预设的改变规则进行更改，如此，完成噪声参数的改变。

S203、采用改变后的噪声参数，在多张无噪白底黑字图像中加入噪声，得到新的有噪白底黑字图像,直至得到的有噪白底黑字图像的数量达到预设的第一数量阈值。

噪声参数改变后，采用改变后的噪声参数，重复步骤S201，在多张无噪白底黑字图像中加入噪声，得到新的多张有噪白底黑字图像。每改变一次噪声参数，就会得到一批新的有噪白底黑字图像，经过多次改变噪声参数，可极大地扩充有噪白底黑字图像的数量，直至得到的有噪白底黑字图像的数量达到预设的第一数量阈值。示例地，预设的第一数量阈值可以是用户自己根据现实场景而设置的，也可以根据预设地数量值而确定。

综上，本申请实施例提供的一种图像处理模型的训练方法中一种扩充训练样本集的方法，通过采用预设的噪声参数，在多张无噪白底黑字图像中加入噪声，得到有噪白底黑字图像，改变噪声参数，采用改变后的噪声参数，在多张无噪白底黑字图像中加入噪声，得到新的有噪白底黑字图像,直至得到的有噪白底黑字图像的数量达到预设的第一数量阈值。通过改变噪声参数，对多张无噪白底黑字图像依次添加多种噪声，可得到多张有噪白底黑字图像，极大地丰富了有噪白底黑字图像的数量，实现对训练样本集的扩充。

可选的，上述无噪白底黑字图像为无噪高清的白底黑字图像，相应的，该有噪白底黑字图像为有噪高清的白底黑字图像。在上述图1所示的图像处理模型的训练方法的基础上，本申请实施例还提供了一种上述图像处理模型的训练方法中处理白底黑字图像的实现方法。可选的，如上所示方法中S102中将有噪白底黑字图像与多张背景图分别进行融合，得到多张样本文档图像包括：

对有噪高清的白底黑字图像进行滤波，得到有噪模糊的白底黑字图像；将有噪模糊的白底黑字图像与背景图分别进行融合，得到所述样本文档图像。

在添加噪声之后，对有噪高清的白底黑字图像进行滤波处理，对有噪高清的白底黑字图像中加入噪声的部分和原有图像部分的边缘进行模糊处理，得到有噪模糊的白底黑字图像。示例的，若上述加入噪声为高斯滤波，则该滤波处理可以为高斯滤波处理。

通过对添加噪声后的有噪高清的白底黑字图像进行滤波处理，使得所添加的噪声部分与其周边的图像部分相适配，减少毛刺，不显得突兀，更接近于真实图像场景。

在上述图1所示的图像处理模型的训练方法的基础上，本申请实施例还提供了一种上述图像处理模型的训练方法中扩充训练样本集的实现方法。可选的，如上所示方法中对有噪高清的白底黑字图像进行滤波，得到有噪模糊的白底黑字图像包括：

在进行滤波处理时，分别采用至少一组滤波参数，对有噪高清的白底黑字图像进行滤波，得到至少一组有噪模糊的白底黑字图像，每组有噪模糊的白底黑字图像对应一组滤波参数。

也就是说，在本申请实施例中，可采用一组滤波参数对有噪高清的白底黑字图像进行滤波，还可采用多组滤波参数对有噪高清的白底黑字图像进行滤波。如下结合附图对采用多组滤波参数进行滤波，继而对扩充训练样本集的实现方法进行示例说明。图3为本申请实施例提供的一种图像处理模型的训练方法中另一种扩充训练样本集的流程示意图，如图3所示，S102中对有噪高清的白底黑字图像进行滤波，得到有噪模糊的白底黑字图像可包括：

S301、采用预设的滤波参数，对多张有噪高清的白底黑字图像进行滤波，得到有噪模糊的白底黑字图像。

示例的，针对每张有噪高清的白底黑字图像，可采用预设的滤波参数，对每张有噪高清的白底黑字图像进行滤波处理，例如，若上述加入噪声为高斯滤波，则该滤波处理可以为高斯滤波处理，得到滤波后的一张有噪模糊的白底黑字图像，对多张有噪高清的白底黑字图像完成滤波处理后，得到多张有噪模糊的白底黑字图像。

S302、改变噪声参数。

在实际应用中，改变滤波参数可以是用户手动选择滤波参数进行更改，也可以是根据预设的改变规则进行更改，如此，完成滤波参数的改变。

S303、采用改变后的滤波参数，对多张有噪高清的白底黑字图像进行滤波，得到新的有噪模糊的白底黑字图像,直至得到的有噪模糊的白底黑字图像的数量达到预设的第二数量阈值。

滤波参数改变后，采用改变后的滤波参数，重复步骤S301，对多张有噪高清的白底黑字图像进行滤波，得到新的有噪模糊的白底黑字图像。每改变一次滤波参数，就会得到一批新的有噪模糊的白底黑字图像，经过多次改变滤波参数，可极大地扩充有噪模糊的白底黑字图像的数量，直至得到的有噪模糊的白底黑字图像的数量达到预设的第二数量阈值。示例地，预设的第二数量阈值可以是用户自己根据现实场景而设置的，也可以根据预设地数量值而确定。

综上，本申请实施例提供的一种图像处理模型的训练方法中另一种扩充训练样本集的方法，通过采用预设的滤波参数，对多张有噪高清的白底黑字图像进行滤波，得到有噪模糊的白底黑字图像，改变噪声参数，采用改变后的滤波参数，对多张有噪高清的白底黑字图像进行滤波，得到新的有噪模糊的白底黑字图像,直至得到的有噪模糊的白底黑字图像的数量达到预设的第二数量阈值。通过改变滤波参数，对多张有噪高清的白底黑字图像依次进行滤波，可得到多张有噪模糊的白底黑字图像，极大地丰富了有噪模糊的白底黑字图像的数量，实现对训练样本集的扩充。

在上述图1所示的图像处理模型的训练方法的基础上，本申请实施例还提供了一种上述图像处理模型的训练方法中扩充训练样本集的实现方法。可选的，如上所示方法步骤S102中，将所述有噪白底黑字图像与多张背景图分别进行融合，得到所多张样本文档图像之前还包括：

采用至少一组权重参数，将有噪的白底黑字图像与每张背景图进行融合，得到至少一组样本文档图像，每组样本文档图像对应一组权重参数。

也就是说，在本申请实施例中，可采用一组权重参数将有噪的白底黑字图像与每张背景图进行融合，还可采用多组权重参数将有噪的白底黑字图像与每张背景图进行融合。如下结合附图对采用多组权重参数进行融合，继而对扩充训练样本集的实现方法进行示例说明。图4为本申请实施例提供的一种图像处理模型的训练方法中另一种扩充训练样本集的流程示意图，如图4所示，S102中采用多组权重参数，将有噪的白底黑字图像与每张背景图进行融合，得到多组样本文档图像可包括：

S401、采用预设的权重参数，将有噪的白底黑字图像与每张背景图进行融合，得到多组样本文档图像。

示例的，针对每张有噪的白底黑字图像和每张背景图，可采用预设的权重参数，给每张有噪的白底黑字图像和每张背景图都赋予预设的权重参数中各自对应的权重，根据各自对应的权重进行融合，完成融合后，得到多组样本文档图像。

S402、改变权重参数。

在实际应用中，改变权重参数可以是用户手动选择权重参数进行更改，也可以是根据预设的改变规则进行更改，如此，完成权重参数的改变。

S403、采用改变后的权重参数，将有噪的白底黑字图像与每张背景图进行融合，得到新的样本文档图像,直至得到的样本文档图像的数量达到预设的第三数量阈值。

权重参数改变后，采用改变后的权重参数，重复步骤S401，将有噪的白底黑字图像与每张背景图进行融合，得到新的样本文档图像。每改变一次权重参数，就会得到一批新的样本文档图像，经过多次改变权重参数，可极大地扩充样本文档图像的数量，直至得到的样本文档图像的数量达到预设的第三数量阈值。示例地，预设的第三数量阈值可以是用户自己根据现实场景而设置的，也可以根据预设地数量值而确定。

综上，本申请实施例提供的一种图像处理模型的训练方法中一种扩充训练样本集的方法，通过采用预设的权重参数，将有噪的白底黑字图像与每张背景图进行融合，得到多组样本文档图像，改变权重参数，采用改变后的权重参数，将有噪的白底黑字图像与每张背景图进行融合，得到新的样本文档图像,直至得到的样本文档图像的数量达到预设的第三数量阈值。通过改变权重参数，将有噪的白底黑字图像与每张背景图进行融合，可得到多组样本文档图像，极大地丰富了样本文档图像的数量，实现对训练样本集的扩充。

在上述图1所示的图像处理模型的训练方法的基础上，本申请实施例还提供了另一种上述图像处理模型的训练方法中扩充训练样本集的实现方法。可选的，如上所示方法步骤S105中，根据训练样本集进行模型训练，得到图像处理模型之前还包括：

依次采用不同的多种图像编辑方式对训练样本集中的各组样本图像进行编辑处理，得到多组不同的编辑样本图像；

将多组不同的编辑样本图像增加至训练样本集中。

也就是说，在本申请实施例中，可多种图像编辑方式对训练样本集中的各组样本图像进行编辑处理，得到多组不同的编辑样本图像。如下结合附图对采用多种图像编辑方式进行编辑处理，继而对扩充训练样本集的实现方法进行示例说明。图5为本申请实施例提供的一种图像处理模型的训练方法中另一种扩充训练样本集的流程示意图，如图5所示，依次采用不同的多种图像编辑方式对训练样本集中的各组样本图像进行编辑处理，得到多组不同的编辑样本图像；可包括：

S501、采用预设的图像编辑方式，对训练样本集中的各组样本图像进行编辑处理，得到多组不同的编辑样本图像。

示例的，针对训练样本集中的每组样本图像，可采用预设的图像编辑方式，对训练样本集中的每组样本图像进行编辑处理，完成编辑处理后，得到多组不同的编辑样本图像。

S502、改变图像编辑方式。

在实际应用中，改变图像编辑方式可以是用户手动选择图像编辑方式进行更改，也可以是根据预设的改变规则进行更改，如此，完成权重参数的改变。示例的，图像编辑方式可以为设定一个旋转方向的一个旋转角度，或者，可以为设定一种随机裁剪方式，或者，设定一个旋转方向的一个旋转角度和一种随机裁剪方式。例如，旋转方向的旋转角度可以为：逆时针旋转90°、180°、270°，随机裁剪方式可以为：保持原图像宽，裁剪改变原图的高度，所形成的图像编辑方式可以为：(1)、逆时针旋转90°；(2)、保持原图像宽，裁剪改变原图的高度；(3)、保持原图像宽，裁剪改变原图的高度，同时逆时针旋转90°。

S503、采用改变后的图像编辑方式，对训练样本集中的各组样本图像进行编辑处理，得到新的多组不同的编辑样本图像,直至得到的编辑样本图像的数量达到预设的第四数量阈值。

图像编辑方式改变后，采用改变后的图像编辑方式，重复步骤S501，对训练样本集中的各组样本图像进行编辑处理，得到新的多组不同的编辑样本图像。每改变一次图像编辑方式，就会得到一批新的编辑样本图像，经过多次改变图像编辑方式，可极大地扩充样本文档图像的数量，直至得到的样本文档图像的数量达到预设的第四数量阈值。示例地，预设的第四数量阈值可以是用户自己根据现实场景而设置的，也可以根据预设地数量值而确定。

综上，本申请实施例提供的一种图像处理模型的训练方法中另一种扩充训练样本集的方法，通过采用预设的图像编辑方式，对训练样本集中的各组样本图像进行编辑处理，得到多组不同的编辑样本图像，改变图像编辑方式，采用改变后的图像编辑方式，对训练样本集中的各组样本图像进行编辑处理，得到新的多组不同的编辑样本图像,直至得到的编辑样本图像的数量达到预设的第四数量阈值。通过改变图像编辑方式，对训练样本集中的各组样本图像进行编辑处理，得到多组不同的编辑样本图像，极大地丰富了样本文档图像的数量，实现对训练样本集的扩充。

在上述图1所示的图像处理模型的训练方法的基础上，本申请实施例还提供了一种上述图像处理模型的训练方法中高精度地训练模型的实现方法。图6为本申请实施例提供的一种图像处理模型的训练方法中一种高精度地训练模型的流程示意图，如图6所示，将训练样本集分成多个批次的样本图像，每个批次的样本图像包括多组样本图像；将多个批次的样本图像进行多次模型训练，得到文档图像处理模型。可包括：

S601、将训练样本集分成多个批次的样本图像，每个批次的样本图像包括多组样本图像。

在可能实现方式中，例如可采用预设的分组参数如批次数或者每个批次包含的样本图像的组数，将训练样本集分成多个批次的样本图像，得到多个批次包括多组样本图像的样本图像。

示例的，可将训练样本集中的样本图像分成M个批次，每个批次中的样本图像包括N组样本图像，其中，M和N为大于或等于1的正整数，M和N的值可以由用户根据实际场景进行手动设置，也可以使用预设的值。

S602、将多个批次的样本图像进行多次模型训练，得到文档图像处理模型。

在实际场景中，将一个批次的样本图像，采用预设的网络架构进行模型训练，得到该批次样本图像满足该网络架构的图像处理模型，例如U2-Net网络的图像处理模型。将多个批次的样本图像依次进行模型训练，完成训练后，得到文档图像处理模型。由于上述模型训练方法，将训练样本集分批次进行训练，相较于将所有训练样本集同时进行训练，所得到的文档图像处理模型更加精确，更加适配于训练样本集中的样本图像，对于待输入的文档图像能进行更为精准地去噪和黑白化处理。

综上，本申请实施例提供的一种图像处理模型的训练方法中一种高精度地训练样本集的方法，通过采用预设的分组参数，将训练样本集分成多个批次的样本图像，得到多个批次包括多组样本图像的样本图像，将多个批次的样本图像进行多次模型训练，得到文档图像处理模型。通过将训练样本集分批次进行模型训练，提高了所得到的文档图像处理模型的精度，使得文档图像处理模型在对待输入的文档图像进行去噪和黑白化处理时，所得到的处理后的文档图像与原文档图像更加匹配。

在上述图1所示的图像处理模型的训练方法的基础上，本申请实施例还提供了一种上述图像处理模型的训练方法中高效地训练模型的实现方法。图7为本申请实施例提供的一种图像处理模型的训练方法中一种高效地训练模型的流程示意图，如图7所示，对多组样本图像中的样本文档图像和无噪黑底白字图像均进行灰度转换，得到多组样本灰度图像；根据多组样本灰度图像进行模型训练，得到图像处理模型，以对输入的文档图像对应的灰度图像进行去噪和黑白化处理,可包括：

S701、对多组样本图像中的样本文档图像和无噪黑底白字图像均进行灰度转换，得到多组样本灰度图像。

示例的，将多组样本图像中的样本文档图像和无噪黑底白字图像均转换为与之对应的灰度图像，可选地，均转为灰度为8bit的灰度图，完成灰度转换后，得到多组样本灰度图像。

S702、根据多组样本灰度图像进行模型训练，得到灰度图像处理模型。

示例的，根据得到的多组样本灰度图像，执行上述任一所示的模型训练方法，得到图像处理模型，以对输入的文档图像对应的灰度图像进行去噪和黑白化处理。

示例的，对输入的文档图像进行灰度转换，得到其对应的灰度图像，可选地，转换为灰度为8bit的灰度图，根据得到图像处理模型对输入的文档图像对应的灰度图像进行去噪和黑白化处理。通过将所有参与模型训练的图像以及待输入的图像都进行同灰度值的灰度转换处理后，可避免对不同图像中各种不同的颜色进行识别所耗费的成本对模型训练产生影响，可极大地缩短模型训练的时间，提高模型训练的效率。

综上，本申请实施例提供的一种图像处理模型的训练方法中一种高效地训练样本集的方法，通过对多组样本图像中的样本文档图像和无噪黑底白字图像均进行灰度转换，得到多组样本灰度图像，根据多组样本灰度图像进行模型训练，得到灰度图像处理模型，以对输入的文档图像对应的灰度图像进行去噪和黑白化处理。通过将图像进行同一灰度的灰度转换，缩短了模型训练的时间，提高了模型训练的效率。

在上述任一实施例提供的图像处理模型的训练方法得到的图像处理模型的基础上，本申请实施例还可提供一种应用上述图像处理模型进行文档图像处理方法的实现方法。如下结合附图对应用上述图像处理模型进行文档图像处理方法的实现方法进行示例说明。图8为本申请实施例提供的一种文档图像处理方法流程示意图，如图8所示，该方法包括：

S801、获取待处理文档图像。

获取待处理文档图像。

S802、采用预先训练的图像处理模型，对文档图像进行去噪和黑化处理，得到目标文档图像对应的黑底白字图像。

将待处理文档图像输入至预先训练的图像处理模型中，对文档图像进行去噪和黑化处理，完成去噪和黑化处理后，得到目标文档图像对应的黑底白字图像，其中，图像处理模型为上述任一实施例所提供的模型训练方法训练得到的图像处理模型。

S803、对黑底白字图像进行反色变换，得到目标文档图像对应的白底黑字图像。

在实际应用中，可采用预设的反色工具或软件，对目标文档图像对应的黑底白字图像进行反色处理，以将该黑底白字图像中的黑色背景变为白色背景，将该黑底白字图像中的白色文字变为黑色文字，如此，即可得到目标文档图像对应的白底黑字图像。

下述对用以执行的本申请所提供的图像处理模型的训练的装置、设备及存储介质等进行说明，其具体的实现过程以及技术效果参见上述，下述不再赘述。

图9为本申请实施例提供的一种图像处理模型的训练装置的示意图，如图9所示，该图像处理模型的训练装置900可包括：

噪声添加模块901，用于在多张无噪白底黑字图像中分别加入噪声，得到多张有噪白底黑字图像。

融合模块902，用于将有噪白底黑字图像与预设场景的背景图进行融合，得到预设场景的样本文档图像。

第一反色处理模块903，用于对无噪白底黑字图像分别进行反色处理，得到无噪黑底白字图像。

训练模块904，用于将样本文档图像和无噪黑底白字图像进行一一对应，得到训练样本集，训练样本集包括：多组样本图像，每组样本图像包括：一张样本文档图像和对应的无噪黑底白字图像；根据训练样本集进行模型训练，得到图像处理模型，以对输入的预设场景的文档图像进行去噪和黑白化处理。

可选的，噪声添加模块901，具体用于分别采用至少一组噪声参数，在无噪高清的白底黑字图像中加入噪声，得到至少一组有噪白底黑字图像，每组有噪高清的白底黑字图像对应一组噪声参数。

可选的，融合模块902，具体用于分别采用至少一组滤波参数，对有噪高清的白底黑字图像进行滤波，得到至少一组有噪模糊的白底黑字图像，每组有噪模糊的白底黑字图像对应一组滤波参数；采用至少一组权重参数，将有噪的白底黑字图像与背景图进行融合，得到至少一组样本文档图像，每组样本文档图像对应一组权重参数。

进一步地，训练模块904，具体用于将训练样本集分成多个批次，每个批次中包含多组样本图像；将每个批次的多组样本图像分别进行模型训练，得到图像处理模型。

进一步地，训练模块904，具体还用于对多组样本图像中的样本文档图像和无噪黑底白字图像均进行灰度转换，得到多组样本灰度图像；根据多组样本灰度图像进行模型训练，得到图像处理模型，以对输入的预设场景的文档图像对应的灰度图像进行去噪和黑白化处理。

本申请实施例还可提供一种执行上述文档图像处理方法的文档图像处理装置。图10为本申请实施例提供的一种文档图像处理装置的示意图，如图10所示，该图像处理模型的训练装置1000可包括：

获取模块1001，用于获取待处理文档图像。

处理模块1002，用于采用预先训练的图像处理模型，对文档图像进行去噪和黑化处理，得到目标文档图像对应的黑底白字图像。其中，该图像处理模型可以为采用上述任一实施例提供的模型训练方法得到的图像处理模型。

第二反色处理模块1003，用于对黑底白字图像进行反色变换，得到目标文档图像对应的白底黑字图像。

以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(Application Specific Integrated Circuit，简称ASIC)，或，一个或多个微处理器(digital singnal processor，简称DSP)，或，一个或者多个现场可编程门阵列(Field Programmable Gate Array，简称FPGA)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(CentralProcessing Unit，简称CPU)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，简称SOC)的形式实现。

图11为本申请实施例提供的一种电子设备的示意图，该电子设备可以集成于设备或者设备的芯片，该设备可以是具备计算处理功能的计算设备或服务器，上述图像处理模型的训练方法和文档图像处理方法所使用的电子设备可以是同一台电子设备，也可以是不同的电子设备。

该电子设备1100包括：存储器1101、处理器1102。存储器1101和处理器1102通过总线连接。

存储器1101用于存储程序，处理器1102调用存储器1101存储的程序，以执行上述方法实施例。具体实现方式和技术效果类似，这里不再赘述。

可选地，本发明还提供一种程序产品，例如计算机可读存储介质，包括程序，该程序在被处理器执行时用于执行上述方法实施例。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(英文：processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(英文：Read-Only Memory，简称：ROM)、随机存取存储器(英文：Random Access Memory，简称：RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种图像处理模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述在多张无噪白底黑字图像中分别加入噪声，得到多张有噪白底黑字图像，包括：

分别采用至少一组噪声参数，在所述无噪的白底黑字图像中加入噪声，得到至少一组所述有噪白底黑字图像，每组所述有噪的白底黑字图像对应一组噪声参数。

3.根据权利要求1所述的方法，其特征在于，所述无噪白底黑字图像为无噪高清的白底黑字图像，相应的，所述有噪白底黑字图像为有噪高清的白底黑字图像；

4.根据权利要求3所述的方法，其特征在于，所述对所述有噪高清的白底黑字图像进行滤波，得到有噪模糊的白底黑字图像，包括：

5.根据权利要求1所述的方法，其特征在于，所述将所述有噪白底黑字图像与多张背景图分别进行融合，得到所多张样本文档图像之前，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，所述根据所述训练样本集进行模型训练，得到图像处理模型之前，所述方法还包括：

将所述多组不同的编辑样本图像增加至所述训练样本集中。

7.根据权利要求1所述的方法，其特征在于，所述根据所述训练样本集进行模型训练，得到图像处理模型，所述方法包括：

将所述多个批次的样本图像进行多次模型训练，得到所述图像处理模型。

8.根据权利要求1所述的方法，其特征在于，所述根据所述训练样本集进行模型训练，得到图像处理模型还包括：

9.一种文档图像处理方法，其特征在于，包括：

获取待处理文档图像；

采用预先训练的图像处理模型，对所述待处理文档图像进行去噪和黑白化处理，得到所述待处理文档图像对应的黑底白字图像；其中，所述图像处理模型，为采用上述权利要求1-8中任一所述的图像处理模型的训练方法得到的模型；

对所述黑底白字图像进行反色变换，得到所述文档图像对应的白底黑字图像。

10.一种电子设备，其特征在于，包括：处理器、存储器，所述存储器存储可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序，以执行上述权利要求1-9中任一所述的方法。