CN113744140A

CN113744140A - 一种图像处理方法、设备和计算机可读存储介质

Info

Publication number: CN113744140A
Application number: CN202011112098.1A
Authority: CN
Inventors: 邸志惠; 郑志彤; 桂创华
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Priority date: 2020-10-16
Filing date: 2020-10-16
Publication date: 2021-12-03

Abstract

本发明实施例公开了一种图像处理方法，所述方法包括：获取第一待训练图像，并基于所述第一待训练图像进行训练生成文字区域生成器；其中，所述第一待训练图像为具有文字信息的图像；采用所述文字区域生成器对所述第一待训练图像进行处理，生成待处理标签图像；其中，所述待处理标签图像用于指示所述第一待训练图像中文字所覆盖的区域；基于所述待处理标签图像和所述第一待训练图像生成文字缺失图像，并基于所述文字缺失图像进行训练，生成图像修复生成器；获取具有文字信息的待处理图像；采用所述文字区域生成器和所述图像修复生成器对所述待处理图像进行修复，得到目标图像。本发明的实施例还公开了一种图像处理设备和计算机可读存储介质。

Description

一种图像处理方法、设备和计算机可读存储介质

技术领域

本发明涉及通信领域中的图像处理技术，尤其涉及一种图像处理方法、设备和计算机可读存储介质。

背景技术

随着全球化与互联网的快速发展，很多电商都选择让自己的商品走向国际，以方便快捷地到达各个国家的消费者手中。这就需要在各个国家推出自己的商品主站，自然主站里的商品详情图、评论、商品介绍等都需要由中文变成对应国家的文字；其中，最重要的是需要将商品详情图像变成对应语言的图像。这需要将原始图像中的文字擦除并将其擦除区域修复，再将对应语言文字写入原始文字位置。

目前，一般是采用图像修复(Image Inpainting)技术来解决上述问题的；且，相关技术中大多是使用快速行进(Fast-Marching)算法、块匹配(PatchMatch)算法或深度学习算法应用于图像修复技术中来实现商品详情图像中文字的擦除以及擦除区域修复的。但是，相关技术中这种图像修复方案存在文字区域的纹理修复不够清晰和不完整的问题，导致图像修复效果较差。

发明内容

为解决上述技术问题，本发明实施例期望提供一种图像处理方法、设备和计算机可读存储介质，解决了相关技术中的图像修复方案存在的文字区域的纹理修复不够清晰和不完整的问题，提高了图像修复的效果。

本发明的技术方案是这样实现的：

一种图像处理方法，所述方法包括：

获取第一待训练图像，并基于所述第一待训练图像进行训练生成文字区域生成器；其中，所述第一待训练图像为具有文字信息的图像；

采用所述文字区域生成器对所述第一待训练图像进行处理，生成待处理标签图像；其中，所述待处理标签图像用于指示所述第一待训练图像中文字所覆盖的区域；

基于所述待处理标签图像和所述第一待训练图像生成文字缺失图像，并基于所述文字缺失图像进行训练，生成图像修复生成器；

获取具有文字信息的待处理图像；

采用所述文字区域生成器和所述图像修复生成器对所述待处理图像进行修复，得到目标图像。

上述方案中，所述获取第一待训练图像，包括：

获取第二待训练图像；其中，所述第二待训练图像中不具有文字信息；

在所述第二待训练图像中添加文字信息，得到所述第一待训练图像。

上述方案中，所述基于所述第一待训练图像进行训练生成文字区域生成器，包括：

基于所述第一待训练图像，生成待训练标签图像；其中，所述待训练标签图像用于指示所述第一待训练图像中的文字所覆盖的区域；

基于所述第一待训练图像和所述待训练标签图像进行训练，生成所述文字区域生成器。

上述方案中，所述基于所述第一待训练图像，生成待训练标签图像，包括：

设置所述第一待训练图像中文字所在区域的色彩为第一色彩，以及所述第一待训练图像中除文字外其它区域的色彩为第二色彩，得到所述待训练标签图像。

上述方案中，所述基于所述第一待训练图像和所述待训练标签图像进行训练，生成所述文字区域生成器，包括：

基于所述第一待训练图像、所述待训练标签图像和第一损失函数对初始文字生成器进行训练，生成所述文字区域生成器；其中，所述第一损失函数为所述初始文字生成器对应的损失函数。

上述方案中，所述基于所述第一待训练图像、所述待训练标签图像和第一损失函数对初始文字生成器进行训练，生成所述文字区域生成器，包括：

基于所述第一待训练图像、所述待训练标签图像和第二损失函数对第一初始鉴别器进行训练，生成第一鉴别器；其中，所述第二损失函数为与所述初始鉴别器对应的损失函数；

基于所述第一待训练图像、所述待训练标签图像、所述第一损失函数和所述第一鉴别器，对所述初始文字生成器进行训练，生成所述文字区域生成器。

上述方案中，所述基于所述第一待训练图像、所述待训练标签图像和第二损失函数对第一初始鉴别器进行训练，生成第一鉴别器，包括：

采用所述初始文字生成器对所述第一待训练图像进行处理，生成参考标签图像；

基于所述参考标签图像、所述待训练标签图像和所述第二损失函数对第一初始鉴别器进行训练，生成所述第一鉴别器。

上述方案中，所述文字区域生成器的架构包括UNet架构；所述第一鉴别器包括马尔科夫性的鉴别器。

上述方案中，所述基于所述待处理标签图像和所述第一待训练图像生成文字缺失图像，包括：

确定所述待处理标签图像对应的第一像素矩阵和所述第一待训练图像对应的第二像素矩阵；

基于所述第一像素矩阵和所述第二像素矩阵，生成所述文字缺失图像。

上述方案中，所述基于所述第一像素矩阵和所述第二像素矩阵，生成所述文字缺失图像，包括：

基于所述第一像素矩阵和所述第二像素矩阵，生成第三像素矩阵；

确定所述第三像素矩阵对应的图像得到所述文字缺失图像。

上述方案中，所述基于所述文字缺失图像进行训练，生成图像修复生成器，包括：

基于所述文字缺失图像、所述第二待训练图像和第三损失函数，对初始图像修复生成器进行训练，生成所述图像修复生成器；其中，所述第三损失函数为所述图像修复生成器对应的损失函数。

上述方案中，所述基于所述文字缺失图像、所述第二待训练图像和第三损失函数，对初始图像修复生成器进行训练，生成所述图像修复生成器，包括：

基于所述文字缺失图像、所述第二待训练图像和第四损失函数对所述第二初始鉴别器进行训练，生成第二鉴别器；其中，所述第四损失函数为所述第二初始鉴别器对应的损失函数；

基于所述文字缺失图像、所述第二待训练图像、所述第三损失函数和所述第二鉴别器，对所述初始图像修复生成器进行训练，生成所述图像修复生成器。

上述方案中，所述基于所述文字缺失图像、所述第二待训练图像和第四损失函数对所述第二初始鉴别器进行训练，生成第二鉴别器，包括：

采用所述初始图像修复生成器对所述文字缺失图像进行修复，生成参考图像；

基于所述参考图像、所述第二待训练图像和所述第四损失函数对所述第二初始鉴别器进行训练，生成所述第二鉴别器。

上述方案中，所述采用所述图像修复生成器和所述文字区域生成器对所述待处理图像进行修复，得到目标图像，包括：

采用所述文字区域生成器对所述待处理图像进行处理，生成中间标签图像；

基于所述中间标签图像和所述待处理图像，生成中间文字缺失图像；

采用所述图像修复生成器对所述中间文字缺失图像进行修复，得到所述目标图像。

一种图像处理设备，所述设备包括：处理器、存储器和通信总线；

所述通信总线用于实现处理器和存储器之间的通信连接；

所述处理器用于执行存储器中存储的图像处理程序，以实现以下步骤：

获取具有文字信息的待处理图像；

采用所述图像修复生成器和所述文字区域生成器对所述待处理图像进行修复，得到目标图像。

一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现上述任一项所述的图像处理方法的步骤。

因为可以获取具有文字信息的第一待训练图像并基于第一待训练图像进行训练生成文字区域生成器，并采用文字区域生成器对第一待训练图像进行处理生成用于指示待处理图像中文字所覆盖的区域待处理标签图像，之后基于待处理标签图像和第一待训练图像生成文字缺失图像，并基于文字缺失图像进行训练生成图像修复生成器，最后获取具有文字信息的待处理图像，并采用文字区域生成器和图像修复生成器对待处理图像进行修复得到目标图像，如此，可以基于训练得到文字区域生成器和图像修复生成器，直接对待处理图像进行修复，文字你区域生成器可以提取待处理图像中文字所覆盖区域，而不是如相对技术一样提取的是待处理图像中包括文字的一个矩形区域，充分利用了待处理图像中除文字区域外其它区域的信息，解决了相关技术中的图像修复方案存在的文字区域的纹理修复不够清晰和不完整的问题，提高了图像修复的效果。

附图说明

图1为本发明的实施例提供的一种图像处理方法的流程示意图；

图2为本发明的实施例提供的另一种图像处理方法的流程示意图；

图3为本发明的实施例提供的又一种图像处理方法的流程示意图；

图4为本发明的实施例提供的一种图像处理方法中的生成文字区域生成器的示意图；

图5为本发明的实施例提供的一种图像处理方法中的生成文字缺失图像的示意图；

图6为本发明的实施例提供的一种图像处理方法中的生成图像修复生成器的示意图；

图7为本发明的实施例提供的一种图像处理方法中的生成目标图像的示意图；

图8为本发明实施例提供的一种图像处理设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

本发明的实施例提供一种图像处理方法，该方法可以应用于图像处理设备中，参照图1所示，该方法包括以下步骤：

步骤101、获取第一待训练图像，并基于第一待训练图像进行训练生成文字区域生成器。

其中，第一待训练图像为具有文字信息的图像。

在本发明实施例中，第一待训练图像可以是预先获取的图像上具有文字信息的，且用来训练生成文字区域生成器的多张图像；其中，第一待训练图像中的文字信息可以是位于图像中的背景所在区域处，也可以是位于图像中的对象所在的区域处；也就是说，第一待训练图像中的文字信息可以是位于图像的背景上，也可以是位于图像的对象上的。需要说明的是，第一待训练图像可以是直接获取到的，也可以是根据无文字信息的图像生成的。

步骤102、采用文字区域生成器对第一待训练图像进行处理，生成待处理标签图像。

其中，待处理标签图像用于指示第一待训练图像中文字所覆盖的区域。

在本发明实施例中，待处理标签图像的尺寸与第一待训练图像的尺寸相同；在一种可行的实现方式中，待处理标签图像中与第一待训练图像的文字信息所覆盖区域对应的区域处采用一种颜色，待处理标签图像中与第一待训练图像中除文字信息覆盖区域外的其他区域对应的区域处采用另一种颜色。

步骤103、基于待处理标签图像和第一待训练图像生成文字缺失图像，并基于文字缺失图像进行训练，生成图像修复生成器。

其中，文字缺失图像的尺寸与第一待训练图像的尺寸相同，且文字缺失图像中与第一待训练图像的文字信息所覆盖区域对应的区域处是空白的，文字缺失图像中除空白处外其他处的信息与第一待训练图像的信息可以是相同的。

步骤104、获取具有文字信息的待处理图像。

其中，待处理图像可以是当前需要对图像中文字进行删除处理的图像；需要说明的是，待处理图像中的文字信息可以是位于图像中的背景所在区域处，也可以是位于图像中的对象所在的区域处；也就是说，待处理图像中的文字信息可以是位于图像的背景上，也可以是位于图像的对象上的。

步骤105、采用文字区域生成器和图像修复生成器对待处理图像进行修复，得到目标图像。

在本发明实施例中，目标图像的尺寸与待处理图像的尺寸相同，且目标图像中与待处理图像的文字信息所覆盖区域对应的区域已填充上相应的信息，目标图像中除与待处理图像的文字信息所覆盖区域对应的区域外其他区域与待处理图像的信息相同；需要说明的是，目标图像中填充进去的信息与目标图像中填充了信息进去的区域周围的区域的信息是匹配的。

本发明的实施例所提供的图像处理方法，获取具有文字信息的第一待训练图像并基于第一待训练图像进行训练生成文字区域生成器，并采用文字区域生成器对第一待训练图像进行处理生成用于指示待处理图像中文字所覆盖的区域待处理标签图像，之后基于待处理标签图像和第一待训练图像生成文字缺失图像，并基于文字缺失图像进行训练生成图像修复生成器，最后获取具有文字信息的待处理图像，并采用文字区域生成器和图像修复生成器对待处理图像进行修复得到目标图像，如此，可以基于训练得到文字区域生成器和图像修复生成器，直接对待处理图像进行修复，文字你区域生成器可以提取待处理图像中文字所覆盖区域，而不是如相对技术一样提取的是待处理图像中包括文字的一个矩形区域，充分利用了待处理图像中除文字区域外其它区域的信息，解决了相关技术中的图像修复方案存在的文字区域的纹理修复不够清晰和不完整的问题，提高了图像修复的效果。

基于前述实施例，本发明的实施例提供一种图像处理方法，参照图2所示，该方法包括以下步骤：

步骤201、图像处理设备获取第二待训练图像。

其中，第二待训练图像中不具有文字信息。

在本发明实施例中，第二待训练图像可以是多张不具有文字信息的图像；第一待训练图像可以是对第二待训练图像进行处理后得到的。

步骤202、图像处理设备在第二待训练图像中添加文字信息，得到第一待训练图像。

其中，图像处理设备可以通过代码来实现在第二待训练图像中添加文字信息；在一种可行的实现方式中，可以使用Python语言进行代码编写实现在第二待训练图像中添加文字信息。

步骤203、图像处理设备基于第一待训练图像，生成待训练标签图像。

其中，待训练标签图像用于指示第一待训练图像中的文字所覆盖的区域。

在本发明实施例中，可以设置第一待训练图像中的文字信息所在区域的颜色为第一颜色，设置第一待训练图像中除文字信息所在区域外其他区域的颜色为第二颜色，已得到待训练标签图像；在一种可行的实现方式中，第一颜色可以是黑色，第二颜色可以是白色；需要说明的是，可以对第一待训练图像进行二值化处理来得到待训练标签图像，二值化处理的时候，可以设置第一待训练图像中的文字信息所覆盖的区域为0，设置除文字信息覆盖区域外的其他区域为1。

步骤204、图像处理设备基于第一待训练图像和待训练标签图像进行训练，生成文字区域生成器。

在本发明实施例中，可以使用第一待训练图像和待训练标签图像对初始文字区域生成器进行训练，来得到文字区域生成器。

其中，步骤204可以通过以下方式来实现：

图像处理设备基于第一待训练图像、待训练标签图像和第一损失函数对初始文字生成器进行训练，生成文字区域生成器。

其中，第一损失函数为初始文字生成器对应的损失函数。

在本发明实施例中，图像处理设备可以将第一待训练图像输入初始文字区域生成器中生成参考标签图像，之后采用第一损失函数比较参考标签图像和待训练标签图像，并基于比较结果和Adam优化器对初始文字区域生成器中的参数进行不断调整，最终训练得到文字区域生成器。在一种可行的实现方式中，训练生成文字生成器过程中学习率lr可以为2e-4，Adam优化器中的β1可以为0.5，β2可以为0.99。需要说明的是，初始文字生成器的架构包括UNet架构。

步骤205、图像处理设备采用文字区域生成器对第一待训练图像进行处理，生成待处理标签图像。

在本发明实施例中，待处理标签图像可以是将第一待训练图像输入至文字区域生成器后生成的。

步骤206、图像处理设备确定待处理标签图像对应的第一像素矩阵和第一待训练图像对应的第二像素矩阵。

其中，第一像素矩阵可以是基于待处理标签图像的每一像素值得到的；可以获取待处理标签图像的每一像素的像素值，之后基于每一像素的像素值生成第一像素矩阵。同样，第二像素矩阵可以是基于第一待训练图像的每一像素值得到的；可以获取第一待训练图像的每一像素的像素值，之后基于每一像素的像素值生成第二像素矩阵。

步骤207、图像处理设备基于第一像素矩阵和第二像素矩阵，生成文字缺失图像。

其中，文字缺失图像可以是基于第一像素矩阵和第二像素矩阵得到一像素矩阵，之后获取该得到的像素矩阵对应的图像来得到文字缺失图像。

步骤208、图像处理设备基于文字缺失图像、第二待训练图像和第三损失函数，对初始图像修复生成器进行训练，生成图像修复生成器。

其中，第三损失函数为图像修复生成器对应的损失函数。

在本发明实施例中，图像处理设备可以将文字缺失图像输入初始图像修复生成器中生成参考图像，之后采用第三损失函数比较参考图像和第二待训练图像，并基于比较结果对初始图像修复生成器中的参数进行不断调整，最终训练得到图像修复生成器。需要说明的是，第三损失函数可以是L1 loss与GAN loss。

步骤209、图像处理设备获取具有文字信息的待处理图像。

步骤210、图像处理设备采用文字区域生成器和图像修复生成器对待处理图像进行修复，得到目标图像。

其中，目标图像可以是先将待处理图像输入文字区域生成器生成中间标签图像，之后将基于中间标签图像和待处理图像得到的图像输入图像修复生成器后得到的。

需要说明的是，本实施例中与其它实施例中相同步骤和相同内容的说明，可以参照其它实施例中的描述，此处不再赘述。

本发明的实施例所提供的图像处理方法，可以基于训练得到文字区域生成器和图像修复生成器，直接对待处理图像进行修复，文字区域生成器可以提取待处理图像中文字所覆盖区域，而不是如相对技术一样提取的是待处理图像中包括文字的一个矩形区域，充分利用了待处理图像中除文字区域外其它区域的信息，解决了相关技术中的图像修复方案存在的文字区域的纹理修复不够清晰和不完整的问题，提高了图像修复的效果。

基于前述实施例，本发明的实施例提供一种图像处理方法，参照图3所示，该方法包括以下步骤：

步骤301、图像处理设备获取第二待训练图像。

其中，第二待训练图像中不具有文字信息。

步骤302、图像处理设备在第二待训练图像中添加文字信息，得到第一待训练图像。

步骤303、图像处理设备设置第一待训练图像中文字所在区域的色彩为第一色彩，以及第一待训练图像中除文字外其它区域的色彩为第二色彩，得到待训练标签图像。

在本发明实施例中，第一色彩与第二色彩不同，第一色彩可以是白色，第二色彩可以是黑色。

步骤304、图像处理设备基于第一待训练图像、待训练标签图像和第二损失函数对第一初始鉴别器进行训练，生成第一鉴别器。

其中，第二损失函数为与初始鉴别器对应的损失函数。

需要说明的是，步骤304可以通过以下方式来时限：

步骤304a、图像处理设备采用初始文字生成器对第一待训练图像进行处理，生成参考标签图像。

其中，参考标签图像可以是直接将第一待训练图像输入至初始文字生成器后得到的。需要说明的是，参考标签图像的尺寸与第一待训练图像的尺寸相同；参考标签图像中与第一待训练图像的文字信息所覆盖区域对应的区域处采用一种颜色，参考标签图像中与第一待训练图像中除文字信息覆盖区域外的其他区域对应的区域处采用另一种颜色。在一种可行的实现方式中，参考标签图像中与第一待训练图像的文字信息所覆盖区域对应的区域处的颜色可以是白色，参考标签图像中与第一待训练图像中除文字信息覆盖区域外的其他区域对应的区域处的颜色可以是黑色。

步骤304b、图像处理设备基于参考标签图像、待训练标签图像和第二损失函数对第一初始鉴别器进行训练，生成第一鉴别器。

其中，采用第二损失函数比较参考标签图像和待训练标签图像，之后根据比较的结果不断更新第一初始鉴别器的参数，最终得到第一鉴别器。如图4所示，可以将第一待训练图像A输入初始文字生成器生成参考标签图像B，之后将参考标签图像输入至第一初始鉴别器进行训练，得到第一鉴别器。

步骤305、图像处理设备基于第一待训练图像、待训练标签图像、第一损失函数和第一鉴别器，对初始文字生成器进行训练，生成文字区域生成器。

其中，文字生成器的架构包括UNet架构；第一鉴别器包括马尔科夫性的鉴别器。需要说明的是，本发明实施例的鉴别器中的块可以采用60×60的尺寸。

在本发明实施例中，可以将第一待训练图像输入初始文字生成器中生成参考标签图像，之后采用第一损失函数比较参考标签图像和待训练标签图像，根据比较结果对参考标签图像进行修正，接着将修复后的参考标签图像和待训练标签图像输入至第一鉴别器中进行比较处理，并根据比较结果不断更新初始文字生成器的参数，最终得到文字区域生成器。

步骤306、图像处理设备采用文字区域生成器对第一待训练图像进行处理，生成待处理标签图像。

步骤307、图像处理设备确定待处理标签图像对应的第一像素矩阵和第一待训练图像对应的第二像素矩阵。

步骤308、图像处理设备基于第一像素矩阵和第二像素矩阵，生成第三像素矩阵。

其中，第三像素矩阵可以基于第一像素矩阵和第二像素生成一个像素矩阵，并对生成的该像素矩阵中的特定元素进行赋值处理后得到的；在一种可行的实现方式中，可以将第一像素矩阵与第二像素矩阵相乘，之后将相乘后得到的像素矩阵中值不为0的元素的至设置为255来得到第三像素矩阵。

步骤309、图像处理设备确定第三像素矩阵对应的图像得到文字缺失图像。

在本发明实施例中，如图5所示，将第一待训练图像A输入文字区域生成器中生成待处理标签图像C，之后基于待处理标签图像C和第一待训练图像A生成文字缺失图像D。

步骤310、图像处理设备基于文字缺失图像、第二待训练图像和第四损失函数对第二初始鉴别器进行训练，生成第二鉴别器。

其中，第四损失函数为第二初始鉴别器对应的损失函数。

需要说明的是，步骤310基于文字缺失图像、第二待训练图像和第四损失函数对第二初始鉴别器进行训练，生成第二鉴别器可以通过以下方式来实现：

步骤310a、图像处理设备采用初始图像修复生成器对文字缺失图像进行修复，生成参考图像。

其中，参考图像可以是直接将文字缺失图像输入至初始图像修复生成器后得到的图像。

步骤310b、图像处理设备基于参考图像、第二待训练图像和第四损失函数对第二初始鉴别器进行训练，生成第二鉴别器。

其中，采用第四损失函数比较参考图像和第一待训练图像，之后根据比较的结果不断更新第二初始鉴别器的参数，最终得到第二鉴别器。

步骤311、图像处理设备基于文字缺失图像、第二待训练图像、第三损失函数和第二鉴别器，对初始图像修复生成器进行训练，生成图像修复生成器。

其中，图像修复生成器的架构可以包括UNet结构；第二鉴别器采用光谱归一化马尔克夫鉴别器(Spectral Normalized Markovian Discriminator，SN-patchGAN)；其中，本发明中的块的大小可以为60×60。在一种可行的实现方式中，本发明中采用文字缺失图像、第二待训练图像和第三损失函数，对初始图像修复生成器进行训练生成图像修复生成器的过程所对应的结构图可以如图6所示，采用文字缺失图像D和待处理标签图像C进行训练得到参考图像E，进而采用第二鉴别器对参考图像进行鉴别最终生成图像修复生成器。

在本发明实施例中，图像修复生成器编码部分的浅层采用self-attention结构，来编码文字缺失图像中任意两个像素点之间的关系信息；这样，当文字缺失区域部分与图像其他部分间中距离较远的像素存在结构和纹理关系时，可以生成与文字缺失区域部分相似或者相关的区域，确保最终进行修复的修复区域与周边区域信息的一致性，极大提升修复效果。第二鉴别器的浅层采用self-attention获取更多的信息，方便快速训练。且，第二鉴别器和图像修复生成器中的卷积采用门卷积(Gated convolution)。其中，门卷积可以采用函数Gating_y,x来表示，W_g和W_f表示的是像素的权重，I表示的是文字缺失图像和第二待训练图像的像素，特征函数可以用Feature_y,x来表示；Gating_y,x＝∑∑W_g*I，Feature_y,x＝∑∑W_f*I；进行卷积运算的时候可以采用公式O_y，x＝φ(Feature_y,x)*σ(Gating_y,x)来进行；需要说明的是，进行卷积运算的时候可以逐层进行卷积运算。

步骤312、图像处理设备获取具有文字信息的待处理图像。

步骤313、图像处理设备采用文字区域生成器对待处理图像进行处理，生成中间标签图像。

步骤314、图像处理设备基于中间标签图像和待处理图像，生成中间文字缺失图像。

需要说明的是，本实施例中基于中间标签图像和待处理图像，生成中间文字缺失图像的具体实现过程，与上述实施例中基于待处理标签图像和第一待训练图像生成文字缺失图像的实现过程一样，可以参考上述实施例中的描述，此处不再赘述。

步骤315、图像处理设备采用图像修复生成器对中间文字缺失图像进行修复，得到目标图像。

其中，如图7所示，将待处理图像F输入文字区域生成器，生成中间标签图像G，之后基于中间标签图像G和待处理图像F生成中间文字缺失图像H，最后将中间文字缺失图像H输入至图像修复生成器得到目标图像K。

基于前述实施例，本发明的实施例提供一种图像处理设备，该设备可以应用于图1～3对应的实施例提供的一种图像处理方法中，参照图8所示，该设备可以包括：处理器41、存储器42和通信总线43，其中：

通信总线43用于实现处理器41和存储器42之间的通信连接；

处理器41用于执行存储器42中存储的图像处理程序，以实现以下步骤：

获取第一待训练图像，并基于第一待训练图像进行训练生成文字区域生成器；

其中，第一待训练图像为具有文字信息的图像；

采用文字区域生成器对第一待训练图像进行处理，生成待处理标签图像；

其中，待处理标签图像用于指示第一待训练图像中文字所覆盖的区域；

基于待处理标签图像和第一待训练图像生成文字缺失图像，并基于文字缺失图像进行训练，生成图像修复生成器；

获取具有文字信息的待处理图像；

采用文字区域生成器和图像修复生成器对待处理图像进行修复，得到目标图像。

在本发明的其他实施例中，处理器41用于执行存储器42中存储的获取第一待训练图像，以实现以下步骤：

获取第二待训练图像；

其中，第二待训练图像中不具有文字信息；

在第二待训练图像中添加文字信息，得到第一待训练图像。

在本发明的其他实施例中，处理器41用于执行存储器42中存储的基于第一待训练图像进行训练生成文字区域生成器，以实现以下步骤：

基于第一待训练图像，生成待训练标签图像；

其中，待训练标签图像用于指示第一待训练图像中的文字所覆盖的区域；

基于第一待训练图像和待训练标签图像进行训练，生成文字区域生成器。

在本发明的其他实施例中，处理器41用于执行存储器42中存储的基于第一待训练图像，生成待训练标签图像，以实现以下步骤：

设置第一待训练图像中文字所在区域的色彩为第一色彩，以及第一待训练图像中除文字外其它区域的色彩为第二色彩，得到待训练标签图像。

在本发明的其他实施例中，处理器41用于执行存储器42中存储的基于第一待训练图像和待训练标签图像进行训练，生成文字区域生成器，以实现以下步骤：

基于第一待训练图像、待训练标签图像和第一损失函数对初始文字生成器进行训练，生成文字区域生成器；

其中，第一损失函数为初始文字生成器对应的损失函数。

在本发明的其他实施例中，处理器41用于执行存储器42中存储的基于第一待训练图像、待训练标签图像和第一损失函数对初始文字生成器进行训练，生成文字区域生成器，以实现以下步骤：

基于第一待训练图像、待训练标签图像和第二损失函数对第一初始鉴别器进行训练，生成第一鉴别器；

其中，第二损失函数为与初始鉴别器对应的损失函数；

基于第一待训练图像、待训练标签图像、第一损失函数和第一鉴别器，对初始文字生成器进行训练，生成文字区域生成器。

在本发明的其他实施例中，处理器41用于执行存储器42中存储的基于第一待训练图像、待训练标签图像和第二损失函数对第一初始鉴别器进行训练，生成第一鉴别器，以实现以下步骤：

采用初始文字生成器对第一待训练图像进行处理，生成参考标签图像；

基于参考标签图像、待训练标签图像和第二损失函数对第一初始鉴别器进行训练，生成第一鉴别器。

在本发明的其他实施例中，文字区域生成器的架构包括UNet架构；第一鉴别器包括马尔科夫性的鉴别器。

在本发明的其他实施例中，处理器41用于执行存储器42中存储的基于待处理标签图像和第一待训练图像生成文字缺失图像，生成第一鉴别器，以实现以下步骤：

确定待处理标签图像对应的第一像素矩阵和第一待训练图像对应的第二像素矩阵；

基于第一像素矩阵和第二像素矩阵，生成文字缺失图像；

基于文字缺失图像和第一待训练图像进行训练，生成图像修复生成器。

在本发明的其他实施例中，处理器41用于执行存储器42中存储的基于第一像素矩阵和第二像素矩阵，生成文字缺失图像，以实现以下步骤：

基于第一像素矩阵和第二像素矩阵，生成第三像素矩阵；

确定第三像素矩阵对应的图像得到文字缺失图像。

在本发明的其他实施例中，处理器41用于执行存储器42中存储的基于文字缺失图像进行训练，生成图像修复生成器，以实现以下步骤：

基于文字缺失图像、第二待训练图像和第三损失函数，对初始图像修复生成器进行训练，生成图像修复生成器；

其中，第三损失函数为图像修复生成器对应的损失函数。

在本发明的其他实施例中，处理器41用于执行存储器42中存储的基于文字缺失图像、第二待训练图像和第三损失函数，对初始图像修复生成器进行训练，生成图像修复生成器，以实现以下步骤：

基于文字缺失图像、第二待训练图像和第四损失函数对第二初始鉴别器进行训练，生成第二鉴别器；

其中，第四损失函数为第二初始鉴别器对应的损失函数；

基于文字缺失图像、第二待训练图像、第三损失函数和第二鉴别器，对初始图像修复生成器进行训练，生成图像修复生成器。

在本发明的其他实施例中，处理器41用于执行存储器42中存储的基于文字缺失图像、第二待训练图像和第四损失函数对第二初始鉴别器进行训练，生成第二鉴别器，以实现以下步骤：

采用初始图像修复生成器对文字缺失图像进行修复，生成参考图像；

基于参考图像、第二待训练图像和第四损失函数对第二初始鉴别器进行训练，生成第二鉴别器。

在本发明的其他实施例中，处理器41用于执行存储器42中存储的采用图像修复生成器和文字区域生成器对待处理图像进行修复，得到目标图像，以实现以下步骤：

采用文字区域生成器对待处理图像进行处理，生成中间标签图像；

基于中间标签图像和待处理图像，生成中间文字缺失图像；

采用图像修复生成器对中间文字缺失图像进行修复，得到目标图像。

需要说明的是，本实施例中处理器所执行的步骤的具体实现过程，可以参照图1～3对应的实施例提供的图像处理方法中的实现过程，此处不再赘述。

本发明的实施例所提供的图像处理设备，可以基于训练得到文字区域生成器和图像修复生成器，直接对待处理图像进行修复，文字你区域生成器可以提取待处理图像中文字所覆盖区域，而不是如相对技术一样提取的是待处理图像中包括文字的一个矩形区域，充分利用了待处理图像中除文字区域外其它区域的信息，解决了相关技术中的图像修复方案存在的文字区域的纹理修复不够清晰和不完整的问题，提高了图像修复的效果。

基于前述实施例本发明的实施例提供一种计算机可读存储介质，该计算机可读存储介质存储有一个或者多个程序，该一个或者多个程序可被一个或者多个处理器执行，以实现图1～3对应的实施例提供的图像处理方法中的步骤。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

Claims

1.一种图像处理方法，其特征在于，所述方法包括：

获取具有文字信息的待处理图像；

2.根据权利要求1所述的方法，其特征在于，所述获取第一待训练图像，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述基于所述第一待训练图像进行训练生成文字区域生成器，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述第一待训练图像，生成待训练标签图像，包括：

5.根据权利要求3所述的方法，其特征在于，所述基于所述第一待训练图像和所述待训练标签图像进行训练，生成所述文字区域生成器，包括：

6.根据权利要求5所述的方法，其特征在于，所述基于所述第一待训练图像、所述待训练标签图像和第一损失函数对初始文字生成器进行训练，生成所述文字区域生成器，包括：

7.根据权利要求6所述的方法，其特征在于，所述基于所述第一待训练图像、所述待训练标签图像和第二损失函数对第一初始鉴别器进行训练，生成第一鉴别器，包括：

8.根据权利要求6所述的方法，其特征在于，所述文字区域生成器的架构包括UNet架构；所述第一鉴别器包括马尔科夫性的鉴别器。

9.根据权利要求1所述的方法，其特征在于，所述基于所述待处理标签图像和所述第一待训练图像生成文字缺失图像，包括：

10.根据权利要求9所述的方法，其特征在于，所述基于所述第一像素矩阵和所述第二像素矩阵，生成所述文字缺失图像，包括：

确定所述第三像素矩阵对应的图像得到所述文字缺失图像。

11.根据权利要求2所述的方法，其特征在于，所述基于所述文字缺失图像进行训练，生成图像修复生成器，包括：

12.根据权利要求11所述的方法，其特征在于，所述基于所述文字缺失图像、所述第二待训练图像和第三损失函数，对初始图像修复生成器进行训练，生成所述图像修复生成器，包括：

13.根据权利要求12所述的方法，其特征在于，所述基于所述文字缺失图像、所述第二待训练图像和第四损失函数对所述第二初始鉴别器进行训练，生成第二鉴别器，包括：

14.根据权利要求1所述的方法，其特征在于，所述采用所述图像修复生成器和所述文字区域生成器对所述待处理图像进行修复，得到目标图像，包括：

15.一种图像处理设备，其特征在于，所述设备包括：处理器、存储器和通信总线；

所述通信总线用于实现处理器和存储器之间的通信连接；

获取具有文字信息的待处理图像；

16.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如权利要求1至14中任一项所述的图像处理方法的步骤。