CN112233047A - 一种图像处理方法、装置、设备和计算机可读存储介质 - Google Patents
一种图像处理方法、装置、设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN112233047A CN112233047A CN202011434747.XA CN202011434747A CN112233047A CN 112233047 A CN112233047 A CN 112233047A CN 202011434747 A CN202011434747 A CN 202011434747A CN 112233047 A CN112233047 A CN 112233047A
- Authority
- CN
- China
- Prior art keywords
- identification image
- image
- trained
- loss function
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 24
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 230000006870 function Effects 0.000 claims description 115
- 238000000034 method Methods 0.000 claims description 48
- 230000008569 process Effects 0.000 claims description 26
- 238000004891 communication Methods 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 239000003550 marker Substances 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 description 29
- 230000002708 enhancing effect Effects 0.000 description 9
- 230000006872 improvement Effects 0.000 description 8
- 238000001914 filtration Methods 0.000 description 7
- 238000004088 simulation Methods 0.000 description 7
- 230000015556 catabolic process Effects 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008439 repair process Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000006002 Pepper Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明实施例公开了一种图像处理方法,包括:获取画质不清晰的待处理标识图像;采用标识图像修复模型对待处理标识图像进行修复得到画质清晰的目标标识图像;获取画质清晰的第二待训练标识图像;对第二待训练标识图像进行处理,得到画质不清晰的第一待训练标识图像;基于第一待训练标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器;基于通过初始标识图像修复模型对第一待训练标识图像处理后的图像、第二待训练标识图像、第一损失函数和鉴别器,对初始标识图像修复模型进行训练,生成标识图像修复模型。本发明的实施例还公开了一种图像处理装置、设备和计算机可读存储介质。
Description
技术领域
本发明涉及通信领域中的图像处理技术,尤其涉及一种图像处理方法、装置、设备和计算机可读存储介质。
背景技术
条形码作为常用的图形化信息标识符,在生产生活中得到了广泛应用。例如条形码用于零售行业可以加快货物清点和收银速度,也可以用于仓储物流的管理跟踪等。对于成像清晰的条形码,识别程序的准确率已经足够高;但是,对于成像较为模糊的条形码,识别率较低。
针对模糊的条形码识别率较低的问题,相关技术中一般是用图像处理中的传统方法对画质进行增强;例如通过滤波器过滤高频信号从而去燥、增强对比度使得黑白色彩更加分明、锐化边缘从而缩小模糊区域等技术,来提升模糊的条形码的识别准确率。但是,目前技术中针对模糊的条形码的画质提升技术较为依赖人工且需要调整大量的超参数,准确率难以保证且调试过程比较复杂。
发明内容
为解决上述技术问题,本发明实施例期望提供一种图像处理方法、装置、设备和计算机可读存储介质,解决了相关技术中的针对模糊的条形码的画质提升技术存在的依赖于人工且调整的超参数较多的问题,降低了复杂度且提高了条形码识别的准确率。
本发明的技术方案是这样实现的:
一种图像处理方法,所述方法包括:
获取画质不清晰的待处理标识图像;
采用标识图像修复模型对所述待处理标识图像进行修复,得到画质清晰的目标标识图像;
所述标识图像修复模型由如下训练过程得到:
获取第二待训练标识图像;其中,所述第二待训练标识图像为画质清晰的标识图像;
对所述第二待训练标识图像进行处理,得到第一待训练标识图像;其中,所述第一待训练标识图像为画质不清晰的标识图像;
基于所述第一待训练标识图像、所述第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器;其中,所述第二损失函数为与所述初始鉴别器对应的损失函数;
基于通过初始标识图像修复模型对所述第一待训练标识图像处理后的图像、所述第二待训练标识图像、第一损失函数和所述鉴别器,对初始标识图像修复模型进行训练,生成所述标识图像修复模型;其中,所述第一损失函数为与所述初始标识图像修复模型对应的损失函数。
上述方案中,所述对所述第二待训练标识图像进行处理,得到第一待训练标识图像,包括:
对所述第二待训练标识图像的质量进行降低处理,得到所述第一待训练标识图像。
上述方案中,所述基于所述第一待训练标识图像、所述第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器,包括:
采用所述初始标识图像修复模型对所述第一待训练标识图像进行处理,生成待验证标识图像;
基于所述待验证标识图像、所述第二待训练标识图像和所述第二损失函数对所述初始鉴别器进行模型训练,生成所述鉴别器。
上述方案中,所述基于所述待验证标识图像、所述第二待训练标识图像和所述第二损失函数对所述初始鉴别器进行模型训练,生成所述鉴别器,包括:
对所述待验证标识图像的尺寸进行调整;
基于尺寸调整后的待验证标识图像、所述第二待训练标识图像和所述第二损失函数对所述初始鉴别器进行模型训练,生成所述鉴别器。
上述方案中,所述对所述待验证标识图像的尺寸进行调整,包括:
获取所述第一待训练标识图像的尺寸与所述第二待训练标识图像的尺寸的比例关系;
基于所述比例关系和所述第二待训练标识图像的尺寸,对所述待验证标识图像的尺寸进行调整。
上述方案中,所述对初始标识图像修复模型进行训练,包括:
采用多层神经网络算法对所述初始标识图像修复模型进行训练。
上述方案中,所述第一损失函数包括交叉熵损失函数;所述第二损失函数包括对抗损失函数。
一种图像处理装置,所述装置包括:获取模块和处理模块,其中:
所述获取模块,用于获取画质不清晰的待处理标识图像;
所述处理模块,用于采用标识图像修复模型对所述待处理标识图像进行修复,得到画质清晰的目标标识图像;
所述获取模块,还用于获取第二待训练标识图像;其中,所述第二待训练标识图像为画质清晰的标识图像;
所述处理模块,还用于对所述第二待训练标识图像进行处理,得到第一待训练标识图像;其中,所述第一待训练标识图像为画质不清晰的标识图像;
所述处理模块,还用于基于通过初始标识图像修复模型对所述第一待训练标识图像处理后的图像、所述第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器;其中,所述第二损失函数为与所述初始鉴别器对应的损失函数;
所述处理模块,还用于基于所述第一待训练标识图像、所述第二待训练标识图像、第一损失函数和所述鉴别器,对初始标识图像修复模型进行训练,生成所述标识图像修复模型;其中,所述第一损失函数为与所述初始标识图像修复模型对应的损失函数。
一种图像处理设备,所述设备包括:处理器、存储器和通信总线;
所述通信总线用于实现处理器和存储器之间的通信连接;
所述处理器用于执行存储器中存储的图像处理程序,以实现以下步骤:
获取画质不清晰的待处理标识图像;
采用标识图像修复模型对所述待处理标识图像进行修复,得到画质清晰的目标标识图像;
所述处理器,还用于实现以下步骤:
获取第二待训练标识图像;其中,所述第二待训练标识图像为画质清晰的标识图像;
对所述第二待训练标识图像进行处理,得到第一待训练标识图像;其中,所述第一待训练标识图像为画质不清晰的标识图像;
基于通过初始标识图像修复模型对所述第一待训练标识图像处理后的图像、所述第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器;其中,所述第二损失函数为与所述初始鉴别器对应的损失函数;
基于所述第一待训练标识图像、所述第二待训练标识图像、第一损失函数和所述鉴别器,对初始标识图像修复模型进行训练,生成所述标识图像修复模型;其中,所述第一损失函数为与所述初始标识图像修复模型对应的损失函数。
一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述任一项所述的图像处理方法的步骤。
因为可以获取画质清晰的第二待训练标识图像,并对第二待训练标识图像进行处理得到第一待训练标识图像,基于不清晰的第一待训练标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器,基于通过初始标识图像修复模型对第一待训练标识图像处理后的图像、第二待训练标识图像、第一损失函数和鉴别器,对初始标识图像修复模型进行训练,生成标识图像修复模型,且能获取画质不清晰的待处理标识图像;采用标识图像修复模型对待处理标识图像进行修复,得到画质清晰的目标标识图像,如此,可以基于训练得到标识图像修复模型,直接对待处理标识图像进行修复来增强待处理标识图像的画质,而不是如相对技术一样采用传统的例如滤波器过滤高频信号去燥、增强对比度或锐化边缘等图像处理技术来增强待处理标识图像的画质,解决了相关技术中的针对模糊的条形码的画质提升技术存在的依赖于人工且调整的超参数较多的问题,降低了复杂度且提高了条形码识别的准确率。
附图说明
图1为本发明的实施例提供的一种图像处理方法的流程示意图;
图2为本发明的实施例提供的一种第一待训练标识图像的示意图;
图3为本发明的实施例提供的另一种图像处理方法的流程示意图;
图4为本发明的实施例提供的又一种图像处理方法的流程示意图;
图5为本发明的实施例提供的一种图像处理方法中的对初始标识图像修复模型进行训练的示意图;
图6为本发明的实施例提供的一种图像处理方法中架构示意图;
图7为本发明实施例提供的一种图像处理设备的结构示意图;
图8为本发明实施例提供的一种图像处理装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明的实施例提供一种图像处理方法,该方法可以应用于图像处理设备中,参照图1所示,该方法包括以下步骤:
步骤101、获取第二待训练标识图像。
其中,第二待训练标识图像为画质清晰的标识图像。
在本发明实施例中,第二待训练标识图像可以是多张高质量清晰的条形码图像;需要说明的是,第二待训练标识图像可以是用模拟的方式产生的。
步骤102、对第二待训练标识图像进行处理,得到第一待训练标识图像。
其中,第一待训练标识图像为画质不清晰的标识图像。
在本发明实施例中,第一待训练图像可以是预先获取的画质不清晰的,且用来训练生成标识图像修复模型的多张标识图像;在一种可行的实现方式中,如图2所示,第一待训练标识图像可以是画质不清晰的条形码图像。当然,第一待训练标识图像可以是画面本身不清晰,也可以是条形码图案的条纹不清晰等。需要说明的是,第一待训练标识图像可以是通过对第二待训练标识图像的质量进行一定处理后得到的;当然,第一待训练标识图像也可以是直接获取到的。
步骤103、基于第一待训练标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器。
其中,第二损失函数为与初始鉴别器对应的损失函数。
步骤104、基于通过初始标识图像修复模型对第一待训练标识图像处理后的图像、第二待训练标识图像、第一损失函数和鉴别器,对初始标识图像修复模型进行训练,生成标识图像修复模型。
其中,第一损失函数为与初始标识图像修复模型对应的损失函数。在本发明实施例中,可以采用第一待训练标识图像对初始标识图像修复模型进行模型训练,进而得到标识图像修复模型;在训练得到标识图像修复模型的时候,可以使用损失函数进行训练;其中,标识图像修复模型是用来对待处理标识图像的画质进行修复的。
步骤105、获取画质不清晰的待处理标识图像。
其中,待处理标识图像可以是需要对图像的画质进行提升的标识图像;在一种可行的实现方式中,待处理标识图像可以是画质不清晰的条形码图像;待处理标识图像可以是画面本身不清晰,也可以是条形码图案的条纹不清晰等。
步骤106、采用标识图像修复模型对待处理标识图像进行修复,得到画质清晰的目标标识图像。
在本发明实施例中,可以是将待处理标识图像输入至标识图像修复模型中,标识图像修复模型对待处理标识图像进行修复处理后即可以得到画质清晰的目标标识图像。
其中,步骤101~步骤104描述的是标识图像修复模型的训练过程。
本发明的实施例所提供的图像处理方法,可以获取画质清晰的第二待训练标识图像,并对第二待训练标识图像进行处理得到第一待训练标识图像,基于不清晰的第一待训练标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器,基于第一待训练标识图像、第二待训练标识图像、第一损失函数和鉴别器,对初始标识图像修复模型进行训练,生成标识图像修复模型,且能获取画质不清晰的待处理标识图像;采用标识图像修复模型对待处理标识图像进行修复,得到画质清晰的目标标识图像,如此,可以基于训练得到标识图像修复模型,直接对待处理标识图像进行修复来增强待处理标识图像的画质,而不是如相对技术一样采用传统的例如滤波器过滤高频信号去燥、增强对比度或锐化边缘等图像处理技术来增强待处理标识图像的画质,解决了相关技术中的针对模糊的条形码的画质提升技术存在的依赖于人工且调整的超参数较多的问题,降低了复杂度且提高了条形码识别的准确率。
基于前述实施例,本发明的实施例提供一种图像处理方法,参照图3所示,该方法包括以下步骤:
步骤201、图像处理设备获取第二待训练标识图像。
其中,第二待训练标识图像为画质清晰的标识图像。
步骤202、图像处理设备对第二待训练标识图像的质量进行降低处理,得到第一待训练标识图像。
在本发明实施例中,图像处理设备可以通过在第二待训练标识图像中加入噪声来得到第一待训练标识图像;其中,可以是通过降质模块来实现在第二待训练标识图像中加入噪声的;在一种可行的实现方式中,可以对第二待训练标识图像进行以下至少之一:高斯模糊、动态模糊、高斯噪声、椒盐噪声、泊松噪声、下采样和降低对比度等处理,来实现给第二待训练标识图像中加入噪声。
步骤203、图像处理设备采用初始标识图像修复模型对第一待训练标识图像进行处理,生成待验证标识图像。
其中,待验证标识图像可以是将第一待训练标识图像输入初始标识图像修复模型后,初始标识图像修复模型对第一待训练标识图像进行图像修复后得到的。
步骤204、图像处理设备基于待验证标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行模型训练,生成鉴别器。
其中,第二损失函数为与初始鉴别器对应的损失函数。
在本发明实施例中,可以基于第一待训练标识图像生成待验证标识图像,之后采用第二损失函数比较待验证标识图像和第二待训练标识图像,并基于比较结果不断更新初始鉴别器的参数,最终得到鉴别器。
步骤205、图像处理设备基于通过初始标识图像修复模型对第一待训练标识图像处理后的图像、第二待训练标识图像、第一损失函数和鉴别器,对初始标识图像修复模型进行训练,生成标识图像修复模型。
其中,第一损失函数为与初始标识图像修复模型对应的损失函数。
在本发明实施例中,可以将第一待训练标识图像输入初始标识图像修复模型中生成待验证标识图像,之后采用第一损失函数比较待验证标识图像和第二待训练标识图像,根据比较结果对待验证标识图像进行修复,接着将修复后的待验证标识图像和第二待训练标识图像输入至鉴别器中进行比较处理,并根据比较结果不断更新初始标识图像修复模型的参数,最终得到标识图像修复模型。
需要说明的是,在对初始标识图像修复模型进行训练得到标识图像修复模型的过程中,可以是采用具有多层卷积的神经网络算法进行处理的。
步骤206、图像处理设备获取画质不清晰的待处理标识图像。
步骤207、图像处理设备采用标识图像修复模型对待处理标识图像进行修复,得到画质清晰的目标标识图像。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
本发明的实施例所提供的图像处理方法,可以基于训练得到标识图像修复模型,直接对待处理标识图像进行修复来增强待处理标识图像的画质,而不是如相对技术一样采用传统的例如滤波器过滤高频信号去燥、增强对比度或锐化边缘等图像处理技术来增强待处理标识图像的画质,解决了相关技术中的针对模糊的条形码的画质提升技术存在的依赖于人工且调整的超参数较多的问题,降低了复杂度且提高了条形码识别的准确率。
基于前述实施例,本发明的实施例提供一种图像处理方法,参照图4所示,该方法包括以下步骤:
步骤301、图像处理设备获取第二待训练标识图像。
其中,第二待训练标识图像为画质清晰的标识图像。
在本发明实施例中,第二待训练标识图像可以是采用计算机生成的标准的黑白分明的二值标识图像。
步骤302、图像处理设备对第二待训练标识图像的质量进行降低处理,得到第一待训练标识图像。
步骤303、图像处理设备采用初始标识图像修复模型对第一待训练标识图像进行处理,生成待验证标识图像。
步骤304、图像处理设备对待验证标识图像的尺寸进行调整。
其中,步骤304可以通过以下方式来实现:
步骤304a1、获取第一待训练标识图像的尺寸与第二待训练标识图像的尺寸的比例关系。
步骤304a2、基于比例关系和第二待训练标识图像的尺寸,对待验证标识图像的尺寸进行调整。
需要说明的是,如果在对第二待训练标识图像的质量进行降低处理的过程中包括下采样处理;此时,需要根据第一待训练标识图像的尺寸与第二待训练标识图像的尺寸的比例关系,对待验证标识图像的尺寸进行调整;在一种可行的实现方式中,也可以对待验证标识图像进行上采样处理来调整待验证标识图像的尺寸,以使得待验证标识图像的尺寸恢复为与第二待训练标识图像的尺寸相同。
步骤305、图像处理设备基于尺寸调整后的待验证标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行模型训练,生成鉴别器。
其中,第二损失函数为与初始鉴别器对应的损失函数。
在本发明实施例中,第二损失函数可以是对抗损失函数;在一种可行的实现方式中,第二损失函数可以是如下的损失函数:
其中,第二待训练标识图像可以视为是T域的图像,待验证标识图像可以视为是S域的图像;d为域的标签,Os为鉴别器对于S域的第s个样本的输出结果,Ot为鉴别器对于T域的第t个样本的输出结果;需要说明的是,d=1表示图像为T域,d=0表示图像为S域。
步骤306、图像处理设备基于通过初始标识图像修复模型对第一待训练标识图像处理后的图像、第二待训练标识图像、第一损失函数和鉴别器,采用多层神经网络算法对初始标识图像修复模型进行训练,生成标识图像修复模型。
其中,第一损失函数为与初始标识图像修复模型对应的损失函数。
在本发明实施例中,第一损失函数可以是交叉熵损失函数,具体可以为:其中,为第n个图像的第i个像素的真实值,像素真实值可以为0或者1(黑色为条码,白色为底色),为第n个图像的第i个像素的预测值。在一种可行的实现方式中,为第n个第二待训练标识图像的第i个像素的值,为第n个待验证标识图像的第i个像素的值。
需要说明的是,通过使用鉴别器进行模型训练后得到的标识图像修复模型的普遍适用性会更好,缩小模拟图像与真实图像之间的差别,使得最终修复得到的图像不会受到任何其他因素的影响。
在本发明实施例中可以采用多层卷积神经网络算法进行训练生成标识图像修复模型;在一种可行的实现方式中,如图5所示可以采用三层卷积神经网络算法进行训练,可以将第一待训练标识图像输入初始标识图像修复模型,之后执行a1、该初始标识图像修复模型中的卷积层对第一待训练标识图像进行第一次卷积处理,之后执行a2、对进行第一次卷积处理的图像进行批归一化处理,之后执行a3、ReLU激活函数层进行处理,接着执行a4、对处理后的图像进行第二次卷积处理,接着执行a5、进行第二次批归一化处理和a6、ReLU激活函数层进行处理,最后再进行第三次卷积处理进而将处理得到的图像输出;需要说明的是,可以采用第一损失函数将输出的图像与第二待训练标识图像进行比较处理以实现对初始标识图像修复模型的参数的更新。其中,每个卷积层中C表示通道数量、K代表卷积核大小、P代表边缘填充大小,S代表步长大小。每个卷积层后跟随一个批归一化层(BatchNormalization,BN)以及ReLU激活函数层。当然,若第一待训练标识图像是通过对第二待训练标识图像进行下采样后得到的,那么在执行完a7之后还需要对得到的图像进行a8、上采样处理以将图像恢复至原始尺寸。
步骤307、图像处理设备获取画质不清晰的待处理标识图像。
步骤308、图像处理设备采用标识图像修复模型对待处理标识图像进行修复,得到画质清晰的目标标识图像。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
本发明的实施例所提供的图像处理方法,可以基于训练得到标识图像修复模型,直接对待处理标识图像进行修复来增强待处理标识图像的画质,而不是如相对技术一样采用传统的例如滤波器过滤高频信号去燥、增强对比度或锐化边缘等图像处理技术来增强待处理标识图像的画质,解决了相关技术中的针对模糊的条形码的画质提升技术存在的依赖于人工且调整的超参数较多的问题,降低了复杂度且提高了条形码识别的准确率。
基于前述实施例,在本发明其他实施例中,以第一待训练标识图像为低质量模糊条形码(模拟),第二待训练标识图像为高质量清晰条形码(模拟),待处理标识图像为低质量模糊条形码(真实),对初始标识图像修复模型进行训练的过程可以认为是质量增强网络,对初始鉴别器进行训练得到鉴别器的过程可以认为是特征域适配模块,如图6所示,可以采用降质模块对高质量清晰条形码(模拟生成的)进行降质处理,得到低质量模糊条形码(模拟),之后采用质量增强网络对低质量模糊条形码(模拟)进行处理得到质量增强条形码图像(模拟),之后采用特征域适配模块对其进行处理,从而实现对标识图像修复模型的训练;训练完成后,采用质量增强网络和特征域适配模块将低质量模糊条形码(真实)的质量进行增强处理,最终得到画质清晰的目标条形码。
基于前述实施例,本发明的实施例提供一种图像处理设备,该设备可以应用于图1、3和4对应的实施例提供的图像处理方法中,参照图7所示,该设备可以包括:处理器41、存储器42和通信总线43,其中:
通信总线43用于实现处理器41和存储器42之间的通信连接;
处理器41用于执行存储器42中存储的图像处理程序,以实现以下步骤:
获取画质不清晰的待处理标识图像;
采用标识图像修复模型对待处理标识图像进行修复,得到画质清晰的目标标识图像;
处理器,还用于执行以下步骤:
获取第二待训练标识图像;其中,第二待训练标识图像为画质清晰的标识图像;
对第二待训练标识图像进行处理,得到第一待训练标识图像;
其中,第一待训练标识图像为画质不清晰的标识图像;
基于第一待训练标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器;其中,第二损失函数为与初始鉴别器对应的损失函数;
基于通过初始标识图像修复模型对第一待训练标识图像处理后的图像、第二待训练标识图像、第一损失函数和鉴别器,对初始标识图像修复模型进行训练,生成标识图像修复模型;
其中,第一损失函数为与初始标识图像修复模型对应的损失函数。
在本发明的其他实施例中,处理器41用于执行存储器42中存储的对第二待训练标识图像进行处理,得到第一待训练标识图像,以实现以下步骤:
对第二待训练标识图像的质量进行降低处理,得到第一待训练标识图像。
在本发明的其他实施例中,处理器41用于执行存储器42中存储的基于第一待训练标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器,以实现以下步骤:
采用初始标识图像修复模型对第一待训练标识图像进行处理,生成待验证标识图像;
基于待验证标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行模型训练,生成鉴别器。
在本发明的其他实施例中,处理器41用于执行存储器42中存储的基于待验证标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行模型训练,生成鉴别器,以实现以下步骤:
对待验证标识图像的尺寸进行调整;
基于尺寸调整后的待验证标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行模型训练,生成鉴别器。
在本发明的其他实施例中,处理器41用于执行存储器42中存储的对待验证标识图像的尺寸进行调整,以实现以下步骤:
获取第一待训练标识图像的尺寸与第二待训练标识图像的尺寸的比例关系;
基于比例关系和第二待训练标识图像的尺寸,对待验证标识图像的尺寸进行调整。
在本发明的其他实施例中,处理器41用于执行存储器42中存储的对初始标识图像修复模型进行训练,以实现以下步骤:
采用多层神经网络算法对初始标识图像修复模型进行训练。
在本发明的其他实施例中,第一损失函数包括交叉熵损失函数;第二损失函数包括对抗损失函数。
需要说明的是,本实施例中处理器所执行的步骤的具体实现过程,可以参照图1、3和4对应的实施例提供的图像处理方法中的实现过程,此处不再赘述。
本发明的实施例所提供的图像处理设备,可以基于训练得到标识图像修复模型,直接对待处理标识图像进行修复来增强待处理标识图像的画质,而不是如相对技术一样采用传统的例如滤波器过滤高频信号去燥、增强对比度或锐化边缘等图像处理技术来增强待处理标识图像的画质,解决了相关技术中的针对模糊的条形码的画质提升技术存在的依赖于人工且调整的超参数较多的问题,降低了复杂度且提高了条形码识别的准确率。
基于前述实施例,本发明的实施例提供一种图像处理装置,该装置可以应用于图1、3和4对应的实施例提供的图像处理方法中,参照图8所示,该装置包括:获取模块51和处理模块52,其中:
获取模块51,用于获取画质不清晰的待处理标识图像;
处理模块52,用于采用标识图像修复模型对待处理标识图像进行修复,得到画质清晰的目标标识图像;
获取模块51,还用于获取第二待训练标识图像;其中,第二待训练标识图像为画质清晰的标识图像;
处理模块52,还用于对第二待训练标识图像进行处理,得到第一待训练标识图像;其中,第一待训练标识图像为画质不清晰的标识图像;
处理模块52,还用于基于第一待训练标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器;其中,第二损失函数为与初始鉴别器对应的损失函数;
处理模块52,还用于基于通过初始标识图像修复模型对第一待训练标识图像处理后的图像、第二待训练标识图像、第一损失函数和鉴别器,对初始标识图像修复模型进行训练,生成标识图像修复模型;
其中,第一损失函数为与初始标识图像修复模型对应的损失函数。
在本发明的其他实施例中,处理模块52,还用于对第二待训练标识图像的质量进行降低处理,得到第一待训练标识图像。
本发明的其他实施例中,处理模块52还用于执行以下步骤:
采用初始标识图像修复模型对第一待训练标识图像进行处理,生成待验证标识图像;
基于待验证标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行模型训练,生成鉴别器。
在本发明的其他实施例中,处理模块52还用于执行以下步骤:
对待验证标识图像的尺寸进行调整;
基于尺寸调整后的待验证标识图像、第二待训练标识图像和第二损失函数对初始鉴别器进行模型训练,生成鉴别器。
在本发明的其他实施例中,处理模块52还用于执行以下步骤:
获取第一待训练标识图像的尺寸与第二待训练标识图像的尺寸的比例关系;
基于比例关系和第二待训练标识图像的尺寸,对待验证标识图像的尺寸进行调整。
在本发明的其他实施例中,处理模块52还用于执行以下步骤:
采用多层神经网络算法对初始标识图像修复模型进行训练。
在本发明的其他实施例中,第一损失函数包括交叉熵损失函数;第二损失函数包括对抗损失函数。
需要说明的是,本发明实施例中各个模块之间的交互过程,可以参照图1、3和4对应的实施例提供的图像处理方法中的实现过程,此处不再赘述。
本发明的实施例所提供的图像处理装置,可以基于训练得到标识图像修复模型,直接对待处理标识图像进行修复来增强待处理标识图像的画质,而不是如相对技术一样采用传统的例如滤波器过滤高频信号去燥、增强对比度或锐化边缘等图像处理技术来增强待处理标识图像的画质,解决了相关技术中的针对模糊的条形码的画质提升技术存在的依赖于人工且调整的超参数较多的问题,降低了复杂度且提高了条形码识别的准确率。
基于前述实施例,本发明的实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现图1、3和4对应的实施例提供的图像处理方法中的步骤。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种图像处理方法,其特征在于,所述方法包括:
获取画质不清晰的待处理标识图像;
采用标识图像修复模型对所述待处理标识图像进行修复,得到画质清晰的目标标识图像;
所述标识图像修复模型由如下训练过程得到:
获取第二待训练标识图像;其中,所述第二待训练标识图像为画质清晰的标识图像;
对所述第二待训练标识图像进行处理,得到第一待训练标识图像;其中,所述第一待训练标识图像为画质不清晰的标识图像;
基于所述第一待训练标识图像、所述第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器;其中,所述第二损失函数为与所述初始鉴别器对应的损失函数;
基于通过初始标识图像修复模型对所述第一待训练标识图像处理后的图像、所述第二待训练标识图像、第一损失函数和所述鉴别器,对初始标识图像修复模型进行训练,生成所述标识图像修复模型;其中,所述第一损失函数为与所述初始标识图像修复模型对应的损失函数。
2.根据权利要求1所述的方法,其特征在于,所述对所述第二待训练标识图像进行处理,得到第一待训练标识图像,包括:
对所述第二待训练标识图像的质量进行降低处理,得到所述第一待训练标识图像。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一待训练标识图像、所述第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器,包括:
采用所述初始标识图像修复模型对所述第一待训练标识图像进行处理,生成待验证标识图像;
基于所述待验证标识图像、所述第二待训练标识图像和所述第二损失函数对所述初始鉴别器进行模型训练,生成所述鉴别器。
4.根据权利要求3所述的方法,其特征在于,所述基于所述待验证标识图像、所述第二待训练标识图像和所述第二损失函数对所述初始鉴别器进行模型训练,生成所述鉴别器,包括:
对所述待验证标识图像的尺寸进行调整;
基于尺寸调整后的待验证标识图像、所述第二待训练标识图像和所述第二损失函数对所述初始鉴别器进行模型训练,生成所述鉴别器。
5.根据权利要求4所述的方法,其特征在于,所述对所述待验证标识图像的尺寸进行调整,包括:
获取所述第一待训练标识图像的尺寸与所述第二待训练标识图像的尺寸的比例关系;
基于所述比例关系和所述第二待训练标识图像的尺寸,对所述待验证标识图像的尺寸进行调整。
6.根据权利要求1所述的方法,其特征在于,所述对初始标识图像修复模型进行训练,包括:
采用多层神经网络算法对所述初始标识图像修复模型进行训练。
7.根据权利要求1所述的方法,其特征在于,所述第一损失函数包括交叉熵损失函数;所述第二损失函数包括对抗损失函数。
8.一种图像处理装置,其特征在于,所述装置包括:获取模块和处理模块,其中:
所述获取模块,用于获取画质不清晰的待处理标识图像;
所述处理模块,用于采用标识图像修复模型对所述待处理标识图像进行修复,得到画质清晰的目标标识图像;
所述获取模块,还用于获取第二待训练标识图像;其中,所述第二待训练标识图像为画质清晰的标识图像;
所述处理模块,还用于对所述第二待训练标识图像进行处理,得到第一待训练标识图像;其中,所述第一待训练标识图像为画质不清晰的标识图像;
所述处理模块,还用于基于所述第一待训练标识图像、所述第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器;其中,所述第二损失函数为与所述初始鉴别器对应的损失函数;
所述处理模块,还用于基于所述第一待训练标识图像、所述第二待训练标识图像、第一损失函数和所述鉴别器,对初始标识图像修复模型进行训练,生成所述标识图像修复模型;其中,所述第一损失函数为与所述初始标识图像修复模型对应的损失函数。
9.一种图像处理设备,其特征在于,所述设备包括:处理器、存储器和通信总线;
所述通信总线用于实现处理器和存储器之间的通信连接;
所述处理器用于执行存储器中存储的图像处理程序,以实现以下步骤:
获取画质不清晰的待处理标识图像;
采用标识图像修复模型对所述待处理标识图像进行修复,得到画质清晰的目标标识图像;
所述处理器,还用于获取第二待训练标识图像;其中,所述第二待训练标识图像为画质清晰的标识图像;
对所述第二待训练标识图像进行处理,得到第一待训练标识图像;其中,所述第一待训练标识图像为画质不清晰的标识图像;
基于所述第一待训练标识图像、所述第二待训练标识图像和第二损失函数对初始鉴别器进行训练,生成鉴别器;其中,所述第二损失函数为与所述初始鉴别器对应的损失函数;
基于通过初始标识图像修复模型对所述第一待训练标识图像处理后的图像、所述第二待训练标识图像、第一损失函数和所述鉴别器,对初始标识图像修复模型进行训练,生成所述标识图像修复模型;其中,所述第一损失函数为与所述初始标识图像修复模型对应的损失函数。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至7中任一项所述的图像处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011434747.XA CN112233047A (zh) | 2020-12-10 | 2020-12-10 | 一种图像处理方法、装置、设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011434747.XA CN112233047A (zh) | 2020-12-10 | 2020-12-10 | 一种图像处理方法、装置、设备和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112233047A true CN112233047A (zh) | 2021-01-15 |
Family
ID=74124887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011434747.XA Pending CN112233047A (zh) | 2020-12-10 | 2020-12-10 | 一种图像处理方法、装置、设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112233047A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110246093A (zh) * | 2019-05-05 | 2019-09-17 | 北京大学 | 一种解码图像增强方法 |
CN110570366A (zh) * | 2019-08-16 | 2019-12-13 | 西安理工大学 | 基于双判别深度卷积生成式对抗网络的图像修复方法 |
US10755391B2 (en) * | 2018-05-15 | 2020-08-25 | Adobe Inc. | Digital image completion by learning generation and patch matching jointly |
CN111612717A (zh) * | 2020-05-20 | 2020-09-01 | 上海杉达学院 | 一种基于对抗网络的水面图像去反光修复方法和装置 |
CN111783494A (zh) * | 2020-06-24 | 2020-10-16 | 成都明灯云工程科技有限公司 | 结合二值分割的卷积自编码器的受损二维码恢复方法 |
-
2020
- 2020-12-10 CN CN202011434747.XA patent/CN112233047A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10755391B2 (en) * | 2018-05-15 | 2020-08-25 | Adobe Inc. | Digital image completion by learning generation and patch matching jointly |
CN110246093A (zh) * | 2019-05-05 | 2019-09-17 | 北京大学 | 一种解码图像增强方法 |
CN110570366A (zh) * | 2019-08-16 | 2019-12-13 | 西安理工大学 | 基于双判别深度卷积生成式对抗网络的图像修复方法 |
CN111612717A (zh) * | 2020-05-20 | 2020-09-01 | 上海杉达学院 | 一种基于对抗网络的水面图像去反光修复方法和装置 |
CN111783494A (zh) * | 2020-06-24 | 2020-10-16 | 成都明灯云工程科技有限公司 | 结合二值分割的卷积自编码器的受损二维码恢复方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pan et al. | Physics-based generative adversarial models for image restoration and beyond | |
Cai et al. | Blind inpainting using the fully convolutional neural network | |
CN110147864B (zh) | 编码图案的处理方法和装置、存储介质、电子装置 | |
CN113128271A (zh) | 脸部图像的伪造检测 | |
CN110675339A (zh) | 基于边缘修复和内容修复的图像修复方法及系统 | |
Xiao et al. | Single image dehazing based on learning of haze layers | |
CN111723841A (zh) | 文本检测方法、装置、电子设备及存储介质 | |
Pattanaik et al. | Enhancement of license plate recognition performance using Xception with Mish activation function | |
CN114332150A (zh) | 手写笔迹擦除方法、装置、设备及可读存储介质 | |
CN114241463A (zh) | 签名验证方法、装置、计算机设备和存储介质 | |
CN113902671A (zh) | 一种基于随机纹理的图像隐写方法和系统 | |
Sharma et al. | High-resolution image de-raining using conditional GAN with sub-pixel upscaling | |
CN116935180A (zh) | 基于人工智能的信码防伪标签数据信息采集方法及系统 | |
Kim et al. | Game effect sprite generation with minimal data via conditional GAN | |
Li et al. | A new qr code recognition method using deblurring and modified local adaptive thresholding techniques | |
Deshpande et al. | An efficient image deblurring method with a deep convolutional neural network for satellite imagery | |
CN112233047A (zh) | 一种图像处理方法、装置、设备和计算机可读存储介质 | |
CN116612416A (zh) | 一种指代视频目标分割方法、装置、设备及可读存储介质 | |
CN115909378A (zh) | 单据文本检测模型的训练方法及单据文本检测方法 | |
CN116152079A (zh) | 图像处理方法及图像处理模型训练方法 | |
Lim et al. | LAU-Net: A low light image enhancer with attention and resizing mechanisms | |
Alshathri et al. | Denoising Letter Images from Scanned Invoices Using Stacked Autoencoders. | |
Liu et al. | Real-world image deblurring via unsupervised domain adaptation | |
CN115115537B (zh) | 一种基于掩码训练的图像修复方法 | |
Li et al. | Human Detection via Image Denoising for 5G‐Enabled Intelligent Applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210115 |
|
RJ01 | Rejection of invention patent application after publication |