CN117670726A - 图像增强方法、装置、计算机设备及存储介质 - Google Patents
图像增强方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN117670726A CN117670726A CN202311752688.4A CN202311752688A CN117670726A CN 117670726 A CN117670726 A CN 117670726A CN 202311752688 A CN202311752688 A CN 202311752688A CN 117670726 A CN117670726 A CN 117670726A
- Authority
- CN
- China
- Prior art keywords
- image
- enhancement
- enhanced
- image enhancement
- modes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000012545 processing Methods 0.000 claims abstract description 83
- 238000004590 computer program Methods 0.000 claims abstract description 25
- 238000004364 calculation method Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 16
- 238000012015 optical character recognition Methods 0.000 description 50
- 238000012937 correction Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
Abstract
本申请涉及一种图像增强方法、装置、计算机设备、存储介质和计算机程序产品。涉及图像处理技术领域。所述方法包括:针对待增强图像,获取预设的多种图像增强方式对于待增强图像的影响度,以及多种图像增强方式之间的干扰度;基于各图像增强方式的影响度以及多种图像增强方式之间的干扰度,确定多种图像增强方式应用于待增强图像的优先级顺序;根据优先级顺序遍历多种图像增强方式,针对当前遍历到的图像增强方式,获取图像增强方式应用于待增强图像的增强力度,并按照增强力度对待增强图像进行对应的增强处理,并在遍历完多种图像增强方式之后,得到经过增强处理后的目标增强图像。采用本方法能够有效提升图像的OCR效果。
Description
技术领域
本申请涉及图像处理技术领域,特别是涉及一种图像增强方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着图像处理技术的发展,由于图片的OCR(Optical Character Recognition的缩写,为光学字符识别)效果差,出现了提升图片OCR效果的图像增强技术。其中OCR可以识别并提取图像或扫描文档中的文字,然后将其转换成计算机可读的文本格式,从而可以对文本进行编辑、搜索和其他处理。
然而,目前针对OCR的图像增强方法主要有图像去噪、倾斜校正、透视矫正以及对比度调节,但每一种图像增强方法在进行图像增强的同时反而会导致图像不同程度的失真,影响OCR效果。
发明内容
基于此,有必要针对上述每一种图像增强方法在进行图像增强的同时导致图像不同程度的失真,影响OCR效果的技术问题,提供一种图像增强方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种图像增强方法,包括:
针对待增强图像,获取预设的多种图像增强方式对于所述待增强图像的影响度,以及所述多种图像增强方式之间的干扰度;所述影响度包括OCR提升程度、增强处理导致图像失真的程度;
基于各图像增强方式的所述影响度以及所述多种图像增强方式之间的干扰度,确定所述多种图像增强方式应用于所述待增强图像的优先级顺序;
根据所述优先级顺序遍历所述多种图像增强方式,针对当前遍历到的图像增强方式,获取所述图像增强方式应用于所述待增强图像的增强力度,并按照所述增强力度对所述待增强图像进行对应的增强处理,并在遍历完所述多种图像增强方式之后,得到经过增强处理后的目标增强图像。
在其中一个实施例中,所述针对待增强图像,获取预设的多种图像增强方式对于所述待增强图像的影响度,以及所述多种图像增强方式之间的干扰度之前,包括:分析所述待增强图像用于OCR识别情形的第一质量信息;所述第一质量信息包括模糊、倾斜、摩尔纹以及噪声多个维度的质量信息;基于所述第一质量信息,确定所述待增强图像对应的多种图像增强方式。
在其中一个实施例中,所述基于各图像增强方式的所述影响度以及所述多种图像增强方式之间的干扰度,确定所述多种图像增强方式应用于所述待增强图像的优先级顺序,包括:确定表征所述OCR提升程度、增强处理导致图像失真的程度、所述多种图像增强方式之间的干扰度各自的计算权重;基于所述计算权重,对每种图像增强方式对应的所述OCR提升程度、增强处理导致图像失真的程度、所述多种图像增强方式之间的干扰度进行融合计算,得到所述每种图像增强方式对于所述待增强图像的综合影响值的大小;基于所述综合影响值的大小,确定所述多种图像增强方式应用于所述待增强图像的优先级顺序。
在其中一个实施例中,所述获取所述图像增强方式应用于所述待增强图像的增强力度,包括:获取所述待增强图像对应于当前遍历到的图像增强方式的第二质量信息;基于所述第二质量信息确定执行当前遍历到的图像增强方式的概率值;比较所述概率值与对应于所述当前遍历到的图像增强方式预设的概率阈值,超过阈值时计算所述当前遍历到的图像增强方式用于所述待增强图像的增强力度。
在其中一个实施例中,所述针对当前遍历到的图像增强方式,获取所述图像增强方式应用于所述待增强图像的增强力度,并按照所述增强力度对所述待增强图像进行对应的增强处理,包括:针对当前遍历到的图像增强方式,基于预先建立的智能模型,计算所述待增强图像执行所述图像增强方式的执行概率值;在所述执行概率值大于预设概率阈值时,确定所述图像增强方式应用于所述待增强图像的增强力度,并基于所述增强力度对所述待增强图像进行处理,得到候选增强图像;对所述候选增强图像和所述待增强图像进行加权计算,得到经过所述图像增强方式处理后的增强图像。
在其中一个实施例中,所述获取预设的多种图像增强方式对于所述待增强图像的影响度,以及所述多种图像增强方式之间的干扰度之前,包括:识别所述待增强图像中的PS痕迹,得出所述待增强图像的PS造假信息;所述PS造假信息包括所述待增强图像的整体PS造假、局部PS造假以及无PS造假中的一种;基于所述PS造假信息,确定出无PS造假的所述待增强图像,或确定出局部PS造假的所述待增强图像中未造假的部分,并基于此执行所述获取预设的多种图像增强方式对于所述待增强图像的影响度,以及所述多种图像增强方式之间的干扰度的步骤。
第二方面,本申请还提供了一种图像增强装置,包括:
影响因素获取模块;用于针对待增强图像,获取预设的多种图像增强方式对于所述待增强图像的影响度,以及所述多种图像增强方式之间的干扰度;所述影响度包括OCR提升程度、增强处理导致图像失真的程度;
优先级确认模块,用于基于各图像增强方式的所述影响度以及所述多种图像增强方式之间的干扰度,确定所述多种图像增强方式应用于所述待增强图像的优先级顺序;
图像增强处理模块,用于根据所述优先级顺序遍历所述多种图像增强方式,针对当前遍历到的图像增强方式,获取所述图像增强方式应用于所述待增强图像的增强力度,并按照所述增强力度对所述待增强图像进行对应的增强处理,并在遍历完所述多种图像增强方式之后,得到经过增强处理后的目标增强图像。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本申请实施例任一项所述的方法的图像增强方法。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例任一项所述的方法的图像增强方法。
第五方面,本申请还提供了一种计算机程序产品,所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本申请实施例任一项所述的方法的图像增强方法。
上述图像增强方法、装置、计算机设备、存储介质和计算机程序产品,在进行图像增强的过程中,具有以下有益效果:首先针对待增强图像,获取预设的多种图像增强方式对于待增强图像的影响度,以及多种图像增强方式之间的干扰度;上述影响度包括OCR提升程度、增强处理导致图像失真的程度;然后基于各图像增强方式的影响度以及多种图像增强方式之间的干扰度,确定多种图像增强方式应用于待增强图像的优先级顺序;最后根据优先级顺序遍历多种图像增强方式,针对当前遍历到的图像增强方式,获取图像增强方式应用于待增强图像的增强力度,并按照增强力度对待增强图像进行对应的增强处理,并在遍历完多种图像增强方式之后,得到经过增强处理后的目标增强图像。通过比较多种图像增强方式对于待增强图像的OCR提升程度和使用不同图像增强方式后待增强图像的失真程度,以及多种图像增强方式之间的干扰度,确定多种图像增强方式的优先级顺序,优先使用对待增强图像的OCR提升程度高且处理后导致待处理图像失真程度低,并且与其他图像增强方式干扰度小的图像增强方式,根据上述条件遍历多种图像增强方式,在遍历过程中分别根据图片增强力度条件对当前的图片处理方式进行力度计算,最终得到经过增强处理后的目标增强图像,该目标增强图像用于后续OCR识别时,可显著提升OCR效果。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中图像增强方法的应用环境图;
图2为一个实施例中图像增强方法的流程示意图;
图3为一个实施例中图像增强步骤的流程示意图;
图4为一个实施例中图像增强步骤的优先级顺序示意图;
图5为一个实施例中图像增强步骤的增强力度判断示意图;
图6为一个实施例中图像增强装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的图像增强方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。首先终端102或服务器104针对待增强图像,获取预设的多种图像增强方式对于待增强图像的影响度,以及多种图像增强方式之间的干扰度;上述影响度包括OCR提升程度、增强处理导致图像失真的程度;然后终端102或服务器104基于各图像增强方式的影响度以及多种图像增强方式之间的干扰度,确定多种图像增强方式应用于待增强图像的优先级顺序;最后终端102或服务器104根据优先级顺序遍历多种图像增强方式,针对当前遍历到的图像增强方式,获取图像增强方式应用于待增强图像的增强力度,并按照增强力度对待增强图像进行对应的增强处理,并在遍历完多种图像增强方式之后,得到经过增强处理后的目标增强图像。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等包括通用增强智能控制组件的设备。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个示例性的实施例中,如图2所示,提供了一种图像增强方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤202至步骤206。其中:
步骤202,针对待增强图像,获取预设的多种图像增强方式对于待增强图像的影响度,以及多种图像增强方式之间的干扰度;上述影响度包括OCR提升程度、增强处理导致图像失真的程度。
其中,待增强图像指的是需要经过图像处理技术进行调整和改进的原始图像,且该图像需用于后续的OCR识别;其中的图像增强指的是利用各种图像处理技术对待增强图像进行调整和改进,提高待增强图像的质量;OCR(Optical Character Recognition,光学字符识别)提升程度指的是通过图像增强技术对待识别图像进行处理后,对OCR系统识别准确率的提升程度。
具体地,待增强图像可能受到光照、噪声、模糊或者其他因素的影响,导致图像质量较低并且可读性差,影响OCR识别效果,因此对应的多种图像增强方式可以包括图像去噪、倾斜矫正、透视矫正、对比度调节等。
步骤204,基于各图像增强方式的影响度以及多种图像增强方式之间的干扰度,确定多种图像增强方式应用于待增强图像的优先级顺序。
具体地,首先需要选择待增强的图像,再获取多种预设的图像增强方式的影响度和干扰度情况,影响度中的OCR提升程度可以根据对增强后的图像进行OCE识别,比较识别准确率和原始图像的准确率进行评估,失真程度可以通过图像评估指标,例如PSNR(PeakSignal-to-Noise Ratio)和SSIM(Structural Similarity Index),进行评估;并且同时对多种图像增强方式之间的干扰度进行评估,通过对不同的图像增强方式进行排序并评估,确定最适合待增强图像的增强方式的优先级排列方式。
步骤206,根据优先级顺序遍历多种图像增强方式,针对当前遍历到的图像增强方式,获取图像增强方式应用于待增强图像的增强力度,并按照增强力度对待增强图像进行对应的增强处理,并在遍历完多种图像增强方式之后,得到经过增强处理后的目标增强图像。
其中,增强力度指的是每种图像增强方式对待增强图像的调整程度。
具体地,针对当前遍历到的图像增强方式,根据相应的算法或模型,获取该增强方式应用于待增强图像的增强力度,可以通过计算图像的统计特征、像素值分布等方式实现,中通用增强智能控制组件可以根据图像自适应确定增强力度,根据优先级顺序和增强力度,对待增强图像进行多种增强方式的组合处理,获得最有利于提升后续OCR效果的图像增强效果。
上述图像增强方法中,首先针对待增强图像,获取预设的多种图像增强方式对于待增强图像的影响度,以及多种图像增强方式之间的干扰度;上述影响度包括OCR提升程度、增强处理导致图像失真的程度;然后基于各图像增强方式的影响度以及多种图像增强方式之间的干扰度,确定多种图像增强方式应用于待增强图像的优先级顺序;最后根据优先级顺序遍历多种图像增强方式,针对当前遍历到的图像增强方式,获取图像增强方式应用于待增强图像的增强力度,并按照增强力度对待增强图像进行对应的增强处理,并在遍历完多种图像增强方式之后,得到经过增强处理后的目标增强图像。通过比较多种图像增强方式对于待增强图像的OCR提升程度和使用不同图像增强方式后待增强图像的失真程度,以及多种图像增强方式之间的干扰度,确定多种图像增强方式的优先级顺序,优先使用对待增强图像的OCR提升程度高且处理后导致待处理图像失真程度低,并且与其他图像增强方式干扰度小的图像增强方式,根据上述条件遍历多种图像增强方式,在遍历过程中分别根据图片增强力度条件对当前的图片处理方式进行力度计算,最终得到经过增强处理后的目标增强图像,该目标增强图像用于后续OCR识别时,可显著提升OCR效果。
在一个实施例中,针对待增强图像,获取预设的多种图像增强方式对于待增强图像的影响度,以及多种图像增强方式之间的干扰度之前,包括:
步骤一:分析待增强图像用于OCR识别情形的第一质量信息;上述第一质量信息包括模糊、倾斜、摩尔纹以及噪声等多个维度的质量信息。
其中,OCR指的是可以将印刷的或手写的文本转换成可编辑的电子文件,识别并提取图像或扫描文档中的文字,然后将其转换成计算机可读的文本格式,从而可以对文本进行编辑、搜索和其他处理的技术;第一质量信息指的是待增强图像用于OCR识别情形的质量特征,包括模糊、倾斜、摩尔纹以及噪声等多个维度的信息,反映了图像在OCR场景下的整体质量特征。
具体地,模糊会导致图像中字符边缘不清晰,倾斜会使得字符形状变形,摩尔纹会干扰字符的清晰度,噪声会干扰字符的辨识度。
步骤二:基于第一质量信息,确定待增强图像对应的多种图像增强方式。
示例性地,对于模糊图像,可以采用透视矫正;对于倾斜图像,可以采用倾斜矫正;对于受摩尔纹影响的图像,可以采用摩尔纹去除处理;对于受噪声干扰的图像,可以采用图像去噪处理。
通过上述实施例,根据不同的待处理图像的质量信息,选择合适的图像增强方式进行处理,提高了图像的质量和清晰度,从而进一步提高待增强图像在OCR识别中的可识别性和准确性。
进一步地,在一个实施例中,所述基于各图像增强方式的影响度以及多种图像增强方式之间的干扰度,确定多种图像增强方式应用于待增强图像的优先级顺序,包括:
步骤1:确定表征OCR提升程度、增强处理导致图像失真的程度、多种图像增强方式之间的干扰度各自的计算权重。
其中,OCR提升程度指的是图像增强处理对OCR识别准确度的提升程度,通常通过准确率或召回率等指标来衡量;图像失真程度指的是图像增强处理对原始图像造成的失真程度,包括信息丢失、细节模糊等情况;干扰度指的是多种图像增强方式之间相互影响的程度,包括增强方式之间可能存在的相互干扰或冲突;计算权重指的是确定各项指标在综合影响值计算中的重要程度,通常通过权重分配来实现。
具体地,确定图像增强方式的综合影响值时,考虑OCR提升程度、图像失真程度和干扰度各自的重要程度,根据重要程度对上述指标进行权重的合理分配。
步骤2:基于计算权重,对每种图像增强方式对应的OCR提升程度、增强处理导致图像失真的程度、多种图像增强方式之间的干扰度进行融合计算,得到每种图像增强方式对于待增强图像的综合影响值的大小。
其中,融合计算指的是将不同指标的影响值综合计算得到最终的影响值,通常采用加权计算或其他融合方法。
示例性地,OCR提升程度、图像失真程度和干扰度分别乘以对应的权重,并进行综合计算,得到每种图像增强方式对于待增强图像的综合影响值的大小。
步骤3:基于综合影响值的大小,确定多种图像增强方式应用于待增强图像的优先级顺序。
其中,优先级顺序指的是根据综合影响值确定多种图像增强方式在应用于待增强图像时可以达到最佳的增强效果的处理顺序。
示例性地,若综合影响值越大的图像增强方式对待增强图像的正向影响越大,则可以优先考虑应用影响值较大的图像增强方式。
通过上述实施例,当有数量较大的图像增强方式时,可以基于待增强图像的整体质量特征筛选出一定数量的图像增强方式,然后针对筛选出的一定数量的图像增强方式中每种图像增强方式,计算其对于待增强图像的综合影响值进行计算和比较,从而确定最适合的图像增强方式的排列顺序,提高了图像增强处理对于当前待增强图像的适配度,同时一定程度也节省了图像增强处理的时间。
在一个示例性的实施例中,所述获取图像增强方式应用于待增强图像的增强力度,包括:
第一步:获取待增强图像对应于当前遍历到的图像增强方式的第二质量信息。
其中,第二质量信息指的是待增强图像对于每种图像增强方式进行增强处理后的质量信息。
第二步:基于第二质量信息确定执行当前遍历到的图像增强方式的概率值。
其中,概率值指的是在多种图像增强方式中,当前遍历到的图像增强方式被选择执行的概率值,概率值可以通过多种方式确定,例如基于历史数据统计、专家经验、模型预测等。
第三步:比较概率值与对应于当前遍历到的图像增强方式预设的概率阈值,超过阈值时计算当前遍历到的图像增强方式用于待增强图像的增强力度。
其中,概率阈值指的是用于决定是否执行当前遍历到的图像增强方式的阈值。当执行当前图像增强方式的概率值超过该阈值时,即认为该图像增强方式会被应用于待增强图像。
在上述实施例中,通过获取第二质量信息,可以对图像增强方式的效果进行量化评估,从而确定其对待增强图像的影响程度;确定概率值的过程包括对各种因素进行综合考虑,通过设置概率阈值,可以控制图像增强方式的应用程度,从而实现对图像增强过程的控制和调节;增强力度的设置可以根据具体的图像增强方式和应用需求进行调整和优化。
在一个实施例中,所述针对当前遍历到的图像增强方式,获取图像增强方式应用于待增强图像的增强力度,并按照增强力度对待增强图像进行对应的增强处理,包括:
第1步:针对当前遍历到的图像增强方式,基于预先建立的智能模型,计算待增强图像执行图像增强方式的执行概率值。
其中,预先建立的智能模型指的是基于机器学习或深度学习技术构建的模型,用于对图像增强方式的执行概率进行计算;执行概率值指的是基于智能模型计算得出的当前遍历到的图像增强方式被选择执行的概率值;概率值记为prob。
第2步:在执行概率值大于预设概率阈值时,确定图像增强方式应用于待增强图像的增强力度,并基于增强力度对待增强图像进行处理,得到候选增强图像。
其中,预设概率阈值指的是在执行概率值大于该阈值时,确定图像增强方式应用于待增强图像的阈值,当执行概率值超过该阈值时,即认为当前增强方式适用于待增强图像,可以进行后续的增强处理;候选增强图像指的是在确定图像增强方式应用于待增强图像的增强力度后,得到的经过增强处理的图像。
具体地,prob大于0.5认为存在该问题需要进行该增强;采取MixUp方法进行增强力度控制,并且在图像倾斜矫正和透视矫正增强中,增强力度P取值为1。
第3步:对候选增强图像和待增强图像进行加权计算,得到经过图像增强方式处理后的增强图像。
其中,具体计算公式为:图像增强方式处理后的增强图像=(1-P)×待增强图像+P×候选增强图像,其中:
在上述实施例中,通过智能模型计算执行概率值,可以根据图像的特征和增强方式的特性,对增强方式的适用性进行预测,从而提高图像增强的效率和准确性;同时,通过设置预设概率阈值和增强力度,可以对增强方式的应用进行精细控制,使得增强效果更加符合预期;最后,通过加权计算得到的增强图像可以综合考虑待增强图像和候选增强图像的特征,得到更加优质的增强结果;最终综合提高图像增强过程的自动化程度和图像增强效果。
在一个实施例中,所述获取预设的多种图像增强方式对于待增强图像的影响度,以及多种图像增强方式之间的干扰度之前,包括:
步骤A:识别待增强图像中的PS痕迹,得出待增强图像的PS造假信息;上述PS造假信息包括待增强图像的整体PS造假、局部PS造假以及无PS造假中的一种。
其中,PS(Photoshop)痕迹识别指的是通过图像处理技术和模型,对待增强图像进行分析,识别其中的PS痕迹,包括图像合成、修饰、滤镜处理等,可能表现为不连续的像素值、边缘不一致、光照不自然等特征,对于PS造假的部分,不作图像增强处理;待增强图像可能包括整个图像都经过PS处理、图像的部分区域经过PS处理以及图像未经过PS处理或PS处理痕迹极其微弱的一种。
步骤B:基于PS造假信息,确定出无PS造假的待增强图像,或确定出局部PS造假的待增强图像中未造假的部分,并基于此执行获取预设的多种图像增强方式对于待增强图像的影响度,以及多种图像增强方式之间的干扰度的步骤。
具体地,基于PS造假信息,确定出待增强图像中未经过PS处理的部分,将其作为待增强图像。
通过上述实施例,识别PS痕迹和提取PS造假信息,可以有效判断待增强图像的真实性和处理历史,为后续的增强处理提供依据;基于PS造假信息确定无PS造假的待增强图像或局部未造假的部分,可以针对性地选择适合的增强方式,避免对已经过PS处理的部分进行不必要的增强,提高增强的精确性和实用性,从而提高增强效果。
为了更好地理解上述图像增强过程,结合图3所示,以下详细阐述一个本申请中图像增强的具体流程,包括以下步骤:
步骤302,判别待增强图像的PS处理情况,获取未进行PS处理的待增强图像。
其中,未进行PS处理的待增强图像,可以是局部图像也可以是完整图像;将图像PS痕迹识别调整到图像增强之前,避免增强导致的图像失真影响PS痕迹识别。
步骤304,融合计算未进行PS处理的图像的OCR提升程度、增强处理导致图像失真的程度以及多种图像增强方式之间的干扰度,得到综合影响值。
步骤306,根据综合影响值,排列多种图像增强方式的优先级顺序。
如图4所示,先实施最能提升OCR效果的透视矫正和倾斜矫正,然后进行轻微失真的图像去噪,最后实施去摩尔纹。
步骤308,分别根据当前遍历到的图像增强方式的概率值,使用智能模型确认每种图像增强方式的增强力度,并根据当前的图像增强处理方式进行相应力度的加权计算,遍历多种图像增强方式后,得到目标增强图像。
如图5所示,增强力度是通用增强智能控制组件根据图像自适应确定的,通过智能模型判断图像是否存在某一种低质量问题(例如噪声、摩尔纹),智能模型输出是否存在该低质量问题的一个概率,记为prob,当prob大于0.5则认为存在该低质量问题,待处理图像需要使用该低质量问题对应的图像增强方式进行图像增强;其中增强力度采取MixUp方法控制。
具体公式为:图像增强方式处理后的增强图像=(1-P)×待增强图像+P×候选增强图像,其中
上述表达式中,设定在图像倾斜矫正和透视矫正增强中,P取值为1。
本实施例中,通过综合计算影响度和干扰度,确定了图像增强处理过程中,具体哪些图像增强方法是有助于OCR效果提升,并确定这些增强方法的执行顺序,通过新提出的通用增强智能控制组件来降低增强导致的图像失真,OCR系统可以更好地识别文档中的关键信息,从而提高核保核赔业务、数字化档案管理、自动化数据输入等领域的效率和准确性;极大限度地帮助提高OCR系统的准确性和稳定性。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的图像增强方法的图像增强装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个图像增强装置实施例中的具体限定可以参见上文中对于图像增强方法的限定,在此不再赘述。
在一个示例性的实施例中,如图6所示,提供了一种图像增强装置,包括:影响因素获取模块601、优先级确认模块602和图像增强处理模块603,其中:
影响因素获取模块601;用于针对待增强图像,获取预设的多种图像增强方式对于待增强图像的影响度,以及多种图像增强方式之间的干扰度;上述影响度包括OCR提升程度、增强处理导致图像失真的程度。
优先级确认模块602,用于基于各图像增强方式的影响度以及多种图像增强方式之间的干扰度,确定多种图像增强方式应用于待增强图像的优先级顺序。
图像增强处理模块603,用于根据优先级顺序遍历多种图像增强方式,针对当前遍历到的图像增强方式,获取图像增强方式应用于待增强图像的增强力度,并按照增强力度对待增强图像进行对应的增强处理,并在遍历完多种图像增强方式之后,得到经过增强处理后的目标增强图像。
在一个实施例中,所述影响因素获取模块模块601,还用于分析待增强图像用于OCR识别情形的第一质量信息;上述第一质量信息包括模糊、倾斜、摩尔纹以及噪声多个维度的质量信息;基于第一质量信息,确定待增强图像对应的多种图像增强方式。
在一个实施例中,所述优先级确认模块602,还用于确定表征OCR提升程度、增强处理导致图像失真的程度、多种图像增强方式之间的干扰度各自的计算权重;基于计算权重,对每种图像增强方式对应的OCR提升程度、增强处理导致图像失真的程度、多种图像增强方式之间的干扰度进行融合计算,得到每种图像增强方式对于待增强图像的综合影响值的大小;基于综合影响值的大小,确定多种图像增强方式应用于待增强图像的优先级顺序。
在一个实施例中,所述图像增强处理模块603,还用于获取待增强图像对应于当前遍历到的图像增强方式的第二质量信息;基于第二质量信息确定执行当前遍历到的图像增强方式的概率值;比较概率值与对应于当前遍历到的图像增强方式预设的概率阈值,超过阈值时计算当前遍历到的图像增强方式用于待增强图像的增强力度。
在一个实施例中,所述图像增强处理模块603,还用于针对当前遍历到的图像增强方式,基于预先建立的智能模型,计算待增强图像执行图像增强方式的执行概率值;在执行概率值大于预设概率阈值时,确定图像增强方式应用于待增强图像的增强力度,并基于增强力度对待增强图像进行处理,得到候选增强图像;对候选增强图像和待增强图像进行加权计算,得到经过图像增强方式处理后的增强图像。
在一个实施例中,所述影响因素获取模块601,还用于识别待增强图像中的PS痕迹,得出待增强图像的PS造假信息;上述PS造假信息包括待增强图像的整体PS造假、局部PS造假以及无PS造假中的一种;基于PS造假信息,确定出无PS造假的待增强图像,或确定出局部PS造假的待增强图像中未造假的部分,并基于此执行获取预设的多种图像增强方式对于待增强图像的影响度,以及多种图像增强方式之间的干扰度的步骤。
上述图像增强装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个示例性的实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储图像增强数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像增强方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个示例性的实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种图像增强方法,其特征在于,所述方法包括:
针对待增强图像,获取预设的多种图像增强方式对于所述待增强图像的影响度,以及所述多种图像增强方式之间的干扰度;所述影响度包括OCR提升程度、增强处理导致图像失真的程度;
基于各图像增强方式的所述影响度以及所述多种图像增强方式之间的干扰度,确定所述多种图像增强方式应用于所述待增强图像的优先级顺序;
根据所述优先级顺序遍历所述多种图像增强方式,针对当前遍历到的图像增强方式,获取所述图像增强方式应用于所述待增强图像的增强力度,并按照所述增强力度对所述待增强图像进行对应的增强处理,并在遍历完所述多种图像增强方式之后,得到经过增强处理后的目标增强图像。
2.根据权利要求1所述的方法,其特征在于,所述针对待增强图像,获取预设的多种图像增强方式对于所述待增强图像的影响度,以及所述多种图像增强方式之间的干扰度之前,包括:
分析所述待增强图像用于OCR识别情形的第一质量信息;所述第一质量信息包括模糊、倾斜、摩尔纹以及噪声多个维度的质量信息;
基于所述第一质量信息,确定所述待增强图像对应的多种图像增强方式。
3.根据权利要求1所述的方法,其特征在于,所述基于各图像增强方式的所述影响度以及所述多种图像增强方式之间的干扰度,确定所述多种图像增强方式应用于所述待增强图像的优先级顺序,包括:
确定表征所述OCR提升程度、增强处理导致图像失真的程度、所述多种图像增强方式之间的干扰度各自的计算权重;
基于所述计算权重,对每种图像增强方式对应的所述OCR提升程度、增强处理导致图像失真的程度、所述多种图像增强方式之间的干扰度进行融合计算,得到所述每种图像增强方式对于所述待增强图像的综合影响值的大小;
基于所述综合影响值的大小,确定所述多种图像增强方式应用于所述待增强图像的优先级顺序。
4.根据权利要求1所述的方法,其特征在于,所述获取所述图像增强方式应用于所述待增强图像的增强力度,包括:
获取所述待增强图像对应于当前遍历到的图像增强方式的第二质量信息;
基于所述第二质量信息确定执行当前遍历到的图像增强方式的概率值;
比较所述概率值与对应于所述当前遍历到的图像增强方式预设的概率阈值,超过阈值时计算所述当前遍历到的图像增强方式用于所述待增强图像的增强力度。
5.根据权利要求4所述的方法,其特征在于,所述针对当前遍历到的图像增强方式,获取所述图像增强方式应用于所述待增强图像的增强力度,并按照所述增强力度对所述待增强图像进行对应的增强处理,包括:
针对当前遍历到的图像增强方式,基于预先建立的智能模型,计算所述待增强图像执行所述图像增强方式的执行概率值;
在所述执行概率值大于预设概率阈值时,确定所述图像增强方式应用于所述待增强图像的增强力度,并基于所述增强力度对所述待增强图像进行处理,得到候选增强图像;
对所述候选增强图像和所述待增强图像进行加权计算,得到经过所述图像增强方式处理后的增强图像。
6.根据权利要求1-5任意一项所述的方法,其特征在于,所述获取预设的多种图像增强方式对于所述待增强图像的影响度,以及所述多种图像增强方式之间的干扰度之前,包括:
识别所述待增强图像中的PS痕迹,得出所述待增强图像的PS造假信息;所述PS造假信息包括所述待增强图像的整体PS造假、局部PS造假以及无PS造假中的一种;
基于所述PS造假信息,确定出无PS造假的所述待增强图像,或确定出局部PS造假的所述待增强图像中未造假的部分,并基于此执行所述获取预设的多种图像增强方式对于所述待增强图像的影响度,以及所述多种图像增强方式之间的干扰度的步骤。
7.一种图像增强装置,其特征在于,所述装置包括:
影响因素获取模块;用于针对待增强图像,获取预设的多种图像增强方式对于所述待增强图像的影响度,以及所述多种图像增强方式之间的干扰度;所述影响度包括OCR提升程度、增强处理导致图像失真的程度;
优先级确认模块,用于基于各图像增强方式的所述影响度以及所述多种图像增强方式之间的干扰度,确定所述多种图像增强方式应用于所述待增强图像的优先级顺序;
图像增强处理模块,用于根据所述优先级顺序遍历所述多种图像增强方式,针对当前遍历到的图像增强方式,获取所述图像增强方式应用于所述待增强图像的增强力度,并按照所述增强力度对所述待增强图像进行对应的增强处理,并在遍历完所述多种图像增强方式之后,得到经过增强处理后的目标增强图像。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311752688.4A CN117670726A (zh) | 2023-12-19 | 2023-12-19 | 图像增强方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311752688.4A CN117670726A (zh) | 2023-12-19 | 2023-12-19 | 图像增强方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117670726A true CN117670726A (zh) | 2024-03-08 |
Family
ID=90066532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311752688.4A Pending CN117670726A (zh) | 2023-12-19 | 2023-12-19 | 图像增强方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117670726A (zh) |
-
2023
- 2023-12-19 CN CN202311752688.4A patent/CN117670726A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102667810B (zh) | 数字图像中的面部识别 | |
CN110070115B (zh) | 一种单像素攻击样本生成方法、装置、设备及存储介质 | |
Liu et al. | Smooth filtering identification based on convolutional neural networks | |
CN109726195B (zh) | 一种数据增强方法及装置 | |
WO2023206944A1 (zh) | 一种语义分割方法、装置、计算机设备和存储介质 | |
CN113011144A (zh) | 表单信息的获取方法、装置和服务器 | |
CN112231592A (zh) | 基于图的网络社团发现方法、装置、设备以及存储介质 | |
CN112132279A (zh) | 卷积神经网络模型压缩方法、装置、设备及存储介质 | |
CN115238815A (zh) | 异常交易数据获取方法、装置、设备、介质和程序产品 | |
CN116012841A (zh) | 一种基于深度学习的开集图像场景匹配方法及装置 | |
CN112884046A (zh) | 基于不完全监督学习的图像分类方法、装置及相关设备 | |
CN111369477A (zh) | 一种针对视频恢复任务的预分析和工具自适应的方法 | |
CN112633200A (zh) | 基于人工智能的人脸图像比对方法、装置、设备及介质 | |
CN110363534B (zh) | 用于识别异常交易的方法及装置 | |
CN116776966A (zh) | 图像分类网络的训练方法、装置、计算机设备和存储介质 | |
CN117670726A (zh) | 图像增强方法、装置、计算机设备及存储介质 | |
CN114463764A (zh) | 表格线检测方法、装置、计算机设备和存储介质 | |
CN112214639B (zh) | 视频筛选方法、视频筛选装置及终端设备 | |
Wang et al. | Ensemble classifier based source camera identification using fusion features | |
CN114049518A (zh) | 图像分类方法、装置、电子设备和存储介质 | |
CN112883956A (zh) | 文本字符的识别方法、装置和服务器 | |
CN117710100B (zh) | 基于区块链的数据分析方法及计算服务器 | |
CN110929118A (zh) | 网络数据处理方法、设备、装置、介质 | |
Zhu et al. | Recaptured image detection through multi-resolution residual-based correlation coefficients | |
CN114240872B (zh) | 图片质量评估方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |