CN111797921A - 一种图像数据对比方法及装置 - Google Patents
一种图像数据对比方法及装置 Download PDFInfo
- Publication number
- CN111797921A CN111797921A CN202010625502.9A CN202010625502A CN111797921A CN 111797921 A CN111797921 A CN 111797921A CN 202010625502 A CN202010625502 A CN 202010625502A CN 111797921 A CN111797921 A CN 111797921A
- Authority
- CN
- China
- Prior art keywords
- image data
- neural network
- image
- network model
- data comparison
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 89
- 238000003062 neural network model Methods 0.000 claims abstract description 56
- 238000012549 training Methods 0.000 claims description 26
- 238000007781 pre-processing Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 18
- 238000013527 convolutional neural network Methods 0.000 claims description 18
- 238000011176 pooling Methods 0.000 claims description 18
- 238000012937 correction Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 11
- 238000003708 edge detection Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 8
- 230000000644 propagated effect Effects 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 23
- 238000007639 printing Methods 0.000 abstract description 17
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000012545 processing Methods 0.000 description 36
- 238000010586 diagram Methods 0.000 description 30
- 238000003860 storage Methods 0.000 description 26
- 238000004458 analytical method Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000000977 initiatory effect Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000001617 migratory effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种图像数据对比方法及装置,图像数据对比方法包括:获取待识别的多个图像数据;提取所述多个图像数据的特征值;根据预生成的神经网络模型以及所述特征值对比所述多个图像数据。本发明提供的图像数据对比方法及装置,能够有效减少监印员对于图像数据对比的工作量,解决监印过程中纯人工、无技术、系统支撑的问题,提高监印员的工作效率进而提升整个用印流程的效率。
Description
技术领域
本发明涉及计算机数据处理技术领域,具体涉及一种图像数据对比方法及装置。
背景技术
传统信贷业务办理中电子印章已经得到越来越多的使用,但还是有一些合作机构需要银行提供实物章。基于现实的需要,为加强实物用印的规范,做到系统有记录,事中有监察,事后可追溯的原则。某些公司信贷已经实现了实物用印流程,满足了实物用印的监管要求。
实物用印系统采用了事中监察的特殊流程,通过人工对前期采集的凭证影像与用印机拍摄的凭证图片进行比对来保证印章使用的可靠性和准确性。但由于业务集中处理,一次用印申请中凭证数量较大,如果采用人工比对会加大监印人员的工作量,拉长一次用印的耗时,降低用印效率,完全依靠人工,准确率也无法得到系统性保障。
发明内容
针对现有技术中的问题,本发明提供的图像数据对比方法及装置,能够有效减少监印员(图像数据对比)的工作量,提升监印的效率。
为解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供一种图像数据对比方法,包括:
获取待识别的多个图像数据;
提取所述多个图像数据的特征值;
根据预生成的神经网络模型以及所述特征值对比所述多个图像数据。
一实施例中,生成所述神经网络模型的步骤包括:
利用3×3以及5×5卷积核训练所述神经网络模型的初始模型,以生成所述神经网络模型。
一实施例中,所述训练所述神经网络模型的初始模型包括:
以预设层数下采样所述初始模型中的卷基层-池化层,其中所述卷基层-池化层向前传播;
利用索贝尔边缘检测滤波器对采样后的初始模型进行迭代训练,当训练次数达到预设值或Loss值趋向0时,生成所述神经网络模型,其中所述神经网络模型为CNN卷积神经网络模型。
一实施例中,所述根据预生成的神经网络模型以及所述特征值对比所述多个图像数据,包括:
生成所述多个图像数据各自的哈希值;
根据所述哈希值生成所述特征值;
根据所述神经网络模型以及所述特征值,按照相似度对所述多个图像数据进行排序。
一实施例中,图像数据对比方法还包括:
对所述多个图像数据进行倾斜校正、噪声去除以及分辨率判别。
第二方面,本发明提供一种图像数据对比装置,包括:
图像数据获取单元,用于获取待识别的多个图像数据;
特征值提取单元,用于提取所述多个图像数据的特征值;
图像数据对比单元,用于根据预生成的神经网络模型以及所述特征值对比所述多个图像数据。
一实施例中,图像数据对比装置还包括:模型生成单元,用于生成所述神经网络模型,所述模型生成单元具体用于利用3×3以及5×5卷积核训练所述神经网络模型的初始模型,以生成所述神经网络模型。
一实施例中,所述模型生成单元包括:
采样模块,用于以预设层数下采样所述初始模型中的卷基层-池化层,其中所述卷基层-池化层向前传播;
训练模块,用于利用索贝尔边缘检测滤波器对采样后的初始模型进行迭代训练,当训练次数达到预设值或Loss值趋向0时,生成所述神经网络模型,其中所述神经网络模型为CNN卷积神经网络模型;
所述图像数据对比单元包括:
哈希值生成模块,用于生成所述多个图像数据各自的哈希值;
特征值生成模块,用于根据所述哈希值生成所述特征值;
图像数据排序模块,用于根据所述神经网络模型以及所述特征值,按照相似度对所述多个图像数据进行排序;
所述图像数据对比装置还包括预处理单元,用于对所述多个图像数据进行倾斜校正、噪声去除以及分辨率判别。
第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现图像数据对比方法的步骤。
第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现图像数据对比方法的步骤。
从上述描述可知,本发明实施例提供的图像数据对比方法及装置,首先获取待识别的多个图像数据;接着,提取所述多个图像数据的特征值;最后根据预生成的神经网络模型以及所述特征值对比所述多个图像数据。本发明将监印识别流程与图像识别和文字识别技术相结合,提供了一种基于图像识别的自动监印比对方案,能有效减少监印员的工作量,提升监印的效率。与现有人工监印比对方法相比其优点如下:效率高:自动识别相似度最高的图片,并直接展示比对图和相似结果,大大降低了人工操作的工作量。高识别率:对图像进行降噪等处理,文字识别还预先进行版面分析等处理,提高识别率。系统灵活高效:根据系统情况,通过异步作业和参数配置提高了系统的响应程度,并由使用者自己决定是否需要进行进一步分析,提升资源利用率。提供了一种分析工具:对于文字识别结果输出底纹图和热点图辅助人员进行快速分析。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的实施例中图像数据对比方法流程示意图一;
图2为本发明的实施例中图像数据对比方法流程示意图二;
图3为本发明的实施例中步骤400的流程示意图;
图4为本发明的实施例中步骤401的流程示意图;
图5为本发明的实施例中步骤300的流程示意图;
图6为本发明的实施例中图像数据对比方法流程示意图三;
图7为本发明的具体应用实例中用印凭证自动比对系统结构示意图;
图8为本发明的具体应用实例中图像采集输入装置1、2内部结构示意图;
图9为本发明的具体应用实例中电子影像管理装置3内部结构示意图;
图10为本发明的具体应用实例中图像识别装置4内部结构示意图;
图11为本发明的具体应用实例中文字对比装置5内部结构示意图;
图12为本发明的具体应用实例中监印比对装置6内部结构示意图;
图13为本发明的具体应用实例中图像数据对比方法流程示意图(异步图像识别);
图14为本发明的具体应用实例中图像数据对比方法流程示意图(监印流程);
图15为本发明的实施例中图像数据对比装置的结构框图一;
图16为本发明的实施例中图像数据对比装置的结构框图二;
图17为本发明的实施例中模型生成单元的组成示意图;
图18为本发明的实施例中图像数据对比单元的组成示意图;
图19为本发明的实施例中图像数据对比装置的结构框图三;
图20为本发明的实施例中的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本发明的实施例提供一种图像数据对比方法的具体实施方式,参见图1,该方法具体包括如下内容:
步骤100:获取待识别的多个图像数据。
优选地,可以高拍仪或扫描仪获取图像数据。
步骤200:提取所述多个图像数据的特征值。
具体地,通过对原始数据的处理和加工,将原始数据属性通过处理转换为数据特征的过程,属性是数据本身具有的维度,特征是数据中所呈现出来的某一种重要的特性,通常是通过属性的计算,组合或转换得到的。比如主成分分析就是将大量的数据属性转换为少数几个特征的过程。某种程度而言,好的数据以及特征往往是一个性能优秀模型的基础。
步骤300:根据预生成的神经网络模型以及所述特征值对比所述多个图像数据。
可以理解的是,神经网络(Artificial Neural Networks,简写为ANNs)也简称为神经网络(NNs)或称作连接模型(Connection Model),它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。其特点有:大规模并行处理,分布式存储,弹性拓扑,高度冗余和非线性运算。因而具有很髙的运算速度,很强的联想能力,很强的适应性,很强的容错能力和自组织能力。另外,利用神经网络模型的方法对比图像数据可以自动识别相似度最高的图片,并直接展示比对图和相似结果,大大降低了人工操作的工作量。
从上述描述可知,本发明实施例提供的图像数据对比方法,将监印识别流程与图像识别和文字识别技术相结合,提供了一种基于图像识别的自动监印比对方案,能有效减少监印员的工作量,提升监印的效率。与现有人工监印比对方法相比其优点如下:效率高:自动识别相似度最高的图片,并直接展示比对图和相似结果,大大降低了人工操作的工作量。高识别率:对图像进行降噪等处理,文字识别还预先进行版面分析等处理,提高识别率。系统灵活高效:根据系统情况,通过异步作业和参数配置提高了系统的响应程度,并由使用者自己决定是否需要进行进一步分析,提升资源利用率。提供了一种分析工具:对于文字识别结果输出底纹图和热点图辅助人员进行快速分析。
一实施例中,参见图2,图像数据对比方法还包括:
步骤400:生成所述神经网络模型,参见图3,进一步地,步骤400包括:
步骤401:利用3×3以及5×5卷积核训练所述神经网络模型的初始模型,以生成所述神经网络模型。
优选地,:采用3×3和5×5卷积核的5层卷积神经网络(CNN)中进行训练。
一实施例中,参见图4,步骤401包括:
步骤4011:以预设层数下采样所述初始模型中的卷基层-池化层,其中所述卷基层-池化层向前传播;
步骤4012:利用索贝尔边缘检测滤波器对采样后的初始模型进行迭代训练,当训练次数达到预设值或Loss值趋向0时,生成所述神经网络模型,其中所述神经网络模型为CNN卷积神经网络模型。
在步骤4011至步骤4012中,采用3×3和5×5卷积核,4层下采样向前传播的C-S层(卷基层-池化层,其中池化层采用最大池化)+1-2层全连接层结构的CNN卷积神经网络模型,使用(索贝尔)边缘检测滤波器,进行迭代训练,通过选取100个常用汉字进行试验,能够在20-50次训练后达到Loss趋向0。
一实施例中,参见图5,步骤300包括:
步骤301:生成所述多个图像数据各自的哈希值;
步骤302:根据所述哈希值生成所述特征值;
步骤303:根据所述神经网络模型以及所述特征值,按照相似度对所述多个图像数据进行排序。
在步骤301中,将特征值输入至训练好的神经网络模型中,生成各个图片数据的相似度,并按照该相似图对多个图片数据进行排序,以方便监印人员对比。
一实施例中,参见图6,图像数据对比方法还包括:
步骤500:对所述多个图像数据进行倾斜校正、噪声去除以及分辨率判别。
对图像数据进行倾斜校正和噪声去除,以提高识别率。常见的倾斜校正可使用基于投影的方法,基于Hough变换、基于线性拟合或基于傅立叶变换等方法。同时如果需要进行文字处理还需要进行判断图片分辨率是否达标等。
为进一步地说明本方案,本发明提供图像数据对比方法的具体应用实例,具体包括如下内容。
在本具体应用实例中,提供一种用印凭证自动比对系统,参见图7,该系统主要包括以下组成部分:图像采集输入装置1、图像采集输入装置2、电子影像管理装置3、图像识别装置4、文字对比装置5以及监印比对装置6,其中:
图像采集输入装置1与电子影像管理装置3和图像识别装置4相连。图像采集输入装置1用于采集申请凭证影像,将原始影像传输到电子影像管理装置3进行存储。同时生成异步任务图像进行预处理,再将处理后的影像传输到电子影像管理装置3。接着,发送异步作业任务到图像识别装置4。图像采集输入装置1一般由高拍仪或扫描仪以及专业系统组成。
图像采集输入装置2与电子影像管理装置3相连。用于采集用印凭证影像,同时对影像进行预处理,再将处理后的影像传输到电子影像管理装置3。最后发送识别任务到图像识别装置4。
电子影像管理装置3与图像采集输入装置1、图像采集输入装置2、文字对比装置5以及监印比对装置6相连。电子影像管理装置3收到图像采集输入装置1和图像采集输入装置2发送的图像后,在单独部署的影像服务器上进行持久化存储。同时可以向图像识别装置4、文字对比装置5提供图像获取服务的支持。
图像识别装置4与图像采集输入装置1、图像采集输入装置2、电子影像管理装置3以及监印比对装置6相连。图像识别装置4接收到图像采集输入装置1发出的异步识别任务后,从电子影像管理装置3获取图像进行图像识别处理获取哈希值,将哈希值写入数据库。接收到图像采集输入装置2发送的任务后,除了获取图像的哈希值外,还需要将其与图像采集输入装置1发送的同一笔业务的所有的凭证图像哈希值进行比较,按照相似度高低将比对关系输出到监印对比装置6。
文字对比装置5与电子影像管理装置3、监印对比装置6相连。文字对比装置5接收监印对比装置6发起的识别任务,从电子影像管理装置3中获取需要进一步进行文字比对的影像,进行版面分析后,针对不同的版面,进行文字切分提取并进行文字识别。还可以根据识别的结果按照匹配值生成不同颜色的底纹,或按照匹配值生成热点图,辅助业务快速进行比对。
监印比对装置6与图像识别装置4、文字对比装置5相连,监印比对装置6提供监印图像比对展现层,输出图像识别装置4输出的(按照相似度从高到底排序的)影像列表和比对图,并可以由业务主动发起文字识别,此时向文字对比装置5发起文字识别任务,接收到文字对比装置5的输出后,可以根据业务选择生成底纹图和热点图,并最终辅助业务完成监印任务。
进一步地,图8是图像采集输入装置1和图像采集输入装置2内部结构图示意图(两者结构类似),如图所示,图像采集输入装置1包括图像采集装置11、图像预处理装置12和图像传输装置13,其中:图像采集装置11:主要是接收高拍仪、扫描仪与实物用印机采集的影像,主要功能均通过服务端接口对接实现,接收后将原始图像传递给图像传输装置13。图像预处理装置12:处理接收图像采集装置11的图像,并对图像进行倾斜校正和噪声去除,提高识别率。常见的倾斜校正可使用基于投影的方法,基于Hough变换、基于线性拟合或基于傅立叶变换等方法。同时如果需要进行文字处理还需要进行判断图片分辨率是否达标等。图像传输装置13:将原始图像和图像预处理装置12处理后的图像传输到影像接收装置31,对于预处理后的图像同时发送异步任务至图像识别装置4,发起图像识别任务。
图9是电子影像管理装置3内部结构图示意图,如图所示,包括影像接收装置31、影像业务处理装置32和影像存储装置33,其中:影像接收装置31:接收图像采集输入装置1和图像采集输入装置2提交的图像数据流。影像业务处理装置32:将图像与对应的业务编号进行挂接,方便后续按照业务进行查询。影像存储装置33:将传输的图像在影像服务器上进行持久化,以备后续调用。
图10是图像识别装置4内部结构图示意图,如图所示,包括图像预处理单元41、图像指纹提取装置42、图像指纹存储装置43和图像识别单元44,其中:图像预处理单元41:接收到图像传输装置13发起的处理任务后,采用感知哈希算法中的差异哈希算法(dHash):先对图像进行过滤裁剪只保留正文部分,缩小图片,缩小到9×8,再进行灰度化。图像指纹提取装置42:根据处理后的影像计算相邻像素的差异,获得图片指纹值。图像指纹存储装置43:将计算后的图像指纹与对应的图像数据挂接,并进行存储,供后续直接使用。图像识别单元44:接收到图像传输装置13发起的图像识别任务后,将本次获得的图像指纹与业务下已经存储好的多个图像指纹进行比对,按照相似度由高到低排序后输出给监印比对装置6。
图11是文字比对装置5内部结构图示意图,如图所示,包括图像预处理装置51,文字识别装置52,文字相似计算装置53,文字重新组装54,其中:图像预处理装置51:接收到文字识别发起装置62的文字识别任务后,从影像业务处理装置32获取需要比对的两幅凭证影像。首先进行版面分析,一般采用投影法。然后按照不同的版面进行字符切分,可以采用阈值分割法、边缘检测法和区域提取等方法。最后进行位置、大小和比划粗细的规范化变换,将图像转成统一尺寸的单个标准文字图片。文字识别装置52:对图像进行提取特征后,对图片进行分类识别。可以使用KNN、BP神经网络、CNN和迁移学习等算法。这里为了避免人为提取特征,采用3×3和5×5卷积核,4层下采样向前传播的C-S层(卷基层-池化层,其中池化层采用最大池化)+1-2层全连接层结构的CNN卷积神经网络模型,使用(索贝尔)边缘检测滤波器,进行迭代训练,通过选取100个常用汉字进行试验,能够在20-50次训练后达到Loss趋向0。文字相似计算装置53:将图像预处理装置51得到的两组标准文字图片数组,按顺序一一对应送入图像预处理装置41,得到每一对字的相似度。文字重新组装54:将文字识别装置52和文字相似计算装置53输出的识别结果按照之前的版式重组输出,并将结果输出给监印比对装置6中的图像比对展示装置61。
图12为监印比对装置6内部结构图示意图,如图所示,包括图像比对展示装置61、文字识别发起装置62、文字识别处理装置63和监印结果存储装置64,其中:图像比对展示装置61:接收到图像识别单元44输出的图片比对相似度结果列表,按照相似度从高到低展示。文字识别发起装置62:向文字比对装置5发送需要进行文字比对一对凭证影像。文字识别处理装置63:接收文字重新组装54输出的两组比对结果,分别生成底纹比对图和相似度热点图。监印结果存储装置64:由人工最终确认监印结果,并存储监印结果。
本具体应用实例所提供图像数据对比方法如图13以及图14所示。
步骤S101:图像采集输入装置1(扫描仪与高拍仪)图像采集装置11获取待用印凭证的影像并传输影像到电子影像管理装置3。
步骤S102:图像采集输入装置1图像预处理装置12进行图像倾斜度校正。
步骤S103:图像采集输入装置1图像预处理装置12进行图像降噪处理,并传输影像到电子影像管理装置3。
步骤S104:电子影像管理装置3影像接收装置31接收上传影像数据流。
步骤S105:影像业务处理装置32将图像业务进行挂接。
步骤S106:影像存储装置进行图像的存储。
步骤S107:判断系统参数是否需要进行文字识别,如果不需要则直接向图像识别装置4发送异步任务。
步骤S108:如果S107判断需要进行文字识别,则需要判断输入图像分辨率是否满足,如果不满足需要重新进行录入,如果满足则向图像识别装置4发送异步任务。
步骤S109:图像识别装置4图像预处理装置41对图像进行过滤裁剪只保留正文部分,缩小图片,缩小到9×8,再进行灰度化处理。
步骤S110:图像指纹提取装置42:根据处理后的影像计算相邻像素的差异,获得图片指纹值。
步骤S111:图像指纹存储装置43存储用印凭证影像图片指纹集合。
图14是本具体应用实例所提供图像数据对比方法(监印流程)。具体包括以下内容:
步骤S112:图像采集输入装置2(用印机)图像采集输入装置21获取待用印凭证的影像并传输影像到电子影像管理装置3。
步骤S113:图像采集输入装置2图像预处理装置22进行图像倾斜度校正。
步骤S114:图像采集输入装置2图像预处理装置22进行图像降噪处理。
步骤S115:传输处理后影像到电子影像管理装置3,同时向图像识别装置4发送图像相似度计算任务
步骤S116:图像识别装置4图像预处理装置41对图像进行过滤裁剪只保留正文部分,缩小图片,缩小到9×8,再进行灰度化处理
步骤S117:图像指纹提取装置42:根据处理后的影像计算相邻像素的差异,获得图片指纹值。
步骤S118:图像识别单元44按照业务号将步骤S117生成的指纹值与步骤S111生成的图片指纹集合逐一比对,按照相似度从高到低排序输出。
步骤S119:监印比对装置6图像比对展示装置61接收图像识别单元44输出的列表并进行展示。
步骤S120:参数配置是否可以进行文字识别,如果不可以则直接跳到步骤S130,如果可以进行文字识别则继续下一步。
步骤S121:业务人员手工决定是否进行文字识别,如果不进行可直接跳到步骤S130,如果需要发起文字识别则继续下一步。
步骤S122:判断图像采集输入装置2输入图像分辨率是否满足,如果不满足直接跳到步骤S130,如果满足则向文字比对装置5发起文字比对任务。
步骤S123:接收到文字识别发起装置62的文字识别任务后,从影像业务处理装置32获取需要文字比对的两幅影像。
步骤S124:图像预处理装置51分别对步骤S123获取的两幅图进行版面分析、字段提取和文字标准化处理。
步骤S125:采用3×3和5×5卷积核的5层卷积神经网络(CNN)中进行训练。
步骤S126:识别两组图像对应的文字,逐一比对是否相等,相等为1不等为0。
步骤S127:文字相似计算装置53将步骤S124两个集合对照后一一输入图像识别装置4,得到单个文字级别比对相似度集合。
步骤S128:文字重新组装54将步骤S126和步骤S127两个结果集合按照图像采集输入装置2输入图像版式从新组装后输出到文字识别处理装置63。
步骤S129:文字识别处理装置63,根据单个文字级识别结果生成带有红色底纹的图片,其中结果为0对应的字加上红色底纹;根据字级相似度比对结果按照相似度高低匹配颜色生成热点图。
步骤S130:使用人员根据上述结果快速判断并保存监印结果。
从上述描述可知,本发明实施例提供的图像数据对比方法,基于凭证影像量可能较大,为了提高监印时系统响应速度,采用异步任务的方式,提前生成图片的哈希值。对于图片相似度高的,可以由业务自己选择是否进一步进行文字识别。针对文字识别的结果可以通过对比图和热点图进行快速差异定位。对系统录入的影像按照图像识别和文字识别分别进行输入质量控制。本发明提供一种基于图像识别的快速实物用印凭证比对(监印比较)系统,解决监印过程中纯人工、无技术、系统支撑的问题,提高监印员的工作效率进而提升整个用印流程的效率。
基于同一发明构思,本申请实施例还提供了图像数据对比装置,可以用于实现上述实施例所描述的方法,如下面的实施例。由于图像数据对比装置解决问题的原理与图像数据对比方法相似,因此图像数据对比装置的实施可以参见图像数据对比方法实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本发明的实施例提供一种能够实现图像数据对比方法的图像数据对比装置的具体实施方式,参见图15,图像数据对比装置具体包括如下内容:
图像数据获取单元10,用于获取待识别的多个图像数据;
特征值提取单元20,用于提取所述多个图像数据的特征值;
图像数据对比单元30,用于根据预生成的神经网络模型以及所述特征值对比所述多个图像数据。
一实施例中,参见图16,图像数据对比装置还包括:模型生成单元40,用于生成所述神经网络模型,所述模型生成单元40具体用于利用3×3以及5×5卷积核训练所述神经网络模型的初始模型,以生成所述神经网络模型。
一实施例中,参见图17,所述模型生成单元40包括:
采样模块401,用于以预设层数下采样所述初始模型中的卷基层-池化层,其中所述卷基层-池化层向前传播;
训练模块402,用于利用索贝尔边缘检测滤波器对采样后的初始模型进行迭代训练,当训练次数达到预设值或Loss值趋向0时,生成所述神经网络模型,其中所述神经网络模型为CNN卷积神经网络模型;
参见图18,所述图像数据对比单元30包括:
哈希值生成模块301,用于生成所述多个图像数据各自的哈希值;
特征值生成模块302,用于根据所述哈希值生成所述特征值;
图像数据排序模块303,用于根据所述神经网络模型以及所述特征值,按照相似度对所述多个图像数据进行排序;
参见图19,所述图像数据对比装置还包括预处理单元50,用于对所述多个图像数据进行倾斜校正、噪声去除以及分辨率判别。
从上述描述可知,本发明实施例提供的图像数据对比装置,首先获取待识别的多个图像数据;接着,提取所述多个图像数据的特征值;最后根据预生成的神经网络模型以及所述特征值对比所述多个图像数据。本发明将监印识别流程与图像识别和文字识别技术相结合,提供了一种基于图像识别的自动监印比对方案,能有效减少监印员的工作量,提升监印的效率。与现有人工监印比对方法相比其优点如下:效率高:自动识别相似度最高的图片,并直接展示比对图和相似结果,大大降低了人工操作的工作量。高识别率:对图像进行降噪等处理,文字识别还预先进行版面分析等处理,提高识别率。系统灵活高效:根据系统情况,通过异步作业和参数配置提高了系统的响应程度,并由使用者自己决定是否需要进行进一步分析,提升资源利用率。提供了一种分析工具:对于文字识别结果输出底纹图和热点图辅助人员进行快速分析。
上述实施例阐明的装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为电子设备,具体的,电子设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在一个典型的实例中电子设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现上述图像数据对比方法的步骤,该步骤包括:
步骤100:获取待识别的多个图像数据;
步骤200:提取所述多个图像数据的特征值;
步骤300:根据预生成的神经网络模型以及所述特征值对比所述多个图像数据。
下面参考图20,其示出了适于用来实现本申请实施例的电子设备600的结构示意图。
如图20所示,电子设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM))603中的程序而执行各种适当的工作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602、以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述图像数据对比方法的步骤,该步骤包括:
步骤100:获取待识别的多个图像数据;
步骤200:提取所述多个图像数据的特征值;
步骤300:根据预生成的神经网络模型以及所述特征值对比所述多个图像数据。
在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上该仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种图像数据对比方法,其特征在于,包括:
获取待识别的多个图像数据;
提取所述多个图像数据的特征值;
根据预生成的神经网络模型以及所述特征值对比所述多个图像数据。
2.根据权利要求1所述图像数据对比方法,其特征在于,生成所述神经网络模型的步骤包括:
利用3×3以及5×5卷积核训练所述神经网络模型的初始模型,以生成所述神经网络模型。
3.根据权利要求2所述图像数据对比方法,其特征在于,所述训练所述神经网络模型的初始模型包括:
以预设层数下采样所述初始模型中的卷基层-池化层,其中所述卷基层-池化层向前传播;
利用索贝尔边缘检测滤波器对采样后的初始模型进行迭代训练,当训练次数达到预设值或Loss值趋向0时,生成所述神经网络模型,其中所述神经网络模型为CNN卷积神经网络模型。
4.根据权利要求1所述图像数据对比方法,其特征在于,所述根据预生成的神经网络模型以及所述特征值对比所述多个图像数据,包括:
生成所述多个图像数据各自的哈希值;
根据所述哈希值生成所述特征值;
根据所述神经网络模型以及所述特征值,按照相似度对所述多个图像数据进行排序。
5.根据权利要求1所述图像数据对比方法,其特征在于,还包括:
对所述多个图像数据进行倾斜校正、噪声去除以及分辨率判别。
6.一种图像数据对比装置,其特征在于,包括:
图像数据获取单元,用于获取待识别的多个图像数据;
特征值提取单元,用于提取所述多个图像数据的特征值;
图像数据对比单元,用于根据预生成的神经网络模型以及所述特征值对比所述多个图像数据。
7.根据权利要求6所述图像数据对比装置,其特征在于,还包括:模型生成单元,用于生成所述神经网络模型,所述模型生成单元具体用于利用3×3以及5×5卷积核训练所述神经网络模型的初始模型,以生成所述神经网络模型。
8.根据权利要求7所述图像数据对比装置,其特征在于,所述模型生成单元包括:
采样模块,用于以预设层数下采样所述初始模型中的卷基层-池化层,其中所述卷基层-池化层向前传播;
训练模块,用于利用索贝尔边缘检测滤波器对采样后的初始模型进行迭代训练,当训练次数达到预设值或Loss值趋向0时,生成所述神经网络模型,其中所述神经网络模型为CNN卷积神经网络模型;
所述图像数据对比单元包括:
哈希值生成模块,用于生成所述多个图像数据各自的哈希值;
特征值生成模块,用于根据所述哈希值生成所述特征值;
图像数据排序模块,用于根据所述神经网络模型以及所述特征值,按照相似度对所述多个图像数据进行排序;
所述图像数据对比装置还包括预处理单元,用于对所述多个图像数据进行倾斜校正、噪声去除以及分辨率判别。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至5任一项所述图像数据对比方法的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至5任一项所述图像数据对比方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010625502.9A CN111797921A (zh) | 2020-07-02 | 2020-07-02 | 一种图像数据对比方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010625502.9A CN111797921A (zh) | 2020-07-02 | 2020-07-02 | 一种图像数据对比方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111797921A true CN111797921A (zh) | 2020-10-20 |
Family
ID=72809964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010625502.9A Pending CN111797921A (zh) | 2020-07-02 | 2020-07-02 | 一种图像数据对比方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111797921A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113593142A (zh) * | 2021-07-26 | 2021-11-02 | 中国工商银行股份有限公司 | 一种自动柜员机巡查方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108389187A (zh) * | 2018-01-30 | 2018-08-10 | 李家菊 | 基于卷积神经网络法和支持向量机法的影像科图像识别方法 |
CN109977750A (zh) * | 2019-01-15 | 2019-07-05 | 平安科技(深圳)有限公司 | 印章真伪校验方法、装置及计算机可读存储介质 |
CN110347851A (zh) * | 2019-05-30 | 2019-10-18 | 中国地质大学(武汉) | 基于卷积神经网络的图像检索方法及系统 |
WO2019223154A1 (zh) * | 2018-05-25 | 2019-11-28 | 平安科技(深圳)有限公司 | 单页高负载图像识别方法、装置、计算机设备及存储介质 |
CN110738236A (zh) * | 2019-09-16 | 2020-01-31 | 深圳市国信合成科技有限公司 | 图像匹配方法、装置、计算机设备及存储介质 |
CN111241329A (zh) * | 2020-01-06 | 2020-06-05 | 北京邮电大学 | 基于图像检索的古文字考释方法和装置 |
-
2020
- 2020-07-02 CN CN202010625502.9A patent/CN111797921A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108389187A (zh) * | 2018-01-30 | 2018-08-10 | 李家菊 | 基于卷积神经网络法和支持向量机法的影像科图像识别方法 |
WO2019223154A1 (zh) * | 2018-05-25 | 2019-11-28 | 平安科技(深圳)有限公司 | 单页高负载图像识别方法、装置、计算机设备及存储介质 |
CN109977750A (zh) * | 2019-01-15 | 2019-07-05 | 平安科技(深圳)有限公司 | 印章真伪校验方法、装置及计算机可读存储介质 |
CN110347851A (zh) * | 2019-05-30 | 2019-10-18 | 中国地质大学(武汉) | 基于卷积神经网络的图像检索方法及系统 |
CN110738236A (zh) * | 2019-09-16 | 2020-01-31 | 深圳市国信合成科技有限公司 | 图像匹配方法、装置、计算机设备及存储介质 |
CN111241329A (zh) * | 2020-01-06 | 2020-06-05 | 北京邮电大学 | 基于图像检索的古文字考释方法和装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113593142A (zh) * | 2021-07-26 | 2021-11-02 | 中国工商银行股份有限公司 | 一种自动柜员机巡查方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3437019B1 (en) | Optical character recognition in structured documents | |
WO2018166116A1 (zh) | 车损识别方法、电子装置及计算机可读存储介质 | |
TW201911130A (zh) | 一種翻拍影像識別方法及裝置 | |
US9977968B2 (en) | System and method for relevance estimation in summarization of videos of multi-step activities | |
JP2020524348A (ja) | 顔画像検索方法およびシステム、撮影装置、ならびにコンピュータ記憶媒体 | |
EP1388804A2 (en) | Method and system for face detection using pattern classifier | |
US8842889B1 (en) | System and method for automatic face recognition | |
US20140348420A1 (en) | Method and system for automatic selection of one or more image processing algorithm | |
WO2020164278A1 (zh) | 一种图像处理方法、装置、电子设备和可读存储介质 | |
US9870420B2 (en) | Classification and storage of documents | |
WO2021081562A2 (en) | Multi-head text recognition model for multi-lingual optical character recognition | |
JP2011521355A (ja) | 勾配ヒストグラムを用いた指紋表現 | |
US11315358B1 (en) | Method and system for detection of altered fingerprints | |
CN112101386B (zh) | 文本检测方法、装置、计算机设备和存储介质 | |
EP0587863A1 (en) | Character-recognition systems and methods with means to measure endpoint features in character bit-maps | |
CN110942456B (zh) | 篡改图像检测方法、装置、设备及存储介质 | |
JP2020052520A (ja) | 判定装置、判定方法、およびプログラム | |
CN102891751A (zh) | 从指纹图像生成业务密码的方法和设备 | |
Wahlberg et al. | Large scale continuous dating of medieval scribes using a combined image and language model | |
CN113705650B (zh) | 一种人脸图片集的处理方法、装置、介质和计算设备 | |
CN111967412A (zh) | 基于联邦学习的人脸属性识别方法、客户端、设备及介质 | |
CN108052918A (zh) | 一种笔迹比对系统及方法 | |
CN115240203A (zh) | 业务数据处理方法、装置、设备及存储介质 | |
US10657369B1 (en) | Unsupervised removal of text from images using linear programming for optimal filter design | |
CN111797921A (zh) | 一种图像数据对比方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |