CN110942063A - 证件文字信息获取方法、装置以及电子设备 - Google Patents
证件文字信息获取方法、装置以及电子设备 Download PDFInfo
- Publication number
- CN110942063A CN110942063A CN201911150349.2A CN201911150349A CN110942063A CN 110942063 A CN110942063 A CN 110942063A CN 201911150349 A CN201911150349 A CN 201911150349A CN 110942063 A CN110942063 A CN 110942063A
- Authority
- CN
- China
- Prior art keywords
- certificate
- image
- certificate image
- identified
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
本申请提供了一种证件文字信息获取方法、装置以及电子设备,涉及计算机技术领域。该方法包括:获取待识别证件图像;基于预置的证件分类模型对所述待识别证件图像进行分类,得到分类结果;确定与所述分类结果对应的语义词典;对所述待识别证件图像进行文字识别处理,确定所述待识别证件图像中的文字信息;基于所述语义词典,对所述文字信息进行语义纠错,得到纠错后的文字信息。本申请实现了证件图像的自动分类,同时提升了证件图像文字识别的准确度。
Description
技术领域
本申请涉及计算机技术领域,具体而言,本申请涉及一种证件文字信息获取方法、装置以及电子设备。
背景技术
目前,关于各种资质证件的维护可以采用人工维护或采用光学字符识别(OpticalCharacter Recognition,OCR)技术来识别证件图像,人工维护指的是由人工在终端设备上输入证件信息,由于证件所包含的信息非常多,人工维护资质证件的工作量是巨大,录入效率较慢,出错率高,浪费人力,而采用OCR技术,现有的OCR技术在识别证件信息时常常会发生识别出错的现象,准确度较低。
发明内容
为了解决现有技术中所存在的问题中的至少一个,本申请实施例提供了一种一种证件文字信息获取方法、装置以及电子设备,本申请实施例所提供的技术方案如下:
本申请的第一方面提供了一种证件文字信息获取方法,包括:
获取待识别证件图像;
基于预置的证件分类模型对待识别证件图像进行分类,得到分类结果;
确定与分类结果对应的语义词典;
对待识别证件图像进行文字识别处理,确定待识别证件图像中的文字信息;
基于语义词典,对文字信息进行语义纠错,得到纠错后的文字信息。
本申请的第二方面提供了一种证件文字信息获取装置,该装置包括:
获取模块,用于获取待识别证件图像;
分类模块,用于基于预置的证件分类模型对待识别证件图像进行分类,得到分类结果;
第一确定模块,用于确定与分类结果对应的语义词典;
第二确定模块,用于对待识别证件图像进行文字识别处理,确定待识别证件图像中的文字信息;
纠错模块,用于基于语义词典,对文字信息进行语义纠错,得到纠错后的文字信息。
可选的,分类模块在基于预置的证件分类模型对待识别证件图像进行分类,得到分类结果之前,该装置还包括:
训练模块,用于训练得到证件分类模型;
训练模块,具体用于:
获取至少两个携带分类标签的证件图像样本,至少两个证件图像样本中包括至少两种证件类型的证件图像样本;
基于神经网络学习算法,确定各证件图像样本的图像内容关键点;
对各证件图像样本进行预处理;
基于图像内容关键点和预处理后的各证件图像样本,获取各证件图像样本的图像特征;
基于各证件图像的图像特征及相应的分类标签,对证件分类模型进行训练,以得到训练后的证件分类模型。
可选的,分类模块在基于预置的证件分类模型对待识别证件图像进行分类,得到分类结果时,具体用于:
基于神经网络学习算法,确定待识别证件图像的图像内容关键点;
对待识别证件图像进行预处理;
基于待识别证件图像的图像内容关键点和预处理后的待识别证件图像,获取待识别证件图像的图像特征;
基于待识别证件图像的图像特征,通过预置的证件分类模型确定与待识别证件图像的图像特征相匹配的证件类别,并将证件类别作为待识别证件图像的证件类别。
可选的,该装置还包括:预处理模块、第三确定模块以及切割模块;
第二确定模块在对待识别证件图像进行文字识别处理之前,预处理模块、第三确定模块以及切割模块分别用于执行如下操作:
预处理模块,用于对待识别证件图像进行预处理;
第三确定模块,用于基于预处理后的待识别证件图像,确定待识别证件图像中文字的区域范围;
切割模块,用于基于区域范围,切割待识别证件图像,得到待识别文字区域;
第二确定模块在对待识别证件图像进行文字识别处理,确定待识别证件图像中的文字信息时,具体用于:
基于待识别文字区域,提取待识别文字区域中的文字信息。
可选的,预处理包括以下至少一项处理方式:
图像二值化、去除图像内容干扰项、修改图像亮度、修改图像对比度、去除图像杂质项。
可选的,该装置还包括调整模块,第三确定模块在基于预处理后的待识别证件图像,确定待识别证件图像中文字的区域范围之前,调整模块用于执行以下至少一个操作:
调整待识别证件图像的方向;
调整待识别证件图像中内容信息的方向;
第三确定模块在基于预处理后的待识别证件图像,确定待识别证件图像中文字的区域范围时,具体用于:
基于预处理后的、调整方向的待识别证件图像,确定待识别证件图像中文字的区域范围。
本申请第三方面,提供了一种电子设备,该电子设备包括:
电子设备包括存储器和处理器;
存储器中存储有计算机程序;
处理器,用于在运行计算机程序时执行第一方面中任一项的方法。
本申请第四方面,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时可以执行第一方面中任一项的方法。
本申请提供的技术方案带来的有益效果是:
本申请可以基于预置的证件分类模型对待识别证件图像进行分类得到分类结果,从而确定与分类结果对应的语义词典,在获取待识别证件图像中的文字信息后,可以基于语义词典对文字信息进行语义纠错,得到纠错后的文字信息,与分类结果对应的语义词典中文字的语义更加符合待识别证件图像中文字信息的实际含义,从而基于该语义词典来完成文字信息的纠错,可以使得识别得到的文字信息更准确,相对于人工录入证件信息的方式,加快了证件信息录入的效率和准确度,同时通过证件分类模型对待识别证件图像进行分类也可以实现证件图像的精准分类。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请证件文字信息获取方法的实施例示意图;
图2为本申请证件分类模型训练以及使用的实施例示意图;
图3为本申请证件图像文字识别的实施例示意图;
图4为本申请证件文字信息获取装置的实施例示意图;
图5为本申请电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
请参照图1,本申请提供了一种证件文字信息获取方法,该方法具体可以由证件处理装置或证件文字信息获取装置或服务器执行,本申请包括:
步骤S101:获取待识别证件图像;
步骤S102:基于预置的证件分类模型对待识别证件图像进行分类,得到分类结果;
步骤S103:确定与分类结果对应的语义词典;
证件处理装置具有证件分类、证件文字信息识别以及识别后录入文字信息的功能,对于一个待识别证件图像而言,证件识别装置通过扫描或拍摄用户证件的方式获取待识别证件图像后,可以基于预置的证件分类模型对待识别证件图像进行分类得到分类结果,对待识别证件图像进行分类的一种可能的情况是:将待识别证件图像归为营业执照证类证件、组织机构代码证类的证件以及其他类型的证件中任一类证件。
由于汉语含义的复杂性,对于某一词语或者句子,包含其一种或多种语义(或术语表示),那么我们需要做语义纠错,防止提取出的文字内容失去特定的含义,可以枚举出这些术语作为语义词典,这样可以利用语义词典达到纠错的功能。
每一类别的证件图像均具有一一对应的语义词典,则根据证件图像的分类结果可以确定语义词典,语义词典也可以称之为语义字典或数据字典。本申请通过确定与证件类别对应的语义词典,该词典中词语或句子的语义更加贴近证件实际的类别,这样可以将与证件类别差别较大的语义剔除掉。
步骤S104:对待识别证件图像进行文字识别处理,确定待识别证件图像中的文字信息;
步骤S105:基于语义词典,对文字信息进行语义纠错,得到纠错后的文字信息。
证件处理设备可以通过OCR技术来对待识别证件图像进行文字识别处理,确定待识别证件图像的文字信息,再基于上述确定得到的与证件图像类别对应的语义词典,对文字信息中词语或句子的语义进行语义纠错,得到纠错后的文字信息。
本申请可以基于预置的证件分类模型对待识别证件图像进行分类得到分类结果,从而确定与分类结果对应的语义词典,在获取待识别证件图像中的文字信息后,可以基于语义词典对文字信息进行语义纠错,得到纠错后的文字信息,与分类结果对应的语义词典中文字的语义更加符合待识别证件图像中文字信息的实际含义,从而基于该语义词典来完成文字信息的纠错,可以使得识别得到的文字信息更准确,相对于人工录入证件信息的方式,加快了证件信息录入的效率和准确度,同时通过证件分类模型对待识别证件图像进行分类也可以实现证件图像的精准分类。
可选的,基于预置的证件分类模型对待识别证件图像进行分类,得到分类结果之前,该方法还包括:
训练得到证件分类模型;
训练得到证件分类模型,包括:
获取至少两个携带分类标签的证件图像样本,至少两个证件图像样本中包括至少两种证件类型的证件图像样本;
基于神经网络学习算法,确定各证件图像样本的图像内容关键点;
对各证件图像样本进行预处理;
基于图像内容关键点和预处理后的各证件图像样本,获取各证件图像样本的图像特征;
基于各证件图像的图像特征及相应的分类标签,对证件分类模型进行训练,以得到训练后的证件分类模型。
可选的,预处理包括以下至少一项处理方式:
图像二值化、去除图像内容干扰项、修改图像亮度、修改图像对比度、去除图像杂质项。
在本实施例中,请参照图2,证件分类模型的训练过程为:
第一步:证件图像样本输入
证件处理装置可以通过扫描或拍摄用户证件的方式获取至少两个证件图像样本,证件处理装置的管理人员将证件图像样本以文件夹的形式归类或对证件图像样本做分类标记,形成至少两种证件类型的证件图像。比如,管理人员分别创建两个名为“营业执照证”和“组织机构代码证”的文件夹,并将准备好的证件图像样本分别放置在两个文件夹中,这样各文件夹中的证件图像样本都携带所在文件夹对应的分类标签;或管理人员对证件图像样本做分类标记,形成携带分类标签的证件图像样本。
第二步:数据特征分析
每一张证件图像样本都有自己的数据特征,这些数据特征也就是表示图像内容关键点,可以基于神经网络学习算法,分析并获取各证件图像样本的图像内容关键点,神经网络学习算法可以是卷积神经网络(Convolutional Neural Networks,CNN)学习算法、循环神经网络(Recurrent Neural Network,RNN)学习算法以及深度神经网络(deep NeuralNetwork,DNN)学习算法中任一项。
第三步:证件图像样本预处理
对各证件图像样本进行预处理,预处理的目的是让证件图像更加清晰和整洁,预处理包括以下至少一项:
图像二值化处理,将图片变为黑白两色,黑色加黑,白色变白,使图像呈现出明显的黑白效果,形成最鲜明的对比;
去除图像内容干扰项处理(如去除扫描件污点)、去除图像杂质项处理(如去除红色印章等);
修改图像亮度处理、修改图像对比度处理。
第四步:图像特征提取
基于预处理后的各证件图像样本和上述确定的各证件图像样本的图像内容关键点,将图像内容关键点中无法表示图像特征的图像内容关键点剔除掉,提取得到各证件图像样本的图像特征,一个证件图像样本可以具有一个或多个图像特征,图样特征也可以称作为图像特征点,指的是图像中具有鲜明特性并能够有效反映图像本质特征、能够标识图像中目标物体的点,将表示该证件图像信息的图像特征汇总在一起,并做记录存储。
第五步:模型训练和证件分类识别
在第一步中已经完成了证件图像样本的分类,程序自动识别证件图像样本后也就可以告知程序证件图像样本的分类标签,基于各证件图像样本的图像特征,以及各证件图像样本的分类标签,确定各类别下的证件图像样本所具有的图像特征,从而进行模型训练得到证件分类模型。
本申请可以通过大量样本的训练,逐步提升证件分类模型的识别精度,后续使用证件分类模型进行证件分类识别时,只要证件图像样本具有某个证件类别的图像特征就应该属于某证件类别。
具体的,关于第五步中证件分类识别的具体过程是:
可选的,基于预置的证件分类模型对待识别证件图像进行分类,得到分类结果,包括:
基于神经网络学习算法,确定待识别证件图像的图像内容关键点;
对待识别证件图像进行预处理;
基于待识别证件图像的图像内容关键点和预处理后的待识别证件图像,获取待识别证件图像的图像特征;
基于待识别证件图像的图像特征,通过预置的证件分类模型确定与待识别证件图像的图像特征相匹配的证件类别,并将证件类别作为待识别证件图像的证件类别。
在本实施例中,对待识别证件图像进行分类时,也需要与证件分类模型训练过程一样,经过上述预处理和提取图像特征的过程,然后将待识别证件图像输入至证件分类模型,基于待识别证件图像的图像特征,证件分类模型对待识别证件图像进行分类,分类的具体方式是:如上述证件分类模型中各证件类别都对应有图像特征,将待识别证件图像的图像特征与各证件类别的图像特征进行比对,只要匹配度满足预置匹配度要求,则该证件类别即为待识别证件图像的证件类别。
可见,本申请识别证件图像时,只需要匹配图像特征,如果图像特征相匹配,符合预置匹配度要求,则能明确知道该证件图像属于哪一证件类别,如果不符合,可以继续训练该证件图片,逐步丰富训练证件图像库。
从上面的实施例中可以看出,我们完成了证件图像的分类识别过程,可以从一堆证件图像中快速做出证件分类,将其归档在不同文件夹内,接下来要实现证件图片文字内容的提取,将其录入到数据表单,下面,对文字提取的过程进行说明:
可选的,对待识别证件图像进行文字识别处理之前,该方法包括:
对待识别证件图像进行预处理;
基于预处理后的待识别证件图像,确定待识别证件图像中文字的区域范围;
基于区域范围,切割待识别证件图像,得到待识别文字区域;
对待识别证件图像进行文字识别处理,确定待识别证件图像中的文字信息,包括:
基于待识别文字区域,提取待识别文字区域中的文字信息。
可选的,基于预处理后的待识别证件图像,确定待识别证件图像中文字的区域范围之前,方法还包括以下至少一项:
调整待识别证件图像的方向;
调整待识别证件图像中内容信息的方向;
基于预处理后的待识别证件图像,确定待识别证件图像中文字的区域范围,包括:
基于预处理后的、调整方向的待识别证件图像,确定待识别证件图像中文字的区域范围。
请参照图3,对待识别证件中文字信息的识别主要包括如下过程:
S1:证件图像预处理
对待识别证件图像进行文字识别处理之前,还需要先将待识别证件图像进行上述预处理过程,如上述对待识别证件进行分类时也经过了预处理,本实施例可以直接用证件分类阶段预处理后的待识别证件图像,也可以基于要实现的目的不同,本实施是为了对证件图像进行文字提取,可能需要再次调节图像亮度或对比度,可以再进一步对待识别证件进行预处理。
S2:校正证件图像方位
预处理后的证件图像还需要进行方位校正,证件图像可能是扫描件,扫描件可能发生倾斜,本实施例中,可以校正图像方位,调整证件图像方向到标准格式,校正过证件图像方向后,证件图像文字内容可能也不是水平方向,证件处理装置通过提取文字直线方向与竖向垂直线间的角度,如果该角度不是90度,则需要改变文字方向,调整文字方向到标准格式(90度)。
S3:提取证件图像中的文字
证件图像上存在大量空白,这样对程序识别证件图像中文字内容来说也是很大的干扰项,需要先确定待识别证件图像中文字的区域范围,缩小识别范围。
S4:证件图像切割
找到文图像中文字的区域范围后,进行图像切割,将证件中空白部分去除掉,留下有效的文字信息,从而得到待识别文字区域,做到有效内容的识别与提取。
S5:文字识别
通过前几步的准备,就可以做出文字识别,提取待识别文字区域中的文字信息。
S6:语义纠错
本申请实施例步骤S6的具体实施过程可以参照上述实施例步骤S103和步骤S106中的内容,具体此处不再赘述。
综上,就完成了待识别证件的证件分类以及文字信息提取过程。
更进一步的,本申请可以应用于医疗行业。由于医疗行业的特殊性,医疗责任重大,所以国家监管非常严格,对于医疗使用的耗材监管也是层层把关,各个环节都需要提供相关资质证明,通过本申请的证件文字信息提取方法,可以实现供应商资质证件快速识别与分类,应用神经网络学习算法以及图像识别技术,建立机器学习模型(即上述证件分类模型),输入大量证件图像样本,通过机器学习模型进行图像特征分析与提取,继续通过持续不断学习,提升识别精度。最终程序会自动识别证件,做到批量分类与维护资质证件,并将证件信息录入数据表单。
本申请总体而言具有如下有益效果:
证件处理装置通过自动识别证件图像文字信息以及对批量的证件图像进行分类,大大提高了证件维护人员(即上述证件处理装置的管理人员)的工作效率,证件维护方式不再是传统的纯手工录入,减少了繁重而枯燥的重复性操作,另外通过预处理和证件图像方位校正,过滤掉不符合标准的证件图像,保证上传证件的高质量。
上面图1至图3介绍了本申请提供的一种证件文字信息获取方法,本申请还提供了一种证件文字信息获取装置,请参照图4,下面将介绍本申请的证件文字信息获取装置,该装置包括:
获取模块401,用于获取待识别证件图像;
分类模块402,用于基于预置的证件分类模型对待识别证件图像进行分类,得到分类结果;
第一确定模块403,用于确定与分类结果对应的语义词典;
第二确定模块404,用于对待识别证件图像进行文字识别处理,确定待识别证件图像中的文字信息;
纠错模块405,用于基于语义词典,对文字信息进行语义纠错,得到纠错后的文字信息。
可选的,分类模块402在基于预置的证件分类模型对待识别证件图像进行分类,得到分类结果之前,该装置还包括:
训练模块,用于训练得到证件分类模型;
训练模块,具体用于:
获取至少两个携带分类标签的证件图像样本,至少两个证件图像样本中包括至少两种证件类型的证件图像样本;
基于神经网络学习算法,确定各证件图像样本的图像内容关键点;
对各证件图像样本进行预处理;
基于图像内容关键点和预处理后的各证件图像样本,获取各证件图像样本的图像特征;
基于各证件图像的图像特征及相应的分类标签,对证件分类模型进行训练,以得到训练后的证件分类模型。
可选的,分类模块402在基于预置的证件分类模型对待识别证件图像进行分类,得到分类结果时,具体用于:
基于神经网络学习算法,确定待识别证件图像的图像内容关键点;
对待识别证件图像进行预处理;
基于待识别证件图像的图像内容关键点和预处理后的待识别证件图像,获取待识别证件图像的图像特征;
基于待识别证件图像的图像特征,通过预置的证件分类模型确定与待识别证件图像的图像特征相匹配的证件类别,并将证件类别作为待识别证件图像的证件类别。
可选的,该装置还包括:预处理模块、第三确定模块以及切割模块;
第二确定模块404在对待识别证件图像进行文字识别处理之前,预处理模块、第三确定模块以及切割模块分别用于执行如下操作:
预处理模块,用于对待识别证件图像进行预处理;
第三确定模块,用于基于预处理后的待识别证件图像,确定待识别证件图像中文字的区域范围;
切割模块,用于基于区域范围,切割待识别证件图像,得到待识别文字区域;
第二确定模块404在对待识别证件图像进行文字识别处理,确定待识别证件图像中的文字信息时,具体用于:
基于待识别文字区域,提取待识别文字区域中的文字信息。
可选的,预处理包括以下至少一项处理方式:
图像二值化、去除图像内容干扰项、修改图像亮度、修改图像对比度、去除图像杂质项。
可选的,该装置还包括调整模块,第三确定模块在基于预处理后的待识别证件图像,确定待识别证件图像中文字的区域范围之前,调整模块用于执行以下至少一个操作:
调整待识别证件图像的方向;
调整待识别证件图像中内容信息的方向;
第三确定模块在基于预处理后的待识别证件图像,确定待识别证件图像中文字的区域范围时,具体用于:
基于预处理后的、调整方向的待识别证件图像,确定待识别证件图像中文字的区域范围。
由于本申请实施例所提供的装置为可以执行本申请实施例中相应的方法的装置,故而基于本申请实施例中所提供的方法,本领域所属技术人员能够了解本申请实施例的装置的具体实施方式以及其各种变化形式,所以在此对于该装置如何实现本申请实施例中的方法不再详细介绍。只要本领域所属技术人员实施本申请实施例中的方法所采用的装置,都属于本申请所欲保护的范围。
基于与本申请实施例所提供的方法相同的原理,本申请实施例还提供了一种电子设备,该电子设备包括存储器和处理器;存储器中存储有计算机程序;处理器用于在运行计算机程序时执行本申请任一可选实施例中所提供的方法。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时可以实现本申请任一可选实施例中所提供的方法。
作为一示例,图5中示出了本申请可以应用于的一种电子设备的结构示意图,该电子设备具体可以是证件处理装置或服务器,也可以是其他设备,该电子设备8000包括存储器8003和处理器8001,存储器8003中存储有计算机程序,处理器8001,用于在运行计算机程序时执行上述任一方法。具体的,图5只是示出了电子设备的一种可选的示意性结构。图5中所示的该电子设备8000的结构并不构成对本申请实施例的限定。
其中,处理器8001和存储器8003相连,如通过总线8002相连。可选地,电子设备8000还可以包括收发器8004。需要说明的是,实际应用中收发器8004不限于一个,收发器8004可以具体用于该电子设备8000与其他设备的通信。
处理器8001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请申请内容所描述的各种示例性的逻辑方框,模块和电路。处理器8001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线8002可包括一通路,在上述组件之间传送信息。总线8002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线8002可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器8003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器8003用于存储执行本申请方案的应用程序代码,并由处理器8001来控制执行。处理器8001用于执行存储器8003中存储的应用程序代码,以实现上面任一方法实施例所示的内容。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种证件文字信息获取方法,其特征在于,包括:
获取待识别证件图像;
基于预置的证件分类模型对所述待识别证件图像进行分类,得到分类结果;
确定与所述分类结果对应的语义词典;
对所述待识别证件图像进行文字识别处理,确定所述待识别证件图像中的文字信息;
基于所述语义词典,对所述文字信息进行语义纠错,得到纠错后的文字信息。
2.根据权利要求1所述的方法,其特征在于,所述基于预置的证件分类模型对所述待识别证件图像进行分类,得到分类结果之前,所述方法还包括:
训练得到所述证件分类模型;
所述训练得到所述证件分类模型,包括:
获取至少两个携带分类标签的证件图像样本,所述至少两个证件图像样本中包括至少两种证件类型的证件图像样本;
基于神经网络学习算法,确定各证件图像样本的图像内容关键点;
对各证件图像样本进行预处理;
基于所述图像内容关键点和预处理后的各证件图像样本,获取各证件图像样本的图像特征;
基于各证件图像的图像特征及相应的分类标签,对证件分类模型进行训练,以得到训练后的所述证件分类模型。
3.根据权利要求2所述的方法,其特征在于,所述基于预置的证件分类模型对所述待识别证件图像进行分类,得到分类结果,包括:
基于所述神经网络学习算法,确定所述待识别证件图像的图像内容关键点;
对所述待识别证件图像进行预处理;
基于所述待识别证件图像的图像内容关键点和所述预处理后的待识别证件图像,获取所述待识别证件图像的图像特征;
基于所述待识别证件图像的图像特征,通过所述预置的证件分类模型确定与所述待识别证件图像的图像特征相匹配的证件类别,并将所述证件类别作为所述待识别证件图像的证件类别。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述对所述待识别证件图像进行文字识别处理之前,所述方法还包括:
对所述待识别证件图像进行预处理;
基于所述预处理后的待识别证件图像,确定所述待识别证件图像中文字的区域范围;
基于所述区域范围,切割所述待识别证件图像,得到待识别文字区域;
所述对待识别证件图像进行文字识别处理,确定所述待识别证件图像中的文字信息,包括:
基于所述待识别文字区域,提取所述待识别文字区域中的文字信息。
5.根据权利要求2至4中任一项所述的方法,其特征在于,所述预处理包括以下至少一项处理方式:
图像二值化、去除图像内容干扰项、修改图像亮度、修改图像对比度、去除图像杂质项。
6.根据权利要求4所述的方法,其特征在于,所述基于所述预处理后的待识别证件图像,确定所述待识别证件图像中文字的区域范围之前,所述方法还包括以下至少一项:
调整所述待识别证件图像的方向;
调整所述待识别证件图像中内容信息的方向;
所述基于所述预处理后的待识别证件图像,确定所述待识别证件图像中文字的区域范围,包括:
基于预处理后的、调整方向的待识别证件图像,确定所述待识别证件图像中文字的区域范围。
7.一种证件文字信息获取装置,其特征在于,包括:
获取模块,用于获取待识别证件图像;
分类模块,用于基于预置的证件分类模型对所述待识别证件图像进行分类,得到分类结果;
第一确定模块,用于确定与所述分类结果对应的语义词典;
第二确定模块,用于对所述待识别证件图像进行文字识别处理,确定所述待识别证件图像中的文字信息;
纠错模块,用于基于所述语义词典,对所述文字信息进行语义纠错,得到纠错后的文字信息。
8.根据权利要7所述的装置,其特征在于,所述装置还包括:
训练模块,用于训练得到所述证件分类模型;
所述训练模块,具体用于:
获取至少两个携带分类标签的证件图像样本,所述至少两个证件图像样本中包括至少两种证件类型的证件图像样本;
基于神经网络学习算法,确定各证件图像样本的图像内容关键点;
对各证件图像样本进行预处理;
基于所述图像内容关键点和预处理后的各证件图像样本,获取各证件图像样本的图像特征;
基于各证件图像的图像特征及相应的分类标签,对证件分类模型进行训练,以得到训练后的所述证件分类模型。
9.一种电子设备,其特征在于,包括:
所述电子设备包括存储器和处理器;
所述存储器中存储有计算机程序;
所述处理器,用于在运行所述计算机程序时执行权利要求1-6中任一项所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911150349.2A CN110942063B (zh) | 2019-11-21 | 2019-11-21 | 证件文字信息获取方法、装置以及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911150349.2A CN110942063B (zh) | 2019-11-21 | 2019-11-21 | 证件文字信息获取方法、装置以及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110942063A true CN110942063A (zh) | 2020-03-31 |
CN110942063B CN110942063B (zh) | 2023-04-07 |
Family
ID=69907824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911150349.2A Active CN110942063B (zh) | 2019-11-21 | 2019-11-21 | 证件文字信息获取方法、装置以及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110942063B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101317A (zh) * | 2020-11-17 | 2020-12-18 | 深圳壹账通智能科技有限公司 | 页面方向识别方法、装置、设备及计算机可读存储介质 |
CN112669049A (zh) * | 2020-12-31 | 2021-04-16 | 车主邦(北京)科技有限公司 | 一种验证物流车辆证件信息的方法及装置 |
CN112668580A (zh) * | 2020-12-28 | 2021-04-16 | 南京航天数智科技有限公司 | 一种文本识别方法、文本识别装置及终端设备 |
CN113298188A (zh) * | 2021-06-28 | 2021-08-24 | 深圳市商汤科技有限公司 | 字符识别及神经网络训练方法和装置 |
CN114782952A (zh) * | 2022-03-14 | 2022-07-22 | 来也科技(北京)有限公司 | 结合rpa和ai的交通业务处理方法、装置及电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1329323A (zh) * | 2001-07-31 | 2002-01-02 | 郭根龙 | 证件自动扫描识别与管理方法及其系统 |
CN101470896A (zh) * | 2007-12-24 | 2009-07-01 | 南京理工大学 | 基于视频分析的机动目标飞行模式预测方法 |
US20120281077A1 (en) * | 2009-11-10 | 2012-11-08 | Icar Vision Systems S L | Method and system for reading and validating identity documents |
CN107463959A (zh) * | 2017-08-05 | 2017-12-12 | 国网江西省电力公司电力科学研究院 | 一种基于bp神经网络的果实蝇识别方法 |
CN108664973A (zh) * | 2018-03-28 | 2018-10-16 | 北京捷通华声科技股份有限公司 | 文本处理方法和装置 |
CN109117773A (zh) * | 2018-08-01 | 2019-01-01 | Oppo广东移动通信有限公司 | 一种图像特征点检测方法、终端设备及存储介质 |
CN109492643A (zh) * | 2018-10-11 | 2019-03-19 | 平安科技(深圳)有限公司 | 基于ocr的证件识别方法、装置、计算机设备及存储介质 |
CN109800312A (zh) * | 2018-12-11 | 2019-05-24 | 广东电网有限责任公司 | 一种电力营销信息管理资料录入系统及方法 |
CN109815976A (zh) * | 2018-12-14 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 一种证件信息识别方法、装置及设备 |
TWM585377U (zh) * | 2019-04-11 | 2019-10-21 | 富邦人壽保險股份有限公司 | 證件識別系統 |
-
2019
- 2019-11-21 CN CN201911150349.2A patent/CN110942063B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1329323A (zh) * | 2001-07-31 | 2002-01-02 | 郭根龙 | 证件自动扫描识别与管理方法及其系统 |
CN101470896A (zh) * | 2007-12-24 | 2009-07-01 | 南京理工大学 | 基于视频分析的机动目标飞行模式预测方法 |
US20120281077A1 (en) * | 2009-11-10 | 2012-11-08 | Icar Vision Systems S L | Method and system for reading and validating identity documents |
CN107463959A (zh) * | 2017-08-05 | 2017-12-12 | 国网江西省电力公司电力科学研究院 | 一种基于bp神经网络的果实蝇识别方法 |
CN108664973A (zh) * | 2018-03-28 | 2018-10-16 | 北京捷通华声科技股份有限公司 | 文本处理方法和装置 |
CN109117773A (zh) * | 2018-08-01 | 2019-01-01 | Oppo广东移动通信有限公司 | 一种图像特征点检测方法、终端设备及存储介质 |
CN109492643A (zh) * | 2018-10-11 | 2019-03-19 | 平安科技(深圳)有限公司 | 基于ocr的证件识别方法、装置、计算机设备及存储介质 |
CN109800312A (zh) * | 2018-12-11 | 2019-05-24 | 广东电网有限责任公司 | 一种电力营销信息管理资料录入系统及方法 |
CN109815976A (zh) * | 2018-12-14 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 一种证件信息识别方法、装置及设备 |
TWM585377U (zh) * | 2019-04-11 | 2019-10-21 | 富邦人壽保險股份有限公司 | 證件識別系統 |
Non-Patent Citations (3)
Title |
---|
CHAO CHEN 等: "DRLgencert:Deep Learning-Based Automated Testing of Certificate Verification in SSL/TLS Implementations", 《2018 IEEE INTERNATIONAL CONFERENCE ON SOFTWARE MAINTENANCE AND EVOLUTION》 * |
刘春平等: "复杂背景下多证件快速识别系统的研究与实现", 《现代计算机(专业版)》 * |
林辉煌: "基于预决策的卷积神经网络加速研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101317A (zh) * | 2020-11-17 | 2020-12-18 | 深圳壹账通智能科技有限公司 | 页面方向识别方法、装置、设备及计算机可读存储介质 |
CN112101317B (zh) * | 2020-11-17 | 2021-02-19 | 深圳壹账通智能科技有限公司 | 页面方向识别方法、装置、设备及计算机可读存储介质 |
CN112668580A (zh) * | 2020-12-28 | 2021-04-16 | 南京航天数智科技有限公司 | 一种文本识别方法、文本识别装置及终端设备 |
CN112669049A (zh) * | 2020-12-31 | 2021-04-16 | 车主邦(北京)科技有限公司 | 一种验证物流车辆证件信息的方法及装置 |
CN113298188A (zh) * | 2021-06-28 | 2021-08-24 | 深圳市商汤科技有限公司 | 字符识别及神经网络训练方法和装置 |
CN114782952A (zh) * | 2022-03-14 | 2022-07-22 | 来也科技(北京)有限公司 | 结合rpa和ai的交通业务处理方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110942063B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110942063B (zh) | 证件文字信息获取方法、装置以及电子设备 | |
CN110826416B (zh) | 一种基于深度学习的卫浴陶瓷表面缺陷检测方法及装置 | |
US10817741B2 (en) | Word segmentation system, method and device | |
US10438083B1 (en) | Method and system for processing candidate strings generated by an optical character recognition process | |
CN105279506A (zh) | 满文单词中轴线的定位方法 | |
CN109784342A (zh) | 一种基于深度学习模型的ocr识别方法及终端 | |
Caldeira et al. | Industrial optical character recognition system in printing quality control of hot-rolled coils identification | |
CN113705576B (zh) | 一种文本识别方法、装置、可读存储介质及设备 | |
Revathi et al. | Comparative analysis of text extraction from color images using tesseract and opencv | |
CN110738030A (zh) | 表格重建方法、装置、电子设备及存储介质 | |
AbdelRaouf et al. | Arabic character recognition using a Haar cascade classifier approach (HCC) | |
CN110796210A (zh) | 一种标签信息的识别方法及装置 | |
CN113191358A (zh) | 金属零件表面文本检测方法和系统 | |
CN112508000B (zh) | 一种用于ocr图像识别模型训练数据生成的方法及设备 | |
CN114596242A (zh) | 缺陷检测方法、装置、电子设备及计算机可读存储介质 | |
CN114612919B (zh) | 一种票据信息处理系统及方法、装置 | |
CN116524297A (zh) | 一种基于专家反馈的弱监督学习训练方法 | |
CN110674678A (zh) | 视频中敏感标志的识别方法及装置 | |
CN113158745B (zh) | 一种基于多特征算子的乱码文档图片识别方法及系统 | |
CN114359931A (zh) | 一种快递面单识别方法、装置、计算机设备及存储介质 | |
CN114519416A (zh) | 模型蒸馏方法、装置及电子设备 | |
CN112733670A (zh) | 指纹特征提取方法、装置、电子设备及存储介质 | |
Fang et al. | Raw material form recognition based on Tesseract-OCR | |
CN113505784A (zh) | 甲片自动标注解析方法及装置、电子设备及存储介质 | |
Dixit et al. | SOUTH INDIAN TAMIL LANGUAGE HANDWRITTEN DOCUMENT TEXT LINE SEGMENTATION TECHNIQUE WITH AID OF SLIDING WINDOW AND SKEWING OPERATIONS. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |