CN109388935A - 单证验证方法及装置、电子设备及可读存储介质 - Google Patents
单证验证方法及装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN109388935A CN109388935A CN201811151533.4A CN201811151533A CN109388935A CN 109388935 A CN109388935 A CN 109388935A CN 201811151533 A CN201811151533 A CN 201811151533A CN 109388935 A CN109388935 A CN 109388935A
- Authority
- CN
- China
- Prior art keywords
- text
- document
- corner
- profile
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000012795 verification Methods 0.000 title claims abstract description 33
- 238000004422 calculation algorithm Methods 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000012550 audit Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 96
- 230000006870 function Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 9
- 238000012706 support-vector machine Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000009182 swimming Effects 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007373 indentation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000013522 software testing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/36—User authentication by graphic or iconic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Computer Security & Cryptography (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
Abstract
一种基于文字识别的单证验证方法,所述方法包括:读取单证影像;从所述单证影像中截取出文字图像;识别所述文字图像中的文字;判断识别的文字是否正确;及显示识别的文字及文字识别的判断结果。本发明还提供一种单证验证装置、电子设备及可读存储介质。本发明可以自动获取并识别单证影像中的文字,及判断用户在单证上的签名是否正确,减少后续人工审核的工作量,提高了工作人员的实效和客户体验。
Description
技术领域
本发明涉及图像识别技术领域,具体涉及一种单证验证方法及装置、电子设备和计算机可读存储介质。
背景技术
目前的一些网页板投保软件,如平安的MIT软件需要客户在纸质单证上完成签名签署,柜面交回后,再由人工核保进行内容审核。然而,人工审核客户的签名是否正确,不仅增加了人工审核的工作量,而且使得单证验证的效率低下。有基于此,需要提供一种更加优化的单证验证方案。
发明内容
鉴于以上内容,有必要提出一种单证验证方法及装置、计算机装置和计算机可读存储介质,其可以提高软件测试测试的准确性且提高软件测试效率。
本申请的第一方面提供一种单证验证方法,所述方法包括:
读取单证影像;
从所述单证影像中截取出文字图像;
采用轮廓笔画描述分析所述文字图像中的文字的轮廓,并依据文字的轮廓将文字转化为二维矢量;
采用边角特征数据库构建文字的四边轮廓特征;
将通过所述轮廓笔画描述获取的文字的二维矢量作为标识,并从所述边角特征数据库中检索出一个与所述标识相匹配的文字,从而得到文字识别结果;
判断识别的文字是否正确;及
显示识别的文字及文字识别的判断结果。
优选地,所述读取单证影像包括:
通过用户终端的选词框读取该单证影像。
优选地,所述采用轮廓笔画描述分析所述文字图像中的文字的轮廓并依据文字的轮廓将所述文字转化为二维矢量包括:
采用逆/顺时针搜索算法描述文字的轮廓;及
对文字的轮廓进行细化处理,其中所述细化处理包括通过切线最徒算法区分出文字相邻的两个笔画。
优选地,所述通过切线最徒算法区分出文字相邻的两个笔画包括:
采用逆/顺时针搜索算法得到文字的轮廓点的数组为P1,P2,…,Pn,并且得到文字的点阵中至少四个x、y坐标最大最小极值点,所述四个极值点标记为MaxMin1、MaxMin2、MaxMin3、MaxMin4,其中n为一个整数;
遍历任意2个极值点之间的轮廓点,如果某一点Px的切线与MaxMin1、MaxMin2所在的直线的夹角最大,且大于一预设角度,则该点Px能把MaxMin1、MaxMin2至少分为两段笔画,其中,x为1,2,…,n中的一个整数。
遍历MaxMin1和Px之间的轮廓点判断文字是否再分为两段笔画,及遍历Px和MaxMin2之间的轮廓点判断文字是否再分为两段笔画;
当区分出所有相邻的两个笔画后实现文字轮廓的二维矢量化。
优选地,所述采用边角特征数据库构建文字的四边轮廓特征包括:
将文字用32×32点阵表示;
分别从上、下、左、右四个方向扫描文字的点阵得到四个轮廓特征值P1、P2、P3、P4;
将文字按1/4进行切割,切割后再获取文字的四个轮廓特征值Q1、Q2、Q3及Q4;及
将所述文字用轮廓特征值P1、P2、P3、P4、Q1、Q2、Q3及Q4表示并存入所述边角特征数据库中。
优选地,所述判断识别的文字是否正确包括步骤:
记录用户在一签名弹窗上输入的触摸轨迹;
根据该触摸轨迹确定用户输入的签名;
检测出用户的签名;
将检测出的用户签名与所述单证影像中识别出的文字进行比较;及
在检测出的用户签名与所述单证影像中识别出的文字一致时确定所述单证影像中的文字识别正确。
优选地,所述判断识别的文字是否正确包括步骤:
通过一摄像头拍摄用户的照片;
通过用户的照片访问并查找与用户的照片相匹配的姓名信息;
将查找出的姓名用户信息与所述单证影像中识别出的文字信息进行比对;及
在查找出的姓名信息与单证影像中识别出的文字一致时则确定单证影像中的文字识别正确。
本申请的第二方面提供一种单证验证装置,所述装置包括:
获取模块,用于读取单证影像;
截取模块,用于从所述单证影像中截取出文字图像;
文字识别模块,用于识别所述文字图像中的文字,其中,所述文字识别模块首先采用轮廓笔画描述将文字转化为二维矢量,然后采用边角特征数据库存储四边轮廓特征,并将通过轮廓笔画描述获取的文字的二维矢量作为标识,从边角特征数据库中检索出一个与之相匹配的文字,从而得到文字识别结果;
判断模块,用于判断识别的文字是否正确;及
显示模块,用于显示识别的文字及文字识别的判断结果。
本申请的第三方面提供一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述单证验证方法。
本申请的第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述单证验证方法。
本发明提供的单证验证方法,可以自动获取并识别单证影像中的文字,及判断用户在单证上的签名是否正确,减少后续人工审核的工作量,提高了工作人员的实效和客户体验。
附图说明
图1是本发明单证验证方法的应用环境示意图。
图2是本发明单证验证方法的流程图。
图3是本发明中用户终端的示意图。
图4是本发明中用户终端的签名弹窗的示意图。
图5为本发明单证验证装置的结构图。
图6为本发明电子设备的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
优选地,本发明的单证验证方法应用在一个或者多个电子设备中。所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(DigitalSignal Processor,DSP)、嵌入式设备等。
所述电子设备可以是桌上型计算机、笔记本电脑、平板电脑及云端服务器等计算设备。所述设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
实施例1
图1是本发明单证验证方法的应用环境示意图。
参阅图1所示,所述单证验证方法应用在用户终端1中,所述用户终端1通过网络2与所述服务器3连接。其中,所述网络2可以是有线网络,也可以是无线网络,例如无线电、无线保真(Wireless Fidelity,WIFI)、蜂窝、卫星、广播等。所述用户终端1获取单证影像,截取出单证影像中的文字内容,对截取出的文字内容进行识别后判断文字内容是否正确,并将识别结果反馈给用户。在一实施方式中,所述用户终端1可以是笔记本电脑、台式电脑、平板电脑、移动手机等装置。所述服务器3可以是单一的服务器,也可以是一服务器群。
图2是本发明单证验证方法的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
参阅图2所示,所述单证验证方法具体包括以下步骤:
步骤201,读取单证影像。
本实施方式中,该用户终端1在显示屏上输出取词框101,该用户终端1通过该选词框101读取单证影像。请参阅图3,所示为本发明一实施方式中用户终端1的示意图。在具体实施方式中,该单证影像中包括用户签名的文字。该取词框101以用户终端1的显示屏的中心作为中心,并且该选词框101的边框可以调整。例如,在一实施方式中,可通过在用户终端1的显示屏上的滑动操作调整该选词框101的边框。具体的,可通过双指相向靠近的滑动手势控制选词框101的边框进行缩小调整,并通过双指相向靠近的滑动距离确定选词框101的边框缩小的程度。在一实施方式中,通过双指相互远离的滑动手势控制选词框101的边框进行放大调整,并通过双指相互远离的滑动距离确定选词框101的边框放大的程度。
在另一实施方式中,可通过用户终端上设置的按键来调整选词框101的边框。例如,该用户终端1上设置有上、下、左、右四个方向键。用户可以使用预先设置好的上、下方向键来调节选词框101的边框的高度及通过左、右方向键来调节选词框101的边框的宽度。具体的,可以通过操作上方向键102增加选词框101的边框的高度,通过操作下方向键103减少选词框101的边框的高度,通过操作左方向键104增加选词框101的边框的高度,及通过操作右方向键105减少选词框101的边框的高度。
在另一实施方式中,该用户终端1连接一第三方文字识别装置(图中未示)。该第三方文字识别装置可以为安装有文字识别软件的手机、平板电脑等电子设备。该第三方文字识别装置的显示屏上显示有长方形的取词框,通过该选词框读取单证影像。在本发明的具体实施方式中,该取词框同样以显示屏的中心作为中心,并且该取词框的边框可以调整。取词框的边框调整的具体方式可以参考前述用户终端1上选词框101的边框调整方式。该第三方文字识别装置在读取单证影像后将单证影像传送给与该第三方文字识别装置相连接的用户终端1。在一实施方式中,该第三方文字识别装置可以通过WiFi、蓝牙等通信方式与用户终端1相连接。
步骤202,从所述单证影像中截取出文字图像。
本实施方式中,该用户终端1将单证影像中含有文字的部分图像截取下来,保存成待识别图片进行存储。例如,该用户终端1可以将单证影像中包含用户签名的文字图像截取下来并进行保存。
步骤203,识别所述文字图像中的文字。
在具体实施方式中,该方法在步骤203中具体包括:
(S31)采用轮廓笔画描述分析所述文字图像中的文字的轮廓,并依据所述文字的轮廓将所述文字转化为二维矢量。
本实施方式中,以轮廓笔画描述为主要的识别方法,找出文字点阵的轮廓,并对笔画的特性、关键性确定取舍。由于现有的游程统计法、廋边法、汉字特征法、匹配法、字根特征、归一法等算法均无法分享文字的轮廓,所以都无法成功地描述出文字的笔画。本实施方式中通过分析轮廓准确地得到文字的横竖撇捺点。由于只有基于“笔画描述”才能识别手写体文字,边角特征、匹配法、游程统计法等都无法归纳出手写体文字的特征,只能归纳印刷体的特征,且廋边法、归一法等建好笔画的识别方法是低效的、误差大的算法,这些算法容易丢失笔画或者产生多余的笔画。因而使用“轮廓”才能体现出手写体文字的原貌。“轮廓”能够体现手写体文字的字形,而且能够实现二维的汉字点阵转化为二维矢量,实现汉字的高效识别。所以,本实施方式中通过“笔画描述”能够实现手写体的识别。通过轮廓来描述笔画,使用许多无关大局的“短边”被“长边”归纳吞并,“曲线”被描述为“两段线段”,“局部凹凸”视周围环境也被归纳吞并。这样,一个复杂的文字就能用少的笔画描述出来。
(S32)采用边角特征数据库构建文字的四边轮廓特征。
在一实施方式中,将每一汉字用32×32点阵表示,分别从上、下、左、右四个方向扫描汉字点阵,得到四个轮廓特征值P1、P2、P3、P4,并把这四个轮廓特征值存入边角特征数据库中。在一实施方式中,可以通过大量的学习、记忆,得到一个所有汉字的边角特征数据库。通过将汉字的边角特征与该边角特征数据库进行比对,系统会从边角特征数据库中检索出一个最相似的汉字,作为该汉字的识别结果。
在具体实施方式中,在将汉字的边角特征进行分类时利用训练好的边角特征训练模型确定边角特征数据库中的边角特征类别。在本发明的较佳实施方式中,所述边角特征类别包括:上方向扫描数值P1、下方向扫描数值P2、左方向扫描数值P3、右方向扫描数值P4。优选地,所述边角特征训练模型包括,但不限于:支持向量机(Support Vector Machine,SVM)模型。将待测试汉字,及该汉字从上、下、左、右四个方向扫描汉字点阵后得到的数值作为所述边角特征训练模型的输入,经过所述边角特征训练模型计算后输出汉字从上、下、左、右四个方向扫描的轮廓特征数值,即得到汉字对应的轮廓特征扫描数值P1,P2,P3,P4。
在本发明的优选实施方式中,所述边角特征训练模型的训练过程包括:
1)获取正样本的边角特征数据及负样本的边角特征数据,并将正样本的边角特征数据标注边角特征类别,以使正样本的边角特征数据携带边角特征类别标签。
例如,分别选取500个上方向扫描数值P1、下方向扫描数值P2、左方向扫描数值P3、右方向扫描数值P4,并对每个扫描数据标注类别,可以以“1”作为上方向扫描数据标签,以“2”作为下方向扫描数据的标签,以“3”作为左方向扫描数据的标签,以“4”作为右方向扫描数据的标签。
2)将所述正样本的边角特征数据及所述负样本的边角特征数据随机分成第一预设比例的训练集和第二预设比例的验证集,利用所述训练集训练所述边角特征模型,并利用所述验证集验证训练后的所述边角特征模型的准确率。
先将不同边角特征类别的训练集中的训练样本分发到不同的文件夹里。例如,将上方向扫描数值P1类别的训练样本分发到第一文件夹里、下方向扫描数值P2类别的训练样本分发到第二文件夹里、左方向扫描数值P3类别的训练样本分发到第三文件夹里、右方向扫描数值P4类别的训练样本分发到第四文件夹里。然后从不同的文件夹里分别提取第一预设比例(例如,70%)的训练样本作为总的训练样本进行边角特征分类模型的训练,从不同的文件夹里分别取剩余第二预设比例(例如,30%)的训练样本作为总的测试样本对训练完成的所述边角特征分类模型进行准确性验证。
3)若所述准确率大于或者等于预设准确率时,则结束训练,以训练后的所述边角特征分类模型作为分类器识别所述当前汉字的边角特征;若所述准确率小于预设准确率时,则增加正样本数量及负样本数量以重新训练所述边角特征分类模型直至所述准确率大于或者等于预设准确率。
在另一实施方式中,在将每一汉字用32×32点阵表示,分别从上、下、左、右四个方向扫描汉字点阵得到四个轮廓特征值P1、P2、P3、P4后,在将每一汉字按1/4进行切割,切割后再取四个轮廓特征值Q1、Q2、Q3及Q4。如此,将所述文字用轮廓特征值P1、P2、P3、P4、Q1、Q2、Q3及Q4表示并存入边角特征数据库中。通过大量的学习、记忆,得到一个所有汉字的边角特征数据库。
在具体实施方式中,在将汉字的边角特征进行分类时利用训练好的边角特征训练模型确定边角特征数据库中的边角特征类别。在本发明的较佳实施方式中,所述边角特征类别包括:上方向扫描数值P1、下方向扫描数值P2、左方向扫描数值P3、右方向扫描数值P4、第一切割数值Q1、第二切割数值Q2、第三切割数值Q3、第四切割数值Q4。优选地,所述边角特征训练模型包括,但不限于:支持向量机(Support Vector Machine,SVM)模型。将待测试汉字及该汉字从上、下、左、右四个方向扫描汉字点阵后得到的数值,及将汉字按1/4进行切割后得到的切割数值作为所述边角特征训练模型的输入,经过所述边角特征训练模型计算后输出汉字从上、下、左、右四个方向扫描的特征数值及四个切割数值,即得到汉字对应的扫描轮廓特征值P1,P2,P3,P4及切割轮廓特征值Q1、Q2、Q3、Q4。
在本发明的优选实施方式中,所述边角特征训练模型的训练过程包括:
1)获取正样本的边角特征数据及负样本的边角特征数据,并将正样本的边角特征数据标注边角特征类别,以使正样本的边角特征数据携带边角特征类别标签。
例如,分别选取500个上方向扫描数值P1、下方向扫描数值P2、左方向扫描数值P3、右方向扫描数值P4、第一切割数值Q1、第二切割数值Q2、第三切割数值Q3、第四切割数值Q4,并对每个扫描数据标注类别,可以以“1”作为上方向扫描数据标签,以“2”作为下方向扫描数据的标签,以“3”作为左方向扫描数据的标签,以“4”作为右方向扫描数据的标签,以“5”作为第一切割数据的标签,以“6”作为第二切割数据的标签,以“7”作为第三切割数据的标签,以“8”作为第四切割数据的标签。
2)将所述正样本的边角特征数据及所述负样本的边角特征数据随机分成第一预设比例的训练集和第二预设比例的验证集,利用所述训练集训练所述边角特征模型,并利用所述验证集验证训练后的所述边角特征模型的准确率。
先将不同边角特征类别的训练集中的训练样本分发到不同的文件夹里。例如,将上方向扫描数值P1类别的训练样本分发到第一文件夹里、将下方向扫描数值P2类别的训练样本分发到第二文件夹里、将左方向扫描数值P3类别的训练样本分发到第三文件夹里、将右方向扫描数值P4类别的训练样本分发到第四文件夹里、将第一切割数据Q1类别的训练样本分发到第五文件夹里、将第二切割数据Q2类别的训练样本分发到第六文件夹里、将第三切割数据Q3类别的训练样本分发到第七文件夹里、将第四切割数据Q4类别的训练样本分发到第八文件夹里。然后从不同的文件夹里分别提取第一预设比例(例如,70%)的训练样本作为总的训练样本进行边角特征分类模型的训练,从不同的文件夹里分别取剩余第二预设比例(例如,30%)的训练样本作为总的测试样本对训练完成的所述边角特征分类模型进行准确性验证。
3)若所述准确率大于或者等于预设准确率时,则结束训练,以训练后的所述边角特征分类模型作为分类器识别所述当前汉字的边角特征;若所述准确率小于预设准确率时,则增加正样本数量及负样本数量以重新训练所述边角特征分类模型直至所述准确率大于或者等于预设准确率。
(S33)将通过所述轮廓笔画描述获取的文字的二维矢量作为标识,并从所述边角特征数据库中检索出一个与所述标识相匹配的文字,从而得到文字识别结果。
在具体实施方式中,首先采用轮廓笔画描述将文字点阵转化为二维矢量,然后,采用边角特征数据库存储四边轮廓特征,并将通过轮廓笔画描述获取的文字的二维矢量作为标识,从边角特征数据库中检索出一个与之相匹配的汉字,从而得到文字识别结果。
本发明实施方式中通过采用轮廓笔画描述作为文字识别的主要文字识别方法,采用边角特征数据库作为辅助的文字识别算法,通过轮廓笔画描述和边角特征数据库的双识别引擎来识别文字,解决传统文字识别算法无法解决变形较多的手写体等文字的识别问题,以提高手写体等文字识别的准确率和识别效率。
本实施方式中,该方法在步骤S31“采用轮廓笔画描述分析所述文字图像中的文字的轮廓,并依据所述文字的轮廓将所述文字转化为二维矢量”包括:
(S311)采用逆/顺时针搜索算法描述文字的轮廓。
本实施方式中,采用“逆/顺时针搜索”算法描述文字的轮廓具体步骤为:将文字设定为Width×Height的点阵,其中,点阵中任意一点都有左上、上、右上、右、右下、下、左下、左这8个方向的邻点;然后,从x:0->Width-1,y:0->Height-1中搜索出一个黑点,该点设为P1;从点P1逆/顺时针搜索出下一轮廓点P2,再从点P2逆/顺时针搜索出下一轮廓点P3,直到搜索出最后的轮廓点Pn。
(S312)对所述文字的轮廓进行细化处理。
本实施方式中,所述细化处理步骤包括:区分文字中相邻的两个笔画。具体的可通过“切线最徒”算法区分出相邻的两个笔画。描述轮廓之后,笔画描述的关键在于决定从何处开始属于下一段笔画。本实施方式中,使用“切线最徒”算法可以算出任意一点属于哪一笔画。
本实施方式中,在步骤“区分文字中相邻的两个笔画”中包括:
(S3121)采用逆/顺时针搜索算法得到文字的轮廓点的数组为P1,P2,…,Pn,并且得到二维文字的点阵中至少四个x、y坐标最大最小极值点,所述四个极值点标记为MaxMin1、MaxMin2、MaxMin3、MaxMin4。
(S3122)遍历任意2个极值点(例如:MaxMin1和MaxMin2)之间的轮廓点,如果某一点Px(x为1,2,…,n中的一个整数)的切线与MaxMin1、MaxMin2所在的直线的夹角最大,且大于一定的角度(如30°),则该点Px能把MaxMin1、MaxMin2至少分为两段笔画。
(S3123)遍历MaxMin1和Px之间的轮廓点,同上步的原理判断是否再分为两段笔画;及遍历Px和MaxMin2之间的轮廓点,同上步的原理判断是否再分为两段笔画。
(S3124)重复步骤S3122,S3123,直至区分出所有相邻的两个笔画,从而实现文字轮廓的矢量化。
本实施方式中,该方法在步骤S31“采用轮廓笔画描述作为文字识别的主要文字识别方法”中还包括:
将文字中无关大局的“短边”归纳、吞并、省略。
本实施方式中一般取文字所占矩形的1/8或1/10为参考值,小于该参考值的边就考虑吞并、省略。
本实施方式中,该方法在步骤“采用轮廓笔画描述作为文字识别的主要文字识别方法”中还包括:
将文字中的曲线描述为两条或多条线段。
本实施方式中,由于描述曲线(撇、捺等)比较复杂,比较两条曲线的相对位置关系会更复杂。因此,本案中将文字中的曲线描述为两条或多条线段,从而将曲线转换为计算机易于操作的对象来处理。
在另一实施方式中,也可以采用光学字符识别(Optical CharacterRecognition,OCR)方法识别该文字图像。
步骤S204,判断识别的文字是否正确。
本实施方式中,用户终端1可以通过检测用户的电子签名的笔迹确认单证影像中的文字识别是否正确。请参阅图4,所示为本发明一实施方式中用户终端1的签名弹窗101的示意图。具体的,该用户终端1显示一签名弹窗107,并记录用户在该签名弹窗107上的触摸轨迹,及根据该触摸轨迹确定用户输入的签名。在一实施方式中,用户可直接用手指滑动方式或通过其他相关的输入工具在用户终端上1的签名弹窗107中输入签名。用户终端1在检测到用户完成签名后,可将检测出的用户签名与单证影像中识别出的文字进行比较并判断单证影像中的文字识别是否正确。其中,若用户签名与单证影像中识别出的文字一致则确定单证影像中的文字识别是正确的,否则,认为单证影像中的文字识别有误。
在另一实施方式中,用户终端1在完成文字识别后可通过调用用户终端1上的摄像头(图中未示)拍摄用户的照片,将所拍摄的照片作为身份照片发送给服务器3。服务器3通过访问公安户籍系统,根据拍摄的用户照片查询公安户籍系统并获取用户身份证上的姓名信息。服务器3进一步将获取的用户姓名信息与单证影像中识别出的文字进行比较并判断单证影像中的文字识别是否正确,若获取的用户姓名信息与单证影像中识别出的文字一致则确定单证影像中的文字识别是正确的,否则,认为单证影像中的文字识别有误。服务器3将文字识别的判断结果发送给用户终端。
步骤S205,显示识别的文字及文字识别的判断结果。
本实施方式中,用户终端1在显示屏上显示识别的文字及文字识别的判断结果,以提供用户查看从单证影像中识别的文字及文字识别的判断结果是否有误。本实施方式中,用户终端1进一步接收用户输入的针对识别的文字及文字识别的判断结果的确认信息,及在接收到用户输入的确认无误的信息后完成单证的签名验证。本实施方式中,当用户终端1确定单证影像中的文字识别有误且接收到用户输入的对识别的文字确认无误的信息后生成一提醒信息提醒用户人工检查单证文件的签名是否正确。
实施例2
图5为本发明单证验证装置10的结构图。
在一些实施例中,所述单证验证装置10运行于电子设备中。所述单证验证装置10可以包括多个由程序代码段所组成的功能模块。所述单证验证装置10中的各个程序段的程序代码可以存储于存储器中,并由至少一个处理器所执行,以执行单证验证的功能。
本实施例中,所述电子设备的单证验证装置根据其所执行的功能,可以被划分为多个功能模块。参阅图5所示,所述单证验证装置10可以包括获取模块301、截取模块302、文字识别模块303、判断模块304、显示模块305。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在一些实施例中,关于各模块的功能将在后续的实施例中详述。
所述获取模块301,用于读取单证影像。
本实施方式中,该用户终端1在显示屏上输出取词框101,所述获取模块301通过该选词框101读取单证影像。在具体实施方式中,该单证影像中包括用户签名的文字。该取词框101以用户终端1的显示屏的中心作为中心,并且该选词框101的边框可以调整。例如,在一实施方式中,可通过在用户终端1的显示屏上的滑动操作调整该选词框101的边框。具体的,可通过双指相向靠近的滑动手势控制选词框101的边框进行缩小调整,并通过双指相向靠近的滑动距离确定选词框101的边框缩小的程度。在一实施方式中,通过双指相互远离的滑动手势控制选词框101的边框进行放大调整,并通过双指相互远离的滑动距离确定选词框101的边框放大的程度。
在另一实施方式中,可通过用户终端1上设置的按键来调整选词框101的边框。例如,该用户终端1上设置有上、下、左、右四个方向键。用户可以使用预先设置好的上、下方向键来调节选词框101的边框的高度及通过左、右方向键来调节选词框101的边框的宽度。具体的,可以通过操作上方向键102增加选词框101的边框的高度,通过操作下方向键103减少选词框101的边框的高度,通过操作左方向键104增加选词框101的边框的高度,及通过操作右方向键105减少选词框101的边框的高度。
在另一实施方式中,该用户终端1连接一第三方文字识别装置(图中未示)。该第三方文字识别装置可以为安装有文字识别软件的手机、平板电脑等电子设备。该第三方文字识别装置的显示屏上显示有长方形的取词框,所述获取模块301通过该选词框读取单证影像。在本发明的具体实施方式中,该取词框同样以显示屏的中心作为中心,并且该取词框的边框可以调整。取词框的边框调整的具体方式可以参考前述用户终端1上选词框101的边框调整方式。该第三方文字识别装置在读取单证影像后将单证影像传送给与该第三方文字识别装置相连接的用户终端1。在一实施方式中,该第三方文字识别装置可以通过WiFi、蓝牙等通信方式与用户终端1相连接。
所述截取模块302从所述单证影像中截取出文字图像。
本实施方式中,该截取模块302将单证影像中含有文字的部分图像截取下来,保存成待识别图片进行存储。例如,该截取模块302可以将单证影像中包含用户签名的文字图像截取下来并进行保存。
所述文字识别模块303用于识别所述文字图像中的文字。
具体的,所述文字识别模块303首先采用轮廓笔画描述分析所述文字图像中的文字的轮廓并依据所述文字的轮廓将所述文字转化为二维矢量;然后采用边角特征数据库构建文字的四边轮廓特征;然后将通过所述轮廓笔画描述获取的文字的二维矢量作为标识,并从所述边角特征数据库中检索出一个与所述标识相匹配的文字,从而得到文字识别结果。
本实施方式中,述文字识别模块303采用轮廓笔画描述作为文字识别的主要文字识别方法找出文字点阵的轮廓,并对笔画的特性、关键性确定取舍。由于现有的游程统计法、廋边法、汉字特征法、匹配法、字根特征、归一法等算法均无法分享文字的轮廓,所以都无法成功地描述出文字的笔画。本实施方式中通过分析轮廓准确地得到文字的横竖撇捺点。由于只有基于“笔画描述”才能识别手写体文字,边角特征、匹配法、游程统计法等都无法归纳出手写体文字的特征,只能归纳印刷体的特征,且廋边法、归一法等建好笔画的识别方法是低效的、误差大的算法,这些算法容易丢失笔画或者产生多余的笔画。因而使用“轮廓”才能体现出手写体文字的原貌。“轮廓”能够体现手写体文字的字形,而且能够实现二维的汉字点阵转化为二维矢量,实现汉字的高效识别。所以,本实施方式中通过“笔画描述”能够实现手写体的识别。通过轮廓来描述笔画,使用许多无关大局的“短边”被“长边”归纳吞并,“曲线”被描述为“两段线段”,“局部凹凸”视周围环境也被归纳吞并。这样,一个复杂的文字就能用少的笔画描述出来。
本实施方式中,所述文字识别模块303采用边角特征数据库作为辅助的文字识别算法时将每一汉字用32×32点阵表示,分别从上、下、左、右四个方向扫描汉字点阵,得到四个轮廓特征值P1、P2、P3、P4,并把这四个轮廓特征值存入边角特征数据库中。在一实施方式中,可以通过大量的学习、记忆,得到一个所有汉字的边角特征数据库。通过将汉字的边角特征与该边角特征数据库进行比对,系统会从边角特征数据库中检索出一个最相似的汉字,作为该汉字的识别结果。
在具体实施方式中,在将汉字的边角特征进行分类时利用训练好的边角特征训练模型确定边角特征数据库中的边角特征类别。在本发明的较佳实施方式中,所述边角特征类别包括:上方向扫描数值P1、下方向扫描数值P2、左方向扫描数值P3、右方向扫描数值P4。优选地,所述边角特征训练模型包括,但不限于:支持向量机(Support Vector Machine,SVM)模型。将待测试汉字,及该汉字从上、下、左、右四个方向扫描汉字点阵后得到的数值作为所述边角特征训练模型的输入,经过所述边角特征训练模型计算后输出汉字从上、下、左、右四个方向扫描的轮廓特征值,即得到汉字对应的扫描数值P1,P2,P3,P4。
在本发明的优选实施方式中,所述边角特征训练模型的训练过程包括:
1)获取正样本的边角特征数据及负样本的边角特征数据,并将正样本的边角特征数据标注边角特征类别,以使正样本的边角特征数据携带边角特征类别标签。
例如,分别选取500个上方向扫描数值P1、下方向扫描数值P2、左方向扫描数值P3、右方向扫描数值P4,并对每个扫描数据标注类别,可以以“1”作为上方向扫描数据标签,以“2”作为下方向扫描数据的标签,以“3”作为左方向扫描数据的标签,以“4”作为右方向扫描数据的标签。
2)将所述正样本的边角特征数据及所述负样本的边角特征数据随机分成第一预设比例的训练集和第二预设比例的验证集,利用所述训练集训练所述边角特征模型,并利用所述验证集验证训练后的所述边角特征模型的准确率。
先将不同边角特征类别的训练集中的训练样本分发到不同的文件夹里。例如,将上方向扫描数值P1类别的训练样本分发到第一文件夹里、下方向扫描数值P2类别的训练样本分发到第二文件夹里、左方向扫描数值P3类别的训练样本分发到第三文件夹里、右方向扫描数值P4类别的训练样本分发到第四文件夹里。然后从不同的文件夹里分别提取第一预设比例(例如,70%)的训练样本作为总的训练样本进行边角特征分类模型的训练,从不同的文件夹里分别取剩余第二预设比例(例如,30%)的训练样本作为总的测试样本对训练完成的所述边角特征分类模型进行准确性验证。
3)若所述准确率大于或者等于预设准确率时,则结束训练,以训练后的所述边角特征分类模型作为分类器识别所述当前汉字的边角特征;若所述准确率小于预设准确率时,则增加正样本数量及负样本数量以重新训练所述边角特征分类模型直至所述准确率大于或者等于预设准确率。
在另一实施方式中,所述文字识别模块303在将每一汉字用32×32点阵表示且分别从上、下、左、右四个方向扫描汉字点阵得到四个数值P1、P2、P3、P4后,还将每一汉字按1/4进行切割,切割后再取四边特征Q1、Q2、Q3及Q4。如此,将所述文字用轮廓特征值P1、P2、P3、P4、Q1、Q2、Q3及Q4表示并存入边角特征数据库中。通过大量的学习、记忆,得到一个所有汉字的边角特征特征数据库。
在具体实施方式中,在将汉字的边角特征进行分类时利用训练好的边角特征训练模型确定边角特征数据库中的边角特征类别。在本发明的较佳实施方式中,所述边角特征类别包括:上方向扫描数值P1、下方向扫描数值P2、左方向扫描数值P3、右方向扫描数值P4、第一切割数值Q1、第二切割数值Q2、第三切割数值Q3、第四切割数值Q4。优选地,所述边角特征训练模型包括,但不限于:支持向量机(Support Vector Machine,SVM)模型。将待测试汉字及该汉字从上、下、左、右四个方向扫描汉字点阵后得到的数值,及将汉字按1/4进行切割后得到的切割数值作为所述边角特征训练模型的输入,经过所述边角特征训练模型计算后输出汉字从上、下、左、右四个方向扫描的特征数值及四个切割数值,即得到汉字对应的扫描数值P1,P2,P3,P4及切割数值Q1、Q2、Q3、Q4。
在本发明的优选实施方式中,所述边角特征训练模型的训练过程包括:
1)获取正样本的边角特征数据及负样本的边角特征数据,并将正样本的边角特征数据标注边角特征类别,以使正样本的边角特征数据携带边角特征类别标签。
例如,分别选取500个上方向扫描数值P1、下方向扫描数值P2、左方向扫描数值P3、右方向扫描数值P4、第一切割数值Q1、第二切割数值Q2、第三切割数值Q3、第四切割数值Q4,并对每个扫描数据标注类别,可以以“1”作为上方向扫描数据标签,以“2”作为下方向扫描数据的标签,以“3”作为左方向扫描数据的标签,以“4”作为右方向扫描数据的标签,以“5”作为第一切割数据的标签,以“6”作为第二切割数据的标签,以“7”作为第三切割数据的标签,以“8”作为第四切割数据的标签。
2)将所述正样本的边角特征数据及所述负样本的边角特征数据随机分成第一预设比例的训练集和第二预设比例的验证集,利用所述训练集训练所述边角特征模型,并利用所述验证集验证训练后的所述边角特征模型的准确率。
先将不同边角特征类别的训练集中的训练样本分发到不同的文件夹里。例如,将上方向扫描数值P1类别的训练样本分发到第一文件夹里、将下方向扫描数值P2类别的训练样本分发到第二文件夹里、将左方向扫描数值P3类别的训练样本分发到第三文件夹里、将右方向扫描数值P4类别的训练样本分发到第四文件夹里、将第一切割数据Q1类别的训练样本分发到第五文件夹里、将第二切割数据Q2类别的训练样本分发到第六文件夹里、将第三切割数据Q3类别的训练样本分发到第七文件夹里、将第四切割数据Q4类别的训练样本分发到第八文件夹里。然后从不同的文件夹里分别提取第一预设比例(例如,70%)的训练样本作为总的训练样本进行边角特征分类模型的训练,从不同的文件夹里分别取剩余第二预设比例(例如,30%)的训练样本作为总的测试样本对训练完成的所述边角特征分类模型进行准确性验证。
3)若所述准确率大于或者等于预设准确率时,则结束训练,以训练后的所述边角特征分类模型作为分类器识别所述当前汉字的边角特征;若所述准确率小于预设准确率时,则增加正样本数量及负样本数量以重新训练所述边角特征分类模型直至所述准确率大于或者等于预设准确率。
本实施方式中,所述文字识别模块303采用轮廓描述和边角特征数据库作为双识别引擎来识别文字图像中的文字时,首先采用轮廓笔画描述将文字点阵转化为二维矢量,然后,采用边角特征数据库存储四边轮廓特征,并将通过轮廓笔画描述获取的文字的二维矢量作为标识,从边角特征数据库中检索出一个与之相匹配的汉字,从而得到文字识别结果。
本发明实施方式中通过采用轮廓笔画描述作为文字识别的主要文字识别方法,采用边角特征数据库作为辅助的文字识别算法,通过轮廓笔画描述和边角特征数据库的双识别引擎来识别文字,解决传统文字识别算法无法解决变形较多的手写体等文字的识别问题,以提高手写体等文字识别的准确率和识别效率。
优选的,所述文字识别模块303在采用轮廓笔画描述作为文字识别的主要文字识别方法时,首先采用“逆/顺时针搜索”算法描述文字的轮廓,然后,对所述文字的轮廓进行细化处理。所述文字识别模块303在采用“逆/顺时针搜索”算法描述文字的轮廓时,首先将文字设定为Width×Height的点阵,其中,点阵中任意一点都有左上、上、右上、右、右下、下、左下、左这8个方向的邻点;然后,从x:0->Width-1,y:0->Height-1中搜索出一个黑点,该点设为P1;从点P1逆/顺时针搜索出下一轮廓点P2,再从点P2逆/顺时针搜索出下一轮廓点P3,直到搜索出最后的轮廓点Pn。
所述文字识别模块303在对所述文字的轮廓进行细化处理时区分文字中相邻的两个笔画。具体的可通过“切线最徒”算法区分出相邻的两个笔画。描述轮廓之后,笔画描述的关键在于决定从何处开始属于下一段笔画。本实施方式中,所述文字识别模块303使用“切线最徒”算法可以算出任意一点属于哪一笔画。
本实施方式中,所述文字识别模块303在“区分文字中相邻的两个笔画”时,首先采用逆/顺时针搜索算法得到文字的轮廓点的数组为P1,P2,…,Pn,并且得到二维文字的点阵中至少四个x、y坐标最大最小极值点,所述四个极值点标记为MaxMin1、MaxMin2、MaxMin3、MaxMin4;然后,遍历任意2个极值点(例如:MaxMin1和MaxMin2)之间的轮廓点,如果某一点Px(x为1,2,…,n中的一个整数)的切线与MaxMin1、MaxMin2所在的直线的夹角最大,且大于一定的角度(如30°),则该点Px能把MaxMin1、MaxMin2至少分为两段笔画;然后,遍历MaxMin1和Px之间的轮廓点,同上步的原理判断是否再分为两段笔画;然后,遍历Px和MaxMin2之间的轮廓点,同上步的原理判断是否再分为两段笔画,直至区分出所有相邻的两个笔画,从而实现文字轮廓的矢量化。
本实施方式中,所述文字识别模块303在采用轮廓笔画描述作为文字识别的主要文字识别方法时还用于将汉字中无关大局的“短边”归纳、吞并、省略。本实施方式中一般取汉字所占矩形的1/8或1/10为参考值,小于该参考值的边就考虑吞并、省略。
本实施方式中,所述文字识别模块303在采用轮廓笔画描述作为文字识别的主要文字识别方法时还用于将汉字中的曲线描述为两条或多条线段。本实施方式中,由于描述曲线(撇、捺等)比较复杂,比较两条曲线的相对位置关系会更复杂。因此,本案中将汉字中的曲线描述为两条或多条线段,从而将曲线转换为计算机易于操作的对象来处理。
在其他实施方式中,所述文字识别模块303可采用光学字符识别方法识别该文字图像。
所述判断模块304判断识别的文字是否正确。
本实施方式中,所述判断模块304可以通过检测用户的电子签名的笔迹确认单证影像中的文字识别是否正确。具体的,判断模块304记录用户在用户终端1的签名弹窗107上的触摸轨迹,及根据该触摸轨迹确定用户输入的签名。在一实施方式中,用户可直接用手指滑动方式或通过其他相关的输入工具在用户终端上1的签名弹窗107中输入签名。所述判断模块304在检测到用户完成签名后,可将检测出的用户签名与单证影像中识别出的文字进行比较并判断单证影像中的文字识别是否正确。其中,若用户签名与单证影像中识别出的文字一致,则判断模块304确定单证影像中的文字识别是正确的,否则,判断模块304认为单证影像中的文字识别有误。
在另一实施方式中,在完成文字识别后判断模块304通过调用用户终端1上的摄像头(图中未示)拍摄用户的照片,将所拍摄的照片作为身份照片发送给服务器3。服务器3通过访问公安户籍系统,根据拍摄的用户照片查询公安户籍系统并获取用户身份证上的姓名信息。服务器3进一步将获取的用户姓名信息与单证影像中识别出的文字进行比较并判断单证影像中的文字识别是否正确,若获取的用户姓名信息与单证影像中识别出的文字一致则确定单证影像中的文字识别是正确的,否则,认为单证影像中的文字识别有误。服务器3将文字识别的判断结果发送给用户终端1。
显示模块305用于显示识别的文字及文字识别的判断结果。
本实施方式中,显示模块305在用户终端1的显示屏上显示识别的文字及文字识别的判断结果,以提供用户查看从单证影像中识别的文字及文字识别的判断结果是否有误。本实施方式中,显示模块305进一步接收用户输入的针对识别的文字及文字识别的判断结果的确认信息,及在接收到用户输入的确认无误的信息后完成单证的签名验证。本实施方式中,当确定单证影像中的文字识别有误且接收到用户输入的对识别的文字确认无误的信息后,显示模块305生成一提醒信息提醒用户人工检查单证文件的签名是否正确。
实施例三
图6为本发明电子设备4的示意图。
所述电子设备4包括存储器41、处理器42以及存储在所述存储器41中并可在所述处理器42上运行的计算机程序43。所述处理器42执行所述计算机程序43时实现上单证验证方法实施例中的步骤,例如图2所示的步骤201~205。或者,所述处理器42执行所述计算机程序43时实现上述装置实施例中各模块/模块的功能,例如图5中的模块301~305。
示例性的,所述计算机程序43可以被分割成一个或多个模块/模块,所述一个或者多个模块/模块被存储在所述存储器41中,并由所述处理器42执行,以完成本发明。所述一个或多个模块/模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序43在所述电子设备4中的执行过程。例如,所述计算机程序43可以被分割成图5中的获取模块301、截取模块302、文字识别模块303、判断模块304、显示模块305,各模块具体功能参见实施例二。
所述电子设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解,所述示意图仅仅是电子设备4的示例,并不构成对电子设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备4还可以包括输入输出设备、网络接入设备、总线等。
所称处理器42可以是中央处理模块(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器42也可以是任何常规的处理器等,所述处理器42是所述电子设备4的控制中心,利用各种接口和线路连接整个电子设备4的各个部分。
所述存储器41可用于存储所述计算机程序43和/或模块/模块,所述处理器42通过运行或执行存储在所述存储器41内的计算机程序和/或模块/模块,以及调用存储在存储器41内的数据,实现所述计电子设备4的各种功能。所述存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备4的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述电子设备4集成的模块/模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
在本发明所提供的几个实施例中,应该理解到,所揭露的电子设备和方法,可以通过其它的方式实现。例如,以上所描述的电子设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
另外,在本发明各个实施例中的各功能模块可以集成在相同处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在相同模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他模块或步骤,单数不排除复数。电子设备权利要求中陈述的多个模块或电子设备也可以由同一个模块或电子设备通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种单证验证方法,其特征在于,所述方法包括:
读取单证影像;
从所述单证影像中截取出文字图像;
采用轮廓笔画描述分析所述文字图像中的文字的轮廓,并依据文字的轮廓将文字转化为二维矢量;
采用边角特征数据库构建文字的四边轮廓特征;
将通过所述轮廓笔画描述获取的文字的二维矢量作为标识,并从所述边角特征数据库中检索出一个与所述标识相匹配的文字,从而得到文字识别结果;
判断识别的文字是否正确;及
显示识别的文字及文字识别的判断结果。
2.如权利要求1所述的单证验证方法,其特征在于,所述读取单证影像包括:
通过用户终端的选词框读取该单证影像。
3.如权利要求1所述的单证验证方法,其特征在于,所述采用轮廓笔画描述分析所述文字图像中的文字的轮廓并依据文字的轮廓将所述文字转化为二维矢量包括:
采用逆/顺时针搜索算法描述文字的轮廓;及
对文字的轮廓进行细化处理,其中所述细化处理包括通过切线最徒算法区分出文字相邻的两个笔画。
4.如权利要求3所述的单证验证方法,其特征在于,所述通过切线最徒算法区分出文字相邻的两个笔画包括:
采用逆/顺时针搜索算法得到文字的轮廓点的数组为P1,P2,…,Pn,并且得到文字的点阵中至少四个x、y坐标最大最小极值点,所述四个极值点标记为MaxMin1、MaxMin2、MaxMin3、MaxMin4,其中n为一个整数;
遍历任意2个极值点之间的轮廓点,如果某一点Px的切线与MaxMin1、MaxMin2所在的直线的夹角最大,且大于一预设角度,则该点Px能把MaxMin1、MaxMin2至少分为两段笔画,其中,x为1,2,…,n中的一个整数;
遍历MaxMin1和Px之间的轮廓点判断文字是否再分为两段笔画,及遍历Px和MaxMin2之间的轮廓点判断文字是否再分为两段笔画;
当区分出所有相邻的两个笔画后实现文字轮廓的二维矢量化。
5.如权利要求1所述的单证验证方法,其特征在于,采用边角特征数据库构建文字的四边轮廓特征包括:
将文字用32×32点阵表示;
分别从上、下、左、右四个方向扫描文字的点阵得到四个轮廓特征值P1、P2、P3、P4;
将文字按1/4进行切割,切割后再获取文字的四个轮廓特征值Q1、Q2、Q3及Q4;及
将所述文字用轮廓特征值P1、P2、P3、P4、Q1、Q2、Q3及Q4表示并存入所述边角特征数据库中。
6.如权利要求1~5所述的任一单证验证方法,其特征在于,所述判断识别的文字是否正确包括步骤:
记录用户在一签名弹窗上输入的触摸轨迹;
根据该触摸轨迹确定用户输入的签名;
检测出用户的签名;
将检测出的用户签名与所述单证影像中识别出的文字进行比较;及
在检测出的用户签名与所述单证影像中识别出的文字一致时确定所述单证影像中的文字识别正确。
7.如权利要求1~5所述的任一单证验证方法,其特征在于,所述判断识别的文字是否正确包括步骤:
通过一摄像头拍摄用户的照片;
通过用户的照片访问并查找与用户的照片相匹配的姓名信息;
将查找出的姓名用户信息与所述单证影像中识别出的文字信息进行比对;及
在查找出的姓名信息与单证影像中识别出的文字一致时则确定单证影像中的文字识别正确。
8.一种单证验证装置,其特征在于,所述装置包括:
获取模块,用于读取单证影像;
截取模块,用于从所述单证影像中截取出文字图像;
文字识别模块,用于采用轮廓笔画描述分析所述文字图像中的文字的轮廓并依据所述文字的轮廓将所述文字转化为二维矢量,采用边角特征数据库构建文字的四边轮廓特征;将通过所述轮廓笔画描述获取的文字的二维矢量作为标识,并从所述边角特征数据库中检索出一个与所述标识相匹配的汉字,从而得到文字识别结果;
判断模块,用于判断识别的文字是否正确;及
显示模块,用于显示识别的文字及文字识别的判断结果。
9.一种电子设备,其特征在于:所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-7中任一项所述单证验证方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述单证验证方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811151533.4A CN109388935B (zh) | 2018-09-29 | 单证验证方法及装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811151533.4A CN109388935B (zh) | 2018-09-29 | 单证验证方法及装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109388935A true CN109388935A (zh) | 2019-02-26 |
CN109388935B CN109388935B (zh) | 2024-07-09 |
Family
ID=
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110414522A (zh) * | 2019-07-08 | 2019-11-05 | 深兰科技(上海)有限公司 | 一种字符识别方法及装置 |
CN112183458A (zh) * | 2020-10-19 | 2021-01-05 | 万汇链智能科技(苏州)有限公司 | 一种基于人工智能技术的电子单证的数据处理系统 |
CN114625710A (zh) * | 2022-05-12 | 2022-06-14 | 深圳市巨力方视觉技术有限公司 | 一种可调取历史数据进行识别的视觉集成系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5745598A (en) * | 1994-03-11 | 1998-04-28 | Shaw; Venson Ming Heng | Statistics based segmentation and parameterization method for dynamic processing, identification, and verification of binary contour image |
JP2001256501A (ja) * | 2000-03-10 | 2001-09-21 | Matsushita Electric Ind Co Ltd | 個人認証システム |
JP2003233719A (ja) * | 2002-02-13 | 2003-08-22 | Hitachi Ltd | 自動契約装置およびその取引方法 |
CN102722284A (zh) * | 2012-06-15 | 2012-10-10 | 重庆傲雄信息技术有限公司 | 一种基于触控屏的手写签字记录方法及系统 |
CN106325562A (zh) * | 2010-07-06 | 2017-01-11 | 阿科罕夫·拉坎 | 用于登记和验证手写签名并对手写信息存档的装置、系统和方法 |
CN107545391A (zh) * | 2017-09-07 | 2018-01-05 | 安徽共生物流科技有限公司 | 一种基于图像识别的物流单据智能分析与自动存储方法 |
CN107729954A (zh) * | 2017-10-27 | 2018-02-23 | 朱秋华 | 一种文字识别方法、装置、文字识别设备及存储介质 |
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5745598A (en) * | 1994-03-11 | 1998-04-28 | Shaw; Venson Ming Heng | Statistics based segmentation and parameterization method for dynamic processing, identification, and verification of binary contour image |
JP2001256501A (ja) * | 2000-03-10 | 2001-09-21 | Matsushita Electric Ind Co Ltd | 個人認証システム |
JP2003233719A (ja) * | 2002-02-13 | 2003-08-22 | Hitachi Ltd | 自動契約装置およびその取引方法 |
CN106325562A (zh) * | 2010-07-06 | 2017-01-11 | 阿科罕夫·拉坎 | 用于登记和验证手写签名并对手写信息存档的装置、系统和方法 |
CN102722284A (zh) * | 2012-06-15 | 2012-10-10 | 重庆傲雄信息技术有限公司 | 一种基于触控屏的手写签字记录方法及系统 |
CN107545391A (zh) * | 2017-09-07 | 2018-01-05 | 安徽共生物流科技有限公司 | 一种基于图像识别的物流单据智能分析与自动存储方法 |
CN107729954A (zh) * | 2017-10-27 | 2018-02-23 | 朱秋华 | 一种文字识别方法、装置、文字识别设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
乔海晔, 肖南峰: "基于视觉的文字识别系统的设计与实现", 交通与计算机, no. 05, pages 97 - 101 * |
王广松, 候济恭: "脱机汉字签名鉴别系统", 福建电脑, no. 11, pages 24 * |
贾旸: "单证识别领域的OCR技术应用探索", 金融电子化, no. 04, pages 48 - 49 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110414522A (zh) * | 2019-07-08 | 2019-11-05 | 深兰科技(上海)有限公司 | 一种字符识别方法及装置 |
CN112183458A (zh) * | 2020-10-19 | 2021-01-05 | 万汇链智能科技(苏州)有限公司 | 一种基于人工智能技术的电子单证的数据处理系统 |
CN112183458B (zh) * | 2020-10-19 | 2023-07-28 | 万汇链智能科技(苏州)有限公司 | 一种基于人工智能技术的电子单证的数据处理系统 |
CN114625710A (zh) * | 2022-05-12 | 2022-06-14 | 深圳市巨力方视觉技术有限公司 | 一种可调取历史数据进行识别的视觉集成系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3437019B1 (en) | Optical character recognition in structured documents | |
US10140511B2 (en) | Building classification and extraction models based on electronic forms | |
CN103975342B (zh) | 用于移动图像捕获和处理的系统和方法 | |
US9311531B2 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
CN110147786A (zh) | 用于检测图像中的文本区域的方法、装置、设备以及介质 | |
CN104200239A (zh) | 一种基于图像特征融合识别的签名鉴伪系统及方法 | |
CN109101469A (zh) | 从数字化文档提取可搜索的信息 | |
CN110597806A (zh) | 一种基于批阅识别的错题集生成与答题统计系统及方法 | |
US10339373B1 (en) | Optical character recognition utilizing hashed templates | |
CN107808154B (zh) | 提取收银票据信息的方法和装置 | |
US10043071B1 (en) | Automated document classification | |
US11847806B2 (en) | Information extraction from images using neural network techniques and anchor words | |
CN110795714A (zh) | 一种身份验证方法、装置、计算机设备及存储介质 | |
US11574492B2 (en) | Efficient location and identification of documents in images | |
CN105138886B (zh) | 机器人生物体征识别系统 | |
CN110222660B (zh) | 一种基于动态与静态特征融合的签名鉴伪方法及系统 | |
CN112396057A (zh) | 一种字符识别方法、装置及电子设备 | |
Shweka et al. | Automatic extraction of catalog data from digital images of historical manuscripts | |
CN109388935A (zh) | 单证验证方法及装置、电子设备及可读存储介质 | |
CN109388935B (zh) | 单证验证方法及装置、电子设备及可读存储介质 | |
Wang et al. | Operator-Assisted Tabulation of Optical Scan Ballots. | |
CN110390508A (zh) | 基于ocr创建日程方法、装置及存储介质 | |
Tan et al. | Multiscale region projection method to discriminate between printed and handwritten text on registration forms | |
Luo et al. | Is There a Difference between Paper and Electronic Chinese Signatures? | |
Muhammad et al. | A generic face detection algorithm in electronic attendance system for educational institute |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |