CN113837129A - 手写签名错别字识别方法、装置、设备及存储介质 - Google Patents

手写签名错别字识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113837129A
CN113837129A CN202111149066.3A CN202111149066A CN113837129A CN 113837129 A CN113837129 A CN 113837129A CN 202111149066 A CN202111149066 A CN 202111149066A CN 113837129 A CN113837129 A CN 113837129A
Authority
CN
China
Prior art keywords
character
score
wrong
handwritten
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111149066.3A
Other languages
English (en)
Other versions
CN113837129B (zh
Inventor
肖玉宾
喻红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202111149066.3A priority Critical patent/CN113837129B/zh
Publication of CN113837129A publication Critical patent/CN113837129A/zh
Application granted granted Critical
Publication of CN113837129B publication Critical patent/CN113837129B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及人工智能领域,公开了一种手写签名错别字识别方法、装置、设备及存储介质。该方法包括:获取待识别的手写签名图片;通过多个预置签名识别模型,分别识别手写签名图片中各单字对应的字符串组,并根据字符串组,计算各单字的识别得分;采用预置图片分割模型,对手写签名图片进行单字符分割,得到多个单字符,并基于各单字符和字符串组,计算各单字的分割得分;选取与字符串组相对应的错字识别模型,并基于各单字符和分割得分,利用错字识别模型计算各单字的错字得分;基于各单字的识别得分、分割得分和错字得分,确定手写签名图片中的错字。本发明实现了手写签名的错字识别,提升了错字识别的稳定性。

Description

手写签名错别字识别方法、装置、设备及存储介质
技术领域
本发明涉及人工智能领域,尤其涉及一种手写签名错别字识别方法、装置、设备及存储介质。
背景技术
随着OCR(Optical Character Recognition)技术的高速发展以及互联网高速发展,线下业务流程逐步线上化。手写签名识别也随之在各个行业应用于在线的手写签名验证,离线的手写签名核查。在多个行业中,办理业务或者是签署合同等文件时,都需要客户进行手写签名以使对应的合同或文件拥有对应的法律效力。以达到保护相关主体的相应的法律权利及利益。所以手写签名就显得尤为重要。在实际的应用中,不仅仅需要签名,而且还需要签署正确的姓名。
目前主要采用的办法有三种,一种是进行手写签名的OCR识别,将识别出来的手写签名同系统中规定的用户签名值进行比对,不一致时则进行风险提示或者让客户重新签署,但该方法对于错字无法判断,当手写错字时存在较大风险;第二种是采用笔迹鉴定的方法,将本次签署的姓名同系统中预留的姓名笔迹进行比对,以此来验证签署的姓名是否有效,而该方法需要提前采集并预留每位用户的签名笔迹操作复杂且准确率不高;第三种是通过人工来进行客户签名的验证,让人工来判断客户签署的姓名是否正确合规;该方法人工成本高,验证规则由于手写输入的多样性无法标准化,人工判断稳定性差。综上所述,即现有手写签名验证方法无法自动识别错字。
发明内容
本发明的主要目的在于解决现有手写签名验证方法无法自动识别错字的技术问题。
本发明第一方面提供了一种手写签名错别字识别方法,包括:获取待识别的手写签名图片;通过多个预置签名识别模型,分别识别所述手写签名图片中各单字对应的字符串组,并根据所述字符串组,计算所述各单字的识别得分;采用预置图片分割模型,对所述手写签名图片进行单字符分割,得到多个单字符,并基于各所述单字符和所述字符串组,计算所述各单字的分割得分;选取与所述字符串组相对应的错字识别模型,并基于各所述单字符和所述分割得分,利用所述错字识别模型计算所述各单字的错字得分;基于所述各单字的识别得分、分割得分和所述错字得分,确定所述手写签名图片中的错字。
可选的,在本发明第一方面的第一种实现方式中,所述多个预置签名识别模型包括手写体签名识别模型和打印体签名识别模型,所述通过多个预置签名识别模型,分别识别所述手写签名图片中各单字对应的字符串组包括:通过所述手写体签名识别模型,识别所述手写签名图片中各单字对应的手写体字符串;通过所述打印体签名识别模型,识别所述手写签名图片中各单字对应的打印体字符串;组合所述手写体字符串和所述打印体字符串,得到所述手写签名图片中各单字对应的字符串组。
可选的,在本发明第一方面的第二种实现方式中,所述根据所述字符串组,计算所述各单字的识别得分包括:分别判断所述字符串组中各单字对应的手写体字符串和打印体字符串是否相同;若相同,则将预置第一识别得分作为对应单字的识别得分;若不相同,则计算对应单字的手写体字符串和打印体字符串的编辑距离,以及计算对应单字的手写字符串的第一置信度和打印字符串的第二置信度;根据所述编辑距离、所述第一置信度和所述第二置信度,计算第二识别得分并作为对应单字的识别得分。
可选的,在本发明第一方面的第三种实现方式中,所述基于各所述单字符和所述字符串组,计算所述各单字的分割得分包括:对所述字符串组中各单字的手写字符串进行单字符拆分,并分别统计所述各单字的手写字符串拆分后的第一单字符数量,以及分别统计所述各单字对应的单字符的第二单字符数量;分别判断所述各单字的第一单字符数量和第二单字符数量是否相同;若相同,则将预置第一分割得分作为对应单字的分割得分,否则将预置第二分割得分作为对应单字的分割得分。
可选的,在本发明第一方面的第四种实现方式中,所述基于各所述单字符和所述分割得分,利用所述错字识别模型计算所述各单字的错字得分包括:若单字的分割得分为所述第二分割得分,则将预置第一错字得分作为对应单字的错字得分;若单字的分割得分为所述第一分割得分,则通过所述错字识别模型依次识别对应单字各所述单字符对应的错字概率;采用各所述错字概率计算第二错字得分并作为对应单字的错字得分。
可选的,在本发明第一方面的第五种实现方式中,所述基于所述各单字的识别得分、分割得分和所述错字得分,确定所述手写签名图片中的错字包括:根据预置权重分配,对所述手写签名图片的识别得分、分割得分和所述错字得分进行加权处理,得到所述各单字的最终错字得分;分别判断所述各单字的最终错字得分是否大于预置得分阈值;若大于,则确定所述手写签名图片中对应的单字为错字。
本发明第二方面提供了一种手写签名错别字识别装置,包括:获取模块,用于获取待识别的手写签名图片;识别得分计算模块,用于通过多个预置签名识别模型,分别识别所述手写签名图片中各单字对应的字符串组,并根据所述字符串组,计算所述各单字的识别得分;分割得分计算模块,用于采用预置图片分割模型,对所述手写签名图片进行单字符分割,得到多个单字符,并基于各所述单字符和所述字符串组,计算所述各单字的分割得分;错字得分计算模块,用于选取与所述字符串组相对应的错字识别模型,并基于各所述单字符和所述分割得分,利用所述错字识别模型计算所述各单字的错字得分;确定模块,用于基于所述各单字的识别得分、分割得分和所述错字得分,确定所述手写签名图片中的错字。
可选的,在本发明第二方面的第一种实现方式中,所述多个预置签名识别模型包括手写体签名识别模型和打印体签名识别模型,所述识别得分计算模块包括识别单元,用于:通过所述手写体签名识别模型,识别所述手写签名图片中各单字对应的手写体字符串;通过所述打印体签名识别模型,识别所述手写签名图片中各单字对应的打印体字符串;组合所述手写体字符串和所述打印体字符串,得到所述手写签名图片中各单字对应的字符串组。
可选的,在本发明第二方面的第二种实现方式中,所述识别得分计算模块包括识别得分计算单元,用于:分别判断所述字符串组中各单字对应的手写体字符串和打印体字符串是否相同;若相同,则将预置第一识别得分作为对应单字的识别得分;若不相同,则计算对应单字的手写体字符串和打印体字符串的编辑距离,以及计算对应单字的手写字符串的第一置信度和打印字符串的第二置信度;根据所述编辑距离、所述第一置信度和所述第二置信度,计算第二识别得分并作为对应单字的识别得分。
可选的,在本发明第二方面的第三种实现方式中,所述分割得分计算模块包括:统计单元,用于对所述字符串组中各单字的手写字符串进行单字符拆分,并分别统计所述各单字的手写字符串拆分后的第一单字符数量,以及分别统计所述各单字对应的单字符的第二单字符数量;判别单元,用于分别判断所述各单字的第一单字符数量和第二单字符数量是否相同;若相同,则将预置第一分割得分作为对应单字的分割得分,否则将预置第二分割得分作为对应单字的分割得分。
可选的,在本发明第二方面的第四种实现方式中,所述错字得分计算模块包括:第一计算单元,用于若单字的分割得分为所述第二分割得分,则将预置第一错字得分作为对应单字的错字得分;第二计算单元,用于若单字的分割得分为所述第一分割得分,则通过所述错字识别模型依次识别对应单字各所述单字符对应的错字概率;采用各所述错字概率计算第二错字得分并作为对应单字的错字得分。
可选的,在本发明第二方面的第五种实现方式中,所述确定模块包括:加权处理单元,用于根据预置权重分配,对所述手写签名图片的识别得分、分割得分和所述错字得分进行加权处理,得到所述各单字的最终错字得分;确定单元,用于分别判断所述各单字的最终错字得分是否大于预置得分阈值;若大于,则确定所述手写签名图片中对应的单字为错字。
本发明第三方面提供了一种手写签名错别字识别设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述手写签名错别字识别设备执行上述的手写签名错别字识别方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的手写签名错别字识别方法。
本发明提供的技术方案中,通过结合多个不同类型的签名识别模型,分别识别手写签名图片中的每个单字的字符串组,然后直接或者间接以该字符串组为基础,依次计算各个单字的识别得分、分割得分和错字得分,在字符级从三个维度上来识别每个单字是否为错字,实现对手写签名图片中每个单字的错字识别,提升手写签名错字识别的标准化和稳定性。
附图说明
图1为本发明实施例中手写签名错别字识别方法的第一个实施例示意图;
图2为本发明实施例中手写签名错别字识别方法的第二个实施例示意图;
图3为本发明实施例中手写签名错别字识别方法的第三个实施例示意图;
图4为本发明实施例中手写签名错别字识别装置的一个实施例示意图;
图5为本发明实施例中手写签名错别字识别装置的另一个实施例示意图;
图6为本发明实施例中手写签名错别字识别设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种手写签名错别字识别方法、装置、设备及存储介质,获取待识别的手写签名图片;通过多个预置签名识别模型,分别识别手写签名图片中各单字对应的字符串组,并根据字符串组,计算各单字的识别得分;采用预置图片分割模型,对手写签名图片进行单字符分割,得到多个单字符,并基于各单字符和字符串组,计算各单字的分割得分;选取与字符串组相对应的错字识别模型,并基于各单字符和分割得分,利用错字识别模型计算各单字的错字得分;基于各单字的识别得分、分割得分和错字得分,确定手写签名图片中的错字。本发明实现了手写签名的错字识别,提升了错字识别的稳定性。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中手写签名错别字识别方法的第一个实施例包括:
101、获取待识别的手写签名图片;
可以理解的是,本发明的执行主体可以为手写签名错别字识别装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
本实施例中,待识别的手写签名图片指的是需要进行错字判别的在线手写签名、离线手写签名或者现实中手写签名后拍摄得到的对应的图片,该手写签名图片中包含有用户电子签署或者手写签署的单字。
102、通过多个预置签名识别模型,分别识别手写签名图片中各单字对应的字符串组,并根据字符串组,计算各单字的识别得分;
本实施例中,通过预先设置的多个不同类型的签名识别模型,分别识别手写签名图片中每个单字笔画笔顺对应组成的字符串,然后组成字符串组,比如签名识别模型可以包括手写体签名识别模型和打印体签名识别模型,则可以得到对应的手写体字符串和打印体字符串,然后对两者进行组合,即可得到各个单字对应的字符串组。其中,一个签名识别模型中对一个单字识别得到一个字符串,比如预先设置有n个签名识别模型以及手写签名图片中包含m个单字,则识别得到的字符串组中包含有n*m个字符串。
另外,还通过识别得分来判别每个签名识别模型识别结果之间的差别,同时侧面评价各个签名识别模型对手写签名图片中每个单字的识别准确度。每个签名识别模型对同一个单字识别得到对应的字符串,然后来对比相同单字在不同签名识别模型中识别得到的字符串之间的差别,根据差别来计算各个单字的识别得分。
其中,在计算不同签名识别模型对同一个单字识别到的字符串之间的差别时,两两字符串进行对比得到不同签名识别模型之间的识别差别,并计算各个识别差别之间的均值,即可得到该单字的识别得分。以此类推,得到每个单字的识别得分。
103、采用预置图片分割模型,对手写签名图片进行单字符分割,得到多个单字符,并基于各单字符和字符串组,计算各单字的分割得分;
本实施例中,通过预先设置好的图片分割模型,比如MNIST手写数据预测模型、HyperLPR模型等,对手写签名图片中的每个单字进行单字符分割,得到多个单字符,其中,单字符分割方法可以包括行列扫描分割、OpenCV的findContours。比如采用MNIST手写数据预测模型对单字符进行行列扫描分割时,通过反相处理的方式对手写签名图片进行分割:先通过对手写签名图片进行黑白预置颠倒,生成反相灰度图,然后对反相灰度图进行二值化处理,得到反相二值化图像,接着对反相二值化图像中的单字轮廓进行边缘膨胀,最后进行行列扫描,手写签名图像的背景像素设置为零,单字的像素则进行累加,得到各个单字对应的单字符。
另外,先前通过多个签名识别模型识别得到字符串组,针对手写体签名识别模型得到到的手写体签名对应的字符串,亦由多个单字符组合;而此处通过图片分割模型分割得到每个单字对应的多个单字符,通过先前识别到的相同单字字符串的单字符与分割得到的相同单字的单字符进行对比,评价图片分割模型的分割准确度,以计算各个单字的分割得分。其中,分割得分可以包括在两类单字符数量相同和不同的情况下对应的预设的分割得分。
104、选取与字符串组相对应的错字识别模型,并基于各单字符和分割得分,利用错字识别模型计算各单字的错字得分;
本实施例中,根据字符串组里不同类型的签名识别模型识别得到的每个字符串,选取相对应的错字识别模型,对图片分割模型分割得到的单字符进行错字判别,其中,通过分割得分可以确定识别得到的单字符和分割得到的单字符的数量是否相同,在数量相同和数量不同的情况下,错字得分的计算方式也不同。
具体的,在识别得到的单字符和分割得到的单字符的数量不相同时,则可以直接用一个预设的得分值作为单字的错字得分,在数量相同时,则采用错字识别模型对分割得到的每个单字符进行错字识别,得到每个单字符的错字概率,并对每个单字对应单字符的错字概率求均值以作为各个单字的错字得分。
105、基于各单字的识别得分、分割得分和错字得分,确定手写签名图片中的错字。
本实施例中,通过识别得分来评述每个手写签名识别模型对各个单字的识别结果差异以及字符串识别准确度,通过分割得分来评述图片分割模型对每个单字的分割准确度,还通过错字得分来评述错字识别模型对每个单字的错字识别准确度,此处三个维度对手写签名图片的错字识别均有影响,故此处结合以上三个影响维度,在字符级别的得分来确定手写签名图片中的错字。
具体的,可以根据三个维度的重要程度预先设置好识别得分、分割得分和错字得分的权重,并对三者进行加权处理,即可得到最终的错字识别得分,通过错字识别得分的值来选取手写签名图片中的错字,比如设置一个识别为错字的阈值,超过该阈值的错字识别得分对应的单字即为错字。
本发明实施例中,通过结合多个不同类型的签名识别模型,分别识别手写签名图片中的每个单字的字符串组,然后直接或者间接以该字符串组为基础,依次计算各个单字的识别得分、分割得分和错字得分,在字符级从三个维度上来识别每个单字是否为错字,实现对手写签名图片中每个单字的错字识别,提升手写签名错字识别的标准化和稳定性。
请参阅图2,本发明实施例中手写签名错别字识别方法的第二个实施例包括:
201、获取待识别的手写签名图片;
202、通过多个预置签名识别模型,分别识别手写签名图片中各单字对应的字符串组,并分别判断字符串组中各单字对应的手写体字符串和打印体字符串是否相同;
203、若相同,则将预置第一识别得分作为对应单字的识别得分;
204、若不相同,则计算对应单字的手写体字符串和打印体字符串的编辑距离,以及计算对应单字的手写字符串的第一置信度和打印字符串的第二置信度;
205、根据编辑距离、第一置信度和第二置信度,计算第二识别得分并作为对应单字的识别得分;
本实施例中,手写体签名识别模型识别到的手写签名图片中第r个单字的手写体字符串hr,以及打印体签名识别模型识别到的第r个单字的打印体字符串pr,分别判断每个单字的手写体字符串h1、h2、……、hr和打印体字符串p1、p2、……、pr是否相同,对于相同字符串的单字将其识别得分设置为预置第一识别得分,比如0.99,根据实际需求和应用场景进行设置即可。对于不相同字符串的单字,则需要进一步计算手写字符串的第一置信度hrc和打印体字符串的第二置信度prc,同时计算手写体字符串hr和打印体字符串pr之间的编辑距离dr,比如莱文斯坦距离;然后通过公式hrc*prc*dr来计算第二识别得分。
206、采用预置图片分割模型,对手写签名图片进行单字符分割,得到多个单字符;
207、对字符串组中各单字的手写字符串进行单字符拆分,并分别统计各单字的手写字符串拆分后的第一单字符数量,以及分别统计各单字对应的单字符的第二单字符数量;
208、分别判断各单字的第一单字符数量和第二单字符数量是否相同;
209、若相同,则将预置第一分割得分作为对应单字的分割得分,否则将预置第二分割得分作为对应单字的分割得分;
本实施例中,将第r单字的手写字符串hr进行拆分,得到第r个单字的k个单字符hr1、hr2、……、hrk,图片分割模型分割得到的第r个单字的t个单字符cr1、cr2、……、crt,此处判断第一单字符数量k和第二单字符数量t是否相同,若相同则采用预先设置好的第一分割得分作为对应单字的分割得分,否则采用预先设置好的第二分割得分作为对应单字的分割得分,其中,第一分割得分大于第二分割得分,比如第一分割得分可以设置为1,第二分割得分可以设置为-1。
210、选取与字符串组相对应的错字识别模型,若单字的分割得分为第二分割得分,则将预置第一错字得分作为对应单字的错字得分;
211、若单字的分割得分为第一分割得分,则通过错字识别模型依次识别对应单字各单字符对应的错字概率;
212、采用各错字概率计算第二错字得分并作为对应单字的错字得分;
本实施例中,此处各个单字的错字得分的计算方法与前面计算得到的分割得分相关,当单字的分割得分为第二分割得分时,则可以确定第一单字符数量和第二单字符数量不相同,此处直接将预先设置的第一错字得分作为该单字的错字得分即可;当单字的分割得分为第一分割得分时,则可以确定第一单字符数量和第二单字符数量相同,则通过错字识别模型,比如KenLM模型,一一识别该单字t个单字符的错字概率p1、p2、……pt,并通过公式:(p1+p2+……+pt)/t,来计算第一错字得分。
213、基于各单字的识别得分、分割得分和错字得分,确定手写签名图片中的错字。
本发明实施例中,在识别各个单字的字符串组时,通过手写体签名识别模型和打印体签名识别模型,识别手写签名图片中各单字对应的手写体字符串和打印体字符串;组合手写体字符串和打印体字符串,得到手写签名图片中各单字对应的字符串组。然后还根据预置权重分配,对手写签名图片的识别得分、分割得分和错字得分进行加权处理,得到各单字的最终错字得分,以用于确定手写签名图片中对应的单字为错字,实现手写签名的错字自动化识别,结合多维度的特征,更提升错字识别的准确度。
请参阅图3,本发明实施例中手写签名错别字识别方法的第三个实施例包括:
301、获取待识别的手写签名图片;
302、通过手写体签名识别模型,识别手写签名图片中各单字对应的手写体字符串;
303、通过打印体签名识别模型,识别手写签名图片中各单字对应的打印体字符串;
304、组合手写体字符串和打印体字符串,得到手写签名图片中各单字对应的字符串组,并根据字符串组,计算各单字的识别得分;
本实施例中,手写签名识别模型可以包括手写体签名识别模型比如GoogleNet、Inception V3和RESNet等,以及打印体签名识别模型比如印刷文字识别模型、OCR模型和CNOCR模型等,通过手写体签名识别模型可以识别到各个单字对应的手写体字符串h1、h2、……、hr,通过打印体签名识别模型可以识别到每个单字对应的打印体字符串c1、c2、……、cr,将h1、h2、……、hr和c1、c2、……、cr进行组合,即可得到字符串组,以用于后续的单字识别得分的计算。
305、采用预置图片分割模型,对手写签名图片进行单字符分割,得到多个单字符,并基于各单字符和字符串组,计算各单字的分割得分;
306、选取与字符串组相对应的错字识别模型,并基于各单字符和分割得分,利用错字识别模型计算各单字的错字得分;
307、根据预置权重分配,对手写签名图片的识别得分、分割得分和错字得分进行加权处理,得到各单字的最终错字得分;
308、分别判断各单字的最终错字得分是否大于预置得分阈值;
309、若大于,则确定手写签名图片中对应的单字为错字。
本实施例中,可以根据三个维度的重要程度预先设置好识别得分、分割得分和错字得分的权重,即权重分配,然后根据设置好的权重分配,来对对三者进行加权处理,以得到最终的错字识别得分,通过错字识别得分的值来选取手写签名图片中的错字,比如设置一个识别为错字的阈值,超过该阈值的错字识别得分对应的单字即为错字。
具体的,比如经过试验确定手写签名识别模型的识别过程最重要,其次为错字识别模型的判别过程,再是图片分割模型的分割过程,则可以设置识别得分的权重为0.6,错字得分的权重为0.3,分割得分的权重为0.1,同时,前面计算得到一单字的识别得分为0.9,错字得分为-1,分割得分为-1,则计算得到最终错字得分为0.14,若预设得分阈值为0.4,则对应的单字不为错字。
本发明实施例中,可以通过判别每个单字对应的手写体字符串和打印体字符串是否相同;相同时将单字识别得分设置为预设的值;不相同时则根据两者的编辑距离和置信度来计算单字的识别得分;然后再判断手写字符串进行单字符和单字分割后的单字符数量是否相同;相同和不同时分别采用预设的值对分割得分进行设置;接着在单字符相同时,也通过预设的值来设置单字的错字得分;在单字符不相同时,则通过错字识别模型依次识别对应单字各单字符对应的错字概率;采用各错字概率计算第一错字得分并作为对应单字的错字得分。在三个维度上计算单字的错字判别的得分,并作为参照,来确定最终的错字,提升手写签名的错字识别的精准度。
上面对本发明实施例中手写签名错别字识别方法进行了描述,下面对本发明实施例中手写签名错别字识别装置进行描述,请参阅图4,本发明实施例中手写签名错别字识别装置一个实施例包括:
获取模块401,用于获取待识别的手写签名图片;
识别得分计算模块402,用于通过多个预置签名识别模型,分别识别所述手写签名图片中各单字对应的字符串组,并根据所述字符串组,计算所述各单字的识别得分;
分割得分计算模块403,用于采用预置图片分割模型,对所述手写签名图片进行单字符分割,得到多个单字符,并基于各所述单字符和所述字符串组,计算所述各单字的分割得分;
错字得分计算模块404,用于选取与所述字符串组相对应的错字识别模型,并基于各所述单字符和所述分割得分,利用所述错字识别模型计算所述各单字的错字得分;
确定模块405,用于基于所述各单字的识别得分、分割得分和所述错字得分,确定所述手写签名图片中的错字。
本发明实施例中,通过结合多个不同类型的签名识别模型,分别识别手写签名图片中的每个单字的字符串组,然后直接或者间接以该字符串组为基础,依次计算各个单字的识别得分、分割得分和错字得分,在字符级从三个维度上来识别每个单字是否为错字,实现对手写签名图片中每个单字的错字识别,提升手写签名错字识别的标准化和稳定性。
请参阅图5,本发明实施例中手写签名错别字识别装置的另一个实施例包括:
获取模块401,用于获取待识别的手写签名图片;
识别得分计算模块402,用于通过多个预置签名识别模型,分别识别所述手写签名图片中各单字对应的字符串组,并根据所述字符串组,计算所述各单字的识别得分;
分割得分计算模块403,用于采用预置图片分割模型,对所述手写签名图片进行单字符分割,得到多个单字符,并基于各所述单字符和所述字符串组,计算所述各单字的分割得分;
错字得分计算模块404,用于选取与所述字符串组相对应的错字识别模型,并基于各所述单字符和所述分割得分,利用所述错字识别模型计算所述各单字的错字得分;
确定模块405,用于基于所述各单字的识别得分、分割得分和所述错字得分,确定所述手写签名图片中的错字。
具体的,所述多个预置签名识别模型包括手写体签名识别模型和打印体签名识别模型,所述识别得分计算模块402包括识别单元4021,用于:
通过所述手写体签名识别模型,识别所述手写签名图片中各单字对应的手写体字符串;
通过所述打印体签名识别模型,识别所述手写签名图片中各单字对应的打印体字符串;
组合所述手写体字符串和所述打印体字符串,得到所述手写签名图片中各单字对应的字符串组。
具体的,所述识别得分计算模块402包括识别得分计算单元4022,用于:
分别判断所述字符串组中各单字对应的手写体字符串和打印体字符串是否相同;
若相同,则将预置第一识别得分作为对应单字的识别得分;
若不相同,则计算对应单字的手写体字符串和打印体字符串的编辑距离,以及计算对应单字的手写字符串的第一置信度和打印字符串的第二置信度;
根据所述编辑距离、所述第一置信度和所述第二置信度,计算第二识别得分并作为对应单字的识别得分。
具体的,所述分割得分计算模块403包括:
统计单元4031,用于对所述字符串组中各单字的手写字符串进行单字符拆分,并分别统计所述各单字的手写字符串拆分后的第一单字符数量,以及分别统计所述各单字对应的单字符的第二单字符数量;
判别单元4032,用于分别判断所述各单字的第一单字符数量和第二单字符数量是否相同;若相同,则将预置第一分割得分作为对应单字的分割得分,否则将预置第二分割得分作为对应单字的分割得分。
具体的,所述错字得分计算模块404包括:
第一计算单元4041,用于若单字的分割得分为所述第二分割得分,则将预置第一错字得分作为对应单字的错字得分;
第二计算单元4042,用于若单字的分割得分为所述第一分割得分,则通过所述错字识别模型依次识别对应单字各所述单字符对应的错字概率;采用各所述错字概率计算第二错字得分并作为对应单字的错字得分。
具体的,所述确定模块405包括:
加权处理单元4051,用于根据预置权重分配,对所述手写签名图片的识别得分、分割得分和所述错字得分进行加权处理,得到所述各单字的最终错字得分;
确定单元4052,用于分别判断所述各单字的最终错字得分是否大于预置得分阈值;若大于,则确定所述手写签名图片中对应的单字为错字。
本发明实施例中,在识别各个单字的字符串组时,通过手写体签名识别模型和打印体签名识别模型,识别手写签名图片中各单字对应的手写体字符串和打印体字符串;组合手写体字符串和打印体字符串,得到手写签名图片中各单字对应的字符串组。然后还根据预置权重分配,对手写签名图片的识别得分、分割得分和错字得分进行加权处理,得到各单字的最终错字得分,以用于确定手写签名图片中对应的单字为错字,实现手写签名的错字自动化识别,结合多维度的特征,更提升错字识别的准确;也可以通过判别每个单字对应的手写体字符串和打印体字符串是否相同;相同时将单字识别得分设置为预设的值;不相同时则根据两者的编辑距离和置信度来计算单字的识别得分;然后再判断手写字符串进行单字符和单字分割后的单字符数量是否相同;相同和不同时分别采用预设的值对分割得分进行设置;接着在单字符相同时,也通过预设的值来设置单字的错字得分;在单字符不相同时,则通过错字识别模型依次识别对应单字各单字符对应的错字概率;采用各错字概率计算第一错字得分并作为对应单字的错字得分。在三个维度上计算单字的错字判别的得分,并作为参照,来确定最终的错字,提升手写签名的错字识别的精准度。
上面图4和图5从模块化功能实体的角度对本发明实施例中的手写签名错别字识别装置进行详细描述,下面从硬件处理的角度对本发明实施例中手写签名错别字识别设备进行详细描述。
图6是本发明实施例提供的一种手写签名错别字识别设备的结构示意图,该手写签名错别字识别设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)610(例如,一个或一个以上处理器)和存储器620,一个或一个以上存储应用程序633或数据632的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对手写签名错别字识别设备600中的一系列指令操作。更进一步地,处理器610可以设置为与存储介质630通信,在手写签名错别字识别设备600上执行存储介质630中的一系列指令操作。
手写签名错别字识别设备600还可以包括一个或一个以上电源640,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口660,和/或,一个或一个以上操作系统631,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图6示出的手写签名错别字识别设备结构并不构成对手写签名错别字识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种手写签名错别字识别设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述手写签名错别字识别方法的步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述手写签名错别字识别方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种手写签名错别字识别方法,其特征在于,所述手写签名错别字识别方法包括:
获取待识别的手写签名图片;
通过多个预置签名识别模型,分别识别所述手写签名图片中各单字对应的字符串组,并根据所述字符串组,计算所述各单字的识别得分;
采用预置图片分割模型,对所述手写签名图片进行单字符分割,得到多个单字符,并基于各所述单字符和所述字符串组,计算所述各单字的分割得分;
选取与所述字符串组相对应的错字识别模型,并基于各所述单字符和所述分割得分,利用所述错字识别模型计算所述各单字的错字得分;
基于所述各单字的识别得分、分割得分和所述错字得分,确定所述手写签名图片中的错字。
2.根据权利要求1所述的手写签名错别字识别方法,其特征在于,所述多个预置签名识别模型包括手写体签名识别模型和打印体签名识别模型,所述通过多个预置签名识别模型,分别识别所述手写签名图片中各单字对应的字符串组包括:
通过所述手写体签名识别模型,识别所述手写签名图片中各单字对应的手写体字符串;
通过所述打印体签名识别模型,识别所述手写签名图片中各单字对应的打印体字符串;
组合所述手写体字符串和所述打印体字符串,得到所述手写签名图片中各单字对应的字符串组。
3.根据权利要求2所述的手写签名错别字识别方法,其特征在于,所述根据所述字符串组,计算所述各单字的识别得分包括:
分别判断所述字符串组中各单字对应的手写体字符串和打印体字符串是否相同;
若相同,则将预置第一识别得分作为对应单字的识别得分;
若不相同,则计算对应单字的手写体字符串和打印体字符串的编辑距离,以及计算对应单字的手写字符串的第一置信度和打印字符串的第二置信度;
根据所述编辑距离、所述第一置信度和所述第二置信度,计算第二识别得分并作为对应单字的识别得分。
4.根据权利要求2所述的手写签名错别字识别方法,其特征在于,所述基于各所述单字符和所述字符串组,计算所述各单字的分割得分包括:
对所述字符串组中各单字的手写字符串进行单字符拆分,并分别统计所述各单字的手写字符串拆分后的第一单字符数量,以及分别统计所述各单字对应的单字符的第二单字符数量;
分别判断所述各单字的第一单字符数量和第二单字符数量是否相同;
若相同,则将预置第一分割得分作为对应单字的分割得分,否则将预置第二分割得分作为对应单字的分割得分。
5.根据权利要求4所述的手写签名错别字识别方法,其特征在于,所述基于各所述单字符和所述分割得分,利用所述错字识别模型计算所述各单字的错字得分包括:
若单字的分割得分为所述第二分割得分,则将预置第一错字得分作为对应单字的错字得分;
若单字的分割得分为所述第一分割得分,则通过所述错字识别模型依次识别对应单字各所述单字符对应的错字概率;
采用各所述错字概率计算第二错字得分并作为对应单字的错字得分。
6.根据权利要求1-5中任一项所述的手写签名错别字识别方法,其特征在于,所述基于所述各单字的识别得分、分割得分和所述错字得分,确定所述手写签名图片中的错字包括:
根据预置权重分配,对所述手写签名图片的识别得分、分割得分和所述错字得分进行加权处理,得到所述各单字的最终错字得分;
分别判断所述各单字的最终错字得分是否大于预置得分阈值;
若大于,则确定所述手写签名图片中对应的单字为错字。
7.一种手写签名错别字识别装置,其特征在于,所述手写签名错别字识别装置包括:
获取模块,用于获取待识别的手写签名图片;
识别得分计算模块,用于通过多个预置签名识别模型,分别识别所述手写签名图片中各单字对应的字符串组,并根据所述字符串组,计算所述各单字的识别得分;
分割得分计算模块,用于采用预置图片分割模型,对所述手写签名图片进行单字符分割,得到多个单字符,并基于各所述单字符和所述字符串组,计算所述各单字的分割得分;
错字得分计算模块,用于选取与所述字符串组相对应的错字识别模型,并基于各所述单字符和所述分割得分,利用所述错字识别模型计算所述各单字的错字得分;
确定模块,用于基于所述各单字的识别得分、分割得分和所述错字得分,确定所述手写签名图片中的错字。
8.根据权利要求7所述的手写签名错别字识别装置,其特征在于,所述多个预置签名识别模型包括手写体签名识别模型和打印体签名识别模型,所述识别得分计算模块包括识别单元,用于:
通过所述手写体签名识别模型,识别所述手写签名图片中各单字对应的手写体字符串;
通过所述打印体签名识别模型,识别所述手写签名图片中各单字对应的打印体字符串;
组合所述手写体字符串和所述打印体字符串,得到所述手写签名图片中各单字对应的字符串组。
9.一种手写签名错别字识别设备,其特征在于,所述手写签名错别字识别设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述手写签名错别字识别设备执行如权利要求1-6中任意一项所述的手写签名错别字识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-6中任意一项所述手写签名错别字识别方法的步骤。
CN202111149066.3A 2021-09-29 2021-09-29 手写签名错别字识别方法、装置、设备及存储介质 Active CN113837129B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111149066.3A CN113837129B (zh) 2021-09-29 2021-09-29 手写签名错别字识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111149066.3A CN113837129B (zh) 2021-09-29 2021-09-29 手写签名错别字识别方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113837129A true CN113837129A (zh) 2021-12-24
CN113837129B CN113837129B (zh) 2023-10-03

Family

ID=78967492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111149066.3A Active CN113837129B (zh) 2021-09-29 2021-09-29 手写签名错别字识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113837129B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002216076A (ja) * 2001-01-24 2002-08-02 Fujitsu Ltd 文字列認識装置
JP2003308480A (ja) * 2002-04-16 2003-10-31 Fujitsu Ltd オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム
KR20150021846A (ko) * 2013-08-21 2015-03-03 주식회사 디오텍 문서 디지털 복원 시스템 및 방법
CN110298250A (zh) * 2019-05-30 2019-10-01 广东爱贝佳科技有限公司 一种书写评分及纠错方法和交互式系统
CN111435407A (zh) * 2019-01-10 2020-07-21 北京字节跳动网络技术有限公司 错别字的纠正方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002216076A (ja) * 2001-01-24 2002-08-02 Fujitsu Ltd 文字列認識装置
JP2003308480A (ja) * 2002-04-16 2003-10-31 Fujitsu Ltd オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム
KR20150021846A (ko) * 2013-08-21 2015-03-03 주식회사 디오텍 문서 디지털 복원 시스템 및 방법
CN111435407A (zh) * 2019-01-10 2020-07-21 北京字节跳动网络技术有限公司 错别字的纠正方法、装置、设备及存储介质
CN110298250A (zh) * 2019-05-30 2019-10-01 广东爱贝佳科技有限公司 一种书写评分及纠错方法和交互式系统

Also Published As

Publication number Publication date
CN113837129B (zh) 2023-10-03

Similar Documents

Publication Publication Date Title
CN110569830B (zh) 多语言文本识别方法、装置、计算机设备及存储介质
WO2021027336A1 (zh) 基于印章和签名的身份验证方法、装置和计算机设备
CN106951832B (zh) 一种基于手写字符识别的验证方法及装置
EP3214577A1 (en) Image text recognition method and device
CN109740606B (zh) 一种图像识别方法及装置
WO2010092952A1 (ja) パターン認識装置
CN111340020B (zh) 一种公式识别方法、装置、设备及存储介质
CN110942004A (zh) 基于神经网络模型的手写识别方法、装置及电子设备
CN108830275B (zh) 点阵字符、点阵数字的识别方法及装置
CN111107107B (zh) 网络行为的检测方法、装置、计算机设备和存储介质
CN110705233A (zh) 基于文字识别技术的笔记生成方法、装置和计算机设备
US9117132B2 (en) System and method facilitating designing of classifier while recognizing characters in a video
CN110647885A (zh) 基于图片识别的试卷拆分方法、装置、设备以及介质
CN112418180A (zh) 表格数据提取方法、装置、设备及计算机存储介质
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
CN112232336A (zh) 一种证件识别方法、装置、设备及存储介质
CN112580108A (zh) 签名和印章完整性验证方法及计算机设备
CN110197140B (zh) 基于文字识别的材料审核方法及设备
CN116343237A (zh) 基于深度学习和知识图谱的票据识别方法
Van Beusekom et al. Automated ocr ground truth generation
Shukla et al. An approach for skew detection using hough transform
CN111414889A (zh) 基于文字识别的财务报表识别方法及装置
CN113837129A (zh) 手写签名错别字识别方法、装置、设备及存储介质
US9092688B2 (en) Assisted OCR
CN115909381A (zh) 一种文本图像识别方法、系统及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant