CN116935407A - 数字字符识别结果的修正方法、装置、存储介质及设备 - Google Patents
数字字符识别结果的修正方法、装置、存储介质及设备 Download PDFInfo
- Publication number
- CN116935407A CN116935407A CN202310913384.5A CN202310913384A CN116935407A CN 116935407 A CN116935407 A CN 116935407A CN 202310913384 A CN202310913384 A CN 202310913384A CN 116935407 A CN116935407 A CN 116935407A
- Authority
- CN
- China
- Prior art keywords
- digital character
- digital
- character
- similar
- correction result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012937 correction Methods 0.000 title claims abstract description 213
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/19007—Matching; Proximity measures
- G06V30/19093—Proximity measures, i.e. similarity or distance measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种数字字符识别结果的修正方法、装置、存储介质及设备,涉及计算机技术领域,可解决数字字符识别成其他的数字字符时,修正效率低且修正准确率低的技术问题。其中方法包括:获取数字字符识别结果以及数字字符识别结果对应的约束条件;在利用约束条件判断数字字符识别结果出错时,获取数字字符识别结果中每一位数字字符对应的相似数字字符;利用相似数字字符替换对应的数字字符,得到符合约束条件的目标数字字符修正结果。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及到一种数字字符识别结果的修正方法、装置、存储介质及设备。
背景技术
光学字符识别(Optical Character Recognition,OCR)是指对图像文件进行分析识别处理,获取版面信息,并以文本的形式返回的过程,然而OCR识别可能出错,需要修正。
目前,对于将数字字符错误的识别成其他数字字符的情况,利用0-9这10个数字字符进行替换,修正效率低且修正准确率低。
发明内容
有鉴于此,本发明提供了一种数字字符识别结果的修正方法、装置、存储介质及设备,可解决数字字符识别成其他的数字字符时,修正效率低且修正准确率低的技术问题。
根据本发明的一个方面,提供了一种数字字符识别结果的修正方法,所述方法包括:
获取数字字符识别结果以及所述数字字符识别结果对应的约束条件;
在利用所述约束条件判断所述数字字符识别结果出错时,获取所述数字字符识别结果中每一位数字字符对应的相似数字字符;
利用所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果。
优选地,所述利用所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果,包括:
确定所述约束条件的约束类型,其中,所述约束类型包括大于第一预设值、小于第二预设值、大于所述第一预设值且小于所述第二预设值;
根据所述约束类型确定替换规则,利用所述替换规则与所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果。
优选地,若所述约束类型是大于所述第一预设值,则确定所述第一预设值的每一位第一目标数字字符,选择所述数字字符对应的所述相似数字字符中大于等于对应位的所述第一目标数字字符的第一最小相似数字字符,利用所述第一最小相似数字字符替换同一位的所述数字字符,得到第一数字字符修正结果;
若所述第一数字字符修正结果大于所述第一预设值,则将所述第一数字字符修正结果作为最小目标数字字符修正结果;
若所述第一数字字符修正结果等于所述第一预设值,则确定所述第一数字字符修正结果的第一最低位数字字符以及所述数字字符识别结果中的最低位数字字符,判断所述最低位数字字符对应的所述相似数字字符中是否存在大于对应位的所述第一最小相似数字字符的第二最小相似数字字符,若是,则利用所述第二最小相似数字字符替换所述第一最低位数字字符,得到最小目标数字字符修正结果,若否,则对所述第一数字字符修正结果逐步进行进位操作,直到得到所述最小目标数字字符修正结果;
根据所述最小目标数字字符修正结果以及所述数字字符对应的所述相似数字字符,得到大于所述第一预设值的目标数字字符修正结果。
优选地,所述根据所述约束类型确定替换规则,利用所述替换规则与所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果,还包括:
若所述约束类型是小于所述第二预设值,则确定所述第二预设值的每一位第二目标数字字符,选择所述数字字符对应的所述相似数字字符中小于等于对应位的所述第二目标数字字符的第一最大相似数字字符,利用所述第一最大相似数字字符替换同一位的所述数字字符,得到第二数字字符修正结果;
若所述第二数字字符修正结果小于所述第二预设值,则将所述第二数字字符修正结果作为最大目标数字字符修正结果;
若所述第二数字字符修正结果等于所述第二预设值,则确定所述第二数字字符修正结果的第二最低位数字字符,判断所述最低位数字字符对应的所述相似数字字符中是否存在小于对应位的所述第一最大相似数字字符的第二最大相似数字字符,若是,则利用所述第二最大相似数字字符替换所述第二最低位数字字符,得到最大目标数字字符修正结果,若否,则对所述第二数字字符修正结果逐步进行借位操作,直到得到所述最大目标数字字符修正结果;
根据所述最大目标数字字符修正结果以及所述数字字符对应的所述相似数字字符,得到小于所述第二预设值的目标数字字符修正结果。
优选地,所述根据所述约束类型确定替换规则,利用所述替换规则与所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果,还包括:
若所述约束类型是大于所述第一预设值且小于所述第二预设值;
若所述最小目标数字字符修正结果小于所述第二预设值且所述最大目标数字字符修正结果大于所述第一预设值,则根据所述最小目标数字字符修正结果、所述最大目标数字字符修正结果以及所述数字字符对应的所述相似数字字符,得到大于所述第一预设值且小于所述第二预设值的目标数字字符修正结果。
优选地,所述逐步进行进位操作,包括:
确定所述数字字符识别结果中的次低位数字字符;
判断所述次低位数字字符对应的所述相似数字字符中是否存在大于对应位的所述第一最小相似数字字符的第二最小相似数字字符;
若是,则利用所述第二最小相似数字字符替换所述第一数字字符修正结果的第一次低位数字字符,且将所述第一最低位数字字符替换为所述最低位数字字符对应的所述相似数字字符中的最小数;
若否,进一步进行进位操作。
优选地,所述逐步进行借位操作,包括:
确定所述数字字符识别结果中的次低位数字字符;
判断所述次低位数字字符对应的相似数字字符中是否存在小于对应位的所述第一最大相似数字字符的第二最大相似数字字符;
若是,则利用所述第二最大相似数字字符替换所述第二数字字符修正结果的第二次低位数字字符,且将所述第二最低位数字字符替换为所述最低位数字字符对应的所述相似数字字符中的最大数;
若否,则进一步进行借位操作。
根据本发明的又一个方面,提供了一种数字字符识别结果的修正装置,所述装置包括:
获取模块,用于获取数字字符识别结果以及所述数字字符识别结果对应的约束条件;
判断模块,用于在利用所述约束条件判断所述数字字符识别结果出错时,获取所述数字字符识别结果中每一位数字字符对应的相似数字字符;
修正模块,用于利用所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果。
根据本发明的又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述数字字符识别结果的修正方法。
根据本发明的再一个方面,提供了一种计算机设备,包括存储介质、处理器以及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述数字字符识别结果的修正方法。
借由上述技术方案,本发明提供的一种数字字符识别结果的修正方法、装置、存储介质及设备,可首先获取数字字符识别结果以及数字字符识别结果对应的约束条件;然后在利用约束条件判断数字字符识别结果出错时,获取数字字符识别结果中每一位数字字符对应的相似数字字符;最后利用相似数字字符替换对应的数字字符,得到符合约束条件的目标数字字符修正结果。通过本发明中的技术方案,使用相似数字字符替换,相比于使用0-9这10个数字字符进行逐个以及全部的替换,极大的减少了替换的工作量,提高了修正效率,也提高了对数字字符识别结果进行修正的准确率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本地申请的不当限定。在附图中:
图1示出了本发明实施例提供的一种数字字符识别结果的修正方法的流程示意图;
图2示出了本发明实施例提供的另一种数字字符识别结果的修正方法的流程示意图;
图3示出了本发明实施例提供的一种数字字符识别结果的修正装置的结构示意图;
图4示出了本发明实施例提供的另一种数字字符识别结果的修正装置的结构示意图。
具体实施方式
下文将参照附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互结合。
针对数字字符识别成其他的数字字符时,修正效率低且修正准确率低的技术问题,本实施例提供了一种数字字符识别结果的修正方法,如图1所示,该方法包括:
101、获取数字字符识别结果以及数字字符识别结果对应的约束条件。
102、在利用约束条件判断数字字符识别结果出错时,获取数字字符识别结果中每一位数字字符对应的相似数字字符。
需要说明的是,本实施例步骤101-103适用于数字字符识别结果中存在某一位的数字字符识别成其他数字字符,从而导致数字字符识别结果出错的情况,其中,数字字符识别结果包括至少一位数字字符。
对于实施例步骤101和102,首先利用约束条件判断数字字符识别结果是否出错,如果数字字符识别结果符合约束条件,那么数字字符识别结果没有出错,如果数字字符识别结果不符合约束条件,那么数字字符识别结果出错了,其中,约束条件根据具体的应用场景确定,例如在证件识别的场景下,出生日期所对应的约束条件一定小于当前日期;
然后在数字字符识别结果出错时,需要对数字字符识别结果进行修正,包括实施例步骤102以及实施例步骤103,对于实施例步骤102,具体的:
(1)进行大规模统计,得到0-9这10个数字字符在字符形状上所相似的相似数字字符,例如9与9、0、8相似,8与8、9、6、0相似,7与7、2、1相似,6与6、8、0相似,5与5、3相似,3与3、5、2相似,2与2、7、3相似,1与1、7相似,0与0、9、8、6相似,而4与其他9个数字字符都不像,基本没有识别错误案例(之所以会被错误识别,就是因为在识别时,字符形状中的某个通用特征被放大,而区别特征可能丢失,例如,7和2相似,因为2最下面的一横这个区别特征丢失了,又例如,3和2相似,因为3中间的一横这个区别特征丢失了)。
(2)获取数字字符识别结果中每一位数字字符对应的相似数字字符,例如识别结果是75,获取7的相似数字字符7、2、1,获取5的相似数字字符5、3。
103、利用相似数字字符替换对应的数字字符,得到符合约束条件的目标数字字符修正结果。
对于本实施例,作为一种实施方式,利用相似数字字符枚举替换对应的数字字符,从替换结果中选择出至少一个符合约束条件的目标数字字符修正结果,具体的,若数字字符识别结果所包括的数字字符只有一位,例如数字字符识别结果是9,约束条件是小于5,那么获取9的相似数字字符9、0、8,替换结果是9、0和8,其中只有0小于5,所以得到目标数字字符修正结果是0。若数字字符识别结果所包括的数字字符大于一位,例如数字字符识别结果是75,约束条件是小于21,获取7的相似数字字符7、2、1,获取5的相似数字字符5、3,替换结果是73、15、13、25、23,其中只有15、13小于21,所以得到目标数字字符修正结果是15或者13,可以根据实际应用场景进行进一步确定是15还是13,也可以15和13任意一个,在此不做限定。
以数字字符识别结果所包括的数字字符只有一位为例,说明使用相似数字字符的效果:如果不利用相似数字字符替换对应的数字字符,那么需要从0-9这10个数字中每一个都替换一次,符合小于5这个约束条件的有0-4这5种情况,还要继续从一个较大的范围即0-4这5种情况中确定哪一个是正确的,因此,利用相似数字字符替换对应的数字字符不仅可以提高修正效率,还能提高修正准确率。
本发明提供的一种数字字符识别结果的修正方法、装置、存储介质及设备,可首先获取数字字符识别结果以及数字字符识别结果对应的约束条件;然后在利用约束条件判断数字字符识别结果出错时,获取数字字符识别结果中每一位数字字符对应的相似数字字符;最后利用相似数字字符替换对应的数字字符,得到符合约束条件的目标数字字符修正结果。通过本发明中的技术方案,使用相似数字字符替换,相比于使用0-9这10个数字字符进行逐个以及全部的替换,极大的减少了替换的工作量,提高了效率,也提高了对数字字符识别结果进行修正的准确率。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例中的具体实施过程,提供了另一种数字字符识别结果的修正方法,如图2所示,该方法包括:
201、获取数字字符识别结果以及数字字符识别结果对应的约束条件。
202、在利用约束条件判断数字字符识别结果出错时,获取数字字符识别结果中每一位数字字符对应的相似数字字符。
具体实施方式与实施例步骤101、102相同,在此不再赘述。
203、确定约束条件的约束类型,其中,约束类型包括大于第一预设值、小于第二预设值、大于第一预设值且小于第二预设值。
204、根据约束类型确定替换规则,利用替换规则与相似数字字符替换对应的数字字符,得到符合约束条件的目标数字字符修正结果。
需要说明的是,对于实施例步骤203与204,为了进一步提高修正效率,在利用相似数字字符替换对应的数字字符时,不采用枚举替换的方式,而是根据不同的约束类型确定不同的替换规则,在具体替换时,利用替换规则与相似数字字符替换对应的数字字符。
在具体的应用场景中,如果需要得到所有符合约束条件的目标数字字符修正结果,则根据约束类型确定三种替换规则,具体如下:
第一种约束类型对应的第一种替换规则(例如数字字符识别结果是2975,数字字符识别结果的每一位数字字符是2、9、7、5):若约束类型是大于第一预设值(例如,第一预设值是3825),则确定第一预设值(3825)的每一位第一目标数字字符(3、8、2、5),选择数字字符对应的相似数字字符中大于等于对应位的第一目标数字字符的第一最小相似数字字符(对于千位,数字字符2对应的相似数字字符是2、7、3,2、7、3中大于等于千位的第一目标数字字符3的有7和3,但是不是7和3都可以,而是要选择7和3中的最小数,因此,对于千位的第一最小相似数字字符是3;对于百位,数字字符9对应的相似数字字符是9、0、8,其中,大于等于百位的第一目标数字字符8的有9和8,9和8中的最小数是百位的第一最小相似数字字符是8,同理十位的第一最小相似数字字符是2,个位的第一最小相似数字字符是5),利用第一最小相似数字字符替换同一位的数字字符,得到第一数字字符修正结果(3825);若第一数字字符修正结果大于第一预设值,则将第一数字字符修正结果作为最小目标数字字符修正结果;若第一数字字符修正结果等于第一预设值(本实施例属于这种情况),则确定第一数字字符修正结果(3825)的第一最低位数字字符(5),以及数字字符识别结果(2975)中的最低位数字字符(5),判断最低位数字字符(2975中的5)对应的相似数字字符(5、3)中是否存在大于对应位的第一最小相似数字字符(3825中的5)的第二最小相似数字字符,若是,则利用第二最小相似数字字符替换第一最低位数字字符,得到最小目标数字字符修正结果,若否,则对第一数字字符修正结果逐步进行进位操作(由于5和3中没有大于5的最小数,因此,需要逐步进行进位操作),直到得到最小目标数字字符修正结果;根据最小目标数字字符修正结果以及数字字符对应的相似数字字符,得到大于第一预设值的目标数字字符修正结果。
其中,第一最小相似数字字符和第二最小相似数字字符的区别在于,第一最小相似数字字符是相似数字字符中大于等于第一目标数字字符的最小数,而第二最小相似数字字符是相似数字字符中大于第一最小相似数字字符的最小数。
需要说明的是,进位操作的思想是:低位数字字符按照相似数字字符从小到大,依次提升到最大后,需要向高一位进位,递归进行更高位的进位,同时将当前位降到相似数字字符中的最小数。具体的,对于逐步进行进位操作,包括:确定数字字符识别结果(2975)中的次低位数字字符(十位是次低位,次低位数字字符是7);判断次低位数字字符(7)对应的相似数字字符(7、2、1)中是否存在大于对应位的第一最小相似数字字符(十位的第一最小相似数字字符是2)的第二最小相似数字字符(7、2、1中的7是大于2中的最小数,所以十位的第二最小相似数字字符是7);若是,则利用第二最小相似数字字符(7)替换第一数字字符修正结果(3825)的第一次低位数字字符(十位是次低位,第一次低位数字字符是2),且将第一最低位数字字符(第一数字字符修正结果3825的第一最低位数字字符是5)替换为最低位数字字符(2975中的5)对应的相似数字字符(5、3)中的最小数(3);若否,进一步进行进位操作。
在进行一步进位操作后,从3825到3873,且3873是大于第一预设值3825的最小数,所以3873是最小目标数字字符修正结果,无需进一步进行进位操作。
在得到最小目标数字字符修正结果之后,对于根据最小目标数字字符修正结果以及数字字符对应的相似数字字符,得到大于第一预设值的目标数字字符修正结果,具体的,由于最小目标数字字符修正结果3873是大于第一预设值3825的最小数,则为了得到所有符合约束条件的目标数字字符修正结果,作为一种实施方式,可以枚举相似数字字符中大于最小目标数字字符修正结果3873的所有结果,大于最小目标数字字符修正结果3873的所有结果以及最小目标数字字符修正结果3873是所有的目标数字字符修正结果。如果利用相似数字字符进行全部枚举替换,还需要从替换结果中筛选出符合约束条件的,而本实施例针对大于第一预设值设置的替换规则,确定了大于第一预设值的最小值即最小目标数字字符修正结果,那么只需要枚举大于最小目标数字字符修正结果的所有结果即可,最小目标数字字符修正结果与大于最小目标数字字符修正结果的所有结果都一定大于第一预设值,无需筛选,提高了修正效率。
第二种约束类型对应的第二种替换规则:若约束类型是小于第二预设值(例如数字字符识别结果是2975,数字字符识别结果的每一位数字字符是2、9、7、5,第二预设值是3978),则确定第二预设值(3978)的每一位第二目标数字字符(3、9、7、8),选择数字字符对应的相似数字字符中小于等于对应位的第二目标数字字符的第一最大相似数字字符(对于千位,数字字符2对应的相似数字字符是2、7、3,2、7、3中小于等于千位的第二目标数字字符3的有3和2,但是不是3和2都可以,而是要选择3和2中的最大数,因此,对于千位的第一最大相似数字字符是3;对于百位,数字字符9对应的相似数字字符是9、0、8,其中,小于等于百位的第二目标数字字符9的有9、0和8,9、0和8中的最大数是百位的第一最大相似数字字符是9,同理十位的第一最大相似数字字符是7,个位的第一最大相似数字字符是5),利用第一最大相似数字字符替换同一位的数字字符,得到第二数字字符修正结果(3975);若第二数字字符修正结果小于第二预设值,则将第二数字字符修正结果作为最大目标数字字符修正结果(本实施例属于这种情况);若第二数字字符修正结果等于第二预设值,则确定第二数字字符修正结果的第二最低位数字字符,判断最低位数字字符对应的相似数字字符中是否存在小于对应位的第一最大相似数字字符的第二最大相似数字字符,若是,则利用第二最大相似数字字符替换第二最低位数字字符,得到最大目标数字字符修正结果,若否,则对第二数字字符修正结果逐步进行借位操作,直到得到最大目标数字字符修正结果;根据最大目标数字字符修正结果以及对应的相似数字字符,得到小于第二预设值的目标数字字符修正结果。
其中,第一最大相似数字字符和第二最大相似数字字符的区别在于,第一最大相似数字字符是相似数字字符中小于等于第二目标数字字符的最大数,而第二最大相似数字字符是相似数字字符中小于第一最大相似数字字符的最大数。
需要说明的是,借位操作的思想是:低位数字字符按照相似数字字符从大到小,依次下降到最小后,需要向高一位借位,递归进行更高位的借位,同时将当前位升到相似数字字符中的最大数。具体的,对于逐步进行借位操作,包括:确定数字字符识别结果中的次低位数字字符;判断次低位数字字符对应的相似数字字符中是否存在小于对应位的第一最大相似数字字符的第二最大相似数字字符;若是,则利用第二最大相似数字字符替换第二数字字符修正结果的第二次低位数字字符,且将第二最低位数字字符替换为最低位数字字符对应的相似数字字符中的最大数;若否,则进一步进行借位操作。
在得到最大目标数字字符修正结果之后,对于根据最大目标数字字符修正结果以及数字字符对应的相似数字字符,得到小于第二预设值的目标数字字符修正结果,具体的,由于最大目标数字字符修正结果是小于第二预设值的最大值,则为了得到所有符合约束条件的目标数字字符修正结果,作为一种实施方式,可以枚举数字字符对应的相似数字字符中小于最大目标数字字符修正结果的所有结果,小于最大目标数字字符修正结果的所有结果以及最大目标数字字符修正结果是所有的目标数字字符修正结果。
第三种约束类型对应的第三种替换规则:若约束类型是大于第一预设值(例如,第一预设值是3825)且小于第二预设值(例如,第二预设值是3978);若最小目标数字字符修正结果小于第二预设值且最大目标数字字符修正结果大于第一预设值(最小目标数字字符修正结果已经大于第一预设值了,最大目标数字字符修正结果已经小于第二预设值了,上述例子中,最小目标数字字符修正结果是3873小于第二预设值3978,最大目标数字字符修正结果是3975大于第一预设值3825),则根据最小目标数字字符修正结果、最大目标数字字符修正结果以及数字字符对应的相似数字字符,得到大于第一预设值且小于第二预设值的目标数字字符修正结果(最小目标数字字符修正结果是3873,最大目标数字字符修正结果是3975,作为一种实施方式,可以枚举数字字符对应的相似数字字符中大于最小目标数字字符修正结果3873,且小于最大目标数字字符修正结果3975的所有结果,大于最小目标数字字符修正结果3873且小于最大目标数字字符修正结果3975的所有结果、最小目标数字字符修正结果3873以及最大目标数字字符修正结果3975是所有大于第一预设值且小于第二预设值的目标数字字符修正结果)。
在具体的应用场景中,如果只需要得到一个符合约束条件的目标数字字符修正结果,则根据约束类型确定三种替换规则,具体如下:
第一种约束类型对应的第一种替换规则:若约束类型是大于第一预设值,则最小目标数字字符修正结果为目标数字字符修正结果;
第二种约束类型对应的第二种替换规则:若约束类型是小于第二预设值,则最大目标数字字符修正结果为目标数字字符修正结果。
第三种约束类型对应的第三种替换规则:若约束类型是大于第一预设值且小于第二预设值,则作为一种实施方式,判断最小目标数字字符修正结果是否小于第二预设值,若最小目标数字字符修正结果小于第二预设值,则最小目标数字字符修正结果为目标数字字符修正结果;作为另一种实施方式,判断最大目标数字字符修正结果是否大于第一预设值,若最大目标数字字符修正结果大于第一预设值,则最大目标数字字符修正结果为目标数字字符修正结果。
本实施例应用于所有将数字字符识别结果错误的识别成其他数字字符时,需要修正的场景,例如证件识别场景(例如身份证号的数字字符识别结果错误),医疗信息识别场景(例如药品批号的数字字符识别结果错误),保险信息识别场景(例如保险订单号的数字字符识别结果错误)等。
本发明提供的一种数字字符识别结果的修正方法、装置、存储介质及设备,可首先获取数字字符识别结果以及数字字符识别结果对应的约束条件;然后在利用约束条件判断数字字符识别结果出错时,获取数字字符识别结果中每一位数字字符对应的相似数字字符;最后利用相似数字字符替换对应的数字字符,得到符合约束条件的目标数字字符修正结果。通过本发明中的技术方案,使用相似数字字符替换,相比于使用0-9这10个数字字符进行逐个以及全部的替换,极大的减少了替换的工作量,提高了效率,也提高了对数字字符识别结果进行修正的准确率。
进一步的,作为图1和图2所示方法的具体实现,本发明实施例提供了一种数字字符识别结果的修正装置,如图3所示,该装置包括:获取模块31、判断模块32、修正模块33;
获取模块31,可用于获取数字字符识别结果以及所述数字字符识别结果对应的约束条件;
判断模块32,可用于在利用所述约束条件判断所述数字字符识别结果出错时,获取所述数字字符识别结果中每一位数字字符对应的相似数字字符;
修正模块33,可用于利用所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果。
相应的,为了利用所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果,修正模块33具体可包括:确定单元331、替换单元332;
确定单元331,用于确定所述约束条件的约束类型,其中,所述约束类型包括大于第一预设值、小于第二预设值、大于所述第一预设值且小于所述第二预设值;
替换单元332,用于根据所述约束类型确定替换规则,利用所述替换规则与所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果。
相应的,为了根据所述约束类型确定替换规则,利用所述替换规则与所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果,替换单元332,具体可用于若所述约束类型是大于所述第一预设值,则确定所述第一预设值的每一位第一目标数字字符,选择所述数字字符对应的所述相似数字字符中大于等于对应位的所述第一目标数字字符的第一最小相似数字字符,利用所述第一最小相似数字字符替换同一位的所述数字字符,得到第一数字字符修正结果;若所述第一数字字符修正结果大于所述第一预设值,则将所述第一数字字符修正结果作为最小目标数字字符修正结果;若所述第一数字字符修正结果等于所述第一预设值,则确定所述第一数字字符修正结果的第一最低位数字字符以及所述数字字符识别结果中的最低位数字字符,判断所述最低位数字字符对应的所述相似数字字符中是否存在大于对应位的所述第一最小相似数字字符的第二最小相似数字字符,若是,则利用所述第二最小相似数字字符替换所述第一最低位数字字符,得到最小目标数字字符修正结果,若否,则对所述第一数字字符修正结果逐步进行进位操作,直到得到所述最小目标数字字符修正结果;根据所述最小目标数字字符修正结果以及所述数字字符对应的所述相似数字字符,得到大于所述第一预设值的目标数字字符修正结果。
相应的,为了根据所述约束类型确定替换规则,利用所述替换规则与所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果,替换单元332,具体还可用于若所述约束类型是小于所述第二预设值,则确定所述第二预设值的每一位第二目标数字字符,选择所述数字字符对应的所述相似数字字符中小于等于对应位的所述第二目标数字字符的第一最大相似数字字符,利用所述第一最大相似数字字符替换同一位的所述数字字符,得到第二数字字符修正结果;若所述第二数字字符修正结果小于所述第二预设值,则将所述第二数字字符修正结果作为最大目标数字字符修正结果;若所述第二数字字符修正结果等于所述第二预设值,则确定所述第二数字字符修正结果的第二最低位数字字符,判断所述最低位数字字符对应的所述相似数字字符中是否存在小于对应位的所述第一最大相似数字字符的第二最大相似数字字符,若是,则利用所述第二最大相似数字字符替换所述第二最低位数字字符,得到最大目标数字字符修正结果,若否,则对所述第二数字字符修正结果逐步进行借位操作,直到得到所述最大目标数字字符修正结果;根据所述最大目标数字字符修正结果以及所述数字字符对应的所述相似数字字符,得到小于所述第二预设值的目标数字字符修正结果。
相应的,为了根据所述约束类型确定替换规则,利用所述替换规则与所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果,替换单元332,具体还可用于若所述约束类型是大于所述第一预设值且小于所述第二预设值;若所述最小目标数字字符修正结果小于所述第二预设值且所述最大目标数字字符修正结果大于所述第一预设值,则根据所述最小目标数字字符修正结果、所述最大目标数字字符修正结果以及所述数字字符对应的所述相似数字字符,得到大于所述第一预设值且小于所述第二预设值的目标数字字符修正结果。
相应的,为了逐步进行进位操作,替换单元332,具体还可用于确定所述数字字符识别结果中的次低位数字字符;判断所述次低位数字字符对应的所述相似数字字符中是否存在大于对应位的所述第一最小相似数字字符的第二最小相似数字字符;若是,则利用所述第二最小相似数字字符替换所述第一数字字符修正结果的第一次低位数字字符,且将所述第一最低位数字字符替换为所述最低位数字字符对应的所述相似数字字符中的最小数;若否,进一步进行进位操作。
相应的,为了逐步进行借位操作,替换单元332,具体还可用于确定所述数字字符识别结果中的次低位数字字符;判断所述次低位数字字符对应的相似数字字符中是否存在小于对应位的所述第一最大相似数字字符的第二最大相似数字字符;若是,则利用所述第二最大相似数字字符替换所述第二数字字符修正结果的第二次低位数字字符,且将所述第二最低位数字字符替换为所述最低位数字字符对应的所述相似数字字符中的最大数;若否,则进一步进行借位操作。
需要说明的是,本实施例提供的一种数字字符识别结果的修正装置所涉及各功能单元的其他相应描述,可以参照图1至图2的对应描述,在此不再赘述。
基于上述如图1至图2所示方法,相应的,本实施例还提供了一种存储介质,存储介质具体可为易失性或非易失性,其上存储有计算机程序,该程序被处理器执行时实现上述如图1至图2所示的数字字符识别结果的修正方法。
基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施场景的方法。
基于上述如图1至图2所示的方法和图3、图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该计算机设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1和图2所示的数字字符识别结果的修正方法。
可选的,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现非易失性存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。
本发明提供的一种数字字符识别结果的修正方法、装置、存储介质及设备,可首先获取数字字符识别结果以及数字字符识别结果对应的约束条件;然后在利用约束条件判断数字字符识别结果出错时,获取数字字符识别结果中每一位数字字符对应的相似数字字符;最后利用相似数字字符替换对应的数字字符,得到符合约束条件的目标数字字符修正结果。通过本发明中的技术方案,使用相似数字字符替换,相比于使用0-9这10个数字字符进行逐个以及全部的替换,极大的减少了替换的工作量,提高了效率,也提高了对数字字符识别结果进行修正的准确率。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本发明所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本发明的几个具体实施场景,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (10)
1.一种数字字符识别结果的修正方法,其特征在于,所述方法包括:
获取数字字符识别结果以及所述数字字符识别结果对应的约束条件;
在利用所述约束条件判断所述数字字符识别结果出错时,获取所述数字字符识别结果中每一位数字字符对应的相似数字字符;
利用所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果。
2.根据权利要求1所述的方法,其特征在于,所述利用所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果,包括:
确定所述约束条件的约束类型,其中,所述约束类型包括大于第一预设值、小于第二预设值、大于所述第一预设值且小于所述第二预设值;
根据所述约束类型确定替换规则,利用所述替换规则与所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述约束类型确定替换规则,利用所述替换规则与所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果,包括:
若所述约束类型是大于所述第一预设值,则确定所述第一预设值的每一位第一目标数字字符,选择所述数字字符对应的所述相似数字字符中大于等于对应位的所述第一目标数字字符的第一最小相似数字字符,利用所述第一最小相似数字字符替换同一位的所述数字字符,得到第一数字字符修正结果;
若所述第一数字字符修正结果大于所述第一预设值,则将所述第一数字字符修正结果作为最小目标数字字符修正结果;
若所述第一数字字符修正结果等于所述第一预设值,则确定所述第一数字字符修正结果的第一最低位数字字符以及所述数字字符识别结果中的最低位数字字符,判断所述最低位数字字符对应的所述相似数字字符中是否存在大于对应位的所述第一最小相似数字字符的第二最小相似数字字符,若是,则利用所述第二最小相似数字字符替换所述第一最低位数字字符,得到最小目标数字字符修正结果,若否,则对所述第一数字字符修正结果逐步进行进位操作,直到得到所述最小目标数字字符修正结果;
根据所述最小目标数字字符修正结果以及所述数字字符对应的所述相似数字字符,得到大于所述第一预设值的目标数字字符修正结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述约束类型确定替换规则,利用所述替换规则与所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果,还包括:
若所述约束类型是小于所述第二预设值,则确定所述第二预设值的每一位第二目标数字字符,选择所述数字字符对应的所述相似数字字符中小于等于对应位的所述第二目标数字字符的第一最大相似数字字符,利用所述第一最大相似数字字符替换同一位的所述数字字符,得到第二数字字符修正结果;
若所述第二数字字符修正结果小于所述第二预设值,则将所述第二数字字符修正结果作为最大目标数字字符修正结果;
若所述第二数字字符修正结果等于所述第二预设值,则确定所述第二数字字符修正结果的第二最低位数字字符,判断所述最低位数字字符对应的所述相似数字字符中是否存在小于对应位的所述第一最大相似数字字符的第二最大相似数字字符,若是,则利用所述第二最大相似数字字符替换所述第二最低位数字字符,得到最大目标数字字符修正结果,若否,则对所述第二数字字符修正结果逐步进行借位操作,直到得到所述最大目标数字字符修正结果;
根据所述最大目标数字字符修正结果以及所述数字字符对应的所述相似数字字符,得到小于所述第二预设值的目标数字字符修正结果。
5.根据权利要求4所述的方法,其特征在于,所述根据所述约束类型确定替换规则,利用所述替换规则与所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果,还包括:
若所述约束类型是大于所述第一预设值且小于所述第二预设值;
若所述最小目标数字字符修正结果小于所述第二预设值且所述最大目标数字字符修正结果大于所述第一预设值,则根据所述最小目标数字字符修正结果、所述最大目标数字字符修正结果以及所述数字字符对应的所述相似数字字符,得到大于所述第一预设值且小于所述第二预设值的目标数字字符修正结果。
6.根据权利要求3所述的方法,其特征在于,所述逐步进行进位操作,包括:
确定所述数字字符识别结果中的次低位数字字符;
判断所述次低位数字字符对应的所述相似数字字符中是否存在大于对应位的所述第一最小相似数字字符的第二最小相似数字字符;
若是,则利用所述第二最小相似数字字符替换所述第一数字字符修正结果的第一次低位数字字符,且将所述第一最低位数字字符替换为所述最低位数字字符对应的所述相似数字字符中的最小数;
若否,进一步进行进位操作。
7.根据权利要求4所述的方法,其特征在于,所述逐步进行借位操作,包括:
确定所述数字字符识别结果中的次低位数字字符;
判断所述次低位数字字符对应的相似数字字符中是否存在小于对应位的所述第一最大相似数字字符的第二最大相似数字字符;
若是,则利用所述第二最大相似数字字符替换所述第二数字字符修正结果的第二次低位数字字符,且将所述第二最低位数字字符替换为所述最低位数字字符对应的所述相似数字字符中的最大数;
若否,则进一步进行借位操作。
8.一种数字字符识别结果的修正装置,其特征在于,所述装置包括:
获取模块,用于获取数字字符识别结果以及所述数字字符识别结果对应的约束条件;
判断模块,用于在利用所述约束条件判断所述数字字符识别结果出错时,获取所述数字字符识别结果中每一位数字字符对应的相似数字字符;
修正模块,用于利用所述相似数字字符替换对应的所述数字字符,得到符合所述约束条件的目标数字字符修正结果。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至7中任一项所述的数字字符识别结果的修正方法。
10.一种计算机设备,包括存储器、处理器以及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7中任一项所述的数字字符识别结果的修正方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310913384.5A CN116935407A (zh) | 2023-07-24 | 2023-07-24 | 数字字符识别结果的修正方法、装置、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310913384.5A CN116935407A (zh) | 2023-07-24 | 2023-07-24 | 数字字符识别结果的修正方法、装置、存储介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116935407A true CN116935407A (zh) | 2023-10-24 |
Family
ID=88376934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310913384.5A Pending CN116935407A (zh) | 2023-07-24 | 2023-07-24 | 数字字符识别结果的修正方法、装置、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116935407A (zh) |
-
2023
- 2023-07-24 CN CN202310913384.5A patent/CN116935407A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10318846B2 (en) | Clustering historical images using a convolutional neural net and labeled data bootstrapping | |
US7889926B2 (en) | Image dictionary creating apparatus, coding apparatus, image dictionary creating method | |
JP6527410B2 (ja) | 文字認識装置、文字認識方法、及びプログラム | |
CN105989333A (zh) | 指纹认证方法、系统及支持指纹认证功能的终端 | |
US10528844B2 (en) | Method and apparatus for distance measurement | |
CN109685805B (zh) | 一种图像分割方法及装置 | |
CN108198083A (zh) | 保单多维度分析实现方法、装置、终端设备及存储介质 | |
CN111210402A (zh) | 人脸图像质量评分方法、装置、计算机设备及存储介质 | |
CN112036304A (zh) | 医疗票据版面识别的方法、装置及计算机设备 | |
JP6606233B2 (ja) | 画像データのリトリーブ方法及び画像データのリトリーブ装置 | |
CN106649210A (zh) | 一种数据转换方法及装置 | |
CN116935407A (zh) | 数字字符识别结果的修正方法、装置、存储介质及设备 | |
CN107077617B (zh) | 指纹提取方法及装置 | |
CN110874387B (zh) | 移动设备识别符共现关系稀疏图的构建方法及装置 | |
CN108961071B (zh) | 自动预测组合业务收益的方法及终端设备 | |
JP7198181B2 (ja) | 通信品質分析システム、通信品質分析方法 | |
CN109766539B (zh) | 标准词库分词方法、装置、设备及计算机可读存储介质 | |
CN110347683B (zh) | 一种数据表合并处理方法及装置 | |
CN113468076A (zh) | 应用程序的异常测试方法、装置、设备及存储介质 | |
JP4865449B2 (ja) | 差分生成装置及び差分適用装置及び差分生成プログラム及び差分適用プログラム及び差分生成適用システム及び差分生成適用方法 | |
CN110751204A (zh) | 数据融合的方法及装置、存储介质和电子装置 | |
EP2657887A1 (en) | Improvements in and relating to data comparison | |
CN110348212A (zh) | 一种基于机器学习的恶意PowerShell命令识别方法 | |
CN112148355B (zh) | 一种基于深度学习的系统差分升级方法及装置 | |
CN109886127B (zh) | 指纹识别方法及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |