CN111126420B - 一种建立识别模型的方法及装置 - Google Patents
一种建立识别模型的方法及装置 Download PDFInfo
- Publication number
- CN111126420B CN111126420B CN201811278815.0A CN201811278815A CN111126420B CN 111126420 B CN111126420 B CN 111126420B CN 201811278815 A CN201811278815 A CN 201811278815A CN 111126420 B CN111126420 B CN 111126420B
- Authority
- CN
- China
- Prior art keywords
- training
- prediction result
- character
- model
- verification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 156
- 238000012795 verification Methods 0.000 claims description 116
- 238000004590 computer program Methods 0.000 claims description 15
- 238000013527 convolutional neural network Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 102100032202 Cornulin Human genes 0.000 description 1
- 108010023321 Factor VII Proteins 0.000 description 1
- 101000920981 Homo sapiens Cornulin Proteins 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
本文公开了一种建立识别模型的方法及装置,该方法可包括:利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的所述图像样本中包含的字符串;利用预先配置的字符校验规则对所述预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,所述字符校验规则用于对所述预测结果中的所述字符串进行校验;利用所述训练集进行训练,以获得用于图像中字符识别的识别模型。本申请能够大幅减少迭代次数,同时还可有效提升识别模型的识别率。
Description
技术领域
本申请涉及信息处理技术领域,尤其涉及一种建立识别模型的方法及装置。
背景技术
在机器学习领域,利用大量图像样本进行训练,可以获得识别模型,该识别模型能够识别图像中的文本信息。如,通过识别模型可以识别监控图像或照片中的车牌号、建筑物标识、集装箱箱号、证件号码等文本信息。
目前,可通过有监督学习、半监督学习和无监督学习来获得识别模型。其中,无监督学习是利用一组未知类别的图像样本进行训练,以获得满足性能要求的识别模型。而训练识别模型所使用的图像样本是否准确,将直接决定训练过程中的迭代次数以及识别模型的识别率。因此,为确保使用的图像样本相对准确,无监督学习需要先对图像样本进行处理。相关技术中,主要采用人工标定的方式对图像样本进行处理,而人工标定不仅耗费人力,而且错误率高,处理后的图像样本的准确率也较低,这不仅会大幅增加训练识别模型时的迭代次数,而且会直接影响识别模型的识别率。
发明内容
本发明的目的是通过以下技术方案实现的。
一种建立识别模型的方法,包括:
利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的所述图像样本中包含的字符串;
利用预先配置的字符校验规则对所述预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,所述字符校验规则用于对所述预测结果中的所述字符串进行校验;
利用所述训练集进行训练,以获得用于图像中字符识别的识别模型。
其中,所述利用所述训练集进行训练,以获得识别模型,包括:当获得的所述识别模型未满足预设的迭代条件时,利用所述识别模型对所述批量图像样本进行预测,得到新的预测结果;利用所述字符校验规则对所述预测结果进行校验,并以校验通过的所述预测结果所对应的图像样本更新所述训练集;利用更新的所述训练集进行训练,直到训练得到的所述识别模型满足预设的迭代条件。
其中,所述迭代条件为所述识别模型的识别率不低于预先设定的识别率阈值。
其中,所述以校验通过的预测结果所对应的图像样本形成训练集,包括:所述字符校验规则为多个时,对于所述校验通过的预测结果,根据其对应的不同字符校验规则,将其对应的图像样本加入不同的训练集。
其中,所述利用所述训练集进行训练,以获得识别模型,包括:分别利用不同的训练集进行训练,以获得不同字符校验规则对应的识别模型。
一种建立识别模型的装置,包括:
预测模块,用于利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的为所述图像样本中包含的字符串;
校验模块,用于利用预先配置的字符校验规则对所述预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,所述字符校验规则用于对所述预测结果中的所述字符串进行校验;
训练模块,用于利用所述训练集进行训练,以获得用于图像中字符识别的识别模型。
其中,所述预测模块,还用于当获得的所述识别模型未满足预设的迭代条件时,利用所述识别模型对所述批量图像样本进行预测,得到新的预测结果;所述校验模块,还用于利用所述字符校验规则对所述预测结果进行校验,并以校验通过的所述预测结果所对应的图像样本更新所述训练集;所述训练模块,还用于利用更新的所述训练集进行训练,直到训练得到的所述识别模型满足预设的迭代条件。
其中,所述校验模块,具体用于在所述字符校验规则为多个时,对于所述校验通过的预测结果,根据其对应的不同字符校验规则,将其对应的图像样本加入不同的训练集。
其中,所述训练模块,具体用于利用不同的训练集分别进行训练,以获得不同字符校验规则对应的识别模型。
一种建立识别模型的装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算程序时实现上述建立识别模型的方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述建立识别模型的方法。
本发明的优点在于:
针对需要识别图像中有校验功能的字符串(如身份证号码、集装箱箱号、或其他具有一定规则的字符串)的场景,本发明实施例首先对图像样本进行预测得到预测结果,利用字符校验规则对预测结果进行校验,使用通过字符校验规则校验的预测结果所对应的图像样本形成训练集来训练识别模型,如此,在图像样本类别未知的情况下,可通过字符校验规则自动筛选出更符合当前应用场景识别需求的图像样本,无需人工标定,实现了图像样本处理与识别模型训练的全自动化,可在提高图像样本处理效率的同时还提高了训练集的准确率,这不仅可大幅减少迭代次数,有效提升识别模型的训练效率,而且可大幅提高识别模型在相关场景下的识别率。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
附图1示出了根据本发明一实施方式的建立识别模型的方法流程示意图;
附图2示出了根据本发明另一实施方式的建立识别模型的方法流程示意图;
附图3示出了根据本发明另一实施方式的建立识别模型的具体实现流程示意图;
附图4示出了根据本发明一实施方式的建立识别模型的装置的结构示意图;
附图5示出了根据本发明另一实施方式的建立识别模型的装置的结构示意图;
附图6示出了根据本发明另一实施方式的示例性应用场景下建立识别模型的流程示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在图像的文本识别应用中,对于图像中文本内容为具有一定规则的字符串的应用场景较多。相关技术中,识别图像中文本内容时不论其文本具有何种特征均采用统一的方式训练识别模型,且训练识别模型时所采用的图像样本也均使用统一的算法或人工标定的方式进行处理,如此,获得的识别模型在识别图像中不同规则的字符时其识别率必然无法达到最佳。比如,识别图像中的车牌号、集装箱箱号、证件号码等具有不同规则的字符时,如果采用统一的算法或人工标定的方式对图像样本进行处理,所获得识别模型识别率必然无法达到最佳。
中国专利CN201510819927公开了一种基于无监督学习深度学习网络的中文检测方法及系统,该方法包括:使用无监督学习法训练深度卷积神经网络,而后使用该网络对自然图像中的各个候选文字区域进行分类,最后对分类为文字的区域进行文本行聚合,得到文字区域,最后分析文字区域之间的相关性,将相关文字区域聚合成文本行,并用矩形框对文本行加以标定。该方法利用中文字数据集训练深度卷积神经网络,其主要针对中文字进行检测。而对于需要识别图像中具有一定规则的字符的场景,则不适用。
如果能够针对不同规则的字符采用与其规则相适应的方式对图像样本进行处理,那么利用该图像样本训练来获得识别模型,不仅可大幅降低训练过程中的迭代次数,而且可大幅提高识别模型对图像中相应字符的识别率。
根据本发明的实施方式,提出一种建立识别模型的方法,如图1所示,可以包括:
步骤101,利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的所述图像样本中包含的字符串;
步骤102,利用预先配置的字符校验规则对所述预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,所述字符校验规则用于对所述预测结果中的所述字符串进行校验;
步骤103,利用所述训练集进行训练,以获得用于图像中字符识别的识别模型。
本发明实施例中,针对需要识别图像中有校验功能的字符串(如身份证号码、集装箱箱号、或其他具有一定规则的字符串)的场景,首先对图像样本进行预测得到预测结果,利用字符校验规则对预测结果进行校验,使用通过字符校验规则校验的预测结果所对应的图像样本形成训练集来训练识别模型,如此,在图像样本类别未知的情况下,可通过字符校验规则自动筛选出更符合当前应用场景识别需求的图像样本,无需人工标定,实现了图像样本处理与识别模型训练的全自动化,可在提高图像样本处理效率的同时还提高了训练集的准确率,这不仅可大幅减少迭代次数,有效提升识别模型的训练效率,而且可大幅提高识别模型在相关场景下的识别率。
本发明实施例中,所述利用所述训练集进行训练,以获得识别模型,可以包括:当获得的所述识别模型未满足预设的迭代条件时,利用所述识别模型对所述批量图像样本进行预测,得到新的预测结果;利用所述字符校验规则对所述预测结果进行校验,并以校验通过的所述预测结果所对应的图像样本更新所述训练集;利用更新的所述训练集进行训练,直到训练得到的所述识别模型满足预设的迭代条件。本发明实施例的该实施方式中,通过先前得到的识别模型与字符校验规则得到当前训练需要的图像样本,再利用该图像样本来训练得到当前的识别模型,如此,不仅可有效减少迭代次数而且可获得识别率更高的识别模型。
本发明实施例中,迭代条件可以根据实际应用场景的需求、识别模型的精度要求等自由设定。一种实现方式中,所述迭代条件可以为识别模型的识别率不低于预先设定的识别率阈值。除此之外,该迭代条件还可以设置为其他,比如,迭代条件可以为迭代次数不高于预设的迭代次数阈值,再比如,迭代条件可以为:迭代次数不高于预设的迭代次数阈值且识别模型的识别率不低于预先设定的识别率阈值。对于具体的迭代条件,本文不予限制。
本发明实施例中,字符校验规则可以包括一种或多种。具体应用中,可以针对不同类型的字符串配置不同的字符校验规则,字符校验规则与字符串的类型一一对应,如此,通过某个字符校验规则校验的预测结果所对应的图像样本即可应用于相应类型字符串的识别模型的训练。举例来说,对于证件号码、集装箱箱号、车牌号等不同类型字符串,可以分别配置其对应的字符校验规则。一种实现方式中,可以配置各字符校验规则,同时还可配置字符校验规则与字符串类型的映射关系,使得字符串类型与字符校验之间一一对应,以便形成针对不同类型字符串的训练集,进而获得适用于不同类型字符串的识别模型,其中字符串类型可以根据预测结果中的字符串的相关属性信息来确定,比如属性信息可以包括字符串的字符个数,字符串中的字符种类,字符串中的字符的空间排布等信息。除此之外,还可采用其他配置方式,对于字符校验规则的具体配置方式,本文不予限制。
本发明实施例中,还可针对不同类型字符串形成其对应的训练集,以便获得适用于不同类型字符串的识别模型。具体来说,步骤102中,可以所述字符校验规则为多个时,对于所述校验通过的预测结果,根据其对应的不同字符校验规则,将其对应的图像样本加入不同的训练集。一种实现方式中,可以根据校验所述预测结果所使用的字符校验规则对应的字符串类型,对所述预测结果所对应的图像样本进行标记,将标记不同的图像样本加入到不同的训练集中。这里,对图像样本进行标记的方式可以有多种。比如,可以根据在图像样本中加入表示字符串类型的标签,这样,可以将标签相同的图像样本加入同一训练集中,并以该标签对训练集进行标记,以便训练不同的识别模型。实际应用中,除通过该字符串类型标记图像样本及训练集之外,还可通过其他方式标记图像样本及训练集,比如,可以使用字符校验规则标识(比如,编号或标号等)标记图像样本及训练集,对此,本文不予限制。
本发明实施例中,可以采用某类字符串的通用字符校验规则,也可以采用自定义的字符校验规则。
比如,针对需要识别图像中集装箱箱号的应用场景来说,集装箱箱号包括三部分,第一部分由4位英文字母组成,这4位英文字母为公司代码,前三位代码主要说明箱主、经营人,第四位代码说明集装箱的类型。例如,CBHU开头的标准集装箱是表明箱主和经营人为中远集运;第二部分由6位数字组成,是箱体注册码,用于一个集装箱箱体持有的唯一标识;第三部分为校验码,即集装箱箱号的第11位数字,该校验码可以由前4位字母和6位数字经过字符校验规则运算得到。针对需要识别图像中集装箱箱号的应用场景,可以配置如下的字符校验规则:根据预测结果(即通过预测得到的集装箱箱号)中每位代码的对应值与换算关系,将其前10位代码分别转换为代码值,再将前10位的代码值乘积累加后对11取模,将取模的结果与所述预测结果的第11位比较,两者相同则校验结果为合法即校验通过,两者不同则说明校验结果为不合法即校验不通过。这里,每位代码的对应值可以通过如下关系得到:A=10,B=12,C=13,D=14,E=15,F=16,G=17,H=18,I=19,J=20,K=21,L=23,M=24,N=25,O=26,P=27,Q=28,R=29,S=30,T=31,U=32,V=34,W=35,X=36,Y=37,Z=38。代码的换算关系可以为:代码的对应值×2的(N-1)次方,N为代码位数,N=1,2,3………,10。例如:集装箱箱号为CBHU3202732时,第1位代码为C,它的代码值=代码的对应值×2的(1-1)次方=13×1=13。类推第2位代码为B它的代码值=代码的对应值×2的(2-1)次方=12×2=24。
比如,针对需要识别图像中身份证号码的应用场景来说,可以配置如下的字符校验规则:提取预测结果(即通过预测得到的身份证号码)中的本体码(即该预测结果的前17位),将本体码乘以加权因子,计算求和后除以11的余数,在预先配置的检验码表中查询余数对应的检验码,将该校验码与预测结果的第18位比较,相同说明该预测结果的校验结果为合法即校验通过,不同则说明该预测结果的校验结果为不合法即校验不通过。其中,下表1为加权因子表,下表2为校验码表。
位置序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 |
加权因子 | 7 | 9 | 10 | 5 | 8 | 4 | 2 | 1 | 6 | 3 | 7 | 9 | 10 | 5 | 8 | 4 | 2 |
表1
余数 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
校验码 | 1 | 0 | X | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 |
表2
本发明实施例中,步骤103中可以分别利用不同的训练集进行训练,以获得不同字符校验规则对应的识别模型。这里,不同的训练集是指使用不同字符校验规则进行校验而得到的训练集,即对应不同类型字符串的训练集。比如,对应于集装箱箱号、身份证号码这两种类型的字符串,可以得到两种训练集,分别使用这两种训练集进行训练可以获得两种识别模型,这两种识别模型分别用于识别图像中的集装箱箱号和身份证号码。由此可知,本发明实施例可以通过某类字符串的字符校验规则形成训练集,再利用该训练集训练即可得到用于识别图像中该类字符串的识别模型,这不仅可提高此识别模型的识别率,而且无需人工标定,支持海量数据的学习,可达到更好的准确率和泛化能力,即使使用大量含有不同字符串且未知类别的图像样本进行训练,也可获得对某类字符串具有高识别率的识别模型。
根据本发明的实施方式,提出另一种建立识别模型的方法,如图2所示,可以包括:
步骤201,利用预先配置的字符校验规则对批量图像样本的预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集;
步骤202,利用所述训练集进行训练,以获得所述识别模型;
步骤203,判断所述识别模型是否满足预设的迭代条件,满足时则结束,否则返回步骤201,继续迭代。
其中,所述预测结果为所述图像样本包含的字符串。
本发明实施例的此实施方式的一种实现方式中,还可以包括:在首次训练识别模型之前,可以利用预先得到的基准模型对批量图像样本进行预测,得到所述预测结果。本发明实施例的此实施方式的另一种实现方式中,还可以包括:在非首次训练识别模型之前,利用上次得到的识别模型对批量图像样本进行预测,得到所述预测结果。。
此实施方式的其他技术细节可参照上下文,不再赘述。
本发明实施例的一种实现方式中,可以将各类图像样本同时输入基准模型进行预测,得到预测结果,该预测结果即为图像样本中的字符串,将预测结果输入校验模型,校验模型利用预先配置的各字符校验规则分别对所述预测结果进行校验,将通过同一字符校验规则校验的预测结果所对应的图像样本归为一类,并形成相应的训练集,这里,一个训练集包含一类图像样本,一类图像样本是指该图像样本的预测结果符合同一字符校验规则,一条字符校验规则对应一种类型的字符串。这里,校验模型可以配置至少一种字符校验规则及其对应的字符串类型。
本发明实施例的另一种实现方式中,获取包含某一类型字符串的批量图像样本,将该批量图像样本输入基准模型进行预测,得到预测结果,将预测结果输入校验模型,校验模型调用对应该类型字符串的字符校验规则对所述预测结果进行校验,将通过校验的预测结果所对应的图像样本加入训练集,该训练集用于训练适用于上述类型字符串的识别模型。
如图3所示,本发明实施例建立识别模型的示例性执行流程可以包括:
步骤301,构建基准模型算法,并利用已知类别的大量图像样本对所述基准模型算法进行训练,获得能够识别图像中文本内容的基准模型;
实际应用中,基准模型可以是在已知类别的数据集上训练的模型,可以是在公开数据集上、生成样本上训练的模型。基准模型可以适用于一种或多种类型文本的识别,该文本可以是字符串,也可以是文字,还可以是其他类型的文本。基准模型还可以是适用于多种类型字符串的识别模型。对于基准模型的具体适用范围及其类型,本文不予限制,只要该基准模型具备识别图像中文本内容的能力即可。
步骤302,获取批量的、类别未知的新图像样本,该新图像样本包含符合一定字符校验规则的字符串;
步骤303,将所述新图像样本输入所述基准模型进行预测,得到预测结果并输出,该预测结果为所述新图像样本中包含的字符串;
这里,如果新图像样本中包含一种类型的字符串时,那么该预测结果包含一个字符串,如果新图像样本包含多种类型的字符串,那么该预测结果则包含多个字符串。比如,一个新图像样本仅包含集装箱箱号这一种字符串,那么该预测结果则为该集装箱箱号。再比如,一个新图像样本包含集装箱箱号和车牌号两种类型的字符串,那么该预测结果则包含两个字符串,分别为该集装箱箱号和车牌号。
步骤304,将预测结果输入校验模型,校验模型利用预先配置的各字符校验规则对所述预测结果进行校验,如果任一字符校验规则的校验结果为合法则该预测结果校验通过,如果所有字符校验规则的校验结果均为不合法则该预测结果不通过;
步骤305,将新图像样本加入相应的训练集,该相应的训练集与校验预测结果时所使用的字符校验规则对应同一字符串类型。
具体应用中,可以使用校验结果为合法的字符校验规则所对应的字符串类型,为所述新图像样本添加标签,再按照所述新图像样本的标签,将所述新图像样本加入相应的训练集。
步骤306,构建识别模型算法,并利用步骤305得到的训练集对所述识别模型算法进行训练,获得识别模型;
步骤307,验证所述识别模型的识别率是否达到预先设定的识别率阈值,如果是,则结束当前流程,否则继续步骤308;
步骤308,使用当前训练得到的识别模型重新对新图像样本进行预测,得到新的预测结果,该预测结果也为所述新图像样本中包含的字符串,并返回步骤304。
本发明实施例中,基准模型算法与识别模型算法相同。一种实现方式中,基准模型算法和识别模型算法可以为卷积神经网络、卷积循环神经网络。除此之外,基准模型算法和识别模型算法还可以为其他类型,只要具有识别图像中文本内容的功能即可。这里,卷积神经网络(Convolutional Neural Network,CNN)是一种前馈的人工神经网络,其神经元可以响应有限覆盖范围内周围单元,并通过权值共享和特征汇聚,有效提取图像的结构信息。卷积循环神经网络(Convolutional Recurrent Neural Networks,CRNN)是指循环神经网络,可以有效的提取上下文结构信息。
根据本发明的实施方式,提出一种建立识别模型的装置40,如图4所示,可以包括:
预测模块41,用于利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的为所述图像样本中包含的字符串;
校验模块42,用于利用预先配置的字符校验规则对所述预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,所述字符校验规则用于对所述预测结果中的所述字符串进行校验;
训练模块43,用于利用所述训练集进行训练,以获得用于图像中字符识别的识别模型。
本发明实施例的此实施方式中,所述预测模块41,还可用于当获得的所述识别模型未满足预设的迭代条件时,利用所述识别模型对所述批量图像样本进行预测,得到新的预测结果;利用上次的识别模型对所述批量图像样本进行预测,得到预测结果;所述校验模块42,还用于利用所述字符校验规则对所述预测结果进行校验,并以校验通过的所述预测结果所对应的图像样本更新所述训练集;所述训练模块43,还用于利用更新的所述训练集进行训练,直到训练得到的所述识别模型满足预设的迭代条件。一个示例中,所述装置还可包括:迭代控制模块44,用于判断本次的识别模型是否满足预设的迭代条件,在本次识别模型不满足所述迭代条件时通知所述预测模型41利用本次的识别模型重新对所述批量图像样本进行预测,在本次识别模型满足所述迭代条件时则输出本次的识别模型。
本发明实施例的此实施方式中,所述校验模块42,具体可用于在所述字符校验规则为多个时,对于所述校验通过的预测结果,根据其对应的不同字符校验规则,将其对应的图像样本加入不同的训练集。
本发明实施例的此实施方式中,所述训练模块43,具体可用于利用不同的训练集分别进行训练,以获得不同字符校验规则对应的识别模型。
根据本发明的实施方式,提出一种建立识别模型的装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算程序时实现上述图1所示的方法。
根据本发明的实施方式,提出一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如图1所示的方法。
根据本发明的实施方式,提出另一种建立识别模型的装置50,如图5所示,可以包括:
校验模块51,用于利用预先配置的字符校验规则对批量图像样本的预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,
训练模块52,用于利用所述训练集进行训练,以获得识别模型;;
其中,所述预测结果为所述图像样本包含的字符串,通过对所述图像样本进行预测得到。
本发明实施例的此实施方式中,该建立识别模型的装置50还可以包括:预测模块53,用于在尚未获得识别模型时,利用预先得到的基准模型对批量图像样本进行预测,得到所述预测结果。这里,所述预测模块53,还可用于在所述训练模型已获得识别模型时,利用所述训练模型52上次得到的识别模型对批量图像样本进行预测,得到所述预测结果。
本发明实施例的此实施方式中,建立识别模型的装置50还可以包括:迭代控制模块54,可用于判断本次识别模型是否满足预设的迭代条件,在本次识别模型不满足所述迭代条件时通知所述预测模型53利用本次的识别模型重新对所述批量图像样本进行预测,在本次识别模型满足所述迭代条件时则输出本次的识别模型。
本发明实施例的此实施方式中,所述校验模块51,具体可用于在所述字符校验规则为多个时,对于所述校验通过的预测结果,根据其对应的不同字符校验规则,将其对应的图像样本加入不同的训练集中。
本发明实施例的此实施方式中,所述训练模块52,具体可用于分别利用不同的训练集进行训练,以获得不同的识别模型。
根据本发明的实施方式,提出另一种建立识别模型的装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算程序时实现图2所示的方法。
根据本发明的实施方式,提出另一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现图3所示的方法。
需要说明的是,本发明实施例所述建立识别模型的装置中,预测模块、校验模块、训练模块分别可以是软件、硬件或两者的结合。本发明实施例所述各类建立识别模型的装置可通过任何能够实现其功能的计算设备来实现。具体应用中,该计算设备可以是电子设备、服务器或服务器集群,该服务器可以是物理服务器,也可以是云服务器。
下面对本发明实施例的示例性实现方式进行详细说明。需要说明的是,下文实例仅为举例,在实际应用中本发明实施例还可以具有其他实现方式、应用于其他场景。
实例1
本实例对本申请的示例性应用场景进行说明。
该示例性应用场景中,需要建立能够识别集装箱箱号的第一识别模型和能够识别身份证号码的第二识别模型。
如图6所示,此示例性应用场景中建立第一识别模型和第二识别模型的流程可以包括:
步骤601,基于已知类别的大量图像样本训练与卷积神经网络算法进行训练,得到可识别图像中各类文本内容的基准模型;
步骤602,在校验模型中预先配置对应集装箱箱号的第一字符校验规则和对应身份证号码的第二字符校验规则。
步骤603,获取批量图像样本,该图像样本中包含集装箱箱号、身份证号码中之一或多项。
步骤604,将该批量图像样本输入基准模型进行预测,得到批量预测结果,该批量预测结果为基准模型从批量图像样本识别出的字符串(该字符串可能是有效的身份证号码,也可能是无效的身份证号码,还可能是有效的集装箱箱号或无效的集装箱箱号);
步骤605,将批量预测结果输入校验模型进行校验,校验模型分别调用第一字符校验规则与第二校验规则对所述批量预测结果进行校验;
步骤606,以通过第一字符校验规则的预测结果所对应的图像样本形成第一训练集,以通过第二字符校验规则的预测结果所对应的图像样本形成第二训练集;
步骤607,利用第一训练集与卷积神经网络算法进行训练,得到可识别图像中集装箱箱号的第一识别模型;
步骤608,判断第一识别模型的识别率是否达到预先设定的第一识别率阈值,如果是则继续步骤610,否则继续步骤609;
步骤609,利用当前获得的第一识别模型对上述批量图像样本重新进行预测,得到批量预测结果,该批量预测结果为第一识别模型从批量图像样本识别出的字符串(该字符串可能是有效的集装箱箱号,也可能是无效的集装箱箱号),将该批量预测结果输入校验模型重新进行校验,并以通过第一字符校验规则校验的预测结果所对应的图像样本重新形成所述第一训练集,并返回步骤607。
步骤610,利用第二训练集与卷积神经网络算法进行训练,得到可识别图像中身份证号码的第二识别模型;
步骤611,判断第二识别模型的识别率是否达到预先设定的第二识别率阈值,如果是则结束当前流程,否则继续步骤612;
步骤612,利用当前获得的第二识别模型对上述批量图像样本重新进行预测,得到批量预测结果,该批量预测结果为第二识别模型从批量图像样本识别出的字符串(该字符串可能是有效的身份证号码,也可能是无效的身份证号码),将该批量预测结果输入校验模型重新进行校验,并以通过第二字符校验规则校验的预测结果所对应的图像样本重新形成所述第二训练集,并返回步骤610。
需要说明的是,步骤607~步骤612的执行顺序可根据实际需要进行调整,比如,步骤610~步骤612可以在步骤607~步骤609之前执行,也可以与步骤607~步骤609同步执行。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (12)
1.一种建立识别模型的方法,包括:
利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的所述图像样本中包含的字符串;
利用预先配置的字符校验规则对所述预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,所述字符校验规则用于对所述预测结果中的所述字符串进行校验;
利用所述训练集进行训练,以获得用于图像中字符识别的识别模型。
2.根据权利要求1所述的方法,其特征在于,所述利用所述训练集进行训练,以获得识别模型,包括:
当获得的所述识别模型未满足预设的迭代条件时,利用所述识别模型对所述批量图像样本进行预测,得到新的预测结果;
利用所述字符校验规则对所述预测结果进行校验,并以校验通过的所述预测结果所对应的图像样本更新所述训练集;
利用更新的所述训练集进行训练,直到训练得到的所述识别模型满足预设的迭代条件。
3.根据权利要求2所述的方法,其特征在于:所述迭代条件为所述识别模型的识别率不低于预先设定的识别率阈值。
4.根据权利要求1或2所述的方法,其特征在于,所述以校验通过的预测结果所对应的图像样本形成训练集,包括:
所述字符校验规则为多个时,对于所述校验通过的预测结果,根据其对应的不同字符校验规则,将其对应的图像样本加入不同的训练集。
5.根据权利要求4所述的方法,其特征在于,所述利用所述训练集进行训练,以获得识别模型,包括:
分别利用不同的训练集进行训练,以获得不同字符校验规则对应的识别模型。
6.一种建立识别模型的装置,其特征在于,包括:
预测模块,用于利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的为所述图像样本中包含的字符串;
校验模块,用于利用预先配置的字符校验规则对所述预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,所述字符校验规则用于对所述预测结果中的所述字符串进行校验;
训练模块,用于利用所述训练集进行训练,以获得用于图像中字符识别的识别模型。
7.根据权利要求6所述的装置,其特征在于,
所述预测模块,还用于当获得的所述识别模型未满足预设的迭代条件时,利用所述识别模型对所述批量图像样本进行预测,得到新的预测结果;
所述校验模块,还用于利用所述字符校验规则对所述预测结果进行校验,并以校验通过的所述预测结果所对应的图像样本更新所述训练集;
所述训练模块,还用于利用更新的所述训练集进行训练,直到训练得到的所述识别模型满足预设的迭代条件。
8.根据权利要求7所述的装置,其特征在于,
所述装置还包括:迭代控制模块,用于判断本次的识别模型是否满足预设的迭代条件,在本次识别模型不满足所述迭代条件时通知所述预测模型利用本次的识别模型重新对所述批量图像样本进行预测,在本次识别模型满足所述迭代条件时则输出本次的识别模型。
9.根据权利要求7或8所述的装置,其特征在于,所述校验模块,具体用于在所述字符校验规则为多个时,对于所述校验通过的预测结果,根据其对应的不同字符校验规则,将其对应的图像样本加入不同的训练集。
10.根据权利要求9所述的装置,其特征在于,所述训练模块,具体用于利用不同的训练集分别进行训练,以获得不同字符校验规则对应的识别模型。
11.一种建立识别模型的装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算程序时实现如权利要求1至5中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811278815.0A CN111126420B (zh) | 2018-10-30 | 2018-10-30 | 一种建立识别模型的方法及装置 |
PCT/CN2019/113029 WO2020088338A1 (zh) | 2018-10-30 | 2019-10-24 | 一种建立识别模型的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811278815.0A CN111126420B (zh) | 2018-10-30 | 2018-10-30 | 一种建立识别模型的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111126420A CN111126420A (zh) | 2020-05-08 |
CN111126420B true CN111126420B (zh) | 2023-04-25 |
Family
ID=70462531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811278815.0A Active CN111126420B (zh) | 2018-10-30 | 2018-10-30 | 一种建立识别模型的方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111126420B (zh) |
WO (1) | WO2020088338A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111708561B (zh) * | 2020-06-17 | 2024-01-05 | 杭州海康消防科技有限公司 | 算法模型更新系统、方法、装置及电子设备 |
CN112001366B (zh) * | 2020-09-25 | 2024-07-12 | 珠海微渐安防科技有限公司 | 模型训练方法、人脸识别方法、装置、设备和介质 |
CN113486808B (zh) * | 2021-07-08 | 2024-09-13 | 核工业井巷建设集团有限公司 | 一种基于卷积神经网络的配电箱隐患识别方法 |
CN114677578B (zh) * | 2022-03-30 | 2024-09-13 | 腾讯科技(深圳)有限公司 | 确定训练样本数据的方法和装置 |
CN115063798A (zh) * | 2022-07-01 | 2022-09-16 | 中国工商银行股份有限公司 | Ocr识别方法及装置、处理器和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0742547A2 (en) * | 1995-05-10 | 1996-11-13 | Canon Kabushiki Kaisha | Method and apparatus for pattern recognition |
CN101329731A (zh) * | 2008-06-06 | 2008-12-24 | 南开大学 | 图像中数学公式的自动识别方法 |
WO2015003486A1 (zh) * | 2013-07-11 | 2015-01-15 | 广州中智融通金融科技有限公司 | 一种纸币识别分类的方法及系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8224092B2 (en) * | 2008-07-08 | 2012-07-17 | Xerox Corporation | Word detection method and system |
CN104899571B (zh) * | 2015-06-12 | 2018-12-04 | 成都数联铭品科技有限公司 | 一种用于复杂文字识别的随机样本产生方法 |
CN107516096A (zh) * | 2016-06-15 | 2017-12-26 | 阿里巴巴集团控股有限公司 | 一种字符识别方法及装置 |
CN106407976B (zh) * | 2016-08-30 | 2019-11-05 | 百度在线网络技术(北京)有限公司 | 图像字符识别模型生成和竖列字符图像识别方法和装置 |
CN106886778B (zh) * | 2017-04-25 | 2020-02-07 | 福州大学 | 一种监控场景下车牌字符分割与识别方法 |
CN108596180A (zh) * | 2018-04-09 | 2018-09-28 | 深圳市腾讯网络信息技术有限公司 | 图像中的参数识别、参数识别模型的训练方法及装置 |
-
2018
- 2018-10-30 CN CN201811278815.0A patent/CN111126420B/zh active Active
-
2019
- 2019-10-24 WO PCT/CN2019/113029 patent/WO2020088338A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0742547A2 (en) * | 1995-05-10 | 1996-11-13 | Canon Kabushiki Kaisha | Method and apparatus for pattern recognition |
CN101329731A (zh) * | 2008-06-06 | 2008-12-24 | 南开大学 | 图像中数学公式的自动识别方法 |
WO2015003486A1 (zh) * | 2013-07-11 | 2015-01-15 | 广州中智融通金融科技有限公司 | 一种纸币识别分类的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2020088338A1 (zh) | 2020-05-07 |
CN111126420A (zh) | 2020-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111126420B (zh) | 一种建立识别模型的方法及装置 | |
CN111783875A (zh) | 基于聚类分析的异常用户检测方法、装置、设备及介质 | |
CN109978893A (zh) | 图像语义分割网络的训练方法、装置、设备及存储介质 | |
CN110378386B (zh) | 基于有监督的无标记异常识别方法、装置及存储介质 | |
CN107204956B (zh) | 网站识别方法及装置 | |
CN113378899B (zh) | 非正常账号识别方法、装置、设备和存储介质 | |
CN113935033A (zh) | 特征融合的恶意代码家族分类方法、装置和存储介质 | |
CN111107107B (zh) | 网络行为的检测方法、装置、计算机设备和存储介质 | |
CN111062036A (zh) | 恶意软件识别模型构建、识别方法及介质和设备 | |
CN114970694B (zh) | 一种网络安全态势评估方法及其模型训练方法 | |
CN115100739B (zh) | 人机行为检测方法、系统、终端设备及存储介质 | |
CN111783812A (zh) | 违禁图像识别方法、装置和计算机可读存储介质 | |
CN110162973B (zh) | 一种Webshell文件检测方法及装置 | |
CN111783088B (zh) | 一种恶意代码家族聚类方法、装置和计算机设备 | |
CN116541228B (zh) | 显示器的触控响应检测方法、装置以及计算机设备 | |
CN110717037B (zh) | 对用户分类的方法和装置 | |
CN116366303A (zh) | 基于深度学习的网络异常检测方法、装置、设备及介质 | |
CN115622793A (zh) | 一种攻击类型识别方法、装置、电子设备及存储介质 | |
CN117975184A (zh) | 图像识别模型的训练方法及图像识别方法 | |
CN114519416A (zh) | 模型蒸馏方法、装置及电子设备 | |
CN112801214A (zh) | 基于鼠类识别终端与云计算平台交互的老鼠数量预测方法 | |
WO2020194583A1 (ja) | 異常検知装置、制御方法、及びプログラム | |
CN116721441B (zh) | 基于区块链的门禁安全管理方法与系统 | |
CN113347021B (zh) | 一种模型生成方法、撞库检测方法、装置、电子设备及计算机可读存储介质 | |
CN113239128B (zh) | 基于隐式特征的数据对分类方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |