CN109858542B - 一种字符识别方法和装置 - Google Patents
一种字符识别方法和装置 Download PDFInfo
- Publication number
- CN109858542B CN109858542B CN201910071756.8A CN201910071756A CN109858542B CN 109858542 B CN109858542 B CN 109858542B CN 201910071756 A CN201910071756 A CN 201910071756A CN 109858542 B CN109858542 B CN 109858542B
- Authority
- CN
- China
- Prior art keywords
- character
- image
- characters
- character image
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
本申请公开了一种字符识别方法和装置。方法包括:对显示有至少一个字符的第一字符图像进行第一处理,所述第一处理用于改变所述至少一个字符的形态;基于所述第一字符图像中的字符子图像,生成第二字符图像,所述字符子图像为单个字符所占区域的图像;对所述第二字符图像进行第二处理,所述第二处理用于在所述第二字符图像中添加干扰数据;基于所述第二字符图像和所述第二字符图像中的字符子图像所占区域,训练目标检测模型,以以供识别目标字符图像中的字符。可见,本申请通过目标检测模型对字符图像中的字符进行识别,能有效提高字符识别的准确度,为自动化测试过程中的验证码识别提供支持。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种字符识别方法和装置。
背景技术
字符识别是指对物品上印刷的字符、用户界面显示的字符等进行识别的过程。
目前的字符识别方案是利用计算机图像处理技术对显示字符串的图像进行二值、去噪点等处理后,对其中的字符进行分割,然后对单个字符利用OCR技术识别、或者使用深度学习的方式进行识别。但该方案对于字符间存在粘连、存在较粗的干扰线、字符宽度不一致等情况,存在无法对字符进行分割,导致识别成功率较低的问题。
因此,需要提供一种高精度的字符识别方案。
发明内容
本说明书实施例提供一种字符识别方法,用以解决字符识别成功率低的问题。
本说明书实施例还提供一种字符识别方法,包括:
对显示有至少一个字符的第一字符图像进行第一处理,所述第一处理用于改变所述至少一个字符的形态;
基于所述第一字符图像中的字符子图像,生成第二字符图像,所述字符子图像为单个字符所占区域的图像;
对所述第二字符图像进行第二处理,所述第二处理用于在所述第二字符图像中添加干扰数据;
基于所述第二字符图像和所述第二字符图像中的字符子图像所占区域,训练目标检测模型,以供识别目标字符图像中的字符。
本说明书实施例还提供一种字符识别装置,包括:
第一处理模块,用于对显示有至少一个字符的第一字符图像进行第一处理,所述第一处理用于改变所述至少一个字符的形态;
第二处理模块,用于基于所述第一字符图像中的字符子图像,生成第二字符图像,所述字符子图像为单个字符所占区域的图像;
第三处理模块,用于对所述第二字符图像进行第二处理,所述第二处理用于在所述第二字符图像中添加干扰数据;
训练模块,用于基于所述第二字符图像和所述第二字符图像中的字符子图像所占区域,训练目标检测模型,以供识别目标字符图像中的字符。
本说明书实施例还提供一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行上述字符识别方法的步骤。
本说明书实施例还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述字符识别方法的步骤。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过将字符图像及其中的字符子图像作为样本数据来训练目标检测模型,以基于训练完成的目标检测模型识别目标字符图像中的字符。与现有技术中OCR技术识别方案相比,能有效提高字符的识别成功率,为自动化测试过程中的验证码识别提供支持,达到可通过验证码的自动识别,提高自动化测试的适用范围的目的。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本说明书提供的一种应用场景的示意图;
图2为本说明书一实施例提供的一种字符识别方法的流程示意图;
图3为本说明书一实施例提供的识别结果可视化展示的示意图;
图4为本说明书一实施例提供的一种字符识别装置的结构示意图;
图5为本说明书一实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
正如背景技术部分陈述的,目前的字符识别成功率较低。基于此,本发明提供一种字符识别方法,通过将字符图像及其中的字符子图像作为样本数据来训练目标检测模型,以基于训练完成的目标检测模型识别目标字符图像中的字符。与现有技术中OCR技术识别方案相比,能有效提高字符的识别成功率,为自动化测试过程中的验证码识别提供支持,达到可通过验证码的自动识别,提高自动化测试的适用范围的目的。
下面对本发明的应用场景进行示例性说明。
参见图1,在自动化测试的应用场景中,若检测到需要验证验证码的场景,为避免过多的人为干预,限制自动化测试的应用范围,则执行如下步骤:
对用户界面进行截图处理,得到显示有验证码的字符图像;将该字符图像输入至训练完成的目标检测模型中,以识别出其中的验证码,并进行验证;验证通过后,由测试脚本继续进行自动化测试,直至得到测试报告;若验证失败,则刷新当前用户界面,并再次执行上述步骤。
其中,自动化测试是指软件测试的自动化;软件测试是指在预设条件下运行系统或应用程序,以评估运行结果。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图2为本说明书一实施例提供的一种字符识别方法的流程示意图,参见图2,该方法具体可以包括如下步骤:
步骤220、对显示有至少一个字符的第一字符图像进行第一处理,所述第一处理用于改变所述至少一个字符的形态;
其中,至少一个字符可以构成验证码,其可以为表示数据和信息的字母、数字或其他符号;第一处理包括:扭曲处理(例如:保持第一字符图像的四个角和底边不变,上边随机缩放为原长的50%~100%,则对缩放后的上边在原来的长度范围内随机移动)、旋转处理(例如:翻转角度-90度到90度)、变换颜色处理(例如:计算出下述背景图像的颜色范围,选择容易与这些颜色形成对比的颜色做为字符的颜色,以免出现难以辨认的情况)、模糊处理(例如:使用高斯模糊,根据字符图片的宽高,模糊半径从0到宽高平均数的0.1之间随机选择)、变换大小处理(例如:字号大小,随机从6到72之间选择)中的至少一种。
不难理解的是,在步骤220之前,方法还包括:预生成第一字符图像的步骤,该步骤具体可以示例为:
示例1、若所述至少一个字符的数量为1,则确定被选取的1个字符,并将所述字符显示在背景透明的画布中,以得到所述第一字符图像。
其中,所述被选取的1个字符为从字符样本集合中随机选取的。
示例2、若所述至少一个字符的数量为N,N>1,则确定被选取的N个字符,并将所述N个字符分别显示在背景透明的画布的不同图层中,以得到所述第一字符图像。
其中,所述N个字符为从字符样本集合中随机选取的;字符样本集合可以为包括10个数字、25个大小写字母以及符号的集合。
基于示例2,步骤220的一种实现方式可以为:
分别对画布的不同图层随机执行不同变形规则的第一处理,以使各个字符的形态改变不同,为后续模型训练提供多样性的样本数据。例如:对第一图层中的字符1进行变成黄色、尺寸变大等处理,对第二图层中的字符2进行变成绿色、尺寸变小等处理。
进一步地,为避免第一处理的力度多大,导致字符失真,可为第一处理对应的扭曲、颜色、尺寸等各个维度设置范围极值;例如:尺寸不小于人眼可识别的最小尺寸,模糊程度不得超出人眼可识别的模糊阈值等等。
步骤240、基于所述第一字符图像中的字符子图像,生成第二字符图像,所述字符子图像为单个字符所占区域的图像;
不难理解的是,在步骤240之前,方法还包括:预采集字符子图像的步骤,该步骤具体可以示例为:
示例1、在完成预生成第一字符图像步骤的过程中,记录字符显示在画布中的位置信息,以基于位置信息将该字符所占区域从画布中截取出来,生成字符子图像。
其中,位置信息可以为:一组坐标(例如:左上角和右下角的坐标)对应的区域范围。
示例2、在步骤220之后,解析所述第一字符图像的像素数据,确定每个字符边界的非透明像素点;基于所述边界的非透明像素点的位置,确定所述字符所占区域的图像,得到字符子图像。例如:遍历整个字符图像,找到最左、最右、最高、最低四个非透明像素点,并将该四个非透明像素点的位置形成的区域的图像作为该字符所占区域的图像。
基于此,可精确定位字符所占区域的图像,为训练提供精确的样本数据;进一步地,在完成预采集字符子图像的步骤之后,步骤240的一种实现方式可以为:
确定被选取的背景图像,并将所述第一字符图像中的字符子图像置于所述被选取的背景图像中,以得到第二字符图像。具体可以示例为:
从背景图像样本集合中随机选取一背景图像,并将字符子图像粘贴在该背景图像中,形成第二字符图像;记录粘贴的位置信息(例如:粘贴的起始点和字符的宽高),记为该字符子图像在第二字符图像所占区域;重复执行上述步骤220至步骤240,可在该背景图像中粘贴多个字符子图像。可见,显示有多个字符子图像的第二字符图像可以形成验证码图像。
其中,背景图像样本集合包括多张预先准备的背景图像,背景图像可以为现实生活中的一帧图像。
步骤260、对所述第二字符图像进行第二处理,所述第二处理用于在所述第二字符图像中添加干扰数据;
其中,干扰数据可以为随机生成干扰线和干扰点的数据。
步骤280、基于所述第二字符图像和所述第二字符图像中的字符子图像所占区域,训练目标检测模型,以供识别目标字符图像中的字符。其一种实现方式可以为:
记录每个第二字符图像的标识及该第二字符图像中的字符、字符子图像所占区域,以生成标注文本;重复执行上述步骤220至步骤280,得到预定数量的第二字符及其对应的标注文本,作为训练样本集合,并训练目标检测模型。
其中,标注文本的格式优选为VOC格式,以便训练目标检测模型。
进一步地,基于目标检测模型识别字符的步骤的一种实现方式可以为:
步骤S1、基于训练完成的目标检测模型,对所述目标字符图像进行目标检测处理,得到多个备选字符。
步骤S2、基于所述多个备选字符的属性信息,确定所述目标字符图像中的字符。
其中,属性信息包括:字符所占区域和识别可信度。基于此,步骤S2具体可以为:
确定所述多个备选字符中预设数量的目标字符,所述目标字符的识别可信度大于其他字符的识别可信度,即选出识别可信度最高的几个字符;基于每个目标字符的字符所占区域,对所述预设数量的目标字符进行排序,得到所述目标字符图像中的字符。由此,可通过字符的属性信息精确识别字符以及字符的位置。
其中,所述目标字符图像可以为自动化测试过程中在待测用户界面中截取的显示有验证码的图像,相应地,对目标字符进行排序后形成的字符串即为验证码。
假设目标字符图像为显示‘17S5’的验证码图像,则本实现方式具体可以示例为:
首先,识别目标字符图像中的每个字符,得到‘1’对应的备选字符集,‘7’对应的备选字符集,‘S’对应的备选字符集,‘5’对应的备选字符集,以及每个备选字符的属性信息;然后,分别对每个备选字符集中的字符的识别可信度进行排序,生成每个字符对应的序号,以供选出每个备选字符集中识别可信度最高的一个字符,作为‘17S5’对应的字符串;最后,基于选出的每个字符的位置,对字符串进行排序,形成作为识别结果验证码。
进一步地,在识别出验证码后,还可将所述验证码中的每个字符的字符所占区域和识别可信度进行可视化展示,参见图3;其中,序号为1的字符‘1’、序号为7的字符‘7’、序号为5的字符‘S’、序号为6的字符‘5’对应的识别可信度均为99%。
可见,本实施例通过将字符图像及其中的字符子图像作为样本数据来训练目标检测模型,以基于训练完成的目标检测模型识别目标字符图像中的字符。与现有技术中OCR技术识别方案相比,能有效提高字符的识别成功率,为自动化测试过程中的验证码识别提供支持,达到可通过验证码的自动识别,提高自动化测试的适用范围的目的。
对于上述方法实施方式,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施方式并不受所描述的动作顺序的限制,因为依据本发明实施方式,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施方式均属于优选实施方式,所涉及的动作并不一定是本发明实施方式所必须的。
图4为本说明书一实施例提供的一种字符识别装置的结构示意图,参见图4,该装置具体可以包括:第一处理模块41、第二处理模块42、第三处理模块43和训练模块44;其中:
第一处理模块41,用于对显示有至少一个字符的第一字符图像进行第一处理,所述第一处理用于改变所述至少一个字符的形态;
第二处理模块42,用于基于所述第一字符图像中的字符子图像,生成第二字符图像,所述字符子图像为单个字符所占区域的图像;
第三处理模块43,用于对所述第二字符图像进行第二处理,所述第二处理用于在所述第二字符图像中添加干扰数据;
训练模块44,用于基于所述第二字符图像和所述第二字符图像中的字符子图像所占区域,训练目标检测模型,以供识别目标字符图像中的字符。
可选的,所述至少一个字符的数量为1;其中,装置还包括:
第一预处理模块,用于确定被选取的1个字符,所述字符为从字符样本集合中随机选取的;将所述字符显示在背景透明的画布中,得到所述第一字符图像。
可选的,所述至少一个字符的数量为N,N>1;其中,装置还包括:
第二预处理模块,用于确定被选取的N个字符,所述N个字符为从字符样本集合中随机选取的;将所述N个字符分别显示在背景透明的画布的不同图层中,得到所述第一字符图像。
可选的,所述第一处理包括:扭曲处理、变换颜色处理、模糊处理、变换大小处理中的至少一种。
可选的,装置还包括:
位置确定模块,用于解析所述第一字符图像的像素数据,确定每个字符边界的非透明像素点;基于所述边界的非透明像素点的位置,确定所述字符所占区域的图像。
可选的,第二处理模块42,具体用于:
确定被选取的背景图像,所述背景图像为从背景图像样本集合中随机选取的;将所述第一字符图像中的字符子图像置于所述被选取的背景图像中,得到第二字符图像。
可选的,装置还包括:
识别模块,用于基于训练完成的目标检测模型,对所述目标字符图像进行目标检测处理,得到多个备选字符;基于所述多个备选字符的属性信息,确定所述目标字符图像中的字符。
可选的,所述属性信息包括:字符所占区域和识别可信度;其中,识别模块,具体用于:
确定所述多个备选字符中预设数量的目标字符,所述目标字符的识别可信度大于其他字符的识别可信度;基于每个目标字符的字符所占区域,对所述预设数量的目标字符进行排序,得到所述目标字符图像中的字符。
可选的,装置还包括:
展示模块,用于将所述目标字符图像中的每个字符的字符所占区域和识别可信度进行可视化展示。
可见,本实施例通过将字符图像及其中的字符子图像作为样本数据来训练目标检测模型,以基于训练完成的目标检测模型识别目标字符图像中的字符。与现有技术中OCR技术识别方案相比,能有效提高字符的识别成功率,为自动化测试过程中的验证码识别提供支持,达到可通过验证码的自动识别,提高自动化测试的适用范围的目的。另外,对于上述装置实施方式而言,由于其与方法实施方式基本相似,所以描述的比较简单,相关之处参见方法实施方式的部分说明即可。应当注意的是,在本发明的装置的各个部件中,根据其要实现的功能而对其中的部件进行了逻辑划分,但是,本发明不受限于此,可以根据需要对各个部件进行重新划分或者组合。
图5为本说明书一实施例提供的一种电子设备的结构示意图,参见图5,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成字符识别装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
网络接口、处理器和存储器可以通过总线系统相互连接。总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器可能包含高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器。
处理器,用于执行所述存储器存放的程序,并具体执行:
对显示有至少一个字符的第一字符图像进行第一处理,所述第一处理用于改变所述至少一个字符的形态;
基于所述第一字符图像中的字符子图像,生成第二字符图像,所述字符子图像为单个字符所占区域的图像;
对所述第二字符图像进行第二处理,所述第二处理用于在所述第二字符图像中添加干扰数据;
基于所述第二字符图像和所述第二字符图像中的字符子图像所占区域,训练目标检测模型,以供识别目标字符图像中的字符。
上述如本申请图4所示实施例揭示的字符识别装置或管理者(Master)节点执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
字符识别装置还可执行图2的方法,并实现管理者节点执行的方法。
基于相同的发明创造,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行图2对应的实施例提供的字符识别方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (9)
1.一种字符识别方法,其特征在于,包括:
对显示有至少一个字符的第一字符图像进行第一处理,所述第一处理用于改变所述至少一个字符的形态;所述第一字符图像中的所述至少一个字符显示在背景透明的画布中;
基于所述第一字符图像中的字符子图像,生成第二字符图像,所述字符子图像为单个字符所占区域的图像;
对所述第二字符图像进行第二处理,所述第二处理用于在所述第二字符图像中添加干扰数据;
基于所述第二字符图像和所述第二字符图像中的字符子图像所占区域,训练目标检测模型,以供识别目标字符图像中的字符;
所述基于所述第一字符图像中的字符子图像,生成第二字符图像之前,还包括:解析所述第一字符图像的像素数据,确定每个字符边界的非透明像素点;基于所述边界的非透明像素点的位置,确定所述字符所占区域的图像。
2.根据权利要求1所述的方法,其特征在于,所述至少一个字符的数量为1;
其中,在对显示至少一个字符的第一字符图像进行第一处理之前,还包括:
确定被选取的1个字符,所述字符为从字符样本集合中随机选取的;
将所述字符显示在背景透明的画布中,得到所述第一字符图像。
3.根据权利要求1所述的方法,其特征在于,所述至少一个字符的数量为N,N>1;
其中,在对显示至少一个字符的第一字符图像进行第一处理之前,还包括:
确定被选取的N个字符,所述N个字符为从字符样本集合中随机选取的;
将所述N个字符分别显示在背景透明的画布的不同图层中,得到所述第一字符图像。
4.根据权利要求2或3所述的方法,其特征在于,所述第一处理包括:扭曲处理、变换颜色处理、模糊处理、变换大小处理中的至少一种。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第一字符图像中的字符子图像,生成第二字符图像,包括:
确定被选取的背景图像,所述背景图像为从背景图像样本集合中随机选取的;
将所述第一字符图像中的字符子图像置于所述被选取的背景图像中,得到第二字符图像。
6.根据权利要求1所述的方法,其特征在于,还包括:
基于训练完成的目标检测模型,对所述目标字符图像进行目标检测处理,得到多个备选字符;
基于所述多个备选字符的属性信息,确定所述目标字符图像中的字符。
7.根据权利要求6所述的方法,其特征在于,所述属性信息包括:字符所占区域和识别可信度;
其中,基于所述多个备选字符的属性信息,确定所述目标字符图像中的字符,包括:
确定所述多个备选字符中预设数量的目标字符,所述目标字符的识别可信度大于其他字符的识别可信度;
基于每个目标字符的字符所占区域,对所述预设数量的目标字符进行排序,得到所述目标字符图像中的字符。
8.根据权利要求7所述的方法,其特征在于,还包括:
将所述目标字符图像中的每个字符的字符所占区域和识别可信度进行可视化展示。
9.一种字符识别装置,其特征在于,包括:
第一处理模块,用于对显示有至少一个字符的第一字符图像进行第一处理,所述第一处理用于改变所述至少一个字符的形态;所述第一字符图像中的所述至少一个字符显示在背景透明的画布中;
第二处理模块,用于基于所述第一字符图像中的字符子图像,生成第二字符图像,所述字符子图像为单个字符所占区域的图像;
第三处理模块,用于对所述第二字符图像进行第二处理,所述第二处理用于在所述第二字符图像中添加干扰数据;
训练模块,用于基于所述第二字符图像和所述第二字符图像中的字符子图像所占区域,训练目标检测模型,以供识别目标字符图像中的字符;
装置还包括:位置确定模块,用于解析所述第一字符图像的像素数据,确定每个字符边界的非透明像素点;基于所述边界的非透明像素点的位置,确定所述字符所占区域的图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910071756.8A CN109858542B (zh) | 2019-01-25 | 2019-01-25 | 一种字符识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910071756.8A CN109858542B (zh) | 2019-01-25 | 2019-01-25 | 一种字符识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109858542A CN109858542A (zh) | 2019-06-07 |
CN109858542B true CN109858542B (zh) | 2021-03-19 |
Family
ID=66896118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910071756.8A Active CN109858542B (zh) | 2019-01-25 | 2019-01-25 | 一种字符识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109858542B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110246207A (zh) * | 2019-06-13 | 2019-09-17 | 四川长虹电器股份有限公司 | 基于多图层的图形验证码生成方法 |
CN110351094B (zh) * | 2019-07-03 | 2024-03-15 | 平安科技(深圳)有限公司 | 字符验证方法、装置、计算机设备及存储介质 |
CN111178352A (zh) * | 2019-12-13 | 2020-05-19 | 中国建设银行股份有限公司 | 一种验证码字符识别的方法和装置 |
CN112101346A (zh) * | 2020-08-27 | 2020-12-18 | 南方医科大学南方医院 | 一种基于目标检测的验证码识别方法及装置 |
CN115063785B (zh) * | 2022-08-17 | 2023-01-10 | 深圳联友科技有限公司 | 高速公路场景使用目标识别模型定位车牌的方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102208039B (zh) * | 2011-06-01 | 2013-02-20 | 汉王科技股份有限公司 | 一种多语言混合手写文本行的识别方法及装置 |
US9152876B1 (en) * | 2014-03-18 | 2015-10-06 | Xerox Corporation | Methods and systems for efficient handwritten character segmentation |
CN106650721B (zh) * | 2016-12-28 | 2019-08-13 | 吴晓军 | 一种基于卷积神经网络的工业字符识别方法 |
CN107360137A (zh) * | 2017-06-15 | 2017-11-17 | 深圳市牛鼎丰科技有限公司 | 用于验证码识别的神经网络模型的构建方法和装置 |
CN108875722A (zh) * | 2017-12-27 | 2018-11-23 | 北京旷视科技有限公司 | 字符识别与识别模型训练方法、装置和系统及存储介质 |
CN109117845A (zh) * | 2018-08-15 | 2019-01-01 | 广州云测信息技术有限公司 | 一种图像中的对象识别方法及装置 |
CN109117848B (zh) * | 2018-09-07 | 2022-11-18 | 泰康保险集团股份有限公司 | 一种文本行字符识别方法、装置、介质和电子设备 |
CN109255826B (zh) * | 2018-10-11 | 2023-11-21 | 平安科技(深圳)有限公司 | 中文训练图像生成方法、装置、计算机设备及存储介质 |
-
2019
- 2019-01-25 CN CN201910071756.8A patent/CN109858542B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109858542A (zh) | 2019-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109858542B (zh) | 一种字符识别方法和装置 | |
CN109117848B (zh) | 一种文本行字符识别方法、装置、介质和电子设备 | |
CN105868758B (zh) | 图像中文本区域检测方法、装置及电子设备 | |
CN109033772B (zh) | 一种验证信息的输入方法及装置 | |
CN110175609B (zh) | 界面元素检测方法、装置及设备 | |
CN110516514B (zh) | 一种目标检测模型的建模方法和装置 | |
CN109871316A (zh) | 一种控件识别方法和装置 | |
CN110276295A (zh) | 车辆识别号码检测识别方法及设备 | |
CN110135225B (zh) | 样本标注方法及计算机存储介质 | |
CN111210473A (zh) | 手机轮廓定位方法及设备 | |
CN112634201B (zh) | 目标检测方法、装置和电子设备 | |
CN109978044B (zh) | 训练数据生成方法和装置、以及模型的训练方法和装置 | |
CN112446259A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN111507332A (zh) | 车辆vin码检测方法与设备 | |
CN112052907A (zh) | 基于图像边缘信息的目标检测方法、装置及存储介质 | |
CN112347997A (zh) | 一种试题检测识别方法、装置、电子设备及介质 | |
CN113160176B (zh) | 缺陷检测方法和装置 | |
CN112533060B (zh) | 一种视频处理方法及装置 | |
CN113591746A (zh) | 一种文档表格结构检测方法及装置 | |
CN110276347B (zh) | 文本类信息检测识别方法及设备 | |
CN112434585A (zh) | 一种车道线的虚实识别方法、系统、电子设备及存储介质 | |
CN110084117B (zh) | 基于二值图分段投影的文档表格线检测方法、系统 | |
CN110880023A (zh) | 一种检测证件图片的方法及装置 | |
WO2023275887A1 (en) | System and method for automated software testing | |
CN111242116B (zh) | 屏幕定位方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210716 Address after: 100016 no.4301, No.52 Jiuxianqiao hospital, Chaoyang District, Beijing Patentee after: BEIJING TESTIN INFORMATION TECHNOLOGY Co.,Ltd. Address before: Room 2016, building 2, No.8, Fenghuang Third Road, Zhongxin Guangzhou Knowledge City, Guangzhou 510260, Guangdong Province Patentee before: GUANGZHOU TESTIN INFORMATION TECHNOLOGY Co.,Ltd. |
|
TR01 | Transfer of patent right |