CN109086834B - 字符识别方法、装置、电子设备及存储介质 - Google Patents

字符识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN109086834B
CN109086834B CN201810967423.9A CN201810967423A CN109086834B CN 109086834 B CN109086834 B CN 109086834B CN 201810967423 A CN201810967423 A CN 201810967423A CN 109086834 B CN109086834 B CN 109086834B
Authority
CN
China
Prior art keywords
character
character image
client
sample set
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810967423.9A
Other languages
English (en)
Other versions
CN109086834A (zh
Inventor
杨虎
张波
郝学武
杨凯鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201810967423.9A priority Critical patent/CN109086834B/zh
Publication of CN109086834A publication Critical patent/CN109086834A/zh
Priority to CA3052846A priority patent/CA3052846A1/en
Application granted granted Critical
Publication of CN109086834B publication Critical patent/CN109086834B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

本发明的实施例提供了一种字符识别方法、装置、电子设备及存储介质,涉及图像处理技术领域。该方法包括:基于客户端的唯一标识获取与所述唯一标识对应的字符图像以及所述字符图像的标准结果;提取所述字符图像的特征,基于所述字符图像的特征以及所述标准结果生成样本集;基于所述唯一标识向所述客户端推送所述样本集,以使所述客户端通过所述样本集对待识别字符图像进行识别。本发明实施例的技术方案能够避免不同客户端的支付环境不同造成识别率较低的问题。

Description

字符识别方法、装置、电子设备及存储介质
技术领域
本发明涉及图像处理技术领域,具体而言,涉及一种字符识别方法、字符识别装置、电子设备以及计算机可读存储介质。
背景技术
随着互联网技术的发展,支付方式也在不断演进,需要对传统的支付方式进行改造以满足人们对支付的便捷性需求。
目前,在一种技术方案中,为了能够与原有支付客户端兼容,在原有支付客户端上调用Windows应用程序接口截取支付界面上的部分区域例如支付金额区域,采用OCR(Optical Character Recognition,光学字符识别)技术识别该支付金额区域的内容。在该技术方案中,由于不同支付客户端的原有收银软件、操作系统版本、显示器分辨率不同等原因,采用同样的样本库进行识别难以使所有支付客户端都达到较好的识别率。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种字符识别方法、字符识别装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本发明实施例的第一方面,提供了一种字符识别方法,包括:基于客户端的唯一标识获取与所述唯一标识对应的字符图像以及所述字符图像的标准结果;提取所述字符图像的特征,基于所述字符图像的特征以及所述标准结果生成样本集;基于所述唯一标识向所述客户端推送所述样本集,以使所述客户端通过所述样本集对待识别字符图像进行识别。
在本发明的一些实施例中,基于前述方案,基于客户端的唯一标识获取与所述唯一标识对应的字符图像,包括:基于所述客户端的唯一标识获取所述客户端的字符识别率;判断所述字符识别率是否小于预定阈值;若判定小于所述预定阈值,则基于所述客户端的唯一标识获取对应的字符图像。
在本发明的一些实施例中,基于前述方案,所述字符识别方法还包括:基于所述客户端的唯一标识获取与所述唯一标识对应的字符图像的识别结果;基于所述识别结果以及所述标准结果确定所述客户端的所述字符识别率。
在本发明的一些实施例中,基于前述方案,提取所述字符图像的特征,基于所述字符图像的特征以及所述标准结果生成样本集,包括:通过特征提取模型提取所述字符图像中各个字符的特征;确定所述标准结果中与所述各个字符对应的目标字符;将所述目标字符作为所述各个字符的特征的标签;基于所述字符图像中各个字符的特征以及特征的标签生成所述样本集。
在本发明的一些实施例中,基于前述方案,所述字符识别方法还包括:接收所述客户端发送的所述字符图像、所述字符图像的识别结果以及标准结果;在第一存储区域存储所述字符图像;在第二存储区域存储所述字符图像的识别结果以及标准结果。
在本发明的一些实施例中,基于前述方案,所述第一存储区域为目标服务器的图像存储单元,所述第二存储区域为所述目标服务器的关系数据存储单元。
根据本发明实施例的第二方面,提供了另一种字符识别方法,包括:接收目标服务器通过客户端的唯一标识推送的样本集,所述样本集为基于所述客户端发送的字符图像以及所述字符图像的标准结果生成的特征集;获取待识别字符图像,并提取所述待识别字符图像中各个字符的特征向量;将各个字符的特征向量与所述样本集中的特征向量进行匹配;基于匹配结果识别所述待识别字符图像中的字符。
在本发明的一些实施例中,基于前述方案,所述字符识别方法还包括:接收用户输入的所述待识别字符图像的标准结果;将所述待识别字符图像、所述待识别字符图像的识别结果以及所述标准结果发送至所述目标服务器。
根据本发明实施例的第三方面,提供了一种字符识别装置,包括:获取单元,用于基于客户端的唯一标识获取与所述唯一标识对应的字符图像以及所述字符图像的标准结果;样本生成单元,用于提取所述字符图像的特征,基于所述字符图像的特征以及所述标准结果生成样本集;样本推送单元,用于基于所述唯一标识向所述客户端推送所述样本集,以使所述客户端通过所述样本集对待识别字符图像进行识别。
根据本发明实施例的第四方面,提供了一种字符识别装置,包括:样本接收单元,用于接收目标服务器通过客户端的唯一标识推送的样本集,所述样本集为基于所述客户端发送的字符图像以及所述字符图像的标准结果生成的特征集;特征提取单元,用于获取待识别字符图像,并提取所述待识别字符图像中各个字符的特征向量;匹配单元,用于将各个字符的特征向量与所述样本集中的特征向量进行匹配;识别单元,用于基于匹配结果识别所述待识别字符图像中的字符。
根据本发明实施例的第五方面,提供了一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上述第一方面所述的字符识别方法。
根据本发明实施例的第六方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的字符识别方法。
在本发明的一些实施例所提供的技术方案中,一方面,基于客户端的字符图像的特征以及标准结果生成该客户端的样本集,由于针对每个客户端生成对应的样本集,从而能够避免不同客户端的支付环境不同造成识别率较低的问题;另一方面,由于不需要对原有支付系统进行升级改造,能够降低部署成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了根据本发明的一些实施例的字符识别方法的流程示意图;
图2示出了根据本发明的一些实施例的字符识别方法的应用的示意图;
图3示出了根据本发明的一些实施例的设置截图区域的示意图;
图4示出了根据本发明的一些实施例的自动上传截取图像的流程示意图;
图5示出了根据本发明的一些实施例的自动训练样本的流程示意图;
图6示出了根据本发明的一些实施例的特征提取模型的示意图;
图7示出了根据本发明的另一些实施例的字符识别方法的流程示意图;
图8示出了根据本发明的一些实施例的字符识别装置的示意框图;
图9示出了根据本发明的另一些实施例的字符识别装置的示意框图;
图10示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了根据本发明的一些实施例的字符识别方法的流程示意图。在本发明的示例实施例中,虽然下面以该字符识别方法应用于收银系统的服务器端为例进行说明,但是应该理解的是,该字符识别方法也可以应用于车牌识别系统的服务器端,还可以应用于其他适当的字符识别系统的服务器端,本发明对比不进行特殊限定。
参照图1所示,在步骤S110中,基于客户端的唯一标识获取与所述唯一标识对应的字符图像以及所述字符图像的标准结果。
在示例实施例中,客户端可以为商场、超市的收银系统例如收银计算机,客户端的唯一标识为在服务器端设置的各客户端的序列号,通过该序列号能够唯一地识别客户端。字符图像的标准结果为客户端输入的标准结果,若客户端对字符图像准确地识别,则将该识别结果作为字符图像的标准结果;若客户端对字符图像识别错误,则由用户输入该字符图像的标准结果。
服务器端基于客户端的唯一标识在存储区域存储客户端发送的字符图像和字符图像的标准结果,例如以客户端的唯一标识为主键存储客户端发送的字符图像和字符图像的标准结果。
若字符图像较小,则可以直接在数据库中存储字符图像和字符图像的标准结果;若字符图像较大,则可以将字符图像存储在云服务器上,在数据库中存储字符图像在云服务器的存储路径以及字符图像的标准结果。在示例实施例中,基于客户端的唯一标识从服务器端获取与该唯一标识对应的字符图像以及字符图像的标准结果,例如在字符图像存储在云服务器上时,可以根据客户端的唯一标识从数据库中获取字符图像的存储路径和字符图像的标准结果,基于获取的存储路径从云服务器获取对应的字符图像。
在步骤S120中,提取所述字符图像的特征,基于所述字符图像的特征以及所述标准结果生成样本集。
以字符图像为付款金额的图像为例进行说明,可以首先对字符图像进行归一化处理,将归一化后的字符图像按照像素分布进行分割,得到多个单字符即0~9的数字字符,提取分割后的单字符的像素特征,得到各个单字符的特性向量。
进一步地,将字符图像的标准结果中与分割后的单字符对应的字符作为该单字符的标签,基于各单字符的特征向量以及对应的标签形成样本集。例如,设提取的单字符的特征向量为x,设单字符的标签为y,n为字符图像中的字符数量,则样本集可以为{(x1,y1),(x2,y2),…,(xn,yn)}。通过字符图像的特征以及标准结果自动生成样本集,提高了生成样本集的效率,提高了数据处理效率。
在步骤S130中,基于所述唯一标识向所述客户端推送所述样本集,以使所述客户端通过所述样本集对待识别字符图像进行识别。
在一些实施例中,基于客户端的唯一标识获取客户端的网络地址例如IP地址,基于获取的网络地址向客户端推送在步骤S120中生成的样本集。通过针对每个客户端生成对应的样本集,从而能够避免不同客户端的支付环境不同造成识别率较低的问题。
此外,客户端通过该样本集与提取的字符图像的特征进行匹配识别,由于该样本集是基于该客户端的字符图像以及标准结果生成的,从而能够提高客户端的字符识别率。
图2示出了根据本发明的一些实施例的字符识别方法的应用的示意图。
参照图2所示,在步骤S21中,客户端210、212将其唯一标识、截取的字符图像、字符图像的识别结果以及标准结果上传至后台服务器220。
在步骤S22中,后台服务器220将客户端的唯一标识、字符图像的识别结果以及标准结果存储在关系数据库230上,将客户端的唯一标识以及截取的字符图像存储在云服务器240上。
在步骤S23中,根据客户端的唯一标识,从关系数据库230中获取客户端发送的字符图像的识别结果以及标准结果,根据字符图像的识别结果以及标准结果计算客户端的字符识别率即字符识别的准确率。
在步骤S24中,判断客户端的字符识别率是否低于预定识别率,若低于预定识别率,则根据客户端的唯一标识从云服务器240下载低于预定识别率的客户端发送的字符图像,并将下载的字符图像发送至样本训练服务器250。
在步骤S25中,通过特征提取模型例如神经网络模型从与唯一标识对应的字符图像中提取各字符的特征向量,将字符图像的标准结果中的各字符作为提取的特征向量的标签,基于各字符的特征向量以及标签生成新的样本集。
在步骤S26中,基于客户端的唯一标识将通过样本训练服务器250生成的新的样本集推送至后台服务器220。
在步骤S27中,基于客户端的唯一标识将样本训练服务器250生成的新的样本集推送至对应的客户端。
图3示出了根据本发明的一些实施例的设置截图区域的示意图。参照图3所示,在收银软件的支付界面打开后,通过OCR的方式自动地识别应收金额的区域,在识别到应收金额的区域时,在支付界面上区别性显示该区域,接收到用户的确认信息之后,将该区域作为截图区域。由于收银软件每次启动后的支付界面不会改变,所以仅需要设置一次截图区域。
图4示出了根据本发明的一些实施例的自动上传截取图像的流程示意图。
参照图4所示,在客户端210处配置截图区域,在用户支付时截取该截图区域的字符图像,通过样本训练服务器推送的样本集对该字符图像进行识别,例如提取该字符图像中各字符的特征向量,将提取的特征向量与样本集中的特征向量进行匹配,根据匹配结果确定各字符的内容。在识别了截图区域的字符图像之后,向后台服务器220发送截取的字符图像、字符图像的识别结果以及标准结果,该标准结果由用户在识别错误时输入。
在后台服务器220处,将客户端的唯一标识、字符图像的识别结果以及标准结果存储在关系数据库230上,将客户端的唯一标识以及截取的字符图像存储在云服务器240上。在存储完成之后,向客户端210返回存储结果。
图5示出了根据本发明的一些实施例的自动训练样本的流程示意图。
参照图5所示,在进行样本训练之前,根据客户端的唯一标识,从关系数据库230中获取客户端的字符识别率,根据客户端的唯一标识向云服务器发送请求获取字符识别率较低的图像获取请求,云服务器240响应于该图像获取请求基于客户端的唯一标识查找与低于预定识别率的客户端的唯一标识对应的字符图像,并将查找到的字符图像返回至样本训练服务器250。
在样本训练服务器250中,通过特征提取模型例如神经网络模型从与唯一标识对应的字符图像中提取各字符的特征向量,将字符图像的标准结果中的各字符作为提取的特征向量的标签,基于各字符的特征向量以及标签生成新的样本集。然后经后台服务器220向客户端210推送生成的新的训练集,客户端210使用该样本集进行图像识别。
图6示出了根据本发明的一些实施例的特征提取模型的示意图。
参照图6所示,该特征提取模型为卷积神经网络(Convolutional NeuralNetwork,CNN)模型。该CNN模型可以包括输入层、卷积层C1、采样层S2、卷积层C3、采样层S4以及输出层。
在图6中,根据客户端的唯一标识从云服务器上下载与该唯一标识对应的字符图像,将下载的图像经二值化、图像切割处理之后获得单个字符的图像,将单个字符的图像输入到该CNN模型中进行样本训练。
参照图6所示,在输入层输入单个字符的图像即28*28的特征图,通过卷积层C1对该28*28的特征图进行卷积处理,形成6个24*24的特征图;通过采样层S2对分别对6个24*24的特征图进行采样处理,形成6个12*12的特征图;通过卷积层C3对6个12*12的特征图进行卷积处理,生成12个8*8的特征图;再通过采样层S4对该12个8*8的特征图进行采用处理,生成12个4*4的特征图;然后,通过输出层生成12个1*1的特征图,基于该12个1*1的特征图生成输入的单个字符的图像的特征向量。
在CNN模型采用了局部连接(Local Connection)和权值共享(Weight Sharing)的技术特征,可以显著图像处理的参数数量,提高图像处理效率。通过采用局部连接,每个神经元只与上一层的一个局部区域连接,可以减少需要处理的参数,该连接的局部区域的空间大小叫做神经元的感受野(receptive field)。通过采用权值共享,当前层在深度方向上每个通道的神经元都使用同样的权重和偏差,从而能够减少参数数量,例如在局部连接中,每个神经元都对应100个参数,一共1000000个神经元,如果这1000000个神经元的100个参数都是相等的,那么参数数目就变为100。在CNN模型中使用局部连接和权值共享降低了参数量,使训练复杂度大大下降,并减轻了过拟合的风险。
需要说明的是,在示例实施例中,虽然以CNN模型为例描述特征提取模型,但是本发明不限于此,例如特征提取模型还可以为支持向量机模型、模板匹配模型等,这同样在本发明的保护范围内。
图7示出了根据本发明的另一些实施例的字符识别方法的流程示意图,该字符识别方法应用于客户端例如商场、超市的收银系统。
参照图7所示,在步骤S710中,接收目标服务器通过客户端的唯一标识推送的样本集,所述样本集为基于所述客户端发送的字符图像以及所述字符图像的标准结果生成的特征集。
该目标服务器可以为上述的样本训练服务器250或后台服务器220,该样本集为字符图像的各字符的特征向量以及特征向量的标签组成的集合,该标签为字符图像的标准结果中与字符图像的单字符对应的字符。
在步骤S720中,获取待识别字符图像,并提取所述待识别字符图像中各个字符的特征向量。
在示例实施例中,首先对字符图像进行归一化处理,将归一化后的字符图像按照像素分布进行分割,得到多个单字符即0~9的数字字符,提取分割后的单字符的像素特征,得到各个单字符的特性向量。
在步骤S730中,将各个字符的特征向量与所述样本集中的特征向量进行匹配。
在示例实施例中,可以计算各个字符的特征向量与样本集中的特征向量之间的距离,将与字符图像中的字符距离最近的样本集中的特征向量作为匹配到的特性向量。特征向量之间的距离可以为海明距离、欧式距离、余弦距离,但是本发明的示例性实施例中的距离不限于此,例如距离还可以为马氏距离、曼哈顿距离等。
在步骤S740中,基于匹配结果识别所述待识别字符图像中的字符。
得到与字符图像中的字符相匹配的样本集中的特征向量之后,基于与该特征向量的标签确定待识别字符图像的中的字符。例如,匹配得到的特征向量为x1,该特征向量的标签为y1,则待识别字符图像的字符为y1。
进一步地,在一些实施例中,在将待识别字符图像识别错误之后,可以接收用户输入的该待识别字符图像的标准结果;将待识别字符图像、待识别字符图像的识别结果以及标准结果发送至目标服务器。
此外,在本发明的另一些实施例中,还提供了一种字符识别装置。参照图8所示,该字符识别装置800可以包括:获取单元810、样本生成单元820、样本推送单元830。获取单元810用于基于客户端的唯一标识获取与所述唯一标识对应的字符图像以及所述字符图像的标准结果;样本生成单元820用于提取所述字符图像的特征,基于所述字符图像的特征以及所述标准结果生成样本集;样本推送单元830用于基于所述唯一标识向所述客户端推送所述样本集,以使所述客户端通过所述样本集对待识别字符图像进行识别。
在本发明的一些实施例中,基于前述方案,获取单元810包括:字符识别率获取单元,用于基于所述客户端的唯一标识获取所述客户端的字符识别率;判断单元,用于判断所述字符识别率是否小于预定阈值;图像获取单元,用于若判定小于所述预定阈值,则基于所述客户端的唯一标识获取对应的字符图像。
在本发明的一些实施例中,基于前述方案,所述字符识别装置800还包括:识别结果获取单元,用于基于所述客户端的唯一标识获取与所述唯一标识对应的字符图像的识别结果;识别率确定单元,用于基于所述识别结果以及所述标准结果确定所述客户端的所述字符识别率。
在本发明的一些实施例中,基于前述方案,样本生成单元820包括:提取单元,用于通过特征提取模型提取所述字符图像中各个字符的特征;字符确定单元,用于确定所述标准结果中与所述各个字符对应的目标字符;标签生成单元,用于将所述目标字符作为所述各个字符的特征的标签;样本集生成单元,用于基于所述字符图像中各个字符的特征以及特征的标签生成所述样本集。
在本发明的一些实施例中,基于前述方案,所述字符识别装置800还包括:接收单元,用于接收所述客户端发送的所述字符图像、所述字符图像的识别结果以及标准结果;第一存储单元,用于在第一存储区域存储所述字符图像;第二存储单元,用于在第二存储区域存储所述字符图像的识别结果以及标准结果。
在本发明的一些实施例中,基于前述方案,所述第一存储区域为目标服务器的图像存储单元,所述第二存储区域为所述目标服务器的关系数据存储单元。
由于本发明的示例实施例的字符识别装置800的各个功能模块与上述图1中所示的字符识别方法的示例实施例的步骤对应,因此在此不再赘述。
此外,在本发明的另一些实施例中,还提供了一种字符识别装置。参照图9所示,该字符识别装置可以包括:样本接收单元910、特征提取单元920、匹配单元930以及识别单元940。其中,样本接收单元910,用于接收目标服务器通过客户端的唯一标识推送的样本集,所述样本集为基于所述客户端发送的字符图像以及所述字符图像的标准结果生成的特征集;特征提取单元920用于获取待识别字符图像,并提取所述待识别字符图像中各个字符的特征向量;匹配单元930用于将各个字符的特征向量与所述样本集中的特征向量进行匹配;识别单元940用于基于匹配结果识别所述待识别字符图像中的字符。
在本发明的一些实施例中,基于前述方案,所述字符识别装置900还包括:标准结果接收单元,用于接收用户输入的所述待识别字符图像的标准结果;发送单元,用于将所述待识别字符图像、所述待识别字符图像的识别结果以及所述标准结果发送至所述目标服务器。
由于本发明的示例实施例的字符识别装置900的各个功能模块与上述图7的字符识别方法的示例实施例的步骤对应,因此在此不再赘述。
在本发明的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
下面参考图10,其示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。图10示出的电子设备的计算机系统仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图10所示,计算机系统包括中央处理单元(CPU)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从储存部分1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中,还存储有系统操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1007;包括硬盘等的储存部分1008;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入储存部分1008。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的字符识别方法。
例如,所述电子设备可以实现如图1中所示的:基于客户端的唯一标识获取与所述唯一标识对应的字符图像以及所述字符图像的标准结果;提取所述字符图像的特征,基于所述字符图像的特征以及所述标准结果生成样本集;基于所述唯一标识向所述客户端推送所述样本集,以使所述客户端通过所述样本集对待识别字符图像进行识别。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备或装置的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (12)

1.一种字符识别方法,其特征在于,包括:
基于客户端的唯一标识获取与所述唯一标识对应的字符图像以及所述字符图像的标准结果;
提取所述字符图像的特征,基于所述字符图像的特征以及所述标准结果生成样本集;
基于所述唯一标识向所述客户端推送所述样本集,以使所述客户端通过所述样本集对待识别字符图像进行识别。
2.根据权利要求1所述的字符识别方法,其特征在于,基于客户端的唯一标识获取与所述唯一标识对应的字符图像,包括:
基于所述客户端的唯一标识获取所述客户端的字符识别率;
判断所述字符识别率是否小于预定阈值;
若判定小于所述预定阈值,则基于所述客户端的唯一标识获取对应的字符图像。
3.根据权利要求2所述的字符识别方法,其特征在于,所述字符识别方法还包括:
基于所述客户端的唯一标识获取与所述唯一标识对应的字符图像的识别结果;
基于所述识别结果以及所述标准结果确定所述客户端的所述字符识别率。
4.根据权利要求1所述的字符识别方法,其特征在于,提取所述字符图像的特征,基于所述字符图像的特征以及所述标准结果生成样本集,包括:
通过特征提取模型提取所述字符图像中各个字符的特征;
确定所述标准结果中与所述各个字符对应的目标字符;
将所述目标字符作为所述各个字符的特征的标签;
基于所述字符图像中各个字符的特征以及特征的标签生成所述样本集。
5.根据权利要求1所述的字符识别方法,其特征在于,所述字符识别方法还包括:
接收所述客户端发送的所述字符图像、所述字符图像的识别结果以及标准结果;
在第一存储区域存储所述字符图像;
在第二存储区域存储所述字符图像的识别结果以及标准结果。
6.根据权利要求5所述的字符识别方法,其特征在于,所述第一存储区域为目标服务器的图像存储单元,所述第二存储区域为所述目标服务器的关系数据存储单元。
7.一种字符识别方法,其特征在于,包括:
接收目标服务器通过客户端的唯一标识推送的样本集,所述样本集为基于所述客户端发送的字符图像以及所述字符图像的标准结果生成的特征集;
获取待识别字符图像,并提取所述待识别字符图像中各个字符的特征向量;
将各个字符的特征向量与所述样本集中的特征向量进行匹配;
基于匹配结果识别所述待识别字符图像中的字符。
8.根据权利要求7所述的字符识别方法,其特征在于,所述字符识别方法还包括:
接收用户输入的所述待识别字符图像的标准结果;
将所述待识别字符图像、所述待识别字符图像的识别结果以及所述标准结果发送至所述目标服务器。
9.一种字符识别装置,其特征在于,包括:
获取单元,用于基于客户端的唯一标识获取与所述唯一标识对应的字符图像以及所述字符图像的标准结果;
样本生成单元,用于提取所述字符图像的特征,基于所述字符图像的特征以及所述标准结果生成样本集;
样本推送单元,用于基于所述唯一标识向所述客户端推送所述样本集,以使所述客户端通过所述样本集对待识别字符图像进行识别。
10.一种字符识别装置,其特征在于,包括:
样本接收单元,用于接收目标服务器通过客户端的唯一标识推送的样本集,所述样本集为基于所述客户端发送的字符图像以及所述字符图像的标准结果生成的特征集;
特征提取单元,用于获取待识别字符图像,并提取所述待识别字符图像中各个字符的特征向量;
匹配单元,用于将各个字符的特征向量与所述样本集中的特征向量进行匹配;
识别单元,用于基于匹配结果识别所述待识别字符图像中的字符。
11.一种电子设备,其特征在于,包括:
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至8中任一项所述的字符识别方法。
12.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的字符识别方法。
CN201810967423.9A 2018-08-23 2018-08-23 字符识别方法、装置、电子设备及存储介质 Active CN109086834B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810967423.9A CN109086834B (zh) 2018-08-23 2018-08-23 字符识别方法、装置、电子设备及存储介质
CA3052846A CA3052846A1 (en) 2018-08-23 2019-08-23 Character recognition method, device, electronic device and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810967423.9A CN109086834B (zh) 2018-08-23 2018-08-23 字符识别方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN109086834A CN109086834A (zh) 2018-12-25
CN109086834B true CN109086834B (zh) 2021-03-02

Family

ID=64794449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810967423.9A Active CN109086834B (zh) 2018-08-23 2018-08-23 字符识别方法、装置、电子设备及存储介质

Country Status (2)

Country Link
CN (1) CN109086834B (zh)
CA (1) CA3052846A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110399912B (zh) * 2019-07-12 2023-04-07 广东浪潮大数据研究有限公司 一种字符识别的方法、系统、设备及计算机可读存储介质
CN110956133A (zh) * 2019-11-29 2020-04-03 上海眼控科技股份有限公司 单字符文本归一化模型训练方法、文本识别方法及装置
CN111325196A (zh) * 2020-03-05 2020-06-23 上海眼控科技股份有限公司 车架号检测方法、装置、计算机设备和存储介质
CN111507355B (zh) * 2020-04-17 2023-08-22 北京百度网讯科技有限公司 一种字符识别方法、装置、设备和存储介质
CN111639648B (zh) * 2020-05-26 2023-09-19 浙江大华技术股份有限公司 证件识别方法、装置、计算设备和存储介质
CN112529004A (zh) * 2020-12-08 2021-03-19 平安科技(深圳)有限公司 智能图像识别方法、装置、计算机设备及存储介质
CN112508003B (zh) * 2020-12-18 2023-10-13 北京百度网讯科技有限公司 字符识别处理方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060248020A1 (en) * 2001-09-21 2006-11-02 Timothy Robinson System and method for biometric authorization for financial transactions
CN105184084A (zh) * 2015-09-14 2015-12-23 深圳供电局有限公司 一种电力计量自动化终端故障类型预测方法和系统
CN105530265A (zh) * 2016-01-28 2016-04-27 李青山 一种基于频繁项集描述的移动互联网恶意应用检测方法
CN106954207A (zh) * 2017-04-25 2017-07-14 腾讯科技(深圳)有限公司 一种获取目标终端的帐号属性值的方法及装置
CN107025567A (zh) * 2016-02-01 2017-08-08 秒针信息技术有限公司 一种数据处理方法和装置
CN107368827A (zh) * 2017-04-01 2017-11-21 阿里巴巴集团控股有限公司 字符识别方法及装置、用户设备、服务器
CN107861957A (zh) * 2016-09-22 2018-03-30 杭州海康威视数字技术股份有限公司 一种数据分析方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060248020A1 (en) * 2001-09-21 2006-11-02 Timothy Robinson System and method for biometric authorization for financial transactions
CN105184084A (zh) * 2015-09-14 2015-12-23 深圳供电局有限公司 一种电力计量自动化终端故障类型预测方法和系统
CN105530265A (zh) * 2016-01-28 2016-04-27 李青山 一种基于频繁项集描述的移动互联网恶意应用检测方法
CN107025567A (zh) * 2016-02-01 2017-08-08 秒针信息技术有限公司 一种数据处理方法和装置
CN107861957A (zh) * 2016-09-22 2018-03-30 杭州海康威视数字技术股份有限公司 一种数据分析方法及装置
CN107368827A (zh) * 2017-04-01 2017-11-21 阿里巴巴集团控股有限公司 字符识别方法及装置、用户设备、服务器
CN106954207A (zh) * 2017-04-25 2017-07-14 腾讯科技(深圳)有限公司 一种获取目标终端的帐号属性值的方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
An Online Character Recognition System to Convert Grantha Script to Malayalam;Sreeraj.M等;《International Journal ofAdvanced Computer Science and Applications》;20121231;第3卷(第7期);第67-72页 *
Handwritten Chinese text editing and Recognition system;Shusen Zhou等;《Multimedia Tools and Applications》;20140831;第1363-1366页 *
On-Line Handwritten Character Recognition using Kohonen Networks;Sreeraj.M等;《2009 World Congress on Nature & Biologically Inspired Computing》;20100122;第1425-1430页 *
基于Android平台的车牌字符识别系统研究与实现;张舟;《中国优秀硕士学位论文全文数据库 信息科技辑》;20131215(第S2期);I138-996 *
基于Android离线字符识别系统的设计与实现;张倩阳;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180115(第1期);I138-1566 *

Also Published As

Publication number Publication date
CN109086834A (zh) 2018-12-25
CA3052846A1 (en) 2020-02-23

Similar Documents

Publication Publication Date Title
CN109086834B (zh) 字符识别方法、装置、电子设备及存储介质
CN108776787B (zh) 图像处理方法及装置、电子设备、存储介质
US11244435B2 (en) Method and apparatus for generating vehicle damage information
US11392792B2 (en) Method and apparatus for generating vehicle damage information
CN108898186B (zh) 用于提取图像的方法和装置
CN108229419B (zh) 用于聚类图像的方法和装置
EP3893125A1 (en) Method and apparatus for searching video segment, device, medium and computer program product
CN108460365B (zh) 身份认证方法和装置
CN111242119B (zh) 车辆图像的处理方法、装置、电子设备和计算机可读介质
US20180032804A1 (en) Optical character recognition utilizing hashed templates
CN108615006B (zh) 用于输出信息的方法和装置
CN112766284A (zh) 图像识别方法和装置、存储介质和电子设备
WO2024131630A1 (zh) 车牌识别方法、装置、电子设备及存储介质
CN109064464B (zh) 用于检测电池极片毛刺的方法和装置
CN111160410A (zh) 一种物体检测方法和装置
CN110472121A (zh) 名片信息搜索方法、装置、电子设备以及计算机可读存储介质
CN110516717B (zh) 用于生成图像识别模型的方法和装置
CN109902531B (zh) 用户管理方法、装置、介质和电子设备
CN110532304B (zh) 数据处理方法及装置、计算机可读存储介质以及电子设备
CN113869099A (zh) 一种图像处理方法、装置、电子设备和存储介质
WO2020000966A1 (zh) 无线访问接入点信息的生成方法、设备和计算机可读介质
CN110705382A (zh) 基于发票类别的电子发票管理方法、装置、设备及介质
CN115761598B (zh) 一种基于云端业务平台的大数据分析方法及系统
CN116311271B (zh) 文本图像的处理方法及装置
CN117173731B (zh) 一种模型训练的方法、图像处理的方法以及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant