CN110909737A - 图片文字识别方法及系统 - Google Patents
图片文字识别方法及系统 Download PDFInfo
- Publication number
- CN110909737A CN110909737A CN201911116166.9A CN201911116166A CN110909737A CN 110909737 A CN110909737 A CN 110909737A CN 201911116166 A CN201911116166 A CN 201911116166A CN 110909737 A CN110909737 A CN 110909737A
- Authority
- CN
- China
- Prior art keywords
- picture
- recognized
- character recognition
- original
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
本发明实施例提供一种图片文字识别方法及系统。其中,方法包括:获取待处理的每一原始图片的特征码,根据各原始图片的特征码,确定各原始图片中的各待识别图片;将每一待识别图片分别输入至文字识别模型,输出待识别图片中文字的识别结果;其中,文字识别模型是基于样本图片和预先获知的样本图片中的文字进行训练后得到的。本发明实施例提供的图片文字识别方法及系统,根据各原始图片的特征码进行去重,确定各待识别图片,基于通过深度学习获得的文字识别模型,获得每一待识别图片中文字的识别结果,能提高进行海量图片文字识别的准确率和效率。
Description
技术领域
本发明涉及计算机技术领域,更具体地,涉及一种图片文字识别方法及系统。
背景技术
随着4G网络的全面普及以及5G网络投入商用,移动数据网络已成为天然的大数据存储和流动的载体。移动互联网指互联网的技术、平台、商业模式和应用与移动通信技术结合并实践的活动的总称。移动互联网拥有的数据源丰富多样,其中图片的数据量级越来越大,图片中附带的信息量也越来越大。为了能从这些海量图片中提取有用的信息,需要对图片中的文字进行识别,然后转换为半结构化数据存入数据中心,用于提供更全面的数据存储和检索服务。
现有图片文字识别系统都是对单张图片构建的。进行图片文字识别时,主要采用开源的计算机视觉库OpenCV对图片进行预处理,然后进行字符识别。上述方法对数字以及英文的识别效果不错,但是中文的识别效果很差。并且,上述方法对图片的质量要求较高,移动互联网中图片质量参差不齐。因此,现有方法难以适应对移动互联网中的海量图片进行文字识别,如何准确、高效地对移动互联网中的海量图片进行文字识别成为本领域亟待解决的问题。
发明内容
本发明实施例提供一种图片文字识别方法及系统,用以解决或者至少部分地解决现有技术存在的难以准确、高效地进行海量图片文字识别的缺陷。
第一方面,本发明实施例提供一种图片文字识别方法,包括:
获取待处理的每一原始图片的特征码,根据各所述原始图片的特征码,确定各所述原始图片中的各待识别图片;
将每一所述待识别图片分别输入至文字识别模型,输出所述待识别图片中文字的识别结果;
其中,所述文字识别模型是基于样本图片和预先获知的样本图片中的文字进行训练后得到的。
优选地,所述确定各所述原始图片中的各待识别图片之后,还包括:
将所述各待识别图片的特征码批量写入特征码存储集群进行存储。
优选地,所述获取待处理的每一原始图片的特征码,根据各所述原始图片的特征码,确定各所述原始图片中的各待识别图片的具体步骤包括:
获取每一所述原始图片的特征码;
若判断获知所述特征码存储集群已存储的每一特征码,与所述原始图片的特征码不同,则将所述原始图片作为待识别图片。
优选地,将每一所述待识别图片分别输入至文字识别模型,输出所述待识别图片中文字的识别结果的具体步骤包括:
将所述待识别图片输入至所述文字识别模型中的图片特征提取子模型,输出所述待识别图片的特征向量;
将所述特征向量输入至所述文字识别模型中的文本序列提取子模型,输出所述特征向量对应的文本序列;
将所述待识别图片与所述特征向量对应的文本序列进行对齐,获取所述待识别图片中文字的识别结果。
优选地,所述输出所述待识别图片中文字的识别结果之后,还包括:
将所述各待识别图片中文字的识别结果批量写入文本存储集群进行存储。
第二方面,本发明实施例提供一种图片文字识别系统,包括:
图片处理器,用于获取待处理的各原始图片的特征码,根据各所述原始图片的特征码,确定各所述原始图片中的各待识别图片;
文本识别器,用于将每一所述待识别图片分别输入至文字识别模型,输出所述待识别图片中文字的识别结果;
其中,所述文字识别模型是基于样本图片和预先获知的样本图片中的文本进行训练后得到的。
优选地,图片文字识别系统还包括:
特征码存储集群,用于存储所述各待识别图片的特征码;
所述特征码存储集群包括多个远程字典服务器模块。
优选地,图片文字识别系统还包括:
文本存储集群,用于存储所述各待识别图片中文字的识别结果;
所述文本存储集群包括多个弹性搜索模块。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,执行所述程序时实现如第一方面的各种可能的实现方式中任一种可能的实现方式所提供的图片文字识别方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面的各种可能的实现方式中任一种可能的实现方式所提供的图片文字识别方法的步骤。
本发明实施例提供的图片文字识别方法及系统,根据各原始图片的特征码进行去重,确定各待识别图片,基于通过深度学习获得的文字识别模型,获得每一待识别图片中文字的识别结果,能提高进行海量图片文字识别的准确率和效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例提供的图片文字识别方法的流程示意图;
图2为根据本发明实施例提供的图片文字识别系统的结构示意图;
图3为根据本发明实施例提供的图片文字识别系统的结构示意图;
图4为根据本发明实施例提供的图片文字识别系统中图片处理器的工作流程示意图;
图5为根据本发明实施例提供的图片文字识别系统中文本识别器的工作流程示意图;
图6为根据本发明实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了克服现有技术的上述问题,本发明实施例提供一种图片文字识别方法及系统,其发明构思是,针对海量图片,先通过图片去重,得到各待识别图片,基于通过深度学习获得的文字识别模型,对各待识别图片中的文字进行识别,从而能更准确、高效地进行海量图片文字识别。
图1为根据本发明实施例提供的图片文字识别方法的流程示意图。如图1所示,该方法包括:步骤S101、获取待处理的每一原始图片的特征码,根据各原始图片的特征码,确定各原始图片中的各待识别图片。
需要说明的是,本发明实施例的执行主体为图片文字识别系统。本发明实施例提供的图片文字识别方法,适用于对海量图片进行文字识别。优选地,由于移动互联网中存在海量图片,本发明实施例提供的图片文字识别方法,尤其适用于对移动互联网中的图片进行
具体地,可以通过扫描图片目录,获取新增的图片,作为待处理的各原始图片。
移动互联网可以通过单向光闸,将多张图片发送至图片文字识别系统。图片文字识别系统可以初始化第一图片目录,通过扫描第一图片目录,获得待处理图片列表。
遍历待处理图片列表,可以获得待处理的各原始图片。
对每一原始图片进行处理,获取该原始图片的特征码;
特征码,是用于表示图片的字符串。特征码可以用于区分不同的图片。
相同的图片,具有相同的特征码;不同的图片,具有不同的特征码。
由于移动互联网中存在大量相同的图片,对于已经进行过文字识别的图片,不需要再次进行识别,因此,可以根据各原始图片的特征码进行去重,以减少重复的识别工作、提高识别的效率。
可以理解的是,已经进行过文字识别的图片的特征码已经在步骤S101之前获得。
通过比较每一原始图片的特征码与步骤S101之前已经获得的各特征码,可以判断该原始图片中的文字是否已经被识别过。
若该原始图片中的文字没有被识别过,将该原始图片确定为待识别图片,需要在之后的步骤中对该原始图片中的文字进行识别;若该原始图片中的文字已经被识别过,不需要对该原始图片进行识别,该原始图片不作为待识别图片,可以在之前获得的文字识别结果中进行搜索,获得该原始图片的文字识别结果,也可以将该原始图片从待处理图片列表中删除,直接丢弃,不再对该原始图片进行文字识别。
通过判断每一原始图片中的文字是否已经被识别过,可以从各原始图片中筛选出之前没有被识别过的原始图片,作为各待识别图片。
步骤S102、将每一待识别图片分别输入至文字识别模型,输出待识别图片中文字的识别结果。
其中,文字识别模型是基于样本图片和预先获知的样本图片中的文字进行训练后得到的。
需要说明的是,步骤S102之前,可以根据各样本图片和预先获知的每一样本图片中的文字,对基于深度学习方法构建的模型进行训练,获得训练好的文字识别模型。
每一样本图片中的文字,可以通过人工识别获得,将样本图片中的文字作为该样本图片的标签。
可以基于任一种人工神经网络构建文字识别模型。
图片文字识别系统可以初始化第二图片目录,通过扫描第二图片目录,获得待识别图片列表。
遍历待识别图片列表,获得各待识别图片,分别将每一待识别图片分别输入至训练好的文字识别模型,可以获得该待识别图片中文字的识别结果。
基于文字识别模型进行识别,识别结果不受图片质量的影响,从而能在移动互联网中的图片质量参差不齐的情况下,获得准确率更高的图片文字识别结果。
本发明实施例根据各原始图片的特征码进行去重,确定各待识别图片,基于通过深度学习获得的文字识别模型,获得每一待识别图片中文字的识别结果,能提高进行海量图片文字识别的准确率和效率。
基于上述各实施例的内容,确定各原始图片中的各待识别图片之后,还包括:将各待识别图片的特征码批量写入特征码存储集群进行存储。
具体地,确定各原始图片中的各待识别图片之后,将各待识别图片的特征码批量写入特征码存储集群进行存储,以便对新的待处理的原始图片进行去重。
需要说明的是,由于移动互联网中的图片的数量巨大,可以采用分布式的特征码存储集群,对历次确定的待识别图片的特征码进行存储,以保证在图片去重时能更快速得获得已存储的特征码并进行比对,能提高图片去重的效率。
本发明实施例通过将各待识别图片的特征码批量写入特征码存储集群进行存储,能提高特征码的存储的效率和图片去重的效率,从而能提高进行海量图片文字识别的效率。
基于上述各实施例的内容,获取待处理的每一原始图片的特征码,根据各原始图片的特征码,确定各原始图片中的各待识别图片的具体步骤包括:获取每一原始图片的特征码。
具体地,对于每一待处理的原始图片,可以将该原始图片进行二值化,根据二值化的结果,按照像素的位置提取出像素值,获得由0和1组成的字符串,作为该原始图片的特征码。
可以理解的是,对于不同的图片,图片上各像素的像素值不同,特征码也不相同,因此,特征码可以用于区分不同的图片。
若判断获知特征码存储集群已存储的每一特征码,与原始图片的特征码不同,则将原始图片作为待识别图片。
具体地,将该原始图片的特征码,与特征码存储集群已存储的每一特征码进行比对。
若比对结果为特征码存储集群已存储的某一特征码,与该原始图片的特征码相同,即特征码存储集群已存储该原始图片的特征码,说明该原始图片中的文字已经被识别过,该原始图片不作为待识别图片。
若比对结果为特征码存储集群已存储的每一特征码,与该原始图片的特征码均不先相同,即特征码存储集群未存储该原始图片的特征码,说明该原始图片中的文字没有被识别过,将该原始图片确定为待识别图片。
本发明实施例根据各原始图片的特征码进行图片去重,能避免进行重复识别,能提高海量图片文字识别的效率。
基于上述各实施例的内容,将每一待识别图片分别输入至文字识别模型,输出待识别图片中文字的识别结果的具体步骤包括:将待识别图片输入至文字识别模型中的图片特征提取子模型,输出待识别图片的特征向量。
具体地,对于每一待识别图片,先将该待识别图片输入至图片特征提取子模型,获取待识别图片的特征向量。
需要说明的是,文字识别模型包括图片特征提取子模型。训练好的文字识别模型中,图片特征提取子模型也是训练好的。
图片特征提取子模型,可以是基于卷积神经网络(Convolutional NeuralNetworks,CNN)构建的。
例如,可以基于VGG16构建图片特征提取子模型,基于该图片特征提取子模型提取待识别图片的特征,获得待识别图片的特征向量。VGG16是由13个卷积层和3个全连接层叠加而成的卷积神经网络。
待识别图片的特征,包括待识别图片中文字的方向和区域等。
将特征向量输入至文字识别模型图片中的文本序列提取子模型,输出特征向量对应的文本序列。
具体地,获得该待识别图片的特征向量之后,将该待识别图片的特征向量输入至文本序列提取子模型,获取该特征向量对应的文本序列。
需要说明的是,文字识别模型包括文本序列提取子模型。训练好的文字识别模型中,文本序列提取子模型也是训练好的。
文本序列提取子模型,可以是基于循环神经网络(Recurrent Neural Networks,CNN)构建的。
例如,可以基于长短期记忆网络(LSTM,Long Short-Term Memory)构建文本序列提取子模型,基于该文本序列提取子模型,获得待识别图片的特征向量对应的文本序列。
将待识别图片与特征向量对应的文本序列进行对齐,获取待识别图片中文字的识别结果。
具体地,特征向量对应的文本序列中只有文本信息,并不携带某一文字是根据待识别图片中的哪一部分识别出来的信息,因此,需要将待识别图片和该文本序列进行对齐,使得获得的识别结果与待识别图片相对应。
可以通过CTC(Connectionist Temporal Classification,连接时序分类)将待识别图片与特征向量对应的文本序列进行对齐,获得待识别图片中文字的识别结果。
本发明实施例通过对待识别图片输入进行特征提取,获得待识别图片的特征向量,根据特征向量获得特征向量对应的文本序列,将待识别图片与特征向量对应的文本序列进行对齐,获取待识别图片中文字的识别结果,识别结果不受图片质量的影响,能基于通过深度学习获得的文字识别模型,获得准确率更高的图片文字识别结果。
基于上述各实施例的内容,输出待识别图片中文字的识别结果之后,还包括:将各待识别图片中文字的识别结果批量写入文本存储集群进行存储。
具体地,通过步骤S102获得各待识别图片中文字的识别结果之后,可以将各待识别图片中文字的识别结果批量写入文本存储集群进行存储。
需要说明的是,由于移动互联网中的图片的数量巨大,可以采用分布式的文本存储集群,对历次识别获得的识别结果进行存储。
将待识别图片中文字的识别结果批量写入文本存储集群进行存储之后,还包括:接收携带有目标文本的搜索指令;根据目标文本搜索文本存储集群,获取目标文本对应的图片的信息;根据目标文本对应的图片的信息,获取目标文本对应的图片。
将待识别图片中文字的识别结果写入分布式的文本存储集群进行存储,便于之后根据输入的目标文本,可以更方便、快速地搜索到与目标文本对应的图片。
本发明实施例通过将各待识别图片中文字的识别结果批量写入文本存储集群进行存储,能更快地获得图片搜索结果。
图2为根据本发明实施例提供的图片文字识别系统的结构示意图。基于上述各实施例的内容,如图2所示,该系统包括图片处理器201和文本识别器202,其中:
图片处理器201,用于获取待处理的各原始图片的特征码,根据各所述原始图片的特征码,确定各所述原始图片中的各待识别图片;
文本识别器202,用于将每一所述待识别图片分别输入至文字识别模型,输出所述待识别图片中文字的识别结果;
其中,所述文字识别模型是基于样本图片和预先获知的样本图片中的文本进行训练后得到的。
具体地,图片处理器201与文本识别器202电连接。
图片处理器201可以通过扫描图片目录,获取新增的图片,作为待处理的各原始图片;对每一原始图片进行处理,获取该原始图片的特征码;通过比较每一原始图片的特征码与之前已经获得的各特征码,判断每一原始图片中的文字是否已经被识别过,从各原始图片中筛选出之前没有被识别过的原始图片,作为各待识别图片。
文本识别器202遍历待识别图片列表,获得各待识别图片,分别将每一待识别图片分别输入至训练好的文字识别模型,可以获得该待识别图片中文字的识别结果。
本发明实施例提供的图片文字识别系统,用于执行本发明上述各实施例提供的图片文字识别方法,该图片文字识别系统包括的各模块实现相应功能的具体方法和流程详见上述图片文字识别方法的实施例,此处不再赘述。
该图片文字识别系统用于前述各实施例的图片文字识别方法。因此,在前述各实施例中的图片文字识别方法中的描述和定义,可以用于本发明实施例中各执行模块的理解。
本发明实施例根据各原始图片的特征码进行去重,确定各待识别图片,基于通过深度学习获得的文字识别模型,获得每一待识别图片中文字的识别结果,能提高进行海量图片文字识别的准确率和效率。
图3为根据本发明实施例提供的图片文字识别系统的结构示意图。基于上述各实施例的内容,如图3所示,图片文字识别系统还包括:特征码存储集群203,用于存储各待识别图片的特征码;特征码存储集群203包括多个远程字典服务器模块2031。
具体地,特征码存储集群203与图片处理器201电连接。
特征码存储集群203可以为分布式数据库,例如Redis(Remote DictionaryServer,远程字典服务器)集群。
特征码存储集群203包括第1个Redis节点、第2个Redis节点、……、第N个Redis节点,N为自然数。每一Redis节点,均为远程字典服务器模块2031。每一Redis节点,可以是安装有Redis内存数据库的Linux服务器。
特征码存储集群203所包括的远程字典服务器模块2031的数量,可以根据实际情况选择,本发明实施例对此不作具体限制。
本发明实施例通过多个远程字典服务器模块的特征码存储集群存储各待识别图片的特征码,能提高特征码的存储的效率和图片去重的效率,从而能提高进行海量图片文字识别的效率。进一步地,使得图片文字识别系统具备图片数据存储的容灾性和水平扩展性。
基于上述各实施例的内容,如图3所示,图片文字识别系统还包括:文本存储集群204,用于存储各待识别图片中文字的识别结果;文本存储集群204包括多个弹性搜索模块2041。
具体地,文本存储集群204与文本识别器202电连接。
文本存储集群204可以为分布式数据库。
文本存储集群204包括第1个ES节点、第2个ES节点、……、第P个ES节点,P为自然数。每一ES节点,均为弹性搜索(ES,ElasticSearch)模块2041。每一ES节点,可以是安装有ElasticSearch开源全文索引库的Linux服务器。
文本存储集群204所包括的弹性搜索模块2041的数量,可以根据实际情况选择,本发明实施例对此不作具体限制。
本发明实施例通过将各待识别图片中文字的识别结果批量写入文本存储集群进行存储,能更快地获得图片搜索结果。进一步地,使得图片文字识别系统具备图片搜索的容灾性和水平扩展性。
为了便于对本发明上述各实施例的理解,下面对图3提供的图片文字识别系统及其工作流程进行具体说明。
如图3所示,该文字识别系统包括图片处理器201、文本识别器202、特征码存储集群203和文本存储集群204。
图片处理器201包括特征码提取模块2011、特征码比对模块2012和特征码入库模块2013。
特征码提取模块2011与特征码比对模块2012电连接;特征码比对模块2012与特征码入库模块2013。
特征码提取模块2011,用于获取每一原始图片的特征码。
特征码比对模块2012,用于若判断获知特征码存储集群已存储的每一特征码,与原始图片的特征码不同,则将原始图片作为待识别图片。
特征码入库模块2013,用于将各待识别图片的特征码批量写入特征码存储集群进行存储。
图片处理器201还可以包括发送模块(图3中未示出),用于将各待识别图片发送至文本识别器202。
文本识别器202包括图片特征提取模块2021、文本序列提取模块2022和文本序列汇总模块2023。
图片特征提取模块2021与、文本序列提取模块2022电连接;、文本序列提取模块2022与文本序列汇总模块2023。
图片特征提取模块2021,用于将待识别图片输入至文字识别模型中的图片特征提取子模型,输出待识别图片的特征向量。
文本序列提取模块2022,用于将特征向量输入至文字识别模型图片中的文本序列提取子模型,输出特征向量对应的文本序列。
文本序列汇总模块2023,用于将待识别图片与特征向量对应的文本序列进行对齐,获取待识别图片中文字的识别结果。
图4为根据本发明实施例提供的图片文字识别系统中图片处理器的工作流程示意图。
如图4所示,图片处理器201的工作流程包括:
步骤401、图片处理器初始化,扫描图片目录(具体为第一图片目录);
步骤402、获取图片列表(具体为待处理图片列表);
步骤403、遍历图片列表,计算该图片列表中每一原始图片的特征码;
步骤404、判断Redis集群中是否有该特征码;是,则执行步骤47;否,则执行步骤45;
步骤405、特征码入库,将该特征码写入Redis集群;
步骤406、图片移至下一个目录,将该原始图片移至第二图片目录;
步骤407、删除图片文件,从待处理图片列表中删除该原始图片;
步骤408、等待下一次扫描。
图5为根据本发明实施例提供的图片文字识别系统中文本识别器的工作流程示意图。
如图5所示,文本识别器202的工作流程包括:
步骤501、文本识别器初始化,扫描图片目录(具体为第二图片目录);
步骤502、获取图片列表(具体为待识别图片列表);
步骤503、遍历图片列表,获取每一待识别图片;
步骤504、使用CNN(如VGG16)对该待识别图片进行特征提取,获取特征向量;
步骤505、将提取的图片特征向量送入RNN(如LSTM),进行文本序列提取,获取该特征向量对应的文本序列;
步骤506、通过CTC汇总,将该待识别图片与该文本序列进行对齐,得出识别结果;
步骤507、等待下一次扫描。
图6为根据本发明实施例提供的电子设备的实体结构示意图。基于上述实施例的内容,如图6所示,该电子设备可以包括:处理器(processor)601、存储器(memory)602和总线603;其中,处理器601和存储器602通过总线603完成相互间的通信;处理器601用于调用存储在存储器602中并可在处理器601上运行的计算机程序指令,以执行上述各方法实施例所提供的图片文字识别方法,例如包括:获取待处理的每一原始图片的特征码,根据各原始图片的特征码,确定各原始图片中的各待识别图片;将每一待识别图片分别输入至文字识别模型,输出待识别图片中文字的识别结果;其中,文字识别模型是基于样本图片和预先获知的样本图片中的文字进行训练后得到的。
本发明另一实施例公开一种计算机程序产品,计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的图片文字识别方法,例如包括:获取待处理的每一原始图片的特征码,根据各原始图片的特征码,确定各原始图片中的各待识别图片;将每一待识别图片分别输入至文字识别模型,输出待识别图片中文字的识别结果;其中,文字识别模型是基于样本图片和预先获知的样本图片中的文字进行训练后得到的。
此外,上述的存储器602中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明另一实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的图片文字识别方法,例如包括:获取待处理的每一原始图片的特征码,根据各原始图片的特征码,确定各原始图片中的各待识别图片;将每一待识别图片分别输入至文字识别模型,输出待识别图片中文字的识别结果;其中,文字识别模型是基于样本图片和预先获知的样本图片中的文字进行训练后得到的。
以上所描述的系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行上述各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种图片文字识别方法,其特征在于,包括:
获取待处理的每一原始图片的特征码,根据各所述原始图片的特征码,确定各所述原始图片中的各待识别图片;
将每一所述待识别图片分别输入至文字识别模型,输出所述待识别图片中文字的识别结果;
其中,所述文字识别模型是基于样本图片和预先获知的样本图片中的文字进行训练后得到的。
2.根据权利要求1所述的图片文字识别方法,其特征在于,所述确定各所述原始图片中的各待识别图片之后,还包括:
将所述各待识别图片的特征码批量写入特征码存储集群进行存储。
3.根据权利要求2所述的图片文字识别方法,其特征在于,所述获取待处理的每一原始图片的特征码,根据各所述原始图片的特征码,确定各所述原始图片中的各待识别图片的具体步骤包括:
获取每一所述原始图片的特征码;
若判断获知所述特征码存储集群已存储的每一特征码,与所述原始图片的特征码不同,则将所述原始图片作为待识别图片。
4.根据权利要求1所述的图片文字识别方法,其特征在于,将每一所述待识别图片分别输入至文字识别模型,输出所述待识别图片中文字的识别结果的具体步骤包括:
将所述待识别图片输入至所述文字识别模型中的图片特征提取子模型,输出所述待识别图片的特征向量;
将所述特征向量输入至所述文字识别模型中的文本序列提取子模型,输出所述特征向量对应的文本序列;
将所述待识别图片与所述特征向量对应的文本序列进行对齐,获取所述待识别图片中文字的识别结果。
5.根据权利要求1至4任一所述的图片文字识别方法,其特征在于,所述输出所述待识别图片中文字的识别结果之后,还包括:
将所述各待识别图片中文字的识别结果批量写入文本存储集群进行存储。
6.一种图片文字识别系统,其特征在于,包括:
图片处理器,用于获取待处理的各原始图片的特征码,根据各所述原始图片的特征码,确定各所述原始图片中的各待识别图片;
文本识别器,用于将每一所述待识别图片分别输入至文字识别模型,输出所述待识别图片中文字的识别结果;
其中,所述文字识别模型是基于样本图片和预先获知的样本图片中的文本进行训练后得到的。
7.根据权利要求6所述的图片文字识别系统,其特征在于,还包括:
特征码存储集群,用于存储所述各待识别图片的特征码;
所述特征码存储集群包括多个远程字典服务器模块。
8.根据权利要求6或7所述的图片文字识别系统,其特征在于,还包括:
文本存储集群,用于存储所述各待识别图片中文字的识别结果;
所述文本存储集群包括多个弹性搜索模块。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一所述的图片文字识别方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至5任一所述的图片文字识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911116166.9A CN110909737A (zh) | 2019-11-14 | 2019-11-14 | 图片文字识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911116166.9A CN110909737A (zh) | 2019-11-14 | 2019-11-14 | 图片文字识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110909737A true CN110909737A (zh) | 2020-03-24 |
Family
ID=69816517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911116166.9A Pending CN110909737A (zh) | 2019-11-14 | 2019-11-14 | 图片文字识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110909737A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783066A (zh) * | 2020-07-07 | 2020-10-16 | 中国联合网络通信集团有限公司 | 文字识别方法、系统、计算机设备及存储介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101626397A (zh) * | 2008-07-11 | 2010-01-13 | 宝利微电子系统控股公司 | 基于Bittorrent协议下载文件的系统 |
CN102547794A (zh) * | 2012-01-12 | 2012-07-04 | 郑州金惠计算机系统工程有限公司 | Wap手机传媒色情图像、视频及不良内容的识别监管平台 |
US20130051460A1 (en) * | 2010-05-12 | 2013-02-28 | Nippon Telegraph And Telephone Corporation | Code amount control method and apparatus |
CN105138245A (zh) * | 2015-09-30 | 2015-12-09 | 北京奇虎科技有限公司 | 一种智能终端截屏图片的去重处理方法和装置 |
CN106484877A (zh) * | 2016-10-14 | 2017-03-08 | 东北大学 | 一种基于hdfs的文件检索系统 |
CN107018152A (zh) * | 2017-05-27 | 2017-08-04 | 北京奇虎科技有限公司 | 消息拦截方法、装置和电子设备 |
CN108205674A (zh) * | 2017-12-22 | 2018-06-26 | 广州爱美互动网络科技有限公司 | 社交app的内容识别方法、电子设备、存储介质及系统 |
CN108509437A (zh) * | 2017-02-24 | 2018-09-07 | 南京烽火星空通信发展有限公司 | 一种ElasticSearch查询加速方法 |
CN109492643A (zh) * | 2018-10-11 | 2019-03-19 | 平安科技(深圳)有限公司 | 基于ocr的证件识别方法、装置、计算机设备及存储介质 |
CN109492206A (zh) * | 2018-10-10 | 2019-03-19 | 深圳市容会科技有限公司 | Ppt演示文档录制方法、装置、计算机设备和存储介质 |
CN109859053A (zh) * | 2018-11-08 | 2019-06-07 | 平安科技(深圳)有限公司 | 图像查重的方法、装置、计算机设备及存储介质 |
CN109992689A (zh) * | 2019-03-26 | 2019-07-09 | 华为技术有限公司 | 搜索方法、终端及介质 |
CN110059694A (zh) * | 2019-04-19 | 2019-07-26 | 山东大学 | 电力行业复杂场景下的文字数据的智能识别方法 |
CN110446088A (zh) * | 2018-05-03 | 2019-11-12 | 尼尔森网联媒介数据服务有限公司 | 电视的媒体信息识别方法、交互方法及设备 |
-
2019
- 2019-11-14 CN CN201911116166.9A patent/CN110909737A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101626397A (zh) * | 2008-07-11 | 2010-01-13 | 宝利微电子系统控股公司 | 基于Bittorrent协议下载文件的系统 |
US20130051460A1 (en) * | 2010-05-12 | 2013-02-28 | Nippon Telegraph And Telephone Corporation | Code amount control method and apparatus |
CN102547794A (zh) * | 2012-01-12 | 2012-07-04 | 郑州金惠计算机系统工程有限公司 | Wap手机传媒色情图像、视频及不良内容的识别监管平台 |
CN105138245A (zh) * | 2015-09-30 | 2015-12-09 | 北京奇虎科技有限公司 | 一种智能终端截屏图片的去重处理方法和装置 |
CN106484877A (zh) * | 2016-10-14 | 2017-03-08 | 东北大学 | 一种基于hdfs的文件检索系统 |
CN108509437A (zh) * | 2017-02-24 | 2018-09-07 | 南京烽火星空通信发展有限公司 | 一种ElasticSearch查询加速方法 |
CN107018152A (zh) * | 2017-05-27 | 2017-08-04 | 北京奇虎科技有限公司 | 消息拦截方法、装置和电子设备 |
CN108205674A (zh) * | 2017-12-22 | 2018-06-26 | 广州爱美互动网络科技有限公司 | 社交app的内容识别方法、电子设备、存储介质及系统 |
CN110446088A (zh) * | 2018-05-03 | 2019-11-12 | 尼尔森网联媒介数据服务有限公司 | 电视的媒体信息识别方法、交互方法及设备 |
CN109492206A (zh) * | 2018-10-10 | 2019-03-19 | 深圳市容会科技有限公司 | Ppt演示文档录制方法、装置、计算机设备和存储介质 |
CN109492643A (zh) * | 2018-10-11 | 2019-03-19 | 平安科技(深圳)有限公司 | 基于ocr的证件识别方法、装置、计算机设备及存储介质 |
CN109859053A (zh) * | 2018-11-08 | 2019-06-07 | 平安科技(深圳)有限公司 | 图像查重的方法、装置、计算机设备及存储介质 |
CN109992689A (zh) * | 2019-03-26 | 2019-07-09 | 华为技术有限公司 | 搜索方法、终端及介质 |
CN110059694A (zh) * | 2019-04-19 | 2019-07-26 | 山东大学 | 电力行业复杂场景下的文字数据的智能识别方法 |
Non-Patent Citations (2)
Title |
---|
江海涛: "基于运营商网络架构的不良信息监测系统研究与设计", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
王哲: "基于特征码的网页去重算法研究", 《山东广播电视大学学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783066A (zh) * | 2020-07-07 | 2020-10-16 | 中国联合网络通信集团有限公司 | 文字识别方法、系统、计算机设备及存储介质 |
CN111783066B (zh) * | 2020-07-07 | 2023-10-27 | 中国联合网络通信集团有限公司 | 文字识别方法、系统、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109117777B (zh) | 生成信息的方法和装置 | |
CN110674629B (zh) | 标点符号标注模型及其训练方法、设备、存储介质 | |
CN109189767B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN110555372A (zh) | 数据录入方法、装置、设备及存储介质 | |
CN107193974B (zh) | 基于人工智能的地域性信息确定方法和装置 | |
CN111738169B (zh) | 一种基于端对端网络模型的手写公式识别方法 | |
CN113254654B (zh) | 模型训练、文本识别方法、装置、设备和介质 | |
CN111221936B (zh) | 一种信息匹配方法、装置、电子设备及存储介质 | |
CN108734159B (zh) | 一种图像中敏感信息的检测方法及系统 | |
CN110597965A (zh) | 文章的情感极性分析方法、装置、电子设备及存储介质 | |
CN112052687A (zh) | 基于深度可分离卷积的语义特征处理方法、装置及介质 | |
CN112613293A (zh) | 摘要生成方法、装置、电子设备及存储介质 | |
CN110909737A (zh) | 图片文字识别方法及系统 | |
CN111368693A (zh) | 一种身份证信息的识别方法和装置 | |
CN115909357A (zh) | 基于人工智能的目标识别方法、模型训练方法和装置 | |
CN114780757A (zh) | 短媒体标签抽取方法、装置、计算机设备和存储介质 | |
CN114782720A (zh) | 文案的配图确定方法、装置、电子设备、介质及程序产品 | |
CN114706943A (zh) | 意图识别的方法、装置、设备和介质 | |
CN116486419A (zh) | 一种基于孪生卷积神经网络的书法字识别方法 | |
CN111291758B (zh) | 用于识别印章文字的方法和装置 | |
CN114373068A (zh) | 一种行业场景化的ocr模型实现系统、方法及设备 | |
CN109800433B (zh) | 基于邮件二分类模型的建档方法、装置、电子设备及介质 | |
CN113591857A (zh) | 字符图像处理方法、装置及古代汉籍图像的识别方法 | |
CN112507912A (zh) | 一种识别违规图片的方法及装置 | |
CN111311197A (zh) | 差旅数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200324 |
|
RJ01 | Rejection of invention patent application after publication |