CN113313214B - 一种基于多卷积核后验的带水印字符的识别方法及系统 - Google Patents

一种基于多卷积核后验的带水印字符的识别方法及系统 Download PDF

Info

Publication number
CN113313214B
CN113313214B CN202110867428.6A CN202110867428A CN113313214B CN 113313214 B CN113313214 B CN 113313214B CN 202110867428 A CN202110867428 A CN 202110867428A CN 113313214 B CN113313214 B CN 113313214B
Authority
CN
China
Prior art keywords
character
recognized
template
sample
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110867428.6A
Other languages
English (en)
Other versions
CN113313214A (zh
Inventor
胡茂厅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huilang Century Technology Co ltd
Original Assignee
Beijing Huilang Century Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huilang Century Technology Co ltd filed Critical Beijing Huilang Century Technology Co ltd
Priority to CN202110867428.6A priority Critical patent/CN113313214B/zh
Publication of CN113313214A publication Critical patent/CN113313214A/zh
Application granted granted Critical
Publication of CN113313214B publication Critical patent/CN113313214B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明提出了一种基于多卷积核后验的带水印字符的识别方法及系统,涉及字符识别的技术领域,其中,一种基于多卷积核后验的带水印字符的识别方法,包括:获取多个样本字符图像,多个样本字符图像包括一部分带水印的字符图像,基于多个样本字符图像获取多个字符模板;获取待识别字符图像,判断是否存在与待识别字符图像对应的字符模板;若是,将与待识别字符图像对应的字符模板作为目标字符模板,通过多种卷积核对待识别字符图像及目标字符模板进行过滤处理,获取卷积核的过滤结果;基于卷积核的过滤结果识别待识别字符图像,具有提高对带水印的字符图像的识别的精准度的优点。

Description

一种基于多卷积核后验的带水印字符的识别方法及系统
技术领域
本发明涉及字符识别的技术领域,具体而言,涉及一种基于多卷积核后验的带水印字符的识别方法及系统。
背景技术
在数字媒体时代,海量的图片作为重要的信息载体,已经在金融、教育、医疗等多个领域发挥了重要的作用。同时,海量的图片中也会包含有大量的字符信息。
传统的字符识别方法对于包含有水印信息的图片进行字符识别时,识别精度会显著降低。因此,有必要提供一种基于多卷积核后验的带水印字符的识别方法及系统,以提高对带水印的字符图像的识别的精准度。
发明内容
本发明的目的在于提供一种基于多卷积核后验的带水印字符的识别方法及系统,具有提高对带水印的字符图像的识别的精准度的优点。
本发明的实施例是这样实现的:
本说明书实施例之一提供一种基于多卷积核后验的带水印字符的识别方法,包括:
获取多个样本字符图像,所述多个样本字符图像包括一部分带水印的字符图像,基于所述多个样本字符图像获取多个字符模板;
获取待识别字符图像,判断是否存在与所述待识别字符图像对应的字符模板;
若是,将与所述待识别字符图像对应的字符模板作为目标字符模板,通过多种卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取所述卷积核的过滤结果;
基于所述卷积核的过滤结果识别所述待识别字符图像。
使用本方法对带水印的字符图像进行识别前,先获取多个样本字符图像,多个样本字符图像包括一部分带水印的字符图像,基于多个样本字符图像获取多个字符模板,再通过多个字符模板对带水印的字符图像进行识别。使用本方法对带水印的字符图像进行识别时,获取待识别字符图像,判断多个字符模板中是否存在与待识别字符图像对应的字符模板,若是,将与待识别字符图像对应的字符模板作为目标字符模板,通过多种卷积核对待识别字符图像及目标字符模板进行过滤处理,获取卷积核的过滤结果,并基于卷积核的过滤结果识别待识别字符图像。本方法通过使用多种卷积核对待识别字符图像及目标字符模板进行过滤处理,并基于卷积核的过滤结果识别待识别字符图像,可以提高对带水印的字符图像的识别的精准度。且,在使用多种卷积核识别待识别字符图像之前,预先判断是否存在与待识别字符图像对应的字符模板,且在存在与待识别字符图像对应的字符模板时才进行使用多种卷积核识别待识别字符图像,提高了本方法对带水印的字符图像的识别的精准度及效率。
在本发明的一些实施例中,所述基于所述多个样本字符图像获取多个字符模板,包括:
对所述多个样本字符图像中的每一个进行目标加强,获取多个加强后的样本字符图像,对所述多个加强后的多个样本字符图像进行筛选,获取多个字符模板。
对所述多个样本字符图像中的每一个进行目标加强,获取多个加强后的样本字符图像,使得样本字符图像中的字符轮廓信息得到进一步加强;对多个加强后的多个样本字符图像进行筛选,对包含有水印等的不显著信息进行删除,获取多个去除水印后的字符模板。
在本发明的一些实施例中,所述对所述多个样本字符图像中的每一个进行目标加强,获取多个加强后的样本字符图像,对所述多个加强后的多个样本字符图像进行筛选,获取多个字符模板,包括:
对所述多个样本字符图像中的每一个,通过最小二乘滤波器对所述样本字符图像进行过滤,得到多个尺度样本图像;
对多个所述尺度样本图像之间进行减除计算,得到不同程度的细节信息;
将所述不同程度的细节信息分别加权到所述样本字符图像中,获取感兴趣区域;基于所述感兴趣区域,得到加强后的样本字符图像。
对多个样本字符图像中的每一个,通过最小二乘滤波器对样本字符图像进行过滤,得到多个尺度样本图像;对多个尺度样本图像之间进行减除计算,得到不同程度的细节信息,将不同程度的细节信息分别加权到样本字符图像中,获取感兴趣区域,即保留样本字符图像中显著的轮廓信息,对不显著的细节信息(例如,水印)进行删除,得到加强后的样本字符图像。
在本发明的一些实施例中,所述对所述多个加强后的多个样本字符图像进行筛选,获取多个字符模板,包括:
对所述多个加强后的样本字符图像进行深度自编码;
计算不同的所述加强后的样本字符图像之间的样本字符相似度;
基于所述样本字符相似度,对所述多个加强后的多个样本字符图像进行筛选,获取多个字符模板。
对多个加强后的样本字符图像进行深度自编码,计算不同的加强后的样本字符图像之间的样本字符相似度,基于样本字符相似度,对多个加强后的多个样本字符图像进行筛选,从多个相似的样本字符图像中保留一个样本字符图像,减少后续判断是否存在与待识别字符图像对应的字符模板的工作量,有利于提高对带水印的字符图像的识别的效率。
在本发明的一些实施例中,所述判断是否存在与所述待识别字符图像对应的字符模板,包括:
计算所述待识别字符图像与所述多个字符模板的字符相似度;
基于所述字符相似度判断是否存在与所述待识别字符图像对应的字符模板。
在判断多个字符模板中是否存在与待识别字符图像对应的字符模板时,可以计算待识别字符图像分别与多个字符模板的字符相似度,当存在计算待识别字符图像与一个字符模板的相似度大于阈值时,则可判断该字符模板与待识别字符图像对应。
在本发明的一些实施例中,所述通过多种卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取每个所述卷积核的过滤结果,包括:
基于平滑卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取第一待识别字符过滤结果及第一目标字符模板过滤结果;
基于锐化卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取第二待识别字符过滤结果及第二目标字符模板过滤结果;
基于去噪卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取第三待识别字符过滤结果及第三目标字符模板过滤结果。
通过使用平滑卷积核、锐化卷积核及去噪卷积核对待识别字符图像及目标字符模板进行过滤处理,并基于三个卷积核的过滤结果识别待识别字符图像,可以提高对带水印的字符图像的识别的精准度。
在本发明的一些实施例中,所述基于所述卷积核的过滤结果识别所述待识别字符图像,包括:
对所述第一待识别字符过滤结果和所述第一目标字符模板过滤结果进行减除计算,获取第一减除结果;
对所述第二待识别字符过滤结果和所述第二目标字符模板过滤结果进行减除计算,获取第二减除结果;
对所述第三待识别字符过滤结果和所述第三目标字符模板过滤结果进行减除计算,获取第三减除结果;
基于第一减除结果、第二减除结果及第三减除结果中的至少一个,识别所述待识别字符图像。
通过使用平滑卷积核、锐化卷积核及去噪卷积核对核对待识别字符图像及目标字符模板进行过滤处理,并基于第一减除结果、第二减除结果及第三减除结果中的至少一个,识别待识别字符图像,可以提高对带水印的字符图像的识别的精准度。
本说明书实施例之一提供一种基于多卷积核后验的带水印字符的识别系统,包括:
字符模板生成模块,用于获取多个样本字符图像,所述多个样本字符图像包括带水印的字符图像,并基于所述多个样本字符图像获取多个字符模板;
匹配模块,获取待识别字符图像,并判断是否存在与所述待识别字符图像对应的字符模板;
识别模块,用于在所述匹配模块判断存在与所述待识别字符图像对应的字符模板时,将与所述待识别字符图像对应的字符模板作为目标字符模板,通过多种卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取每个所述卷积核的过滤结果,并基于每个所述卷积核的过滤结果识别所述待识别字符图像。
使用本系统对带水印的字符图像进行识别前,字符模板生成模块先获取多个样本字符图像,多个样本字符图像包括一部分带水印的字符图像,基于多个样本字符图像获取多个字符模板,匹配模块及识别模块再通过多个字符模板对带水印的字符图像进行识别。使用本系统对带水印的字符图像进行识别时,匹配模块先获取待识别字符图像,判断多个字符模板中是否存在与待识别字符图像对应的字符模板,若是,识别模块将与待识别字符图像对应的字符模板作为目标字符模板,通过多种卷积核对待识别字符图像及目标字符模板进行过滤处理,获取卷积核的过滤结果,并基于卷积核的过滤结果识别待识别字符图像。本系统通过使用多种卷积核对待识别字符图像及目标字符模板进行过滤处理,并基于卷积核的过滤结果识别待识别字符图像,可以提高对带水印的字符图像的识别的精准度。且,在使用多种卷积核识别待识别字符图像之前,预先判断是否存在与待识别字符图像对应的字符模板,且在存在与待识别字符图像对应的字符模板时才进行使用多种卷积核识别待识别字符图像,提高了本系统对带水印的字符图像的识别的精准度及效率。
本说明书实施例之一提供一种基于多卷积核后验的带水印字符的识别装置,所述装置包括处理器以及存储器;所述存储器用于存储指令,所述指令被所述处理器执行时,使得所述装置实现上述的一种基于多卷积核后验的带水印字符的识别方法。
本说明书实施例之一提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机运行上述的一种基于多卷积核后验的带水印字符的识别方法。
相对于现有技术,本发明的实施例至少具有如下优点或有益效果:
1)具有提高对带水印的字符图像的识别的精准度的优点;
2)在使用多种卷积核识别待识别字符图像之前,预先判断是否存在与待识别字符图像对应的字符模板,且在存在与待识别字符图像对应的字符模板时才进行使用多种卷积核识别待识别字符图像,提高了本方法对带水印的字符图像的识别的精准度及效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明的一些实施例提供的一种基于多卷积核后验的带水印字符的识别系统的示意框图;
图2为本发明的一些实施例提供的一种基于多卷积核后验的带水印字符的识别方法的流程示意图;
图3为本发明的一些实施例提供的用于展示基于多个样本字符图像获取多个字符模板的流程示意图;
图4为本发明的一些实施例提供的用于展示获取多个字符模板的流程示意图;
图5为本发明的一些实施例提供的用于展示判断是否存在与所述待识别字符图像对应的字符模板的流程示意图;
图6为本发明的一些实施例提供的一种电子设备的示意框图;
图中,100-基于多卷积核后验的带水印字符的识别系统;110-字符模板生成模块;120-匹配模块;130-识别模块;600-电子设备;610-存储器;620-处理器;630-通信接口。
具体实施方式
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
实施例
图1为本发明的一些实施例提供的一种基于多卷积核后验的带水印字符的识别系统的示意框图。
如图1所示,在一些实施例中,一种基于多卷积核后验的带水印字符的识别系统100的示意框图包括字符模板生成模块110、匹配模块120及识别模块130。
字符模板生成模块110,用于获取多个样本字符图像,多个样本字符图像包括一部分带水印的字符图像,并基于多个样本字符图像获取多个字符模板。在一些实施例中,字符模板生成模块110可以对多个样本字符图像中的每一个进行目标加强,获取多个加强后的样本字符图像,对多个加强后的多个样本字符图像进行筛选,获取多个字符模板。
匹配模块120,获取待识别字符图像,并判断是否存在与待识别字符图像对应的字符模板。在一些实施例中,匹配模块120可以计算待识别字符图像与多个字符模板的字符相似度;基于字符相似度判断是否存在与待识别字符图像对应的字符模板。
识别模块130,用于在匹配模块判断存在与待识别字符图像对应的字符模板时,将与待识别字符图像对应的字符模板作为目标字符模板,通过多种卷积核对待识别字符图像及目标字符模板进行过滤处理,获取每个卷积核的过滤结果,并基于每个卷积核的过滤结果识别待识别字符图像。在一些实施例中,识别模块130可以基于平滑卷积核对待识别字符图像及目标字符模板进行过滤处理,获取第一待识别字符过滤结果及第一目标字符模板过滤结果;识别模块130还可以基于锐化卷积核对待识别字符图像及目标字符模板进行过滤处理,获取第二待识别字符过滤结果及第二目标字符模板过滤结果;识别模块130还可以基于去噪卷积核对待识别字符图像及目标字符模板进行过滤处理,获取第三待识别字符过滤结果及第三目标字符模板过滤结果,并对第一待识别字符过滤结果和第一目标字符模板过滤结果进行减除计算,获取第一减除结果;对第二待识别字符过滤结果和第二目标字符模板过滤结果进行减除计算,获取第二减除结果;对第三待识别字符过滤结果和第三目标字符模板过滤结果进行减除计算,获取第三减除结果,基于第一减除结果、第二减除结果及第三减除结果中的至少一个,识别待识别字符图像。
需要注意的是,以上对于一种基于多卷积核后验的带水印字符的识别系统100及其模块的描述,仅为描述方便,并不能把本说明书限制在所举实施例范围之内。可以理解,对于本领域的技术人员来说,在了解该系统的原理后,可能在不背离这一原理的情况下,对各个模块进行任意组合,或者构成子系统与其他模块连接。在一些实施例中,图1中披露的字符模板生成模块110、匹配模块120及识别模块130可以是一个系统中的不同模块,也可以是一个模块实现上述的两个或两个以上模块的功能。例如,各个模块可以共用一个存储模块,各个模块也可以分别具有各自的存储模块。诸如此类的变形,均在本说明书的保护范围之内。
图2为本发明的一些实施例提供的一种基于多卷积核后验的带水印字符的识别方法的流程示意图。
在一些实施例中,一种基于多卷积核后验的带水印字符的识别方法可以由一种基于多卷积核后验的带水印字符的识别系统100执行。例如,一种基于多卷积核后验的带水印字符的识别方法可以以程序或指令的形式存储在存储装置中,当一种基于多卷积核后验的带水印字符的识别系统100执行该程序或指令时,可以实现一种基于多卷积核后验的带水印字符的识别方法。下面呈现的一种基于多卷积核后验的带水印字符的识别方法的操作示意图是说明性的。在一些实施例中,可以利用一个或以上未描述的附加操作和/或未讨论的一个或以上操作来完成该过程。另外,图2中示出的和下面描述的流程的操作的顺序不旨在是限制性的。
步骤210,可以获取多个样本字符图像,多个样本字符图像包括一部分带水印的字符图像,基于多个样本字符图像获取多个字符模板。
在一些实施例中,可以将包含有字符的图像作为一部分样本字符图像。在一些实施例中,还可以将包含有字符及水印的图像作为一部分样本字符图像。在一些实施例中,还可以对包含有字符的图像添加水印,作为一部分样本字符图像。字符可以为文字、数字、图案、字符串、二维码、条形码等中的至少一种或其组合。例如,压印在液化气缸瓶上的标识编码、饮料瓶上的喷码、机械加工工件上通过冲头或激光加工出的字符串、包装盒上的字符串等。还例如,银行卡的卡号、电机外壳的铭牌上的钢印等。
在一些实施例中,基于多个样本字符图像获取多个字符模板,包括:对多个样本字符图像中的每一个进行目标加强,获取多个加强后的样本字符图像,对多个加强后的多个样本字符图像进行筛选,获取多个字符模板。在一些实施例中,可以基于目标加强算法对多个样本字符图像中的每一个进行目标加强,示例行目标加强算法可以为结合小波变换和数学形态学的图像增强算法、直方图均衡化等。
结合图3,图3为本发明的一些实施例提供的用于展示基于多个样本字符图像获取多个字符模板的流程示意图,在一些实施例中,对多个样本字符图像中的每一个进行目标加强,获取多个加强后的样本字符图像,对多个加强后的多个样本字符图像进行筛选,获取多个字符模板,可以包括:
步骤310,对多个样本字符图像中的每一个,通过最小二乘滤波器对样本字符图像进行过滤,得到多个尺度样本图像。
步骤320,对多个尺度样本图像之间进行减除计算,得到不同程度的细节信息;
步骤330,将不同程度的细节信息分别加权到样本字符图像中,获取感兴趣区域,基于感兴趣区域(例如,包含有显著的字符轮廓信息的图像区域),对包含有不显著的细节信息(例如,水印)区域进行删除,得到加强后的样本字符图像,即包含有显著的字符轮廓且去除了水印的样本字符图像。
结合图4,图4为本发明的一些实施例提供的用于展示获取多个字符模板的流程示意图,在一些实施例中,对多个加强后的多个样本字符图像进行筛选,获取多个字符模板,包括:
步骤410,对多个加强后的样本字符图像进行深度自编码;
步骤420,计算不同的加强后的样本字符图像之间的样本字符相似度。
在一些实施例中,可以基于预设算法计算不同的加强后的样本字符图像之间的样本字符相似度,示例性预设算法可以为基于欧氏距离的相似度算法、基于曼哈顿距离的相似度算法、基于切比雪夫距离的相似度算法、基于闵可夫斯基距离的相似度算法、基于标准化欧氏距离的相似度算法、基于马氏距离的相似度算法、基于夹角余弦的相似度算法、基于皮尔逊相关系数的相似度算法、基于DTW距离地相似度算法、基于KL散度的相似度算法等,或其任意组合等。
在一些实施例中,还可以使用机器学习模型计算不同的加强后的样本字符图像之间的样本字符相似度。机器学习模型可以是监督学习模型。多个训练样本可以包括机器学习模型的示例性输入和表示与示例性输入相对应的期望输出的标签。用于训练监督学习模型的过程可以使机器学习模型能够学习将输入映射到相应输出的一般规则。可以用于训练监督机器学习模型的示例性算法可以包括梯度提升决策树(GBDT)算法、决策树算法、随机森林算法、逻辑回归算法、支持向量机(SVM)算法、自适应增强算法等,或其任意组合。在一些实施例中,机器学习模型可以是无监督学习模型。训练样本可以包括没有标签的示例性输入。训练无监督学习模型的过程可以使机器学习模型能够了解更多的输入数据,例如,以找到数据的基础分布模式。可以用于训练无监督机器学习模型的示例性算法可以包括k均值聚类算法、分层聚类算法、具有噪声的基于密度的聚类方法(DBSCAN)算法等,或其任意组合。
步骤430,基于样本字符相似度,对多个加强后的多个样本字符图像进行筛选,获取多个字符模板。从多个(例如,3个)相似的样本字符图像中保留一个样本字符图像,减少后续判断是否存在与待识别字符图像对应的字符模板的工作量。
请再次参照图2,步骤220,获取待识别字符图像,判断是否存在与待识别字符图像对应的字符模板。
在一些实施例中,可以使用机器学习模型判断是否存在与待识别字符图像对应的字符模板。机器学习模型可以是监督学习模型。多个训练样本可以包括机器学习模型的示例性输入和表示与示例性输入相对应的期望输出的标签。用于训练监督学习模型的过程可以使机器学习模型能够学习将输入映射到相应输出的一般规则。可以用于训练监督机器学习模型的示例性算法可以包括梯度提升决策树(GBDT)算法、决策树算法、随机森林算法、逻辑回归算法、支持向量机(SVM)算法、自适应增强算法等,或其任意组合。在一些实施例中,机器学习模型可以是无监督学习模型。训练样本可以包括没有标签的示例性输入。训练无监督学习模型的过程可以使机器学习模型能够了解更多的输入数据,例如,以找到数据的基础分布模式。可以用于训练无监督机器学习模型的示例性算法可以包括k均值聚类算法、分层聚类算法、具有噪声的基于密度的聚类方法(DBSCAN)算法等,或其任意组合。
结合图5,图5为本发明的一些实施例提供的用于展示判断是否存在与待识别字符图像对应的字符模板的流程示意图,在一些实施例中,判断是否存在与待识别字符图像对应的字符模板,还可以包括:
步骤510,计算待识别字符图像与多个字符模板的字符相似度。
在一些实施例中,可以基于预设算法计算待识别字符图像与多个字符模板的字符相似度,示例性预设算法可以为基于欧氏距离的相似度算法、基于曼哈顿距离的相似度算法、基于切比雪夫距离的相似度算法、基于闵可夫斯基距离的相似度算法、基于标准化欧氏距离的相似度算法、基于马氏距离的相似度算法、基于夹角余弦的相似度算法、基于皮尔逊相关系数的相似度算法、基于DTW距离地相似度算法、基于KL散度的相似度算法等,或其任意组合等。
步骤520,基于字符相似度判断是否存在与待识别字符图像对应的字符模板。当存在计算待识别字符图像与一个字符模板的相似度大于阈值时,则可判断该字符模板与待识别字符图像对应。
请再次参照图2,步骤230,若是,将与待识别字符图像对应的字符模板作为目标字符模板,通过多种卷积核对待识别字符图像及目标字符模板进行过滤处理,获取卷积核的过滤结果。
在一些实施例中,可以基于平滑卷积核对待识别字符图像及目标字符模板进行过滤处理,获取第一待识别字符过滤结果及第一目标字符模板过滤结果;还可以基于锐化卷积核对待识别字符图像及目标字符模板进行过滤处理,获取第二待识别字符过滤结果及第二目标字符模板过滤结果;还可以基于去噪卷积核对待识别字符图像及目标字符模板进行过滤处理,获取第三待识别字符过滤结果及第三目标字符模板过滤结果。
请再次参照图2,步骤240,基于卷积核的过滤结果识别待识别字符图像。
在一些实施例中,可以对第一待识别字符过滤结果和第一目标字符模板过滤结果进行减除计算,获取第一减除结果;还可以对第二待识别字符过滤结果和第二目标字符模板过滤结果进行减除计算,获取第二减除结果;还可以对第三待识别字符过滤结果和第三目标字符模板过滤结果进行减除计算,获取第三减除结果;基于第一减除结果、第二减除结果及第三减除结果中的至少一个,识别待识别字符图像。例如,可以基于第一减除结果、第二减除结果识别待识别字符图像,当第一减除结果、第二减除结果均为不显著时,识别待识别字符图像中的字符为目标字符模板中的字符。还例如,可以基于第一减除结果、第二减除结果及第三减除结果识别待识别字符图像,当第一减除结果、第二减除结果及第三减除结果中存在两个或两个以上为不显著时,识别待识别字符图像中的字符为目标字符模板中的字符。
图6为本发明的一些实施例提供的一种电子设备的示意框图。
电子设备600包括存储器610、处理器620和通信接口630,该存储器610、处理器620和通信接口630相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器610可用于存储软件程序及模块,如本申请实施例所提供的一种基于多卷积核后验的带水印字符的识别系统100对应的程序指令/模块,处理器620通过执行存储在存储器610内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口630可用于与其他节点设备进行信令或数据的通信。
其中,存储器610可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器620可以是一种集成电路芯片,具有信号处理能力。该处理器620可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可以理解,图6所示的结构仅为示意,电子设备还可包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置。图6中所示的各组件可以采用硬件、软件或其组合实现。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
综上,本申请实施例提供的一种基于多卷积核后验的带水印字符的识别方法及系统,对带水印的字符图像进行识别前,先获取多个样本字符图像,多个样本字符图像包括带水印的字符图像,基于多个样本字符图像获取多个字符模板,再通过多个字符模板对带水印的字符图像进行识别。使用本方法对带水印的字符图像进行识别时,获取待识别字符图像,判断多个字符模板中是否存在与待识别字符图像对应的字符模板,若是,将与待识别字符图像对应的字符模板作为目标字符模板,通过多种卷积核对待识别字符图像及目标字符模板进行过滤处理,获取卷积核的过滤结果,并基于卷积核的过滤结果识别待识别字符图像。通过使用多种卷积核对待识别字符图像及目标字符模板进行过滤处理,并基于卷积核的过滤结果识别待识别字符图像,可以提高对带水印的字符图像的识别的精准度。且,在使用多种卷积核识别待识别字符图像之前,预先判断是否存在与待识别字符图像对应的字符模板,且在存在与待识别字符图像对应的字符模板时才进行使用多种卷积核识别待识别字符图像,提高了对带水印的字符图像的识别的精准度及效率。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (7)

1.一种基于多卷积核后验的带水印字符的识别方法,其特征在于,包括:
获取多个样本字符图像,所述多个样本字符图像包括一部分带水印的字符图像,基于所述多个样本字符图像获取多个字符模板;
获取待识别字符图像,计算所述待识别字符图像与所述多个字符模板的字符相似度,基于所述字符相似度判断是否存在与所述待识别字符图像对应的字符模板;
若是,将与所述待识别字符图像对应的字符模板作为目标字符模板,通过多种卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取所述卷积核的过滤结果;
其中,所述通过多种卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取所述卷积核的过滤结果,包括:
基于平滑卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取第一待识别字符过滤结果及第一目标字符模板过滤结果;
基于锐化卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取第二待识别字符过滤结果及第二目标字符模板过滤结果;
基于去噪卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取第三待识别字符过滤结果及第三目标字符模板过滤结果;
基于所述卷积核的过滤结果识别所述待识别字符图像;
其中,所述基于所述卷积核的过滤结果识别所述待识别字符图像,包括:
对所述第一待识别字符过滤结果和所述第一目标字符模板过滤结果进行减除计算,获取第一减除结果;
对所述第二待识别字符过滤结果和所述第二目标字符模板过滤结果进行减除计算,获取第二减除结果;
对所述第三待识别字符过滤结果和所述第三目标字符模板过滤结果进行减除计算,获取第三减除结果;
判断所述第一减除结果、所述第二减除结果及所述第三减除结果中的两个或两个以上是否为不显著,若是,识别所述待识别字符图像中的字符为所述目标字符模板中的字符。
2.根据权利要求1所述的一种基于多卷积核后验的带水印字符的识别方法,其特征在于,所述基于所述多个样本字符图像获取多个字符模板,包括:
对所述多个样本字符图像中的每一个进行目标加强,获取多个加强后的样本字符图像,对所述多个加强后的多个样本字符图像进行筛选,获取多个字符模板。
3.根据权利要求2所述的一种基于多卷积核后验的带水印字符的识别方法,其特征在于,所述对所述多个样本字符图像中的每一个进行目标加强,获取多个加强后的样本字符图像,对所述多个加强后的多个样本字符图像进行筛选,获取多个字符模板,包括:
对所述多个样本字符图像中的每一个,通过最小二乘滤波器对所述样本字符图像进行过滤,得到多个尺度样本图像;
对多个所述尺度样本图像之间进行减除计算,得到不同程度的细节信息;
将所述不同程度的细节信息分别加权到所述样本字符图像中,获取感兴趣区域,基于所述感兴趣区域,得到加强后的样本字符图像。
4.根据权利要求2或3所述的一种基于多卷积核后验的带水印字符的识别方法,其特征在于,所述对所述多个加强后的多个样本字符图像进行筛选,获取多个字符模板,包括:
对所述多个加强后的样本字符图像进行深度自编码;
计算不同的所述加强后的样本字符图像之间的样本字符相似度;
基于所述样本字符相似度,对所述多个加强后的多个样本字符图像进行筛选,获取多个字符模板。
5.一种基于多卷积核后验的带水印字符的识别系统,其特征在于,包括:
字符模板生成模块,用于获取多个样本字符图像,所述多个样本字符图像包括一部分带水印的字符图像,并基于所述多个样本字符图像获取多个字符模板;
匹配模块,获取待识别字符图像,计算所述待识别字符图像与所述多个字符模板的字符相似度,基于所述字符相似度判断是否存在与所述待识别字符图像对应的字符模板;
识别模块,用于在所述匹配模块判断存在与所述待识别字符图像对应的字符模板时,将与所述待识别字符图像对应的字符模板作为目标字符模板,通过多种卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取每个所述卷积核的过滤结果,并基于每个所述卷积核的过滤结果识别所述待识别字符图像;
其中,所述识别模块通过多种卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取每个所述卷积核的过滤结果,包括:
基于平滑卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取第一待识别字符过滤结果及第一目标字符模板过滤结果;
基于锐化卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取第二待识别字符过滤结果及第二目标字符模板过滤结果;
基于去噪卷积核对所述待识别字符图像及所述目标字符模板进行过滤处理,获取第三待识别字符过滤结果及第三目标字符模板过滤结果;
所述识别模块基于每个所述卷积核的过滤结果识别所述待识别字符图像,包括:
对所述第一待识别字符过滤结果和所述第一目标字符模板过滤结果进行减除计算,获取第一减除结果;
对所述第二待识别字符过滤结果和所述第二目标字符模板过滤结果进行减除计算,获取第二减除结果;
对所述第三待识别字符过滤结果和所述第三目标字符模板过滤结果进行减除计算,获取第三减除结果;
判断所述第一减除结果、所述第二减除结果及所述第三减除结果中的两个或两个以上是否为不显著,若是,识别所述待识别字符图像中的字符为所述目标字符模板中的字符。
6.一种基于多卷积核后验的带水印字符的识别装置,所述装置包括处理器以及存储器;所述存储器用于存储指令,其特征在于,所述指令被所述处理器执行时,使得所述装置实现如权利要求1至4中任一所述方法。
7.一种计算机可读存储介质,其特征在于,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机运行如权利要求1至4中任一所述方法。
CN202110867428.6A 2021-07-30 2021-07-30 一种基于多卷积核后验的带水印字符的识别方法及系统 Active CN113313214B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110867428.6A CN113313214B (zh) 2021-07-30 2021-07-30 一种基于多卷积核后验的带水印字符的识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110867428.6A CN113313214B (zh) 2021-07-30 2021-07-30 一种基于多卷积核后验的带水印字符的识别方法及系统

Publications (2)

Publication Number Publication Date
CN113313214A CN113313214A (zh) 2021-08-27
CN113313214B true CN113313214B (zh) 2021-11-16

Family

ID=77382487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110867428.6A Active CN113313214B (zh) 2021-07-30 2021-07-30 一种基于多卷积核后验的带水印字符的识别方法及系统

Country Status (1)

Country Link
CN (1) CN113313214B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115661784B (zh) * 2022-10-12 2023-08-22 北京惠朗时代科技有限公司 一种面向智慧交通的交通标志图像大数据识别方法与系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902710A (zh) * 2019-01-07 2019-06-18 南京热信软件科技有限公司 一种文本图像的快速匹配方法和装置
CN110135427A (zh) * 2019-04-11 2019-08-16 北京百度网讯科技有限公司 用于识别图像中的字符的方法、装置、设备和介质
CN112070649A (zh) * 2020-09-09 2020-12-11 焦点科技股份有限公司 一种去除特定字符串水印的方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1619874B1 (en) * 2003-04-25 2016-02-03 Oki Data Corporation Watermark information detection method
KR101443404B1 (ko) * 2006-09-15 2014-10-02 구글 인코포레이티드 페이퍼 및 전자 문서내의 주석의 캡처 및 디스플레이

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902710A (zh) * 2019-01-07 2019-06-18 南京热信软件科技有限公司 一种文本图像的快速匹配方法和装置
CN110135427A (zh) * 2019-04-11 2019-08-16 北京百度网讯科技有限公司 用于识别图像中的字符的方法、装置、设备和介质
CN112070649A (zh) * 2020-09-09 2020-12-11 焦点科技股份有限公司 一种去除特定字符串水印的方法及系统

Also Published As

Publication number Publication date
CN113313214A (zh) 2021-08-27

Similar Documents

Publication Publication Date Title
US10621727B1 (en) Label and field identification without optical character recognition (OCR)
Meng Two-stage recognition for oracle bone inscriptions
CN112862024B (zh) 一种文本识别方法及系统
EP4012608A1 (en) Method and system for document classification and text information extraction
CN110738238A (zh) 一种证件信息的分类定位方法及装置
Thammarak et al. Comparative analysis of Tesseract and Google Cloud Vision for Thai vehicle registration certificate
CN113313214B (zh) 一种基于多卷积核后验的带水印字符的识别方法及系统
CN112634246A (zh) 一种口腔图像识别方法及相关设备
CN113435499B (zh) 标签分类方法、装置、电子设备和存储介质
CN112861743B (zh) 一种掌静脉图像防伪方法、装置和设备
CN108921006B (zh) 手写签名图像真伪鉴别模型建立方法及真伪鉴别方法
CN110796145A (zh) 基于智能决策的多证件分割关联方法及相关设备
CN112200789B (zh) 一种图像识别的方法及装置、电子设备和存储介质
US20220398399A1 (en) Optical character recognition systems and methods for personal data extraction
CN116152079A (zh) 图像处理方法及图像处理模型训练方法
CN114943695A (zh) 医学序列影像的异常检测方法、装置、设备及存储介质
CN111931229B (zh) 一种数据识别方法、装置和存储介质
CN113705749A (zh) 基于深度学习的二维码识别方法、装置、设备及存储介质
CN113836297A (zh) 文本情感分析模型的训练方法及装置
CN113705455A (zh) 身份核查方法、装置、电子设备及可读存储介质
Chowdhury et al. Detection and recognition of Bangladeshi license plate
CN112861874A (zh) 一种基于多滤波器去噪结果的专家场去噪方法及系统
Gonasagi et al. Classification of historical documents based on LBP and LPQ techniques
CN107644251B (zh) 对象分类方法、装置和系统
CN113343963B (zh) 一种基于高质量模板的智能尾箱指纹识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant