CN113313217A - 一种基于鲁棒性模板的倾角文字精准识别方法及系统 - Google Patents

一种基于鲁棒性模板的倾角文字精准识别方法及系统 Download PDF

Info

Publication number
CN113313217A
CN113313217A CN202110876329.4A CN202110876329A CN113313217A CN 113313217 A CN113313217 A CN 113313217A CN 202110876329 A CN202110876329 A CN 202110876329A CN 113313217 A CN113313217 A CN 113313217A
Authority
CN
China
Prior art keywords
character
character image
template
image blocks
image block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110876329.4A
Other languages
English (en)
Other versions
CN113313217B (zh
Inventor
胡茂厅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huilang Century Technology Co ltd
Original Assignee
Beijing Huilang Century Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huilang Century Technology Co ltd filed Critical Beijing Huilang Century Technology Co ltd
Priority to CN202110876329.4A priority Critical patent/CN113313217B/zh
Publication of CN113313217A publication Critical patent/CN113313217A/zh
Application granted granted Critical
Publication of CN113313217B publication Critical patent/CN113313217B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明公开了一种基于鲁棒性模板的倾角文字精准识别方法,包括以下步骤:建立样本图像数据集;建立对应文字类别的多个鲁棒性文字模板;将待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建;计算各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度;根据各个尺度下的相似度值确定待识别倾角文字图像块的初始文字类别;采用卷积核对待识别倾角文字图像块和其初始文字类别的鲁棒性文字模板进行过滤;计算过滤待识别倾角文字图像块和过滤模板文字图像块的相似度;确定待识别倾角文字图像块的文字类别。本发明公开了一种基于鲁棒性模板的倾角文字精准识别系统。本发明有效提升了倾角文字识别的精准度。

Description

一种基于鲁棒性模板的倾角文字精准识别方法及系统
技术领域
本发明涉及文字识别技术领域,具体而言,涉及一种基于鲁棒性模板的倾角文字精准识别方法及系统。
背景技术
在数字媒体时代,海量的图片已经成为了一种重要的信息载体,发挥了越来越重要的价值。例如,银行的票据、公司的财务报表等都可以用图片的形式展示和存储。虽然我们可以较为方便地阅读图像中的文字信息,但是无法对文字信息进行有效识别并编辑,因此如果能够有效地识别出图片中的文字有着非常重要的价值。传统的文字方法虽然能够识别出图片中的文字,但当文字出现一定的倾角时,它们往往无法较好地被识别出来。因此,如何建立一种有效的倾角文字识别方法,对于倾角文字仍然有较高的识别精度是一项亟待解决的工作。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种基于鲁棒性模板的倾角文字精准识别方法及系统,有效提升了倾角文字识别的精准度。
本发明的实施例是这样实现的:
第一方面,本发明实施例提供一种基于鲁棒性模板的倾角文字精准识别方法,包括以下步骤:
获取样本文字图像块,并建立样本图像数据集;上述样本图像数据集包括多个倾角文字图像块和多个正角文字图像块;
根据样本图像数据集中的文字类别建立对应文字类别的多个鲁棒性文字模板;
获取待识别倾角文字图像块,并将待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建,以得到多个尺度下的待识别倾角文字图像块和多个模板文字图像块;
计算各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度,以得到各个尺度下的相似度值;
根据各个尺度下的相似度值确定待识别倾角文字图像块的初始文字类别;
采用卷积核对待识别倾角文字图像块和其初始文字类别的鲁棒性文字模板进行过滤,以得到过滤待识别倾角文字图像块和过滤模板文字图像块;
计算过滤待识别倾角文字图像块和过滤模板文字图像块的相似度,以得到过滤图像相似度值;
根据过滤图像相似度值确定待识别倾角文字图像块的文字类别,生成识别结果。
为了解决现有技术中对倾角文字图像识别不准确的问题,本方法基于多个鲁棒性模板,并利用多尺度相似性计算和单卷积核相结合的方式对文字图像进行精准识别。首先,获取样本文字图像块,并建立样本图像数据集,上述样本图像数据集包括多个倾角文字图像块和多个正角文字图像块,在前期挑选样本的时候就加入了倾角文字图像块,以便后续在建立鲁棒性模板时,也充分考虑倾角文字图像块,使建立的模板模型具有识别倾角文字的能力,进而提高文字图像识别的精准性。选取多个文字类别的样本图像,根据不同的文字类别分别建立挑选对应文字类别的多个鲁棒性文字模板,为后续文字识别提供模板基础。当需要对图像进行识别时,将获取到的待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建,以得到多个尺度下的待识别倾角文字图像块和多个模板文字图像块,在各个尺度下对待识别文字图像块和模板文字块进行相似度计算,统计各个尺度下的相似度值,若多个尺度下,待识别文字图像块和某一类别模板文字块都保持了较高的相似度(在预设的相似度阈值范围内),则将待识别文字图像块初步判定为上述模板文字类别;确定好待识别文字图像块的初始文字类别后,为了保证识别的准确性,结合卷积核技术,利用3*3卷积核对待识别文字图像块和该类别文字模板进行过滤,基于过滤后的结果,计算过滤后该类文字模板和过滤后待识别文字图像块的相似度,若该类模板文字块和待识别图像仍然保持较高的相似度,我们将待识别文字图像块最终判定为上述模板文字类别,识别完成。
本方法在鲁棒性模板挑选的过程中,充分考虑了倾角文字图像块,使识别模型具有识别倾角文字的能力;同时利用多尺度相似性计算和单卷积核相结合的方式对图像进行全面精确的识别,提升了倾角文字识别的精准度。
基于第一方面,在本发明的一些实施例中,上述根据样本图像数据集中的文字类别建立对应文字类别的多个鲁棒性文字模板的方法包括以下步骤:
从样本图像数据集中选取并根据多个倾角文字图像块和多个正角文字图像块建立模板样本集;
将模板样本集中的各个文字图像块进行深度自编码;
计算并根据自编码后的各个文字图像块两两之间的欧式距离对模板样本集中的文字图像块进行筛选,以得到多个目标文字图像块,将各个目标文字图像块作为鲁棒性文字模板。
基于第一方面,在本发明的一些实施例中,上述计算并根据自编码后的各个文字图像块两两之间的欧式距离对模板样本集中的文字图像块进行筛选,以得到多个目标文字图像块,将各个目标文字图像块作为鲁棒性文字模板的方法包括以下步骤:
计算自编码后的各个文字图像块两两之间的欧式距离,以得到两两文字图像块对应的欧式距离值;
根据各个欧式距离值和预设的差异性阈值对模板样本集中的文字图像块进行筛选,筛选出对应的欧式距离值超过预设的差异性阈值的各个文字图像块,将筛选出的各个文字图像块作为鲁棒性文字模板。
基于第一方面,在本发明的一些实施例中,上述根据各个欧式距离值和预设的差异性阈值对模板样本集中的文字图像块进行筛选,筛选出对应的欧式距离值超过预设的差异性阈值的各个文字图像块,将筛选出的各个文字图像块作为鲁棒性文字模板的方法包括以下步骤:
根据两两文字图像块对应的欧式距离值与预设的相似性阈值对各个文字图像块进行筛选,筛选的得到多个有效文字图像;
计算各个有效文字图像两两之间的欧式距离,得到多个有效欧式距离值;
根据各个有效欧式距离值和预设的差异性阈值对模板样本集中的文字图像块进行筛选,筛选出对应的欧式距离值超过预设的差异性阈值的各个文字图像块,将筛选出的各个文字图像块作为鲁棒性文字模板。
基于第一方面,在本发明的一些实施例中,上述计算各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度的方法包括以下步骤:
对各个尺度下的待识别倾角文字图像块与各个模板文字图像块进行深度自编码;
计算并根据自编码后的各个模板文字图像块与待识别倾角文字图像块之间的欧式距离确定各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度。
基于第一方面,在本发明的一些实施例中,上述根据各个尺度下的相似度值确定待识别倾角文字图像块的初始文字类别的方法包括以下步骤:
将各个尺度下的相似度值与预设的相似度阈值进行对比,生成第一对比结果;
根据第一对比结果中的尺度相似数量确定待识别倾角文字图像块的初始文字类别。
基于第一方面,在本发明的一些实施例中,上述根据过滤图像相似度值确定待识别倾角文字图像块的文字类别,生成识别结果的方法包括以下步骤:
将过滤图像相似度值与预设的相似度阈值进行对比,生成第二对比结果;
根据第二对比结果确定待识别倾角文字图像块的文字类别,生成识别结果。
第二方面,本发明实施例提供一种基于鲁棒性模板的倾角文字精准识别系统,包括样本获取模块、模板建立模块、尺度构建模块、相似度计算模块、初始类别模块、过滤模块、过滤计算模块以及识别模块,其中:
样本获取模块,用于获取样本文字图像块,并建立样本图像数据集;上述样本图像数据集包括多个倾角文字图像块和多个正角文字图像块;
模板建立模块,用于根据样本图像数据集中的文字类别建立对应文字类别的多个鲁棒性文字模板;
尺度构建模块,用于获取待识别倾角文字图像块,并将待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建,以得到多个尺度下的待识别倾角文字图像块和多个模板文字图像块;
相似度计算模块,用于计算各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度,以得到各个尺度下的相似度值;
初始类别模块,用于根据各个尺度下的相似度值确定待识别倾角文字图像块的初始文字类别;
过滤模块,用于采用卷积核对待识别倾角文字图像块和其初始文字类别的鲁棒性文字模板进行过滤,以得到过滤待识别倾角文字图像块和过滤模板文字图像块;
过滤计算模块,用于计算过滤待识别倾角文字图像块和过滤模板文字图像块的相似度,以得到过滤图像相似度值;
识别模块,用于根据过滤图像相似度值确定待识别倾角文字图像块的文字类别,生成识别结果。
为了解决现有技术中对倾角文字图像识别不准确的问题,本系统基于多个鲁棒性模板,并利用多尺度相似性计算和单卷积核相结合的方式对文字图像进行精准识别。首先,通过样本获取模块获取样本文字图像块,并建立样本图像数据集,上述样本图像数据集包括多个倾角文字图像块和多个正角文字图像块,在前期挑选样本的时候就加入了倾角文字图像块,以便后续在建立鲁棒性模板时,也充分考虑倾角文字图像块,使建立的模板模型具有识别倾角文字的能力,进而提高文字图像识别的精准性。选取多个文字类别的样本图像,模板建立模块根据不同的文字类别分别建立挑选对应文字类别的多个鲁棒性文字模板,为后续文字识别提供模板基础。当需要对图像进行识别时,尺度构建模块将获取到的待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建,以得到多个尺度下的待识别倾角文字图像块和多个模板文字图像块,相似度计算模块在各个尺度下对待识别文字图像块和模板文字块进行相似度计算,统计各个尺度下的相似度值,若多个尺度下,待识别文字图像块和某一类别模板文字块都保持了较高的相似度(在预设的相似度阈值范围内),则将待识别文字图像块初步判定为上述模板文字类别;确定好待识别文字图像块的初始文字类别后,为了保证识别的准确性,结合卷积核技术,过滤模块利用3*3卷积核对待识别文字图像块和该类别文字模板进行过滤,基于过滤后的结果,过滤计算模块计算过滤后该类文字模板和过滤后待识别文字图像块的相似度,若该类模板文字块和待识别图像仍然保持较高的相似度,我们将待识别文字图像块最终判定为上述模板文字类别,识别完成。
本系统在鲁棒性模板挑选的过程中,充分考虑了倾角文字图像块,使识别模型具有识别倾角文字的能力;同时利用多尺度相似性计算和单卷积核相结合的方式对图像进行全面精确的识别,提升了倾角文字识别的精准度。
第三方面,本申请实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
本发明实施例至少具有如下优点或有益效果:
本发明实施例提供一种基于鲁棒性模板的倾角文字精准识别方法及系统,解决了现有技术中对倾角文字图像识别不准确的问题,本方法基于多个鲁棒性模板,在鲁棒性模板挑选的过程中,充分考虑了倾角文字图像块,使识别模型具有识别倾角文字的能力;同时利用多尺度相似性计算和单卷积核相结合的方式对图像进行全面精确的识别,提升了倾角文字识别的精准度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一种基于鲁棒性模板的倾角文字精准识别方法的流程图;
图2为本发明实施例一种基于鲁棒性模板的倾角文字精准识别系统的原理框图;
图3为本发明实施例提供的一种电子设备的结构框图。
图标:100、样本获取模块;200、模板建立模块;300、尺度构建模块;400、相似度计算模块;500、初始类别模块;600、过滤模块;700、过滤计算模块;800、识别模块;101、存储器;102、处理器;103、通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本发明实施例的描述中,“多个”代表至少2个。
实施例
如图1所示,第一方面,本发明实施例提供一种基于鲁棒性模板的倾角文字精准识别方法,包括以下步骤:
S1、获取样本文字图像块,并建立样本图像数据集;上述样本图像数据集包括多个倾角文字图像块和多个正角文字图像块;
S2、根据样本图像数据集中的文字类别建立对应文字类别的多个鲁棒性文字模板;
进一步地,上述根据样本图像数据集中的文字类别建立对应文字类别的多个鲁棒性文字模板的方法包括以下步骤:
从样本图像数据集中选取并根据多个倾角文字图像块和多个正角文字图像块建立模板样本集;将模板样本集中的各个文字图像块进行深度自编码;计算并根据自编码后的各个文字图像块两两之间的欧式距离对模板样本集中的文字图像块进行筛选,以得到多个目标文字图像块,将各个目标文字图像块作为鲁棒性文字模板。
进一步地,上述计算并根据自编码后的各个文字图像块两两之间的欧式距离对模板样本集中的文字图像块进行筛选,以得到多个目标文字图像块,将各个目标文字图像块作为鲁棒性文字模板的方法包括以下步骤:
计算自编码后的各个文字图像块两两之间的欧式距离,以得到两两文字图像块对应的欧式距离值;根据各个欧式距离值和预设的差异性阈值对模板样本集中的文字图像块进行筛选,筛选出对应的欧式距离值超过预设的差异性阈值的各个文字图像块,将筛选出的各个文字图像块作为鲁棒性文字模板。
进一步地,上述根据各个欧式距离值和预设的差异性阈值对模板样本集中的文字图像块进行筛选,筛选出对应的欧式距离值超过预设的差异性阈值的各个文字图像块,将筛选出的各个文字图像块作为鲁棒性文字模板的方法包括以下步骤:
根据两两文字图像块对应的欧式距离值与预设的相似性阈值对各个文字图像块进行筛选,筛选的得到多个有效文字图像;计算各个有效文字图像两两之间的欧式距离,得到多个有效欧式距离值;根据各个有效欧式距离值和预设的差异性阈值对模板样本集中的文字图像块进行筛选,筛选出对应的欧式距离值超过预设的差异性阈值的各个文字图像块,将筛选出的各个文字图像块作为鲁棒性文字模板。
在本发明的一些实施例中,获取样本文字图像块,并建立样本图像数据集,上述样本图像数据集包括多个倾角文字图像块和多个正角文字图像块,在前期挑选样本的时候就加入了倾角文字图像块,以便后续在建立鲁棒性模板时,也充分考虑倾角文字图像块,使建立的模板模型具有识别倾角文字的能力,进而提高文字图像识别的精准性。选取多个文字类别的样本图像,根据不同的文字类别分别建立挑选对应文字类别的多个鲁棒性文字模板,为后续文字识别提供模板基础。从海量的文字数据库中挑选出足量的文字图像块,保证一定比率的倾角文字图像块;对文字图像块进行深度自编码;计算不同文字图像块自编码后的欧式距离;当若干个文字图像块的欧式距离较近时,我们认为它们高度相似,仅保留其中一个即可;经过多次欧式距离的计算,筛选出一批差异性较大的文字图像块,作为鲁棒性的文字模板。
S3、获取待识别倾角文字图像块,并将待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建,以得到多个尺度下的待识别倾角文字图像块和多个模板文字图像块;
S4、计算各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度,以得到各个尺度下的相似度值;
进一步地,对各个尺度下的待识别倾角文字图像块与各个模板文字图像块进行深度自编码;计算并根据自编码后的各个模板文字图像块与待识别倾角文字图像块之间的欧式距离确定各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度。
S5、根据各个尺度下的相似度值确定待识别倾角文字图像块的初始文字类别;
进一步地,将各个尺度下的相似度值与预设的相似度阈值进行对比,生成第一对比结果;根据第一对比结果中的尺度相似数量确定待识别倾角文字图像块的初始文字类别。
在本发明的一些实施例中,当需要对图像进行识别时,将获取到的待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建,以得到多个尺度下的待识别倾角文字图像块和多个模板文字图像块,在各个尺度下对待识别文字图像块和模板文字块进行相似度计算,统计各个尺度下的相似度值,若多个尺度下,待识别文字图像块和某一类别模板文字块都保持了较高的相似度(在预设的相似度阈值范围内),则将待识别文字图像块初步判定为上述模板文字类别。将各个尺度下的相似度值与预设的相似度阈值进行对比,当相似度值超过或者等于相似度阈值时,即可认定在该尺度下图像是相似的,统计各个模板图像有多少个尺度下待识别文字图像和模板图像是具有相似性的,若超过预设的数量,则将待识别文字图像块初步判定为上述模板文字类别;例如:预设的数量为4个尺度,待识别文字图像块与模板文字图像块A1在1个或者2个尺度下满足上述要求,则表明识别文字图像块与模板文字图像块A1不相似,识别文字图像块的文字类别不是模板文字图像块A1的文字类别;若待识别文字图像块与模板文字图像块A1在4个或者5个尺度下都满足上述要求,则表明识别文字图像块与模板文字图像块A1是相似的,可以确定识别文字图像块为模板文字图像块A1的文字类别。
S6、采用卷积核对待识别倾角文字图像块和其初始文字类别的鲁棒性文字模板进行过滤,以得到过滤待识别倾角文字图像块和过滤模板文字图像块;
在本发明的一些实施例中,确定好待识别文字图像块的初始文字类别后,为了保证识别的准确性,结合卷积核技术,利用3*3卷积核对待识别文字图像块和该类别文字模板进行过滤,以得到过滤待识别倾角文字图像块和过滤模板文字图像块。
S7、计算过滤待识别倾角文字图像块和过滤模板文字图像块的相似度,以得到过滤图像相似度值;
S8、根据过滤图像相似度值确定待识别倾角文字图像块的文字类别,生成识别结果。
进一步地,将过滤图像相似度值与预设的相似度阈值进行对比,生成第二对比结果;根据第二对比结果确定待识别倾角文字图像块的文字类别,生成识别结果。
在本发明的一些实施例中,基于过滤后的结果,计算过滤后该类文字模板和过滤后待识别文字图像块的相似度,若该类模板文字块和待识别图像仍然保持较高的相似度,我们将待识别文字图像块最终判定为上述模板文字类别,识别完成。为了保证对相似度的准确判断,先预设定一个相似度阈值,当过滤图像相似度值超过或者等于预设的相似度阈值则表明两个图像具有较高的相似度,例如,预设的相似度阈值为0.8,当过滤图像相似度值为0.8或者0.86,则可确定待识别倾角文字图像块为初始确定的模板的文字类别,进而达到精确识别的效果。
为了解决现有技术中对倾角文字图像识别不准确的问题,本方法基于多个鲁棒性模板,在鲁棒性模板挑选的过程中,充分考虑了倾角文字图像块,使识别模型具有识别倾角文字的能力;同时利用多尺度相似性计算和单卷积核相结合的方式对图像进行全面精确的识别,提升了倾角文字识别的精准度。
如图2所示,第二方面,本发明实施例提供一种基于鲁棒性模板的倾角文字精准识别系统,包括样本获取模块100、模板建立模块200、尺度构建模块300、相似度计算模块400、初始类别模块500、过滤模块600、过滤计算模块700以及识别模块800,其中:
样本获取模块100,用于获取样本文字图像块,并建立样本图像数据集;上述样本图像数据集包括多个倾角文字图像块和多个正角文字图像块;
模板建立模块200,用于根据样本图像数据集中的文字类别建立对应文字类别的多个鲁棒性文字模板;
尺度构建模块300,用于获取待识别倾角文字图像块,并将待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建,以得到多个尺度下的待识别倾角文字图像块和多个模板文字图像块;
相似度计算模块400,用于计算各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度,以得到各个尺度下的相似度值;
初始类别模块500,用于根据各个尺度下的相似度值确定待识别倾角文字图像块的初始文字类别;
过滤模块600,用于采用卷积核对待识别倾角文字图像块和其初始文字类别的鲁棒性文字模板进行过滤,以得到过滤待识别倾角文字图像块和过滤模板文字图像块;
过滤计算模块700,用于计算过滤待识别倾角文字图像块和过滤模板文字图像块的相似度,以得到过滤图像相似度值;
识别模块800,用于根据过滤图像相似度值确定待识别倾角文字图像块的文字类别,生成识别结果。
为了解决现有技术中对倾角文字图像识别不准确的问题,本系统基于多个鲁棒性模板,并利用多尺度相似性计算和单卷积核相结合的方式对文字图像进行精准识别。首先,通过样本获取模块100获取样本文字图像块,并建立样本图像数据集,上述样本图像数据集包括多个倾角文字图像块和多个正角文字图像块,在前期挑选样本的时候就加入了倾角文字图像块,以便后续在建立鲁棒性模板时,也充分考虑倾角文字图像块,使建立的模板模型具有识别倾角文字的能力,进而提高文字图像识别的精准性。选取多个文字类别的样本图像,模板建立模块200根据不同的文字类别分别建立挑选对应文字类别的多个鲁棒性文字模板,为后续文字识别提供模板基础。当需要对图像进行识别时,尺度构建模块300将获取到的待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建,以得到多个尺度下的待识别倾角文字图像块和多个模板文字图像块,相似度计算模块400在各个尺度下对待识别文字图像块和模板文字块进行相似度计算,统计各个尺度下的相似度值,若多个尺度下,待识别文字图像块和某一类别模板文字块都保持了较高的相似度(在预设的相似度阈值范围内),则将待识别文字图像块初步判定为上述模板文字类别;确定好待识别文字图像块的初始文字类别后,为了保证识别的准确性,结合卷积核技术,过滤模块600利用3*3卷积核对待识别文字图像块和该类别文字模板进行过滤,基于过滤后的结果,过滤计算模块700计算过滤后该类文字模板和过滤后待识别文字图像块的相似度,若该类模板文字块和待识别图像仍然保持较高的相似度,我们将待识别文字图像块最终判定为上述模板文字类别,识别完成。
本系统在鲁棒性模板挑选的过程中,充分考虑了倾角文字图像块,使识别模型具有识别倾角文字的能力;同时利用多尺度相似性计算和单卷积核相结合的方式对图像进行全面精确的识别,提升了倾角文字识别的精准度。
如图3所示,第三方面,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器101(Random Access Memory,RAM),只读存储器101(Read Only Memory,ROM),可编程只读存储器101(ProgrammableRead-Only Memory,PROM),可擦除只读存储器101(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器101(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器102,包括中央处理器102(Central Processing Unit,CPU)、网络处理器102(Network Processor,NP)等;还可以是数字信号处理器102(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及系统和方法,也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器101(ROM,Read-Only Memory)、随机存取存储器101(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (10)

1.一种基于鲁棒性模板的倾角文字精准识别方法,其特征在于,包括以下步骤:
获取样本文字图像块,并建立样本图像数据集;所述样本图像数据集包括多个倾角文字图像块和多个正角文字图像块;
根据样本图像数据集中的文字类别建立对应文字类别的多个鲁棒性文字模板;
获取待识别倾角文字图像块,并将待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建,以得到多个尺度下的待识别倾角文字图像块和多个模板文字图像块;
计算各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度,以得到各个尺度下的相似度值;
根据各个尺度下的相似度值确定待识别倾角文字图像块的初始文字类别;
采用卷积核对待识别倾角文字图像块和其初始文字类别的鲁棒性文字模板进行过滤,以得到过滤待识别倾角文字图像块和过滤模板文字图像块;
计算过滤待识别倾角文字图像块和过滤模板文字图像块的相似度,以得到过滤图像相似度值;
根据过滤图像相似度值确定待识别倾角文字图像块的文字类别,生成识别结果。
2.根据权利要求1所述的一种基于鲁棒性模板的倾角文字精准识别方法,其特征在于,所述根据样本图像数据集中的文字类别建立对应文字类别的多个鲁棒性文字模板的方法包括以下步骤:
从样本图像数据集中选取并根据多个倾角文字图像块和多个正角文字图像块建立模板样本集;
将模板样本集中的各个文字图像块进行深度自编码;
计算并根据自编码后的各个文字图像块两两之间的欧式距离对模板样本集中的文字图像块进行筛选,以得到多个目标文字图像块,将各个目标文字图像块作为鲁棒性文字模板。
3.根据权利要求2所述的一种基于鲁棒性模板的倾角文字精准识别方法,其特征在于,所述计算并根据自编码后的各个文字图像块两两之间的欧式距离对模板样本集中的文字图像块进行筛选,以得到多个目标文字图像块,将各个目标文字图像块作为鲁棒性文字模板的方法包括以下步骤:
计算自编码后的各个文字图像块两两之间的欧式距离,以得到两两文字图像块对应的欧式距离值;
根据各个欧式距离值和预设的差异性阈值对模板样本集中的文字图像块进行筛选,筛选出对应的欧式距离值超过预设的差异性阈值的各个文字图像块,将筛选出的各个文字图像块作为鲁棒性文字模板。
4.根据权利要求3所述的一种基于鲁棒性模板的倾角文字精准识别方法,其特征在于,所述根据各个欧式距离值和预设的差异性阈值对模板样本集中的文字图像块进行筛选,筛选出对应的欧式距离值超过预设的差异性阈值的各个文字图像块,将筛选出的各个文字图像块作为鲁棒性文字模板的方法包括以下步骤:
根据两两文字图像块对应的欧式距离值与预设的相似性阈值对各个文字图像块进行筛选,筛选的得到多个有效文字图像;
计算各个有效文字图像两两之间的欧式距离,得到多个有效欧式距离值;
根据各个有效欧式距离值和预设的差异性阈值对模板样本集中的文字图像块进行筛选,筛选出对应的欧式距离值超过预设的差异性阈值的各个文字图像块,将筛选出的各个文字图像块作为鲁棒性文字模板。
5.根据权利要求1所述的一种基于鲁棒性模板的倾角文字精准识别方法,其特征在于,所述计算各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度的方法包括以下步骤:
对各个尺度下的待识别倾角文字图像块与各个模板文字图像块进行深度自编码;
计算并根据自编码后的各个模板文字图像块与待识别倾角文字图像块之间的欧式距离确定各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度。
6.根据权利要求1所述的一种基于鲁棒性模板的倾角文字精准识别方法,其特征在于,所述根据各个尺度下的相似度值确定待识别倾角文字图像块的初始文字类别的方法包括以下步骤:
将各个尺度下的相似度值与预设的相似度阈值进行对比,生成第一对比结果;
根据第一对比结果中的尺度相似数量确定待识别倾角文字图像块的初始文字类别。
7.根据权利要求1所述的一种基于鲁棒性模板的倾角文字精准识别方法,其特征在于,所述根据过滤图像相似度值确定待识别倾角文字图像块的文字类别,生成识别结果的方法包括以下步骤:
将过滤图像相似度值与预设的相似度阈值进行对比,生成第二对比结果;
根据第二对比结果确定待识别倾角文字图像块的文字类别,生成识别结果。
8.一种基于鲁棒性模板的倾角文字精准识别系统,其特征在于,包括样本获取模块、模板建立模块、尺度构建模块、相似度计算模块、初始类别模块、过滤模块、过滤计算模块以及识别模块,其中:
样本获取模块,用于获取样本文字图像块,并建立样本图像数据集;所述样本图像数据集包括多个倾角文字图像块和多个正角文字图像块;
模板建立模块,用于根据样本图像数据集中的文字类别建立对应文字类别的多个鲁棒性文字模板;
尺度构建模块,用于获取待识别倾角文字图像块,并将待识别倾角文字图像块和各个鲁棒性文字模板进行多尺度构建,以得到多个尺度下的待识别倾角文字图像块和多个模板文字图像块;
相似度计算模块,用于计算各个尺度下的待识别倾角文字图像块与各个模板文字图像块的相似度,以得到各个尺度下的相似度值;
初始类别模块,用于根据各个尺度下的相似度值确定待识别倾角文字图像块的初始文字类别;
过滤模块,用于采用卷积核对待识别倾角文字图像块和其初始文字类别的鲁棒性文字模板进行过滤,以得到过滤待识别倾角文字图像块和过滤模板文字图像块;
过滤计算模块,用于计算过滤待识别倾角文字图像块和过滤模板文字图像块的相似度,以得到过滤图像相似度值;
识别模块,用于根据过滤图像相似度值确定待识别倾角文字图像块的文字类别,生成识别结果。
9.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
CN202110876329.4A 2021-07-31 2021-07-31 一种基于鲁棒性模板的倾角文字精准识别方法及系统 Active CN113313217B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110876329.4A CN113313217B (zh) 2021-07-31 2021-07-31 一种基于鲁棒性模板的倾角文字精准识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110876329.4A CN113313217B (zh) 2021-07-31 2021-07-31 一种基于鲁棒性模板的倾角文字精准识别方法及系统

Publications (2)

Publication Number Publication Date
CN113313217A true CN113313217A (zh) 2021-08-27
CN113313217B CN113313217B (zh) 2021-11-02

Family

ID=77382411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110876329.4A Active CN113313217B (zh) 2021-07-31 2021-07-31 一种基于鲁棒性模板的倾角文字精准识别方法及系统

Country Status (1)

Country Link
CN (1) CN113313217B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113903035A (zh) * 2021-12-06 2022-01-07 北京惠朗时代科技有限公司 一种基于超分辨率多尺度重建的文字识别方法及系统
CN113902046A (zh) * 2021-12-10 2022-01-07 北京惠朗时代科技有限公司 一种特效字体识别方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020131642A1 (en) * 2001-02-02 2002-09-19 Lee Shih-Jong J. Robust method for automatic reading of skewed, rotated or partially obscured characters
CN101859382A (zh) * 2010-06-03 2010-10-13 复旦大学 一种基于最大稳定极值区域的车牌检测与识别的方法
CN103473545A (zh) * 2013-08-01 2013-12-25 西安交通大学 一种基于多特征的文本图像相似度度量方法
CN105913093A (zh) * 2016-05-03 2016-08-31 电子科技大学 一种用于文字识别处理的模板匹配方法
CN107247950A (zh) * 2017-06-06 2017-10-13 电子科技大学 一种基于机器学习的身份证图像文本识别方法
CN112016547A (zh) * 2020-08-20 2020-12-01 上海天壤智能科技有限公司 基于深度学习的图像文字识别方法、系统及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020131642A1 (en) * 2001-02-02 2002-09-19 Lee Shih-Jong J. Robust method for automatic reading of skewed, rotated or partially obscured characters
CN101859382A (zh) * 2010-06-03 2010-10-13 复旦大学 一种基于最大稳定极值区域的车牌检测与识别的方法
CN103473545A (zh) * 2013-08-01 2013-12-25 西安交通大学 一种基于多特征的文本图像相似度度量方法
CN105913093A (zh) * 2016-05-03 2016-08-31 电子科技大学 一种用于文字识别处理的模板匹配方法
CN107247950A (zh) * 2017-06-06 2017-10-13 电子科技大学 一种基于机器学习的身份证图像文本识别方法
CN112016547A (zh) * 2020-08-20 2020-12-01 上海天壤智能科技有限公司 基于深度学习的图像文字识别方法、系统及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
牛轶峰,伯晓晨,沈林成: "基于可变模板的文本倾斜检测", 《计算机工程》 *
胡洋,石煌雄,蒋作,潘文林: "基于分类模板数据库的电气铭牌识别", 《现代电子技术》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113903035A (zh) * 2021-12-06 2022-01-07 北京惠朗时代科技有限公司 一种基于超分辨率多尺度重建的文字识别方法及系统
CN113902046A (zh) * 2021-12-10 2022-01-07 北京惠朗时代科技有限公司 一种特效字体识别方法及装置
CN113902046B (zh) * 2021-12-10 2022-02-18 北京惠朗时代科技有限公司 一种特效字体识别方法及装置

Also Published As

Publication number Publication date
CN113313217B (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN108256568B (zh) 一种植物种类识别方法以及装置
CN108920580B (zh) 图像匹配方法、装置、存储介质及终端
CN107690657B (zh) 根据影像发现商户
CN113313217B (zh) 一种基于鲁棒性模板的倾角文字精准识别方法及系统
CN109191226B (zh) 风险控制方法和装置
WO2018001195A1 (zh) 数据风险控制的方法及装置
CN108986125B (zh) 物体边缘提取方法、装置及电子设备
CN113837151B (zh) 表格图像处理方法、装置、计算机设备及可读存储介质
CN113138982B (zh) 一种大数据清洗方法
CN114581207B (zh) 一种面向电商平台的商品图像大数据精准推送方法及系统
CN115100450B (zh) 基于人工智能的智慧交通品牌汽车大数据检测方法及系统
CN115018492A (zh) 一种基于人工智能的智慧校园自动结账方法及系统
CN115759148B (zh) 图像处理方法、装置、计算机设备及计算机可读存储介质
CN114596441A (zh) 一种面向网络直播社交大数据的海量图像去噪方法及系统
CN115600249A (zh) 基于区块链的元宇宙电商购物大数据安全保护方法及系统
CN114155172A (zh) 一种图像处理方法和系统
CN113221752A (zh) 一种基于多模板匹配的多尺度文字精准识别方法
CN112906696A (zh) 一种英文图像区域识别方法及装置
CN112836636A (zh) 一种签字图像真伪鉴别方法及装置
CN114723536B (zh) 基于图像大数据比对的电商平台廉价商品选取方法及系统
CN110738204B (zh) 一种证件区域定位的方法及装置
CN111428725A (zh) 数据结构化处理方法、装置和电子设备
CN116562991A (zh) 面向元宇宙电商平台的商品大数据信息识别方法及系统
CN115713630A (zh) 基于人工智能的低质量盖章图像大数据识别方法及系统
CN115205866A (zh) 一种基于区块链的科技论文大数据抄袭检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant