CN113902046B - 一种特效字体识别方法及装置 - Google Patents
一种特效字体识别方法及装置 Download PDFInfo
- Publication number
- CN113902046B CN113902046B CN202111509028.4A CN202111509028A CN113902046B CN 113902046 B CN113902046 B CN 113902046B CN 202111509028 A CN202111509028 A CN 202111509028A CN 113902046 B CN113902046 B CN 113902046B
- Authority
- CN
- China
- Prior art keywords
- special effect
- preset
- recognized
- font
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
Abstract
本发明提出了一种特效字体识别方法及装置,涉及字体识别技术领域。该方法包括:利用特征算子表征,计算编号一致的相似度,若相似度大于预设值的数目未达到第一预设数目,判定待识别特效字体为非模板类别文字。利用空洞率为第一预置值的卷积核处理,计算编号一致的相似度,若相似度大于预设值的数目未达到第二预设数目,判定待识别特效字体为非模板类别文字。若相似的数量达到第三预设数目,判定待识别特效字体为非模板类别文字,否则待识别特效字体为模板类别文字。本发明分别在多个区域中利用特征算子、差异性空洞卷积计算编号一致的两个区域的相似度,以此判断待识别特效字体,提高对特效字体识别的精准度,达到较为精确识别特效字体的效果。
Description
技术领域
本发明涉及字体识别技术领域,具体而言,涉及一种特效字体识别方法及装置。
背景技术
在数字媒体时代,合同、协议、论文等不仅包含了丰富的语义信息,也可以以图片的形式将合同、协议、论文等呈现出来,以方便大家进行阅读。同时,文字识别技术可以较为精准地将图片中的文字识别出来,更进一步地方便了大家对其进行编辑。
然而,合同、协议、论文中的字体往往存在明显的多样性,甚至会出现特效字体,显著增加了字体识别的难度。传统的识别方法虽然能够对特效字体进行识别,但识别精度无法达到预期效果。
专利文献CN113221904A公开了一种语义关联文字识别方法及装置,其虽然能够通过语义关联对每个块中的文字进行检验,以对每个块中文字之间进行语义关联,以提高文字识别的正确率。但是若利用该专利文献的技术方案识别合同、协议、论文中的特效字体,由于特效字体的个性化字体风格,与楷体、宋体等易识别的字体截然不同,则无法保证对特效字体的识别精度。专利文献CN105913093B公开了一种用于文字识别处理的模板匹配方法,该方法在模板集合中进行匹配寻优,以确定待识别图像的最优匹配模板。虽然能够解决场景图像的褶皱、尺度多变以及光照多变等因素对文字识别造成的影响,但是由于特效字体的个性化和多样性,则通过该模板匹配方法无法对特效字体进行有效识别。专利文献CN112784932A公开了一种字体识别方法、装置和存储介质,该字体识别方法、装置和存储介质通过提取每一个字体图片的特征点,再分别进行文本区域图片和每一个字体图片特征点匹配,以确定对应的特征相似度,进而选定特征相似度最大的字体图片所对应的字体为所述文本区域图片的字体。由于楷体、宋体等易识别的字体不仅特征点明显且是统一性字体,采用该字体识别方法、装置和存储介质可以起到一定的识别效果,但是对于多样化且非统一的特效字体而言,仅仅凭借特征点无法进行有效匹配,则达不到预期的识别精度。
发明内容
本发明的目的在于提供一种特效字体识别方法及装置,用以改善现有技术中虽然能对特效字体进行识别,但识别精度无法达到预期效果的问题。
本发明的实施例是这样实现的:
第一方面,本申请实施例提供一种特效字体识别方法,其包括如下步骤:步骤S110:获取待识别特效字体。步骤S120:分别将待识别特效字体和预设文字模板等分为预设数量个区域,并对区域进行编号,其中,位于相同位置的两个区域的编号一致。步骤S130:利用SIFT特征算子同时对待识别特效字体和预设文字模板进行表征后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到第一预设数目,则判定待识别特效字体为非模板类别文字,否则,执行步骤S140。步骤S140:利用空洞率为第一预置值的卷积核对待识别特效字体和预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到第二预设数目,则判定待识别特效字体为非模板类别文字,否则,依次增加第一预置值的数值对待识别特效字体进行判断,当增加后的第一预置值等于第二预置值时,执行步骤S150。步骤S150:若两个区域相似的数量未达到第三预设数目,则判定待识别特效字体为非模板类别文字,若两个区域相似的数量达到第三预设数目,则判定待识别特效字体为模板类别文字。
在本发明的一些实施例中,上述步骤S120之前,该方法还包括:选取多个文字图片。分别增加多个文字图片中文字的特效字体,以生成特效字体图片。选取多个特效字体图片作为预设文字模板。
在本发明的一些实施例中,该方法还包括:分别对多个文字图片进行GIST特征提取。
在本发明的一些实施例中,上述选取多个特效字体图片作为预设文字模板的步骤包括以下步骤:利用欧式距离计算不同文字图片的相似度。若多个文字图片的相似度高于预设相似值,则将任一文字图片作为预设文字模板。
在本发明的一些实施例中,上述步骤S120包括:分别将待识别特效字体和预设文字模板等分为4个区域。
在本发明的一些实施例中,上述步骤S140包括以下步骤:利用空洞率为1的卷积核对待识别特效字体和预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到3个,则判定待识别特效字体为非模板类别文字,否则,增加卷积核的空洞率为2对待识别特效字体进行判断,当卷积核的空洞率等于3时,执行步骤S150。
在本发明的一些实施例中,上述步骤S150包括以下步骤:若两个区域相似的数量未达到3个,则判定待识别特效字体为非模板类别文字,若两个区域相似的数量达到3个,则判定待识别特效字体为模板类别文字。
第二方面,本申请实施例提供一种特效字体识别装置,其包括:待识别特效字体获取模块,用于获取待识别特效字体。区域等分模块,用于分别将待识别特效字体和预设文字模板等分为预设数量个区域,并对区域进行编号,其中,位于相同位置的两个区域的编号一致。非模板类别文字判定模块,用于利用SIFT特征算子同时对待识别特效字体和预设文字模板进行表征后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到第一预设数目,则判定待识别特效字体为非模板类别文字,否则,执行卷积核处理模块。卷积核处理模块,用于利用空洞率为第一预置值的卷积核对待识别特效字体和预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到第二预设数目,则判定待识别特效字体为非模板类别文字,否则,依次增加第一预置值的数值对待识别特效字体进行判断,当增加后的第一预置值等于第二预置值时,执行模板类别文字判定模块。模板类别文字判定模块,用于若两个区域相似的数量未达到第三预设数目,则判定待识别特效字体为非模板类别文字,若两个区域相似的数量达到第三预设数目,则判定待识别特效字体为模板类别文字。
在本发明的一些实施例中,上述特效字体识别装置还包括:文字图片获取模块,用于选取多个文字图片。特效字体图片生成模块,用于分别增加多个文字图片中文字的特效字体,以生成特效字体图片。预设文字模板选取模块,用于选取多个特效字体图片作为预设文字模板。
在本发明的一些实施例中,上述特效字体识别装置还包括:GIST特征提取模块,用于分别对多个文字图片进行GIST特征提取。
在本发明的一些实施例中,上述预设文字模板选取模块包括:相似度计算单元,用于利用欧式距离计算不同文字图片的相似度。预设文字模板选择单元,用于若多个文字图片的相似度高于预设相似值,则将任一文字图片作为预设文字模板。
在本发明的一些实施例中,上述区域等分模块包括:等分4个区域单元,用于分别将待识别特效字体和预设文字模板等分为4个区域。
在本发明的一些实施例中,上述卷积核处理模块包括:卷积核处理单元,用于利用空洞率为1的卷积核对待识别特效字体和预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到3个,则判定待识别特效字体为非模板类别文字,否则,增加卷积核的空洞率为2对待识别特效字体进行判断,当卷积核的空洞率等于3时,执行模板类别文字判定模块。
在本发明的一些实施例中,上述模板类别文字判定模块包括:模板类别文字判别单元,用于若两个区域相似的数量未达到3个,则判定待识别特效字体为非模板类别文字,若两个区域相似的数量达到3个,则判定待识别特效字体为模板类别文字。
第三方面,本申请实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
相对于现有技术,本发明的实施例至少具有如下优点或有益效果:
本发明提供一种特效字体识别方法及装置,其包括如下步骤:步骤S110:获取待识别特效字体。步骤S120:分别将待识别特效字体和预设文字模板等分为预设数量个区域,并对区域进行编号,其中,位于相同位置的两个区域的编号一致。步骤S130:利用SIFT特征算子同时对待识别特效字体和预设文字模板进行表征后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到第一预设数目,则判定待识别特效字体为非模板类别文字,否则,执行步骤S140。步骤S140:利用空洞率为第一预置值的卷积核对待识别特效字体和预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到第二预设数目,则判定待识别特效字体为非模板类别文字,否则,依次增加第一预置值的数值对待识别特效字体进行判断,当增加后的第一预置值等于第二预置值时,执行步骤S150。步骤S150:若两个区域相似的数量未达到第三预设数目,则判定待识别特效字体为非模板类别文字,若两个区域相似的数量达到第三预设数目,则判定待识别特效字体为模板类别文字。
该方法及装置通过将待识别特效字体和预设文字模板等分为多个区域,分别在多个区域中利用SIFT特征算子对待识别特效字体和预设文字模板进行表征,以深入提取待识别特效字体和预设文字模板中的特征,进而有效提升特效字体识别的精准度。并在待识别特效字体和预设文字模板相同的情况下,通过增加卷积核的空洞率形成差异性空洞卷积,差异性空洞卷积可以得到更大的感受野,进而提高待识别特效字体和预设文字模板中的识别分割的效果。通过上述差异性空洞卷积进行特征提取,可以更加深入地提取图像特征,进一步提高对特效字体识别的精准度。即分别在多个区域中利用SIFT特征算子、差异性空洞卷积计算编号一致的两个区域的相似度,并根据相似度的结果对待识别特效字体进行判断,可以提高对特效字体识别的精准度,达到较为精确地识别特效字体的效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种特效字体识别方法的流程图;
图2为本发明实施例提供的一种特效字体识别装置的结构框图;
图3为本发明实施例提供的一种电子设备的示意性结构框图;
图4为本发明实施例提供的一种等分示意图。
图标:100-特效字体识别装置;110-待识别特效字体获取模块;120-区域等分模块;130-非模板类别文字判定模块;140-卷积核处理模块;150-模板类别文字判定模块;101-存储器;102-处理器;103-通信接口。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,若出现术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,若出现由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本申请的描述中,需要说明的是,若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该申请产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,若出现术语“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。
实施例
请参阅图1,图1所示为本申请实施例提供的一种特效字体识别方法的流程图。一种特效字体识别方法,其包括如下步骤:
步骤S110:获取待识别特效字体;
具体的,可以通过拍照、扫描等方式获取图片,以得到图片中的待识别特效字体。
步骤S120:分别将待识别特效字体和预设文字模板等分为预设数量个区域,并对区域进行编号,其中,位于相同位置的两个区域的编号一致;
请参照图4,图4所示为本申请实施例提供的一种等分示意图。上述预设数量可以是4,从左至右,各个区域的编号依次为1、2、3、4。其中,待识别特效字体和预设文字模板中位置相同的两个区域编号一致,将待识别特效字体和预设文字模板等分为多个区域,并分别比较编号一致的两个区域,以得到多个比较结果,从而根据多个比较结果可以更好地判断特效字体,则可以有效提升对特效字体识别的精准度。
步骤S130:利用SIFT特征算子同时对待识别特效字体和预设文字模板进行表征后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到第一预设数目,则判定待识别特效字体为非模板类别文字,否则,执行步骤S140;
具体的,上述SIFT特征算子即尺度不变特征变换,可以用于影像匹配。分别利用SIFT特征算子对待识别特效字体和预设文字模板中编号一致的区域进行表征,以深入提取待识别特效字体和预设文字模板中编号一致的区域中图像的特征,从而有效提升特效字体识别的精准度。
其中,上述预设值可以是90%,上述第一预设数目可以为3个,利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到3个,则判定待识别特效字体为非模板类别文字。
步骤S140:利用空洞率为第一预置值的卷积核对待识别特效字体和预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到第二预设数目,则判定待识别特效字体为非模板类别文字,否则,依次增加第一预置值的数值对待识别特效字体进行判断,当增加后的第一预置值等于第二预置值时,执行步骤S150;
其中,上述第一预置值可以是1,上述第二预置值可以是3,上述第二预设数目可以与第一预设数目相同,上述第二预设数目可以是3。通过空洞率为1的卷积核处理待识别特效字体和预设文字模板后,再利用欧式距离计算编号一致的两个区域的相似度,并统计编号一致的两个区域的相似度大于预设值的数目。若统计的数目达到3个,则利用空洞率为2的卷积核处理待识别特效字体和预设文字模板,再利用欧式距离计算编号一致的两个区域的相似度,并统计编号一致的两个区域的相似度大于预设值的数目。若统计的数目达到3个,则利用空洞率为2的卷积核对待识别特效字体和预设文字模板进行处理后,执行步骤S150。
上述实现过程中,通过空洞卷积不仅可以保留图像的空间特征,也不会损失图像信息。在待识别特效字体和预设文字模板相同的情况下,通过增加卷积核的空洞率形成差异性空洞卷积,差异性空洞卷积可以得到更大的感受野,进而提高待识别特效字体和预设文字模板中的识别分割的效果。通过上述差异性空洞卷积进行特征提取,可以更加深入地提取图像特征,进一步提高对特效字体识别的精准度。
步骤S150:若两个区域相似的数量未达到第三预设数目,则判定待识别特效字体为非模板类别文字,若两个区域相似的数量达到第三预设数目,则判定待识别特效字体为模板类别文字。
其中,上述第三预设数目可以与第一预设数目一致,上述第三预设数目可以为3。若两个区域相似的数量达到3个,则判定待识别特效字体为模板类别文字,反之,则判定待识别特效字体为非模板类别文字,以达到识别特效字体的效果。该方法通过将待识别特效字体和预设文字模板等分为多个区域,分别在多个区域中利用SIFT特征算子、差异性空洞卷积计算编号一致的两个区域的相似度,根据相似度的计算结果判断待识别特效字体,以提高对特效字体识别的精准度,从而达到较为精确地识别特效字体的效果。
在本实施例的一些实施方式中,上述步骤S120之前,该方法还包括:选取多个文字图片。分别增加多个文字图片中文字的特效字体,以生成特效字体图片。选取多个特效字体图片作为预设文字模板。具体的,选取多个带有文字的文字图片。可以将文字图片中的文字转换为特效字体,达到增加文字图片中文字的特效字体的效果,以生成特效字体图片。选取具有代表性的多个特效字体图片作为预设文字模板,可以有效减少预设文字模板与待识别特效字体之间相似度的计算,也就减少了计算量,提高了识别特效字体的识别效率。
在本实施例的一些实施方式中,上述选取多个文字图片的步骤之后,该方法还包括:分别对多个文字图片进行GIST特征提取。具体的,GIST特征即全局特征信息。采用全局特征信息对文字图片进行识别与分类不需要对文字图片进行分割和局部特征提取,就可以实现文字图片识别与分类的目的。从而通过对多个文字图片进行GIST特征提取,以对文字图片进行识别分类。
在本实施例的一些实施方式中,上述选取多个特效字体图片作为预设文字模板的步骤包括以下步骤:利用欧式距离计算不同文字图片的相似度。若多个文字图片的相似度高于预设相似值,则将任一文字图片作为预设文字模板。具体的,在利用GIST特征算子过滤的基础上,利用欧式距离计算不同文字图片的相似度,以得到更加准确的不同文字图片之间的相似度。若存在多个文字图片的相似度高于预设相似值,则仅保留一个文字图片作为预设文字模板,从而保证挑选出的预设文字模板是具有代表性的。
示例性的,上述预设相似值可以是93%。
在本实施例的一些实施方式中,上述步骤S120包括:分别将待识别特效字体和预设文字模板等分为4个区域。
在本实施例的一些实施方式中,上述步骤S140包括以下步骤:利用空洞率为1的卷积核对待识别特效字体和预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到3个,则判定待识别特效字体为非模板类别文字,否则,增加卷积核的空洞率为2对待识别特效字体进行判断,当卷积核的空洞率等于3时,执行步骤S150。具体的,通过空洞率为1的卷积核处理待识别特效字体和预设文字模板后,再利用欧式距离计算编号一致的两个区域的相似度,并统计编号一致的两个区域的相似度大于预设值的数目。若统计的数目达到3个,则利用空洞率为2的卷积核处理待识别特效字体和预设文字模板,再利用欧式距离计算编号一致的两个区域的相似度,并统计编号一致的两个区域的相似度大于预设值的数目。若统计的数目达到3个,则利用空洞率为2的卷积核对待识别特效字体和预设文字模板进行处理后,执行步骤S150。从而在待识别特效字体和预设文字模板相同的情况下,通过增加卷积核的空洞率而造成的差异性空洞卷积,可以得到更大的感受野,进而提高待识别特效字体和预设文字模板中的识别分割的效果。
在本实施例的一些实施方式中,上述步骤S150包括以下步骤:若两个区域相似的数量未达到3个,则判定待识别特效字体为非模板类别文字,若两个区域相似的数量达到3个,则判定待识别特效字体为模板类别文字。从而实现识别特效字体的目的。
请参照图2,图2所示为本申请实施例提供一种特效字体识别装置100的结构框图。一种特效字体识别装置100,其包括:待识别特效字体获取模块110,用于获取待识别特效字体。区域等分模块120,用于分别将待识别特效字体和预设文字模板等分为预设数量个区域,并对区域进行编号,其中,位于相同位置的两个区域的编号一致。非模板类别文字判定模块150130,用于利用SIFT特征算子同时对待识别特效字体和预设文字模板进行表征后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到第一预设数目,则判定待识别特效字体为非模板类别文字,否则,执行卷积核处理模块140。卷积核处理模块140,用于利用空洞率为第一预置值的卷积核对待识别特效字体和预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到第二预设数目,则判定待识别特效字体为非模板类别文字,否则,依次增加第一预置值的数值对待识别特效字体进行判断,当增加后的第一预置值等于第二预置值时,执行模板类别文字判定模块150。模板类别文字判定模块150,用于若两个区域相似的数量未达到第三预设数目,则判定待识别特效字体为非模板类别文字,若两个区域相似的数量达到第三预设数目,则判定待识别特效字体为模板类别文字。
具体的,该装置通过将待识别特效字体和预设文字模板等分为多个区域,分别在多个区域中利用SIFT特征算子对待识别特效字体和预设文字模板进行表征,以深入提取待识别特效字体和预设文字模板中的特征,进而有效提升特效字体识别的精准度。并在待识别特效字体和预设文字模板相同的情况下,通过增加卷积核的空洞率形成差异性空洞卷积,差异性空洞卷积可以得到更大的感受野,进而提高待识别特效字体和预设文字模板中的识别分割的效果。通过上述差异性空洞卷积进行特征提取,可以更加深入地提取图像特征,进一步提高对特效字体识别的精准度。即分别在多个区域中利用SIFT特征算子、差异性空洞卷积计算编号一致的两个区域的相似度,并根据相似度的结果对待识别特效字体进行判断,以提高对特效字体识别的精准度,达到较为精确地识别特效字体的效果。
在本实施例的一些实施方式中,上述特效字体识别装置100还包括:文字图片获取模块,用于选取多个文字图片。特效字体图片生成模块,用于分别增加多个文字图片中文字的特效字体,以生成特效字体图片。预设文字模板选取模块,用于选取多个特效字体图片作为预设文字模板。具体的,选取多个带有文字的文字图片。可以将文字图片中的文字转换为特效字体,达到增加文字图片中文字的特效字体的效果,以生成特效字体图片。选取具有代表性的多个特效字体图片作为预设文字模板,可以有效减少预设文字模板与待识别特效字体之间相似度的计算,也就减少了计算量,提高了识别特效字体的识别效率。
在本实施例的一些实施方式中,上述特效字体识别装置100还包括:GIST特征提取模块,用于分别对多个文字图片进行GIST特征提取。具体的,GIST特征即全局特征信息。采用全局特征信息对文字图片进行识别与分类不需要对文字图片进行分割和局部特征提取,就可以实现文字图片识别与分类的目的。从而通过对多个文字图片进行GIST特征提取,以对文字图片进行识别分类。
在本实施例的一些实施方式中,上述预设文字模板选取模块包括:相似度计算单元,用于利用欧式距离计算不同文字图片的相似度。预设文字模板选择单元,用于若多个文字图片的相似度高于预设相似值,则将任一文字图片作为预设文字模板。具体的,在利用GIST特征算子过滤的基础上,利用欧式距离计算不同文字图片的相似度,以得到更加准确的不同文字图片之间的相似度。若存在多个文字图片的相似度高于预设相似值,则仅保留一个文字图片作为预设文字模板,从而保证挑选出的预设文字模板是具有代表性的。
在本实施例的一些实施方式中,上述区域等分模块120包括:等分4个区域单元,用于分别将待识别特效字体和预设文字模板等分为4个区域。
在本实施例的一些实施方式中,上述卷积核处理模块140包括:卷积核处理单元,用于利用空洞率为1的卷积核对待识别特效字体和预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到3个,则判定待识别特效字体为非模板类别文字,否则,增加卷积核的空洞率为2对待识别特效字体进行判断,当卷积核的空洞率等于3时,执行模板类别文字判定模块150。具体的,通过空洞率为1的卷积核处理待识别特效字体和预设文字模板后,再利用欧式距离计算编号一致的两个区域的相似度,并统计编号一致的两个区域的相似度大于预设值的数目。若统计的数目达到3个,则利用空洞率为2的卷积核处理待识别特效字体和预设文字模板,再利用欧式距离计算编号一致的两个区域的相似度,并统计编号一致的两个区域的相似度大于预设值的数目。若统计的数目达到3个,则利用空洞率为2的卷积核对待识别特效字体和预设文字模板进行处理后,执行步骤S150。从而在待识别特效字体和预设文字模板相同的情况下,通过增加卷积核的空洞率而造成的差异性空洞卷积,可以得到更大的感受野,进而提高待识别特效字体和预设文字模板中的识别分割的效果。
在本实施例的一些实施方式中,上述模板类别文字判定模块150包括:模板类别文字判别单元,用于若两个区域相似的数量未达到3个,则判定待识别特效字体为非模板类别文字,若两个区域相似的数量达到3个,则判定待识别特效字体为模板类别文字。从而实现识别特效字体的目的。
请参阅图3,图3为本申请实施例提供的电子设备的一种示意性结构框图。电子设备包括存储器101、处理器102和通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,如本申请实施例所提供的一种特效字体识别装置100对应的程序指令/模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器101(Random Access Memory,RAM),只读存储器101(Read Only Memory,ROM),可编程只读存储器101(ProgrammableRead-Only Memory,PROM),可擦除只读存储器101(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器101(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器102,包括中央处理器102(Central Processing Unit,CPU)、网络处理器102(Network Processor,NP)等;还可以是数字信号处理器102(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可以理解,图3所示的结构仅为示意,电子设备还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。图3中所示的各组件可以采用硬件、软件或其组合实现。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器101(ROM,Read-Only Memory)、随机存取存储器101(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本申请实施例提供的一种特效字体识别方法及装置,其包括如下步骤:步骤S110:获取待识别特效字体。步骤S120:分别将待识别特效字体和预设文字模板等分为预设数量个区域,并对区域进行编号,其中,位于相同位置的两个区域的编号一致。步骤S130:利用SIFT特征算子同时对待识别特效字体和预设文字模板进行表征后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到第一预设数目,则判定待识别特效字体为非模板类别文字,否则,执行步骤S140。步骤S140:利用空洞率为第一预置值的卷积核对待识别特效字体和预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个区域的相似度,统计编号一致的两个区域的相似度大于预设值的数目,若统计的数目未达到第二预设数目,则判定待识别特效字体为非模板类别文字,否则,依次增加第一预置值的数值对待识别特效字体进行判断,当增加后的第一预置值等于第二预置值时,执行步骤S150。步骤S150:若两个区域相似的数量未达到第三预设数目,则判定待识别特效字体为非模板类别文字,若两个区域相似的数量达到第三预设数目,则判定待识别特效字体为模板类别文字。该方法及装置通过将待识别特效字体和预设文字模板等分为多个区域,分别在多个区域中利用SIFT特征算子对待识别特效字体和预设文字模板进行表征,以深入提取待识别特效字体和预设文字模板中的特征,进而有效提升特效字体识别的精准度。并在待识别特效字体和预设文字模板相同的情况下,通过增加卷积核的空洞率形成差异性空洞卷积,差异性空洞卷积可以得到更大的感受野,进而提高待识别特效字体和预设文字模板中的识别分割的效果。通过上述差异性空洞卷积进行特征提取,可以更加深入地提取图像特征,进一步提高对特效字体识别的精准度。即分别在多个区域中利用SIFT特征算子、差异性空洞卷积计算编号一致的两个区域的相似度,并根据相似度的结果对待识别特效字体进行判断,可以提高对特效字体识别的精准度,达到较为精确地识别特效字体的效果。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种特效字体识别方法,其特征在于,包括如下步骤:
步骤S110:获取待识别特效字体;
步骤S120:分别将所述待识别特效字体和预设文字模板等分为预设数量个区域,并对所述区域进行编号,其中,位于相同位置的两个所述区域的编号一致;
步骤S130:利用SIFT特征算子同时对所述待识别特效字体和所述预设文字模板进行表征后,分别利用欧式距离计算编号一致的两个所述区域的相似度,统计编号一致的两个所述区域的相似度大于预设值的数目,若统计的数目未达到第一预设数目,则判定所述待识别特效字体为非模板类别文字,否则,执行步骤S140;
步骤S140:利用空洞率为第一预置值的卷积核对所述待识别特效字体和所述预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个所述区域的相似度,统计编号一致的两个所述区域的相似度大于预设值的数目,若统计的数目未达到第二预设数目,则判定所述待识别特效字体为非模板类别文字,否则,依次增加第一预置值的数值对所述待识别特效字体进行判断,当增加后的第一预置值等于第二预置值时,执行步骤S150;
步骤S150:若两个所述区域相似的数量未达到第三预设数目,则判定所述待识别特效字体为非模板类别文字,若两个所述区域相似的数量达到第三预设数目,则判定所述待识别特效字体为模板类别文字。
2.根据权利要求1所述的特效字体识别方法,其特征在于,所述步骤S120之前,还包括:
选取多个文字图片;
分别增加多个所述文字图片中文字的特效字体,以生成特效字体图片;
选取多个特效字体图片作为预设文字模板。
3.根据权利要求2所述的特效字体识别方法,其特征在于,所述选取多个文字图片的步骤之后,还包括:
分别对多个所述文字图片进行GIST特征提取。
4.根据权利要求3所述的特效字体识别方法,其特征在于,所述选取多个特效字体图片作为预设文字模板的步骤包括以下步骤:
利用欧式距离计算不同所述文字图片的相似度;
若多个所述文字图片的相似度高于预设相似值,则将任一所述文字图片作为预设文字模板。
5.根据权利要求1所述的特效字体识别方法,其特征在于,所述步骤S120包括:
分别将所述待识别特效字体和预设文字模板等分为4个区域。
6.根据权利要求5所述的特效字体识别方法,其特征在于,所述步骤S140包括以下步骤:
利用空洞率为1的卷积核对所述待识别特效字体和所述预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个所述区域的相似度,统计编号一致的两个所述区域的相似度大于预设值的数目,若统计的数目未达到3个,则判定所述待识别特效字体为非模板类别文字,否则,增加卷积核的空洞率为2对所述待识别特效字体进行判断,当卷积核的空洞率等于3时,执行步骤S150。
7.根据权利要求6所述的特效字体识别方法,其特征在于,所述步骤S150包括以下步骤:
若两个所述区域相似的数量未达到3个,则判定所述待识别特效字体为非模板类别文字,若两个所述区域相似的数量达到3个,则判定所述待识别特效字体为模板类别文字。
8.一种特效字体识别装置,其特征在于,包括:
待识别特效字体获取模块,用于获取待识别特效字体;
区域等分模块,用于分别将所述待识别特效字体和预设文字模板等分为预设数量个区域,并对所述区域进行编号,其中,位于相同位置的两个所述区域的编号一致;
非模板类别文字判定模块,用于利用SIFT特征算子同时对所述待识别特效字体和所述预设文字模板进行表征后,分别利用欧式距离计算编号一致的两个所述区域的相似度,统计编号一致的两个所述区域的相似度大于预设值的数目,若统计的数目未达到第一预设数目,则判定所述待识别特效字体为非模板类别文字,否则,执行卷积核处理模块;
卷积核处理模块,用于利用空洞率为第一预置值的卷积核对所述待识别特效字体和所述预设文字模板进行处理后,分别利用欧式距离计算编号一致的两个所述区域的相似度,统计编号一致的两个所述区域的相似度大于预设值的数目,若统计的数目未达到第二预设数目,则判定所述待识别特效字体为非模板类别文字,否则,依次增加第一预置值的数值对所述待识别特效字体进行判断,当增加后的第一预置值等于第二预置值时,执行模板类别文字判定模块;
模板类别文字判定模块,用于若两个所述区域相似的数量未达到第三预设数目,则判定所述待识别特效字体为非模板类别文字,若两个所述区域相似的数量达到第三预设数目,则判定所述待识别特效字体为模板类别文字。
9.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111509028.4A CN113902046B (zh) | 2021-12-10 | 2021-12-10 | 一种特效字体识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111509028.4A CN113902046B (zh) | 2021-12-10 | 2021-12-10 | 一种特效字体识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113902046A CN113902046A (zh) | 2022-01-07 |
CN113902046B true CN113902046B (zh) | 2022-02-18 |
Family
ID=79026142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111509028.4A Active CN113902046B (zh) | 2021-12-10 | 2021-12-10 | 一种特效字体识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113902046B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144254A (zh) * | 2019-12-18 | 2020-05-12 | 江河瑞通(北京)技术有限公司 | 城市内涝积水程度识别方法及装置 |
CN111753727A (zh) * | 2020-06-24 | 2020-10-09 | 北京百度网讯科技有限公司 | 用于提取结构化信息的方法、装置、设备及可读存储介质 |
CN112070174A (zh) * | 2020-09-11 | 2020-12-11 | 上海海事大学 | 一种基于深度学习的自然场景下文本检测方法 |
CN113095313A (zh) * | 2021-04-07 | 2021-07-09 | 中国工商银行股份有限公司 | 文本字符串的识别方法、装置和服务器 |
CN113221904A (zh) * | 2021-05-13 | 2021-08-06 | 北京惠朗时代科技有限公司 | 一种语义关联文字识别方法及装置 |
CN113313217A (zh) * | 2021-07-31 | 2021-08-27 | 北京惠朗世纪科技有限公司 | 一种基于鲁棒性模板的倾角文字精准识别方法及系统 |
WO2021196013A1 (zh) * | 2020-03-31 | 2021-10-07 | 京东方科技集团股份有限公司 | 单词识别方法、设备及存储介质 |
-
2021
- 2021-12-10 CN CN202111509028.4A patent/CN113902046B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144254A (zh) * | 2019-12-18 | 2020-05-12 | 江河瑞通(北京)技术有限公司 | 城市内涝积水程度识别方法及装置 |
WO2021196013A1 (zh) * | 2020-03-31 | 2021-10-07 | 京东方科技集团股份有限公司 | 单词识别方法、设备及存储介质 |
CN111753727A (zh) * | 2020-06-24 | 2020-10-09 | 北京百度网讯科技有限公司 | 用于提取结构化信息的方法、装置、设备及可读存储介质 |
CN112070174A (zh) * | 2020-09-11 | 2020-12-11 | 上海海事大学 | 一种基于深度学习的自然场景下文本检测方法 |
CN113095313A (zh) * | 2021-04-07 | 2021-07-09 | 中国工商银行股份有限公司 | 文本字符串的识别方法、装置和服务器 |
CN113221904A (zh) * | 2021-05-13 | 2021-08-06 | 北京惠朗时代科技有限公司 | 一种语义关联文字识别方法及装置 |
CN113313217A (zh) * | 2021-07-31 | 2021-08-27 | 北京惠朗世纪科技有限公司 | 一种基于鲁棒性模板的倾角文字精准识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
一种基于门控空洞卷积的高效中文命名实体识别方法;王笑月,等;《中文信息学报》;20210131;全文 * |
基于可变形卷积神经网络的数字仪表识别方法;郭兰英,等;《计算机科学》;20201031;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113902046A (zh) | 2022-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9569855B2 (en) | Apparatus and method for extracting object of interest from image using image matting based on global contrast | |
CN109829071B (zh) | 人脸图像搜索方法、服务器、计算机设备及存储介质 | |
CN110928992B (zh) | 文本搜索方法、装置、服务器及存储介质 | |
CN112036395A (zh) | 基于目标检测的文本分类识别方法及装置 | |
CN115100450B (zh) | 基于人工智能的智慧交通品牌汽车大数据检测方法及系统 | |
WO2021072876A1 (zh) | 证件图像分类方法、装置、计算机设备及可读存储介质 | |
CN114241484B (zh) | 一种面向社交网络的图像大数据精准检索方法及系统 | |
CN114494982B (zh) | 一种基于人工智能的直播视频大数据精准推荐方法及系统 | |
CN111666868A (zh) | 保险单识别方法、装置以及计算机设备 | |
CN112906696B (zh) | 一种英文图像区域识别方法及装置 | |
CN113221904A (zh) | 一种语义关联文字识别方法及装置 | |
CN113313217B (zh) | 一种基于鲁棒性模板的倾角文字精准识别方法及系统 | |
CN106844733B (zh) | 基于词汇树信息融合与豪斯多夫距离结合的图像检索方法 | |
CN113902046B (zh) | 一种特效字体识别方法及装置 | |
CN114155172A (zh) | 一种图像处理方法和系统 | |
JP2019021100A (ja) | 画像探索装置、商品認識装置および画像探索プログラム | |
CN113269153B (zh) | 一种表格识别方法以及装置 | |
CN114723536A (zh) | 基于图像大数据比对的电商平台廉价商品选取方法及系统 | |
CN113903035A (zh) | 一种基于超分辨率多尺度重建的文字识别方法及系统 | |
CN114298236A (zh) | 非结构化内容相似度确定方法、装置和电子设备 | |
CN113378838A (zh) | 一种基于深度学习的互感器铭牌文本区域检测方法 | |
CN112633250A (zh) | 一种人脸识别检测实验方法及装置 | |
CN107092875B (zh) | 一种新的场景识别方法 | |
CN111899833A (zh) | 一种医疗数据处理方法、装置、服务器及存储介质 | |
CN113705367A (zh) | 基于特征与长宽比检测的公式图像区域识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A special effect font recognition method and device Effective date of registration: 20230210 Granted publication date: 20220218 Pledgee: Beijing ustron Tongsheng financing Company limited by guarantee Pledgor: BEIJING WILION TIME TECHNOLOGY Co.,Ltd. Registration number: Y2023990000111 |