CN114708445A - 一种商标相似度识别方法、装置、电子设备及存储介质 - Google Patents

一种商标相似度识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114708445A
CN114708445A CN202210180991.0A CN202210180991A CN114708445A CN 114708445 A CN114708445 A CN 114708445A CN 202210180991 A CN202210180991 A CN 202210180991A CN 114708445 A CN114708445 A CN 114708445A
Authority
CN
China
Prior art keywords
trademark
image
similarity
existing
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210180991.0A
Other languages
English (en)
Inventor
余松森
严彬彬
曹一波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202210180991.0A priority Critical patent/CN114708445A/zh
Publication of CN114708445A publication Critical patent/CN114708445A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明涉及一种商标相似度识别方法、装置、电子设备及存储介质。本发明所述的一种商标相似度识别方法包括:获取待识别商标图像;将待识别商标图像输入训练好的商标图形要素识别模型,识别出待识别商标图像中的图形要素和第一位置信息;检索商标图像识别特征数据库中的现有商标图像,计算现有商标图像与待识别商标图像的第一相似度;针对第一相似度大于第一阈值的现有商标图像,获取图形要素在现有商标图像中的第二位置信息,并根据位置信息,计算现有商标图像与待识别商标图像的第二相似度;输出第二相似度大于第二阈值的现有商标图像。本发明所述的一种商标相似度识别方法,从商标的图形要素对商标进行相似度计算,提高了商标的管理效率。

Description

一种商标相似度识别方法、装置、电子设备及存储介质
技术领域
本发明涉及信息处理技术领域,特别是涉及一种商标相似度识别方法、装置、电子设备及存储介质
背景技术
商标检索是注册申请、商标审查、商标管理、商标维权等程序中的重要工作。传统的图形商标检索基本上是通过手工输入商标图形要素编码作为检索条件而实现检索目的。商标图形要素编码是依据《建立商标图形要素国际分类维也纳协定》所产生一种的商标图形要素划分工具,由商标图形要素按大类、小类及组分类的一览表组成,其中包括商标图形要素编号和商标图形要素名称构成。因此,每一商标图形要素编码代表了商标图形要素的内容意义。
目前,商标的图形要素和后续的管理工作主要是采用人工管理的方法,需要对检索人员进行长时间的培训,消耗大量的人力物力;而且人工识别带有一定的主观性,不同的人员对同一商标的识别存在差别,可能造成商标图形要素识别不准,相似度识别存在偏差等问题。
发明内容
基于此,本发明的目的在于,提供一种商标相似度识别方法、装置、电子设备及存储介质,从商标的图形要素对商标进行相似度计算,因此训练能够识别商标图形所含有的图形要素,并将识别的商标图形要素用于提高近似商标查找的准确率,从而提高对商标的管理效率。
第一方面,本发明提供一种商标相似度识别方法,包括以下步骤:
获取待识别商标图像;
将所述待识别商标图像输入训练好的商标图形要素识别模型,识别出所述待识别商标图像中的图形要素,以及每个所述图形要素在所述待识别商标图像中的第一位置信息;
检索预先建立的商标图像识别特征数据库中的所有现有商标图像,根据所述现有商标图像与所述待识别商标图像含有相同图形要素的数量,计算所述现有商标图像与所述待识别商标图像的第一相似度;
针对所述第一相似度大于第一阈值的现有商标图像,获取所述图形要素在所述现有商标图像中的第二位置信息,并根据所述第一位置信息和所述第二位置信息,得到所述现有商标图像与所述待识别商标图像的第二相似度;
输出第二相似度大于第二阈值的所述现有商标图像。
进一步地,根据所述现有商标图像与所述待识别商标图像含有相同图形要素的数量,计算所述现有商标图像与所述待识别商标图像的第一相似度,包括:
当所述现有商标图像与所述待识别的商标图像不包含相同的图形要素,第一相似度=0;
当所述现有商标图像与所述待识别的商标图像包含相同的图形要素,第一相似度>0。
进一步地,针对所述第一相似度大于第一阈值的现有商标图像,获取所述图形要素在所述现有商标图像中的第二位置信息,并根据所述第一位置信息和所述第二位置信息,得到所述现有商标图像与所述待识别商标图像的第二相似度,包括:
针对与所述待识别的商标图像的第一相似度>0的现有商标图像,使用以下公式,计算每一个相同的图形要素的交并比IOU:
IOU=A∩B/A∪B
其中,IOU为某一个相同的图形要素在两个商标图形中的交并比,A为所述相同的图形要素在所述待识别的商标图像中标记框的面积,B为所述相同的图形要素在所述现有商标图像中标记框的面积;A∩B为所述相同的图形要素在两个商标图像中的标记框的交集的面积, A∪B为所述相同的图形要素在两个商标图像中的标记框的并集的面积;
根据每一个相同的图形要素的交并比IOU,得到交并比IOU=0的图形要素数量为m1,交并比IOU>0的图形要素的图像要素数量m2;
根据所有交并比IOU=0的图形要素,利用以下公式,计算所述待识别的商标图像和所述现有商标图像的第三相似度score1:
Figure RE-GDA0003580390540000021
其中,m1为相同的图形要素中IOU=0的个数,m为所述待识别的商标图像和所述现有商标图像中所含有的相同的图形要素个数,
Figure RE-GDA0003580390540000022
表示某一个IOU为0的图形要素对商标相似度得分的贡献度;pw1表示第一惩罚性权重值;
根据所有交并比IOU>0的图形要素,利用以下公式,计算所述待识别的商标图像和所述现有商标图像的第四相似度score2:
Figure RE-GDA0003580390540000023
其中,i表示某一个图形要素在m2个图形要素中IOU值的排名,即1≤i≤m2;IOUi为第i个图形要素对应的交并比;m2为相同的图形要素中IOU>0的个数,m为所述待识别的商标图像和所述现有商标图像中所含有的相同的图形要素个数,
Figure RE-GDA0003580390540000024
表示相同商标图形要素中IOU>0的商标图形要素对商标相似度得分的贡献度;pw2表示第二惩罚性权重值;
根据所述第三相似度和第四相似度,计算所述待识别的商标图像和所述现有商标图像的第二相似度。
进一步地,当M=m=1时,pw1=100,pw2=100;其他情况下,pw1=100*m1/M,pw2=100 *m2/M;
其中,M为所述待识别的商标图像中图形要素的个数。
进一步地,获取待识别商标图像之后,还包括:
调整所述待识别的商标图像的分辨率,将所述待识别的商标图像调整为416*416大小。
进一步地,所述商标图形要素识别模型采用YOLO V4算法;
所述商标图形要素识别模型删除了原始的YOLO V4算法中用于识别中型和小型目标的尺度,只保留识别大型目标的尺度。
进一步地,所述商标图形要素识别模型的训练步骤包括:
收集商标图像,并标注所述商标图像包含的图形要素,得到商标图形要素数据集;所述商标图形要素数据集包括记录图形要素类别名称以及该图形要素在商标图像中的相对位置的文件;
将所述商标图形要素数据集划分为训练集与测试集;
根据预设的batch_size,以所述训练集作为输入数据,每次将batch_size张商标图像同时加载到所述商标图形要素识别模型中进行训练;
使用所述测试集对所述商标图形要素识别模型进行准确率的评估,得到训练好的所述商标图形要素识别模型。
第二方面,本发明还提供一种商标相似度识别装置,包括:
图像获取模块,用于获取待识别商标图像;
要素识别模块,用于将所述待识别商标图像输入训练好的商标图形要素识别模型,识别出所述待识别商标图像中的图形要素,以及每个所述图形要素在所述待识别商标图像中的第一位置信息;
第一相似度计算模块,用于检索预先建立的商标图像识别特征数据库中的所有现有商标图像,根据所述现有商标图像与所述待识别商标图像含有相同图形要素的数量,计算所述现有商标图像与所述待识别商标图像的第一相似度;
第二相似度计算模块,用于针对所述第一相似度大于第一阈值的现有商标图像,获取所述图形要素在所述现有商标图像中的第二位置信息,并根据所述第一位置信息和所述第二位置信息,得到所述现有商标图像与所述待识别商标图像的第二相似度;
结果输出模块,用于输出第二相似度大于第二阈值的所述现有商标图像。
第三方面,本发明还提供一种电子设备,其特征在于,包括:
至少一个存储器以及至少一个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如本发明第一方面任一所述的一种商标相似度识别方法的步骤。
第四方面,本发明还提供一种计算机可读存储介质,其特征在于:
所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如本发明第一方面任一所述的一种商标相似度识别方法的步骤。
本发明提供的一种商标相似度识别方法、装置、电子设备及存储介质,通过比较不同的商标图形是否含有相同的图形要素以及相同图形要素的位置信息,确定商标图形的相似程度,从而提高查找相似商标的查全率和查准率,为用户提供相似商标的查找方法。针对商标图像的组成元素制作数据集并训练生成商标图形要素识别模型,从而从图形要素的层次进行细粒度的识别并进行比较,提高相似标准判断的细腻度,能更好的量化商标图像的相似程度,从而提高相似商标的查全率和查准率。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本发明提供的一种商标相似度识别方法的流程示意图;
图2为本发明在一个实施例中的流程示意图;
图3为本发明在一个实施例中使商标图形要素识别模型的结构示意图;
图4为本发明提供的一种商标相似度识别装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
应当明确,所描述的实施例仅仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请实施例保护的范围。
在本申请实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请实施例。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和 /或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。在本申请的描述中,需要理解的是,术语“第一”、“第二”、“第三”等仅用于区别类似的对象,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在 A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
针对背景技术中的问题,本申请实施例提供一种商标相似度识别方法,如图1所示,该方法包括以下步骤:
S01:获取待识别商标图像。
在一个优选的实施例中,获取待识别商标图像之后,还包括:
调整所述待识别的商标图像的分辨率,将所述待识别的商标图像调整为416*416大小。
S02:将所述待识别商标图像输入训练好的商标图形要素识别模型,识别出所述待识别商标图像中的图形要素,以及每个所述图形要素在所述待识别商标图像中的第一位置信息。
图形要素是指构成该商标图形若干的子图形,每个子图形构成一个独立的图形要素,每个图形要素与背景色一起,构成了一个完整的商标图形。图形要素指示商标是由哪些简单的图形构成的,或者这个商标图形的设计原型是什么。在进行图形商标的近似检索时,会选择图形商标里面可能包含的各种要素来综合检索。
同时,每个要素对应一个边界框,表示该图形要素在该商标图像中的所在位置信息。
S03:检索预先建立的商标图像识别特征数据库中的所有现有商标图像,根据所述现有商标图像与所述待识别商标图像含有相同图形要素的数量,计算所述现有商标图像与所述待识别商标图像的第一相似度。
在一个优选的实施例中,可以定义:
1)当所述现有商标图像与所述待识别的商标图像不包含相同的图形要素,第一相似度=0;
2)当所述现有商标图像与所述待识别的商标图像包含相同的图形要素,第一相似度=1。
在其他实施例中,也可根据实际需求,定义其他计算方式,例如:
1)当相同图形要素数量=0,第一相似度=0;
2)当相同图形要素数量介于1-3之间,第一相似度=1;
3)当相同图形要素数量>3,第一相似度=2。
或者,根据相同图形要素数量与待识别商标图像中所有图形要素数量的比例,设置第一相似度的计算方式。
具体的计算方式根据实际需求而定,不构成对本发明具体实施方式的限制。
S04:针对所述第一相似度大于第一阈值的现有商标图像,获取所述图形要素在所述现有商标图像中的第二位置信息,并根据所述第一位置信息和所述第二位置信息,得到所述现有商标图像与所述待识别商标图像的第二相似度。
具体的,包括以下子步骤:
S041:针对与所述待识别的商标图像的第一相似度>0的现有商标图像,使用以下公式,计算每一个相同的图形要素的交并比IOU:
IOU=A∩B/A∪B
其中,IOU为某一个相同的图形要素在两个商标图形中的交并比,A为所述相同的图形要素在所述待识别的商标图像中标记框的面积,B为所述相同的图形要素在所述现有商标图像中标记框的面积;A∩B为所述相同的图形要素在两个商标图像中的标记框的交集的面积, A∪B为所述相同的图形要素在两个商标图像中的标记框的并集的面积。
S042:根据每一个相同的图形要素的交并比IOU,得到交并比IOU=0的图形要素数量为 m1,交并比IOU>0的图形要素的图像要素数量m2;
S043:根据所有交并比IOU=0的图形要素,利用以下公式,计算所述待识别的商标图像和所述现有商标图像的第三相似度score1:
Figure RE-GDA0003580390540000061
其中,m1为相同的图形要素中IOU=0的个数,m为所述待识别的商标图像和所述现有商标图像中所含有的相同的图形要素个数,
Figure RE-GDA0003580390540000062
表示某一个IOU为0的图形要素对商标相似度得分的贡献度;pw1表示第一惩罚性权重值;
S044:根据所有交并比IOU>0的图形要素,利用以下公式,计算所述待识别的商标图像和所述现有商标图像的第四相似度score2:
Figure RE-GDA0003580390540000063
其中,i表示某一个图形要素在m2个图形要素中IOU值的排名,即1≤i≤m2;m2为相同的图形要素中IOU>0的个数,m为所述待识别的商标图像和所述现有商标图像中所含有的相同的图形要素个数,
Figure RE-GDA0003580390540000071
表示相同商标图形要素中IOU>0的商标图形要素对商标相似度得分的贡献度;pw2表示第二惩罚性权重值。
在一个优选的实施例中,当M=m=1时,pw1=100,pw2=100;其他情况下,pw1=100*m1 /M,pw2=100*m2/M;
其中,M为所述待识别的商标图像中图形要素的个数。
S045:根据所述第三相似度和第四相似度,计算所述待识别的商标图像和所述现有商标图像的第二相似度。
在一个具体的实施例中,第二相似度score的计算公式为:
score=k1*score1+k2*score2
其中,score为待识别的商标图像和现有商标图像的第二相似度,score1为待识别的商标图像和现有商标图像的第三相似度,score2为待识别的商标图像和现有商标图像的第四相似度,k1为第三相似度的权重值,k2为第四相似度的权重值。
优选的,k1=k2=1。
在其他的实施例中,k1和k2也可以根据实际需求另行取值。第二相似度也可以是通过其他加权方式计算得到,包括但不限于:
Figure RE-GDA0003580390540000072
score=k1*score12+k2*score22
等计算方式。具体的计算方式根据实际需求而定,不构成对本发明具体实施方式的限制。
S05:输出第二相似度大于第二阈值的所述现有商标图像。
在一个具体的实施例中,第二阈值可以为0,即输出所有与待识别的商标图像的第二相似度>0的现有商标图像。优选的,输出现有商标图像时,同时显示每张现有商标图像与待识别的商标图像的第二相似度的值,并按照第二相似度值的大小降序排列。
在实际应用过程中,为防止输出商标图像过多,造成系统卡顿等情况,可以通过灵活设置第二相似度对应的第二阈值,例如设置只输出第二相似度>20的商标图像;或设置第二相似度的排序对应的第二阈值,例如设置只输出第二相似度排序前10位的商标图像。具体的阈值设置方式根据实际需求而定,不构成对本发明具体实施方式的限制。
在一个优选的实施例中,本发明的完整流程如图2所示,分为3大部分,商标图形要素识别模型训练部分、商标图像识别特征数据库搭建部分和待检索商标图像的识别检索部分。
在商标图形要素识别模型训练部分,包括以下子步骤:
S11:制作商标图形要素数据集。
制作商标图形要素数据集的工作内容包括:收集商标图像以及标注商标图像。首先,需要确定待识别的商标图形要素有哪些种类。然后有针对性的收集包含对应种类商标图形要素的商标图像,每个种类的训练样本不少于200个;之后,借助标注工具,对收集到的商标图像进行标记,即将需要识别的图形要素用边界框将其框起来,为该图形要素选择正确的类别,并生成记录图形要素类别名称以及该图形要素在商标图像中的相对位置的文件,并将模型按照8:2划分为训练集与测试集,用于接下来的商标图形要素识别模型的训练与测试工作。
S12:训练和测试商标图形要素识别模型。
优选的,本发明所使用的商标图形要素识别模型采用YOLO V4算法,删除了原始的YOLO V4算法中用于识别中型和小型目标的尺度,只保留识别大型目标的尺度。
原始的YOLO V4算法有3个预测尺度,分别对应大、中、小三个尺度。而在商标图形中,图形要素是商标的主要组成部分,不需要识别中型和小型目标,因此,为了加快模型训练工作,减少卷积操作,本方法删除了用于识别中型和小型目标的尺度,只保留识别大型目标的尺度,模型结构如图3所示。
优选的,利用上述步骤S11收集制作的商标图形要素数据集,训练商标图形要素识别模型的步骤包括:
S121:根据预设的batch_size,以所述训练集作为输入数据,每次将batch_size张商标图像同时加载到所述商标图形要素识别模型中进行训练。
S122:使用所述测试集对所述商标图形要素识别模型进行准确率的评估,得到训练好的所述商标图形要素识别模型。
在一个具体的实施例中,在设置好batch_size后,以上述划分好的训练集作为输入数据,每次将batch_size张商标图像同时加载到模型中进行训练,经过适当次数的迭代,获得能够识别商标图形要素的深度学习模型,模型以.pth格式进行保存,是一个以key-value形式保存模型所有参数的字典类型文件。然后用测试集对模型进行准确率的评估。
基于上述训练好的商标图形要素识别模型,商标图像识别特征数据库搭建部分,包括以下子步骤:
S21:对现有的商标图像进行预处理。
由于后续判断商标图像是否相似时利用的是其所包含的图形要素名称以及所在位置,因此在预处理阶段,需要调整商标图像的分辨率,将所有需要输入到模型的商标图像调整到统一大小,本方法将商标图像调整为416*416大小,以便用于后续的商标相似比较。
S21:将预处理过的现有商标图像输入上述训练好的商标图形要素识别模型,获得每一张商标图像所包含的商标图形要素的种类以及所在位置,得到商标图像识别特征数据库。
商标图像识别特征数据库的建立需要将我们所有收集到的商标图像经过预处理阶段后输入到商标图形要素识别模型中,获得每一张商标图像所包含的商标图形要素的种类以及所在位置,并存储到数据库,从而建立好商标图像识别特征数据库,作为后续查找相似商标的依据。
基于上述商标图像识别特征数据库,对待检索商标图像的识别检索部分,即为前述的一种商标相似度识别方法的步骤,在此不再赘述。
本申请实施例还提供一种商标相似度识别装置,如图4所示,该商标相似度识别装置400 包括:
图像获取模块401,用于获取待识别商标图像;
要素识别模块402,用于将所述待识别商标图像输入训练好的商标图形要素识别模型,识别出所述待识别商标图像中的图形要素,以及每个所述图形要素在所述待识别商标图像中的第一位置信息;
第一相似度计算模块403,用于检索预先建立的商标图像识别特征数据库中的所有现有商标图像,根据所述现有商标图像与所述待识别商标图像含有相同图形要素的数量,计算所述现有商标图像与所述待识别商标图像的第一相似度;
第二相似度计算模块404,用于针对所述第一相似度大于第一阈值的现有商标图像,获取所述图形要素在所述现有商标图像中的第二位置信息,并根据所述第一位置信息和所述第二位置信息,得到所述现有商标图像与所述待识别商标图像的第二相似度;
结果输出模块405,用于输出第二相似度大于第二阈值的所述现有商标图像。
优选的,当所述现有商标图像与所述待识别的商标图像不包含相同的图形要素,第一相似度=0;
当所述现有商标图像与所述待识别的商标图像包含相同的图形要素,第一相似度=1。
优选的,第二相似度计算模块包括:
交并比计算单元,用于针对与所述待识别的商标图像的第一相似度>0的现有商标图像,使用以下公式,计算每一个相同的图形要素的交并比IOU:
IOU=A∩B/A∪B
其中,IOU为某一个相同的图形要素在两个商标图形中的交并比,A为所述相同的图形要素在所述待识别的商标图像中标记框的面积,B为所述相同的图形要素在所述现有商标图像中标记框的面积;A∩B为所述相同的图形要素在两个商标图像中的标记框的交集的面积, A∪B为所述相同的图形要素在两个商标图像中的标记框的并集的面积;
交并比数量计算单元,用于根据每一个相同的图形要素的交并比IOU,得到交并比IOU=0 的图形要素数量为m1,交并比IOU>0的图形要素的图像要素数量m2;
第三相似度计算单元,用于根据所有交并比IOU=0的图形要素,利用以下公式,计算所述待识别的商标图像和所述现有商标图像的第三相似度score1:
Figure RE-GDA0003580390540000101
其中,m1为相同的图形要素中IOU=0的个数,m为所述待识别的商标图像和所述现有商标图像中所含有的相同的图形要素个数,
Figure RE-GDA0003580390540000102
表示某一个IOU为0的图形要素对商标相似度得分的贡献度;pw1表示第一惩罚性权重值;
第四相似度计算单元,用于根据所有交并比IOU>0的图形要素,利用以下公式,计算所述待识别的商标图像和所述现有商标图像的第四相似度score2:
Figure RE-GDA0003580390540000103
其中,i表示某一个图形要素在m2个图形要素中IOU值的排名,即1≤i≤m2;IOUi为第i个图形要素对应的交并比;m2为相同的图形要素中IOU>0的个数,m为所述待识别的商标图像和所述现有商标图像中所含有的相同的图形要素个数,
Figure RE-GDA0003580390540000104
表示相同商标图形要素中IOU>0的商标图形要素对商标相似度得分的贡献度;pw2表示第二惩罚性权重值;
第二相似度计算单元,用于根据所述第三相似度和第四相似度,计算所述待识别的商标图像和所述现有商标图像的第二相似度。
优选的,当M=m=1时,pw1=100,pw2=100;其他情况下,pw1=100*m1/M,pw2=100 *m2/M;
其中,M为所述待识别的商标图像中图形要素的个数。
优选的,图像获取模块还包括:
预处理单元,用于调整所述待识别的商标图像的分辨率,将所述待识别的商标图像调整为416*416大小。
优选的,所述商标图形要素识别模型采用YOLO V4算法;
所述商标图形要素识别模型删除了原始的YOLO V4算法中用于识别中型和小型目标的尺度,只保留识别大型目标的尺度。
优选的,所述商标图形要素识别模型的训练步骤包括:
收集商标图像,并标注所述商标图像包含的图形要素,得到商标图形要素数据集;所述商标图形要素数据集包括记录图形要素类别名称以及该图形要素在商标图像中的相对位置的文件;
将所述商标图形要素数据集划分为训练集与测试集;
根据预设的batch_size,以所述训练集作为输入数据,每次将batch_size张商标图像同时加载到所述商标图形要素识别模型中进行训练;
使用所述测试集对所述商标图形要素识别模型进行准确率的评估,得到训练好的所述商标图形要素识别模型。
本申请实施例还提供一种电子设备,包括:
至少一个存储器以及至少一个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如前所述的一种商标相似度识别方法的步骤。
本申请实施例还提供一种计算机可读存储介质,
所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如前所述的一种商标相似度识别方法的步骤。
本发明提供的一种商标相似度识别方法、装置、电子设备及存储介质,通过比较不同的商标图形是否含有相同的图形要素以及相同图形要素的位置信息,确定商标图形的相似程度,从而提高查找相似商标的查全率和查准率,为用户提供相似商标的查找方法。针对商标图像的组成元素制作数据集并训练生成商标图形要素识别模型,从而从图形要素的层次进行细粒度的识别并进行比较,提高相似标准判断的细腻度,能更好的量化商标图像的相似程度,从而提高相似商标的查全率和查准率。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (10)

1.一种商标相似度识别方法,其特征在于,包括以下步骤:
获取待识别商标图像;
将所述待识别商标图像输入训练好的商标图形要素识别模型,识别出所述待识别商标图像中的图形要素,以及每个所述图形要素在所述待识别商标图像中的第一位置信息;
检索预先建立的商标图像识别特征数据库中的所有现有商标图像,根据所述现有商标图像与所述待识别商标图像含有相同图形要素的数量,计算所述现有商标图像与所述待识别商标图像的第一相似度;
针对所述第一相似度大于第一阈值的现有商标图像,获取所述图形要素在所述现有商标图像中的第二位置信息,并根据所述第一位置信息和所述第二位置信息,得到所述现有商标图像与所述待识别商标图像的第二相似度;
输出第二相似度大于第二阈值的所述现有商标图像。
2.根据权利要求1所述的一种商标相似度识别方法,其特征在于,根据所述现有商标图像与所述待识别商标图像含有相同图形要素的数量,计算所述现有商标图像与所述待识别商标图像的第一相似度,包括:
当所述现有商标图像与所述待识别的商标图像不包含相同的图形要素,第一相似度=0;
当所述现有商标图像与所述待识别的商标图像包含相同的图形要素,第一相似度=1。
3.根据权利要求2所述的一种商标相似度识别方法,其特征在于,针对所述第一相似度大于第一阈值的现有商标图像,获取所述图形要素在所述现有商标图像中的第二位置信息,并根据所述第一位置信息和所述第二位置信息,得到所述现有商标图像与所述待识别商标图像的第二相似度,包括:
针对与所述待识别的商标图像的第一相似度>0的现有商标图像,使用以下公式,计算每一个相同的图形要素的交并比IOU:
IOU=A∩B/A∪B
其中,IOU为某一个相同的图形要素在两个商标图形中的交并比,A为所述相同的图形要素在所述待识别的商标图像中标记框的面积,B为所述相同的图形要素在所述现有商标图像中标记框的面积;A∩B为所述相同的图形要素在两个商标图像中的标记框的交集的面积,A∪B为所述相同的图形要素在两个商标图像中的标记框的并集的面积;
根据每一个相同的图形要素的交并比IOU,得到交并比IOU=0的图形要素数量为m1,交并比IOU>0的图形要素的图像要素数量m2;
根据所有交并比IOU=0的图形要素,利用以下公式,计算所述待识别的商标图像和所述现有商标图像的第三相似度score1:
Figure FDA0003520865830000021
其中,m1为相同的图形要素中IOU=0的个数,m为所述待识别的商标图像和所述现有商标图像中所含有的相同的图形要素个数,
Figure FDA0003520865830000022
表示某一个IOU为0的图形要素对商标相似度得分的贡献度;pw1表示第一惩罚性权重值;
根据所有交并比IOU>0的图形要素,利用以下公式,计算所述待识别的商标图像和所述现有商标图像的第四相似度score2:
Figure FDA0003520865830000023
其中,i表示某一个图形要素在m2个图形要素中IOU值的排名,即1≤i≤m2;IOUi为第i个图形要素对应的交并比;m2为相同的图形要素中IOU>0的个数,m为所述待识别的商标图像和所述现有商标图像中所含有的相同的图形要素个数,
Figure FDA0003520865830000024
表示相同商标图形要素中IOU>0的商标图形要素对商标相似度得分的贡献度;pw2表示第二惩罚性权重值;
根据所述第三相似度和第四相似度,计算所述待识别的商标图像和所述现有商标图像的第二相似度。
4.根据权利要求3所述的一种商标相似度识别方法,其特征在于:
当M=m=1时,pw1=100,pw2=100;其他情况下,pw1=100*m1/M,pw2=100*m2/M;
其中,M为所述待识别的商标图像中图形要素的个数。
5.根据权利要求1所述的一种商标相似度识别方法,其特征在于,获取待识别商标图像之后,还包括:
调整所述待识别的商标图像的分辨率,将所述待识别的商标图像调整为416*416大小。
6.根据权利要求1所述的一种商标相似度识别方法,其特征在于:
所述商标图形要素识别模型采用YOLO V4算法;
所述商标图形要素识别模型删除了原始的YOLO V4算法中用于识别中型和小型目标的尺度,只保留识别大型目标的尺度。
7.根据权利要求1所述的一种商标相似度识别方法,其特征在于,所述商标图形要素识别模型的训练步骤包括:
收集商标图像,并标注所述商标图像包含的图形要素,得到商标图形要素数据集;所述商标图形要素数据集包括记录图形要素类别名称以及该图形要素在商标图像中的相对位置的文件;
将所述商标图形要素数据集划分为训练集与测试集;
根据预设的batch_size,以所述训练集作为输入数据,每次将batch_size张商标图像同时加载到所述商标图形要素识别模型中进行训练;
使用所述测试集对所述商标图形要素识别模型进行准确率的评估,得到训练好的所述商标图形要素识别模型。
8.一种商标相似度识别装置,其特征在于,包括:
图像获取模块,用于获取待识别商标图像;
要素识别模块,用于将所述待识别商标图像输入训练好的商标图形要素识别模型,识别出所述待识别商标图像中的图形要素,以及每个所述图形要素在所述待识别商标图像中的第一位置信息;
第一相似度计算模块,用于检索预先建立的商标图像识别特征数据库中的所有现有商标图像,根据所述现有商标图像与所述待识别商标图像含有相同图形要素的数量,计算所述现有商标图像与所述待识别商标图像的第一相似度;
第二相似度计算模块,用于针对所述第一相似度大于第一阈值的现有商标图像,获取所述图形要素在所述现有商标图像中的第二位置信息,并根据所述第一位置信息和所述第二位置信息,得到所述现有商标图像与所述待识别商标图像的第二相似度;
结果输出模块,用于输出第二相似度大于第二阈值的所述现有商标图像。
9.一种电子设备,其特征在于,包括:
至少一个存储器以及至少一个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-7任一所述的一种商标相似度识别方法的步骤。
10.一种计算机可读存储介质,其特征在于:
所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任一所述的一种商标相似度识别方法的步骤。
CN202210180991.0A 2022-02-25 2022-02-25 一种商标相似度识别方法、装置、电子设备及存储介质 Pending CN114708445A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210180991.0A CN114708445A (zh) 2022-02-25 2022-02-25 一种商标相似度识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210180991.0A CN114708445A (zh) 2022-02-25 2022-02-25 一种商标相似度识别方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114708445A true CN114708445A (zh) 2022-07-05

Family

ID=82166644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210180991.0A Pending CN114708445A (zh) 2022-02-25 2022-02-25 一种商标相似度识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114708445A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117668273A (zh) * 2024-02-01 2024-03-08 山东省国土测绘院 一种测绘成果管理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117668273A (zh) * 2024-02-01 2024-03-08 山东省国土测绘院 一种测绘成果管理方法
CN117668273B (zh) * 2024-02-01 2024-04-19 山东省国土测绘院 一种测绘成果管理方法

Similar Documents

Publication Publication Date Title
CN110826320A (zh) 一种基于文本识别的敏感数据发现方法及系统
CN110472209B (zh) 基于深度学习的表格生成方法、装置和计算机设备
CN113112222A (zh) 一种基于大数据分析的ofd版式文件的自动签章方法及系统
CN111428480A (zh) 简历识别方法、装置、设备及存储介质
CN115544348A (zh) 一种基于互联网大数据的海量信息智能搜索系统
CN112381087A (zh) 结合rpa和ai的图像识别方法、装置、计算机设备和介质
CN114708445A (zh) 一种商标相似度识别方法、装置、电子设备及存储介质
CN112559676B (zh) 相似题目的检索方法、装置及计算机存储介质
CN115659226A (zh) 一种获取app标签的数据处理系统
CN115269958A (zh) 互联网可靠性数据信息采集分析系统
CN113177644A (zh) 一种基于词嵌入和深度时序模型的自动建模系统
CN110955774A (zh) 基于词频分布的文字分类方法、装置、设备及介质
CN116434273A (zh) 一种基于单正标签的多标记预测方法及系统
CN115841336A (zh) 一种基于云计算的农产品交易流通信息追溯方法
CN111209397B (zh) 一种确定企业产业类别的方法
CN114298460A (zh) 素材工单分派处理方法、装置、设备及存储介质
CN114065934A (zh) 一种环境影响评价领域语义知识库构建方法及系统
CN111209428A (zh) 图像检索方法、装置、设备及计算机可读存储介质
CN112529084B (zh) 一种基于滑坡剖面图像分类模型的相似滑坡推荐方法
CN111191648B (zh) 一种基于深度学习网络进行图像识别的方法及装置
CN113919799B (zh) 一种云管理平台审计控制器集群数据的方法及系统
CN117474344B (zh) 一种货物运输过程的风险评估方法及系统
CN115601778A (zh) 基于图像识别的作业批改方法、装置、设备及存储介质
CN117763126A (zh) 知识检索方法、设备、存储介质及装置
CN115858715A (zh) 一种预警数据管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination