CN112507160A - 商标侵权的自动化判定方法、装置、电子设备和存储介质 - Google Patents

商标侵权的自动化判定方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN112507160A
CN112507160A CN202011393630.1A CN202011393630A CN112507160A CN 112507160 A CN112507160 A CN 112507160A CN 202011393630 A CN202011393630 A CN 202011393630A CN 112507160 A CN112507160 A CN 112507160A
Authority
CN
China
Prior art keywords
meaning
trademark
similarity
item
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011393630.1A
Other languages
English (en)
Inventor
张师琲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202011393630.1A priority Critical patent/CN112507160A/zh
Publication of CN112507160A publication Critical patent/CN112507160A/zh
Priority to PCT/CN2021/082724 priority patent/WO2022116418A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及人工智能技术领域,具体公开了一种商标侵权的自动化判定方法、装置、电子设备和存储介质,其中,商标侵权判定方法包括:获取待维权商标的特征信息,其中,所述特征信息包括:文字信息、数字信息、图形信息、所属的企业名称、注册日期、商品服务分类以及经营范围;在预设商标库中筛选与所述特征信息相匹配的商标作为疑似侵权的候选商标;对待维权商标和候选商标进行语义比对处理,得到待维权商标和候选商标之间的相似度;根据相似度,对候选商标进行侵权判定。采用本申请所提供的商标侵权判定方法,可以快速定位相似商标进行比对,实现商标侵权的自动化处理,在保证比对精准度的同时,节省了大量的人力成本。

Description

商标侵权的自动化判定方法、装置、电子设备和存储介质
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于语义分析的高精准度商标侵权的自动化判定方法、装置、电子设备和存储介质。
背景技术
商标,作为一种区别一个经营者的品牌或服务和其他经营者的品牌或服务的标记,在一定程度上代表了该经营者,以及其在其所经营的领域中所累积的声誉。且由于商标所代表的经营者的声誉,使商标可以说明的拥有该商标的产品或服务的性质和质量符合,由此,可以帮助消费者识别和购买某些产品或服务。基于此,商标可以说是企业的无形资产,其重要性不言而喻。目前,市面上充斥着各种大型或知名企业的仿冒商标,在扰乱市场秩序的同时,也严重影响了大型或知名企业的声誉。因此,对于商标的维权,几乎是所有企业需要重点关注的事情。
目前,关于商标侵权的审理标准中有一条,就是商标文字的含义相似也可以算作侵权。通常情况下,这种审理标准只能通过人工审查的方式进行界定,但是,这种人工审查的方式效率低下,人力成本高。
发明内容
为了解决现有技术中存在的上述问题,本申请实施方式提供了一种商标侵权的自动化判定方法、装置、电子设备和存储介质,可以快速定位相似商标进行比对,实现高准确度的商标侵权的自动化判定的同时,节省了大量的人力成本。
第一方面,本申请的实施方式提供了一种商标侵权的自动化判定方法,包括:
获取待维权商标的特征信息,其中,所述特征信息包括:文字信息、数字信息、图形信息、所属的企业名称、注册日期、商品服务分类以及经营范围;
在预设商标库中筛选与所述特征信息相匹配的商标作为疑似侵权的候选商标;
对待维权商标和候选商标进行语义比对处理,得到所述待维权商标和所述候选商标之间的相似度;
根据相似度,对候选商标进行侵权判定。
在本申请的一些实施方式中,对待维权商标和候选商标进行语义比对处理,得到所述待维权商标和所述候选商标之间的相似度,包括:
对待维权商标进行语义切分处理,得到待维权商标对应的第一含义词;
对候选商标进行语义切分处理,得到候选商标对应的第二含义词;
获取第一含义词和第二含义词的语义相似度;
将语义相似度作为相似度。
在本申请的一些实施方式中,获取第一含义词和第二含义词的语义相似度,包括:
对第一含义词进行义项提取处理,得到第一含义词对应的第一义项组;
对第二含义词进行义项提取处理,得到第二含义词对应的第二义项组;
将第一义项组中的义项和第二义项组中的义项两两配对,得到至少一个义项对;
针对至少一个义项对中的每个义项对,分别获取每个义项对中的第一义项和第二义项之间的第一相似度,其中,第一义项为每个义项对中的属于第一义项组的义项,第二义项为每个义项对中的属于第二义项组的义项;
将至少一个义项对对应的至少一个第一相似度中的最大值作为语义相似度。
在本申请的一些实施方式中,获取第一义项和第二义项之间的第一相似度,包括:
确定第一义项和第二义项之间的最短路径的长度,其中,最短路径表示第一义项和第二义项在义原层次体系中最短的路径;
根据最短路径的长度和预先设置的第一调节参数,确定第一义项和第二义项之间的第二相似度;
将第二相似度作为第一相似度。
在本申请的一些实施方式中,在将第二相似度作为第一相似度之前,该方法还包括:
获取第一义项的第一义项长度;
获取第二义项的第二义项长度;
获取第一义项和第二义项之间的最长公共子序列的长度,其中,最长公共子序列表示第一义项和第二义项之间的所有公共子序列中最长的公共子序列;
根据最长公共子序列的长度,以及第一义项长度和第二义项长度之和,确定第一义项和第二义项之间的第三相似度;
将第二相似度作为第一相似度,包括:
将第二相似度和第三相似度的最大值作为第一相似度。
在本申请的一些实施方式中,将语义相似度作为处理相似度,该方法还包括:
对第一含义词进行词嵌入处理,得到第一含义词对应的第一词向量;
对第二含义词进行词嵌入处理,得到第二含义词对应的第二词向量;
根据第一词向量和第二词向量,获取第一含义词和第二含义词之间的相似距离;
将语义相似度作为处理结果,包括:
将语义相似度和相似距离均作为相似度。
在本申请的一些实施方式中,根据相似度,对候选商标进行侵权判定,包括:
若第一相似度大于第一阈值和/或相似距离小于第二阈值,判定候选商标侵权。。
第二方面,本申请的实施方式提供了一种商标侵权判定装置,包括:
特征提取模块,用于获取待维权商标的特征信息,其中,所述特征信息包括:文字信息、数字信息、图形信息、所属的企业名称、注册日期、商品服务分类以及经营范围;
候选商标确定模块,用于在预设商标库中筛选与所述特征信息相匹配的商标作为疑似侵权的候选商标;
比对模块,用于对待维权商标和候选商标进行语义比对处理,得到所述待维权商标和所述候选商标之间的相似度;
判定模块,用于相似度,对候选商标进行侵权判定。
第三方面,本申请实施例提供一种电子设备,包括:处理器,所述处理器与存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如第一方面所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序使得计算机执行如第一方面所述的方法。
第五方面,本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机可操作来使计算机执行如第一方面所述的方法。
实施本申请实施例,具有如下有益效果:
可以看出,在本申请实施方式中,先采用特征提取比对的方式,快速定位疑似侵权的候选商标,然后,对待维权商标和候选商标进行比对处理,根据比对处理的处理结果,对候选商标进行侵权判定,从而实现了商标侵权的自动化处理,节省了大量的人力成本。此外,自动化的比对与人工比对相比,不受人工的主观判断的影响,使比对结果的可信度大大提高。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施方式提供的一种商标侵权的自动化判定方法的流程示意图;
图2为本申请实施方式提供的一种语义比对处理的流程示意图;
图3为本申请实施方式提供的一种获取语义相似度的方法的流程示意图;
图4为本申请实施方式提供的一种词林拓扑结构图;
图5为本申请实施方式提供的一种获取第一相似度的方法的流程示意图;
图6为本申请实施方式提供的一种义原层次结构示意图;
图7为本申请实施方式提供的另一种获取第一相似度的方法的流程示意图;
图8为本申请实施方式提供的另一种语义比对处理的流程示意图;
图9为本申请实施方式提供的一种商标侵权的自动化判定装置的功能模块组成框图。
具体实施方式
下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施方式”意味着,结合实施方式描述的特定特征、结果或特性可以包含在本申请的至少一个实施方式中。在说明书中的各个位置出现该短语并不一定均是指相同的实施方式,也不是与其它实施方式互斥的独立的或备选的实施方式。本领域技术人员显式地和隐式地理解的是,本文所描述的实施方式可以与其它实施方式相结合。
参阅图1,图1为本申请实施方式提供的一种商标侵权的自动化判定方法的流程示意图。该商标侵权的自动化判定方法包括以下步骤:
101:获取待维权商标的特征信息。
示例性的,商标由文字和图片组成,区分商标的主要因素包括商标中的文字的形态、文字的含义以及图形的形态颜色等。但是,商标还构成某个企业在特定经营范围中针对某种商品服务分类的标签,因此,除了商标本身所包括的文字与图形之外,其所属的企业名称、注册日期、商品服务分类以及经营范围等因素也是有重要意义的。
因此,在本实施方式中,特征信息可以是待维权商标的主体(文字与图形)、所属的企业名称、注册日期、商品服务分类以及经营范围等。从而可以更加全面的捕获与待维权商标相关的疑似侵权的候选商标。
102:在预设商标库中筛选与特征信息相匹配的商标作为疑似侵权的候选商标。
在本实施方式中,可以通过特征信息对商标库中保存的商标进行筛选,以此获取疑似侵权的候选商标。其中,商标库为用于保存市面上已存在的商标的数据库。
示例性的,可以采用Elasticsearch数据库(一种用于分布式全文检索的数据库)作为商标库,通过搜索引擎对商标库中保存的商标进行特征信息匹配的方式,初步从商标库中的海量商标中快速筛选出特征信息匹配的商标作为疑似侵权的候选商标,例如,当商标库中的某个商标的商品服务分类以及经营范围与特征信息相同,且文字信息中包括的特征信息中的字符的个数超过预设值或图形信息的颜色或形状相似,则判定该商标与特征信息匹配,可以作为疑似侵权的候选商标。然后通过比对处理来判断候选商标是否侵权。此外,还可以采用神经网络模型识别等方式筛选候选商标,本申请对筛选候选商标的方式不进行限定。
103:对待维权商标和候选商标进行语义比对处理,得到所述待维权商标和所述候选商标之间的相似度;
在本实施方式中,参阅图2,图2为本申请实施方式提供的一种比对处理的流程示意图。该比对处理包括以下步骤:
201:对待维权商标进行语义切分处理,得到待维权商标对应的第一含义词。
202:对候选商标进行语义切分处理,得到候选商标对应的第二含义词。
由于商标本身带有一定的语义不确定性,很多商标都会选择一些新的词汇,或者没有见过的字组合,那么对于这类商标要判断其含义是非常困难的。
在本实施方式中,主要针对于一些商标中包含日常生活中遇到的词汇,对其进行语义理解和相似度判断。若一个商标,其从头到尾都没有已知熟悉词汇的话,是不能判断其含义的。
因此,对于商标中包含有语义的部分,可以通过语义切分的方式,进行含义词提取。从而去除无效的比对元素,从而可以简化后续比对处理流程,提高比对效率。本申请对含义词提取的方式不进行限定。
203:获取第一含义词和第二含义词的语义相似度。
在本实施方式中,参阅图3,图3为本申请实施方式提供的一种获取语义相似度的方法的流程示意图。该方法包括以下步骤:
301:对第一含义词进行义项提取处理,得到第一含义词对应的第一义项组。
302:对第二含义词进行义项提取处理,得到第二含义词对应的第二义项组。
通常而言,一对词语的相似度由它们的共性决定。在一个具有良好分类层次结构的体系中,例如,如图4示出的词林拓扑结构图中,一对义项(一个词语可能包含多个义项,不同义项可以存在于本体中的不同节点上)的共性,就表现在它们有多少共享的信息。如果义项A代表的是“香蕉”,义项B代表的是“橙子”,那么A和B的共性就表现在它们都是水果。因此,在一个具有良好分类层次结构的体系中,义项“香蕉”和“橙子”的最近公共父节点应该是“水果”,基于此,在这些具有良好分类层次结构的体系中,可以用最近公共父节点的信息内容含量来表示A和B的共性。
基于图4的词林拓扑结构图,使用义项表示第一含义词和第二含义词,可以使语义的表达更加全面,从而提升侵权比对的精准度。
303:将第一义项组中的义项和第二义项组中的义项两两配对,得到至少一个义项对。
304:针对至少一个义项对中的每个义项对,分别获取每个义项对中的第一义项和第二义项之间的第一相似度。
其中,第一义项为每个义项对中的属于第一义项组的义项,第二义项为每个义项对中的属于第二义项组的义项。
在本实施方式中,参阅图5,图5为本申请实施方式提供的一种获取第一相似度的方法的流程示意图。该方法包括以下步骤:
501:确定第一义项和第二义项之间的最短路径的长度。
在本实施方式中,最短路径表示第一义项和第二义项在义原层次体系中最短的路径。
虽说使用义项表示第一含义词和第二含义词,可以使语义的表达更加全面,但是,同义词林的拓扑结构及存储方式有如下不合理之处:
如图4所示,第一层到第四层的分类节点只有分类编码没有具体义项,所有的义项只在原子词群上,这样的拓扑结构无法区分抽象的和具体的义项。例如“水果”这一指代某一类事物的义项与“苹果”、“香蕉”、“橙子”等表示具体水果的义项放置在同一个原子词群节点下,极有可能得出“苹果”与“水果”之间的相似度等价于“苹果”与“橙子”之间的相似度。
因此,在本实施方式中,通过确定第一义项和第二义项在义原层次体系中最短的路径的长度,从而使用最小的语义单位——义原表示第一含义词和第二含义词。
义原层次体系预定义了两千多个义原,并用其标注了十万多个中/英文词语。每个词语的每个义项都用若干义原标注以表达其语义。如【husband】这个多义词在中有【丈夫】和【节俭】两个义项,其中【丈夫】这个义项被标注了【人类】、【家庭】、【男性】、【配偶】这四个义原,而【节俭】这个义项则被标注了【节约】这一个义原。
根据义原的上下位关系,如图6所示,所有的义原组成了一个义原层次体系,这个义原层次体系是一个树状结构。这种树状结构也是进行语义相似度计算的基础。
示例性的,通过义原之间的上下位关系,已经天然存在一个树状义原层次体系,该层次体系中包括所有的义原。根据义项的表达式可以提取抽象概念和实概念,并形成义项的蕴涵公理定义表达式。由于义原层次体系只包括实概念而不包括抽象概念,需要为义项公理定义表达式中的抽象概念逐层找到其直接上位概念,并挂在原有的义原树上,形成一个包含所有概念的义项结构。由于义项的语义表达式由一到多个概念通过并运算组成,所以义项可能有多个上位概念,而由义项组成的义项结构是一个具有多重继承特征的义项网。本申请所形成的义项网中,每一个抽象概念的直接上位概念必须是与该概念具有相同的独立义原和更少的语义限定,且该上位概念必须是独立义原或是独立存在于其他义项定义中的抽象概念。
基于此,使用义原表示第一含义词和第二含义词,可以进一步使语义的表达更加全面,从而再次提升侵权比对的精准度。
502:根据最短路径的长度和预先设置的第一调节参数,确定第一义项和第二义项之间的第二相似度;
503:将第二相似度作为第一相似度。
此外,在可选的实施方式中,参阅图7,图7为本申请实施方式提供的另一种获取第一相似度的方法的流程示意图。该方法包括以下步骤:
701:获取第一义项的第一义项长度。
702:获取第二义项的第二义项长度。
703:获取第一义项和第二义项之间的最长公共子序列的长度。
在本实施方式中,最长公共子序列表示第一义项和第二义项之间的所有公共子序列中最长的公共子序列。
示例性的,对于给定的字符串{a,b,c,d,e,f,g,h},它的子序列示例可以为{a,c,e,h},即字符串{a,b,c,d,e,f,g,h}中元素a,c,e,h组成的字符串,并不要求元素之间是否有连续关系。因此,字符串{a,b,e,h}、{b,h}等也都是它的子序列。
基于此,若再给出一个字符串{b,d,c,e,s},则这两个字符串之间的公共子串可以包括{b}、{c}、{d}、{e}、{b,c}、{b、d}、{b,e}、{c,e}、{d、e}和{b,c,e},且由于{b,c,e}的长度最长,则{b,c,e}就是这两个字符串之间的最长公共子序列。
704:根据最长公共子序列的长度,以及第一义项长度和第二义项长度之和,确定第一义项和第二义项之间的第三相似度;
705:将第二相似度和第三相似度的最大值作为第一相似度。
基于此,可以兼顾义项之间的共性和差异性确定相似度,从而提升第一相似度的精准度。
305:将至少一个义项对对应的至少一个第一相似度中的最大值作为语义相似度。
204:将语义相似度作为相似度。
在可选的实施方式中,参阅图8,图8为本申请实施方式提供的另一种语义比对处理的流程示意图。该比对处理包括以下步骤:
801:对第一含义词进行词嵌入处理,得到第一含义词对应的第一词向量。
802:对第二含义词进行词嵌入处理,得到第二含义词对应的第二词向量。
示例性的,词嵌入处理是根据设定映射好关系,将词语中的每个字符映射为各自对应的词向量,例如,每个字符可以使用各自的ASCII码作为每个字符的词向量。
803:根据第一词向量和第二词向量,获取第一含义词和第二含义词之间的相似距离。
804:将语义相似度和相似距离均作为相似度。
104:根据相似度,对候选商标进行侵权判定。
由于相似度可以包括义原-义项体系下的语义相似度和基于Word2vec的词向量的相似距离。因此,在本实施方式中,对候选商标进行侵权判定可以通过以下方式进行:
若第一相似度大于第一阈值和/或相似距离小于第二阈值,判定候选商标侵权。
综上所述,本发明所提供的商标侵权的自动化判定方法,采用特征提取比对的方式,可以快速定位相似商标。同时,采用义原-义项体系下的语义相似度和基于Word2vec的词向量的相似距离进行综合判定,使判定结果更加精准,且整个计算相似度过程,没有人工参与,不受人工的主观判断的影响,从而可以将侵权判定结果作为维权的依据。并且,实现了商标侵权的自动化处理,节省了大量的人力成本。
以下,将结合具体实施例对本发明所提供的商标侵权的自动化判定方法进行说明。
在本实施例中,首先,对待维权的商标进行特征信息提取,具体包括待维权商标的本体(文字与图形)、所属的企业名称、注册日期、商品服务分类以及经营范围等。然后,通过搜索引擎以特征信息匹配的方式对Elasticsearch数据库进行检索,从Elasticsearch数据库中筛选出候选商标,进行侵权比对。
在本实施例中,侵权比对可以分为义原-义项体系下的语义相似度比对和基于Word2vec的词向量的相似距离比对,以下将分别对二者进行说明:
(1)义原-义项体系下的语义相似度比对:
在本实施例中,首先,对比对双方的商标进行语义切分处理,获取与待维权商标对应的第一含义词和与候选商标对应的第二含义词。在获取包含语义的含义词的同时去除无序无意义的比对元素。这样去除了无效的比对元素,从而可以简化后续比对处理流程,提高比对效率。
在本实施例中,在获取到含义词后,可以进行语义相似度的获取。示例性的,本申请的语义相似度可以通过公式①表示:
Figure BDA0002814166990000111
其中,w1表示第一含义词,w2表示第二含义词,i表示第一含义词的义原个数,j表示第二含义词的义原个数,c1i表示第一含义词的i个义原,c2j表示第二含义次的第j个义原,SIM()为获取语义相似度,Sim()为获取第一相似度。
基于此,本申请的第一相似度可以通过公式②表示:
Figure BDA0002814166990000112
其中,syn()为获取义原,sim()为获取第二相似度(义原相似度)。
示例性的,本申请的第二相似度可以通过公式③表示:
Figure BDA0002814166990000113
其中,a表示第一调节参数,d表示第一义项的义原c1i和第二义项的义原c2j之间在义原层次体系中的最短路径的长度。
在可选的实施例中,本申请的第一相似度还可以通过公式④表示:
Sim(c1i,c2j)=max{sim(c1i,c2j),simlm(c1i,c2j)}…………..④
其中,simlm()为获取第三相似度。
基于此,示例性的,本申请的第三相似度可以通过公式⑤表示:
Figure BDA0002814166990000121
其中,IC()为获取长度,LCS()为获取最长公共子序列。
通过以上公式①-⑤可看出,使用义原表示第一含义词和第二含义词,可以进一步使语义的表达更加全面,从而提升侵权比对的精准度。
(2)基于Word2vec的词向量的相似距离比对:
首先,同样是对比对双方的商标进行语义切分处理,获取与待维权商标对应的第一含义词和与候选商标对应的第二含义词。从而在获取包含语义的含义词的同时去除无序无意义的比对元素。然后,分别对第一含义词和第二含义词进行词嵌入处理,得到与第一含义词对应的第一词向量,以及与第二含义词对应的第二词向量。最后,根据第一词向量和第二词向量,获取第一含义词和第二含义词之间的相似距离。
并且,在本实施例中,义原-义项体系下的语义相似度和基于Word2vec的词向量的相似距离的获取可以同步进行,同时,只要第一相似度大于第一阈值和/或相似距离小于第二阈值,即可判定候选商标侵权,进行侵权判定推送。
同时,采用义原-义项体系下的语义相似度和基于Word2vec的词向量的相似距离进行综合判定,使判定结果更加精准,且整个计算相似度过程,没有人工参与,不受人工的主观判断的影响,从而可以将侵权判定结果作为维权的依据。
参阅图9,图9为本申请实施方式提供的一种商标侵权的自动化判定装置的功能模块组成框图。该商标侵权的自动化判定装置包括:
特征提取模块11,用于获取待维权商标的特征信息,其中,所述特征信息包括:文字信息、数字信息、图形信息、所属的企业名称、注册日期、商品服务分类以及经营范围。
候选商标确定模块12,用于在预设商标库中筛选与特征信息相匹配的商标作为疑似侵权的候选商标。
比对模块13,用于对待维权商标和候选商标进行语义比对处理,得到所述待维权商标和所述候选商标之间的相似度。
判定模块14,用于相似度,对候选商标进行侵权判定。
在本发明的实施方式中,比对模块13具体用于:对待维权商标进行语义切分处理,得到待维权商标对应的第一含义词;
对候选商标进行语义切分处理,得到候选商标对应的第二含义词;
获取第一含义词和第二含义词的语义相似度;
将语义相似度作为相似度。
在本发明的实施方式中,在获取第一含义词和第二含义词的语义相似度方面,比对模块13具体用于:
对第一含义词进行义项提取处理,得到第一含义词对应的第一义项组;
对第二含义词进行义项提取处理,得到第二含义词对应的第二义项组;
将第一义项组中的义项和第二义项组中的义项两两配对,得到至少一个义项对;
针对至少一个义项对中的每个义项对,分别获取每个义项对中的第一义项和第二义项之间的第一相似度,其中,第一义项为每个义项对中的属于第一义项组的义项,第二义项为每个义项对中的属于第二义项组的义项;
将至少一个义项对对应的至少一个第一相似度中的最大值作为语义相似度。
在本发明的实施方式中,在获取第一义项和第二义项之间的第一相似度方面,比对模块13具体用于:
确定第一义项和第二义项之间的最短路径的长度,其中,最短路径表示第一义项和第二义项在义原层次体系中最短的路径;
根据最短路径的长度和预先设置的第一调节参数,确定第一义项和第二义项之间的第二相似度;
将第二相似度作为第一相似度。
在本发明的实施方式中,在将第二相似度作为第一相似度之前,比对模块13还用于:
获取第一义项的第一义项长度;
获取第二义项的第二义项长度;
获取第一义项和第二义项之间的最长公共子序列的长度,其中,最长公共子序列表示第一义项和第二义项之间的所有公共子序列中最长的公共子序列;
根据最长公共子序列的长度,以及第一义项长度和第二义项长度之和,确定第一义项和第二义项之间的第三相似度;
将第二相似度和第三相似度的最大值作为第一相似度。
在本发明的实施方式中,在将语义相似度作为处理结果之前,比对模块13还用于:
对第一含义词进行词嵌入处理,得到第一含义词对应的第一词向量;
对第二含义词进行词嵌入处理,得到第二含义词对应的第二词向量;
根据第一词向量和第二词向量,获取第一含义词和第二含义词之间的相似距离;
将语义相似度作为处理结果,包括:
将语义相似度和相似距离均作为相似度。
基于此,在本发明的实施方式中,判定模块14具体用于:若第一相似度大于第一阈值和/或相似距离小于第二阈值,判定候选商标侵权。
应理解,本申请中商标侵权的自动化判定装置可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备MID(Mobile Internet Devices,简称:MID)或穿戴式设备等。上述商标侵权的自动化判定装置仅是举例,而非穷举,包含但不限于上述商标侵权的自动化判定装置。在实际应用中,上述商标侵权的自动化判定装置还可以包括:智能车载终端、计算机设备等等。
本申请实施方式还提供了一种电子设备,该电子设备包括处理器、存储器、通信接口以及一个或多个程序。其中,一个或多个程序被存储在存储器中,并且被配置由处理器执行,从而实现本发明前述实施方式或实现方式所提供的商标侵权的自动化判定方法。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施方式或者实施方式的某些部分所述的方法。
因此,本申请实施例还提供一种计算机存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如上述方法实施例中记载的任何一种商标侵权的自动化判定方法的部分或全部步骤。例如,所述存储介质可以包括硬盘、软盘、光盘、磁带、磁盘、优盘、闪存等。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种商标侵权的自动化判定方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种商标侵权的自动化判定方法,其特征在于,所述方法包括:
获取待维权商标的特征信息,其中,所述特征信息包括:文字信息、数字信息、图形信息、所属的企业名称、注册日期、商品服务分类以及经营范围;
在预设商标库中筛选与所述特征信息相匹配的商标作为疑似侵权的候选商标;
对所述待维权商标和所述候选商标进行语义比对处理,得到所述待维权商标和所述候选商标之间的相似度;
根据所述相似度,对所述候选商标进行侵权判定。
2.根据权利要求1所述的方法,其特征在于,所述对所述待维权商标和所述候选商标进行语义比对处理,得到所述待维权商标和所述候选商标之间的相似度,包括:
对所述待维权商标进行语义切分处理,得到所述待维权商标对应的第一含义词;
对所述候选商标进行语义切分处理,得到所述候选商标对应的第二含义词;
获取所述第一含义词和所述第二含义词的语义相似度;
将所述语义相似度作为所述相似度。
3.根据权利要求2所述的方法,其特征在于,所述获取所述第一含义词和所述第二含义词的语义相似度,包括:
对所述第一含义词进行义项提取处理,得到所述第一含义词对应的第一义项组;
对所述第二含义词进行义项提取处理,得到所述第二含义词对应的第二义项组;
将所述第一义项组中的义项和所述第二义项组中的义项两两配对,得到至少一个义项对;
针对所述至少一个义项对中的每个义项对,分别获取所述每个义项对中的第一义项和第二义项之间的第一相似度,其中,所述第一义项为所述每个义项对中的属于所述第一义项组的义项,所述第二义项为所述每个义项对中的属于所述第二义项组的义项;
将所述至少一个义项对对应的至少一个第一相似度中的最大值作为所述语义相似度。
4.根据权利要求3所述的方法,其特征在于,所述获取所述第一义项和所述第二义项之间的第一相似度,包括:
确定所述第一义项和所述第二义项之间的最短路径的长度,其中,所述最短路径表示所述第一义项和所述第二义项在义原层次体系中最短的路径;
根据所述最短路径的长度和预先设置的第一调节参数,确定所述第一义项和所述第二义项之间的第二相似度;
将所述第二相似度作为所述第一相似度。
5.根据权利要求4所述的方法,其特征在于,在将所述第二相似度作为所述第一相似度之前,所述方法还包括:
获取所述第一义项的第一义项长度;
获取所述第二义项的第二义项长度;
获取所述第一义项和所述第二义项之间的最长公共子序列的长度,其中,所述最长公共子序列表示所述第一义项和所述第二义项之间的所有公共子序列中最长的公共子序列;
根据所述最长公共子序列的长度,以及所述第一义项长度和所述第二义项长度之和,确定所述第一义项和所述第二义项之间的第三相似度;
所述将所述第二相似度作为所述第一相似度,包括:
将所述第二相似度和所述第三相似度的最大值作为所述第一相似度。
6.根据权利要求2所述的方法,其特征在于,将所述语义相似度作为所述相似度之前,所述方法还包括:
对所述第一含义词进行词嵌入处理,得到所述第一含义词对应的第一词向量;
对所述第二含义词进行词嵌入处理,得到所述第二含义词对应的第二词向量;
根据所述第一词向量和所述第二词向量,获取所述第一含义词和所述第二含义词之间的相似距离;
所述将所述语义相似度作为所述相似度,包括:
将所述语义相似度和所述相似距离均作为所述相似度。
7.根据权利要求6所述的方法,其特征在于,所述根据所述相似度,对所述候选商标进行侵权判定,包括:
若所述第一相似度大于第一阈值和/或所述相似距离小于第二阈值,判定所述候选商标侵权。
8.一种商标侵权的自动化判定装置,其特征在于,所述装置包括:
特征提取模块,用于获取待维权商标的特征信息,其中,所述特征信息包括:文字信息、数字信息、图形信息、所属的企业名称、注册日期、商品服务分类以及经营范围;
候选商标确定模块,用于在预设商标库中筛选与所述特征信息相匹配的商标作为疑似侵权的候选商标;
比对模块,用于对所述待维权商标和所述候选商标进行语义比对处理,得到所述待维权商标和所述候选商标之间的相似度;
判定模块,用于根据所述相似度,对所述候选商标进行侵权判定。
9.一种电子设备,其特征在于,包括处理器、存储器、通信接口以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述一个或多个程序包括用于执行权利要求1-7任一项方法中的步骤的指令。
10.一种可读计算机存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-7任一项所述的方法。
CN202011393630.1A 2020-12-03 2020-12-03 商标侵权的自动化判定方法、装置、电子设备和存储介质 Pending CN112507160A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011393630.1A CN112507160A (zh) 2020-12-03 2020-12-03 商标侵权的自动化判定方法、装置、电子设备和存储介质
PCT/CN2021/082724 WO2022116418A1 (zh) 2020-12-03 2021-03-24 商标侵权的自动化判定方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011393630.1A CN112507160A (zh) 2020-12-03 2020-12-03 商标侵权的自动化判定方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN112507160A true CN112507160A (zh) 2021-03-16

Family

ID=74969278

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011393630.1A Pending CN112507160A (zh) 2020-12-03 2020-12-03 商标侵权的自动化判定方法、装置、电子设备和存储介质

Country Status (2)

Country Link
CN (1) CN112507160A (zh)
WO (1) WO2022116418A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113032524A (zh) * 2021-03-23 2021-06-25 平安科技(深圳)有限公司 商标侵权识别方法、终端设备及存储介质
CN113240556A (zh) * 2021-05-31 2021-08-10 平安科技(深圳)有限公司 基于智能决策的侵权处理方法、装置、设备及介质
CN113268613A (zh) * 2021-04-30 2021-08-17 上海右云信息技术有限公司 一种用于获取侵权线索的方法、设备、介质及程序产品
CN114359590A (zh) * 2021-12-06 2022-04-15 支付宝(杭州)信息技术有限公司 Nft图像作品侵权检测方法、装置、及计算机存储介质
CN114529784A (zh) * 2022-02-18 2022-05-24 广东数源智汇科技有限公司 一种面向电商数据的商标侵权分析方法及系统
WO2022116418A1 (zh) * 2020-12-03 2022-06-09 平安科技(深圳)有限公司 商标侵权的自动化判定方法、装置、电子设备和存储介质
CN115392938A (zh) * 2022-10-26 2022-11-25 北京吉道尔科技有限公司 一种基于区块链的电商平台仿冒商品大数据识别方法
CN116628245A (zh) * 2023-07-24 2023-08-22 四海良田(天津)智能科技有限公司 一种基于人工智能的商标智能推荐方法和系统

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116579786B (zh) * 2023-05-06 2023-11-14 全拓科技(杭州)股份有限公司 一种应用于大数据分析的数据清洗方法与系统
CN117609771B (zh) * 2024-01-24 2024-03-29 中国标准化研究院 疑似侵权商标的检索方法、检索装置及电子设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10891701B2 (en) * 2011-04-15 2021-01-12 Rowan TELS Corp. Method and system for evaluating intellectual property
CN106095865B (zh) * 2016-06-03 2019-04-12 中细软移动互联科技有限公司 一种商标文本相似性评审方法
CN109189888B (zh) * 2018-09-07 2023-03-21 平安科技(深圳)有限公司 电子装置、侵权分析的方法及存储介质
CN110110116B (zh) * 2019-04-02 2021-04-06 浙江工业大学 一种整合深度卷积网络和语义分析的商标图像检索方法
CN112507160A (zh) * 2020-12-03 2021-03-16 平安科技(深圳)有限公司 商标侵权的自动化判定方法、装置、电子设备和存储介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022116418A1 (zh) * 2020-12-03 2022-06-09 平安科技(深圳)有限公司 商标侵权的自动化判定方法、装置、电子设备和存储介质
CN113032524A (zh) * 2021-03-23 2021-06-25 平安科技(深圳)有限公司 商标侵权识别方法、终端设备及存储介质
CN113268613A (zh) * 2021-04-30 2021-08-17 上海右云信息技术有限公司 一种用于获取侵权线索的方法、设备、介质及程序产品
CN113268613B (zh) * 2021-04-30 2024-04-09 上海右云信息技术有限公司 一种用于获取侵权线索的方法、设备、介质及程序产品
CN113240556B (zh) * 2021-05-31 2024-02-09 平安科技(深圳)有限公司 基于智能决策的侵权处理方法、装置、设备及介质
CN113240556A (zh) * 2021-05-31 2021-08-10 平安科技(深圳)有限公司 基于智能决策的侵权处理方法、装置、设备及介质
CN114359590A (zh) * 2021-12-06 2022-04-15 支付宝(杭州)信息技术有限公司 Nft图像作品侵权检测方法、装置、及计算机存储介质
CN114529784B (zh) * 2022-02-18 2022-11-18 广东数源智汇科技有限公司 一种面向电商数据的商标侵权分析方法及系统
CN114529784A (zh) * 2022-02-18 2022-05-24 广东数源智汇科技有限公司 一种面向电商数据的商标侵权分析方法及系统
CN115392938B (zh) * 2022-10-26 2023-06-02 重庆央链数据科技有限公司 一种基于区块链的电商平台仿冒商品大数据识别方法
CN115392938A (zh) * 2022-10-26 2022-11-25 北京吉道尔科技有限公司 一种基于区块链的电商平台仿冒商品大数据识别方法
CN116628245A (zh) * 2023-07-24 2023-08-22 四海良田(天津)智能科技有限公司 一种基于人工智能的商标智能推荐方法和系统
CN116628245B (zh) * 2023-07-24 2023-10-27 四海良田(天津)智能科技有限公司 一种基于人工智能的商标智能推荐方法和系统

Also Published As

Publication number Publication date
WO2022116418A1 (zh) 2022-06-09

Similar Documents

Publication Publication Date Title
CN112507160A (zh) 商标侵权的自动化判定方法、装置、电子设备和存储介质
CN109446343B (zh) 一种公共安全知识图谱构建的方法
CN108959431B (zh) 标签自动生成方法、系统、计算机可读存储介质及设备
CN109446524B (zh) 一种语音质检方法及装置
CN105095195B (zh) 基于知识图谱的人机问答方法和系统
CN107463605B (zh) 低质新闻资源的识别方法及装置、计算机设备及可读介质
US20180232443A1 (en) Intelligent matching system with ontology-aided relation extraction
CN106776897B (zh) 一种用户画像标签确定方法及装置
CN109460455A (zh) 一种文本检测方法及装置
CN109271489A (zh) 一种文本检测方法及装置
CN109947903B (zh) 一种成语查询方法及装置
CN112507176A (zh) 域名侵权的自动化判定方法、装置、电子设备和存储介质
CN110880142A (zh) 一种风险实体获取方法及装置
CN114416998A (zh) 文本标签的识别方法、装置、电子设备及存储介质
CN116719997A (zh) 政策信息推送方法、装置及电子设备
CN116739626A (zh) 商品数据挖掘处理方法、装置、电子设备及可读介质
CN113837824A (zh) 信息推送方法及其系统
CN117351334A (zh) 图像审核方法和相关设备
CN110489740B (zh) 语义解析方法及相关产品
CN114282119B (zh) 一种基于异构信息网络的科技信息资源检索方法及系统
CN114706948A (zh) 新闻处理方法、装置、存储介质以及电子设备
CN111401047A (zh) 法律文书的争议焦点生成方法、装置及计算机设备
CN113901317A (zh) 基于大数据和网络社区的产品推荐方法
CN107102994B (zh) 查询维度信息的确定方法及装置
CN113032775A (zh) 情报处理方法和情报处理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40041504

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination