CN109189888B

CN109189888B - 电子装置、侵权分析的方法及存储介质

Info

Publication number: CN109189888B
Application number: CN201811044154.5A
Authority: CN
Inventors: 叶素兰; 窦文伟; 田甜; 汪伟; 王晓伟
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-09-07
Filing date: 2018-09-07
Publication date: 2023-03-21
Anticipated expiration: 2038-09-07
Also published as: CN109189888A

Abstract

本发明涉及一种电子装置、侵权分析的方法及存储介，该方法包括：从数据源中提取企业信息，构建企业经营范围信息库；获取输入信息，对输入信息进行分析获取该输入信息中的商标名称，以该商标名称作为待维权商标，从预设的商标库中获取待维权商标使用类别的保护范围；对企业经营范围信息库进行匹配，以获取经营范围与待维权商标的保护范围有重叠的企业的企业名称作为疑似侵权对象；将待维权商标与疑似侵权对象输入到预先训练的商标近似识别模型中，利用该商标近似识别模型来分析是否构成近似商标；若构成近似商标，则采集疑似侵权对象的使用证据，判定是否构成侵权。本发明能够高效地对商标侵权进行自动化分析。

Description

电子装置、侵权分析的方法及存储介质

技术领域

本发明涉及数据处理领域，尤其涉及一种电子装置、侵权分析的方法及存储介。

背景技术

目前，在企业知识产权维权过程中，例如，商标侵权维权中，一般都是由法务人员自行收集侵权线索，对侵权线索进行人工分析、核实，最后结合相关的法律法规来得出侵权与否的结论；而对于明确属于侵权的线索，还需法务人员根据工作经验来草拟一份维权策略。整个过程均由法务人员人工操作完成，耗时耗力，效率低，不利于企业维权。

发明内容

本发明的目的在于提供一种电子装置、侵权分析的方法及存储介，旨在构建高效的商标侵权自动化分析方法。

为实现上述目的，本发明提供一种电子装置，所述电子装置包括存储器及与所述存储器连接的处理器，所述存储器中存储有可在所述处理器上运行的处理系统，所述处理系统被所述处理器执行时实现如下步骤：

构建步骤，从数据源中提取企业信息，基于所述企业信息构建企业经营范围信息库；

获取步骤，获取输入信息，对输入信息进行分析获取该输入信息中的商标名称，以该商标名称作为待维权商标，从预设的商标库中获取待维权商标使用类别的保护范围；

匹配步骤，基于待维权商标的保护范围对企业经营范围信息库进行匹配，以获取经营范围与待维权商标的保护范围有重叠的企业的企业名称作为疑似侵权对象；

分析步骤，将待维权商标与疑似侵权对象输入到预先训练的商标近似识别模型中，利用该商标近似识别模型来分析是否构成近似商标；

判定步骤，若构成近似商标，则采集疑似侵权对象的使用证据，基于所述使用证据判定是否构成侵权。

优选地，所述数据源包括应用APP数据源及非应用APP数据源，从应用APP数据源中提取企业信息，基于所述企业信息构建企业经营范围信息库的步骤，具体包括：

从应用APP中获取应用APP的描述文件中的描述文本，并获取该描述文本中的创作author字段；

基于预设的识别规则对创作author字段的内容进行识别，以分析该应用APP的所有者是否是企业实体；

若是企业实体，则获取该企业实体的企业名称；

若不是企业实体或创作author字段的内容为空，则对描述文本进行文本分析，以获取该应用APP对应的企业名称；

基于所述企业名称获取对应的经营范围及产品描述信息，将企业名称与对应的经营范围及产品描述信息进行关联，以供构建企业经营范围信息库；

所述预设的识别规则包括：

分析author字段的内容是汉字还是拼音；

若是汉字，则在企业工商库中匹配该author字段的内容，以匹配到企业主体；

若是拼音，则分析author字段的内容是否以字符Ltd结尾，以分析是否为企业主体。

优选地，所述分析步骤，具体包括：

将待维权商标与疑似侵权对象输入到证据规则模型中，获取输出的待维权商标与疑似侵权对象近似的第一概率；

若该第一概率小于预设第一阈值，则将待维权商标与疑似侵权对象输入到语义分析模型中，获取输出的待维权商标与疑似侵权对象近似的第二概率；

若该第二概率小于预设第二阈值，将待维权商标与疑似侵权对象发送至审核平台，供人工判定是否构成近似商标。

优选地，所述证据规则模型的训练包括：获取商标判决书，通过预定的文本挖掘方式抽取判决书中商标近似的判定语句，利用该判定语句对预定的分类模型进行训练，以得到基于近似判定规则的证据规则模型；

其中，预定的文本挖掘方式包括：获取标准的商标近似的判定语句，计算判决书中的语句与标准的商标近似的判定语句两者的句向量相似度，若该句向量相似度大于预定的阈值，则判决书中的该语句为商标近似的判定语句；或者通过将预先定义商标近似的判定语句的模式串与判决书中的语句进行匹配，得到商标近似的判定语句；

其中，语义分析模型通过疑似侵权对象相对于待维权商标增加的文字的显著性来判断，以分析疑似侵权对象增加文字是否具有显著性，包括：获取疑似侵权对象相对于待维权商标所增加的文字，基于预设的行业常用搭配词词库，分析所增加的文字是否是该疑似侵权对象对应的企业所在的领域的常用名称搭配词，以得到待维权商标与疑似侵权对象近似的第一子概率，再基于预设的词典分析所增加的文字是否与该疑似侵权对象对应的企业所在的领域相契合，以得到待维权商标与疑似侵权对象近似的第二子概率，将第一子概率及第二子概率相加得到所述第二概率。

为实现上述目的，本发明还提供一种侵权分析的方法，所述侵权分析的方法包括：

S1，从数据源中提取企业信息，基于所述企业信息构建企业经营范围信息库；

S2，获取输入信息，对输入信息进行分析获取该输入信息中的商标名称，以该商标名称作为待维权商标，从预设的商标库中获取待维权商标使用类别的保护范围；

S3，基于待维权商标的保护范围对企业经营范围信息库进行匹配，以获取经营范围与待维权商标的保护范围有重叠的企业的企业名称作为疑似侵权对象；

S4，将待维权商标与疑似侵权对象输入到预先训练的商标近似识别模型中，利用该商标近似识别模型来分析是否构成近似商标；

S5，若构成近似商标，则采集疑似侵权对象的使用证据，基于所述使用证据判定是否构成侵权。

若是企业实体，则获取该企业实体的企业名称；

所述预设的识别规则包括：

分析author字段的内容是汉字还是拼音；

优选地，所述商标近似识别模型包括证据规则模型及语义分析模型，所述步骤S4，具体包括：

优选地，所述步骤S5之后，还包括：获取判定是否构成侵权的结果，并获取官方的裁定结果，将判定是否构成侵权的结果及官方的裁定结果进行关联存储，以进行优化。

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有处理系统，所述处理系统被处理器执行时实现上述的侵权分析的方法的步骤。

本发明的有益效果是：本发明预先构建企业经营范围信息库，从商标库中获取待维权商标使用类别的保护范围，利用企业经营范围信息库对待维权商标的保护范围进行匹配，得到保护范围有重叠的企业作为疑似侵权对象，通过自然语言处理及深度学习技术对待维权商标与疑似侵权对象进行分析，若构成近似商标，结合商标侵权的法律判断依据从多种数据源提取使用证据信息得到侵权相关证据，能够高效地对商标侵权进行自动化分析，有利于企业维权。

附图说明

图1为本发明电子装置一实施例的硬件架构的示意图；

图2为本发明侵权分析的方法一实施例的流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在本发明中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

参阅图1所示，是本发明电子装置一实施例的硬件架构的示意图。所述电子装置1是一种能够按照事先设定或者存储的指令，自动进行数值计算和/或信息处理的设备。所述电子装置1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云，其中云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机。

在本实施例中，电子装置1可包括，但不仅限于，可通过系统总线相互通信连接的存储器11、处理器12、网络接口13，存储器11存储有可在处理器12上运行的处理系统。需要指出的是，图1仅示出了具有组件11-13的电子装置1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

其中，存储器11包括内存及至少一种类型的可读存储介质。内存为电子装置1的运行提供缓存；可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中，可读存储介质可以是电子装置1的内部存储单元，例如该电子装置1的硬盘；在另一些实施例中，该非易失性存储介质也可以是电子装置1的外部存储设备，例如电子装置1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。本实施例中，存储器11的可读存储介质通常用于存储安装于电子装置1的操作系统和各类应用软件，例如存储本发明一实施例中的处理系统的程序代码等。此外，存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子装置1的总体操作，例如执行与其他设备进行数据交互或者通信相关的控制和处理等。本实施例中，所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据，例如运行处理系统等。

所述网络接口13可包括无线网络接口或有线网络接口，该网络接口13通常用于在所述电子装置1与其他电子设备之间建立通信连接。

所述处理系统存储在存储器11中，包括至少一个存储在存储器11中的计算机可读指令，该至少一个计算机可读指令可被处理器12执行，以实现本申请各实施例的方法；以及，该至少一个计算机可读指令依据其各部分所实现的功能不同，可被划为不同的逻辑模块。

在一实施例中，上述处理系统被所述处理器12执行时实现如下步骤：

本实施例中，从多种数据源中提取企业信息，数据源包括应用APP及非应用APP，非应用APP包括企业工商信息、企业招聘信息、行业网站、舆情信息(新闻网站、论坛、贴吧)等，应用APP例如为“QQ”。从非应用APP中可以直接获取到企业信息，所获取的企业信息包括企业主体名称及其经营范围、产品描述等，将企业主体名称及其对应的经营范围、产品描述关联，构建企业经营范围信息库。在一实施例中，企业经营范围信息库在具体应用时，可以通过过滤器去除待维权商标对应的白名单，包括其子、分、支公司及其各种办事处、代理点等机构，并且过滤掉与待维权商标名称类似的地名、人名之后，得到待分析的企业集合及其经营范围、产品描述。

在一实施例中，从应用APP数据源中提取企业信息，基于所述企业信息构建企业经营范围信息库包括：从应用APP中获取应用APP的描述文件中的描述文本，并获取该描述文本中的创作author字段，例如，创作author字段为：San Zhang、Shenzhen PingAn XunKeTechnology Co Ltd、优思科技、深圳文化传媒有限公司。基于预设的识别规则对创作author字段的内容进行识别，以分析该应用APP的所有者是否是企业实体，预设的识别规则如下：

1、如果author字段为汉字，则直接到企业工商库中进行匹配，企业工商库中包含企业主体的全称及简称，匹配到的则为企业主体，匹配不上的推送到系统前台供人工处理，上述的“深圳文化传媒有限公司”可以匹配到；

2、如果author字段为拼音并以“Ltd”结尾则为企业实体，例如上述的“ShenzhenPingAn XunKe Technology Co Ltd”；

3、如果author字段不以“Ltd”结尾，则可能是企业简称拼音或者是自然人，则将企业工商库中的所有简称转化为拼音，逐个与之匹配，找出的结果提交到前台由供人工核对，核对结果同步到企业工商库，例如，经过识别后：“San Zhang”为自然人，“优思科技”为企业主体；

4、若不是企业实体或创作author字段的内容为空，则对描述文本(描述文本包括对企业的描述)进行文本分析，例如对描述文本进行分词，并将分词后的词与企业工商库进行匹配，与以获取该应用APP对应的企业名称；

5、一般而言，企业名称是对于经营范围的高度浓缩，或者企业名称就是生产和经营的商品类别、品种或服务项目，基于企业名称获取对应的经营范围及产品描述信息，将企业名称与对应的经营范围及产品描述信息进行关联，以供构建企业经营范围信息库。

其中，用户在操作界面上输入商标的相关的输入信息，系统对输入信息分析得到待维权商标，从商标库中获取该待维权商标使用类别的保护范围。

其中，将待维权商标的保护范围与企业经营范围信息库中大量的企业信息进行匹配，并分析企业经营范围信息库是否有与待维权商标的保护范围有重叠的企业，若有，则将其作为疑似侵权对象，供后续进行侵权分析。

本实施例通过商标近似识别模型来识别待维权商标与疑似侵权对象是否相似，商标近似识别模型包括判定型的证据规则模型，以及在待维权商标的前后增加文字后分析语义是否相似的语义分析模型，前者通过数理统计的方式找出已判决案件中类似案件的判定规则，后者通过经验定性的来抽取特征进行判断，两者相互补充，更有效判断出商标的相似性，包括：

在一实施例中，证据规则模型的训练包括：获取商标判决书，通过预定的文本挖掘方式抽取判决书中商标近似的判定语句，利用该判定语句对预定的分类模型(例如随机森林模型)进行训练，以得到基于近似判定规则的证据规则模型。其中，预定的文本挖掘方式可以是：首先获取标准的商标近似的判定语句，计算判决书中的语句与标准的商标近似的判定语句两者的句向量相似度，若句向量相似度大于一定的阈值(例如0.985)，则判决书中的该语句为商标近似的判定语句；还可以通过模式匹配的方式，例如预先定义商标近似的判定语句的模式串，将该模式串与判决书中的语句进行匹配，得到商标近似的判定语句；

若该第一概率小于预设第一阈值(例如0.985)，则将待维权商标与疑似侵权对象输入到语义分析模型中，获取输出的待维权商标与疑似侵权对象近似的第二概率；

在一实施例中，语义分析模型通过疑似侵权对象相对于待维权商标增加的文字的显著性来判断，即分析疑似侵权对象增加文字是否具有显著性，可从两个方面进行度量：语义分析模型获取疑似侵权对象相对于待维权商标所增加的文字，基于预设的行业常用搭配词词库，分析所增加的文字是否是该疑似侵权对象对应的企业所在的领域的常用名称搭配词，若否，则得到待维权商标与疑似侵权对象近似的第一子概率，例如为10％或15％，若是，则得到待维权商标与疑似侵权对象近似的第一子概率，例如为40％或45％，基于预设的词典分析所增加的文字是否与该疑似侵权对象对应的企业所在的领域相契合，如果契合，则得到待维权商标与疑似侵权对象近似的第二子概率，例如为40％或45％，如果不契合，得到待维权商标与疑似侵权对象近似的第二子概率，例如为10％或15％，将两次分析得到的子概率相加得到第二概率，例如两次分析得到的子概率相加后得到第二概率：10％+10％＝20％，则显著性大(即不相似)，而两次分析得到的概率相加后得到第二概率：45％+45％＝90％，则显著性小(即相似)。对于待维权商标与疑似侵权对象是否容易导致混淆，从待维权商标与疑似侵权对象是否在相同领域内来判断，如两家企业都是从事于股票基金管理业务领域，而增加的文字又不具有显著性，则近似的概率大。这里判断两家企业的经营领域，使用经营范围领域相同或近似的规则来判断。

若该第二概率小于预设第二阈值(例如0.9)，将待维权商标与疑似侵权对象发送至审核平台，供人工判定是否构成近似商标。

本实施例中，如果待维权商标与疑似侵权对象构成近似商标，则从多种渠道采集疑似侵权对象的使用证据，例如微信公众号、微博、APP、官网、新闻、行业网站等平台，如满足商标性使用，则判定构成侵权。如不能判定，则继续搜集证据。待维权商标经过上述的侵权预判定后，最终将会有官方的裁定结果，可以将官方的裁定结果输入至上述的相关库中，以优化系统。

与现有技术相比，本发明预先构建企业经营范围信息库，从商标库中获取待维权商标使用类别的保护范围，利用企业经营范围信息库对待维权商标的保护范围进行匹配，得到保护范围有重叠的企业作为疑似侵权对象，通过自然语言处理及深度学习技术对待维权商标与疑似侵权对象进行分析，若构成近似商标，结合商标侵权的法律判断依据从多种数据源提取使用证据信息得到侵权相关证据，能够高效地对商标侵权进行自动化分析，有利于企业维权。

如图2所示，图2为本发明侵权分析的方法一实施例的流程示意图，该侵权分析的方法包括以下步骤：

步骤S1，从数据源中提取企业信息，基于所述企业信息构建企业经营范围信息库；

在一实施例中，从应用APP中获取企业信息包括：从应用APP中获取应用APP的描述文件中的描述文本，并获取该描述文本中的创作author字段，例如，创作author字段为：SanZhang、Shenzhen PingAn XunKe Technology Co Ltd、优思科技、深圳文化传媒有限公司。基于预设的识别规则对创作author字段的内容进行识别，以分析该应用APP的所有者是否是企业实体，预设的识别规则如下：

步骤S2，获取输入信息，对输入信息进行分析获取该输入信息中的商标名称，以该商标名称作为待维权商标，从预设的商标库中获取待维权商标使用类别的保护范围；

步骤S3，基于待维权商标的保护范围对企业经营范围信息库进行匹配，以获取经营范围与待维权商标的保护范围有重叠的企业的企业名称作为疑似侵权对象；

步骤S4，将待维权商标与疑似侵权对象输入到预先训练的商标近似识别模型中，利用该商标近似识别模型来分析是否构成近似商标；

步骤S5，若构成近似商标，则采集疑似侵权对象的使用证据，基于所述使用证据判定是否构成侵权。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种电子装置，其特征在于，所述电子装置包括存储器及与所述存储器连接的处理器，所述存储器中存储有可在所述处理器上运行的处理系统，所述处理系统被所述处理器执行时实现如下步骤：

判定步骤，若构成近似商标，则采集疑似侵权对象的使用证据，基于所述使用证据判定是否构成侵权；

其中：

所述商标近似识别模型包括证据规则模型及语义分析模型，所述分析步骤，具体包括：将待维权商标与疑似侵权对象输入到证据规则模型中，获取输出的待维权商标与疑似侵权对象近似的第一概率；若该第一概率小于预设第一阈值，则将待维权商标与疑似侵权对象输入到语义分析模型中，获取输出的待维权商标与疑似侵权对象近似的第二概率；若该第二概率小于预设第二阈值，将待维权商标与疑似侵权对象发送至审核平台，供人工判定是否构成近似商标；

所述证据规则模型的训练包括：获取商标判决书，通过预定的文本挖掘方式抽取判决书中商标近似的判定语句，利用该判定语句对预定的分类模型进行训练，以得到基于近似判定规则的证据规则模型；

语义分析模型通过疑似侵权对象相对于待维权商标增加的文字的显著性来判断，以分析疑似侵权对象增加文字是否具有显著性，包括：获取疑似侵权对象相对于待维权商标所增加的文字，基于预设的行业常用搭配词词库，分析所增加的文字是否是该疑似侵权对象对应的企业所在的领域的常用名称搭配词，以得到待维权商标与疑似侵权对象近似的第一子概率，再基于预设的词典分析所增加的文字是否与该疑似侵权对象对应的企业所在的领域相契合，以得到待维权商标与疑似侵权对象近似的第二子概率，将第一子概率及第二子概率相加得到所述第二概率。

2.根据权利要求1所述的电子装置，其特征在于，所述数据源包括应用APP数据源及非应用APP数据源，从应用APP数据源中提取企业信息，基于所述企业信息构建企业经营范围信息库的步骤，具体包括：

若是企业实体，则获取该企业实体的企业名称；

所述预设的识别规则包括：

分析author字段的内容是汉字还是拼音；

3.根据权利要求1所述的电子装置，其特征在于，预定的文本挖掘方式包括：获取标准的商标近似的判定语句，计算判决书中的语句与标准的商标近似的判定语句两者的句向量相似度，若该句向量相似度大于预定的阈值，则判决书中的该语句为商标近似的判定语句；或者通过将预先定义商标近似的判定语句的模式串与判决书中的语句进行匹配，得到商标近似的判定语句。

4.一种侵权分析的方法，其特征在于，所述侵权分析的方法包括：

S5，若构成近似商标，则采集疑似侵权对象的使用证据，基于所述使用证据判定是否构成侵权；

其中：

所述商标近似识别模型包括证据规则模型及语义分析模型，所述步骤S4，具体包括：将待维权商标与疑似侵权对象输入到证据规则模型中，获取输出的待维权商标与疑似侵权对象近似的第一概率；若该第一概率小于预设第一阈值，则将待维权商标与疑似侵权对象输入到语义分析模型中，获取输出的待维权商标与疑似侵权对象近似的第二概率；若该第二概率小于预设第二阈值，将待维权商标与疑似侵权对象发送至审核平台，供人工判定是否构成近似商标；

5.根据权利要求4所述的侵权分析的方法，其特征在于，所述数据源包括应用APP数据源及非应用APP数据源，从应用APP数据源中提取企业信息，基于所述企业信息构建企业经营范围信息库的步骤，具体包括：

若是企业实体，则获取该企业实体的企业名称；

所述预设的识别规则包括：

分析author字段的内容是汉字还是拼音；

6.根据权利要求4所述的侵权分析的方法，其特征在于，预定的文本挖掘方式包括：获取标准的商标近似的判定语句，计算判决书中的语句与标准的商标近似的判定语句两者的句向量相似度，若该句向量相似度大于预定的阈值，则判决书中的该语句为商标近似的判定语句；或者通过将预先定义商标近似的判定语句的模式串与判决书中的语句进行匹配，得到商标近似的判定语句。

7.根据权利要求4或5所述的侵权分析的方法，其特征在于，所述步骤S5之后，还包括：获取判定是否构成侵权的结果，并获取官方的裁定结果，将判定是否构成侵权的结果及官方的裁定结果进行关联存储，以进行优化。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有处理系统，所述处理系统被处理器执行时实现如权利要求4至7中任一项所述的侵权分析的方法的步骤。