CN108416535B

CN108416535B - 基于深度学习的专利价值评估的方法

Info

Publication number: CN108416535B
Application number: CN201810259236.5A
Authority: CN
Inventors: 陈恩红; 刘淇; 林弘杰; 杜东舫; 武晗
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2018-03-27
Filing date: 2018-03-27
Publication date: 2021-08-13
Anticipated expiration: 2038-03-27
Also published as: CN108416535A

Abstract

本发明公开了一种基于深度学习的专利价值评估的方法，包括：获取专利的属性特征与引用关系，通过属性网络表征的方法，得到专利对应的属性网络表征；获取专利的文本信息，通过多层卷积神经网络，得到专利对应的文本表征；利用专利对应的属性网络表征与文本表征，对专利的价值进行评估预测。通过该方法可以精确地评估专利的价值。

Description

基于深度学习的专利价值评估的方法

技术领域

本发明涉及专利评估技术领域，尤其涉及一种基于深度学习的专利价值评估的方法。

背景技术

随着各产业的研究和发展，专利的应用已经是保护知识产权的最重要方法之一，同样也成为公司的重要事务之一。在过去的数十年，大量的专利被申请，许多公司甚至平均每年申请上千个专利。

对于公司而言，管理众多的专利是一个重要的事务；其中，对专利的价值评估及其重要。准确的预测一个专利的价值，可以帮助公司提前保护这个专利。在过去的专利价值评估研究中，研究者通常将专利的被引用数次数为专利价值体现的一个重要指标。被引用次数越多，意味着专利的价值越高。传统的，研究者采用统计分析的方法或者分析引用关系来评估专利的价值，缺乏结合专利的文本信息、属性特征以及引用关系的深度学习方法。

发明内容

本发明的目的是提供一种基于深度学习的专利价值评估方法。

本发明的目的是通过以下技术方案实现的：

一种基于深度学习的专利价值评估的方法，包括：

获取专利的属性特征与专利间互相引用的关系，通过属性网络表征的方法，得到专利对应的属性网络表征；

获取专利的文本信息，通过多层卷积神经网络，得到专利对应的文本表征；

利用专利对应的属性网络表征与文本表征，对专利的价值进行评估预测。

由上述本发明提供的技术方案可以看出，通过对专利的文本信息、属性特征及引用关系，进行深度学习，从而可以精确地评估专利的价值。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。

图1为本发明实施例提供的一种基于深度学习的专利价值评估方法的流程图；

图2为本发明实施例提供的获得专利对应的属性网络表征的流程图；

图3为本发明实施例提供的卷积神经网络的执行流程图。

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明的保护范围。

本发明实施例提供一种基于深度学习的专利价值评估的方法，如图1所示，主要过程包括：

步骤1、获取专利的属性特征与专利间互相引用的关系，通过属性网络表征的方法，得到专利对应的属性网络表征。

本发明实施例中，将专利看作属性网络中的一个节点，节点的特征向量代表着对应专利的属性特征，专利间互相引用的关系看作属性网络中的一条边；如图2所示，获得专利对应的属性网络表征的流程如下：

对于属性网络中的节点v_i，计算其在属性网络中相邻节点的序列；属性网络的优化目标是最大化以下目标函数：

其中，p为概率符号，K为相邻节点序列的集合，context(v_i)为节点v_i的相邻节点，u'_i为节点v_i的输出向量表征，u'_j为节点v_j的输出向量表征，u_context(i)为节点v_i的内容向量表征，|V|为网络属性节点的个数；

采用节点的属性矩阵作为初始输入，之后转换输入矩阵为节点表征矩阵，其第j行表达式如下：

u_j＝E^Tf_j；

其中，u_j为节点v_j的输入向量表征，f_j为节点v_j的特征向量，E为一个矩阵变量；

节点v_i的内容向量表征u_context(i)是利用属性特征以及专利间互相引用的关系学习得来，定义u_context(i)为：

其中，k_ANE为句子窗口的大小，该参数是考虑节点相邻的节点数，手动设定的参数；u_r为节点v_r的输入向量表征；

上面这些式子中的各个带有不同下标的参数u都表示相同的含义，即输入向量表征，区别仅在于，输入向量表征对应于不同的节点。

将上述u_j表达式与u_context(i)表达式相结合，再通过最优化目标函数，得到的u'_i为节点v_i的属性网络表征，记为PU_i。

本领域技术人员可以理解，图1～图2中所示的句子生成是指一种通过网络图生成节点序列的方法，然后这种方法将节点看作单词，节点序列相当于句子，所以叫句子生成。

本领域技术人员可以理解，专利间互相引用的关系是指专利之间的引用与被引用关系；以当前专利A与其他专利之间的引用与被引用关系为例，假如：当前专利A在审查阶段引用了的作为对比文件的专利B，则当前专利A引用了专利B，专利C在审查阶段引用了的作为对比文件的专利A，则当前专利A被专利C引用。

步骤2、获取专利的文本信息，通过多层卷积神经网络，得到专利对应的文本表征。

本发明实施例中，每一专利的文本信息包括：专利的标题与摘要文本。

1、输入层。

利用输入层对文本信息进行处理，获得相应的句子表征：假设摘要文本包含M个句子，专利的标题为一个句子；每一个句子中单词数量为N；通过word2vec技术得到每个词的d₀维的表征向量，从而得到专利标题表征矩阵PT_i与专利摘要表征矩阵PA_i；其中，

本发明实施例中，专利的摘要文本可以表示为{s₁,s₂,...,s_M}，其中的s表示一个句子，下标为句子的序号；s＝{w₁,w₂,...,w_N}，其中的w表示一个单词，下标为单子的序号。

本发明实施例中，M是一个浮动值，根据对应摘要文本中实际句子数量；N为根据实际情况所设定的数值，通过对每一个句子去去除停用词等操作后剩余单词的数量如果不足N可以用空字符串填补，如果超过N，则截断，仅保留前N个单词。

2、卷积神经网络层。

采用不同参数的三层卷积神经网络对文本信息进行学习，每一层卷积神经网络包含卷积层与池化层；

通过输入层处理后将每个句子表征为N×d₀维的矩阵，首先，采用k×1维的卷积核对每一个句子表征矩阵进行宽卷积，得到隐层表征

表示为：

其中，

b∈R^d为卷积参数，x∈[1,N+k-1]，d为卷积操作的输出维度，ReLU是一个非线性的激活函数，ReLU(x)＝max(0,x)，

为向量拼接符号，w表示单词，下标对应单词的序号；

通过卷积操作，句子表征矩阵被转换为局部语义表征矩阵，之后池化操作融合之前的结果，得到一个新的局部表征

表示为：

其中，

表示e^cp中第y个局部表征；l为池化窗的宽度，等式右侧下标中第一项对应行数序号，第二项对应元素序号，例如，

对应

中的第y-l+1行，第1个元素。

通过不同参数的三层卷积神经网络进行上述卷积与池化操作，将专利的标题表征为

专利的摘要表征为

其中，d₁为通过不同参数的三层卷积神经网络进行处理后的每个句子表征向量的维度。

3、加权层。

根据专利标题表征与专利摘要各个语句表征的相似度进行加权处理，表示为：

其中，PAA_i为加权后的专利摘要表征，PAA_i与PT_i'即为专利对应的文本表征；

为专利的摘要表征PA_i'中第j个句子的表征，α_j为通过两个表征通过余弦相似度计算得到的结果。

步骤3、利用专利对应的属性网络表征与文本表征，对专利的价值进行评估预测。

采用全连接网络进行专利价值的评估预测，其公式如下：

其中，

为专利价值的评估预测结果，W_ReLU,b_ReLU,W_LeakyReLU,b_LeakyReLU为预测模型的参数(是预测模型需要学习的变量)，

为向量拼接符号，PU_i为专利对应的属性网络表征，ReLU是一个非线性的激活函数，LeakyReLU是一个非线性函数，即x＜0时，LeakyReLU(x)＝0.1x，x≥0时，LeakyReLU(x)＝max(0,x)。

本发明实施例的上述方案，通过对专利的文本信息以及属性特征，进行深度学习，从而可以精确地评估专利的价值。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现，也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解，上述实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求书的保护范围为准。