CN115186982A

CN115186982A - 一种专利价值的早期评估方法

Info

Publication number: CN115186982A
Application number: CN202210629548.7A
Authority: CN
Inventors: 程戈; 尹智斌
Original assignee: Xiangtan University
Current assignee: Xiangtan University
Priority date: 2022-06-01
Filing date: 2022-06-01
Publication date: 2022-10-14

Abstract

本发明属于专利价值评估领域，公开了一种专利价值的早期评估方法，方法包括：根据专利被引用次数和专利权利转移状态定义专利价值等级；从专利数据中提取专利文本并预处理；定义专利指标和提取专利指标；基于专利文本和专利指标构建专利价值评估模型预测专利价值等级。本发明可以在专利公开的早期有效评估专利价值。

Description

一种专利价值的早期评估方法

技术领域

本发明属于专利价值评估领域，尤其涉及面向科研院校与公益事业单位的一种专利价值的早期评估方法。

背景技术

科研院校与公益事业单位的专利申请数量逐年递增，然而真正能产生重大影响的专利只占一小部分。在专利公布的早期阶段从大量专利中辨别出那些有前景的专利并有针对性的提出专利策略对于相关从业者是非常重要的。对于科研院校与公益事业单位来说，在早期发现有巨大价值的专利是一个关键的问题，可以有针对性的做好后续的专利成果转化工作。

目前使用深度学习模型做专利价值评估的研究，大都把专利被引用数量作为衡量专利价值的单一指标。专利特征提取上，多从专利文本与专利引用关系两方面入手。对于专利文本，使用传统的神经网络模型处理专利文本来提取特征，如CNN、RNN等。对于专利引用关系，则使用引用网络表示，然后通过深度学习处理引用网络，提取专利间的引用关系特征。使用以上方法获取专利特征并通过感知机模型预测专利被引用数量，评估专利价值。

以上研究存在三方面的不足，首先，专利被引用数量虽然和专利价值有很强的正相关关系，但是只用这个指标衡量专利价值过于简单。其次，传统的神经网络模型在专利文本语义特征的提取方面存在不足。最后，专利文本与专利引用关系能表达的内容有限，不足以作为专利价值的表征。现有技术有必要改进。

发明内容

本发明所要解决的问题是克服现有基于深度学习的专利价值评估方法中，因衡量专利价值指标单一，文本语义特征提取不充分，缺少专利指标建模，导致的专利价值评估效果不佳的问题。

为解决上述问题，本发明提供一种专利价值的早期评估方法，其特征在于，包括如下步骤：

S1.根据专利被引用次数和专利权利转移状态定义专利价值等级；

S2.从专利数据中提取专利文本并预处理；

S3.定义专利指标和提取专利指标；

S4.基于专利文本和专利指标构建专利价值评估模型预测专利价值等级。

进一步地，步骤S1中的专利被引用次数为目标专利被其它专利引用的次数，专利权利转移状态为目标专利是否存在专利权的转让和/或目标专利是否存在专利授权许可。

进一步地，步骤S2中所提取的专利文本包括专利摘要文本和专利权利要求书文本。

进一步地，步骤S2中所述的专利文本预处理为提取的专利摘要文本和权利要求书文本去除停用词，去除专利术语，使用嵌入模型将文本嵌入为向量，得到摘要文本的特征矩阵M₁和权利要求书文本的特征矩阵M₂。

进一步地，步骤S3中的专利指标包括专利新颖性，专利科学强度，专利所在领域的技术周期，专利覆盖范围，专利受让人的能力五类指标。

进一步地，步骤S3中的五类专利指标具体为，

专利新颖性类指标，衡量专利的原创性和采用现有知识的多少；

科学强度类指标，衡量专利引用科学文献的多少；

专利所在领域的技术周期类指标，衡量该领域专利增长速度；

专利的覆盖范围类指标，衡量专利所属的类别，覆盖的国家范围，权利要求的数量；

专利受让人的能力类指标，衡量专利受让人的技术积累。

进一步地，步骤S4中的专利价值评估模型为深度学习模型，分为文本处理模块、指标处理模块和价值评估模块，文本处理模块提取专利文本上下文含义的专利语义特征，指标处理模块自动提取较为重要的专利指标特征，价值评估模块使用专利语义特征和专利指标特征评估专利价值。

进一步地，步骤S4中各模块按照以下步骤构建专利价值评估模型预测专利价值等级：

S41.文本处理模块使用深度学习模型提取文本矩阵的局部语义特征；

S42.文本处理模块使用深度学习模型提取文本矩阵的长距离的语义特征；

S43.将步骤S41,S42分别得到的语义特征拼接为文本语义特征矩阵T₁,作为文本处理模块的输出；

S44.指标处理模块使用注意力网络处理专利指标，得到专利指标特征矩阵T₂，作为专利指标处理模块的输出；

S45.价值评估模块使用深度学习模型处理拼接后的特征矩阵T₁与T₂，然后用激活函数将目标专利预测为预定义的专利价值等级中的一个，从而实现专利价值的评估。

附图说明

图1为本发明实施例方法的流程示意图

图2为本发明实施例专利价值评估模型的示意图

图3为本发明实施例专利价值评估模型文本处理模块的示意图

图4为本发明实施例专利价值评估模型指标处理模块的示意图

具体实施方式

为了能够更清楚地说明本发明的目的、实施方案和优点，下面将对本发明的技术方案进行清楚、完整的描述。显然，所描述的实施例是本发明的一部分实施例，对于本领域普通技术人员来讲，不需要创造性的劳动就可以获得其他实施例，都属于本发明的保护范围。

如图1所示，一种专利价值的早期评估方法，包括如下步骤：

S2.从专利数据中提取专利文本并预处理；

S3.定义专利指标和提取专利指标；

通过上述步骤，根据专利被引用次数和专利权利转移状态定义专利价值，使用更复杂的深度学习模型提取文本语义特征，对专利指标进行建模，可以解决现有深度学习方法评估专利时专利价值指标单一，文本特征提取不充分，缺少专利指标建模导致的专利价值评估质量不高的问题。

本实施例中专利被引用次数为三年内专利被引用次数，同时使用专利权转让和专利授权许可，只要专利具备其中一个状态，就认为专利存在权利转移状态。专利被引用次数和专利权利转移状态与专利经济价值之间存在很强的正相关关系，可以作为专利价值的量化指标，进而定义专利价值等级。

本实施例中定义专利价值等级的方法如下：目标专利被引用次数在数据集所有的专利被引用次数中排名为前百分之二十，并且存在专利权的转让和/或专利授权许可的为A等级；目标专利被引用次数在数据集所有的专利被引用次数中排名为前百分之二十，并且不存在专利权的转让或专利授权许可的，为B等级；目标专利被引用次数在数据集所有的专利被引用次数中排名为中间百分之四十，并且不存在专利权的转让或专利授权许可的，为C等级；目标专利被引用次数在数据集所有的专利被引用次数中排名为最后百分之四十，并且不存在专利权的转让或专利授权许可的，为D等级；所划分的A,B,C,D四个专利价值等级，专利价值依次递减。

本实施例使用Bert模型将文本嵌入为向量，使用中文常用停用词表去除“的”“了”“不常”等停用词，使用知识产权术语表去除“专利”“发明”“申请”“图纸”等专利术语，从而提高文本特征的质量。

进一步地，步骤S3中的五类专利指标具体为，

科学强度类指标，衡量专利引用科学文献的多少；

专利受让人的能力类指标，衡量专利受让人的技术积累。

本实施例中，专利新颖性类指标，包括专利原创性指标和先验知识指标，专利原创性指标的计算方式如下：

其中，S_B为目标专利被引用的类别，B_i为目标专利被j类专利引用的数量与目标专利总被引数量之比，先验知识指标为目标专利的参考文献数量；

科学强度类指标，包括科学强度指标，科学强度指标为目标专利的参考文献中，非专利参考文献的数量；

专利所在领域的技术周期类指标，包括增长速度指标，增长速度指标为目标专利引用的专利的中位年龄；

专利的覆盖范围类指标，包括专利所属的主要类别，专利所属的类数，专利覆盖的国家数量，专利独立权利要求数量，专利从属权利要求数量，其中，专利所属的主要类别为目标专利的分类号，专利所属的类数为目标专利的分类号个数，专利覆盖的国家数量为目标专利所在专利族覆盖了多少个国家和地区，专利独立权利要求数量为目标专利的独立权利要求个数，专利从属权利要求数量为目标专利的从属权利要求个数；

专利受让人的能力类指标，包括是否有多个受让人，是否有多个发明人，受让人发布的专利总数量，受让人在核心领域发布的专利数量，受让人在外围领域发布的专利数量，受让人发布的专利的总被引数量，受让人在核心领域发布的专利的被引数量，受让人在外围领域发布的专利的被引数量，其中，受让人在核心领域发布的专利数量，为受让人在目标专利所属领域中发布的专利数量，受让人在外围领域发布的专利数量，为受让人在目标专利所属领域之外的领域中发布的专利数量，受让人在核心领域发布的专利的被引数量，为受让人在目标专利所属领域中发布的专利被引用的数量，受让人在外围领域发布的专利的被引数量，为受让人在目标专利所属领域之外的领域中发布的专利被引数量。

本实施例中，步骤S41具体为，文本处理模块使用CNN模型提取文本矩阵的局部n-gram语义特征，CNN模型包括卷积层与最大池化层；

卷积层使用q种大小不同的滤波器，每种滤波器数量为k个，一种滤波器进行滤波并做最大池化操作后，可以得到1个k维语义特征向量，q种滤波器全部滤波并池化后，可以得到q个k维语义特征向量；

本实施例中，步骤S42具体为，文本处理模块使用Bi-LSTM-ATTENTION模型提取文本矩阵的双向长距离的语义特征，Bi-LSTM-ATTENTION模型包括m个前向LSTM模型单元、m个后向LSTM模型单元和ATTENTION层；

将前向LSTM模型单元的每一个状态向量与后向LSTM模型单元的每一个状态向量做拼接，得到m个状态向量，使用ATTENTION层处理m个状态向量得到语义特征向量。

ATTENTION层计算方式为：

K＝X×W₁

Q＝X×W₂

V＝X×W₃

其中，X为状态向量矩阵，W₁，W₂，W₃为待训练参数矩阵，

为每一个K矩阵中的向量的维度。

本实施例中，步骤S43具体为，步骤S41,S42分别使用CNN和Bi-LSTM-ATTENTION模型提取文本语义特征，既提取了文本的局部语义特征又提取了文本的双向长距离语义特征，将两种模型提取出的语义特征拼接在一起，得到特征矩阵，作为文本处理模块的输出，从而使得所提取的专利文本的语义特征更加丰富。

在具体实施时，因为摘要文本与权利要求书文本都需要文本处理模块进行处理，所以需要调用两次文本处理模块，最后得到的文本语义特征矩阵有两个，分别为表征权利要求书文本局部语义特征与双向长距离语义特征的矩阵T₁’，表征摘要文本局部语义特征与双向长距离语义特征的矩阵T₁”。

本实施例中，步骤S44具体为，专利指标使用one-hot方式嵌入为向量，然后输入注意力网络处理。注意力网络可以将注意力集中于重要的专利指标，忽视次要的专利指标，即赋予重要指标更大的权重，赋予次要指标更小的权重。

注意力网络使用与步骤S42中ATTENTION层一样的计算方式。指标处理模块最终得到经过注意力处理的专利指标特征矩阵T₂。

本实施例中，步骤S45具体为，价值评估模块使用多层感知机模型处理拼接后的特征矩阵T₁’，T₁″与T₂，然后用Softmax函数将目标专利预测为A,B,C,D四个专利价值等级中的一个，从而实现专利价值的评估。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制。本领域的普通技术人员可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换不需要花费创造性劳动。在不脱离本发明的原理和精神的情况下对实施方式进行变化、修改、替换仍落入本发明的保护范围。

Claims

1.一种专利价值的早期评估方法，其特征在于，包括如下步骤：

S2.从专利数据中提取专利文本并预处理；

S3.定义专利指标和提取专利指标；

2.根据权利要求1所述的专利价值的早期评估方法，其特征在于，步骤S1中的专利被引用次数为目标专利被其它专利引用的次数，专利权利转移状态为目标专利是否存在专利权的转让和/或目标专利是否存在专利授权许可。

3.根据权利要求1所述的专利价值的早期评估方法，其特征在于，步骤S2中所提取的专利文本包括专利摘要文本和专利权利要求书文本。

4.根据权利要求3所述的专利价值的早期评估方法，其特征在于，步骤S2中所述的专利文本预处理为提取的专利摘要文本和权利要求书文本去除停用词，去除专利术语，使用嵌入模型将文本嵌入为向量，得到摘要文本的特征矩阵M₁和权利要求书文本的特征矩阵M₂。

5.根据权利要求1所述的专利价值的早期评估方法，其特征在于，步骤S3中的专利指标包括专利新颖性，专利科学强度，专利所在领域的技术周期，专利覆盖范围，专利受让人的能力五类指标。

6.根据权利要求5所述的专利价值的早期评估方法，其特征在于，步骤S3中的五类专利指标具体为，

科学强度类指标，衡量专利引用科学文献的多少；

专利受让人的能力类指标，衡量专利受让人的技术积累。

7.根据权利要求1所述的专利价值的早期评估方法，其特征在于，步骤S4中的专利价值评估模型为深度学习模型，分为文本处理模块、指标处理模块和价值评估模块，文本处理模块提取专利文本上下文含义的专利语义特征，指标处理模块自动提取较为重要的专利指标特征，价值评估模块使用专利语义特征和专利指标特征评估专利价值。

8.根据权利要求7所述的专利价值的早期评估方法，其特征在于，步骤S4中各模块按照以下步骤构建专利价值评估模型预测专利价值等级：