CN115186982A - 一种专利价值的早期评估方法 - Google Patents

一种专利价值的早期评估方法 Download PDF

Info

Publication number
CN115186982A
CN115186982A CN202210629548.7A CN202210629548A CN115186982A CN 115186982 A CN115186982 A CN 115186982A CN 202210629548 A CN202210629548 A CN 202210629548A CN 115186982 A CN115186982 A CN 115186982A
Authority
CN
China
Prior art keywords
text
value
index
evaluation
processing module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210629548.7A
Other languages
English (en)
Inventor
程戈
尹智斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiangtan University
Original Assignee
Xiangtan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiangtan University filed Critical Xiangtan University
Priority to CN202210629548.7A priority Critical patent/CN115186982A/zh
Publication of CN115186982A publication Critical patent/CN115186982A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于专利价值评估领域,公开了一种专利价值的早期评估方法,方法包括:根据专利被引用次数和专利权利转移状态定义专利价值等级;从专利数据中提取专利文本并预处理;定义专利指标和提取专利指标;基于专利文本和专利指标构建专利价值评估模型预测专利价值等级。本发明可以在专利公开的早期有效评估专利价值。

Description

一种专利价值的早期评估方法
技术领域
本发明属于专利价值评估领域,尤其涉及面向科研院校与公益事业单位的一种专利价值的早期评估方法。
背景技术
科研院校与公益事业单位的专利申请数量逐年递增,然而真正能产生重大影响的专利只占一小部分。在专利公布的早期阶段从大量专利中辨别出那些有前景的专利并有针对性的提出专利策略对于相关从业者是非常重要的。对于科研院校与公益事业单位来说,在早期发现有巨大价值的专利是一个关键的问题,可以有针对性的做好后续的专利成果转化工作。
目前使用深度学习模型做专利价值评估的研究,大都把专利被引用数量作为衡量专利价值的单一指标。专利特征提取上,多从专利文本与专利引用关系两方面入手。对于专利文本,使用传统的神经网络模型处理专利文本来提取特征,如CNN、RNN等。对于专利引用关系,则使用引用网络表示,然后通过深度学习处理引用网络,提取专利间的引用关系特征。使用以上方法获取专利特征并通过感知机模型预测专利被引用数量,评估专利价值。
以上研究存在三方面的不足,首先,专利被引用数量虽然和专利价值有很强的正相关关系,但是只用这个指标衡量专利价值过于简单。其次,传统的神经网络模型在专利文本语义特征的提取方面存在不足。最后,专利文本与专利引用关系能表达的内容有限,不足以作为专利价值的表征。现有技术有必要改进。
发明内容
本发明所要解决的问题是克服现有基于深度学习的专利价值评估方法中,因衡量专利价值指标单一,文本语义特征提取不充分,缺少专利指标建模,导致的专利价值评估效果不佳的问题。
为解决上述问题,本发明提供一种专利价值的早期评估方法,其特征在于,包括如下步骤:
S1.根据专利被引用次数和专利权利转移状态定义专利价值等级;
S2.从专利数据中提取专利文本并预处理;
S3.定义专利指标和提取专利指标;
S4.基于专利文本和专利指标构建专利价值评估模型预测专利价值等级。
进一步地,步骤S1中的专利被引用次数为目标专利被其它专利引用的次数,专利权利转移状态为目标专利是否存在专利权的转让和/或目标专利是否存在专利授权许可。
进一步地,步骤S2中所提取的专利文本包括专利摘要文本和专利权利要求书文本。
进一步地,步骤S2中所述的专利文本预处理为提取的专利摘要文本和权利要求书文本去除停用词,去除专利术语,使用嵌入模型将文本嵌入为向量,得到摘要文本的特征矩阵M1和权利要求书文本的特征矩阵M2
进一步地,步骤S3中的专利指标包括专利新颖性,专利科学强度,专利所在领域的技术周期,专利覆盖范围,专利受让人的能力五类指标。
进一步地,步骤S3中的五类专利指标具体为,
专利新颖性类指标,衡量专利的原创性和采用现有知识的多少;
科学强度类指标,衡量专利引用科学文献的多少;
专利所在领域的技术周期类指标,衡量该领域专利增长速度;
专利的覆盖范围类指标,衡量专利所属的类别,覆盖的国家范围,权利要求的数量;
专利受让人的能力类指标,衡量专利受让人的技术积累。
进一步地,步骤S4中的专利价值评估模型为深度学习模型,分为文本处理模块、指标处理模块和价值评估模块,文本处理模块提取专利文本上下文含义的专利语义特征,指标处理模块自动提取较为重要的专利指标特征,价值评估模块使用专利语义特征和专利指标特征评估专利价值。
进一步地,步骤S4中各模块按照以下步骤构建专利价值评估模型预测专利价值等级:
S41.文本处理模块使用深度学习模型提取文本矩阵的局部语义特征;
S42.文本处理模块使用深度学习模型提取文本矩阵的长距离的语义特征;
S43.将步骤S41,S42分别得到的语义特征拼接为文本语义特征矩阵T1,作为文本处理模块的输出;
S44.指标处理模块使用注意力网络处理专利指标,得到专利指标特征矩阵T2,作为专利指标处理模块的输出;
S45.价值评估模块使用深度学习模型处理拼接后的特征矩阵T1与T2,然后用激活函数将目标专利预测为预定义的专利价值等级中的一个,从而实现专利价值的评估。
附图说明
图1为本发明实施例方法的流程示意图
图2为本发明实施例专利价值评估模型的示意图
图3为本发明实施例专利价值评估模型文本处理模块的示意图
图4为本发明实施例专利价值评估模型指标处理模块的示意图
具体实施方式
为了能够更清楚地说明本发明的目的、实施方案和优点,下面将对本发明的技术方案进行清楚、完整的描述。显然,所描述的实施例是本发明的一部分实施例,对于本领域普通技术人员来讲,不需要创造性的劳动就可以获得其他实施例,都属于本发明的保护范围。
如图1所示,一种专利价值的早期评估方法,包括如下步骤:
S1.根据专利被引用次数和专利权利转移状态定义专利价值等级;
S2.从专利数据中提取专利文本并预处理;
S3.定义专利指标和提取专利指标;
S4.基于专利文本和专利指标构建专利价值评估模型预测专利价值等级。
通过上述步骤,根据专利被引用次数和专利权利转移状态定义专利价值,使用更复杂的深度学习模型提取文本语义特征,对专利指标进行建模,可以解决现有深度学习方法评估专利时专利价值指标单一,文本特征提取不充分,缺少专利指标建模导致的专利价值评估质量不高的问题。
进一步地,步骤S1中的专利被引用次数为目标专利被其它专利引用的次数,专利权利转移状态为目标专利是否存在专利权的转让和/或目标专利是否存在专利授权许可。
本实施例中专利被引用次数为三年内专利被引用次数,同时使用专利权转让和专利授权许可,只要专利具备其中一个状态,就认为专利存在权利转移状态。专利被引用次数和专利权利转移状态与专利经济价值之间存在很强的正相关关系,可以作为专利价值的量化指标,进而定义专利价值等级。
本实施例中定义专利价值等级的方法如下:目标专利被引用次数在数据集所有的专利被引用次数中排名为前百分之二十,并且存在专利权的转让和/或专利授权许可的为A等级;目标专利被引用次数在数据集所有的专利被引用次数中排名为前百分之二十,并且不存在专利权的转让或专利授权许可的,为B等级;目标专利被引用次数在数据集所有的专利被引用次数中排名为中间百分之四十,并且不存在专利权的转让或专利授权许可的,为C等级;目标专利被引用次数在数据集所有的专利被引用次数中排名为最后百分之四十,并且不存在专利权的转让或专利授权许可的,为D等级;所划分的A,B,C,D四个专利价值等级,专利价值依次递减。
进一步地,步骤S2中所提取的专利文本包括专利摘要文本和专利权利要求书文本。
进一步地,步骤S2中所述的专利文本预处理为提取的专利摘要文本和权利要求书文本去除停用词,去除专利术语,使用嵌入模型将文本嵌入为向量,得到摘要文本的特征矩阵M1和权利要求书文本的特征矩阵M2
本实施例使用Bert模型将文本嵌入为向量,使用中文常用停用词表去除“的”“了”“不常”等停用词,使用知识产权术语表去除“专利”“发明”“申请”“图纸”等专利术语,从而提高文本特征的质量。
进一步地,步骤S3中的专利指标包括专利新颖性,专利科学强度,专利所在领域的技术周期,专利覆盖范围,专利受让人的能力五类指标。
进一步地,步骤S3中的五类专利指标具体为,
专利新颖性类指标,衡量专利的原创性和采用现有知识的多少;
科学强度类指标,衡量专利引用科学文献的多少;
专利所在领域的技术周期类指标,衡量该领域专利增长速度;
专利的覆盖范围类指标,衡量专利所属的类别,覆盖的国家范围,权利要求的数量;
专利受让人的能力类指标,衡量专利受让人的技术积累。
本实施例中,专利新颖性类指标,包括专利原创性指标和先验知识指标,专利原创性指标的计算方式如下:
Figure BDA0003675137520000041
其中,SB为目标专利被引用的类别,Bi为目标专利被j类专利引用的数量与目标专利总被引数量之比,先验知识指标为目标专利的参考文献数量;
科学强度类指标,包括科学强度指标,科学强度指标为目标专利的参考文献中,非专利参考文献的数量;
专利所在领域的技术周期类指标,包括增长速度指标,增长速度指标为目标专利引用的专利的中位年龄;
专利的覆盖范围类指标,包括专利所属的主要类别,专利所属的类数,专利覆盖的国家数量,专利独立权利要求数量,专利从属权利要求数量,其中,专利所属的主要类别为目标专利的分类号,专利所属的类数为目标专利的分类号个数,专利覆盖的国家数量为目标专利所在专利族覆盖了多少个国家和地区,专利独立权利要求数量为目标专利的独立权利要求个数,专利从属权利要求数量为目标专利的从属权利要求个数;
专利受让人的能力类指标,包括是否有多个受让人,是否有多个发明人,受让人发布的专利总数量,受让人在核心领域发布的专利数量,受让人在外围领域发布的专利数量,受让人发布的专利的总被引数量,受让人在核心领域发布的专利的被引数量,受让人在外围领域发布的专利的被引数量,其中,受让人在核心领域发布的专利数量,为受让人在目标专利所属领域中发布的专利数量,受让人在外围领域发布的专利数量,为受让人在目标专利所属领域之外的领域中发布的专利数量,受让人在核心领域发布的专利的被引数量,为受让人在目标专利所属领域中发布的专利被引用的数量,受让人在外围领域发布的专利的被引数量,为受让人在目标专利所属领域之外的领域中发布的专利被引数量。
进一步地,步骤S4中的专利价值评估模型为深度学习模型,分为文本处理模块、指标处理模块和价值评估模块,文本处理模块提取专利文本上下文含义的专利语义特征,指标处理模块自动提取较为重要的专利指标特征,价值评估模块使用专利语义特征和专利指标特征评估专利价值。
进一步地,步骤S4中各模块按照以下步骤构建专利价值评估模型预测专利价值等级:
S41.文本处理模块使用深度学习模型提取文本矩阵的局部语义特征;
S42.文本处理模块使用深度学习模型提取文本矩阵的长距离的语义特征;
S43.将步骤S41,S42分别得到的语义特征拼接为文本语义特征矩阵T1,作为文本处理模块的输出;
S44.指标处理模块使用注意力网络处理专利指标,得到专利指标特征矩阵T2,作为专利指标处理模块的输出;
S45.价值评估模块使用深度学习模型处理拼接后的特征矩阵T1与T2,然后用激活函数将目标专利预测为预定义的专利价值等级中的一个,从而实现专利价值的评估。
本实施例中,步骤S41具体为,文本处理模块使用CNN模型提取文本矩阵的局部n-gram语义特征,CNN模型包括卷积层与最大池化层;
卷积层使用q种大小不同的滤波器,每种滤波器数量为k个,一种滤波器进行滤波并做最大池化操作后,可以得到1个k维语义特征向量,q种滤波器全部滤波并池化后,可以得到q个k维语义特征向量;
本实施例中,步骤S42具体为,文本处理模块使用Bi-LSTM-ATTENTION模型提取文本矩阵的双向长距离的语义特征,Bi-LSTM-ATTENTION模型包括m个前向LSTM模型单元、m个后向LSTM模型单元和ATTENTION层;
将前向LSTM模型单元的每一个状态向量与后向LSTM模型单元的每一个状态向量做拼接,得到m个状态向量,使用ATTENTION层处理m个状态向量得到语义特征向量。
ATTENTION层计算方式为:
K=X×W1
Q=X×W2
V=X×W3
Figure BDA0003675137520000061
其中,X为状态向量矩阵,W1,W2,W3为待训练参数矩阵,
Figure BDA0003675137520000062
为每一个K矩阵中的向量的维度。
本实施例中,步骤S43具体为,步骤S41,S42分别使用CNN和Bi-LSTM-ATTENTION模型提取文本语义特征,既提取了文本的局部语义特征又提取了文本的双向长距离语义特征,将两种模型提取出的语义特征拼接在一起,得到特征矩阵,作为文本处理模块的输出,从而使得所提取的专利文本的语义特征更加丰富。
在具体实施时,因为摘要文本与权利要求书文本都需要文本处理模块进行处理,所以需要调用两次文本处理模块,最后得到的文本语义特征矩阵有两个,分别为表征权利要求书文本局部语义特征与双向长距离语义特征的矩阵T1’,表征摘要文本局部语义特征与双向长距离语义特征的矩阵T1”。
本实施例中,步骤S44具体为,专利指标使用one-hot方式嵌入为向量,然后输入注意力网络处理。注意力网络可以将注意力集中于重要的专利指标,忽视次要的专利指标,即赋予重要指标更大的权重,赋予次要指标更小的权重。
注意力网络使用与步骤S42中ATTENTION层一样的计算方式。指标处理模块最终得到经过注意力处理的专利指标特征矩阵T2
本实施例中,步骤S45具体为,价值评估模块使用多层感知机模型处理拼接后的特征矩阵T1’,T1″与T2,然后用Softmax函数将目标专利预测为A,B,C,D四个专利价值等级中的一个,从而实现专利价值的评估。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制。本领域的普通技术人员可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换不需要花费创造性劳动。在不脱离本发明的原理和精神的情况下对实施方式进行变化、修改、替换仍落入本发明的保护范围。

Claims (8)

1.一种专利价值的早期评估方法,其特征在于,包括如下步骤:
S1.根据专利被引用次数和专利权利转移状态定义专利价值等级;
S2.从专利数据中提取专利文本并预处理;
S3.定义专利指标和提取专利指标;
S4.基于专利文本和专利指标构建专利价值评估模型预测专利价值等级。
2.根据权利要求1所述的专利价值的早期评估方法,其特征在于,步骤S1中的专利被引用次数为目标专利被其它专利引用的次数,专利权利转移状态为目标专利是否存在专利权的转让和/或目标专利是否存在专利授权许可。
3.根据权利要求1所述的专利价值的早期评估方法,其特征在于,步骤S2中所提取的专利文本包括专利摘要文本和专利权利要求书文本。
4.根据权利要求3所述的专利价值的早期评估方法,其特征在于,步骤S2中所述的专利文本预处理为提取的专利摘要文本和权利要求书文本去除停用词,去除专利术语,使用嵌入模型将文本嵌入为向量,得到摘要文本的特征矩阵M1和权利要求书文本的特征矩阵M2
5.根据权利要求1所述的专利价值的早期评估方法,其特征在于,步骤S3中的专利指标包括专利新颖性,专利科学强度,专利所在领域的技术周期,专利覆盖范围,专利受让人的能力五类指标。
6.根据权利要求5所述的专利价值的早期评估方法,其特征在于,步骤S3中的五类专利指标具体为,
专利新颖性类指标,衡量专利的原创性和采用现有知识的多少;
科学强度类指标,衡量专利引用科学文献的多少;
专利所在领域的技术周期类指标,衡量该领域专利增长速度;
专利的覆盖范围类指标,衡量专利所属的类别,覆盖的国家范围,权利要求的数量;
专利受让人的能力类指标,衡量专利受让人的技术积累。
7.根据权利要求1所述的专利价值的早期评估方法,其特征在于,步骤S4中的专利价值评估模型为深度学习模型,分为文本处理模块、指标处理模块和价值评估模块,文本处理模块提取专利文本上下文含义的专利语义特征,指标处理模块自动提取较为重要的专利指标特征,价值评估模块使用专利语义特征和专利指标特征评估专利价值。
8.根据权利要求7所述的专利价值的早期评估方法,其特征在于,步骤S4中各模块按照以下步骤构建专利价值评估模型预测专利价值等级:
S41.文本处理模块使用深度学习模型提取文本矩阵的局部语义特征;
S42.文本处理模块使用深度学习模型提取文本矩阵的长距离的语义特征;
S43.将步骤S41,S42分别得到的语义特征拼接为文本语义特征矩阵T1,作为文本处理模块的输出;
S44.指标处理模块使用注意力网络处理专利指标,得到专利指标特征矩阵T2,作为专利指标处理模块的输出;
S45.价值评估模块使用深度学习模型处理拼接后的特征矩阵T1与T2,然后用激活函数将目标专利预测为预定义的专利价值等级中的一个,从而实现专利价值的评估。
CN202210629548.7A 2022-06-01 2022-06-01 一种专利价值的早期评估方法 Pending CN115186982A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210629548.7A CN115186982A (zh) 2022-06-01 2022-06-01 一种专利价值的早期评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210629548.7A CN115186982A (zh) 2022-06-01 2022-06-01 一种专利价值的早期评估方法

Publications (1)

Publication Number Publication Date
CN115186982A true CN115186982A (zh) 2022-10-14

Family

ID=83512941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210629548.7A Pending CN115186982A (zh) 2022-06-01 2022-06-01 一种专利价值的早期评估方法

Country Status (1)

Country Link
CN (1) CN115186982A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116894596A (zh) * 2023-06-05 2023-10-17 清华大学 一种科技成果智能评价方法、装置及介质
CN117710161A (zh) * 2024-01-05 2024-03-15 广东聚智诚科技有限公司 基于大数据技术的专利价值分析系统、方法、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116894596A (zh) * 2023-06-05 2023-10-17 清华大学 一种科技成果智能评价方法、装置及介质
CN117710161A (zh) * 2024-01-05 2024-03-15 广东聚智诚科技有限公司 基于大数据技术的专利价值分析系统、方法、设备及介质

Similar Documents

Publication Publication Date Title
CN115186982A (zh) 一种专利价值的早期评估方法
WO2021120934A1 (zh) 一种基于卷积神经网络的DRGs自动分组方法
CN110490239B (zh) 图像质控网络的训练方法、质量分类方法、装置及设备
CN111753101B (zh) 一种融合实体描述及类型的知识图谱表示学习方法
CN110119449B (zh) 一种基于序列增强胶囊网络的刑事案件罪名预测方法
CN113779260B (zh) 一种基于预训练模型的领域图谱实体和关系联合抽取方法及系统
CN112734154B (zh) 一种基于模糊数相似度的多因素舆情风险评估方法
CN110321563A (zh) 基于混合监督模型的文本情感分析方法
CN110188047A (zh) 一种基于双通道卷积神经网络的重复缺陷报告检测方法
CN115470962A (zh) 一种基于LightGBM的企业失信风险预测模型构建方法
CN110765266A (zh) 一种裁判文书相似争议焦点合并方法及系统
CN115017887A (zh) 基于图卷积的中文谣言检测方法
CN114036993A (zh) 基于多尺度跨模态神经网络的多模态讽刺对象检测方法
CN114610891B (zh) 面向不平衡司法裁判文书数据的法条推荐方法及系统
CN115982385A (zh) 一种基于知识图谱的关系图神经网络专利质量评估方法
CN109597944B (zh) 一种基于深度信念网络的单分类微博谣言检测模型
Tianxiong et al. Identifying chinese event factuality with convolutional neural networks
CN117150232A (zh) 一种大模型非时序训练数据质量评价方法
CN115600602B (zh) 一种长文本的关键要素抽取方法、系统及终端设备
CN107577922A (zh) 一种基于ARM处理器的玉米lncRNA筛选分类方法
CN113705241B (zh) 面向高考咨询基于多视角注意力的智能语义匹配方法与装置
CN114819999A (zh) 一种bert融合胶囊网络的电梯故障投诉文本分类方法
CN114519092A (zh) 一种面向中文领域大规模复杂关系数据集构建框架
Xia et al. Analysis and prediction of telecom customer churn based on machine learning
CN112348257A (zh) 一种多源数据融合与时序分析驱动的选举预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination