CN108416535B - 基于深度学习的专利价值评估的方法 - Google Patents
基于深度学习的专利价值评估的方法 Download PDFInfo
- Publication number
- CN108416535B CN108416535B CN201810259236.5A CN201810259236A CN108416535B CN 108416535 B CN108416535 B CN 108416535B CN 201810259236 A CN201810259236 A CN 201810259236A CN 108416535 B CN108416535 B CN 108416535B
- Authority
- CN
- China
- Prior art keywords
- characterization
- node
- representation
- attribute
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 13
- 238000013135 deep learning Methods 0.000 title claims abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 15
- 238000012512 characterization method Methods 0.000 claims description 31
- 239000013598 vector Substances 0.000 claims description 24
- 239000011159 matrix material Substances 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 8
- 239000000126 substance Substances 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 4
- 230000014509 gene expression Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 claims description 2
- 238000005457 optimization Methods 0.000 claims description 2
- 238000012886 linear function Methods 0.000 claims 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/184—Intellectual property management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Technology Law (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Primary Health Care (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于深度学习的专利价值评估的方法,包括:获取专利的属性特征与引用关系,通过属性网络表征的方法,得到专利对应的属性网络表征;获取专利的文本信息,通过多层卷积神经网络,得到专利对应的文本表征;利用专利对应的属性网络表征与文本表征,对专利的价值进行评估预测。通过该方法可以精确地评估专利的价值。
Description
技术领域
本发明涉及专利评估技术领域,尤其涉及一种基于深度学习的专利价值评估的方法。
背景技术
随着各产业的研究和发展,专利的应用已经是保护知识产权的最重要方法之一,同样也成为公司的重要事务之一。在过去的数十年,大量的专利被申请,许多公司甚至平均每年申请上千个专利。
对于公司而言,管理众多的专利是一个重要的事务;其中,对专利的价值评估及其重要。准确的预测一个专利的价值,可以帮助公司提前保护这个专利。在过去的专利价值评估研究中,研究者通常将专利的被引用数次数为专利价值体现的一个重要指标。被引用次数越多,意味着专利的价值越高。传统的,研究者采用统计分析的方法或者分析引用关系来评估专利的价值,缺乏结合专利的文本信息、属性特征以及引用关系的深度学习方法。
发明内容
本发明的目的是提供一种基于深度学习的专利价值评估方法。
本发明的目的是通过以下技术方案实现的:
一种基于深度学习的专利价值评估的方法,包括:
获取专利的属性特征与专利间互相引用的关系,通过属性网络表征的方法,得到专利对应的属性网络表征;
获取专利的文本信息,通过多层卷积神经网络,得到专利对应的文本表征;
利用专利对应的属性网络表征与文本表征,对专利的价值进行评估预测。
由上述本发明提供的技术方案可以看出,通过对专利的文本信息、属性特征及引用关系,进行深度学习,从而可以精确地评估专利的价值。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种基于深度学习的专利价值评估方法的流程图;
图2为本发明实施例提供的获得专利对应的属性网络表征的流程图;
图3为本发明实施例提供的卷积神经网络的执行流程图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种基于深度学习的专利价值评估的方法,如图1所示,主要过程包括:
步骤1、获取专利的属性特征与专利间互相引用的关系,通过属性网络表征的方法,得到专利对应的属性网络表征。
本发明实施例中,将专利看作属性网络中的一个节点,节点的特征向量代表着对应专利的属性特征,专利间互相引用的关系看作属性网络中的一条边;如图2所示,获得专利对应的属性网络表征的流程如下:
对于属性网络中的节点vi,计算其在属性网络中相邻节点的序列;属性网络的优化目标是最大化以下目标函数:
其中,p为概率符号,K为相邻节点序列的集合,context(vi)为节点vi的相邻节点,u'i为节点vi的输出向量表征,u'j为节点vj的输出向量表征,ucontext(i)为节点vi的内容向量表征,|V|为网络属性节点的个数;
采用节点的属性矩阵作为初始输入,之后转换输入矩阵为节点表征矩阵,其第j行表达式如下:
uj=ETfj;
其中,uj为节点vj的输入向量表征,fj为节点vj的特征向量,E为一个矩阵变量;
节点vi的内容向量表征ucontext(i)是利用属性特征以及专利间互相引用的关系学习得来,定义ucontext(i)为:
其中,kANE为句子窗口的大小,该参数是考虑节点相邻的节点数,手动设定的参数;ur为节点vr的输入向量表征;
上面这些式子中的各个带有不同下标的参数u都表示相同的含义,即输入向量表征,区别仅在于,输入向量表征对应于不同的节点。
将上述uj表达式与ucontext(i)表达式相结合,再通过最优化目标函数,得到的u'i为节点vi的属性网络表征,记为PUi。
本领域技术人员可以理解,图1~图2中所示的句子生成是指一种通过网络图生成节点序列的方法,然后这种方法将节点看作单词,节点序列相当于句子,所以叫句子生成。
本领域技术人员可以理解,专利间互相引用的关系是指专利之间的引用与被引用关系;以当前专利A与其他专利之间的引用与被引用关系为例,假如:当前专利A在审查阶段引用了的作为对比文件的专利B,则当前专利A引用了专利B,专利C在审查阶段引用了的作为对比文件的专利A,则当前专利A被专利C引用。
步骤2、获取专利的文本信息,通过多层卷积神经网络,得到专利对应的文本表征。
本发明实施例中,每一专利的文本信息包括:专利的标题与摘要文本。
1、输入层。
利用输入层对文本信息进行处理,获得相应的句子表征:假设摘要文本包含M个句子,专利的标题为一个句子;每一个句子中单词数量为N;通过word2vec技术得到每个词的d0维的表征向量,从而得到专利标题表征矩阵PTi与专利摘要表征矩阵PAi;其中,
本发明实施例中,专利的摘要文本可以表示为{s1,s2,...,sM},其中的s表示一个句子,下标为句子的序号;s={w1,w2,...,wN},其中的w表示一个单词,下标为单子的序号。
本发明实施例中,M是一个浮动值,根据对应摘要文本中实际句子数量;N为根据实际情况所设定的数值,通过对每一个句子去去除停用词等操作后剩余单词的数量如果不足N可以用空字符串填补,如果超过N,则截断,仅保留前N个单词。
2、卷积神经网络层。
采用不同参数的三层卷积神经网络对文本信息进行学习,每一层卷积神经网络包含卷积层与池化层;
3、加权层。
根据专利标题表征与专利摘要各个语句表征的相似度进行加权处理,表示为:
步骤3、利用专利对应的属性网络表征与文本表征,对专利的价值进行评估预测。
采用全连接网络进行专利价值的评估预测,其公式如下:
其中,为专利价值的评估预测结果,WReLU,bReLU,WLeakyReLU,bLeakyReLU为预测模型的参数(是预测模型需要学习的变量),为向量拼接符号,PUi为专利对应的属性网络表征,ReLU是一个非线性的激活函数,LeakyReLU是一个非线性函数,即x<0时,LeakyReLU(x)=0.1x,x≥0时,LeakyReLU(x)=max(0,x)。
本发明实施例的上述方案,通过对专利的文本信息以及属性特征,进行深度学习,从而可以精确地评估专利的价值。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (2)
1.一种基于深度学习的专利价值评估的方法,其特征在于,包括:
获取专利的属性特征与专利间互相引用的关系,通过属性网络表征的方法,得到专利对应的属性网络表征;
获取专利的文本信息,通过多层卷积神经网络,得到专利对应的文本表征;
利用专利对应的属性网络表征与文本表征,对专利的价值进行评估预测;
其中,通过属性网络表征的方法,得到专利对应的属性网络表征的过程包括:
将专利看作属性网络中的一个节点,节点的特征向量代表着对应专利的属性特征,专利间互相引用的关系看作属性网络中的一条边;
对于属性网络中的节点vi,计算其在属性网络中相邻节点的序列;属性网络的优化目标是最大化以下目标函数:
其中,p为概率符号,K为相邻节点序列的集合,context(vi)为节点vi的相邻节点,u'i为节点vi的输出向量表征,u'j为节点vj的输出向量表征,ucontext(i)为节点vi的内容向量表征,|V|为网络属性节点的个数;
采用节点的属性矩阵作为初始输入,之后转换输入矩阵为节点表征矩阵,其第j行表达式如下:
uj=ETfj;
其中,uj为节点vj的输入向量表征,fj为节点vj的特征向量,E 为一个矩阵变量;
节点vi的内容向量表征ucontext(i)是利用属性特征以及专利间互相引用的关系学习得来,定义ucontext(i)为:
其中,kANE为句子窗口的大小,ur为节点vr的输入向量表征;
将上述uj表达式与ucontext(i)表达式相结合,再通过最优化目标函数,得到的u'i为节点vi的属性网络表征,记为PUi;
利用专利对应的属性网络表征与文本表征,采用全连接网络进行专利价值的评估预测,其公式如下:
2.根据权利要求1所述的一种基于深度学习的专利价值评估的方法,其特征在于,所述获取专利的文本信息,通过多层卷积神经网络,得到专利对应的文本表征的过程包括:
每一专利的文本信息包括:专利的标题与摘要文本;
利用输入层对文本信息进行处理,获得相应的句子表征:假设摘要文本包含M个句子,专利的标题为一个句子;每一个句子中单词数量为N;通过word2vec技术得到每个词的d0维的表征向量,从而得到专利标题表征矩阵PTi与专利摘要表征矩阵PAi;其中,
采用不同参数的三层卷积神经网络对文本信息进行学习,每一层卷积神经网络包含卷积层与池化层;
根据专利标题表征与专利摘要各个语句表征的相似度进行加权处理,表示为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810259236.5A CN108416535B (zh) | 2018-03-27 | 2018-03-27 | 基于深度学习的专利价值评估的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810259236.5A CN108416535B (zh) | 2018-03-27 | 2018-03-27 | 基于深度学习的专利价值评估的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108416535A CN108416535A (zh) | 2018-08-17 |
CN108416535B true CN108416535B (zh) | 2021-08-13 |
Family
ID=63133576
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810259236.5A Active CN108416535B (zh) | 2018-03-27 | 2018-03-27 | 基于深度学习的专利价值评估的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108416535B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109902168B (zh) * | 2019-01-25 | 2022-02-11 | 北京创新者信息技术有限公司 | 一种专利评价方法和系统 |
CN109919807A (zh) * | 2019-03-17 | 2019-06-21 | 南京智慧光信息科技研究院有限公司 | 基于深度学习的个性化知识产权信息服务方法和系统 |
CN111861046B (zh) * | 2019-04-02 | 2023-12-29 | 南京大学 | 基于大数据和深度学习的专利价值智能评估系统 |
CN110298545B (zh) * | 2019-05-23 | 2022-05-27 | 中国科学院计算技术研究所 | 一种基于神经网络的专利评价方法、系统和介质 |
CN110674257B (zh) * | 2019-09-25 | 2022-10-28 | 中国科学技术大学 | 评估网络空间中文本信息真实性的方法 |
CN111784054A (zh) * | 2020-07-03 | 2020-10-16 | 内蒙古大学 | 基于贝叶斯神经网络的专利价值实现路径预测方法及系统 |
CN112613835A (zh) * | 2020-12-18 | 2021-04-06 | 上海大学 | 技术转移办公室通用信息系统 |
CN112733549B (zh) * | 2020-12-31 | 2024-03-01 | 厦门智融合科技有限公司 | 一种基于多重语义融合的专利价值信息分析方法、装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880799A (zh) * | 2012-09-24 | 2013-01-16 | 西北工业大学 | 一种基于多属性决策的复杂网络节点重要度综合评价方法 |
CN103559262A (zh) * | 2013-11-04 | 2014-02-05 | 北京邮电大学 | 基于社区的作者及其学术论文推荐系统和推荐方法 |
CN104573103A (zh) * | 2015-01-30 | 2015-04-29 | 福州大学 | 一种科技文献异构网络下合作作者推荐方法 |
CN106980683A (zh) * | 2017-03-30 | 2017-07-25 | 中国科学技术大学苏州研究院 | 基于深度学习的博客文本摘要生成方法 |
CN107169527A (zh) * | 2017-06-06 | 2017-09-15 | 西北工业大学 | 基于协同深度学习的医学图像分类方法 |
CN107291803A (zh) * | 2017-05-15 | 2017-10-24 | 广东工业大学 | 一种融合多类型信息的网络表示方法 |
-
2018
- 2018-03-27 CN CN201810259236.5A patent/CN108416535B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102880799A (zh) * | 2012-09-24 | 2013-01-16 | 西北工业大学 | 一种基于多属性决策的复杂网络节点重要度综合评价方法 |
CN103559262A (zh) * | 2013-11-04 | 2014-02-05 | 北京邮电大学 | 基于社区的作者及其学术论文推荐系统和推荐方法 |
CN104573103A (zh) * | 2015-01-30 | 2015-04-29 | 福州大学 | 一种科技文献异构网络下合作作者推荐方法 |
CN106980683A (zh) * | 2017-03-30 | 2017-07-25 | 中国科学技术大学苏州研究院 | 基于深度学习的博客文本摘要生成方法 |
CN107291803A (zh) * | 2017-05-15 | 2017-10-24 | 广东工业大学 | 一种融合多类型信息的网络表示方法 |
CN107169527A (zh) * | 2017-06-06 | 2017-09-15 | 西北工业大学 | 基于协同深度学习的医学图像分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108416535A (zh) | 2018-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108416535B (zh) | 基于深度学习的专利价值评估的方法 | |
CN108388651B (zh) | 一种基于图核和卷积神经网络的文本分类方法 | |
CN107766324B (zh) | 一种基于深度神经网络的文本一致性分析方法 | |
CN110348227B (zh) | 一种软件漏洞的分类方法及系统 | |
CN106778878B (zh) | 一种人物关系分类方法及装置 | |
CN109710766B (zh) | 一种工单数据的投诉倾向分析预警方法及装置 | |
CN108664512B (zh) | 文本对象分类方法及装置 | |
CN110781406A (zh) | 一种基于变分自动编码器的社交网络用户多属性推断方法 | |
Huang et al. | Large-scale heterogeneous feature embedding | |
Heller et al. | Infinite hierarchical hidden Markov models | |
CN111339260A (zh) | 一种基于bert和qa思想的细粒度情感分析方法 | |
CN110472225B (zh) | 基于词扩展lda的铁路事故原因分析方法 | |
CN111966878A (zh) | 基于机器学习的舆情事件反转检测方法 | |
CN111709225B (zh) | 一种事件因果关系判别方法、装置和计算机可读存储介质 | |
CN111897961A (zh) | 一种宽度神经网络模型的文本分类方法及相关组件 | |
CN110674301A (zh) | 一种情感倾向预测方法、装置、系统及存储介质 | |
CN115018656A (zh) | 风险识别方法、风险识别模型的训练方法、装置和设备 | |
CN114357171A (zh) | 一种应急事件处理方法、装置、存储介质及电子设备 | |
CN110569355A (zh) | 一种基于词块的观点目标抽取和目标情感分类联合方法及系统 | |
CN111581379B (zh) | 一种基于作文扣题度的自动作文评分计算方法 | |
CN112446205A (zh) | 语句判别方法、装置、设备及存储介质 | |
CN116521899A (zh) | 一种基于改进的图神经网络的文档级关系抽取算法及系统 | |
CN116257601A (zh) | 一种基于深度学习的违法词库构建方法及系统 | |
CN112463964B (zh) | 文本分类及模型训练方法、装置、设备及存储介质 | |
CN115017906A (zh) | 一种针对文本中实体的识别方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |