CN117422321A - 专利价值评估方法、装置、电子设备和存储介质 - Google Patents
专利价值评估方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117422321A CN117422321A CN202310280940.XA CN202310280940A CN117422321A CN 117422321 A CN117422321 A CN 117422321A CN 202310280940 A CN202310280940 A CN 202310280940A CN 117422321 A CN117422321 A CN 117422321A
- Authority
- CN
- China
- Prior art keywords
- training
- data
- value
- model
- value evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 53
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 174
- 238000013210 evaluation model Methods 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 26
- 238000007781 pre-processing Methods 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims description 36
- 238000012797 qualification Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000009795 derivation Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 6
- 238000000926 separation method Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/184—Intellectual property management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Technology Law (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种专利价值评估方法、装置、电子设备和存储介质,属于专利价值评估技术领域,其中,专利价值评估方法包括:获取目标专利对应的原始数据;对所述原始数据进行预处理,得到预处理后的数据;对所述预处理后的数据进行特征工程处理,得到第一特征数据;将所述第一特征数据输入专利价值评估模型,得到所述目标专利对应的专利价值等级;其中,所述专利价值评估模型是基于训练专利对应的训练特征数据,以及所述训练专利对应的专利价值等级标签,对XGBoost模型进行训练得到的。本发明提高了专利价值评估的准确性。
Description
技术领域
本发明涉及专利价值评估技术领域,尤其涉及一种专利价值评估方法、装置、电子设备和存储介质。
背景技术
银行等金融机构在对高新企业放贷时,需要对企业的知识产权的价值进行评估,专利价值评估是知识产权价值评估的重点。现有技术大多数是由专家建立专利评价指标并对各个指标的权重进行赋值,从而对专利价值进行评估,其评价结果受专家的经验、专业能力以及主观因素的影响,专利价值评估的准确性有待进一步提高。
发明内容
本发明提供一种专利价值评估方法、装置、电子设备和存储介质,用以解决现有技术中由专家建立专利评价指标并对各个指标的权重进行赋值,从而对专利价值进行评估,其评价结果受专家的经验、专业能力以及主观因素的影响的缺陷,实现提高专利价值评估的准确性。
本发明提供一种专利价值评估方法,包括:
获取目标专利对应的原始数据;
对所述原始数据进行预处理,得到预处理后的数据;
对所述预处理后的数据进行特征工程处理,得到第一特征数据;
将所述第一特征数据输入专利价值评估模型,得到所述目标专利对应的专利价值等级;
其中,所述专利价值评估模型是基于训练专利对应的训练特征数据,以及所述训练专利对应的专利价值等级标签,对XGBoost模型进行训练得到的。
在一些实施例中,所述对所述原始数据进行预处理,得到预处理后的数据,包括:
对所述原始数据进行基础数据解析、数据清洗和质量校准,得到预处理后的数据。
在一些实施例中,所述对所述预处理后的数据进行特征工程处理,得到第一特征数据,包括:
对所述预处理后的数据进行特征衍生,形成结构化的特征数据表;
对所述特征数据表进行特征转换和分箱,得到具有多维度属性的第一特征数据。
在一些实施例中,所述专利价值评估模型的确定过程包括:
从数据库中获取所述训练专利对应的训练原始数据;
确定所述训练专利对应的专利价值等级标签;
对所述训练原始数据进行预处理,得到预处理后的训练数据,对所述预处理后的训练数据进行特征工程处理,得到所述训练特征数据;
基于所述训练特征数据和所述专利价值等级标签,对XGBoost模型进行训练,得到所述专利价值评估模型。
在一些实施例中,所述确定所述训练专利对应的专利价值等级标签,包括:
基于所述训练专利对应的专利权人的资质,以及所述训练专利对应的专利影响力,确定所述训练专利对应的专利价值等级标签。
在一些实施例中,所述基于所述训练专利对应的专利权人的资质,以及所述训练专利对应的专利影响力,确定所述训练专利对应的专利价值等级标签,包括:
对所述训练专利对应的专利权人的资质进行评分,得到专利权人得分,其中所述训练专利对应的专利权人的类型包括个人、学校和企业;
对所述训练专利对应的专利影响力进行评分,得到专利影响力得分,其中,所述专利影响力的评分指标包括专利的被引用情况、专利的技术布局、专利在全球的公开情况、专利的技术质量和专利所属技术领域的热门程度;
基于所述专利权人得分和所述专利影响力得分,得到所述训练专利的综合得分,根据所述综合得分确定所述训练专利对应的专利价值等级标签。
在一些实施例中,所述对所述训练专利对应的专利权人的资质进行评分,得到专利权人得分,包括:
若所述训练专利对应的专利权人为企业,则获取所述企业的市值和企业的专利数据,基于所述企业的市值和所述企业的专利数据,对所述企业的资质进行评分,得到所述企业的得分。
本发明还提供一种专利价值评估装置,包括:
获取单元,用于获取目标专利对应的原始数据;
预处理单元,用于对所述原始数据进行预处理,得到预处理后的数据;
特征提取单元,用于对所述预处理后的数据进行特征工程处理,得到第一特征数据;
评估单元,用于将所述第一特征数据输入专利价值评估模型,得到所述目标专利对应的专利价值等级;
其中,所述专利价值评估模型是以训练专利对应的训练特征数据为训练数据,以所述训练专利对应的专利价值等级为标签,对XGBoost模型进行训练得到的。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述专利价值评估方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述专利价值评估方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述专利价值评估方法。
本发明提供的一种专利价值评估方法、装置、电子设备和存储介质,通过对获取的目标专利对应的原始数据进行预处理和特征工程处理,得到第一特征数据,基于第一特征数据和专利价值评估模型,得到目标专利对应的专利价值等级,其中,专利价值评估模型是基于训练专利对应的训练特征数据,以及训练专利对应的专利价值等级标签,对XGBoost模型进行训练得到的,本发明提高了专利价值评估的准确性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的专利价值评估方法的流程示意图;
图2是本发明实施例提供的专利价值评估模型的确定过程的流程示意图;
图3是本发明实施例提供的基于训练专利对应的专利权人的资质以及专利影响力确定训练专利对应的专利价值等级标签的流程示意图;
图4是本发明提供的专利价值评估装置的结构示意图;
图5是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
银行等金融机构在对高新企业放贷时,很难像对其他中大型企业一样,参考企业的财报税收交易等进行放贷。因此,需要评估企业的科研能力,知识产权作为企业科研能力体现的重点,需要对其进行价值上的估算。知识产权包括专利权、商标权和著作权,专利权是知识产权的重点。
目前专利价值评估方法中常见的有:成本法、市场法和收益法。成本法是根据创造或购买具有类似专利技术所需要投入的成本来估算专利的价值,这种方法比较片面,并不适用于所有情况。市场法是参考相同或类似专利在市场实际成交的价格对专利的价值进行评估,由于当前市面上不存在针对专利的大规模二级市场,无法对专利进行准确的定价。收益法是根据专利在专利权期限中所能创造的收益推算其价值,但是由于收益的不确定性,这个方法也难以实施。
为此,本发明提供了一种专利价值评估方法、装置、电子设备和存储介质,通过对获取的目标专利对应的原始数据进行预处理和特征工程处理,得到第一特征数据,基于第一特征数据和专利价值评估模型,得到目标专利对应的专利价值等级,其中,专利价值评估模型是基于训练专利对应的训练特征数据,以及训练专利对应的专利价值等级标签,对XGBoost模型进行训练得到的。本发明提高了专利价值评估的准确性。
图1为本发明实施例提供的专利价值评估方法的流程示意图。如图1所示,提供了一种专利价值评估方法,包括以下步骤:步骤110、步骤120、步骤130和步骤140。该方法流程步骤仅仅作为本发明一个可能的实现方式。
步骤110、获取目标专利对应的原始数据。
其中,原始数据包括以下至少一项:专利文本信息、专利权人、发明人数量、申请号、申请日、授权公告日、IPC主分类号、专利类型、专利被引用次数和专利法律状态。
其中,专利文本信息包括摘要、摘要附图、权利要求书、说明书和说明书附图。
其中,专利类型包括发明专利、实用新型专利和外观专利。
步骤120、对所述原始数据进行预处理,得到预处理后的数据。
需要说明的是,对原始数据进行预处理旨在改进不完整、不一致、无法直接使用的原始数据,得到优质的原始数据。
可选地,对原始数据进行探查,找出原始数据中的异常值,对异常值进行补充或删除处理,其中,异常值包括缺失值、单一值和/或离群值。
步骤130、对所述预处理后的数据进行特征工程处理,得到第一特征数据。
其中,特征工程,是指用一系列工程化的方式从原始数据中筛选出更好的数据特征,特征工程通常包括特征预处理、特征选择、降维等环节。
其中,常用的特征选择方法有:过滤式(Filter)、包裹式(Wrapper)和嵌入式(Embedding)。
1)过滤式特征选择是通过评估每个特征和结果的相关性,来对特征进行筛选,留下相关性最强的几个特征。
2)包裹式特征选择是把最终要使用的机器学习模型、评测性能的指标作为特征选择的重要依据,每次去选择若干特征,或是排除若干特征。
3)嵌入式特征选择是根据机器学习的算法、模型来分析特征的重要性,从而选择最重要的N个特征。
其中,降维是指把原始高维空间的特征投影到低维度的空间,进行特征的重组,以减少数据的维度,常见的降维方法包括:主成分分析法和线性判别分析法。
本申请实施例中,通过对预处理后的数据进行特征工程处理,得到第一特征数据,该第一特征数据能够反映目标专利的特征。
步骤140、将所述第一特征数据输入专利价值评估模型,得到所述目标专利对应的专利价值等级;
其中,所述专利价值评估模型是基于训练专利对应的训练特征数据,以及所述训练专利对应的专利价值等级标签,对XGBoost模型进行训练得到的。
其中,极限梯度提升算法(eXtreme Gradient Boosting,XGBoost)是一种高效的机器学习算法,近年来,广泛应用于模式识别、图像识别、文本分类和生物医学工程等领域。XGBoost是对梯度提升算法的改进,在计算损失函数时使用了牛顿法,将损失函数进行二阶泰勒展开,同时加入了正则化项。
本申请实施例中,基于训练专利对应的训练特征数据,以及训练专利对应的专利价值等级标签,对XGBoost模型进行训练,得到专利价值评估模型,该专利价值评估模型具有基于输入的第一特征数据预测得到专利价值等级的能力,由于无需专家建立专利评价指标并对各个指标的权重进行赋值,可以解决专利价值评估的准确性受专家的经验、专业能力以及主观因素的影响的问题。
可选地,可以构建标注函数,采用标注函数对训练专利的专利价值等级标签进行标注。
在本发明实施例中,通过对获取的目标专利对应的原始数据进行预处理和特征工程处理,得到第一特征数据,基于第一特征数据和专利价值评估模型,得到目标专利对应的专利价值等级,其中,专利价值评估模型是基于训练专利对应的训练特征数据,以及训练专利对应的专利价值等级标签,对XGBoost模型进行训练得到的,提高了专利价值评估的准确性。
需要说明的是,本发明每一个实施方式可以自由组合、调换顺序或者单独执行,并不需要依靠或依赖固定的执行顺序。
在一些实施例中,所述对所述原始数据进行预处理,得到预处理后的数据,包括:
对所述原始数据进行基础数据解析、数据清洗和质量校准,得到预处理后的数据。
其中,基础数据解析是指对收集来的大量原始数据进行分析,提取有用的信息。
其中,数据清洗是指将原始数据中重复、多余的数据清除,将缺失的数据补充完整,并将不正确的数据纠正或者删除。
示例性地,对于字段错位、字段值和真实含义不匹配(例如在数值特征中出现文本、类别特征中出现例外的类别)的数据进行纠正或者删除。
可选地,对原始数据的完整性、有效性、数值格式等方面进行质量校准,得到高质量的数据。
在本发明实施例中,通过对原始数据进行预处理,能够得到高质量的数据,便于后续进行特征提取。
在一些实施例中,所述对所述预处理后的数据进行特征工程处理,得到第一特征数据,包括:
对所述预处理后的数据进行特征衍生,形成结构化的特征数据表;
对所述特征数据表进行特征转换和分箱,得到具有多维度属性的第一特征数据。
可选地,基于预处理后的数据得到原始特征,基于原始特征,得到衍生特征。
表1为本发明实施例提供的目标专利的特征数据表示例。如表1所示,基于目标专利的专利类型,衍生出专利保护期限;基于目标专利的申请日,衍生出申请日距今年限;基于申请号,衍生出申请国别;基于发明人,衍生出发明人的总人数。
表1目标专利的特征数据表示例
其中,特征转换是指对特征变量进行转换处理,常见的特征转换方式有标准化处理、归一化处理、正则化处理和特征编码。
其中,特征分箱是指对连续特征变量进行离散化处理。
可选地,可以通过无监督分箱法或有监督分箱法进行特征分箱。
其中,无监督分箱法包括:
1)等距分箱:从最小值到最大值之间均分为N等份,A为最小值,B为最大值,则每个区间的长度为W=(B-A)/N,则区间边界值为A+W,A+2W,…,A+(N-1)W,这里只考虑边界,每个等份的实例数量可能不等。
2)等频分箱:对区间的边界值进行选择,使得每个区间包含的实例数量一致。
3)聚类分箱:比如基于k均值聚类的分箱,k均值聚类法将观测值聚为k类,在聚类过程中需要保证分箱的有序性,第一个分箱中所有观测值都要小于第二个分箱中的观测值,第二个分箱中所有观测值都要小于第三个分箱中的观测值,等等。
其中,有监督分箱法包括决策树分箱或卡方分箱。
其中,决策树分箱是指用树模型拟合目标变量,将树模型内部节点的阈值作为分箱的切点。
需要说明的是,卡方分箱是依赖于卡方检验的分箱方法,在统计指标上选择卡方统计量进行判别,分箱的基本思想是判断相邻的两个区间是否有分布差异,基于卡方统计量的结果进行自下而上的合并,直到满足分箱的限制条件为止。
在本发明实施例中,通过对预处理后的数据进行特征衍生,形成结构化的特征数据表,对特征数据表进行特征转换和分箱,得到具有多维度属性的第一特征数据,能够在一定程度上减少异常值的影响,对异常数据有很强的鲁棒性。
图2为本发明实施例提供的专利价值评估模型的确定过程的流程示意图。如图2所示,专利价值评估模型的确定过程包括以下步骤:
步骤210、步骤220、步骤230和步骤240。该方法流程步骤仅仅作为本发明一个可能的实现方式。
步骤210、从数据库中获取所述训练专利对应的训练原始数据。
其中,训练原始数据包括以下至少一项:专利文本信息、专利权人、发明人数量、申请号、申请日、授权公告日、IPC主分类号、专利类型、专利被引用次数和专利法律状态。
其中,专利文本信息包括摘要、摘要附图、权利要求书、说明书和说明书附图,专利类型包括发明专利、实用新型专利和外观专利。
步骤220、确定所述训练专利对应的专利价值等级标签。
步骤230、对所述训练原始数据进行预处理,得到预处理后的训练数据,对所述预处理后的训练数据进行特征工程处理,得到所述训练特征数据。
可选地,对训练原始数据进行基础数据解析、数据清洗和质量校准,得到预处理后的训练数据。
可选地,对预处理后的训练数据进行特征衍生,形成结构化的特征数据表。
进一步地,对预处理后的训练数据对应的特征数据表进行特征转换和分箱,得到具有多维度属性的训练特征数据。
步骤240、基于所述训练特征数据和所述专利价值等级标签,对XGBoost模型进行训练,得到所述专利价值评估模型。
可选地,XGBoost模型训练完成后,得到初始专利价值评估模型,对初始专利价值评估模型进行参数优化迭代,得到专利价值评估模型。
在本发明实施例中,通过获取训练专利对应的训练原始数据并对其进行预处理和特征工程处理,得到训练特征数据,确定训练专利对应的专利价值等级标签,基于训练特征数据和专利价值等级标签对XGBoost模型进行训练,得到专利价值评估模型,提高了专利价值评估模型的精度。
在一些实施例中,所述步骤220,进一步包括:
基于所述训练专利对应的专利权人的资质,以及所述训练专利对应的专利影响力,确定所述训练专利对应的专利价值等级标签。
其中,专利权人的资质可以反映专利权人的综合科研实力。
可选地,可以通过专利权人已获取的专利权的数量、已发表文献的数量以及专利权人的价值等方面对专利权人的资质进行评估。
其中,专利影响力是指专利在当前和未来对社会、经济、教育等方面带来的影响。
可选地,获取训练专利对应的专利权人的资质和专利影响力,以及两者对应的权重,从而确定训练专利对应的专利价值等级标签。
在本发明实施例中,基于训练专利对应的专利权人的资质,以及训练专利对应的专利影响力,确定训练专利对应的专利价值等级标签,提高了专利价值等级标签的准确性。
图3为本发明实施例提供的基于训练专利对应的专利权人的资质以及专利影响力确定训练专利对应的专利价值等级标签的流程示意图。如图3所示,在一些实施例中,所述基于所述训练专利对应的专利权人的资质,以及所述训练专利对应的专利影响力,确定所述训练专利对应的专利价值等级标签,包括步骤310、步骤320和步骤330。
步骤310、对所述训练专利对应的专利权人的资质进行评分,得到专利权人得分,其中所述训练专利对应的专利权人的类型包括个人、学校和企业。
可选地,根据不同类型的专利权人设置不同的评价指标,根据专利权人对应的评价指标对专利权人的资质进行评分。
示例性地,针对个人的评价指标包括职位、学历、工作经历等,针对学校的评价指标包括学校排名、科研成果等。
步骤320、对所述训练专利对应的专利影响力进行评分,得到专利影响力得分,其中,所述专利影响力的评分指标包括专利的被引用情况、专利的技术布局、专利在全球的公开情况、专利的技术质量和专利所属技术领域的热门程度。
可选地,设置专利影响力评价指标,根据专利影响力评价指标对训练专利对应的专利影响力进行评分。
步骤330、基于所述专利权人得分和所述专利影响力得分,得到所述训练专利的综合得分,根据所述综合得分确定所述训练专利对应的专利价值等级标签。
在本发明实施例中,分别对专利权人的资质和专利影响力进行评分,根据两者的得分得到训练专利的综合得分,从而得到训练专利对应的专利价值等级标签,进一步提高了专利价值等级标签的准确性,从而有助于提高专利价值评估模型的精度。
在一些实施例中,所述对所述训练专利对应的专利权人的资质进行评分,得到专利权人得分,包括:
若所述训练专利对应的专利权人为企业,则获取所述企业的市值和企业的专利数据,基于所述企业的市值和所述企业的专利数据,对所述企业的资质进行评分,得到所述企业的得分。
企业的市值可以通过以下方式获取:对于上市公司,企业的市值可以通过将该上市公司发行的每股股票的市场价格乘以发行总股数计算得到;对于非上市公司,企业的市值即为企业的估值,可以通过资产评估法、收益法等方法计算其估值。
其中,企业的专利数据包括企业的专利申请数量、专利类型、专利申请量的变化趋势、专利授权率等数据,可以从官方专利网站或专业的商业数据库获取。
在本发明实施例中,训练专利对应的专利权人为企业,则基于企业的市值和企业的专利数据,得到企业得分,在对企业的专利价值等级进行打标的过程中,充分考虑了企业的综合实力,提高了专利价值等级标签的准确性。
下面对本发明实施例提供的专利价值评估装置进行描述,下文描述的专利价值评估装置与上文描述的专利价值评估方法可相互对应参照。
图4为本发明提供的专利价值评估装置的结构示意图,如图4所示,该专利价值评估装置400包括:
获取单元410,用于获取目标专利对应的原始数据;
预处理单元420,用于对所述原始数据进行预处理,得到预处理后的数据;
特征提取单元430,用于对所述预处理后的数据进行特征工程处理,得到第一特征数据;
评估单元440,用于将所述第一特征数据输入专利价值评估模型,得到所述目标专利对应的专利价值等级;
其中,所述专利价值评估模型是以训练专利对应的训练特征数据为训练数据,以所述训练专利对应的专利价值等级为标签,对XGBoost模型进行训练得到的。
可选地,所述对所述原始数据进行预处理,得到预处理后的数据,包括:
对所述原始数据进行基础数据解析、数据清洗和质量校准,得到预处理后的数据。
可选地,所述对所述预处理后的数据进行特征工程处理,得到第一特征数据,包括:
对所述预处理后的数据进行特征衍生,形成结构化的特征数据表;
对所述特征数据表进行特征转换和分箱,得到具有多维度属性的第一特征数据。
可选地,所述专利价值评估模型的确定过程包括:
从数据库中获取所述训练专利对应的训练原始数据;
确定所述训练专利对应的专利价值等级标签;
对所述训练原始数据进行预处理,得到预处理后的训练数据,对所述预处理后的训练数据进行特征工程处理,得到所述训练特征数据;
基于所述训练特征数据和所述专利价值等级标签,对XGBoost模型进行训练,得到所述专利价值评估模型。
可选地,所述确定所述训练专利对应的专利价值等级标签,包括:
基于所述训练专利对应的专利权人的资质,以及所述训练专利对应的专利影响力,确定所述训练专利对应的专利价值等级标签。
可选地,所述基于所述训练专利对应的专利权人的资质,以及所述训练专利对应的专利影响力,确定所述训练专利对应的专利价值等级标签,包括:
对所述训练专利对应的专利权人的资质进行评分,得到专利权人得分,其中所述训练专利对应的专利权人的类型包括个人、学校和企业;
对所述训练专利对应的专利影响力进行评分,得到专利影响力得分,其中,所述专利影响力的评分指标包括专利的被引用情况、专利的技术布局、专利在全球的公开情况、专利的技术质量和专利所属技术领域的热门程度;
基于所述专利权人得分和所述专利影响力得分,得到所述训练专利的综合得分,根据所述综合得分确定所述训练专利对应的专利价值等级标签。
可选地,所述对所述训练专利对应的专利权人的资质进行评分,得到专利权人得分,包括:
若所述训练专利对应的专利权人为企业,则获取所述企业的市值和企业的专利数据,基于所述企业的市值和所述企业的专利数据,对所述企业的资质进行评分,得到所述企业的得分。
在此需要说明的是,本发明实施例提供的专利价值评估装置,能够实现上述专利价值评估方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行专利价值评估方法,该方法包括:获取目标专利对应的原始数据;对所述原始数据进行预处理,得到预处理后的数据;对所述预处理后的数据进行特征工程处理,得到第一特征数据;将所述第一特征数据输入专利价值评估模型,得到所述目标专利对应的专利价值等级;其中,所述专利价值评估模型是基于训练专利对应的训练特征数据,以及所述训练专利对应的专利价值等级标签,对XGBoost模型进行训练得到的。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的专利价值评估方法,该方法包括:获取目标专利对应的原始数据;对所述原始数据进行预处理,得到预处理后的数据;对所述预处理后的数据进行特征工程处理,得到第一特征数据;将所述第一特征数据输入专利价值评估模型,得到所述目标专利对应的专利价值等级;其中,所述专利价值评估模型是基于训练专利对应的训练特征数据,以及所述训练专利对应的专利价值等级标签,对XGBoost模型进行训练得到的。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的专利价值评估方法,该方法包括获取目标专利对应的原始数据;对所述原始数据进行预处理,得到预处理后的数据;对所述预处理后的数据进行特征工程处理,得到第一特征数据;将所述第一特征数据输入专利价值评估模型,得到所述目标专利对应的专利价值等级;其中,所述专利价值评估模型是基于训练专利对应的训练特征数据,以及所述训练专利对应的专利价值等级标签,对XGBoost模型进行训练得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种专利价值评估方法,其特征在于,包括:
获取目标专利对应的原始数据;
对所述原始数据进行预处理,得到预处理后的数据;
对所述预处理后的数据进行特征工程处理,得到第一特征数据;
将所述第一特征数据输入专利价值评估模型,得到所述目标专利对应的专利价值等级;
其中,所述专利价值评估模型是基于训练专利对应的训练特征数据,以及所述训练专利对应的专利价值等级标签,对XGBoost模型进行训练得到的。
2.根据权利要求1所述的专利价值评估方法,其特征在于,所述对所述原始数据进行预处理,得到预处理后的数据,包括:
对所述原始数据进行基础数据解析、数据清洗和质量校准,得到预处理后的数据。
3.根据权利要求1所述的专利价值评估方法,其特征在于,所述对所述预处理后的数据进行特征工程处理,得到第一特征数据,包括:
对所述预处理后的数据进行特征衍生,形成结构化的特征数据表;
对所述特征数据表进行特征转换和分箱,得到具有多维度属性的第一特征数据。
4.根据权利要求1所述的专利价值评估方法,其特征在于,所述专利价值评估模型的确定过程包括:
从数据库中获取所述训练专利对应的训练原始数据;
确定所述训练专利对应的专利价值等级标签;
对所述训练原始数据进行预处理,得到预处理后的训练数据,对所述预处理后的训练数据进行特征工程处理,得到所述训练特征数据;
基于所述训练特征数据和所述专利价值等级标签,对XGBoost模型进行训练,得到所述专利价值评估模型。
5.根据权利要求4所述的专利价值评估方法,其特征在于,所述确定所述训练专利对应的专利价值等级标签,包括:
基于所述训练专利对应的专利权人的资质,以及所述训练专利对应的专利影响力,确定所述训练专利对应的专利价值等级标签。
6.根据权利要求5所述的专利价值评估方法,其特征在于,所述基于所述训练专利对应的专利权人的资质,以及所述训练专利对应的专利影响力,确定所述训练专利对应的专利价值等级标签,包括:
对所述训练专利对应的专利权人的资质进行评分,得到专利权人得分,其中所述训练专利对应的专利权人的类型包括个人、学校和企业;
对所述训练专利对应的专利影响力进行评分,得到专利影响力得分,其中,所述专利影响力的评分指标包括专利的被引用情况、专利的技术布局、专利在全球的公开情况、专利的技术质量和专利所属技术领域的热门程度;
基于所述专利权人得分和所述专利影响力得分,得到所述训练专利的综合得分,根据所述综合得分确定所述训练专利对应的专利价值等级标签。
7.根据权利要求6所述的专利价值评估方法,其特征在于,所述对所述训练专利对应的专利权人的资质进行评分,得到专利权人得分,包括:
若所述训练专利对应的专利权人为企业,则获取所述企业的市值和企业的专利数据,基于所述企业的市值和所述企业的专利数据,对所述企业的资质进行评分,得到所述企业的得分。
8.一种专利价值评估装置,其特征在于,包括:
获取单元,用于获取目标专利对应的原始数据;
预处理单元,用于对所述原始数据进行预处理,得到预处理后的数据;
特征提取单元,用于对所述预处理后的数据进行特征工程处理,得到第一特征数据;
评估单元,用于将所述第一特征数据输入专利价值评估模型,得到所述目标专利对应的专利价值等级;
其中,所述专利价值评估模型是以训练专利对应的训练特征数据为训练数据,以所述训练专利对应的专利价值等级为标签,对XGBoost模型进行训练得到的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述专利价值评估方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述专利价值评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310280940.XA CN117422321A (zh) | 2023-03-21 | 2023-03-21 | 专利价值评估方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310280940.XA CN117422321A (zh) | 2023-03-21 | 2023-03-21 | 专利价值评估方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117422321A true CN117422321A (zh) | 2024-01-19 |
Family
ID=89523535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310280940.XA Pending CN117422321A (zh) | 2023-03-21 | 2023-03-21 | 专利价值评估方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117422321A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118094413A (zh) * | 2024-04-01 | 2024-05-28 | 烽台科技(北京)有限公司 | 专利价值评估模型的训练方法和专利数据的评估方法 |
-
2023
- 2023-03-21 CN CN202310280940.XA patent/CN117422321A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118094413A (zh) * | 2024-04-01 | 2024-05-28 | 烽台科技(北京)有限公司 | 专利价值评估模型的训练方法和专利数据的评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108564286B (zh) | 一种基于大数据征信的人工智能金融风控授信评定方法和系统 | |
CN103154991B (zh) | 信用风险采集 | |
Tsui et al. | Knowledge-based extraction of intellectual capital-related information from unstructured data | |
CN112102073A (zh) | 信贷风险控制方法及系统、电子设备及可读存储介质 | |
CN108764707A (zh) | 一种数据评估系统以及方法 | |
CN112446744B (zh) | 基于工业产品供需平台构建企业画像的方法、系统及介质 | |
CN112488507B (zh) | 一种基于聚类的专家分类画像方法、装置及存储介质 | |
CN111783829A (zh) | 一种基于多标签学习的财务异常检测方法及装置 | |
CN113723737A (zh) | 一种基于企业画像的政策匹配方法、装置、设备及介质 | |
CN117422321A (zh) | 专利价值评估方法、装置、电子设备和存储介质 | |
CN116934160A (zh) | 一种数据要素资产价值评估方法及系统 | |
CN114841239A (zh) | 基于机器学习的上市公司财务异常分析方法 | |
CN112434862B (zh) | 上市企业财务困境预测方法及装置 | |
CN113506173A (zh) | 一种信用风险评估方法及其相关设备 | |
CN113837803A (zh) | 一种基于多模型融合的二手手机回收价格预测算法 | |
CN117114812A (zh) | 一种针对企业的金融产品推荐方法及装置 | |
CN117132383A (zh) | 一种信贷数据处理方法、装置、设备及可读存储介质 | |
CN116304929A (zh) | 一种基于a股市场的财务操纵识别方法及装置 | |
CN116385151A (zh) | 基于大数据进行风险评级预测的方法及计算设备 | |
CN116523301A (zh) | 基于电商大数据进行风险评级预测的系统 | |
CN114693428A (zh) | 数据确定方法、装置、计算机可读存储介质及电子设备 | |
CN114626940A (zh) | 数据分析方法、装置及电子设备 | |
CN113177733A (zh) | 基于卷积神经网络的中小微企业数据建模方法及系统 | |
CN113240513A (zh) | 一种用户授信额度的确定方法和相关装置 | |
CN113870007A (zh) | 一种产品推荐方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |