一种基于科技大数据的技术成熟度判断方法和系统
技术领域
本发明涉及文献分析的技术领域,特别是一种基于科技大数据的技术成熟度判断方法和系统。
背景技术
技术成熟度,是人们在大量工程实践基础上,对技术成熟规律的总结。为了加强科技工程项目的科学决策的管理能力,提高科研队伍应对技术风险的技术水平,有效控制工程的技术风险,在科技工程项目研制过程中并行开展技术成熟度评价工作。通过技术成熟度评价,客观评定关键技术成熟度等级,准确把握关键技术研发状态,综合分析存在的问题和差距,以期加强对工程研制的指导作用。技术成熟度,不仅可以指导按照技术成熟规律制定技术发展路线、科学合理安排科研活动,也可以评价当前技术发展状态对于项目预期目标的满足程度,还可以作为技术转移的出口准则和技术风险管理的工具。通过技术成熟度评价,准确认识当前技术的发展状态,以及当前技术状态与目标状态的差距,为制定技术成熟计划提供基础。
目前技术成熟度评价的方法主要包括以下三种:
(1)专家评审法,这种方法较为常用,但其准确性对专家的主观判断有较大的依赖,受专家的认识水平、情绪和主观印象影响很大,评价含糊而且容易受部门利益或个人偏见的影响,缺乏规范而客观的评价标准,难以有效地支撑决策。
(2)专利分析法,该方法强调对专利数量及质量的分析,该方法的代表是基于Altshuller的TRIZ理论(发明问题解决理论)的专利分析模型,TRIZ理论将技术生命周期分为萌芽期、成长期、成熟期和衰退期四个阶段,这四个阶段的技术性能和时间关系呈现为“S”曲线,这一方法主要从专利数量、专利等级、性能和经济收益四个方面描述技术各个阶段的特征。首先对专利信息基于时间轴进行统计分析,然后将所得到的当前技术的S曲线与标准的S曲线进行对比,从而判断该技术所处在的生命周期的发展阶段。TRIZ理论还包括基于专利获利能力及专利创新程度的技术成熟度评估模型,然而,在实践中发现,专利获利能力受到社会经济大环境、企业经营水平等多种因素的影响,难以准确反映技术成熟度,而专利创新程度通常由专家阅读专利文献并主观判定,工作量大且难以做到客观准确。
(3)技术成熟度标准(TechnologyReadinessLevels,TRL),是一种比较系统的技术成熟度评价标准,由美国航空航天局(NASA)于1995年首先提出并在航天领域应用,随后被美国及英国的国防部采纳应用。TRL按技术发展过程将技术的成熟度划分为九级:TRL1~TRL9。这一方法需要全面考察该项技术的各项活动,从技术状态、技术在系统中的集成度、进行演示或验证的环境三方面属性综合判断技术成熟度,需要大量的专家现场调研工作,存在主观性,此外该方法存在笼统地描述技术是如何成熟的,由于TRL的定义由于要体现它的通用性,无法体现专用性,一个评价检查单也难以适应属性变化的多种类型,难以清晰的区别各级的准则。
公开号为CN105184078A的发明专利公开了一种基于专利相对量分析的技术成熟度评价方法,通过对待分析技术的专利绝对增长进行统计,并基于专利总量增长倍数及专利质量等级对绝对增长量进行修正,得到专利相对增长量,并基于年份对归一化的专利相对增长量进行曲线拟合,将拟合曲线和标准专利增长量曲线图进行对比,从而确定当前的技术成熟度。本发明包括以下步骤:(a)检索统计待分析技术的专利绝对增长量;(b)计算待分析技术的专利相对增长量;(c)对专利相对增长量进行归一化处理;(d)对专利相对增长量归一化值进行曲线拟合。该方法的缺点是在专利质量判断上过于简单。
发明内容
为了解决上述的技术问题,本发明提出基于科技大数据的技术成熟度判断方法和系统,基于专利分析法为主,辅助以论文、项目等科技大数据分析,通过多维度评价指标和算法,将技术点放在与之相关联的技术集群中进行综合分析,将科技大数据指标与技术成熟度建立映射,实现自动化判断,有别于传统的专家评审法等需大量依靠人工主观性工作,更具客观真实性。
本发明的第一目的是提供了一种基于科技大数据的技术成熟度判断方法,包括建立数据库、算法库和指标库,还包括以下步骤:
步骤1:在所述数据库中进行数据检索;
步骤2:对检索结果进行数据计算整理;
步骤3:对整理好的数据进行回归计算,得到技术成熟度指标;
步骤4:对应所述技术成熟度指标,汇总得到判断结论。
优选的是,所述数据库为多维科技数据库,所述多维科技数据库包括专利库、论文库、项目库和新闻库中至少一种。
在上述任一方案中优选的是,所述算法库包括科技知识图谱和/或技术集群,所述科技知识图谱和/或技术集群用于定义技术点、技术集群和与其相关技术内容。
在上述任一方案中优选的是,所述指标库中的指标包括技术影响力指标、技术影响力即时性指标和核心节点专利技术占比中至少一种指标。
在上述任一方案中优选的是,所述步骤1包括以下子步骤:
步骤11:利用已有的科技知识图谱,输入待分析评价技术点的名称,通过所述待分析评价技术点之间的联系与步距,确定所述待分析评价技术点的特征的多个关键词语义;
步骤12:将所述步骤11得到的所述关键词语义,在论文、项目、新闻库中,进行整体数据检索;
步骤13:将所述步骤11得到的所述关键词语义,与已有的技术集群进行交集,将所述交集的结果在专利库中进行整体数据检索;
步骤14:将所述步骤12和所述步骤13的数据检索结果综合。
在上述任一方案中优选的是,所述步骤2包括以下子步骤:
步骤21:对专利、论文和项目中至少一种客观大数据进行数据清洗和消歧,对新闻非客观大数据进行计算机情感计算,推算真实性保留可靠结果;
步骤22:根据不同纵坐标绘制基本坐标曲线图,所述基本坐标曲线图的横坐标为时间,纵坐标为专利申请数量、专利授权数量、分区论文数量、分区项目数量和新闻中至少一种数据;
步骤23:根据不同纵坐标绘制参照坐标曲线图,所述参照坐标曲线图的横坐标为时间,纵坐标为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标。
在上述任一方案中优选的是,所述步骤3包括以下子步骤:
步骤31:拟合曲线f1(x)=a1x+b1,其中,x为时间,f1(x)为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标,a1为相应指标的变化斜率,b1为曲线截距;
步骤32:拟合曲线f2(x)=a2x2+b2x+c,其中x为时间,f2(x)为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标,其中,a2为相应指标的变化斜率的增长率,b2为拟合一次项参数,c为曲线截距;
步骤33:参照最小二乘法通用方法拟合曲线的模型。
在上述任一方案中优选的是,所述判断结论包括判定技术成熟度处于以下阶段中的一种:萌芽期阶段、成长期阶段、成熟期阶段和衰退期阶段。
在上述任一方案中优选的是,当所述基本坐标曲线中的纵坐标数据主体为所述分区论数量时,判定为萌芽期阶段,所述萌芽期包括萌芽期早期阶段和萌芽期向成长期阶段。
在上述任一方案中优选的是,当满足下述判断条件时,判定所述技术成熟度处于所述萌芽期早期阶段:
1)所述论文技术影响力大于所述专利技术影响力,或所述专利技术影响力为零但所述论文技术影响力为正值;
2)所述论文技术影响力曲线中的a1大于1,a2大于0。
在上述任一方案中优选的是,当满足下述判断条件时,判定所述技术成熟度处于所述萌芽期向成长期阶段:
1)论文逐步从SCI论文向EI论文过渡,所述论文技术影响力大于所述专利技术影响力;
2)所述论文技术影响力曲线中的a1大于0,a2接近0或小于0,增速下降;
3)所述论文技术影响力即时性曲线中的a1小于0,a2接近0或大于0;
4)所述专利技术影响力曲线中的a1大于0,a2大于0;
5)所述核心节点专利曲线中的a1大于0,a2大于0。
在上述任一方案中优选的是,当满足下述判断条件时,判定所述技术成熟度处于所述成长期阶段:
1)所述基本坐标曲线中的纵坐标数据主体专利数据超出论文数据,基本坐标曲线中的专利数据趋于平稳,工程化研究项目和新闻数据开始出现;
2)所述参照坐标曲线中的专利技术影响力超过技术论文影响力,技术影响力即时性比萌芽期下降,核心节点专利技术占比趋于稳定;
3)所述论文技术影响力曲线中的a1小于0;
4)所述论文技术影响力即时性曲线中的a1小于0;
5)所述专利技术影响力曲线中的a1接近或小于0,a2接近0或小于0;
6)所述专利技术影响力即时性曲线中的a1小于0,a2接近0或小于0;
7)所述核心节点专利曲线中的a1接近或小于0,a2小于0。
在上述任一方案中优选的是,当满足下述判断条件时,判定所述技术成熟度处于所述成熟期阶段:
1)所述基本坐标曲线中的纵坐标数据主体专利数据超出论文数据,基本坐标曲线中的专利数据趋于平稳,工程化研究项目和新闻数据开始出现;
2)所述参照坐标曲线中的专利技术影响力超过技术论文影响力,技术影响力即时性比萌芽期下降,核心节点专利技术占比趋于稳定;
3)所述论文技术影响力曲线中的a1小于0;
4)所述论文技术影响力即时性曲线中的a1小于0;
5)所述专利技术影响力曲线中的a1接近或小于0,a2接近0或小于0;
6)所述专利技术影响力即时性曲线中的a1小于0,a2接近0或小于0;
7)所述核心节点专利曲线中的a1接近或小于0,a2小于0。
在上述任一方案中优选的是,当满足下述判断条件时,判定所述技术成熟度处于所述衰退期阶段:
1)所述新闻数据为主体,专利与论文数据均下降;
2)所述论文技术影响力曲线中的a1小于-1;
3)所述专利技术影响力曲线中的a1小于-1;
4)所述核心节点专利曲线中的a1小于-1。
本发明的第二目的是提供了一种基于科技大数据的技术成熟度判断系统,包括数据库、算法库和指标库,还包括以下模块:
数据检索模块:用于在所述数据库中进行数据检索;
数据整理模块:用于对检索结果进行数据计算整理;
数据计算模块:用于对整理好的数据进行回归计算,得到技术成熟度指标;
汇总判断模块:用于对应所述技术成熟度指标,汇总得到判断结论。
优选的是,所述数据库为多维科技数据库,所述多维科技数据库包括专利库、论文库、项目库和新闻库中至少一种。
在上述任一方案中优选的是,所述算法库包括科技知识图谱和/或技术集群,所述科技知识图谱和/或技术集群用于定义技术点、技术集群和与其相关技术内容。
在上述任一方案中优选的是,所述指标库中的指标包括技术影响力指标、技术影响力即时性指标和核心节点专利技术占比中至少一种指标。
在上述任一方案中优选的是,所述数据检索模块包括以下子模块:整体检索子模块:用于利用已有的科技知识图谱,输入待分析评价技术点的名称,通过所述待分析评价技术点之间的联系与步距,确定所述待分析评价技术点的特征的多个关键词语义;
数据挖掘子模块:用于将所述整体检索子模块中得到的所述关键词语义,在论文、项目、新闻库中,进行整体数据检索;
指定检索子模块:用于将所述整体检索子模块中得到的所述关键词语义,与已有的技术集群进行交集,将所述交集的结果在专利库中进行整体数据检索;
综合子模块:用于将所述数据挖掘子模块和所述指定检索子模块的数据检索结果综合。
在上述任一方案中优选的是,所述数据整理模块包括以下子模块:数据清洗子模块:用于对专利、论文和项目中至少一种客观大数据进行数据清洗和消歧,对新闻非客观大数据进行计算机情感计算,推算真实性保留可靠结果;
曲线图绘制子模块:用于根据不同纵坐标绘制基本坐标曲线图,所述基本坐标曲线图的横坐标为时间,纵坐标为专利申请数量、专利授权数量、分区论文数量、分区项目数量和新闻中至少一种数据;
曲线图修订子模块:用于根据不同纵坐标绘制参照坐标曲线图,所述参照坐标曲线图的横坐标为时间,纵坐标为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标。
在上述任一方案中优选的是,所述数据计算模块的工作包括以下步骤:步骤31:拟合曲线f1(x)=a1x+b1,其中,x为时间,f1(x)为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标,a1为相应指标的变化斜率,b1为曲线截距;
步骤32:拟合曲线f2(x)=a2x2+b2x+c,其中x为时间,f2(x)为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标,其中,a2为相应指标的变化斜率的增长率,b2为拟合一次项参数,c为曲线截距;
步骤33:参照最小二乘法通用方法拟合曲线的模型。
在上述任一方案中优选的是,所述判断结论包括判定技术成熟度处于以下阶段中的一种:萌芽期阶段、成长期阶段、成熟期阶段和衰退期阶段。
在上述任一方案中优选的是,当所述基本坐标曲线中的纵坐标数据主体为所述分区论数量时,判定为萌芽期阶段,所述萌芽期包括萌芽期早期阶段和萌芽期向成长期阶段。
在上述任一方案中优选的是,当满足下述判断条件时,判定所述技术成熟度处于所述萌芽期早期阶段:
1)所述论文技术影响力大于所述专利技术影响力,或所述专利技术影响力为零但所述论文技术影响力为正值;
2)所述论文技术影响力曲线中的a1大于1,a2大于0。
在上述任一方案中优选的是,当满足下述判断条件时,判定所述技术成熟度处于所述萌芽期向成长期阶段:
1)论文逐步从SCI论文向EI论文过渡,所述论文技术影响力大于所述专利技术影响力;
2)所述论文技术影响力曲线中的a1大于0,a2接近0或小于0,增速下降;
3)所述论文技术影响力即时性曲线中的a1小于0,a2接近0或大于0;
4)所述专利技术影响力曲线中的a1大于0,a2大于0;
5)所述核心节点专利曲线中的a1大于0,a2大于0。
在上述任一方案中优选的是,当满足下述判断条件时,判定所述技术成熟度处于所述成长期阶段:
1)所述基本坐标曲线中的纵坐标数据主体专利数据超出论文数据,基本坐标曲线中的专利数据趋于平稳,工程化研究项目和新闻数据开始出现;
2)所述参照坐标曲线中的专利技术影响力超过技术论文影响力,技术影响力即时性比萌芽期下降,核心节点专利技术占比趋于稳定;
3)所述论文技术影响力曲线中的a1小于0;
4)所述论文技术影响力即时性曲线中的a1小于0;
5)所述专利技术影响力曲线中的a1接近或小于0,a2接近0或小于0;
6)所述专利技术影响力即时性曲线中的a1小于0,a2接近0或小于0;
7)所述核心节点专利曲线中的a1接近或小于0,a2小于0。
在上述任一方案中优选的是,当满足下述判断条件时,判定所述技术成熟度处于所述成熟期阶段:
1)所述基本坐标曲线中的纵坐标数据主体专利数据超出论文数据,基本坐标曲线中的专利数据趋于平稳,工程化研究项目和新闻数据开始出现;
2)所述参照坐标曲线中的专利技术影响力超过技术论文影响力,技术影响力即时性比萌芽期下降,核心节点专利技术占比趋于稳定;
3)所述论文技术影响力曲线中的a1小于0;
4)所述论文技术影响力即时性曲线中的a1小于0;
5)所述专利技术影响力曲线中的a1接近或小于0,a2接近0或小于0;
6)所述专利技术影响力即时性曲线中的a1小于0,a2接近0或小于0;
7)所述核心节点专利曲线中的a1接近或小于0,a2小于0。
在上述任一方案中优选的是,当满足下述判断条件时,判定所述技术成熟度处于所述衰退期阶段:
1)所述新闻数据为主体,专利与论文数据均下降;
2)所述论文技术影响力曲线中的a1小于-1;
3)所述专利技术影响力曲线中的a1小于-1;
4)所述核心节点专利曲线中的a1小于-1。
本发明提出了一种基于科技大数据的技术成熟度判断方法和系统,克服现有评价技术的不足,尤其是专家的主观性,提供一种基于专利等科技大数据进行技术成熟度评估的方法,更具客观真实性,且可实现机器的半自动化计算。
附图说明
图1为按照本发明的基于科技大数据的技术成熟度判断方法的一优选实施例的流程图。
图1A为按照本发明的基于科技大数据的技术成熟度判断方法的如图1所示实施例的数据检索方法流程图。
图1B为按照本发明的基于科技大数据的技术成熟度判断方法的如图1所示实施例的数据整理方法流程图。
图1C为按照本发明的基于科技大数据的技术成熟度判断方法的如图1所示实施例的回归计算方法流程图。
图2为按照本发明的基于科技大数据的技术成熟度判断系统的一优选实施例的模块图。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的阐述。
实施例一
如图1所示,执行步骤100,建立数据库、算法库和指标库。数据库为多维科技数据库,所述多维科技数据库包括专利库、论文库、项目库和新闻库中至少一种;算法库包括科技知识图谱和/或技术集群,所述科技知识图谱和/或技术集群用于定义技术点、技术集群和与其相关技术内容;指标库中的指标包括技术影响力指标、技术影响力即时性指标和核心节点专利技术占比中至少一种指标。
执行步骤110,在所述数据库中进行数据检索。如图1A所示,执行步骤111,利用已有的科技知识图谱,输入待分析评价技术点的名称,通过所述待分析评价技术点之间的联系与步距,确定所述待分析评价技术点的特征的多个关键词语义。执行步骤112,将步骤111得到的所述关键词语义,在论文、项目、新闻库中,进行整体数据检索。执行步骤113,将所述步骤111得到的所述关键词语义,与已有的技术集群进行交集,将所述交集的结果在专利库中进行整体数据检索。执行步骤114,将所述步骤112和所述步骤113的数据检索结果综合
执行步骤120,对检索结果进行数据计算整理。如图1B所示,执行步骤121,利用现有公开技术对专利、论文和项目中至少一种客观大数据进行数据清洗和消歧,利用现有公开技术对新闻非客观大数据进行计算机情感计算,推算真实性保留可靠结果。执行步骤122,根据不同纵坐标绘制基本坐标曲线图,所述基本坐标曲线图的横坐标为时间,纵坐标为专利申请数量、专利授权数量、分区论文数量、分区项目数量和新闻中至少一种数据。执行步骤123,根据不同纵坐标绘制参照坐标曲线图,所述参照坐标曲线图的横坐标为时间,纵坐标为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标。
执行步骤130,对整理好的数据进行回归计算,得到技术成熟度指标。如图1C所示,执行步骤131,拟合曲线f1(x)=a1x+b1,其中,x为时间,f1(x)为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标,a1为相应指标的变化斜率,b1为曲线截距。执行步骤132,拟合曲线f2(x)=a2x2+b2x+c,其中x为时间,f2(x)为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标,其中,a2为相应指标的变化斜率的增长率,b2为拟合一次项参数,c为曲线截距。执行步骤133,照最小二乘法通用方法拟合曲线的模型。执行步骤140,对应所述技术成熟度指标,汇总得到判断结论。判断结论包括判定技术成熟度处于以下阶段中的一种:萌芽期阶段、成长期阶段、成熟期阶段和衰退期阶段,判定方法为:
1、当所述基本坐标曲线中的纵坐标数据主体为所述分区论数量时,判定为萌芽期阶段,所述萌芽期包括萌芽期早期阶段和萌芽期向成长期阶段。
1.1、当满足下述判断条件时,判定所述技术成熟度处于所述萌芽期向成长期阶段:
1)论文逐步从SCI论文向EI论文过渡,论文技术影响力大于专利技术影响力;
2)所述论文技术影响力曲线中的a1大于0,a2接近0或小于0,增速下降;
3)所述论文技术影响力即时性曲线中的a1小于0,a2接近0或大于0;
4)所述专利技术影响力曲线中的a1大于0,a2大于0;
5)所述核心节点专利曲线中的a1大于0,a2大于0
1.2、当满足下述判断条件时,判定所述技术成熟度处于所述萌芽期向成长期阶段:
1)论文逐步从SCI论文向EI论文过渡,论文技术影响力大于专利技术影响力;
2)所述论文技术影响力曲线中的a1大于0,a2接近0或小于0,增速下降;
3)所述论文技术影响力即时性曲线中的a1小于0,a2接近0或大于0;
4)所述专利技术影响力曲线中的a1大于0,a2大于0;
5)所述核心节点专利曲线中的a1大于0,a2大于0。
2、满足下述判断条件时,判定所述技术成熟度处于成长期阶段:
1)所述基本坐标曲线中的纵坐标数据主体EI论文超过SCI论文数量;
2)所述专利数据增长率趋于稳定,所述专利技术影响力逐渐接近所述论文技术影响力,所述核心节点专利比例上升;
3)所述论文技术影响力曲线中的a1接近0;
4)所述论文技术影响力即时性曲线中的a1小于0,a2接近0或大于0;
5)所述专利技术影响力曲线中的a1大于0,a2接近0或小于0;
6)所述专利技术影响力即时性曲线中的a1小于0,a2接近0或小于0;
7)所述核心节点专利曲线中的a1大于0,a2逐渐接近0。
3、当满足下述判断条件时,判定所述技术成熟度处于所述成熟期阶段:
1)所述基本坐标曲线中的纵坐标数据主体专利数据超出论文数据,基本坐标曲线中的专利数据趋于平稳,工程化研究项目和新闻数据开始出现;
2)所述参照坐标曲线中的专利技术影响力超过技术论文影响力,技术影响力即时性比萌芽期下降,核心节点专利技术占比趋于稳定;
3)所述论文技术影响力曲线中的a1小于0;
4)所述论文技术影响力即时性曲线中的a1小于0;
5)所述专利技术影响力曲线中的a1接近或小于0,a2接近0或小于0;
6)所述专利技术影响力即时性曲线中的a1小于0,a2接近0或小于0;
7)所述核心节点专利曲线中的a1接近或小于0,a2小于0。
4、当满足下述判断条件时,判定所述技术成熟度处于所述衰退期阶段:
1)所述新闻数据为主体,专利与论文数据均下降;
2)所述论文技术影响力曲线中的a1小于-1;
3)所述专利技术影响力曲线中的a1小于-1;
4)所述核心节点专利曲线中的a1小于-1。
实施例二
如图2所示,一种基于科技大数据的技术成熟度判断系统包括数据库200、算法库210、指标库220、数据检索模块230、数据整理模块240、数据计算模块250和汇总判断模块260。
数据库200为多维科技数据库,所述多维科技数据库包括专利库、论文库、项目库和新闻库中至少一种。
算法库210包括科技知识图谱和/或技术集群,所述科技知识图谱和/或技术集群用于定义技术点、技术集群和与其相关技术内容。
指标库220中的指标包括技术影响力指标、技术影响力即时性指标和核心节点专利技术占比中至少一种指标。
数据检索模块230:用于在所述数据库中进行数据检索,包括以下子模块:
整体检索子模块:用于利用已有的科技知识图谱,输入待分析评价技术点的名称,通过所述待分析评价技术点之间的联系与步距,确定所述待分析评价技术点的特征的多个关键词语义;
数据挖掘子模块:用于将所述整体检索子模块中得到的所述关键词语义,在论文、项目、新闻库中,进行整体数据检索;
指定检索子模块:用于将所述整体检索子模块中得到的所述关键词语义,与已有的技术集群进行交集,将所述交集的结果在专利库中进行整体数据检索;综合子模块:用于将所述数据挖掘子模块和所述指定检索子模块的数据检索结果综合。
数据整理模块240:用于对检索结果进行数据计算整理。包括以下子模块:
数据清洗子模块:用于利用现有公开技术对专利、论文和项目中至少一种客观大数据进行数据清洗和消歧,利用现有公开技术对新闻非客观大数据进行计算机情感计算,推算真实性保留可靠结果。
曲线图绘制子模块:用于根据不同纵坐标绘制基本坐标曲线图,所述基本坐标曲线图的横坐标为时间,纵坐标为专利申请数量、专利授权数量、分区论文数量、分区项目数量和新闻中至少一种数据。
曲线图修订子模块:用于根据不同纵坐标绘制参照坐标曲线图,所述参照坐标曲线图的横坐标为时间,纵坐标为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标。
数据计算模块250:用于对整理好的数据进行回归计算,得到技术成熟度指标。数据计算模块的工作包括以下步骤:
步骤31:拟合曲线f1(x)=a1x+b1,其中,x为时间,f1(x)为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标,a1为相应指标的变化斜率,b1为曲线截距;
步骤32:拟合曲线ff(x)=afxf+bfx+c,其中x为时间,f2(x)为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标,其中,a2为相应指标的变化斜率的增长率,b2为拟合一次项参数,c为曲线截距;
步骤33:参照最小二乘法通用方法拟合曲线的模型。
汇总判断模块260:用于对应所述技术成熟度指标,汇总得到判断结论。判断结论包括以下几种情况:
1、当所述基本坐标曲线中的纵坐标数据主题为论文数据时,判定为萌芽期,萌芽期包括萌芽期早期阶段和萌芽期向成长期阶段。
1.1当满足下述判断条件时,判定所述技术成熟度处于所述萌芽期早期阶段:
1)论文技术影响力大于专利技术影响力,或专利技术影响力为零但论文技术影响力为正值;
2)所述论文技术影响力曲线中的a1大于1,a2大于0。
1.2当满足下述判断条件时,判定所述技术成熟度处于所述萌芽期向成长期阶段:
1)论文逐步从SCI论文向EI论文过渡,所述论文技术影响力大于所述专利技术影响力;
2)所述论文技术影响力曲线中的a1大于0,a2接近0或小于0,增速下降;
3)所述论文技术影响力即时性曲线中的a1小于0,a2接近0或大于0;
4)所述专利技术影响力曲线中的a1大于0,a2大于0;
5)所述核心节点专利曲线中的a1大于0,a2大于0。
2、当满足下述判断条件时,判定所述技术成熟度处于所述成长期阶段:
1)所述基本坐标曲线中的纵坐标数据主体专利数据超出论文数据,基本坐标曲线中的专利数据趋于平稳,工程化研究项目和新闻数据开始出现;
2)所述参照坐标曲线中的专利技术影响力超过技术论文影响力,技术影响力即时性比萌芽期下降,核心节点专利技术占比趋于稳定;
3)所述论文技术影响力曲线中的a1小于0;
4)所述论文技术影响力即时性曲线中的a1小于0;
5)所述专利技术影响力曲线中的a1接近或小于0,a2接近0或小于0;
6)所述专利技术影响力即时性曲线中的a1小于0,a2接近0或小于0;
7)所述核心节点专利曲线中的a1接近或小于0,a2小于0。
3、当满足下述判断条件时,判定所述技术成熟度处于所述成熟期阶段:
1)所述基本坐标曲线中的纵坐标数据主体专利数据超出论文数据,基本坐标曲线中的专利数据趋于平稳,工程化研究项目和新闻数据开始出现;
2)所述参照坐标曲线中的专利技术影响力超过技术论文影响力,技术影响力即时性比萌芽期下降,核心节点专利技术占比趋于稳定;
3)所述论文技术影响力曲线中的a1小于0;
4)所述论文技术影响力即时性曲线中的a1小于0;
5)所述专利技术影响力曲线中的a1接近或小于0,a2接近0或小于0;
6)所述专利技术影响力即时性曲线中的a1小于0,a2接近0或小于0;
7)所述核心节点专利曲线中的a1接近或小于0,a2小于0。
4、当满足下述判断条件时,判定所述技术成熟度处于所述衰退期阶段:
1)所述新闻数据为主体,专利与论文数据均下降;
2)所述论文技术影响力曲线中的a1小于-1;
3)所述专利技术影响力曲线中的a1小于-1;
4)所述核心节点专利曲线中的a1小于-1。
实施例三
本发明基于专利分析法为主,辅助以论文、项目等科技大数据分析,通过多维度评价指标和算法,将技术点放在与之相关联的技术集群中进行综合分析,将科技大数据指标与技术成熟度建立映射,实现自动化判断,有别于传统的专家评审法等需大量依靠人工主观性工作,更具客观真实性。
本发明的技术方案克服现有评价技术的不足,尤其是专家的主观性,提供一种基于专利等科技大数据进行技术成熟度评估的方法,更具客观真实性,且可实现机器的半自动化计算,具体步骤如下:
步骤1:建立数据库,算法库和指标库;
所述步骤1包括以下子步骤:
步骤11:建立多维科技数据库,涵盖专利库,论文库(分区,包括SCI和EI),项目库(分区,包括基础研究项目,应用研究项目和产业推广项目),以及新闻库;
步骤12:建立算法库,具体涵盖科技知识图谱和技术集群,综合定义技术点和技术集群的内涵和外延,量化技术的相互影响节点;
步骤13:建立指标库,具体涵盖专利指标、论文指标、项目指标、新闻指标;
所述步骤13包括以下指标:
技术影响力:由专利和论文的后引数,引用者在技术集群下的排名,进行领域内归一化处理,包括专利技术影响力和论文技术影响力;
技术影响力即时性:专利和论文技术影响力的平均时间
核心节点专利技术占比:运用复杂技术网络算法,在技术集群下,指定技术的专利影响力在同技术集群下的价值占比;
步骤2:构建检索式,在步骤11所述多维科技数据库中进行数据检索;
所述步骤2包括以下子步骤:
步骤21:利用现有公开技术,对专利、论文和项目中至少一种客观大数据进行数据清洗和消歧;
步骤22:根据不同纵坐标绘制基本坐标曲线图,所述基本坐标曲线图的横坐标为时间,纵坐标为专利申请数量、专利授权数量、分区论文数量和分区项目数量、新闻中至少一种数据;
分区论文数量具体解释为:
分区论文数量主要包括SCI论文数量与EI论文数量两类。
其中,SCI论文指美国科学信息研究所(ISI)编辑出版的引文索引类刊物,全球数万种期刊中选出3300种科技期刊,涉及自然基础科学的100余个领域。EI论文指是全球范围内的一个数据库Engineering Index所收录的文献,主要包括工程技术领域的重要文献。
步骤23:根据不同纵坐标绘制参照坐标曲线图,所述基本坐标曲线图的横坐标为时间,纵坐标为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标。
步骤3:进行数据计算整理;
所述步骤3包括以下子步骤:
步骤31:利用现有公开技术,对专利、论文和项目中至少一种客观大数据进行数据清洗和消歧;利用现有公开技术,对新闻非客观大数据进行计算机情感计算,推算真实性保留可靠结果;
步骤32:绘制基本坐标曲线图,所述基本坐标曲线图的横坐标为时间,纵坐标为专利申请数量、专利授权数量、分区论文数量和分区项目数量、新闻中至少一种数据;
步骤33:绘制参照坐标曲线图,所述基本坐标曲线图的横坐标为时间,纵坐标为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标。
步骤4:进行算法回归;
所述步骤4包括以下子步骤:
步骤41:拟合曲线f1(x)=a1x+b1,其中,x为时间,f1(x)为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标,a1为相应指标的变化斜率,b1为曲线截距;
步骤42:拟合曲线f2(x)=a2x2+b2x+c,其中x为时间,f2(x)为所述技术影响力、所述技术影响力即时性和核心节点专利中至少一种指标,其中,a2为相应指标的变化斜率的增长率,b2为拟合一次项参数,c为曲线截距。
步骤43:拟合曲线的模型参照最小二乘法通用方法,即如下通用方法:
拟合曲线的残差值为:
对I求ei的偏导值,使其为0,得到:
变换得到:
求解改方程组可得到唯一解,从而确定拟合曲线f(x)。
步骤5:对应指标,如表1所示,汇总得出如下结论:
当基本坐标曲线中的纵坐标数据主体为论文数据,判定为萌芽期;
当论文技术影响力大于所述专利技术影响力,或专利技术影响力为零但所述论文技术影响力为正值;论文技术影响力曲线中的a1大于1,a2大于0,为萌芽期早期,近似于TRL1-2的基础研究或概念研究阶段,需满足下述判断条件:此时论文技术影响力大于专利技术影响力,或专利技术影响力为零但论文技术影响力为正值;此时曲线回归值论文技术影响力a1大于1,a2大于0。
萌芽期向成长期阶段,近似于TRL3-4的应用分析或实验室研究阶段,需满足下述判断条件:此时论文逐步从SCI论文向EI论文过渡,论文技术影响力仍大于专利技术影响力;此时论文技术影响力a1大于0,a2接近0或小于0,增速有所下降;论文技术影响力即时性a1小于0,a2接近0或大于0;此时专利技术影响力a1大于0,a2大于0;核心节点专利a1大于0,a2大于0。
当基本坐标曲线中的纵坐标数据主体EI论文超过SCI论文数量,且专利数据增长率趋于稳定时,判定为成长期;
此时专利技术影响力逐渐接近论文技术影响力,核心节点专利比例上升;此时论文技术影响力a1接近0;论文技术影响力即时性a1小于0,a2接近0或大于0;此时专利技术影响力a1大于0,a2接近0或小于0;专利技术影响力即时性a1小于0,a2接近0或小于0;核心节点专利a1大于0,a2逐渐接近0。
当基本坐标曲线中的纵坐标数据主体专利数据超出论文数据,判定为成熟期;
此时基本坐标曲线中的专利数据趋于平稳,工程化研究项目和新闻数据开始出现,参照曲线中的专利技术影响力超过技术论文影响力,技术影响力即时性比萌芽期下降,核心节点专利技术占比趋于稳定;此时论文技术影响力a1小于0;论文技术影响力即时性a1小于0;此时专利技术影响力a1接近或小于0,a2接近0或小于0;专利技术影响力即时性a1小于0,a2接近0或小于0;核心节点专利a1接近或小于0,a2小于0。
当新闻数据为主体时,专利与论文数据均显著下降时,判定进入衰退期;
此时论文技术影响力a1小于-1;专利技术影响力a1小于-1;核心节点专利a1小于-1。
表1
为了更好地理解本发明,以上结合本发明的具体实施例做了详细描述,但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改,均仍属于本发明技术方案的范围。本说明书中每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。