CN116894596A - 一种科技成果智能评价方法、装置及介质 - Google Patents

一种科技成果智能评价方法、装置及介质 Download PDF

Info

Publication number
CN116894596A
CN116894596A CN202310657876.2A CN202310657876A CN116894596A CN 116894596 A CN116894596 A CN 116894596A CN 202310657876 A CN202310657876 A CN 202310657876A CN 116894596 A CN116894596 A CN 116894596A
Authority
CN
China
Prior art keywords
creation
database
innovation
technological achievements
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310657876.2A
Other languages
English (en)
Inventor
陈劲
于飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202310657876.2A priority Critical patent/CN116894596A/zh
Publication of CN116894596A publication Critical patent/CN116894596A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种科技成果智能评价方法,所述方法包括:获取原始数据库,所述原始数据库中记录有各个创造主体及其科技成果;对所述原始数据库进行数据清洗,以构建精简后的参考数据库;基于所述参考数据库,采用知识图谱技术构建记录有各个所述创造主体的科技成果的关联关系的创新链图谱;获取用户输入的至少一个创造主体,并输出对应于所述至少一个创造主体的创新耦合度图谱,所述创新耦合度图谱记录有所述至少一个创造主体的科技成果的关联关系。本发明技术方案,能够以量化的方法对不同的创造主体的科技成果进行准确评价,并以图谱的形式直观地呈现出评价结果。

Description

一种科技成果智能评价方法、装置及介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种科技成果智能评价方法、装置及介质。
背景技术
随着科技对于提升经济效益的重要性日益提高,整个社会对于科技创新也越来越重视。越来越多的创造主体和科技成果逐渐呈现在大众的视角下。创造主体,例如包括企业、高等院校以及个人等。科技成果,包括科技论文、专著、模型、专利、计算机软件或集成电路布图等,其形式也越来越丰富。
在科技创新的过程中,通常需要对不同的创造主体的科技成果进行评价,例如将不同的创造主体相近领域的科技成果进行比较。现有技术,通常由人工操作,通过科技成果的相关数据库进行科技成果的筛选,再进行基于主观意识的评价。因此,现有技术的评价方法主观性比较高,不能较好地以量化的计算方法进行评价,且现有技术的评价结果不够直观,尤其是不能直观地表现出不同创造主体在各个领域创新活动的异同。
发明内容
针对上述问题,本发明的目的是提供一种科技成果智能评价方法、装置及介质,能够以量化的方法对不同的创造主体的科技成果进行准确评价,并以图谱的形式直观地呈现出评价结果。
为实现上述目的,本发明采取以下技术方案:
第一方面,本申请提供一种科技成果智能评价方法,所述方法包括:
获取原始数据库,所述原始数据库中记录有各个创造主体及其科技成果;
根据所述原始数据库,构建精简后的参考数据库;
基于所述参考数据库,采用知识图谱技术构建记录有各个所述创造主体的科技成果的关联关系的创新链图谱;
获取用户输入的至少一个创造主体,并输出对应于所述至少一个创造主体的创新耦合度图谱,所述创新耦合度图谱记录有所述至少一个创造主体的科技成果的关联关系。
在本申请的一种实现方式中,所述根据所述原始数据库,构建精简后的参考数据库,包括,包括对所述原始数据库进行数据清洗,以构建精简后的参考数据库,
具体包括:
将所述原始数据库中的创造主体进行分类,得到多个类型的创造主体的子数据库;
对每个类型的所述子数据库分别进行数据筛选,得到对应的多个子参考数据库;
将所述多个子参考数据库进行合并,得到所述参考数据库。
在本申请的一种实现方式中,所述对每个类型的所述子数据库分别进行数据筛选,包括:
根据每个类型的所述子数据库中的各创造主体的科技成果,计算各所述创造主体的创造主体相关指标;并根据所述子数据库中所有创造主体在各个技术领域中的科技成果,计算各个技术领域的领域相关指标;
根据所述创造主体相关指标,和/或所述领域相关指标,计算各个创新主体的数据筛选阈值;
根据各创造主体的科技成果,以及所述数据筛选阈值,确定各个创新主体最终入选的科技成果。
在本申请的一种实现方式中,所述科技成果具体为专利;
所述创造主体相关指标,包括原创性指标、集中度指标、多样性指标以及创新传播能力指标;
其中,以公式
计算创造主体每个专利m的原创性指标,k为技术领域序号,Ncitingmk为专利m引用技术领域k中的专利的次数,Ncitingm为专利m引用专利的总次数;
以公式
计算创造主体x在t年的专利集中度指标,设创造主体x有Sx个从属子主体,Nst是授权人s在t年提交的专利数量,为创造主体x的同类主体在t年的授权专利总数;
以公式
计算创造主体f在t年的多样性指标,Pfjt是t年创造主体f在技术领域j中申请专利的数量,Pjt是创造主体f在t年申请专利的数目;
以公式
计算创造主体f在t年的创新传播能力指标,nfft是t年创造主体f的专利引用自身专利的次数,nft是创造主体f的所有引用次数,ncft是t年创造主体f的专利被其它创造主体引用的次数,nct是t年除创造主体f之外的其它创造主体的专利引用的总次数。
在本申请的一种实现方式中,所述科技成果具体为专利;
所述领域相关指标,包括创新机会指标、创新延续性指标、创新独占性指标、技术周期指标、知识初始库存指标以及技术不确定性指标;
其中,以公式
tGmt/T。
计算每个专利m面临的创新机会指标,Gmt为每个专利m相同技术领域中授权专利的平均增长率,T为统计年限的总数;
以公式
计算每个专利m面临的创新延续性指标,Pmt为t年专利m同一技术领域中授权专利的总数,Pmjt为t年该同一技术领域中持续创新者j的授权专利数目;
以公式
计算专利m的创新独占性指标,SCmt为t年专利m的相同技术领域中授权专利的被自引次数,TCmt是t年专利m相同技术领域中授权专利的总被引用次数;
以公式
mean(TCTmt)/mean(TCTt)
计算专利m的技术周期指标,TCTmt为t年专利m相同技术领域中授权专利的平均时间差,TCTt为t年专利m相同技术领域所有授权专利的平均时间差;
以公式
计算专利m的知识初始库存指标,Pmt为t年专利m的相同技术领域中的授权专利数量,Pt为t年授权的所有专利数量;
以公式
(Maxm–Minm)/AVGm
计算专利m的技术不确定性指标,Maxm为设定统计年限期间专利m的相同技术领域中授权专利的数量的年度最大值,Minm为相应的最小值,AVGm为相应的平均值。
在本申请的一种实现方式中,所述基于所述参考数据库,采用知识图谱技术构建记录有各个所述创造主体的科技成果的关联关系的创新链图谱,包括:
对所述参考数据库进行知识抽取,提取其中的实体、属性值和关联关系信息,所述实体为各个创造主体的专利;
进行实体对齐;
基于语义搜索和两两实体之间的搜索匹配程度,构建所述创新链图谱。
在本申请的一种实现方式中,所述获取用户输入的至少一个创造主体,并输出对应于所述至少一个创造主体的创新耦合度图谱,包括:
当获取到所述用户输入两个创造主体,根据所述两个创造主体的创新耦合度图谱计算耦合度。
第二方面,本申请提供一种科技成果智能评价装置,所述装置包括:
数据库获取模块,用于获取原始数据库,所述原始数据库中记录有各个创造主体及其科技成果;
数据清洗模块,用于对所述原始数据库进行数据清洗,以构建精简后的参考数据库;
知识图谱构建模块,用于基于所述参考数据库,采用知识图谱技术构建记录有各个所述创造主体的科技成果的关联关系的创新链图谱;
分析处理模块,用于获取用户输入的至少一个创造主体,并输出对应于所述至少一个创造主体的创新耦合度图谱,所述创新耦合度图谱记录有所述至少一个创造主体的科技成果的关联关系。
第三方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述第一方面所述的科技成果智能评价方法。
第四方面,本申请提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序,实现上述第一方面所述的科技成果智能评价方法。
本发明由于采取以上技术方案,其具有以下优点:本发明申请方案中,获取原始数据库,再对原始数据库进行数据清洗,以构建精简后的参考数据库,然后再基于参考数据库,采用知识图谱技术构建记录有各个创造主体的科技成果的关联关系的创新链图谱;以及根据获取到用户输入的至少一个创造主体,并输出对应的创新耦合度图谱,从而相比于现有技术,可以对不同创造主体的科技成果进行量化评价,并且以图的形式准确呈现。
附图说明
图1是本申请实施例提供的一种科技成果智能评价方法的流程示意图;
图2示意了一创新链图谱的示意图;
图3是本申请实施例中的一种科技成果智能评价装置的模块功能示意图;
图4是本申请实施例中的一种计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
针对传统技术针对科技成果进行评价具有主观意识高、结果呈现不直观的问题。本申请相应提供一种科技成果智能评价方法、装置、计算机可读存储介质以及计算机设备。其中,所述方法包括:获取原始数据库,所述原始数据库中记录有各个创造主体及其科技成果;对所述原始数据库进行数据清洗,以构建精简后的参考数据库;基于所述参考数据库,采用知识图谱技术构建记录有各个所述创造主体的科技成果的关联关系的创新链图谱;获取用户输入的至少一个创造主体,并输出对应于所述至少一个创造主体的创新耦合度图谱,所述创新耦合度图谱记录有所述至少一个创造主体的科技成果的关联关系。本申请技术方案,可以对不同创造主体的科技成果进行量化评价,并且以图的形式准确呈现。
参见图1,在本申请实施例的一个方面中,提供了一种科技成果智能评价方法。
所述方法,包括:
S11,获取原始数据库。
所述原始数据库中记录有各个创造主体及其科技成果。
在本申请实施例中,科技成果可以有科学论文、专著、原理性模型、专利、专有技术、计算机软件、集成电路布图设计等不同形式。在现有常规技术中,不同的科技成果,有不同的数据库进行数据存储,例如专利数据库、论文数据库等等。在本申请实施例中,专利数据库具有数据半结构化、数量大、内容及时公开、发布渠道单一的优势。因此,除计算机软件、集成电路布图设计的内容呈现高度专业化之外,其他的科技成果均可以将具有相似可比的专利作为参照,进行比较和评价。因此,本申请实施例中,科技成果将以专利来举例,原始数据库在本申请实施例中将特指专利数据库。如现有技术,专利数据库可以由专利局或者不同的内容服务厂商提供,在本申请实施例中,通过数据端口与专利数据库进行对接,就可以获取到原始数据库的内容。
S12,对所述原始数据库进行数据清洗,以构建精简后的参考数据库。
具体的,可以将原始数据库中的创造主体进行分类,得到多个类型的创造主体的子数据库;再对每个类型的子数据库分别进行数据筛选,得到对应的多个子参考数据库;最后将多个子参考数据库进行合并,得到最终的参考数据库。
例如,以专利为例,创造主体(申请人)是个人、企业、高校院所,其中企业专利库往往具备较高的商业可行性,不过企业出于战略性专利布局、或者申请政策优惠(例如各地方对国家高新技术企业、国家级科技型中小企业的税收减免),而倾向于拥有多于实际需要的专利;而且不同企业的创新能力、市场地位不同,也影响到其专利的价值。所以有必要根据企业的特征进行专利筛选。同理,对个人类型、或者高效类型的专利字库,也有必要进行精简,得到相应的子数据库,最终对子数据库进行合并,得到高价值的专利参考数据库。
进一步的,在本申请实施例中,对每个类型的子数据库分别进行数据筛选,包括:
根据每个类型的所述子数据库中的各创造主体的科技成果,计算各所述创造主体的创造主体相关指标;并根据所述子数据库中所有创造主体在各个技术领域中的科技成果,计算各个技术领域的领域相关指标。
根据创造主体相关指标,和/或领域相关指标,计算各个创新主体的数据筛选阈值。
根据各创造主体的科技成果,以及数据筛选阈值,确定各个创新主体最终入选的科技成果。
下面以企业类型的专利为例,来说明子数据库的筛选。
对于企业来说,创造主体相关指标,包括原创性指标、集中度指标、多样性指标以及创新传播能力指标;
其中:
(1)原创性指标
以公式
计算创造主体每个专利m的原创性指标,k为技术领域序号,Ncitingmk为专利m引用技术领域k中的专利的次数,Ncitingm为专利m引用专利的总次数;
由计算公式可知,原创性指标的测度是指引用其他技术类别的已有专利的程度,被引用专利的范围越广则原创性越高。如果引用的专利所属的专利类别比较窄,则原创性得分将比较低,若一个专利从一个广泛的领域中引用其他专利,则其原创性得分就会比较高。
(2)(专利)集中度指标
以公式
计算创造主体x在t年的专利集中度指标,设创造主体x有Sx个从属子主体,Nst是授权人s在t年提交的专利数量,为创造主体x的同类主体在t年的授权专利总数;
(3)多样性指标
每个企业的知识库的多样性可以使用每个企业的专利申请所分布的技术领域(可以被标识为专利类别)的数量进行衡量。
以公式
计算创造主体f在t年的多样性指标,Pfjt是t年创造主体f在技术领域j中申请专利的数量,Pjt是创造主体f在t年申请专利的数目;
(4)创新传播能力指标
以公式
计算创造主体f在t年的创新传播能力指标,nfft是t年创造主体f的专利引用自身专利的次数,nft是创造主体f的所有引用次数,ncft是t年创造主体f的专利被其它创造主体引用的次数,nct是t年除创造主体f之外的其它创造主体的专利引用的总次数。
在本申请实施例中,领域相关指标,包括创新机会指标、创新延续性指标、创新独占性指标、技术周期指标、知识初始库存指标以及技术不确定性指标。
其中:
(5)创新机会指标
创新机会指标,指的是投资于某个产业的研发资金能成功促进创新的可能性。
以公式
tGmt/T。
计算每个专利m面临的创新机会指标,Gmt为每个专利m相同技术领域中授权专利的平均增长率,T为统计年限的总数。
例如,当统计年限从2010年至2020年,相应公式改写为
(6)创新延续性(累积性)指标
累积性指的是现今的技术创新对已有技术的依赖程度。一项创新会产生后续的创新,例如创造新的知识逐步改善已有创新,或是应用在相关领域的其他创新。累积性水平高说明其经济环境的特点是创新活动的连续性和报酬递增。
以公式
计算每个专利m面临的创新延续性指标,Pmt为t年专利m同一技术领域中授权专利的总数,Pmjt为t年该同一技术领域中持续创新者j的授权专利数目。持续创新者是指在该专利领域中以5年为一个移动窗口,在每个移动窗口期中都至少有一个同领域专利申请的单位或个人。
(7)创新独占性指标
创新的独占性是指防止模仿、保护创新成果、从创新活动中获取利润的可能性。高独占性是指成功地保护创新不被模仿的途径。
以公式
计算专利m的创新独占性指标,SCmt为t年专利m的相同技术领域中授权专利的被自引次数,TCmt是t年专利m相同技术领域中授权专利的总被引用次数。
(8)技术周期指标
知识的一个重要属性是会随着时间的推移而过时,但不同的知识在这方面有所不同。有些知识很快会变得过时,而有些则不会。过时的速度影响了赶超的机会。如果知识的“寿命”很长,则在这一领域掌握知识和技术需要更多的时间。知识的这一特点可以称为技术的周期时间。技术周期时间通常由索引专利与被索引专利的申请专利的时间差来测量。
以公式
mean(TCTmt)/mean(TCTt)
计算专利m的技术周期指标,TCTmt为t年专利m相同技术领域中授权专利的平均时间差,TCTt为t年专利m相同技术领域所有授权专利的平均时间差。
(9)知识初始库存指标
知识的初始库存代表企业在某一个技术类别中实行创新之前必须掌握的知识量,在使用专利数据测度这个指标时,一般可使用每个专利类别中专利的数量,除以所有类别的专利总数(发明专利、实用新型、外观设计)。
以公式
计算专利m的知识初始库存指标,Pmt为t年专利m的相同技术领域中的授权专利数量,Pt为t年授权的所有专利数量。
(10)技术不确定性指标
企业遇到的每一种技术的不确定性程度都不相同,通常与技术的年限有关。预测尚处于早期阶段的技术在未来如何演变是很困难的,其不确定性也很大。相比之下,在一个成熟的技术产业部门,企业普遍面临一个更稳定的环境。
以公式
(Maxm–Minm)/AVGm
计算专利m的技术不确定性指标,Maxm为设定统计年限期间专利m的相同技术领域中授权专利的数量的年度最大值,Minm为相应的最小值,AVGm为相应的平均值。
综上,由上述的计算公式,可以计算各个企业的指标,为这些指标赋予不同的权重,可以确定不同企业入选专利的阈值,将指标的分值在阈值之上的专利选入参考,就可以得到一个以企业为申请人主体的高价值专利子库(HVP-E)。
同理,对于高等院校为申请人主体的专利,也可以构建一个高价值专利子库(HVP-U),两者合并得到的高价值专利子库(HVP-EU)。HVP-EU可以进一步作为参考数据库。
S13,基于所述参考数据库,采用知识图谱技术构建记录有各个所述创造主体的科技成果的关联关系的创新链图谱。
具体的,知识图谱是由节点和边构成的一种语义网络,网络节点表示实体或者概念或属性,边表示他们之间的关联关系。构建知识图谱的过程与步骤如下。
首先,进行知识抽取。将人工智能分词技术和专家分词相结合,每个具有较高辨识度的分词构成一个特征分词。不同的实体特征分词属于不同的语义类,不同的实体特征分词有不同的属性和属性值,进而不同的分词之间形成不同的“关系”,关系可以用函数表示,即把节点(实体、语义类、属性值)映射到布尔值的函数。
其次,在完成知识抽取后,进行实体对齐,具体包括实体消歧和共指消解。实体消歧专门用于解决同名实体产生歧义的问题,通常采用聚类法,以判断知识库中的同名实体是否代表不同的含义。共指消解则解决知识库中是否存在其他命名实体表示相同的含义的问题。
再次,进行语义搜索。传统搜索引擎依靠网页之间的超链接实现网页的搜索,而语义搜索直接对事物进行搜索。知识图谱提供了关于事物的分类、属性和关系的描述,使得搜索引擎可以直接对事物进行索引和搜索。
最后,以高价值专利子库(HVP-EU)为基础库,根据两两专利之间的搜索匹配程度,构建创新链图谱。
图2示意了一个企业A的创新链图谱的示意,图中每一个节点为一个专利。
S14,获取用户输入的至少一个创造主体,并输出对应于所述至少一个创造主体的创新耦合度图谱,所述创新耦合度图谱记录有所述至少一个创造主体的科技成果的关联关系。
将每一个企业的所有专利看做一个集合(即一个专利池),则两个企业之间的专利池可形成一个新的创新链图谱,亦称专利池耦合度图谱。从直观上理解,耦合度度量了两个专利池之间所有的边所形成包络线的围聚体积与企业A的包络线围聚体积之比。
上述本申请实施例提供的方法,获取原始数据库,再对原始数据库进行数据清洗,以构建精简后的参考数据库,然后再基于参考数据库,采用知识图谱技术构建记录有各个创造主体的科技成果的关联关系的创新链图谱;以及根据获取到用户输入的至少一个创造主体,并输出对应的创新耦合度图谱,从而相比于现有技术,可以对不同创造主体的科技成果进行量化评价,并且以图的形式准确呈现。
在本申请实施例中的另一方面,还提供一种科技成果智能评价装置。该装置可以以硬件或软件的方式实现于计算机设备中。
如图3所示,在本申请的实施例提供了一种科技成果智能评价装置400,该装置包括:
数据库获取模块401,用于获取原始数据库,所述原始数据库中记录有各个创造主体及其科技成果;
数据清洗模块402,用于对所述原始数据库进行数据清洗,以构建精简后的参考数据库;
知识图谱构建模块403,用于基于所述参考数据库,采用知识图谱技术构建记录有各个所述创造主体的科技成果的关联关系的创新链图谱;
分析处理模块404,用于获取用户输入的至少一个创造主体,并输出对应于所述至少一个创造主体的创新耦合度图谱,所述创新耦合度图谱记录有所述至少一个创造主体的科技成果的关联关系。
上述实施例提供的装置,获取原始数据库,再对原始数据库进行数据清洗,以构建精简后的参考数据库,然后再基于参考数据库,采用知识图谱技术构建记录有各个创造主体的科技成果的关联关系的创新链图谱;以及根据获取到用户输入的至少一个创造主体,并输出对应的创新耦合度图谱,从而相比于现有技术,可以对不同创造主体的科技成果进行量化评价,并且以图的形式准确呈现。
上述装置可以以硬件或软件的方式实现于计算机设备中,从而供计算机设备实现本申请实施例中的科技成果智能评价方法,所述方法的具体可以参照前述实施例的描述,在此不再重复赘述。
在本申请实施例中,还相应提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,在计算机设备执行该计算机程序时,实现本申请实施例中的科技成果智能评价方法。
其中,所实现的科技成果智能评价方法,其流程步骤包括:
获取原始数据库,所述原始数据库中记录有各个创造主体及其科技成果;
对所述原始数据库进行数据清洗,以构建精简后的参考数据库;
基于所述参考数据库,采用知识图谱技术构建记录有各个所述创造主体的科技成果的关联关系的创新链图谱;
获取用户输入的至少一个创造主体,并输出对应于所述至少一个创造主体的创新耦合度图谱,所述创新耦合度图谱记录有所述至少一个创造主体的科技成果的关联关系。
参照图4提供的一种计算机设备600。该实施例的计算机设备600包括:处理器601、存储器602以及存储在存储器中并可在处理器601上运行的计算机程序603,处理器601执行计算机程序603时实现实施例中的科技成果智能评价方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器601执行时实现实施例中科技成果智能评价装置中各模型中/单元的功能,为避免重复,此处不一一赘述。
计算机设备可包括,但不仅限于,处理器601、存储器602。本领域技术人员可以理解,图4仅仅是计算机设备600的示例,并不构成对计算机设备600的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器601可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器602可以是计算机设备600的内部存储单元,例如计算机设备600的硬盘或内存。存储器602也可以是计算机设备600的外部存储设备,例如计算机设备600上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器602还可以既包括计算机设备600的内部存储单元也包括外部存储设备。存储器602用于存储计算机程序以及计算机设备所需的其他程序和数据。存储器602还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例上述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上表述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种科技成果智能评价方法,其特征在于,所述方法包括:
获取原始数据库,所述原始数据库中记录有各个创造主体及其科技成果;
根据所述原始数据库,构建精简后的参考数据库;
基于所述参考数据库,采用知识图谱技术构建记录有各个所述创造主体的科技成果的关联关系的创新链图谱;
获取用户输入的至少一个创造主体,并输出对应于所述至少一个创造主体的创新耦合度图谱,所述创新耦合度图谱记录有所述至少一个创造主体的科技成果的关联关系。
2.根据权利要求1所述的科技成果智能评价方法,其特征在于,所述根据所述原始数据库,构建精简后的参考数据库,包括:
对所述原始数据库进行数据清洗,以构建精简后的参考数据库,
具体包括:
将所述原始数据库中的创造主体进行分类,得到多个类型的创造主体的子数据库;
对每个类型的所述子数据库分别进行数据筛选,得到对应的多个子参考数据库;
将所述多个子参考数据库进行合并,得到所述参考数据库。
3.根据权利要求2所述的科技成果智能评价方法,其特征在于,所述对每个类型的所述子数据库分别进行数据筛选,包括:
根据每个类型的所述子数据库中的各创造主体的科技成果,计算各所述创造主体的创造主体相关指标;并根据所述子数据库中所有创造主体在各个技术领域中的科技成果,计算各个技术领域的领域相关指标;
根据所述创造主体相关指标,和/或所述领域相关指标,计算各个创新主体的数据筛选阈值;
根据各创造主体的科技成果,以及所述数据筛选阈值,确定各个创新主体最终入选的科技成果。
4.根据权利要求3所述的科技成果智能评价方法,其特征在于,所述科技成果具体为专利;
所述创造主体相关指标,包括原创性指标、集中度指标、多样性指标以及创新传播能力指标;
其中,以公式
计算创造主体每个专利m的原创性指标,k为技术领域序号,Ncitingmk为专利m引用技术领域k中的专利的次数,Ncitingm为专利m引用专利的总次数;
以公式
计算创造主体x在t年的专利集中度指标,设创造主体x有Sx个从属子主体,Nst是授权人s在t年提交的专利数量,为创造主体x的同类主体在t年的授权专利总数;
以公式
计算创造主体f在t年的多样性指标,Pfjt是t年创造主体f在技术领域j中申请专利的数量,Pjt是创造主体f在t年申请专利的数目;
以公式
计算创造主体f在t年的创新传播能力指标,nfft是t年创造主体f的专利引用自身专利的次数,nft是创造主体f的所有引用次数,ncft是t年创造主体f的专利被其它创造主体引用的次数,nct是t年除创造主体f之外的其它创造主体的专利引用的总次数。
5.根据权利要求3所述的科技成果智能评价方法,其特征在于,所述科技成果具体为专利;
所述领域相关指标,包括创新机会指标、创新延续性指标、创新独占性指标、技术周期指标、知识初始库存指标以及技术不确定性指标;
其中,以公式
计算每个专利m面临的创新机会指标,Gmt为每个专利m相同技术领域中授权专利的平均增长率,T为统计年限的总数;
以公式
计算每个专利m面临的创新延续性指标,Pmt为t年专利m同一技术领域中授权专利的总数,Pmjt为t年该同一技术领域中持续创新者j的授权专利数目;
以公式
计算专利m的创新独占性指标,SCmt为t年专利m的相同技术领域中授权专利的被自引次数,TCmt是t年专利m相同技术领域中授权专利的总被引用次数;
以公式
mean(TCTmt)/mean(TCTt)
计算专利m的技术周期指标,TCTmt为t年专利m相同技术领域中授权专利的平均时间差,TCTt为t年专利m相同技术领域所有授权专利的平均时间差;
以公式
计算专利m的知识初始库存指标,Pmt为t年专利m的相同技术领域中的授权专利数量,Pt为t年授权的所有专利数量;
以公式
(Maxm–Minm)/AVGm
计算专利m的技术不确定性指标,Maxm为设定统计年限期间专利m的相同技术领域中授权专利的数量的年度最大值,Minm为相应的最小值,AVGm为相应的平均值。
6.根据权利要求5所述的科技成果智能评价方法,其特征在于,所述基于所述参考数据库,采用知识图谱技术构建记录有各个所述创造主体的科技成果的关联关系的创新链图谱,包括:
对所述参考数据库进行知识抽取,提取其中的实体、属性值和关联关系信息,所述实体为各个创造主体的专利;
进行实体对齐;
基于语义搜索和两两实体之间的搜索匹配程度,构建所述创新链图谱。
7.根据权利要求6所述的科技成果智能评价方法,其特征在于,所述获取用户输入的至少一个创造主体,并输出对应于所述至少一个创造主体的创新耦合度图谱,包括:
当获取到所述用户输入两个创造主体,根据所述两个创造主体的创新耦合度图谱计算耦合度。
8.一种科技成果智能评价装置,其特征在于,所述装置包括:
数据库获取模块,用于获取原始数据库,所述原始数据库中记录有各个创造主体及其科技成果;
数据清洗模块,用于对所述原始数据库进行数据清洗,以构建精简后的参考数据库;
知识图谱构建模块,用于基于所述参考数据库,采用知识图谱技术构建记录有各个所述创造主体的科技成果的关联关系的创新链图谱;
分析处理模块,用于获取用户输入的至少一个创造主体,并输出对应于所述至少一个创造主体的创新耦合度图谱,所述创新耦合度图谱记录有所述至少一个创造主体的科技成果的关联关系。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7任一项所述的科技成果智能评价方法。
10.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序,实现权利要求1至7任一项所述的科技成果智能评价方法。
CN202310657876.2A 2023-06-05 2023-06-05 一种科技成果智能评价方法、装置及介质 Pending CN116894596A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310657876.2A CN116894596A (zh) 2023-06-05 2023-06-05 一种科技成果智能评价方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310657876.2A CN116894596A (zh) 2023-06-05 2023-06-05 一种科技成果智能评价方法、装置及介质

Publications (1)

Publication Number Publication Date
CN116894596A true CN116894596A (zh) 2023-10-17

Family

ID=88314052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310657876.2A Pending CN116894596A (zh) 2023-06-05 2023-06-05 一种科技成果智能评价方法、装置及介质

Country Status (1)

Country Link
CN (1) CN116894596A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189942A (zh) * 2018-09-12 2019-01-11 山东大学 一种专利数据知识图谱的构建方法及装置
US20200151176A1 (en) * 2018-11-11 2020-05-14 Jeffery Lamonde Carter Cyber metric information method and system
CN113761208A (zh) * 2021-09-17 2021-12-07 福州数据技术研究院有限公司 一种基于知识图谱的科技创新资讯分类方法和存储设备
CN115186982A (zh) * 2022-06-01 2022-10-14 湘潭大学 一种专利价值的早期评估方法
CN115545411A (zh) * 2022-09-13 2022-12-30 国网山东省电力公司潍坊供电公司 基于人工智能的双创成果与专利运营的价值关联评估方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189942A (zh) * 2018-09-12 2019-01-11 山东大学 一种专利数据知识图谱的构建方法及装置
US20200151176A1 (en) * 2018-11-11 2020-05-14 Jeffery Lamonde Carter Cyber metric information method and system
CN113761208A (zh) * 2021-09-17 2021-12-07 福州数据技术研究院有限公司 一种基于知识图谱的科技创新资讯分类方法和存储设备
CN115186982A (zh) * 2022-06-01 2022-10-14 湘潭大学 一种专利价值的早期评估方法
CN115545411A (zh) * 2022-09-13 2022-12-30 国网山东省电力公司潍坊供电公司 基于人工智能的双创成果与专利运营的价值关联评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
任海英;王倩;: "技术机会发现方法的研究现状、趋势和问题", 情报杂志, no. 04, pages 55 - 63 *
陈劲等: "《科技成果智能化与标准化评价规范》", 6 March 2023, 中国管理科学学会发布 , pages: 1 - 42 *

Similar Documents

Publication Publication Date Title
US9489627B2 (en) Hybrid clustering for data analytics
CN111581479B (zh) 一站式数据处理的方法、装置、存储介质及电子设备
CN109740642A (zh) 发票类别识别方法、装置、电子设备及可读存储介质
CN110727857A (zh) 针对业务对象识别潜在用户的关键特征的方法及装置
Zhang et al. Reputationpro: The efficient approaches to contextual transaction trust computation in e-commerce environments
CN109740129A (zh) 基于区块链的报表生成方法、装置、设备及可读存储介质
CN111310032A (zh) 资源推荐方法、装置、计算机设备及可读存储介质
CN115374781A (zh) 文本数据信息挖掘方法、装置、设备
CN112102006A (zh) 基于大数据分析的目标客户获取方法、搜索方法及装置
CN114118816A (zh) 一种风险评估方法、装置、设备及计算机存储介质
CN109213793A (zh) 一种流式数据处理方法和系统
CN116933130A (zh) 一种基于大数据的企业行业分类方法、系统、设备及介质
CN110059749B (zh) 重要特征的筛选方法、装置及电子设备
US11461337B2 (en) Attribute annotation for relevance to investigative query response
US20210319036A1 (en) Method and System For Retrieving and Displaying Data From an Entity Network Database
CN116894596A (zh) 一种科技成果智能评价方法、装置及介质
CN115827994A (zh) 一种数据处理方法、装置、设备、存储介质
CN113570464B (zh) 一种数字货币交易社区识别方法、系统、设备及存储介质
US7756854B2 (en) Minimization of calculation retrieval in a multidimensional database
CN114117052A (zh) 一种业务数据报表的分类方法及装置
CN113988878A (zh) 一种基于图数据库技术的反欺诈方法及系统
CN108985811A (zh) 用于精准营销的方法、装置及电子设备
CN112632284A (zh) 用于未标注文本数据集的信息抽取方法及系统
CN116226297B (zh) 数据模型的可视化搜索方法、系统、设备及存储介质
CN108537654A (zh) 客户关系网络图的渲染方法、装置、终端设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination