CN108255796A - 一种表征科技专家成果能力的科技词条抽取方法 - Google Patents
一种表征科技专家成果能力的科技词条抽取方法 Download PDFInfo
- Publication number
- CN108255796A CN108255796A CN201810022753.0A CN201810022753A CN108255796A CN 108255796 A CN108255796 A CN 108255796A CN 201810022753 A CN201810022753 A CN 201810022753A CN 108255796 A CN108255796 A CN 108255796A
- Authority
- CN
- China
- Prior art keywords
- scientific
- entry
- achievement
- technological
- expert
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000005516 engineering process Methods 0.000 claims abstract description 31
- 238000011160 research Methods 0.000 claims abstract description 30
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000011156 evaluation Methods 0.000 claims description 17
- 238000010586 diagram Methods 0.000 claims description 15
- 238000002372 labelling Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 9
- FESBVLZDDCQLFY-UHFFFAOYSA-N sete Chemical compound [Te]=[Se] FESBVLZDDCQLFY-UHFFFAOYSA-N 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种表征科技专家成果能力的科技词条抽取方法,首先对科技成果进行量化计算和科技词条计算,得到每项成果包含的科技词条和评分分布;然后统计所有科技词条上的成果得分,产生带标注的科技词条树图,其中顶点权值为词条上的成果分,边的权值为组合系数(后继顶点权值与前驱顶点权值的比值);最后根据专家成果及成果包含的科技词条,计算专家成果直接包含的科技词条列表;利用科技词条树图中词条之间的关联关系扩展专家科技词条列表;利用科技词条树图的组合系数计算专家在扩展后词条上的成果评分,并计算贡献系数(专家成果分占科技词条上总成果分的比值);挑选出贡献系数最高的k个科技词条表征专家主要研究范畴及成果能力。
Description
技术领域
本发明涉及信息技术领域,具体涉及一种表征科技专家成果能力的科技词条抽取方法。
背景技术
科技专家在我国科技项目评审、咨询等活动中担任着非常重要的角色,完善科技专家评价是推动国家科技事业持续健康发展,促进科技资源优化配置,提高科技管理水平的重要手段和保障。目前科技专家评价主要考虑职称、成果数量、荣誉称号等因素。这种评价方法的主要缺点是以点概面,容易放大科技专家熟悉的领域,也分不清专家具体熟悉哪些划分比较精细的研究领域,使建立在专家评价机制之上的科技服务难以高质量完成,如目前很多专家遴选系统多采用学科或技术领域挑选专家,往往造成所挑选的专家对项目所涉及的理论或技术有一定了解,但并不擅长,而真正擅长项目所涉及的理论和关键技术的专家无法被挑出。
产生上述问题的主要原因是科技专家评价时没有对科技活动中理论和技术的研究范畴进行细分,界定研究范畴之间的关系,并在研究范畴的层面分析专家的成果,从而评价专家在各研究范畴的科技能力。基于此,发明人提出了科技词条这个规范化词语对科技活动的研究范畴进行分类和管理。科技词条提供一种比学科、技术领域等分类更为精确,更能真实反映科技工作中理论和技术研究范畴的分类方法和管理模式,由科技人员主导完成词条的管理。在范畴划分中,若科技词条te1研究范畴是由科技词条te2的研究范畴细化而来,称te2强包含te1,记为te2→te1;若科技词条te1的研究范畴与科技词条te2的研究范畴存在交集,或te1的研究范畴在某种程度上也属于te2的研究范畴,称te2弱包含te1,记为包含关系是传递的。若以科技词条为顶点,词条间的强包含和弱包含关系表示为有向边,则所有科技词条构成有向无环树图。给定科技词条te,所有te传递包含或传递包含te的词条都是te的关联词,反映研究范畴的相关性,可作为项目-科技人员匹配时领域方向一致性程度的判据。如某项研究对应到科技词条树图中是出度为零的顶点,说明该研究范畴是一个划分比较精确的研究分支,熟悉该词条的科技人员专家遴选时候的首选,熟悉词条的关联词的科技人员可以作为专家遴选时的备选者,而其他人员则不能成为候选者。就科技人员的研究范畴而言,在其研究生涯中随着研究的展开,研究范畴将越来越细化和宽泛,可能包含上百个科技词条。然而,在某一个时间段内,研究人员的研究主题应该比较集中,如何发现其主要成果领域和成果能力最突出的研究是正确对专家进行评价的基础。
发明内容
本发明的目的是针对现有技术的不足,基于科技词条模型,分析专家科技成果,提出了一种表征科技专家成果能力的科技词条抽取方法,给出专家在指定自然年成果集中的k个科技词条及其评分,客观反映专家在各种粒度研究范畴上的成果能力,将能够有效推动科技专家遴选、科技咨询、科技前沿分析等科技服务活动的开展,提高科技大数据分析水平。
本发明的目的可以通过如下技术方案实现:
一种表征科技专家成果能力的科技词条抽取方法,所述方法包括以下步骤:
步骤S1、科技成果量化计算;
步骤S2、科技成果词条计算;
步骤S3、科技词条树图标注;
步骤S4、专家成果评价科技词条子图标注。
进一步地,步骤S1中,科技成果量化计算是计算所有科技成果中与成果人无关的评分,评分结果以数值表示。
进一步地,步骤S2中,科技成果词条计算是计算科技成果中能表征科技成果涉及范畴的科技词条及其权重。
进一步地,步骤S3通过计算科技词条树图顶点的权值和有向边的权值,其中所述顶点的权值为顶点上成果分之和,所述有向边的权值表示后继顶点成果分在前驱顶点上的比例,即组合系数,最终产生带标注的科技词条树图,具体步骤为:
步骤S301、计算到指定自然年截止的科技词条树图,科技词条有一个表示词条首次出现的时间,本步骤剔除词条库在指定自然年后出现的科技词条;
步骤S302、计算到指定自然年截止的科技成果评分并将其分配到所属词条:设到指定自然年截止的科技词条集为TE,成果集为F,f的成果评分为Score(f),成果f经计算出的词条集为Te(f),每个科技词条的权重为ωl(1≦l≦|Te(f)|),成果f在词条te上的成果评分为:
Sf-te=Score(f)×ωl×t
其中,t表示成果的时态系数,是一个以成果时间跨度,即“指定自然年-成果获得年”为自变量的函数,反映成果随时间的流逝价值总体衰减的特点,也能够设置为常数,认为成果不贬值;词条te上的成果自有评分为:
步骤S303、科技词条成果得分计算,计算树图中每个顶点的成果分之和:对任意顶点,其成果分包括自有评分、强包含顶点的成果分和弱包含顶点的成果分:
其中,出度为零的顶点,成果分只包含自有评分;
步骤S304、计算树图中每条有向边的组合系数:对每一个词条te,设a是其后继顶点,其中te→a或αte-a表示词条te和a之间的组合系数:
αte-a=SEa/SEte。
进一步地,步骤S4通过计算专家在指定自然年前的成果Top k科技词条表,筛选出专家成果所在的具体研究范畴,生成专家成果评价科技词条子图,具体过程如下:
步骤S401、专家成果评分词条分布计算:计算专家每项成果中各词条上的评分,设专家e在指定自然年前的成果集为Fe,成果包含的词条集为T,对应子图为专家科技词条子图G,专家在成果f中的排名系数为其中,Ef为成果f的成果人集合,则专家e的成果f在词条te(te∈T)上的评分为:
步骤S402、专家成果词条得分计算:计算专家词条集合T中各词条的汇总分:
步骤S403、扩展的专家科技词条集计算:按照科技词条间的关联关系,计算与T中词条存在关联关系的词条集合,称为扩展的专家科技词条集,记为T',对应图为扩展专家科技词条子图G',图中顶点权值为专家在该词条上的成果分,计算包括以下子步骤:
步骤S4031、正向遍历TG:T″=T,若TG中存在te→a或且则:
T″=T″∪{a},Se-a=Se-a+Se-te×αte-a
步骤S4032、逆向遍历TG:令T'=T,若TG中存在a→te或则:
T′=T′∪{a},Se-a=Se-a+Se-te
步骤S4033、令T′=T′∪T″,并构造对应的扩展专家科技词条子图G';
步骤S404、专家词条贡献计算:计算专家在扩展科技词条中各词条上的贡献系数βe-te,并将计算结果作为顶点权值标注到扩展专家科技词条子图,形成带标注的扩展专家科技词条子图,其中:
βe-te=Se-te/SEte
步骤S405、Top k科技词条筛选,对贡献系数βe-te降序排序,取前k个词条构成专家Top k科技词条列表,生成以贡献系数为顶点权值的专家成果能力评价科技词条图。
本发明与现有技术相比,具有如下优点和有益效果:
本发明提出的表征科技专家成果能力的科技词条抽取方法,利用带标注的科技词条树图反映科技成果在科技词条上的聚集能力及对比,专家成果能力评价科技词条图标注了专家成果在具体词条上的得分和占比,其计算过程除参考成果内在评价分外,还综合了专家排名、成果时态和成果所包含的科技词条及权值等因素,因此更能客观反映专家成果所在的主要研究范畴及成果能力,解决了以往专家成果评价以点概面,无法了解专家具体专长的缺点,将有效推动科技专家遴选、科技咨询、科技前沿分析等科技服务活动的开展,提高科技大数据分析水平。
附图说明
图1为本发明实施例一种表征科技专家成果能力的科技词条抽取方法流程图。
图2为本发明实施例标注前的科技词条树图。
图3为本发明实施例标注后的科技词条树图。
图4为本发明实施例中某专家的科技词条子图。
图5为本发明实施例中带标注的扩展专家科技词条子图。
图6为本发明实施例中专家成果能力评价科技词条图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例:
本实施例提供了一种表征科技专家成果能力的科技词条抽取方法,所述方法的流程图如图1所示,包括四个步骤:
步骤01,科技成果量化计算:设指定自然年前科技成果集合为F,按照科技成果评价的指标体系和评价模型计算F中所有科技成果与成果人无关的评价分,本实施例不限定所使用的指标体系和评价模型,给定成果f,成果评分结果记为Score(f);
步骤02,科技成果词条计算:利用科技成果词条计算方法,抽取成果包含的科技词条,并计算对应科技词条的权重,给定成果f,用Te(f)表示成果f经计算出的词条集,每个科技词条的权重为ωl(1≦l≦|Te(f)|);
步骤03,科技词条树图标注:计算科技词条树图前驱顶点和后继顶点间边的组合系数,标注前后的科技词条树图分别如图2和图3所示,标注过程分4个子步骤:
子步骤031,科技词条树图初始化:根据输入的自然年,剔除科技词条库中指定自然年后产生的词条,设剩余的科技词条集为TE,对应树图为TG,如图2所示;
子步骤032,成果评分词条分配:根据成果时间数、步骤02计算出的科技词条列表及权重,将成果评分按权重分配到各科技词条上,得到各科技词条的自有评分,设f的成果评分为Score(f),成果f在词条te上的成果评分为:
Sf-te=Score(f)×ωl×t
所述子步骤032中t表示成果的时态系数,是一个以成果时间跨度(指定自然年-成果获得年)为自变量的函数,也可设置为常数,如采用:
所述Ct,a,b,δ均为正常数,x表示到从获得成果到指定自然年的时间跨度,上式表达出时间系数t是随着科技成果获得的时间越长,值越小的先凸后凹、单调递减;
所述子步骤032计算出成果集F中所有成果在词条te上的自有评分为:
子步骤033,科技词条成果得分计算:从科技词条末端顶点的前驱顶点开始,按照科技词条的成果分由自有评分、强包含顶点的成果分和弱包含顶点的成果分组成的特点,计算科技词条上的最终成果分,词条te上的最终科技成果评分为:
子步骤034,树图组合系数计算:根据科技词条上的成果评分,遍历树图,计算树图中各边的权值(前驱顶点和后继顶点间的组合系数),对词条te,设a是其后继顶点(te→a或),αte-a表示词条te和a之间的组合系数:
αte-a=SEa/SEte
步骤04,专家成果能力评价科技词条图标注:对指定自然年前的专家成果,根据专家成果的评分及专家在成果中的排名,分析出专家熟悉领域的科技词条,并筛选出最能代表专家成果能力的前k个科技词条,包含以下子步骤:
子步骤041,专家成果评分词条分布计算:根据专家在成果中排名,结合成果在词条上的评分,计算专家成果各词条上的得分,设专家e在成果f中的排名系数为(Ef为成果f的成果人集合),则专家e的成果f在词条te(te∈T)上的评分为:
所述专家排名系数采用如下计算方法:
其中i表示专家e在成果中的排位,n表示成果人总数。
子步骤042,专家成果词条得分计算:根据专家成果列表和成果科技词条列表,得到专家熟悉的科技词条,汇总各词条上专家取得的成果分:
子步骤043,扩展专家科技词条计算:利用科技词条树图之间的关联关系,将专家熟悉的科技词条列表进行扩展,给定科技词条,扩展分逆向(从后继顶点到前驱)和正向(从前驱到后继),设扩展前专家科技词条集为T,扩展后为T';
子步骤0431,正向扩展:令T″=T,若TG中存在te→a或且将a加入到T″,同时将则专家在词条te上的成果分乘以te和a之间的组合系数后加到a上,即:
T″=T″∪{a},Se-a=Se-a+Se-te×αte-a
子步骤0432,逆向扩展:令T'=T,若TG中存在a→te或将a加入到T',同时将专家在词条te上的成果评分加到a上的成果评分,即:
T′=T′∪{a},Se-a=Se-a+Se-te
子步骤0433:将正向扩展和逆向扩展的结果合并,产生扩展专家科技词条子图G',即T′=T′∪T″;
子步骤044,专家词条贡献系数计算:计算扩展专家科技词条子图中专家在词条上的成果与科技词条树图中对应词条成果分的比值,并将该比值作为权值标识到扩展专家科技词条子图,形成带标注的扩展专家科技词条子图,即:
βe-te=Se-te/SEte
子步骤045,Top k科技词条筛选:对贡献系数βe-te降序排序,取前k个词条构成专家Top k科技词条列表,生成以贡献系数为顶点权值的专家成果能力评价科技词条图。
所示图2和图3为标注前后的科技词条树图,为便于标识,每项科技词条均设置一个可唯一标识的编码ID,图中每个顶点表示一条科技词条及其同义词,对每个词条仅列出其词条编码,词条间的强包含关系用I型有向边表示,弱包含关系用II型有向边表示;
所述科技词条关联了科技成果和科技成果人,图2中用虚线表示科技词条关联到的科技成果或成果人,如成果人B涉及的科技词条有ID14、ID12、ID10和ID11,其主要成果集中在ID14的研究(成果分639),专利C主要属于ID12的研究范畴(63%),同时涉及ID8(37%);
图3中所述带标注的科技词条树图为每个顶点标注了成果分的权值,为每条边分配了称为组合系数的权值。图中,各顶点的权值是所有涉及该词条的科技成果步骤032计算出的结果,边的权值为步骤033计算出的结果。如ID12为综合多个研究范畴的研究,其成果占ID9的0.783,占ID6的0.543,占ID10的0.487,反映出ID12是ID9的主要子范畴。
图3中成果人B的科技词条图如图4,该成果人主要涉及ID14、ID12、ID10和ID11四个词条。
图5为带标注的扩展专家科技词条子图,矩形框中斜杠后数字表示经扩展后专家在该词条上的成果分,矩形框下侧为专家在该词条上的贡献系数(千分数,取3位小数点),如专家在ID13上的成果分和贡献分分别为Se-ID13=Se-ID12*αID12-ID13=327*0.147=48,βe-ID13=Se-ID13/SEID13=48/34522=1.39E-3。
对图5中专家的贡献逆序排序,所得结果为ID14/4.497E-3,ID12/4.113E-3,ID9/3.221E-3,ID10/2.901E-3,ID6/2.234E-3,ID4/1.855E-3,ID1/1.62E-3,ID13/1.39E-3,ID7/1.306E-3,ID2/1.3E-3,ID3/0.0992E-3,ID16/0.148E-3,ID11/0.147E-3,ID15/0.142E-3,若取k=5,则成果人B的科技成果能力评价科技词条图如图6所示,反映出词条ID14、ID12、ID9、ID10和ID6是成果人B的代表性研究范畴。
由上述可见,本发明的一种表征科技专家成果能力的科技词条抽取方法,在对专家成果进行评价和科技词条计算基础上,根据科技词条范畴划分的特点,抽取出专家在指定自然年成果能力最强的前k个科技词条及其在该词条上的贡献比。单一专家层面,top k词条反映了专家在指定自然年成果能力最强的研究范畴,多专家层面,贡献比可反映各专家在该研究范畴的成果综合排名情况,解决了当前专家评价以点概面,专家专长不清的确定,对专家遴选等需要考察专家成果能力的应用具有非常重要意义。
以上所述,仅为本发明专利较佳的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明专利所公开的范围内,根据本发明专利的技术方案及其发明专利构思加以等同替换或改变,都属于本发明专利的保护范围。
Claims (5)
1.一种表征科技专家成果能力的科技词条抽取方法,其特征在于,所述方法包括以下步骤:
步骤S1、科技成果量化计算;
步骤S2、科技成果词条计算;
步骤S3、科技词条树图标注;
步骤S4、专家成果评价科技词条子图标注。
2.根据权利要求1所述的一种表征科技专家成果能力的科技词条抽取方法,其特征在于:步骤S1中,科技成果量化计算是计算所有科技成果中与成果人无关的评分,评分结果以数值表示。
3.根据权利要求1所述的一种表征科技专家成果能力的科技词条抽取方法,其特征在于:步骤S2中,科技成果词条计算是计算科技成果中能表征科技成果涉及范畴的科技词条及其权重。
4.根据权利要求1所述的一种表征科技专家成果能力的科技词条抽取方法,其特征在于,步骤S3通过计算科技词条树图顶点的权值和有向边的权值,其中所述顶点的权值为顶点上成果分之和,所述有向边的权值表示后继顶点成果分在前驱顶点上的比例,即组合系数,最终产生带标注的科技词条树图,具体步骤为:
步骤S301、计算到指定自然年截止的科技词条树图,科技词条有一个表示词条首次出现的时间,本步骤剔除词条库在指定自然年后出现的科技词条;
步骤S302、计算到指定自然年截止的科技成果评分并将其分配到所属词条:设到指定自然年截止的科技词条集为TE,成果集为F,f的成果评分为Score(f),成果f经计算出的词条集为Te(f),每个科技词条的权重为ωl(1≦l≦|Te(f)|),成果f在词条te上的成果评分为:
Sf-te=Score(f)×ωl×t
其中,t表示成果的时态系数,是一个以成果时间跨度,即“指定自然年-成果获得年”为自变量的函数,反映成果随时间的流逝价值总体衰减的特点,也能够设置为常数,认为成果不贬值;词条te上的成果自有评分为:
步骤S303、科技词条成果得分计算,计算树图中每个顶点的成果分之和:对任意顶点,其成果分包括自有评分、强包含顶点的成果分和弱包含顶点的成果分:
其中,出度为零的顶点,成果分只包含自有评分;
步骤S304、计算树图中每条有向边的组合系数:对每一个词条te,设a是其后继顶点,其中te→a或αte-a表示词条te和a之间的组合系数:
αte-a=SEa/SEte。
5.根据权利要求1所述的一种表征科技专家成果能力的科技词条抽取方法,其特征在于,步骤S4通过计算专家在指定自然年前的成果Top k科技词条表,筛选出专家成果所在的具体研究范畴,生成专家成果评价科技词条子图,具体过程如下:
步骤S401、专家成果评分词条分布计算:计算专家每项成果中各词条上的评分,设专家e在指定自然年前的成果集为Fe,成果包含的词条集为T,对应子图为专家科技词条子图G,专家在成果f中的排名系数为其中,Ef为成果f的成果人集合,则专家e的成果f在词条te(te∈T)上的评分为:
步骤S402、专家成果词条得分计算:计算专家词条集合T中各词条的汇总分:
步骤S403、扩展的专家科技词条集计算:按照科技词条间的关联关系,计算与T中词条存在关联关系的词条集合,称为扩展的专家科技词条集,记为T',对应图为扩展专家科技词条子图G',图中顶点权值为专家在该词条上的成果分,计算包括以下子步骤:
步骤S4031、正向遍历TG:T″=T,若TG中存在te→a或且则:
T″=T″∪{a},Se-a=Se-a+Se-te×αte-a
步骤S4032、逆向遍历TG:令T'=T,若TG中存在a→te或则:
T′=T′∪{a},Se-a=Se-a+Se-te
步骤S4033、令T′=T′∪T″,并构造对应的扩展专家科技词条子图G';
步骤S404、专家词条贡献计算:计算专家在扩展科技词条中各词条上的贡献系数βe-te,并将计算结果作为顶点权值标注到扩展专家科技词条子图,形成带标注的扩展专家科技词条子图,其中:
βe-te=Se-te/SEte
步骤S405、Top k科技词条筛选,对贡献系数βe-te降序排序,取前k个词条构成专家Top k科技词条列表,生成以贡献系数为顶点权值的专家成果能力评价科技词条图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810022753.0A CN108255796A (zh) | 2018-01-10 | 2018-01-10 | 一种表征科技专家成果能力的科技词条抽取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810022753.0A CN108255796A (zh) | 2018-01-10 | 2018-01-10 | 一种表征科技专家成果能力的科技词条抽取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108255796A true CN108255796A (zh) | 2018-07-06 |
Family
ID=62724803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810022753.0A Pending CN108255796A (zh) | 2018-01-10 | 2018-01-10 | 一种表征科技专家成果能力的科技词条抽取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108255796A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543001A (zh) * | 2018-10-18 | 2019-03-29 | 华南理工大学 | 一种表征科研论文研究内容的科技词条抽取方法 |
CN109992642A (zh) * | 2019-03-29 | 2019-07-09 | 华南理工大学 | 一种基于科技词条的单任务专家自动遴选方法及系统 |
WO2022120975A1 (zh) * | 2020-12-10 | 2022-06-16 | 中国科学院深圳先进技术研究院 | 文献搜索方法、装置及电子设备 |
-
2018
- 2018-01-10 CN CN201810022753.0A patent/CN108255796A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543001A (zh) * | 2018-10-18 | 2019-03-29 | 华南理工大学 | 一种表征科研论文研究内容的科技词条抽取方法 |
CN109992642A (zh) * | 2019-03-29 | 2019-07-09 | 华南理工大学 | 一种基于科技词条的单任务专家自动遴选方法及系统 |
CN109992642B (zh) * | 2019-03-29 | 2022-11-18 | 华南理工大学 | 一种基于科技词条的单任务专家自动遴选方法及系统 |
WO2022120975A1 (zh) * | 2020-12-10 | 2022-06-16 | 中国科学院深圳先进技术研究院 | 文献搜索方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108255796A (zh) | 一种表征科技专家成果能力的科技词条抽取方法 | |
JP6467264B2 (ja) | 計画作成支援装置および計画作成支援方法 | |
CN108389069A (zh) | 基于随机森林和逻辑回归的优质客户识别方法及装置 | |
Fei et al. | Elastic resource provisioning using data clustering in cloud service platform | |
CN108364191A (zh) | 基于随机森林和逻辑回归的优质客户优化识别方法及装置 | |
CN110737805A (zh) | 图模型数据的处理方法、装置和终端设备 | |
CN114579720A (zh) | 一种基于文本挖掘的水电工程进度智能评估方法 | |
CN111833018A (zh) | 一种科技项目的专利分析方法及系统 | |
Bell et al. | The application of a research project selection method | |
António | Predictive models of hotel booking cancellation: a semi-automated analysis of the literature | |
CN107133274B (zh) | 一种基于图知识库的分布式信息检索集合选择方法 | |
CN116049379A (zh) | 知识推荐方法、装置、电子设备和存储介质 | |
CN114429043A (zh) | 基于科技服务需求的机构推荐系统及方法 | |
CN109543001A (zh) | 一种表征科研论文研究内容的科技词条抽取方法 | |
CN106156260A (zh) | 一种数据缺失修补的方法和装置 | |
CN112861956A (zh) | 基于数据分析的水污染模型构建方法 | |
CN112256681A (zh) | 一种空管数字化指标应用系统及方法 | |
CN117827881A (zh) | 一种基于历史信息的Spark SQL Shuffle任务数优化系统 | |
Kashevarova | Technological development modeling based on patent analysis: Review of the state-of-the-art | |
Vasiliev et al. | Application of text mining technology to solve project management problems | |
CN115048503A (zh) | 一种基于内容分析的用户偏好标签设计方法 | |
CN108182288A (zh) | 一种基于人工免疫的推荐方法 | |
CN108985811A (zh) | 用于精准营销的方法、装置及电子设备 | |
Adilah et al. | An augmented method of selecting fashion talent by adding social media characteristic | |
CN112668836A (zh) | 一种面向风险图谱的关联风险证据高效挖掘与监控方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180706 |
|
RJ01 | Rejection of invention patent application after publication |