CN109992642B - 一种基于科技词条的单任务专家自动遴选方法及系统 - Google Patents
一种基于科技词条的单任务专家自动遴选方法及系统 Download PDFInfo
- Publication number
- CN109992642B CN109992642B CN201910253367.7A CN201910253367A CN109992642B CN 109992642 B CN109992642 B CN 109992642B CN 201910253367 A CN201910253367 A CN 201910253367A CN 109992642 B CN109992642 B CN 109992642B
- Authority
- CN
- China
- Prior art keywords
- scientific
- expert
- technological
- entry
- selection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于科技词条的单任务专家自动遴选方法和系统,所述方法包括步骤:步骤S1、遴选任务词条计算;步骤S2、在科技词条树图中,对任务涉及科技词条延伸及权重计算;步骤S3、根据遴选条件进行专家初筛选;步骤S4、基于科技词条,计算出与遴选任务最匹配的候选评审专家组。所述系统包括用户管理模块、个人设置模块、消息提示模块、模板管理模块、遴选任务管理模块、专家遴选模块、遴选结果管理模块、后台管理模块、数据库。本发明在对专家成果和项目内容分析的基础上,通过基于科技词条的单任务专家自动遴选方法实现专家的多种模式遴选,有效保证科技专家遴选工作的科学性、准确性和公正性,对提升科技服务水平有重要帮助。
Description
技术领域
本发明涉及信息管理技术领域,特别涉及一种基于科技词条的单任务专家自动遴选方法及系统。
背景技术
科技专家是项目评审的主体,其在和项目有关的科技领域内的水平直接决定了评审结果的有效性。同行评审是国内外科技项目评审的主要方法,旨在由从事该科技项目的所在细分领域或接近该领域的专家来评定科技项目的水平或重要性。当前很多遴选系统均可以做到“大同行”,即专业方向基本贴近,但很难做到“小同行”,即评审专家和项目所涉及的具体研究主题难以一致,需要专业人员的参与才能选到最合适的专家。
随着各类科技项目的立项、申报等活动日益增多,科技项目种类繁多,涉及多个科技领域,跨领域交叉又越来越普遍,人工遴选项目评审专家的相关机构面临着严峻的挑战。单纯依靠项目管理人员进行的人工专家遴选存在着效率低下、工作量过大,以及缺乏准确性及公正性等问题。
目前,国内外也存在一些专家自动遴选系统,但是遴选时基本采用学科或技术领域作为统计边界,过于宽泛,没有解决“小同行”问题,无法在具体细分领域、行业水平层次实现科技项目与评审专家的精准匹配。
基于此,发明人提出了科技词条这一规范化术语。科技词条提供一种比学科、技术领域等分类更为精确,更能真实反映科技工作中理论和技术研究范畴的分类方法和管理模式,由科技人员主导完成词条的管理。在范畴划分中,若科技词条te1研究范畴是由科技词条te2的研究范畴细化而来,称te2强包含te1,记为te2→te1;若科技词条te1的研究范畴与科技词条te2的研究范畴存在交集,或te1的研究范畴在某种程度上也属于te2的研究范畴,称te2弱包含te1,记为包含关系是传递的。
若以科技词条为顶点,词条间的强包含和弱包含关系表示为有向边,则所有科技词条构成有向无环树图。给定科技词条te,所有te传递包含或传递包含te的词条都是te的关联词,反映研究范畴的相关性。如某项研究对应到科技词条树图中是出度为零的顶点,说明该研究范畴是一个划分比较精确的分支。
科技词条之间存在关联,同时,科技词条关联了科研论文、科技人员。给定科技词条te,研究内容包含te的科研论文都是te的关联科研论文,研究范畴包含te的科技人员都是te的关联科技人员。
专利“一种表征科技专家成果能力的科技词条抽取方法”(申请号:CN201810022753.0,公开号:CN108255796A)中,计算出了专家在科技词条上的贡献系数(专家成果分占科技词条上总成果分的比值),客观地反映了专家在各种粒度研究范畴上的成果能力。
本发明基于科技词条模型,分析专家和项目涉及的科技词条,提出一种基于科技词条的单任务专家自动遴选方法及配套系统,每次针对单个遴选任务,在科技词条层面上实现科技项目与评审专家的精准匹配,做到既可以找“大同行”,也可以找“小同行”。
本发明在对专家成果和项目内容进行分析基础上,研究专家自动遴选算法并实现专家的多种模式遴选,在有效保证科技专家遴选工作的科学性、准确性和公正性的同时,极大降低了相关管理机构遴选专家的工作量,不但有助于科研管理,也将对提升科技服务水平有重要帮助。
发明内容
为了解决人工遴选过程效率低下、工作量大、公正性及准确性难以保障的问题,本发明提出了一种基于科技词条进行专家自动遴选的方法和系统,具体包括:一种基于科技词条的单任务专家自动遴选方法和基于科技词条的单任务专家自动遴选系统。
本发明通过如下技术方案实现。
一种基于科技词条的单任务专家自动遴选方法,包括以下步骤:
步骤S1、遴选任务词条计算,从概括遴选任务内容的描述性文字中提取出科技词条集,并计算科技词条的自有权重;
步骤S2、在科技词条树图中,对任务涉及科技词条延伸及权重计算;
步骤S3、根据遴选条件进行专家初筛选;
步骤S4、基于科技词条,计算出与遴选任务最匹配的候选评审专家组;
进一步地,所述从概括遴选任务内容的描述性文字中提取出科技词条集,并计算科技词条的自有权重的具体步骤包括:
步骤S101,科技词条提取:利用分词工具从概括遴选任务内容的描述性文字中提取出所有科技词条,设提取出的科技词条集合为T;
步骤S103,判断科技词条无向图G是否是连通图,如果是则执行步骤S104,如果不是则执行步骤S105;
步骤S104,计算出科技词条无向图G中代表领域之间交叉联系的科技词条,并计算G中每个节点的自有权重;
步骤S105,设科技词条无向图G可划分为m个连通子图G1,G2,…,Gm,其中|Gi|代表第i个连通子图的节点个数,那么子图Gi中节点的自有权重SWte的计算公式为:
SWte=1/m×1/|Gi|。
进一步地,所述的步骤S104具体包括步骤:
步骤S104.1,求科技词条无向图G的连通度k,若在图的连通图上删去k个节点才能破坏图的连通性,那么称k为图的连通度,在无向图G中找到这k个节点,这k个科技词条代表了领域之间的交叉联系;
步骤S104.2,计算这k个科技词条的自有权重,设在G中删除这k个节点后分割为m个连通子图G1,G2,…,Gm,其中|Gi|代表第i个连通子图的节点个数,那么这k个节点的自有权重SWte的计算公式为:
其中,C为权重系数,代表了这k个节点与其他普通节点的权重比,若要基于专家成果能力综合评价,则设置C>1,这样可以遴选出全面、综合的专家,若要基于专家成果能力定域评价,则设置C<1,这样可以遴选出单方面擅长、精通的专家;
步骤S104.3,计算无向图G中其他节点的自有权重,设在G中删除这k个节点后分割为m个连通子图G1,G2,…,Gm,其中|Gi|代表第i个连通子图的节点个数,那么子图Gi中节点自有权重SWte的计算公式为:
进一步地,其特征在于,在科技词条树图中,对遴选任务涉及科技词条延伸,并计算其权重,对任意科技词条te,其权重包含自有权重、上游顶点延伸权重和下游顶点延伸权重:
Wte=SWte+UWte+DWte
其中,SWte表示科技词条te的自有权重,UWte表示科技词条的上游顶点延伸权重,DWte表示科技词条te的下游顶点延伸权重。
若要找大同行时,则执行以下步骤:
步骤S201,在科技词条树图中计算出大同行和小同行划分阈值节点te*,判断te所属范畴,若te属于大同行范畴,那么执行步骤S202、S203、S204、S205,若te属于小同行范畴,那么执行步骤S202、S204、S205;
步骤S202,向上游延伸,令te'=te,T'={};
步骤S202.1,若科技词条树图中存在a→te'或那么DWa=DWa+SWte/1+|La-te|,若a属于大同行范畴,那么T'=T'∪{a},其中,DWa代表科技词条a的下游顶点延伸权重,SWte表示科技词条te的自有权重,|La-te|代表科技词条树图中科技词条a和科技词条te的最短路径;
步骤S202.2,令te'=a,重复步骤S202.1,直到a为科技词条树图最上层的学科顶点;
步骤S203,向下游延伸,令te'=te,T*={};
步骤S203.1,若科技词条树图中存在te'→a或那么UWa=UWa+SWte/1+|La-te|,若a属于大同行范畴,那么T*=T*∪{a},其中,UWa代表科技词条a的上游顶点延伸权重,SWte表示科技词条te的自有权重,|La-te|代表科技词条树图中科技词条a和科技词条te的最短路径;
步骤S203.2,令te'=a,重复步骤S203.1,直到a为大同行和小同行划分阈值节点te*;
步骤S204,若te属于大同行范畴,TE=T'∪T*∪{te},否则TE=T'∪T*,TE作为此次遴选任务的科技词条延伸集;
若要找小同行时,则执行以下步骤:
步骤S211,在科技词条树图中计算出大同行和小同行划分阈值节点te*,判断te所属范畴,若te属于大同行范畴,那么执行步骤S213,S214,S215,若te属于小同行范畴,那么执行步骤S212,S213,S214,S215;
步骤S212,向上游延伸,令te'=te,T'={};
步骤S212.1,若科技词条树图中存在a→te'或那么DWa=DWa+SWte/1+|La-te|,若a属于小同行范畴,那么T'=T'∪{a},其中,DWa代表科技词条a的下游顶点延伸权重,SWte表示科技词条te的自有权重,|La-te|代表科技词条树图中科技词条a和科技词条te的最短路径;
步骤S212.2,令te'=a,重复步骤S212.1,直到a为大同行和小同行划分阈值节点te*;
步骤S213,向下游延伸,令te'=te,T*={};
步骤S213.1,若科技词条树图中存在te'→a或那么UWa=UWa+SWte/1+|La-te|,若a属于小同行范畴,那么T*=T*∪{a},其中,UWa代表科技词条a的上游顶点延伸权重,SWte表示科技词条te的自有权重,|La-te|代表科技词条树图中科技词条a和科技词条te的最短路径;
步骤S213.2,令te'=a,重复步骤S213.1,直到a为科技词条树图中的树叶顶点;
步骤S214,若te属于小同行范畴,TE=T'∪T*∪{te},否则TE=T'∪T*,TE作为此次遴选任务的科技词条延伸集;
进一步地,所述大同行指从事一级学科的学者群体,在科技词条树图中以学科作为统计起始边界,以用户定义的大同行和小同行划分阈值为终止边界;所述小同行指具有相同或相近的研究方向的小型的学者群体,在科技词条树图中以用户定义的大同行和小同行划分阈值为起始边界,所有分支的树叶顶点为终止边界。
进一步地,所述大同行和小同行划分阈值的边界是一个介于0-1间的比值,由用户指定,将从最上层的学科顶点开始到树叶顶点的路径长度划分为两段,上段为大同行,下段为小同行,阈值缺省为0,表示以顶层的学科顶点区分大同行。
进一步地,步骤S3中,专家初筛选时,根据遴选条件过滤专家库,遴选条件包括回避专家列表、回避单位列表、专家所在地域限制、专家年龄限制、专家职称限制、专家曾评审过的项目级别限制、专家所在机构类别限制。
进一步地,步骤S4中,基于科技词条,计算出与遴选任务最匹配的候选评审专家组时,针对单个遴选任务,基于科技词条计算出与遴选任务的科技词条延伸列表TE匹配度最高的候选评审专家组,若要基于专家成果能力定域评价,则执行步骤S401、S402,遴选出单方面擅长、精通的专家:
步骤S401,科技词条延伸集划分,根据在科技树图中的分支,将科技词条延伸集TE划分为不同的子集,设科技词条树图中最上层的学科顶点集合为SUB,若te∈TE,那么te及科技词条延伸集TE中te的后代构成一子集,若那么科技词条延伸集TE中te的后代构成一子集;
步骤S402,设经过步骤S401之后划分成了k个子集TE1,TE2,…,TEk,在对应子集上得到匹配度最高的专家,包括以下步骤:
步骤S402.1,计算在对应子集上所需专家个数,设遴选任务所需专家个数为n,那么子集TEi上所需专家个数ni的计算公式为:
步骤S402.2,计算专家在对应子集上的匹配度,计算结果为数值,设Ce-te表示专家e在科技词条te上的贡献度(该数值通过分析专家成果计算得到,由专利“一种表征科技专家成果能力的科技词条抽取方法”给出),那么专家e与子集TEi的匹配度的计算公式为:在专家集ES中找到匹配度最高的ni个专家(这ni个专家与其他子集上计算出的专家不存在重复);
若要基于专家成果能力综合评价,则执行步骤S403,遴选出全面、综合的专家:
步骤S403,科技词条延伸集-专家匹配度计算,假设遴选任务所需专家人数为n,Ce-te表示专家e在科技词条te上的贡献度(该数值通过分析专家成果计算得到,由专利“一种表征科技专家成果能力的科技词条抽取方法”给出),那么专家te与科技词条延伸集TE的匹配度ZTE-e的计算公式为在专家集ES中找到匹配度最高的n个专家作为此次遴选任务的候选专家组。
进一步地,所述基于专家成果能力综合评价指从多个领域综合对专家评价,可以甄别出一些全面、综合的专家。
进一步地,所述基于专家成果能力的定域评价指从特定领域对专家评价,可以甄别出单方面擅长、精通的专家。
一种基于科技词条的单任务专家自动遴选系统,包括功能模块以及所依赖的数据库,所述功能模块包括用户管理模块、个人设置模块、消息提示模块、模板管理模块、遴选任务管理模块、专家遴选模块、遴选结果管理模块、后台管理模块,所依赖数据库包括用户库、遴选任务库、专家库、科技词条库,
所述用户管理模块用于提供对机构/企业用户、专家用户的系统登录和注册功能;
所述个人设置模块用于设置个人信息,同时专家用户可上传自己的成果附件、可设置有能力参与评审活动的地域及时间段;
所述消息提示模块用于提供以站内消息形式发送的消息通知功能,具体发送的消息内容包括系统消息与公告、对专家用户发出的确认参加评审任务通知、专家用户确认参与或拒绝参与评审任务的通知,以及评审任务的评审专家组名单最终确认通知;
所述模块管理模块用于遴选条件模板管理、评审专家组报表导出模板管理、专家资料导出模板管理;
所述遴选任务管理模块用于提供对遴选任务的管理功能,包括遴选任务的新建、删除、修改、查看;
所述专家遴选模块用于通过基于科技词条的单任务专家自动遴选方法自动产生候选评审专家名单;
所述遴选结果管理模块用于提供对遴选结果的管理功能,包括遴选结果查看、评审专家资料查看、评审专家通知、评审专家替换、评审专家组报表导出、专家资料导出、评审专家评价;
所述后台管理模块用于用户信息管理、专家信息管理、科技词条信息管理,所述用户信息管理包括用户新增、编辑、删除、禁用、启用,专家信息管理包括专家信息的增、删、改、查,科技词条信息管理包括科技词条信息的增、删、改、查。
进一步地,所述专家遴选模块包括:
遴选任务词条计算模块,用于从概括遴选任务内容的描述性文字中提取出科技词条集,并计算科技词条的自有权重;
任务涉及科技词条延伸及权重计算模块,用于在科技词条树图中,对任务涉及科技词条延伸及权重计算;
专家初筛选模块,根据遴选条件进行专家初筛选;
候选评审专家组计算模块,基于科技词条,计算出与遴选任务最匹配的候选评审专家组。
本发明与现有技术相比,具有以下优点和有益效果:
基于科技词条的单任务专家自动遴选算法,以科技词条作为统计边界,解决了人工遴选时所采用的学科或技术领域统计边界往往过于宽泛,无法在具体细分领域、行业水平层次实现科技项目与评审专家的精准匹配的缺点,实现细粒度专家精准遴选。基于科技词条的单任务专家自动遴选系统,规范了遴选流程,减少了人为干预,保证了专家遴选过程的公平性,提高了专家遴选的效率。
附图说明
图1为完成一次遴选任务的业务流程图。
图2为专家遴选系统的主要功能模块以及所依赖的数据库。
图3为基于科技词条的单任务专家自动遴选算法的算法流程图。
图4为某科技词条向上游延伸过程图。
图5为部分科技词条树图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图和具体实施例对本发明作进一步的详细描述。
图1展示了在专家遴选系统中完成一次遴选任务的基本流程,包括以下步骤:
步骤01,机构/企业等用户建立遴选任务;
步骤02,系统遴选并产生候选评审专家;
步骤03,通知候选专家进行确认,若有专家拒绝,可进行专家替换或重新遴选;
步骤04,最终专家组名单确认后,通知专家进行评审活动;
步骤05,专家现场参加评审活动;
步骤06,机构/企业等用户对专家在评审活动中的表现进行评价反馈;
步骤07,任务结束;
图2展示了专家遴选系统的功能模块以及所依赖的数据库。
所述功能模块包括用户管理模块、个人设置模块、消息提示模块、模板管理模块、遴选任务管理模块、专家遴选模块、遴选结果管理模块、后台管理模块,所依赖数据库包括用户库、遴选任务库、专家库、科技词条库。
所述用户管理模块提供对机构/企业用户、专家用户的系统登录和注册功能。
所述个人设置模块是指用户可以设置个人信息,同时专家用户可上传自己的成果附件、可设置有能力参与评审活动的地域及时间段。
所述消息提示模块提供以站内消息形式发送的消息通知功能,具体发送的消息内容包括但不限于系统消息与公告、对专家用户发出的确认参加评审任务通知、专家用户确认参与或拒绝参与评审任务的通知,以及评审任务的评审专家组名单最终确认通知。
所述模块管理模块包括遴选条件模板管理、评审专家组报表导出模板管理、专家资料导出模板管理。
所述遴选任务管理模块提供对遴选任务的管理功能,包括但不限于遴选任务的新建、删除、修改、查看,其中新建遴选任务功能中,需设置的遴选任务信息包括遴选算法和内容均无关、算法相关但内容无关和算法及内容均相关等三类信息。
所述与遴选算法及内容均无关的信息包括但不限于任务名称、录入时间等。所述算法相关但内容无关的信息包括评审开始与结束时间、评审地点、所需评审专家数量、所需财务专家数量、回避专家列表、回避单位列表,以及专家个人年龄、头衔、职称等。所述与算法及内容均相关的信息包括概括项目内容的描述性文字等,信息设置支持甄别大同行和小同行、支持基于专家成果能力综合评价或定域评价。
所述大同行指从事一级学科的学者群体,在科技词条树图中以学科作为统计起始边界,以用户定义的大同行和小同行划分阈值为终止边界。所述小同行指具有相同或相近的研究方向的小型的学者群体,在科技词条树图中以用户定义的大同行和小同行划分阈值为起始边界,所有分支的树叶顶点为终止边界。所述大同行和小同行划分阈值边界是一个介于0-1间的比值,由用户指定,将从最上层的学科顶点开始到树叶顶点的路径长度划分为两段,上段为大同行,下段为小同行,阈值缺省为0,表示以顶层的学科顶点区分大同行。
所述基于专家成果能力综合评价指从多个领域综合对专家评价,可以甄别出一些全面、综合的专家。所述基于专家成果能力的定域评价指从特定领域对专家评价,可以甄别出单方面擅长、精通的专家。
所述专家遴选模块通过基于科技词条的单任务专家自动遴选算法自动产生候选评审专家名单。
所述遴选结果管理模块提供对遴选结果的管理功能,包括但不限于遴选结果查看、评审专家资料查看、评审专家通知、评审专家替换、评审专家组报表导出、专家资料导出、评审专家评价。
所述遴选结果管理模块中的评审专家通知功能指以站内消息、电话、手机短信、电子邮件等形式通知候选评审专家参与评审任务,候选专家可以选择确认参加或拒绝参加,候选专家选择确认参加后成为正式专家。
所述遴选结果管理模块中的评审专家替换功能指在某名候选评审专家回复拒绝参与评审任务时,调用专家遴选模块遴选出另一名候选评审专家取而代之。
所述遴选结果管理模块中的评审专家组报表输出功能指导出一个遴选任务中全部候选或正式评审专家的报表。
所述遴选结果管理模块中的所述专家资料导出功能是指导出某名候选的或正式的评审专家详细信息的报表。
所述遴选结果管理模块中的评审专家评价功能是指在评审专家完成评审任务后,用户对评审专家在此次评审任务中的表现进行评价反馈。
所述后台管理模块包括用户信息管理、专家信息管理、科技词条信息管理,用户信息管理包括用户新增、编辑、删除、禁用、启用,专家信息管理包括专家信息的增、删、改、查,科技词条信息管理包括科技词条信息的增、删、改、查。
所述专家遴选模块中基于科技词条的单任务专家自动遴选算法,针对单个遴选任务,计算出专家库中与所给遴选任务匹配度最高的候选评审专家组,包括:
遴选任务词条计算模块,用于从概括遴选任务内容的描述性文字中提取出科技词条集,并计算科技词条的自有权重;
任务涉及科技词条延伸及权重计算模块,用于在科技词条树图中,对任务涉及科技词条延伸及权重计算;
专家初筛选模块,根据遴选条件进行专家初筛选;
候选评审专家组计算模块,基于科技词条,计算出与遴选任务最匹配的候选评审专家组。
图3展示了一种基于科技词条的单任务专家自动遴选方法的流程图,包括以下步骤:
步骤1:遴选任务词条计算,从概括遴选任务内容的描述性文字中提取出科技词条集,并计算科技词条的自有权重;
步骤2:在科技词条树图中,对任务涉及科技词条延伸及权重计算;
步骤3:根据遴选条件进行专家初筛选;
步骤4:基于科技词条,计算出与遴选任务最匹配的候选评审专家组。
所述步骤1中遴选任务词条计算,从概括遴选任务内容的描述性文字中提取出科技词条集,并计算科技词条的自有权重,包括以下子步骤:
步骤1.1,科技词条提取:利用分词工具从概括遴选任务内容的描述性文字中提取出所有科技词条,设提取出的科技词条集合为T;
步骤1.3,判断科技词条无向图G是否是连通图,如果是则执行步骤1.4,如果不是则执行步骤1.5;
步骤1.4,计算出科技词条无向图G中代表领域之间交叉联系的科技词条,并计算G中每个节点的自有权重,包括以下步骤:
步骤1.4.1,求科技词条无向图G的连通度k,若在图的连通图上删去k个节点才能破坏图的连通性,那么称k为图的连通度,在无向图G中找到这k个节点,这k个科技词条代表了领域之间的交叉联系;
步骤1.4.2,计算这k个科技词条的自有权重,设在G中删除这k个节点后分割为m个连通子图G1,G2,…,Gm,其中|Gi|代表第i个连通子图的节点个数,那么这k个节点的自有权重SWte的计算公式为:
其中,C为权重系数,代表了这k个节点与其他普通节点的权重比,若要基于专家成果能力综合评价,则设置C>1,这样可以遴选出全面、综合的专家,若要基于专家成果能力定域评价,则设置C<1,这样可以遴选出单方面擅长、精通的专家;
步骤1.4.3,计算无向图G中其他节点的自有权重,设在G中删除这k个节点后分割为m个连通子图G1,G2,…,Gm,其中|Gi|代表第i个连通子图的节点个数,那么子图Gi中节点自有权重SWte的计算公式为:
步骤1.5,设科技词条无向图G可划分为m个连通子图G1,G2,…,Gm,其中|Gi|代表第i个连通子图的节点个数,那么子图Gi中节点的自有权重SWte的计算公式为:
SWte=1/m×1/|Gi|
所述步骤2中根据科技词条间的关联关系,计算与步骤1所得科技词条集T存在关联关系的词条集合,作为此次遴选任务的科技词条延伸集,并计算其权重,对任意科技词条te,其权重包含自有权重、上游顶点延伸权重和下游顶点延伸权重:
Wte=SWte+UWte+DWte
其中,SWte表示科技词条te的自有权重,UWte表示科技词条的上游顶点延伸权重,DWte表示科技词条te的下游顶点延伸权重;
若要找大同行,则执行以下步骤:
步骤201,在科技词条树图中计算出大同行和小同行划分阈值节点te*,判断te所属范畴,若te属于大同行范畴,那么执行步骤202、203、204、205,若te属于小同行范畴,那么执行步骤202、204、205;
步骤202,向上游延伸,令te'=te,T'={};
步骤202.1,若科技词条树图中存在a→te'或那么DWa=DWa+SWte/1+La-te|,若a属于大同行范畴,那么T'=T'∪{a},其中,DWa代表科技词条a的下游顶点延伸权重,SWte表示科技词条te的自有权重,|La-te|代表科技词条树图中科技词条a和科技词条te的最短路径;
步骤202.2,令te'=a,重复步骤202.1,直到a为科技词条树图最上层的学科顶点;
步骤203,向下游延伸,令te'=te,T*={};
步骤203.1,若科技词条树图中存在te'→a或那么UWa=UWa+SWte/1+|La-te|,若a属于大同行范畴,那么T*=T*∪{a},其中,UWa代表科技词条a的上游顶点延伸权重,SWte表示科技词条te的自有权重,|La-te|代表科技词条树图中科技词条a和科技词条te的最短路径;
步骤203.2,令te'=a,重复步骤203.1,直到a为大同行和小同行划分阈值节点te*;
步骤204,若te属于大同行范畴,TE=T'∪T*∪{te},否则TE=T'∪T*,TE作为此次遴选任务的科技词条延伸集;
若要找小同行,则执行以下步骤:
步骤211,在科技词条树图中计算出大同行和小同行划分阈值节点te*,判断te所属范畴,若te属于大同行范畴,那么执行步骤213,214,215,若te属于小同行范畴,那么执行步骤212,213,214,215;
步骤212,向上游延伸,令te'=te,T'={};
步骤212.1,若科技词条树图中存在a→te'或那么DWa=DWa+SWte/1+|La-te|,若a属于小同行范畴,那么T'=T'∪{a},其中,DWa代表科技词条a的下游顶点延伸权重,SWte表示科技词条te的自有权重,|La-te|代表科技词条树图中科技词条a和科技词条te的最短路径;
步骤212.2,令te'=a,重复步骤212.1,直到a为大同行和小同行划分阈值节点te*;
步骤213,向下游延伸,令te'=te,T*={};
步骤213.1,若科技词条树图中存在te'→a或那么UWa=UWa+SWte/1+|La-te|,若a属于小同行范畴,那么T*=T*∪{a},其中,UWa代表科技词条a的上游顶点延伸权重,SWte表示科技词条te的自有权重,|La-te|代表科技词条树图中科技词条a和科技词条te的最短路径;
步骤213.2,令te'=a,重复步骤213.1,直到a为科技词条树图中的树叶顶点;
步骤214,若te属于小同行范畴,TE=T'∪T*∪{te},否则TE=T'∪T*,TE作为此次遴选任务的科技词条延伸集;
图4展示了某次选小同行的遴选任务中科技词条ID7向上游延伸过程,图中节点"ID/UW/SW/DW",其中ID代表科技词条的可唯一标识的编码,UW代表科技词条的上游顶点延伸权重,SW代表科技词条的自有权重,DW代表科技词条的下游顶点延伸权重,图中词条间的强包含关系用I型有向边表示,弱包含关系用II型有向边表示,用户设定大同行与小同行的划分阈值为0.5,ID1为学科顶点,计算出大同行与小同行的划分阈值节点为ID4,科技词条ID7的自有权重为0.2,因为本次遴选任务是选小同行,ID7只能向上游延伸到大同行与小同行的划分阈值节点ID4,从图中可看出科技词条ID7向上游延伸过程中可延伸到的科技词条有ID6、ID4,其中ID4的下游顶点延伸权重计算公式为:
DWID4=DWID4+SWID7/1+|LID4-ID7|=0+0.2/1+3=0.05
所述步骤3中使用遴选条件过滤专家库,挑选出专家库E中满足遴选条件的专家集ES,遴选条件包括回避专家列表、回避单位列表、专家所在地域限制、专家年龄限制、专家职称限制、专家曾评审过的项目级别限制、专家所在机构类别限制等;
所述步骤4中候选评审专家组计算,计算出与遴选任务的科技词条延伸列表匹配度最高的候选评审专家组,若要基于专家成果能力定域评价,则执行步骤4.1、4.2,这样可以遴选出单方面擅长、精通的专家,若要基于专家成果能力综合评价,则执行步骤4.3,这样可以遴选出全面、综合的专家;
步骤4.1,科技词条延伸集划分,根据在科技树图中的分支,将科技词条延伸集TE划分为不同的子集,设科技词条树图中最上层的学科顶点集合为SUB,若te∈TE,那么te及科技词条延伸集TE中te的后代构成一子集,若那么科技词条延伸集TE中te的后代构成一子集;
步骤4.2,设经过步骤4.1之后划分成了k个子集TE1,TE2,…,TEk,在对应子集上得到匹配度最高的专家,包括以下步骤:
步骤4.2.1,计算专家在对应子集上所需专家个数,设遴选任务所需专家个数为n,那么子集TEi上所需专家个数ni的计算公式为:
步骤4.2.2,计算专家在对应子集上的匹配度,计算结果为数值,设Ce-te表示专家e在科技词条te上的贡献度(该数值通过分析专家成果计算得到,由专利“一种表征科技专家成果能力的科技词条抽取方法”给出),那么专家e与子集TEi的匹配度的计算公式为:在专家集ES中找到匹配度最高的ni个专家(这ni个专家与其他子集上计算出的专家不存在重复);
步骤4.1,4.2计算过程:设某遴选任务的科技词条延伸集TE为(ID1,0.15)、(ID2,0.2)、(ID3,0.15)、(ID4,0.2)、(ID5,0.3),需要评审专家个数为10,
图5展示了部分科技词条树图,图中词条间的强包含关系用I型有向边表示,弱包含关系用II型有向边表示,ID1,ID2为学科顶点,所以分为两个分支,相对应的子集为TE1={ID1,ID3,ID4},TE2={ID2,ID4,ID5},TE1所需专家个数为n2=10-n1=6,设专家e在科技词条ID1、ID2、ID3、ID4、ID5上的贡献度分别为0.02、0.015、0.006、0.01、0.03,那么专家e在子集TE1上的匹配度为:在专家集ES中找到在TE1上的匹配度最高的4个专家和在TE2上的匹配度最高的6个专家作为此次遴选任务的候选专家组;
步骤4.3,科技词条延伸集-专家匹配度计算,假设遴选任务所需专家人数为n,Ce-te表示专家e在科技词条te上的贡献度(该数值通过分析专家成果计算得到,由专利“一种表征科技专家成果能力的科技词条抽取方法”给出),那么专家te与科技词条延伸集TE的匹配度ZTE-e的计算公式为在专家集ES中找到匹配度最高的n个专家作为此次遴选任务的候选专家组;
步骤4.3计算过程:设某遴选任务的科技词条延伸集TE为(ID1,0.15)、(ID2,0.2)、(ID3,0.15)、(ID4,0.2)、(ID5,0.3),需要评审专家个数为10,专家e在科技词条ID1、ID2、ID3、ID4、ID5上的贡献度分别为0.02、0.015、0.006、0.01、0.03,那么科技词条延伸列表TE与专家e的相关度计算公式为:
在专家集ES中找到与科技词条延伸列表TE匹配度最高的10个评审专家作为此次遴选任务的候选专家组。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (9)
1.一种基于科技词条的单任务专家自动遴选方法,其特征在于,包括以下步骤:
步骤S1、遴选任务词条计算,从概括遴选任务内容的描述性文字中提取出科技词条集,并计算科技词条的自有权重;
步骤S2、在科技词条树图中,对任务涉及科技词条延伸及权重计算;在科技词条树图中,对遴选任务涉及科技词条延伸,并计算其权重,对任意科技词条te,其权重包含自有权重、上游顶点延伸权重和下游顶点延伸权重:
Wte=SWte+UWte+DWte
其中,SWte表示科技词条te的自有权重,UWte表示科技词条的上游顶点延伸权重,DWte表示科技词条te的下游顶点延伸权重;
若要找大同行时,则执行以下步骤:
步骤S201,在科技词条树图中计算出大同行和小同行划分阈值节点te*,判断te所属范畴,若te属于大同行范畴,那么执行步骤S202、S203、S204、S205,若te属于小同行范畴,那么执行步骤S202、S204、S205;
步骤S202,向上游延伸,令te'=te,T'={};
步骤S202.1,若科技词条树图中存在a→te'或那么DWa=DWa+SWte/1+|La-te|,若a属于大同行范畴,那么T'=T'∪{a},其中,DWa代表科技词条a的下游顶点延伸权重,SWte表示科技词条te的自有权重,|La-te|代表科技词条树图中科技词条a和科技词条te的最短路径;
步骤S202.2,令te'=a,重复步骤S202.1,直到a为科技词条树图最上层的学科顶点;
步骤S203,向下游延伸,令te'=te,T*={};
步骤S203.1,若科技词条树图中存在te'→a或那么UWa=UWa+SWte/1+|La-te|,若a属于大同行范畴,那么T*=T*∪{a},其中,UWa代表科技词条a的上游顶点延伸权重,SWte表示科技词条te的自有权重,|La-te|代表科技词条树图中科技词条a和科技词条te的最短路径;
步骤S203.2,令te'=a,重复步骤S203.1,直到a为大同行和小同行划分阈值节点te*;
步骤S204,若te属于大同行范畴,TE=T'∪T*∪{te},否则TE=T'∪T*,TE作为此次遴选任务的科技词条延伸集;
若要找小同行时,则执行以下步骤:
步骤S211,在科技词条树图中计算出大同行和小同行划分阈值节点te*,判断te所属范畴,若te属于大同行范畴,那么执行步骤S213,S214,S215,若te属于小同行范畴,那么执行步骤S212,S213,S214,S215;
步骤S212,向上游延伸,令te'=te,T'={};
步骤S212.1,若科技词条树图中存在a→te'或那么DWa=DWa+SWte/1+|La-te|,若a属于小同行范畴,那么T'=T'∪{a},其中,DWa代表科技词条a的下游顶点延伸权重,SWte表示科技词条te的自有权重,|La-te|代表科技词条树图中科技词条a和科技词条te的最短路径;
步骤S212.2,令te'=a,重复步骤S212.1,直到a为大同行和小同行划分阈值节点te*;
步骤S213,向下游延伸,令te'=te,T*={};
步骤S213.1,若科技词条树图中存在te'→a或那么UWa=UWa+SWte/1+|La-te|,若a属于小同行范畴,那么T*=T*∪{a},其中,UWa代表科技词条a的上游顶点延伸权重,SWte表示科技词条te的自有权重,|La-te|代表科技词条树图中科技词条a和科技词条te的最短路径;
步骤S213.2,令te'=a,重复步骤S213.1,直到a为科技词条树图中的树叶顶点;
步骤S214,若te属于小同行范畴,TE=T'∪T*∪{te},否则TE=T'∪T*,TE作为此次遴选任务的科技词条延伸集;
步骤S3、根据遴选条件进行专家初筛选;
步骤S4、基于科技词条,计算出与遴选任务最匹配的候选评审专家组。
2.根据权利要求1所述基于科技词条的单任务专家自动遴选方法,其特征在于,所述从概括遴选任务内容的描述性文字中提取出科技词条集,并计算科技词条的自有权重的具体步骤包括:
步骤S101,科技词条提取:利用分词工具从概括遴选任务内容的描述性文字中提取出所有科技词条,设提取出的科技词条集合为T;
步骤S103,判断科技词条无向图G是否是连通图,如果是则执行步骤S104,如果不是则执行步骤S105;
步骤S104,计算出科技词条无向图G中代表领域之间交叉联系的科技词条,并计算G中每个节点的自有权重;
步骤S105,设科技词条无向图G可划分为m个连通子图G1,G2,…,Gm,其中|Gi|代表第i个连通子图的节点个数,那么子图Gi中节点的自有权重SWte的计算公式为:
SWte=1/m×1/|Gi|。
3.根据权利要求2所述基于科技词条的单任务专家自动遴选方法,其特征在于,所述的步骤S104具体包括步骤:
步骤S104.1,求科技词条无向图G的连通度k,若在图的连通图上删去k个节点才能破坏图的连通性,那么称k为图的连通度,在无向图G中找到这k个节点,这k个科技词条代表了领域之间的交叉联系;
步骤S104.2,计算这k个科技词条的自有权重,设在G中删除这k个节点后分割为m个连通子图G1,G2,…,Gm,其中|Gi|代表第i个连通子图的节点个数,那么这k个节点的自有权重SWte的计算公式为:
其中,C为权重系数,代表了这k个节点与其他普通节点的权重比,若要基于专家成果能力综合评价,则设置C>1,这样可以遴选出全面、综合的专家,若要基于专家成果能力定域评价,则设置C<1,这样可以遴选出单方面擅长、精通的专家;
步骤S104.3,计算无向图G中其他节点的自有权重,设在G中删除这k个节点后分割为m个连通子图G1,G2,…,Gm,其中|Gi|代表第i个连通子图的节点个数,那么子图Gi中节点自有权重SWte的计算公式为:
4.根据权利要求2所述基于科技词条的单任务专家自动遴选方法,其特征在于,其特征在于,所述大同行指从事一级学科的学者群体,在科技词条树图中以学科作为统计起始边界,以用户定义的大同行和小同行划分阈值为终止边界;所述小同行指具有相同或相近的研究方向的小型的学者群体,在科技词条树图中以用户定义的大同行和小同行划分阈值为起始边界,所有分支的树叶顶点为终止边界。
5.根据权利要求4所述基于科技词条的单任务专家自动遴选方法,其特征在于,所述大同行和小同行划分阈值的边界是一个介于0-1间的比值,由用户指定,将从最上层的学科顶点开始到树叶顶点的路径长度划分为两段,上段为大同行,下段为小同行,阈值缺省为0,表示以顶层的学科顶点区分大同行。
6.根据权利要求1所述基于科技词条的单任务专家自动遴选方法,其特征在于,步骤S4中,专家初筛选时,根据遴选条件过滤专家库,遴选条件包括回避专家列表、回避单位列表、专家所在地域限制、专家年龄限制、专家职称限制、专家曾评审过的项目级别限制、专家所在机构类别限制。
7.根据权利要求1所述基于科技词条的单任务专家自动遴选方法,其特征在于,步骤S4中,基于科技词条,计算出与遴选任务最匹配的候选评审专家组时,针对单个遴选任务,基于科技词条计算出与遴选任务的科技词条延伸列表TE匹配度最高的候选评审专家组,若要基于专家成果能力定域评价,则执行步骤S401、S402,遴选出单方面擅长、精通的专家:
步骤S401,科技词条延伸集划分,根据在科技树图中的分支,将科技词条延伸集TE划分为不同的子集,设科技词条树图中最上层的学科顶点集合为SUB,若te∈TE,那么te及科技词条延伸集TE中te的后代构成一子集,若那么科技词条延伸集TE中te的后代构成一子集;
步骤S402,设经过步骤S401之后划分成了k个子集TE1,TE2,...,TEk,在对应子集上得到匹配度最高的专家,包括以下步骤:
步骤S402.1,计算在对应子集上所需专家个数,设遴选任务所需专家个数为n,那么子集TEi上所需专家个数ni的计算公式为:
若要基于专家成果能力综合评价,则执行步骤S403,遴选出全面、综合的专家:
8.一种实现权利要求1所述基于科技词条的单任务专家自动遴选方法的基于科技词条的单任务专家自动遴选系统,其应用于权利要求1中的一种基于科技词条的单任务专家自动遴选方法,其特征在于,包括功能模块以及所依赖的数据库,所述功能模块包括用户管理模块、个人设置模块、消息提示模块、模板管理模块、遴选任务管理模块、专家遴选模块、遴选结果管理模块、后台管理模块,所依赖数据库包括用户库、遴选任务库、专家库、科技词条库,
所述用户管理模块用于提供对机构/企业用户、专家用户的系统登录和注册功能;
所述个人设置模块用于设置个人信息,同时专家用户可上传自己的成果附件、可设置有能力参与评审活动的地域及时间段;
所述消息提示模块用于提供以站内消息形式发送的消息通知功能,具体发送的消息内容包括系统消息与公告、对专家用户发出的确认参加评审任务通知、专家用户确认参与或拒绝参与评审任务的通知,以及评审任务的评审专家组名单最终确认通知;
所述模板 管理模块用于遴选条件模板管理、评审专家组报表导出模板管理、专家资料导出模板管理;
所述遴选任务管理模块用于提供对遴选任务的管理功能,包括遴选任务的新建、删除、修改、查看;
所述专家遴选模块用于通过基于科技词条的单任务专家自动遴选方法自动产生候选评审专家名单;
所述遴选结果管理模块用于提供对遴选结果的管理功能,包括遴选结果查看、评审专家资料查看、评审专家通知、评审专家替换、评审专家组报表导出、专家资料导出、评审专家评价;
所述后台管理模块用于用户信息管理、专家信息管理、科技词条信息管理,所述用户信息管理包括用户新增、编辑、删除、禁用、启用,专家信息管理包括专家信息的增、删、改、查,科技词条信息管理包括科技词条信息的增、删、改、查。
9.根据权利要求8所述的基于科技词条的单任务专家自动遴选系统,其特征在于,所述专家遴选模块包括:
遴选任务词条计算模块,用于从概括遴选任务内容的描述性文字中提取出科技词条集,并计算科技词条的自有权重;
任务涉及科技词条延伸及权重计算模块,用于在科技词条树图中,对任务涉及科技词条延伸及权重计算;
专家初筛选模块,根据遴选条件进行专家初筛选;
候选评审专家组计算模块,基于科技词条,计算出与遴选任务最匹配的候选评审专家组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910253367.7A CN109992642B (zh) | 2019-03-29 | 2019-03-29 | 一种基于科技词条的单任务专家自动遴选方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910253367.7A CN109992642B (zh) | 2019-03-29 | 2019-03-29 | 一种基于科技词条的单任务专家自动遴选方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109992642A CN109992642A (zh) | 2019-07-09 |
CN109992642B true CN109992642B (zh) | 2022-11-18 |
Family
ID=67131208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910253367.7A Active CN109992642B (zh) | 2019-03-29 | 2019-03-29 | 一种基于科技词条的单任务专家自动遴选方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109992642B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111221971B (zh) * | 2020-01-07 | 2023-04-21 | 华南理工大学 | 一种基于科技词条的批量任务专家自动遴选方法 |
CN111666420B (zh) * | 2020-05-29 | 2021-02-26 | 华东师范大学 | 基于学科知识图谱集中抽取专家的方法 |
CN114567703B (zh) * | 2022-04-13 | 2022-10-18 | 湖南畅迅信息技术有限公司 | 政务呼叫中心优化方法及系统 |
CN115879829B (zh) * | 2023-02-21 | 2023-07-28 | 广东省科技基础条件平台中心 | 一种应用于平台创新能力审核的评审专家筛选方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103631859A (zh) * | 2013-10-24 | 2014-03-12 | 杭州电子科技大学 | 一种面向科技项目的评审专家智能推荐方法 |
WO2016150472A1 (en) * | 2015-03-20 | 2016-09-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Relevance score assignment for artificial neural network |
CN108255796A (zh) * | 2018-01-10 | 2018-07-06 | 华南理工大学 | 一种表征科技专家成果能力的科技词条抽取方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10152509B2 (en) * | 2015-09-23 | 2018-12-11 | International Business Machines Corporation | Query hint learning in a database management system |
-
2019
- 2019-03-29 CN CN201910253367.7A patent/CN109992642B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103631859A (zh) * | 2013-10-24 | 2014-03-12 | 杭州电子科技大学 | 一种面向科技项目的评审专家智能推荐方法 |
WO2016150472A1 (en) * | 2015-03-20 | 2016-09-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Relevance score assignment for artificial neural network |
CN108255796A (zh) * | 2018-01-10 | 2018-07-06 | 华南理工大学 | 一种表征科技专家成果能力的科技词条抽取方法 |
Non-Patent Citations (1)
Title |
---|
科技专家遴选方法研究与实现;黎坚;《中国优秀硕士论文全文数据库 信息科技辑》;20180715;第I138-1875页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109992642A (zh) | 2019-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109992642B (zh) | 一种基于科技词条的单任务专家自动遴选方法及系统 | |
Rowe et al. | Automated social hierarchy detection through email network analysis | |
CN109189901A (zh) | 一种智能客服系统中自动发现新分类以及对应语料的方法 | |
CN108052605A (zh) | 一种基于客户特征库的智能问答系统 | |
CN110599839A (zh) | 一种基于智能组卷和文本分析评阅的在线考试方法和系统 | |
McDaniels | Using judgment in resource management: a multiple objective analysis of a fisheries management decision | |
CN101520868A (zh) | 将层次分析法运用于审稿专家信息数据库系统的方法 | |
CN105550216A (zh) | 学术研究信息的搜索方法、挖掘方法及装置 | |
CN105721279A (zh) | 一种电信网络用户的交往圈挖掘方法及系统 | |
CN106570763A (zh) | 用户影响力评估的方法及系统 | |
CN111325422B (zh) | 一种工单派发方法及系统 | |
CN113435627A (zh) | 基于工单轨迹信息的电力客户投诉预测方法及装置 | |
CN110009182A (zh) | 一种法院案件自动化分案方法及系统 | |
CN109376167A (zh) | 专家选取方法、装置和服务器 | |
Gajowniczek et al. | Comparison of decision trees with Rényi and Tsallis entropy applied for imbalanced churn dataset | |
CN112132488A (zh) | 一种耦合建模-优化-优选的水库生态调度方法 | |
CN113361980A (zh) | 一种大数据资产价值评估的系统和方法 | |
CN113592456A (zh) | 一种基于人工智能的工程咨询管理系统及数据处理方法 | |
CN109299473B (zh) | 一种基于开发者画像的软件工程任务推荐方法 | |
Ólafsson et al. | Intelligent partitioning for feature selection | |
CN112860973B (zh) | 基于社交网络分析的组织健康评估方法 | |
CN112308749B (zh) | 培养计划的生成装置、方法、电子设备及可读存储介质 | |
CN110502675A (zh) | 基于数据分析的语音拨叫用户分类方法及相关设备 | |
CN115801483B (zh) | 一种信息共享处理方法及系统 | |
CN117494045B (zh) | 一种基于数据融合的数据集成智能管控系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |