CN107194672B - 一种融合学术专长与社会网络的评审分配方法 - Google Patents

一种融合学术专长与社会网络的评审分配方法 Download PDF

Info

Publication number
CN107194672B
CN107194672B CN201710414298.4A CN201710414298A CN107194672B CN 107194672 B CN107194672 B CN 107194672B CN 201710414298 A CN201710414298 A CN 201710414298A CN 107194672 B CN107194672 B CN 107194672B
Authority
CN
China
Prior art keywords
expert
paper
project
item
review
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710414298.4A
Other languages
English (en)
Other versions
CN107194672A (zh
Inventor
曹朝
曲大成
李凯霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Publication of CN107194672A publication Critical patent/CN107194672A/zh
Application granted granted Critical
Publication of CN107194672B publication Critical patent/CN107194672B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种融合学术专长与社会网络的评审分配方法,属于计算机应用技术领域。本方法首先建立标签集、论文/项目集及专家集,依据标签相似度矩阵计算论文/项目与专家的标签相似度;其次基于论文/项目合作数据库建模社会网络,计算论文/项目与专家的合作距离;然后建立论文/项目与专家的分配数组,遍历论文集,依据最大匹配度优先和最小差调整算法,依次进行评审分配;最后输出最优分配结果及其匹配度和、标签相似度和、合作距离和。本方法能够在满足论文/项目的作者/申请人与专家无合作、非师生关系、不属于同一机构的约束条件下,实现均衡评审分配,最大化评审分配的标签相似度和与合作距离和,确保评审结果的客观、公平、公正。

Description

一种融合学术专长与社会网络的评审分配方法
技术领域
本发明涉及一种融合学术专长与社会网络的评审分配方法,属于计算机应用技术、论文/项目评审管理应用领域。
背景技术
目前,国家和高校越来越重视学术及科学研究,论文和项目申请数量也逐年增多,在有限时间内将论文/项目分配给合适的评审成为困扰会议、期刊、项目组织者的难题。评审专家的审阅意见是论文录用或者项目授予的直接依据,因此确保评审结果的公正性、权威性,是组织者一直以来关注的重点。面对大量的论文/项目以及繁重的组织工作,利用计算机技术进行评审分配已成为趋势,但现有的方法大多是在满足用户设定的约束条件前提下,计算论文/项目与专家的专业领域相似度,作为评审分配的主要依据。在论文/项目的作者/申请人与专家存在现实中的直接或间接的学术交流的情况下,专家的主观因素会影响到评审过程的客观性,导致评审结果难免出现偏差。
论文/项目合作数据库记录了大量公开发布的文献资料,包含文章标题、文章作者及合作者、会议/期刊论文集、会议/期刊名称及发布时间等信息;该数据库中的论文/项目的作者/申请人包含了待分配的论文/项目的作者/申请人与专家,以及其他论文/项目的作者/申请人;利用论文/项目的作者/申请人与专家的合作路径,能够很好地反映出论文/项目的作者/申请人与专家在现实中的直接或间接的学术交流情况。
本方法基于论文/项目合作数据库建模社会网络,计算出论文/项目的作者/申请人与专家的合作距离;通过最大化论文/项目与专家的合作距离,降低专家的主观因素,提高了评审过程的客观性;同时结合专业领域标签,最大化论文/项目与专家的标签相似度,为评审分配提供系统全面、科学有效的解决方案。
与本文相关的论文主要有两篇,下文分别对这两篇论文进行剖析:
论文(1):全国青年管理科学与系统科学学术会议,2007年,作者张正文、唐锡晋,标题为论文分配的支持方法研究。该论文首先计算论文关键词向量和评审知识结构关键词向量之间的相似度作为客观相似度;接着根据评审之间是否有合作或发表过包含相同或同义的关键词,构建社会网络,以评审之间的知识结构关键词向量的相似度为权值,计算最大权值路径作为评审的主观相似度;最后结合评审个人倾向,计算综合相似度,按照递减排序进行评审分配。该论文所用方法虽然构建了结合了社会网络,但是该社会网络仅是用来计算评审之间的相似度,所用评审分配方法的主要依据是专家个人倾向、论文与评审或评审之间的关键词向量相似度,没有考虑论文作者与评审的学术交流情况。
论文(2):北京交通大学硕士学位论文,2014年,作者夏雷,标题为基于二部图匹配和聚类的论文分配方法研究。该论文构建论文与专家二部图网络,以边的权重作为分配权重;分配权重依据基础权重(值为1)、专家倾向、论文作者与专家是否同单位、论文与专家的研究领域进行计算;基于二部图的匈牙利算法和KM算法,设计均衡分配算法实现了评审分配。该论文所用方法虽然构建了论文与评审的二部图网络,但是该二部图网络的权重计算的主要依据仍是个人倾向、论文与评审的研究领域相似度,依然没有考虑论文作者与评审的学术交流情况。
上述已有的评审分配方法虽然解决了按照论文/项目与专家的专业领域的进行评审分配的问题,但均没有考虑到论文/项目的作者/申请人与专家存在现实中的直接或间接的学术交流的情况,没有将学术专长和社会网络进行深度融合,很可能因专家的主观因素而影响评审结果的客观性。因此,评审分配方法具有很大的改进空间。本发明的目的是即是致力于解决上述评审分配方法的缺陷,提出一种融合学术专长与社会网络的评审分配方法。
发明内容
本发明旨在解决已有的评审分配方法没有考虑论文/项目的作者/申请人与专家的学术交流而影响评审分配的客观性的缺陷,提出了一种融合学术专长与社会网络的评审分配方法。
一种融合学术专长与社会网络的评审分配方法,简称本方法,核心内容为:基于论文/项目合作数据库建模社会网络,提出论文/项目与专家的合作距离;综合论文/项目与专家的相似度与合作距离,提出论文/项目与专家的匹配度,确定最优化目标;采用最大匹配度优先与最小差调整算法,得出论文/项目的最优评审分配结果;本方法能够在满足论文/项目的作者/申请人与专家无合作、非师生、不属于同一机构的约束条件下,实现均衡评审分配,最大化评审分配的标签相似度和与合作距离和,确保评审结果的客观、公平、公正。
为实现上述目的,本方法包括如下步骤:
步骤1:根据给定数据集,建立标签集、带标签的论文/项目集与专家集,以及论文/项目集的作者/申请人集;得出论文/项目数及专家数、标签相似度矩阵以及论文/项目-专家的标签相似度;
其中,标签集,记为T;论文/项目集,记为P;专家集,记为R;论文/项目集P的作者/申请人集,记为A;集合大小|T|=h,|P|=g,|R|=f,|T|代表标签集T的大小,|P|代表论文/项目集P的大小,|R|代表专家集R的大小,且标签集T、论文/项目集P以及专家集R的大小,分别记为h,g,f,h,g及f均为大于1的整数常量;
对P中的任何一篇论文/项目p,p的标签集表示为T(p),p的作者/申请人集表示为A(p),|A(p)|为大于1的整数且不唯一,|A(p)|代表作者/申请人集A(p)的大小;对R中的任一专家r,r的标签表示为T(r);且
Figure GDA0002361960290000031
标签相似度矩阵,记为S,其大小为h×h,其中h表示标签集的的大小;其中每个元素表示相应的一对标签的相似度,可以由用户设定或者通过论文/项目合作关系数据库统计计算得到;
其中,论文/项目-专家的标签相似度,定义为论文/项目p与专家r的标签相似度的最大值,用公式(1)表示:
S(p,r)=maxS[ti][tj],ti∈T(p),tj∈T(r); (1)
其中,S(p,r)代表论文/项目p与专家r的标签相似度的最大值,max是求最大值的函数,S[ti][tj]代表相似度矩阵中标签ti和标签tj的相似度;其中,ti代表T(p)中第i个标签,tj代表T(r)中第j个标签;下标i,j为大于等于0,小于h的整数变量;
步骤2:建模社会网络,确定最大合作距离,得出论文/项目集的作者/申请人-专家的合作距离数组及论文/项目-专家的合作距离;
其中,建模社会网络可以通过论文/项目合作关系数据库获得,具体为:
社会网络,记为G,G=(V,E)为权值为1的无向网;其中节点集,记为V,|V|=n,|V|表示节点集V的大小,n为大于1的整数常量;每个节点代表一位作者/申请人;且步骤1中的专家集
Figure GDA0002361960290000042
论文/项目集的作者/申请人集
Figure GDA0002361960290000043
边集,记为E,|E|=m,|E|表示边集E的大小,m为大于1的整数常量;每条边表示边连接的两名作者/申请人之间有合作的结合;
任意两名作者/申请人的合作距离定义为相应的两个节点之间的最短路径;最大合作距离,记为MAXD,如果两个节点之间不可达或者最短路径值大于MAXD,则合作距离设为MAXD;最大合作距离由用户给定;
计算论文/项目集的作者/申请人-专家的合作距离数组DIS,其大小为g×f,其中g,f分别表示论文/项目集P以及专家集R的大小;数组中的每个元素DIS[p][r],是由论文/项目p的作者/申请人与专家r的合作距离组成的向量,该向量的长度为|A(p)|,A(p)代表论文/项目p的作者/申请人集;
论文/项目-专家的合作距离定义为论文/项目p的作者/申请人与专家r的合作距离组成的向量中的最小值,用公式(2)表示:
D(p,r)=min D[p][r]; (2)
其中,D(p,r)代表论文/项目p与专家r的合作距离,min是求最小值的函数;
步骤3:确定约束条件,计算论文/项目-专家的指示关系;
其中,约束条件为论文/项目的任一作者/申请人与专家无合作发表论文/申请项目、非师生关系、不属于同一机构;论文/项目的作者/申请人与专家是否无合作,可通过论文/项目-专家的合作距离得出;论文/项目的作者/申请人与专家是否非师生关系、不属于同一机构的条件由用户给定;
其中,论文/项目-专家的指示关系,记为B(p,r),表示论文/项目p的任一作者/申请人a与专家r是否满足无合作发表论文/申请项目、非师生关系、不属于同一机构的约束条件;不满足约束条件,值为1,表示存在论文/项目p的作者/申请人a与专家r有关系,则不可分配;满足约束条件,值为0,表示论文/项目p的任一作者/申请人a与专家r没有关系,则可分配;论文/项目-专家的指示关系定义用公式(3)表示:
Figure GDA0002361960290000041
其中,p为论文/项目,r为专家,a是p的作者/申请人集A(p)中的作者/申请人;
Figure GDA0002361960290000051
表示存在;
Figure GDA0002361960290000052
表示对于任意的;
步骤4:确定步骤1中的论文/项目集中每篇论文/项目的审阅数、论文/项目数及专家数,计算平均审阅数及冗余审阅数;
其中,每篇论文/项目的审阅数,记为k,k为整数常量且k>1;
平均审阅数,记为averageNum,平均审阅数的计算公式为(4):
Figure GDA0002361960290000053
其中,
Figure GDA0002361960290000054
表示对(k×g)/f向上取整;
冗余审阅数,记为remainNum,冗余审阅数的计算公式为(5):
remainNum=(k×g)%f; (5)
其中,(k×g)%f表示(k×g)对f取整数类型余数;
为了保证均衡分配,专家集R中每名专家r的审阅数,记为r.num,r.num等于averageNum或averageNum-1;审阅数等于averageNum的专家子集,记为Ra,|Ra|等于remainNum,|Ra|表示Ra的大小;
步骤5:根据步骤1中论文/项目-专家的标签相似度、步骤2中论文/项目-专家的合作距离及最大合作距离,确定论文/项目-专家的匹配度;
其中,论文/项目-专家的匹配度用公式(6)表示:
Figure GDA0002361960290000055
其中,M(p,r)代表论文/项目p与专家r的匹配度,D(p,r)代表代表论文/项目p与专家r的合作距离,S(p,r)代表代表论文/项目p与专家r的标签相似度,max是求最大值的函数;α为平衡参数,由用户给定;MAXD代表最大合作距离,由用户给定;从公式(6)可以看出,论文/项目与专家的标签相似度越高、合作距离越远,匹配度M(p,r)就越高;
步骤6:建立结果集并将其初始化为空,初始化结果集的匹配度和、标签相似度和、合作距离和为零;
其中,结果集存储最优分配方案,记为result,其形式为:
Figure GDA0002361960290000056
结果集result中的p0,...,pg-1以及下标
Figure GDA0002361960290000057
表示论文/项目集中的第0到g-1篇论文/项目;
其中,分配给论文/项目pi的专家集,记为
Figure GDA0002361960290000058
的大小为k;论文/项目pi的专家集
Figure GDA0002361960290000061
的形式为:
Figure GDA0002361960290000062
其中,
Figure GDA0002361960290000063
Figure GDA0002361960290000064
中的下标
Figure GDA0002361960290000065
均表示论文/项目集中的第i篇论文/项目pi;上标0,1,...,k-1表示序号;
结果集result的匹配度和,记为sumMatching,用公式(7)表示:
Figure GDA0002361960290000066
其中,
Figure GDA0002361960290000067
代表论文/项目pi与专家
Figure GDA0002361960290000068
的标签相似度;
Figure GDA0002361960290000069
代表分配给论文/项目pi的专家集中的第j名专家;上标j表示序号;pi及下标pi代表论文/项目集中的第i篇论文/项目;
结果集result的标签相似度和,记为sumSimilarity,用公式(8)表示:
Figure GDA00023619602900000610
其中,
Figure GDA00023619602900000611
代表论文/项目pi与专家
Figure GDA00023619602900000612
的标签相似度;
Figure GDA00023619602900000613
代表分配给论文/项目pi的专家集中的第j名专家;上标j表示序号;pi及下标pi代表论文/项目集中的第i篇论文/项目;
结果集result的合作距离和,记为sumDistance,用公式(9)表示:
Figure GDA00023619602900000614
其中,
Figure GDA00023619602900000615
代表论文/项目pi与专家
Figure GDA00023619602900000616
的标签相似度;
Figure GDA00023619602900000617
代表分配给论文/项目pi的专家集中的第j名专家;上标j表示序号;pi及下标
Figure GDA00023619602900000618
代表论文/项目集中的第i篇论文/项目;
步骤7:根据步骤3中论文/项目-专家的指示关系、步骤4中平均审阅数及冗余审阅数、步骤6中结果集的匹配度和,确定最优化目标;
其中,评审分配的最优化问题为,在满足约束条件下,实现均衡评审分配,最大化论文/项目与专家的标签相似度和、合作距离和;
本方法综合论文/项目与专家的标签相似度与合作距离,将最优分配方案的目标转化为:在满足约束条件下,实现均衡评审分配,最大化结果集result的匹配度和;此最优化分配问题用公式(10)表示:
Figure GDA0002361960290000071
公式(10)中,第一行表示最优化目标是最大化结果集的匹配度和,其中,sumMatching代表结果集result的匹配度和,max是求最大值的函数;第二行至第七行为最优化目标的约束条件,其中g表示论文/项目集大小,k表示每篇论文/项目的审阅数,i,j为大于等于0小于g的整数变量,s,t为大于等于0小于k的整数变量,上标s,t表示序号,下标
Figure GDA0002361960290000072
分别表示论文/项目集中的第i与j篇论文/项目,
Figure GDA0002361960290000073
表示存在,
Figure GDA0002361960290000074
表示对于任意的,==表示等于,≠表示不等于;第三行表示对于任意的分配给论文/项目pi的专家集
Figure GDA0002361960290000075
论文/项目pi
Figure GDA0002361960290000076
中的第s名专家的指示关系为0,其中,
Figure GDA0002361960290000077
表示分配给论文/项目pi的专家集,
Figure GDA0002361960290000078
分别表示
Figure GDA0002361960290000079
的第s名专家,
Figure GDA00023619602900000710
表示论文/项目pi与分配给论文/项目pi第s名专家的指示关系;第四行表示对于任意的分配给论文/项目pi的专家集
Figure GDA00023619602900000711
中的第s名专家与第t名专家不能相同,其中,
Figure GDA00023619602900000712
分别表示
Figure GDA00023619602900000713
中第s和第t名专家;第五行表示存在论文/项目pi的专家集
Figure GDA00023619602900000714
与论文/项目pj专家集
Figure GDA00023619602900000715
中第s名专家与
Figure GDA00023619602900000716
中第t或者s名专家相同;第六行表示对于专家集R中的任意专家r,专家r的审阅数为averageNum或(averageNum-1);第七行Ra表示审阅数为averageNum的专家子集,其大小|Ra|等于remainNum。
步骤8:建立论文/项目-专家的分配数组,记录论文/项目-专家的分配状态、匹配度、标签相似度与合作距离,并将分配数组中的元素初始化为零向量;
建立论文/项目-专家的分配数组,记为Q,其大小为g×f,其中g,f分别表示论文/项目集P以及专家集R的大小;分配数组的每个元素Q[p,r]是由论文/项目p-专家r的分配状态、匹配度、标签相似度与合作距离组成的向量:论文/项目-专家的分配状态,记为selected(1代表已分配、0代表可分配、-1代表不可分配);论文/项目p-专家r的匹配度,记为M;论文/项目p-专家r的标签相似度,记为S;论文/项目p-专家r的合作距离,记为D;初始化分配数组的每个元素为零向量,即(0,0,0,0)。
步骤9:遍历论文/项目集,在满足最优化目标的约束条件的前提下,依次进行评审分配,并得出论文/项目-专家的分配数组的最终结果;
其中,最优化目标的约束条件为公式(10)中的第二行至第六行;
对于论文/项目集P中的每篇论文/项目pi,0≤i<g,依次进行评审分配,其中g为论文/项目集P的大小,i为大于等于0小于g的整数变量,具体按照以下步骤执行:
步骤9.1:对于专家集R中的每名专家rj,0≤j<f,其中f为专家集R的大小,j为大于等于0小于f的整数变量;若B(pi,rj)==0,则计算论文/项目pi-专家rj的标签相似度S(pi,rj)、合作距离D(pi,rj)和匹配度M(pi,rj),将Q[i][j]的值置为(0,M(pi,rj),S(pi,rj),D(pi,rj));若B(pi,rj)==1,则将Q[i][j]置为(-1,0,0,0)。其中下标i为大于等于0小于g的整数变量,下标j为大于等于0小于f的整数变量;pi表示论文/项目集中的第i篇论文/项目;rj表示专家集中的第j名专家;B(pi,rj)表示论文/项目pi与专家rj的指示关系;Q表示论文/项目-专家的分配数组,Q[i][j]为数组Q中论文/项目pi与专家rj的分配向量,其中第一项表示分配状态selected,第二至四项分别表示论文/项目pi-专家rj的匹配度M(pi,rj)、标签相似度S(pi,rj)和合作距离D(pi,rj)。
步骤9.2:为论文/项目pi分配k位评审,0≤jj<k,其中k为每篇论文/项目的审阅数,由用户指定,jj为大于等于0小于k的整数变量,执行最大匹配度优先与最小差调整算法,具体为:
步骤9.2.1:根据最大匹配度优先分配评审,具体为:选择与论文/项目pi的匹配度最大且可分配的1位专家r,将Q中相应的元素的selected置为1,选中专家r的审阅数r.num加1;
步骤9.2.2:若i<averageNum或选中专家r的审阅数小于averageNum,不用调整,转至步骤9.2.5;
步骤9.2.3:根据选中专家r的审阅数与averageNum的比较关系,以及审阅数等于averageNum的专家子集Ra的大小与remainNum的比较关系,判断是否执行最小差调整;若需要调整,则设置待调整的专家子集;否则转至步骤9.2.5;具体为:
①若选中专家r的审阅数等于averageNum,将专家r加入审阅数等于averageNum的专家子集Ra;加入后,若|Ra|≤remainNum,不用调整,转至9.2.5;若|Ra|>remainNum,需要调整,设置待调整的专家子集为Ra
②若选中专家r的审阅数大于averageNum,需要调整,设置待调整的专家子集为{r};
步骤9.2.4:根据最小差原则调整分配状态;
其中,最小差原则为:首先,若|Ra|<remainNum,设置最小差调整的专家审阅数为available=averageNum;若|Ra|≥remainNum,设置最小差调整的专家审阅数为available=averageNum-1;其次,在论文/项目集的第(0-i)篇论文子集和待调整的专家子集中,若论文/项目p与专家r为已分配状态,则将论文/项目p与专家r的匹配度值,减去p与专家集R中可分配的、匹配度最大的且审阅数小于available的专家r′的匹配度,若所得差值最小,则将Q[p][r]的分配状态置为-1,Q[p][r′]的分配状态置为1;根据调整后专家r的审阅数r.num以及专家r′的审阅数r′.num,调整Ra
步骤9.2.5:jj=jj+1;若jj<k,转至步骤9.2.1;
步骤9.3:i=i+1;若i<g,转至步骤9.1;
步骤10:根据步骤9得出的论文/项目-专家的分配数组的最终结果,计算得结果集,以及结果集的匹配度和、标签相似度和、合作距离和;
根据论文/项目-专家的分配数组Q的最终结果,可得最优评审分配的结果集result,计算对应的匹配度和sumMatching、标签相似度和sumSimilarity、合作距离和sumDistance,输出结果;
至此,从步骤1到步骤10,完成了一种融合学术专长与社会网络的评审分配方法。
有益效果
一种融合学术专长与社会网络的评审分配方法,与现有技术对比,本方法具有如下有益效果:
1.本方法基于论文/项目数据库建模社会网络,提出论文/项目的作者/申请人与专家的合作距离,应用于评审分配方法中,可以降低专家的主观因素,提高了评审过程的客观性;
2.相较于仅依靠专业领域相似度进行评审分配的方法相比,本方法综合考虑论文/项目与专家的标签相似度与合作距离,提出论文/项目与专家的匹配度,确立了更加全面的最优化目标;
3.本方法设计了最大匹配度优先与最小差调整算法,能够在满足最优化目标的约束条件下,实现均衡评审分配,最大化结果集的标签相似度和与合作距离和,提供更加合理的评审分配方案;
4.本方法适用于不同形式的学术会议、期刊及项目的评审分配场景中,应用范围广,实用性强,易于推广。
附图说明
图1为本发明“一种融合学术专长与社会网络的评审分配方法”中的评审分配方法及实施例1的流程示意图;
图2为本发明“一种融合学术专长与社会网络的评审分配方法”中的最大匹配度优先与最小差调整算法及实施例4的流程示意图。
具体实施方式
下面根据附图及实施例对本发明进行详细说明,但本发明的具体实施形式并不局限于此。
实施例1
本实施例详细阐述了本发明“一种融合学术专长与社会网络的评审分配方法”应用于某学术会议在论文评审管理时的评审分配的流程。
图1为本方法的算法流程图以及本实施例的流程图;从图中可看出,本方法包含如下步骤:
步骤A:给定4个标签、带标签的10篇论文和7名专家,每篇论文由2名作者共同完成,建立标签集、带标签的论文集与专家集,以及论文集的作者集;得出论文数及专家数、标签相似度矩阵以及论文-专家的标签相似度;
具体到本实施例,建立标签集T={a,b,c,d},带标签的论文集P={p0,p1,p2,p3,p4,p5,p6,p7,p8,p9},带标签的专家集R={r0,r1,r2,r3,r4,r5,r6};集合大小|T|=4,|P|=10,|R|=7;建立论文集的作者集:A={A(p0),A(p1),A(p2),A(p3),A(p4),A(p5),A(p6),A(p7),A(p8),
Figure GDA0002361960290000114
论文集P的标签T(P)={T(p0),T(p1),T(p2),T(p3),T(p4),T(p5),T(p6),T(p7),T(p8),r(p9)}={(a,b),(a,c),(d),(b,c),(a,b),(c,d),(b),(a),(b,d),(c)};专家集的R标签T(R)={T(r0),T(r1),T(r2),T(r3),T(r4),T(r5),T(r6)}={(a),(b),(c),(d),(a),(c),(d)};
Figure GDA0002361960290000115
根据论文合作数据库统计计算得标签相似度矩阵S[4][4]:
Figure GDA0002361960290000111
根据论文-专家标签相似度定义,可得论文-专家的标签相似度S(p,r):
Figure GDA0002361960290000112
步骤B:基于论文合作数据库建立包含200个节点、5000条边的权值为1的无向社交网络G,给定最大合作距离MAXD=50,得出论文集的作者-专家的合作距离数组D[10][7]及论文-专家的合作距离D(p,r);
步骤C:给定作者与专家无合作、非师生、不属于同一机构的约束条件,计算论文-专家的指示关系;
具体到本实施例,论文p5中的作者
Figure GDA0002361960290000113
与专家r3属同一机构;根据论文-专家的合作距离,得出论文p2与专家r0、论文p6与专家r1、论文p9与专家r6有合作;由论文-专家的关系指示函数B(p,r)的定义,计算得B(p,r):
Figure GDA0002361960290000121
步骤D:确定每篇论文的审阅数k=3,论文数为10,专家数为7,计算平均审阅数及冗余审阅数;
具体到本实施例,计算平均审阅数
Figure GDA0002361960290000122
计算冗余审阅数remainNum=(3×10)%7=2;为了保证均衡分配,专家集R中每名专家r的审阅数r.num为5或4,用Ra表示审阅数等于5的专家子集,且|Ra|==2;
步骤E:根据步骤A中论文-专家的标签相似度、步骤B中论文-专家的合作距离及最大合作距离,确定论文-专家的匹配度;
具体本实施例,论文-专家的标签相似度为S(p,r),步骤2中论文-专家的合作距离D(p,r)及最大合作距离MAXD=50,给定平衡参数α=0.5,论文-专家的匹配度计算公式为:
Figure GDA0002361960290000123
步骤F:建立结果集result,初始化为空;初始化结果集的匹配度和、标签相似度和、合作距离和为零;
具体本实施例,结果集result存储最优分配方案,是由10个二元组<p,R>组成的集合;结果集result的形式为:
Figure GDA0002361960290000124
其中分配给论文pi的专家集
Figure GDA0002361960290000127
为由3名专家组成的集合,
Figure GDA0002361960290000125
形式为:
Figure GDA0002361960290000126
初始化结果集的匹配度和sumMatching、标签相似度和sumSimilarity、合作距离和sumDistance为0;
步骤G:根据步骤C中论文-专家的指示关系、步骤D中平均审阅数及冗余审阅数以及步骤F中结果集的匹配度和,确定最优化目标;
步骤H:建立论文-专家的分配数组Q[10][7],用来存储论文-专家的分配状态selected(1已分配、0可分配,-1不可分配)、匹配度M、标签相似度S与合作距离D;初始化分配数组的每个元素为零向量,即(0,0,0,0);
步骤I:遍历论文集,在满足最优化目标的约束条件的前提下,依次进行评审分配,并得出论文-专家的分配数组的最终结果;
对于论文集P中的每篇论文pi,0≤i<10,依次进行评审分配,具体按照以下步骤执行:
步骤I.1:对于专家集R中的每名专家rj,0≤j<7,若B(pi,rj)==0,则计算论文pi-专家rj的标签相似度S、合作距离D与匹配度M,将Q[i][j]置为(0,M,S,D);若B(pi,rj)==1,则将Q[i][j]置为(-1,0,0,0);
具体到本实施例,当i=5时,0≤j<7,计算后,Q为:
Figure GDA0002361960290000131
步骤I.2:为论文pi分配3位评审,执行最大匹配度优先与最小差调整算法;
步骤I.3:i=i+1;若i<10,转至I.1;
步骤J:步骤I得出的论文-专家的分配数组的最终结果,计算得结果集,以及结果集的匹配度和、标签相似度和、合作距离和;
具体到本实施例,论文-专家的分配数组Q[10][7]的最终结果为:
Figure GDA0002361960290000141
计算的最优评审分配的结果集result,即为最优分配结果:
{<p0,{r0,r1,r4}>,<p1,{r2,r3,r5}>,<p2,{r3,r5,r6}>,<p3,{r1,r2,r5}>,<p4,{r0,r2,r4}>,
<p5,{r0,r2,r6}>,<p6,{r3,r4,r6}>,<p7,{r0,r4,r6}>,<p8,{r1,r3,r4}>,<p9,{r1,r2,r5}>}
计算结果集result对应的匹配度和sumMatching=18.49,标签相似度和sumSimilarity=26.8,合作距离和sumDistance=509。
实施例2
本实施例按照实施例1所述的参数,具体阐述了本发明步骤2定义的论文/项目-专家的合作距离及实施例1的步骤B中的论文-专家的合作距离的计算过程。
具体过程为:社会网络G=(V,E),节点集|V|=200,且专家集
Figure GDA0002361960290000143
论文作者集
Figure GDA0002361960290000144
边集|E|=5000;根据定义,计算得论文的作者-专家的合作距离数组D[10][7]:
Figure GDA0002361960290000142
根据定义,计算得论文-专家的合作距离D(p,r):
Figure GDA0002361960290000151
如果不考虑论文-专家的合作距离,仅考虑最大化论文-专家的标签相似度,进行评审分配,则专家很可能因为主观因素而影响对论文的评审的客观性;其中论文-专家的标签相似度由实施例1的S(p,r)得出;
具体到本实施例,论文p6与专家r1的标签相似度为1,则论文p6会被分配给专家r1进行评审;而论文p6与专家r1的合作距离为1,表示论文p6与专家r1有合作,在现实中存在学术交流,则专家r1很可能会受到主观因素的影响而提高对论文p6的评审分数;同样,论文p1与专家r0、论文p4与专家r1、论文p8与专家r6的标签相似度均为1,而论文p1与专家r0、论文p4与专家r1、论文p8与专家r6的合作距离分别为3、4、3,论文的作者与专家有较短的合作路径,则很可能存在现实中的学术交流;如果仅按照最大化论文-专家的标签相似度进行评审分配,则不能保证评审的客观性;而实施例1中按照本发明所用评审分配方法得出的评审分配结果,论文p1,p4,p6,p8没有分配给相应的专家r0,r1,r1,r6,因而降低了专家的主观因素,提高了评审过程的客观性。
实施例3
本实施例按照实施例1所述的参数,具体阐述了本发明步骤5定义的论文/项目-专家的匹配度、步骤7定义的最优化目标及实施例1的步骤E的论文-专家的匹配度、步骤G确定的最优化目标。
具体到本实施例,步骤E:论文-专家的匹配度计算公式为:
Figure GDA0002361960290000152
步骤G:评审分配的最优化目标为:
max sumMatching
st.for 0≤i,j<10 and i≠j,0≤s,t<3 and s≠t,that
Figure GDA0002361960290000161
Figure GDA0002361960290000162
Figure GDA0002361960290000163
Figure GDA0002361960290000164
for Ra,that|Ra|==2
本实施例确立的最优化目标,在满足约束条件和均衡分配的前提下,最大化论文-专家的匹配度;而最大化论文-专家的匹配度,需要同时最大化论文-专家的标签相似度与合作距离;相较于仅依靠专业领域相似度进行评审分配的方法相比,本发明所用方法的最优化目标更加全面。
实施例4
本实施例具体阐述了本发明步骤9中叙述的最大匹配度优先与最小差调整算法及实施例1中步骤I的执行流程,算法流程如图2所示。
从图2中可以看出,最大匹配度优先与最小差调整算法的具体步骤为:
步骤I:遍历论文集,在满足最优化目标的约束条件的前提下,依次进行评审分配,并得出论文-专家的分配数组的最终结果;
对于论文集P中的每篇论文pi,0≤i<10,依次进行评审分配,具体按照以下步骤执行:
步骤I.1:对于专家集R中的每名专家rj,0≤j<7,若B(pi,rj)==0,则计算论文pi-专家rj的标签相似度S、合作距离D与匹配度M,将Q[i][j]置为(0,M,S,D);若B(pi,rj)==1,则将Q[i][j]置为(-1,0,0,0);
步骤I.2:为论文pi分配3位评审,0≤jj<3,执行最大匹配度优先与最小差调整算法,执行步骤为:
步骤I.2.1:根据最大匹配度优先分配评审,选择与论文pi的匹配度值最大且可分配的1位专家r,将Q中相应的元素置为(1,M,S,D),选中专家r的审阅数加1;
具体到本实施例,当i=5,jj=0时,选择匹配度值最大且可分配的1位专家为r0,分配后,Q为:
Figure GDA0002361960290000171
步骤I.2.2:若i<5或选中专家r的审阅数小于5,不用调整,转至I.2.5;
具体到本实施例,i=5,jj=0时,选中专家r0的审阅数为3,小于5,不用调整;
步骤I.2.3:根据选中专家r的审阅数与averageNum的比较关系,以及审阅数等于averageNum的专家子集Ra的大小与remainNum的比较关系,判断是否执行最小差调整;若需要调整,则设置待调整的专家子集;否则转至I.2.5;
(a)若选中专家r的审阅数等于5,将专家r加入审阅数等于5的专家子集Ra;加入后,若|Ra|≤2,不用调整,转至I.2.5;若|Ra|>2,需要调整,设置待调整的专家子集为Ra
具体到本实施例,当i=6,jj=2时,选定专家r5后,专家r5的审阅数为5,将r5加入Ra,此时Ra={r4,r5},|Ra|≤2,不用调整,此时Q为:
Figure GDA0002361960290000172
当i=9,jj=1时,选定专家r2后,专家r2的审阅数为5,将r2加入Ra后,Ra={r2,r4,r5},|Ra|=3>2,需要调整,设置待调整专家子集为{r2,r4,r5};
(b)若选中专家r的审阅数大于5,需要调整,设置待调整的专家子集为{r};
具体到本实施例,当i=7,jj=0时,选中专家r4后,专家r4的审阅数为6,大于5,设置待调整专家子集为{r4};
步骤I.2.4:执行最小差调整;
调整原则为:若|Ra|<2,设置最小差调整的专家审阅数为available=5;若|Ra|≥2,设置最小差调整的专家审阅数为available=5-1=4;在论文集的(0-i)论文子集和待调整的专家子集中,若论文p与专家r为已分配状态,则将论文p与专家r的匹配度值,减去p与专家集R中、可分配的、审阅数小于available的、匹配度最大的专家r′的匹配度值,若所得差值最小,则将Q[p][r]的分配状态置为-1,Q[p][r′]的分配状态置为1;
具体到本实施例,当i=9,jj=1时,选定专家r2后,专家r2的审阅数为5,将r2加入Ra,Ra={r2,r4,r5},|Ra|=3>2,待调整专家子集为{r2,r4,r5},调整前Q为:
Figure GDA0002361960290000181
执行最小差调整:|Ra|=3,设置available=4;在论文(0-9)中,与待调整专家子集{r2,r4,r5},与专家r2为已分配状态的论文为{p1,p3,p4,p5,p9},与专家r4为已分配状态的论文为{p0,p4,p6,p7,p8},与专家r5为已分配状态的论文为{p1,p2,p3,p6,p9},根据最小差定义,计算得最小差为:Q[6][5].M-Q[6][6].M=0.52-0.42=0.1,调整Q[6][5]的分配状态置为-1,Q[6][6]置为已分配;调整后Ra={r2,r4},|Ra|=2;调整后的Q为:
Figure GDA0002361960290000182
当i=7,jj=0时,选中专家r4后,专家r4的审阅数为6,大于5,待调整专家子集为{r4},调整前Q为:
Figure GDA0002361960290000191
执行最小差调整:|Ra|=2,设置available=4;在论文(0-7)中,与待调整专家r4为已分配状态的论文为{p0,p1,p3,p4,p6,p7},根据最小差定义,计算得最小差为:Q[1][4].M-Q[1][3].M=0.56-0.55=0.01;调整Q[1][4]的分配状态置为-1,Q[1][3]置为已分配,调整后Q为:
Figure GDA0002361960290000192
步骤I.2.5:jj=jj+1;若jj<3,转至I.2.1;
步骤I.3:i=i+1;若i<10,转至I.1;
由本实施例的最大匹配度优先与最小差调整算法的执行过程以及实施例1的评审分配结果可以看出,本发明所用方法能够在满足最优化目标的约束条件下,实现均衡评审分配,最大化结果集的标签相似度和与合作距离和,提供更加合理的评审分配方案。
实施例5
将实施例1中的某学术会议改成其他学术会议、期刊及项目的评审分配管理场景中,本发明所提出的评审分配方法依然有效。
上述实施方式中未述及的有关技术内容采取或借鉴已有技术即可实现。
以上所述为本发明的较佳实施例而已,本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。

Claims (9)

1.一种融合学术专长与社会网络的评审分配方法,简称本方法,本方法能够在满足论文/项目的作者/申请人与专家无合作、非师生、不属于同一机构的约束条件下,实现均衡评审分配,最大化评审分配的标签相似度和与合作距离和,确保评审结果的客观、公平、公正;为实现上述目的,本方法其特征在于:包括如下步骤:
步骤1:根据给定数据集,建立标签集、带标签的论文/项目集与专家集,以及论文/项目集的作者/申请人集;得出论文/项目数及专家数、标签相似度矩阵以及论文/项目-专家的标签相似度;
步骤2:建模社会网络,确定最大合作距离,得出论文/项目集的作者/申请人-专家的合作距离数组、论文/项目-专家的合作距离;
步骤3:确定约束条件,计算论文/项目-专家的指示关系;
步骤4:确定步骤1中的论文/项目集中每篇论文/项目的审阅数、论文/项目数及专家数,计算平均审阅数及冗余审阅数;
步骤5:根据步骤1中论文/项目-专家的标签相似度、步骤2中论文/项目-专家的合作距离及最大合作距离,确定论文/项目-专家的匹配度;
步骤6:建立结果集并将其初始化为空,初始化结果集的匹配度和、标签相似度和、合作距离和为零;
步骤7:根据步骤3中论文/项目-专家的指示关系、步骤4中平均审阅数及冗余审阅数、步骤6中结果集的匹配度和,确定最优化目标;
步骤8:建立论文/项目-专家的分配数组,记录论文/项目-专家的分配状态、匹配度、标签相似度与合作距离,并将分配数组中的元素初始化为零向量;
步骤9:遍历论文/项目集,在满足最优化目标的约束条件的前提下,依次进行评审分配,并得出论文/项目-专家的分配数组的最终结果;
步骤10:根据步骤9得出的由论文/项目-专家的分配数组的最终结果,计算得结果集,以及结果集的匹配度和、标签相似度和、合作距离和;
至此,从步骤1到步骤10,完成了一种融合学术专长与社会网络的评审分配方法。
2.根据权利要求1所述的一种融合学术专长与社会网络的评审分配方法,其特征在于:步骤1中,标签集,记为T;论文/项目集,记为P;专家集,记为R;论文/项目集P的作者/申请人集,记为A;集合大小|T|=h,|P|=g,|R|=f,|T|代表标签集T的大小,|P|代表论文/项目集P的大小,|R|代表专家集R的大小,且标签集T、论文/项目集P以及专家集R的大小,分别记为h,g,f,h,g及f均为大于1的整数常量;
对P中的任何一篇论文/项目p,p的标签集表示为T(p),p的作者/申请人集表示为A(p),|A(p)|为大于1的整数且不唯一,|A(p)|代表作者/申请人集A(p)的大小;对R中的任一专家r,r的标签表示为T(r);且
Figure FDA0002786391140000021
标签相似度矩阵,记为S,其大小为h×h,其中h表示标签集的大小;其中每个元素表示相应的一对标签的相似度由用户设定或者通过论文/项目合作关系数据库统计计算得到;
其中,论文/项目-专家的标签相似度,定义为论文/项目p与专家r的标签相似度的最大值,用公式(1)表示:
S(p,r)=max S[ti][tj],ti∈T(p),tj∈T(r); (1)
其中,S(p,r)代表论文/项目p与专家r的标签相似度的最大值,max是求最大值的函数,S[ti][tj]代表相似度矩阵中标签ti和标签tj的相似度;其中,ti代表T(p)中第i个标签,tj代表T(r)中第j个标签;下标i,j为大于等于0,小于h的整数变量;
每篇论文/项目的审阅数,记为k,k为整数常量且k>1;
平均审阅数,记为averageNum,平均审阅数的计算公式为(2):
Figure FDA0002786391140000022
其中,
Figure FDA0002786391140000023
表示对(k×g)/f向上取整;
冗余审阅数,记为remainNum,冗余审阅数的计算公式为(3):
remainNum=(k×g)%f; (3)
其中,(k×g)%f表示(k×g)对f取整数类型余数;
为了保证均衡分配,专家集R中每名专家r的审阅数,记为r.num,r.num等于averageNum或averageNum-1。
3.根据权利要求2所述的一种融合学术专长与社会网络的评审分配方法,其特征在于:步骤2中,建模社会网络通过论文/项目合作关系数据库获得,具体为:
社会网络,记为G,G=(V,E)为权值为1的无向网;其中节点集,记为V,|V|=n,|V|表示节点集V的大小,n为大于1的整数常量;每个节点代表一位作者/申请人;且步骤1中的专家集
Figure FDA0002786391140000031
论文/项目集的作者/申请人集
Figure FDA0002786391140000032
边集,记为E,|E|=m,|E|表示边集E的大小,m为大于1的整数常量;每条边表示边连接的两名作者/申请人之间有合作的结合;
任意两名作者/申请人的合作距离定义为相应的两个节点之间的最短路径;最大合作距离,记为MAXD,如果两个节点之间不可达或者最短路径值大于MAXD,则合作距离设为MAXD;最大合作距离由用户给定;
计算论文/项目集的作者/申请人-专家的合作距离数组DIS,其大小为g×f,其中g,f分别表示论文/项目集P以及专家集R的大小;数组中的每个元素DIS[p][r],是由论文/项目p的作者/申请人与专家r的合作距离组成的向量,该向量的长度为|A(p)|,A(p)代表论文/项目p的作者/申请人集;
论文/项目-专家的合作距离定义为论文/项目p的作者/申请人与专家r的合作距离组成的向量中的最小值,用公式(4)表示:
D(p,r)=min D[p][r]; (4)
其中,D(p,r)代表论文/项目p与专家r的合作距离,min是求最小值的函数。
4.根据权利要求3所述的一种融合学术专长与社会网络的评审分配方法,其特征在于:步骤3中,约束条件为论文/项目的任一作者/申请人与专家无合作发表论文/申请项目、非师生关系、不属于同一机构;论文/项目的作者/申请人与专家是否无合作,可通过论文/项目-专家的合作距离得出;论文/项目的作者/申请人与专家是否非师生关系、不属于同一机构的条件由用户给定;
其中,论文/项目-专家的指示关系,记为B(p,r),表示论文/项目p的任一作者/申请人a与专家r是否满足无合作发表论文/申请项目、非师生关系、不属于同一机构的约束条件;不满足约束条件,值为1,表示存在论文/项目p的作者/申请人a与专家r有关系,则不可分配;满足约束条件,值为0,表示论文/项目p的任一作者/申请人a与专家r没有关系,则可分配;论文/项目-专家的指示关系定义用公式(5)表示:
Figure FDA0002786391140000041
其中,p为论文/项目,r为专家,a是p的作者/申请人集A(p)中的作者/申请人;
Figure FDA0002786391140000042
表示存在;
Figure FDA0002786391140000043
表示对于任意的。
5.根据权利要求4所述的一种融合学术专长与社会网络的评审分配方法,其特征在于:步骤5中,论文/项目-专家的匹配度用公式(6)表示:
Figure FDA0002786391140000044
其中,M(p,r)代表论文/项目p与专家r的匹配度,D(p,r)代表论文/项目p与专家r的合作距离,S(p,r)代表论文/项目p与专家r的标签相似度,α为平衡参数,由用户给定;MAXD代表最大合作距离,由用户给定;从公式(6)可以看出,论文/项目与专家的标签相似度越高、合作距离越远,匹配度M(p,r)就越高。
6.根据权利要求5所述的一种融合学术专长与社会网络的评审分配方法,其特征在于:步骤6中,结果集存储最优分配方案,记为result,其形式为:
Figure FDA0002786391140000045
结果集result中的p0,...,pg-1以及下标p0,...,pg-1表示论文/项目集中的第0到g-1篇论文/项目;
其中,分配给论文/项目pi的专家集,记为
Figure FDA0002786391140000046
的大小为k;论文/项目pi的专家集
Figure FDA0002786391140000047
的形式为:
Figure FDA0002786391140000048
其中,
Figure FDA0002786391140000049
Figure FDA00027863911400000410
中的下标pi均表示论文/项目集中的第i篇论文/项目pi;上标0,1,...,k-1表示序号;
结果集result的匹配度和,记为sumMatching,用公式(7)表示:
Figure FDA00027863911400000411
其中,
Figure FDA00027863911400000412
代表论文/项目pi与专家
Figure FDA00027863911400000413
的标签相似度;
Figure FDA00027863911400000414
代表分配给论文/项目pi的专家集中的第j名专家;上标j表示序号;pi及下标pi代表论文/项目集中的第i篇论文/项目;
结果集result的标签相似度和,记为sumSimilarity,用公式(8)表示:
Figure FDA0002786391140000051
其中,
Figure FDA0002786391140000052
代表论文/项目pi与专家
Figure FDA0002786391140000053
的标签相似度;
Figure FDA0002786391140000054
代表分配给论文/项目pi的专家集中的第j名专家;上标j表示序号;pi及下标pi代表论文/项目集中的第i篇论文/项目;
结果集result的合作距离和,记为sumDistance,用公式(9)表示:
Figure FDA0002786391140000055
其中,
Figure FDA0002786391140000056
代表论文/项目pi与专家
Figure FDA0002786391140000057
的标签相似度;
Figure FDA0002786391140000058
代表分配给论文/项目pi的专家集中的第j名专家;上标j表示序号;pi及下标pi代表论文/项目集中的第i篇论文/项目。
7.根据权利要求6所述的一种融合学术专长与社会网络的评审分配方法,其特征在于:步骤7中,评审分配的最优化问题为,在满足约束条件下,实现均衡评审分配,最大化论文/项目与专家的标签相似度和、合作距离和;
本方法综合论文/项目与专家的标签相似度与合作距离,将最优分配方案的目标转化为:在满足约束条件下,实现均衡评审分配,最大化结果集result的匹配度和;此最优化分配问题用公式(10)表示:
Figure FDA0002786391140000059
公式(10)中,第一行表示最优化目标是最大化结果集的匹配度和,其中,sumMatching代表结果集result的匹配度和,max是求最大值的函数;第二行至第七行为最优化目标的约束条件,其中g表示论文/项目集大小,k表示每篇论文/项目的审阅数,i,j为大于等于0小于g的整数变量,s,t为大于等于0小于k的整数变量,上标s,t表示序号,下标pi,pj分别表示论文/项目集中的第i与j篇论文/项目,
Figure FDA0002786391140000061
表示存在,
Figure FDA0002786391140000062
表示对于任意的,==表示等于,≠表示不等于;第三行表示对于任意的分配给论文/项目pi的专家集
Figure FDA0002786391140000063
论文/项目pi
Figure FDA0002786391140000064
中的第s名专家的指示关系为0,其中,
Figure FDA0002786391140000065
表示分配给论文/项目pi的专家集,
Figure FDA0002786391140000066
分别表示
Figure FDA0002786391140000067
的第s名专家,
Figure FDA0002786391140000068
表示论文/项目pi与分配给论文/项目pi第s名专家的指示关系;第四行表示对于任意的分配给论文/项目pi的专家集
Figure FDA0002786391140000069
中的第s名专家与第t名专家不能相同,其中,
Figure FDA00027863911400000610
分别表示
Figure FDA00027863911400000611
中第s和第t名专家;第五行表示存在论文/项目pi的专家集
Figure FDA00027863911400000612
与论文/项目pj专家集
Figure FDA00027863911400000613
中第s名专家与
Figure FDA00027863911400000614
中第t或者s名专家相同;第六行表示对于专家集R中的任意专家r,专家r的审阅数为averageNum或(averageNum-1);第七行Ra表示审阅数为averageNum的专家子集,其大小|Ra|等于remainNum。
8.根据权利要求7所述的一种融合学术专长与社会网络的评审分配方法,其特征在于:步骤8中,建立论文/项目-专家的分配数组,记为Q,其大小为g×f,其中g,f分别表示论文/项目集P以及专家集R的大小;分配数组的每个元素是由论文/项目p-专家r的分配状态、匹配度、标签相似度与合作距离组成的向量:论文/项目-专家的分配状态,记为selected(1代表已分配、0代表可分配、-1代表不可分配);论文/项目p-专家r的匹配度,记为M;论文/项目p-专家r的标签相似度,记为S;论文/项目p-专家r的合作距离,记为D;初始化分配数组的每个元素为零向量,即(0,0,0,0)。
9.根据权利要求7或8所述的一种融合学术专长与社会网络的评审分配方法,其特征在于:步骤9中最优化目标的约束条件为公式(10)中的第二行至第六行;
对于论文/项目集P中的每篇论文/项目pi,0≤i<g,依次进行评审分配,其中g为论文/项目集P的大小,i为大于等于0小于g的整数变量,具体按照以下步骤执行:
步骤9.1:对于专家集R中的每名专家rj,0≤j<f,其中f为专家集R的大小,j为大于等于0小于f的整数变量;若B(pi,rj)==0,则计算论文/项目pi-专家rj的标签相似度S(pi,rj)、合作距离D(pi,rj)和匹配度M(pi,rj),将Q[i][j]的值置为(0,M(pi,rj),S(pi,rj),D(pi,rj));若B(pi,rj)==1,则将Q[i][j]置为(-1,0,0,0),其中下标i为大于等于0小于g的整数变量,下标j为大于等于0小于f的整数变量;pi表示论文/项目集中的第i篇论文/项目;rj表示专家集中的第j名专家;B(pi,rj)表示论文/项目pi与专家rj的指示关系;Q表示论文/项目-专家的分配数组,Q[i][j]为数组Q中论文/项目pi与专家rj的分配向量,其中第一项表示分配状态selected,第二至四项分别表示论文/项目pi-专家rj的匹配度M(pi,rj)、标签相似度S(pi,rj)和合作距离D(pi,rj);
步骤9.2:为论文/项目pi分配k位评审,0≤jj<k,其中k为每篇论文/项目的审阅数,由用户指定,jj为大于等于0小于k的整数变量,执行最大匹配度优先与最小差调整算法,具体为:
步骤9.2.1:根据最大匹配度优先分配评审,具体为:选择与论文/项目pi的匹配度最大且可分配的1位专家r,将Q中相应的元素的selected置为1,选中专家r的审阅数r.num加1;
步骤9.2.2:若i<averageNum或选中专家r的审阅数小于averageNum,不用调整,转至步骤9.2.5;
步骤9.2.3:根据选中专家r的审阅数与averageNum的比较关系,以及审阅数等于averageNum的专家子集Ra的大小与remainNum的比较关系,判断是否执行最小差调整;若需要调整,则设置待调整的专家子集;否则转至步骤9.2.5,具体为:
①若选中专家r的审阅数等于averageNum,将专家r加入审阅数等于averageNum的专家子集Ra;加入后,若|Ra|≤remainNum,不用调整,转至9.2.5;若|Ra|>remainNum,需要调整,设置待调整的专家子集为Ra
②若选中专家r的审阅数大于averageNum,需要调整,设置待调整的专家子集为{r};
步骤9.2.4:根据最小差原则调整分配状态;
其中,最小差原则为:首先,若|Ra|<remainNum,设置最小差调整的专家审阅数为available=averageNum;若|Ra|≥remainNum,设置最小差调整的专家审阅数为available=averageNum-1;其次,在论文/项目集的第(0-i)篇论文子集和待调整的专家子集中,若论文/项目p与专家r为已分配状态,则将论文/项目p与专家r的匹配度值,减去p与专家集R中可分配的、匹配度最大的且审阅数小于avaliable的专家r′的匹配度,若所得差值最小,则将Q[p][r]的分配状态置为-1,Q[p][r′]的分配状态置为1;根据调整后专家r的审阅数r.num以及专家r′的审阅数r′.num,调整Ra
步骤9.2.5:jj=jj+1;若jj<k,转至步骤9.2.1;
步骤9.3:i=i+1;若i<g,转至步骤9.1;
步骤10中根据论文/项目-专家的分配数组Q的最终结果,可得最优评审分配的结果集result,计算对应的匹配度和sumMatching、标签相似度和sumSimilarity、合作距离和sumDistance,输出结果。
CN201710414298.4A 2016-11-09 2017-06-05 一种融合学术专长与社会网络的评审分配方法 Expired - Fee Related CN107194672B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2016109869011 2016-11-09
CN201610986901 2016-11-09

Publications (2)

Publication Number Publication Date
CN107194672A CN107194672A (zh) 2017-09-22
CN107194672B true CN107194672B (zh) 2021-07-13

Family

ID=59877571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710414298.4A Expired - Fee Related CN107194672B (zh) 2016-11-09 2017-06-05 一种融合学术专长与社会网络的评审分配方法

Country Status (1)

Country Link
CN (1) CN107194672B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107833142A (zh) * 2017-11-08 2018-03-23 广西师范大学 学术社交网络科研合作者推荐方法
CN110533386A (zh) * 2019-08-21 2019-12-03 深圳点猫科技有限公司 分发作品给评委的方法及装置
CN111008215B (zh) * 2019-11-29 2021-04-06 中科院计算技术研究所大数据研究院 一种结合标签构建与社区关系规避的专家推荐方法
CN111143690A (zh) * 2019-12-31 2020-05-12 中国电子科技集团公司信息科学研究院 一种基于关联专家库的专家推荐方法和系统
CN113868407B (zh) * 2021-08-17 2024-06-28 北京智谱华章科技有限公司 基于科研大数据的评审推荐算法的评估方法及装置
CN114897281A (zh) * 2022-01-04 2022-08-12 北京航空航天大学 一种专家画像计算方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102012911B (zh) * 2010-11-19 2012-11-14 清华大学 基于约束优化的专家匹配方法及系统
RU2543315C2 (ru) * 2013-03-22 2015-02-27 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики" Способ отбора эффективных вариантов в поисковых и рекомендательных системах (варианты)
CN103631859B (zh) * 2013-10-24 2017-01-11 杭州电子科技大学 一种面向科技项目的评审专家智能推荐方法

Also Published As

Publication number Publication date
CN107194672A (zh) 2017-09-22

Similar Documents

Publication Publication Date Title
CN107194672B (zh) 一种融合学术专长与社会网络的评审分配方法
Du et al. Managing noncooperative behaviors in large-scale group decision-making: Integration of independent and supervised consensus-reaching models
CN109710835B (zh) 一种带有时间权重的异构信息网络推荐方法
CN109255586A (zh) 一种面向电子政务办事的在线个性化推荐方法
Wang et al. A comprehensive survey of the reviewer assignment problem
CN112883289B (zh) 一种基于社交信任和标签语义相似度的pmf推荐方法
CN116561436B (zh) 一种基于知识图谱的数据需求匹配方法
WO2023273295A1 (zh) 基于聚类技术的企业esg指数确定方法及相关产品
US11853400B2 (en) Distributed machine learning engine
Silva et al. Process analytics approach for R&D project selection
Ullah et al. Requirements engineering and Business/IT alignment: Lessons Learned.
CN108984551A (zh) 一种基于多类别联合软聚类的推荐方法及系统
He et al. SRSH: a social recommender system based on Hadoop
Li et al. Multi-attribute feature fusion algorithm for blockchain communications in healthcare systems using machine intelligence
CN113657083A (zh) 面向意图计算与推理的dikw资源交互填充系统
Agarwal et al. WGSDMM+ GA: A genetic algorithm-based service clustering methodology assimilating dirichlet multinomial mixture model with word embedding
Gil-Aluja et al. Using homogeneous groupings in portfolio management
Jung et al. Hierarchical business process clustering
CN108280176A (zh) 基于MapReduce的数据挖掘优化方法
CN109753662B (zh) 一种基于分层网络的重名作者辨识方法
CN114840775A (zh) 一种融合多空间特征的网络对齐模型及其应用
CN107093149A (zh) 在线好友关系强度评估方法及系统
Zhang et al. Fuzzy cognitive map approach for trust-based partner selection in virtual enterprise
CN111460300A (zh) 网络内容推送方法、装置及存储介质
Huang et al. Social network coalescence based on multilayer network model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210713

CF01 Termination of patent right due to non-payment of annual fee