CN107194672B

CN107194672B - 一种融合学术专长与社会网络的评审分配方法

Info

Publication number: CN107194672B
Application number: CN201710414298.4A
Authority: CN
Inventors: 曹朝; 曲大成; 李凯霞
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2016-11-09
Filing date: 2017-06-05
Publication date: 2021-07-13
Anticipated expiration: 2037-06-05
Also published as: CN107194672A

Abstract

本发明公开一种融合学术专长与社会网络的评审分配方法，属于计算机应用技术领域。本方法首先建立标签集、论文/项目集及专家集，依据标签相似度矩阵计算论文/项目与专家的标签相似度；其次基于论文/项目合作数据库建模社会网络，计算论文/项目与专家的合作距离；然后建立论文/项目与专家的分配数组，遍历论文集，依据最大匹配度优先和最小差调整算法，依次进行评审分配；最后输出最优分配结果及其匹配度和、标签相似度和、合作距离和。本方法能够在满足论文/项目的作者/申请人与专家无合作、非师生关系、不属于同一机构的约束条件下，实现均衡评审分配，最大化评审分配的标签相似度和与合作距离和，确保评审结果的客观、公平、公正。

Description

一种融合学术专长与社会网络的评审分配方法

技术领域

本发明涉及一种融合学术专长与社会网络的评审分配方法，属于计算机应用技术、论文/项目评审管理应用领域。

背景技术

目前，国家和高校越来越重视学术及科学研究，论文和项目申请数量也逐年增多，在有限时间内将论文/项目分配给合适的评审成为困扰会议、期刊、项目组织者的难题。评审专家的审阅意见是论文录用或者项目授予的直接依据，因此确保评审结果的公正性、权威性，是组织者一直以来关注的重点。面对大量的论文/项目以及繁重的组织工作，利用计算机技术进行评审分配已成为趋势，但现有的方法大多是在满足用户设定的约束条件前提下，计算论文/项目与专家的专业领域相似度，作为评审分配的主要依据。在论文/项目的作者/申请人与专家存在现实中的直接或间接的学术交流的情况下，专家的主观因素会影响到评审过程的客观性，导致评审结果难免出现偏差。

论文/项目合作数据库记录了大量公开发布的文献资料，包含文章标题、文章作者及合作者、会议/期刊论文集、会议/期刊名称及发布时间等信息；该数据库中的论文/项目的作者/申请人包含了待分配的论文/项目的作者/申请人与专家，以及其他论文/项目的作者/申请人；利用论文/项目的作者/申请人与专家的合作路径，能够很好地反映出论文/项目的作者/申请人与专家在现实中的直接或间接的学术交流情况。

本方法基于论文/项目合作数据库建模社会网络，计算出论文/项目的作者/申请人与专家的合作距离；通过最大化论文/项目与专家的合作距离，降低专家的主观因素，提高了评审过程的客观性；同时结合专业领域标签，最大化论文/项目与专家的标签相似度，为评审分配提供系统全面、科学有效的解决方案。

与本文相关的论文主要有两篇，下文分别对这两篇论文进行剖析：

论文(1)：全国青年管理科学与系统科学学术会议，2007年，作者张正文、唐锡晋，标题为论文分配的支持方法研究。该论文首先计算论文关键词向量和评审知识结构关键词向量之间的相似度作为客观相似度；接着根据评审之间是否有合作或发表过包含相同或同义的关键词，构建社会网络，以评审之间的知识结构关键词向量的相似度为权值，计算最大权值路径作为评审的主观相似度；最后结合评审个人倾向，计算综合相似度，按照递减排序进行评审分配。该论文所用方法虽然构建了结合了社会网络，但是该社会网络仅是用来计算评审之间的相似度，所用评审分配方法的主要依据是专家个人倾向、论文与评审或评审之间的关键词向量相似度，没有考虑论文作者与评审的学术交流情况。

论文(2)：北京交通大学硕士学位论文，2014年，作者夏雷，标题为基于二部图匹配和聚类的论文分配方法研究。该论文构建论文与专家二部图网络，以边的权重作为分配权重；分配权重依据基础权重(值为1)、专家倾向、论文作者与专家是否同单位、论文与专家的研究领域进行计算；基于二部图的匈牙利算法和KM算法，设计均衡分配算法实现了评审分配。该论文所用方法虽然构建了论文与评审的二部图网络，但是该二部图网络的权重计算的主要依据仍是个人倾向、论文与评审的研究领域相似度，依然没有考虑论文作者与评审的学术交流情况。

上述已有的评审分配方法虽然解决了按照论文/项目与专家的专业领域的进行评审分配的问题，但均没有考虑到论文/项目的作者/申请人与专家存在现实中的直接或间接的学术交流的情况，没有将学术专长和社会网络进行深度融合，很可能因专家的主观因素而影响评审结果的客观性。因此，评审分配方法具有很大的改进空间。本发明的目的是即是致力于解决上述评审分配方法的缺陷，提出一种融合学术专长与社会网络的评审分配方法。

发明内容

本发明旨在解决已有的评审分配方法没有考虑论文/项目的作者/申请人与专家的学术交流而影响评审分配的客观性的缺陷，提出了一种融合学术专长与社会网络的评审分配方法。

一种融合学术专长与社会网络的评审分配方法，简称本方法，核心内容为：基于论文/项目合作数据库建模社会网络，提出论文/项目与专家的合作距离；综合论文/项目与专家的相似度与合作距离，提出论文/项目与专家的匹配度，确定最优化目标；采用最大匹配度优先与最小差调整算法，得出论文/项目的最优评审分配结果；本方法能够在满足论文/项目的作者/申请人与专家无合作、非师生、不属于同一机构的约束条件下，实现均衡评审分配，最大化评审分配的标签相似度和与合作距离和，确保评审结果的客观、公平、公正。

为实现上述目的，本方法包括如下步骤：

步骤1：根据给定数据集，建立标签集、带标签的论文/项目集与专家集，以及论文/项目集的作者/申请人集；得出论文/项目数及专家数、标签相似度矩阵以及论文/项目-专家的标签相似度；

其中，标签集，记为T；论文/项目集，记为P；专家集，记为R；论文/项目集P的作者/申请人集，记为A；集合大小|T|＝h，|P|＝g，|R|＝f，|T|代表标签集T的大小，|P|代表论文/项目集P的大小，|R|代表专家集R的大小，且标签集T、论文/项目集P以及专家集R的大小，分别记为h，g，f，h，g及f均为大于1的整数常量；

对P中的任何一篇论文/项目p，p的标签集表示为T(p)，p的作者/申请人集表示为A(p)，|A(p)|为大于1的整数且不唯一，|A(p)|代表作者/申请人集A(p)的大小；对R中的任一专家r，r的标签表示为T(r)；且

标签相似度矩阵，记为S，其大小为h×h，其中h表示标签集的的大小；其中每个元素表示相应的一对标签的相似度，可以由用户设定或者通过论文/项目合作关系数据库统计计算得到；

其中，论文/项目-专家的标签相似度，定义为论文/项目p与专家r的标签相似度的最大值，用公式(1)表示：

S(p，r)＝maxS[t_i][t_j]，t_i∈T(p)，t_j∈T(r)； (1)

其中，S(p，r)代表论文/项目p与专家r的标签相似度的最大值，max是求最大值的函数，S[t_i][t_j]代表相似度矩阵中标签t_i和标签t_j的相似度；其中，t_i代表T(p)中第i个标签，t_j代表T(r)中第j个标签；下标_i，j为大于等于0，小于h的整数变量；

步骤2：建模社会网络，确定最大合作距离，得出论文/项目集的作者/申请人-专家的合作距离数组及论文/项目-专家的合作距离；

其中，建模社会网络可以通过论文/项目合作关系数据库获得，具体为：

社会网络，记为G，G＝(V，E)为权值为1的无向网；其中节点集，记为V，|V|＝n，|V|表示节点集V的大小，n为大于1的整数常量；每个节点代表一位作者/申请人；且步骤1中的专家集

论文/项目集的作者/申请人集

边集，记为E，|E|＝m，|E|表示边集E的大小，m为大于1的整数常量；每条边表示边连接的两名作者/申请人之间有合作的结合；

任意两名作者/申请人的合作距离定义为相应的两个节点之间的最短路径；最大合作距离，记为MAXD，如果两个节点之间不可达或者最短路径值大于MAXD，则合作距离设为MAXD；最大合作距离由用户给定；

计算论文/项目集的作者/申请人-专家的合作距离数组DIS，其大小为g×f，其中g，f分别表示论文/项目集P以及专家集R的大小；数组中的每个元素DIS[p][r]，是由论文/项目p的作者/申请人与专家r的合作距离组成的向量，该向量的长度为|A(p)|，A(p)代表论文/项目p的作者/申请人集；

论文/项目-专家的合作距离定义为论文/项目p的作者/申请人与专家r的合作距离组成的向量中的最小值，用公式(2)表示：

D(p，r)＝min D[p][r]； (2)

其中，D(p，r)代表论文/项目p与专家r的合作距离，min是求最小值的函数；

步骤3：确定约束条件，计算论文/项目-专家的指示关系；

其中，约束条件为论文/项目的任一作者/申请人与专家无合作发表论文/申请项目、非师生关系、不属于同一机构；论文/项目的作者/申请人与专家是否无合作，可通过论文/项目-专家的合作距离得出；论文/项目的作者/申请人与专家是否非师生关系、不属于同一机构的条件由用户给定；

其中，论文/项目-专家的指示关系，记为B(p，r)，表示论文/项目p的任一作者/申请人a与专家r是否满足无合作发表论文/申请项目、非师生关系、不属于同一机构的约束条件；不满足约束条件，值为1，表示存在论文/项目p的作者/申请人a与专家r有关系，则不可分配；满足约束条件，值为0，表示论文/项目p的任一作者/申请人a与专家r没有关系，则可分配；论文/项目-专家的指示关系定义用公式(3)表示：

其中，p为论文/项目，r为专家，a是p的作者/申请人集A(p)中的作者/申请人；

表示存在；

表示对于任意的；

步骤4：确定步骤1中的论文/项目集中每篇论文/项目的审阅数、论文/项目数及专家数，计算平均审阅数及冗余审阅数；

其中，每篇论文/项目的审阅数，记为k，k为整数常量且k＞1；

平均审阅数，记为averageNum，平均审阅数的计算公式为(4)：

其中，

表示对(k×g)/f向上取整；

冗余审阅数，记为remainNum，冗余审阅数的计算公式为(5)：

remainNum＝(k×g)％f； (5)

其中，(k×g)％f表示(k×g)对f取整数类型余数；

为了保证均衡分配，专家集R中每名专家r的审阅数，记为r.num，r.num等于averageNum或averageNum-1；审阅数等于averageNum的专家子集，记为R_a，|R_a|等于remainNum，|R_a|表示R_a的大小；

步骤5：根据步骤1中论文/项目-专家的标签相似度、步骤2中论文/项目-专家的合作距离及最大合作距离，确定论文/项目-专家的匹配度；

其中，论文/项目-专家的匹配度用公式(6)表示：

其中，M(p，r)代表论文/项目p与专家r的匹配度，D(p，r)代表代表论文/项目p与专家r的合作距离，S(p，r)代表代表论文/项目p与专家r的标签相似度，max是求最大值的函数；α为平衡参数，由用户给定；MAXD代表最大合作距离，由用户给定；从公式(6)可以看出，论文/项目与专家的标签相似度越高、合作距离越远，匹配度M(p，r)就越高；

步骤6：建立结果集并将其初始化为空，初始化结果集的匹配度和、标签相似度和、合作距离和为零；

其中，结果集存储最优分配方案，记为result，其形式为：

结果集result中的p₀，...，p_g-1以及下标

表示论文/项目集中的第0到g-1篇论文/项目；

其中，分配给论文/项目p_i的专家集，记为

的大小为k；论文/项目p_i的专家集

的形式为：

其中，

与

中的下标

均表示论文/项目集中的第i篇论文/项目p_i；上标^{0，1，...，k-1}表示序号；

结果集result的匹配度和，记为sumMatching，用公式(7)表示：

其中，

代表论文/项目p_i与专家

的标签相似度；

代表分配给论文/项目p_i的专家集中的第j名专家；上标^j表示序号；p_i及下标p_i代表论文/项目集中的第i篇论文/项目；

结果集result的标签相似度和，记为sumSimilarity，用公式(8)表示：

其中，

代表论文/项目p_i与专家

的标签相似度；

结果集result的合作距离和，记为sumDistance，用公式(9)表示：

其中，

代表论文/项目p_i与专家

的标签相似度；

代表分配给论文/项目p_i的专家集中的第j名专家；上标^j表示序号；p_i及下标

代表论文/项目集中的第i篇论文/项目；

步骤7：根据步骤3中论文/项目-专家的指示关系、步骤4中平均审阅数及冗余审阅数、步骤6中结果集的匹配度和，确定最优化目标；

其中，评审分配的最优化问题为，在满足约束条件下，实现均衡评审分配，最大化论文/项目与专家的标签相似度和、合作距离和；

本方法综合论文/项目与专家的标签相似度与合作距离，将最优分配方案的目标转化为：在满足约束条件下，实现均衡评审分配，最大化结果集result的匹配度和；此最优化分配问题用公式(10)表示：

公式(10)中，第一行表示最优化目标是最大化结果集的匹配度和，其中，sumMatching代表结果集result的匹配度和，max是求最大值的函数；第二行至第七行为最优化目标的约束条件，其中g表示论文/项目集大小，k表示每篇论文/项目的审阅数，i，j为大于等于0小于g的整数变量，s，t为大于等于0小于k的整数变量，上标^s，t表示序号，下标

分别表示论文/项目集中的第i与j篇论文/项目，

表示存在，

表示对于任意的，＝＝表示等于，≠表示不等于；第三行表示对于任意的分配给论文/项目p_i的专家集

论文/项目p_i与

中的第s名专家的指示关系为0，其中，

表示分配给论文/项目p_i的专家集，

分别表示

的第s名专家，

表示论文/项目p_i与分配给论文/项目p_i第s名专家的指示关系；第四行表示对于任意的分配给论文/项目p_i的专家集

中的第s名专家与第t名专家不能相同，其中，

分别表示

中第s和第t名专家；第五行表示存在论文/项目p_i的专家集

与论文/项目p_j专家集

中第s名专家与

中第t或者s名专家相同；第六行表示对于专家集R中的任意专家r，专家r的审阅数为averageNum或(averageNum-1)；第七行R_a表示审阅数为averageNum的专家子集，其大小|R_a|等于remainNum。

步骤8：建立论文/项目-专家的分配数组，记录论文/项目-专家的分配状态、匹配度、标签相似度与合作距离，并将分配数组中的元素初始化为零向量；

建立论文/项目-专家的分配数组，记为Q，其大小为g×f，其中g，f分别表示论文/项目集P以及专家集R的大小；分配数组的每个元素Q[p，r]是由论文/项目p-专家r的分配状态、匹配度、标签相似度与合作距离组成的向量：论文/项目-专家的分配状态，记为selected(1代表已分配、0代表可分配、-1代表不可分配)；论文/项目p-专家r的匹配度，记为M；论文/项目p-专家r的标签相似度，记为S；论文/项目p-专家r的合作距离，记为D；初始化分配数组的每个元素为零向量，即(0，0，0，0)。

步骤9：遍历论文/项目集，在满足最优化目标的约束条件的前提下，依次进行评审分配，并得出论文/项目-专家的分配数组的最终结果；

其中，最优化目标的约束条件为公式(10)中的第二行至第六行；

对于论文/项目集P中的每篇论文/项目p_i，0≤i＜g，依次进行评审分配，其中g为论文/项目集P的大小，i为大于等于0小于g的整数变量，具体按照以下步骤执行：

步骤9.1：对于专家集R中的每名专家r_j，0≤j＜f，其中f为专家集R的大小，j为大于等于0小于f的整数变量；若B(p_i，r_j)＝＝0，则计算论文/项目p_i-专家r_j的标签相似度S(p_i，r_j)、合作距离D(p_i，r_j)和匹配度M(p_i，r_j)，将Q[i][j]的值置为(0，M(p_i，r_j)，S(p_i，r_j)，D(p_i，r_j))；若B(p_i，r_j)＝＝1，则将Q[i][j]置为(-1，0，0，0)。其中下标i为大于等于0小于g的整数变量，下标j为大于等于0小于f的整数变量；p_i表示论文/项目集中的第i篇论文/项目；r_j表示专家集中的第j名专家；B(p_i，r_j)表示论文/项目p_i与专家r_j的指示关系；Q表示论文/项目-专家的分配数组，Q[i][j]为数组Q中论文/项目p_i与专家r_j的分配向量，其中第一项表示分配状态selected，第二至四项分别表示论文/项目p_i-专家r_j的匹配度M(p_i，r_j)、标签相似度S(p_i，r_j)和合作距离D(p_i，r_j)。

步骤9.2：为论文/项目p_i分配k位评审，0≤jj＜k，其中k为每篇论文/项目的审阅数，由用户指定，jj为大于等于0小于k的整数变量，执行最大匹配度优先与最小差调整算法，具体为：

步骤9.2.1：根据最大匹配度优先分配评审，具体为：选择与论文/项目p_i的匹配度最大且可分配的1位专家r，将Q中相应的元素的selected置为1，选中专家r的审阅数r.num加1；

步骤9.2.2：若i＜averageNum或选中专家r的审阅数小于averageNum，不用调整，转至步骤9.2.5；

步骤9.2.3：根据选中专家r的审阅数与averageNum的比较关系，以及审阅数等于averageNum的专家子集R_a的大小与remainNum的比较关系，判断是否执行最小差调整；若需要调整，则设置待调整的专家子集；否则转至步骤9.2.5；具体为：

①若选中专家r的审阅数等于averageNum，将专家r加入审阅数等于averageNum的专家子集R_a；加入后，若|R_a|≤remainNum，不用调整，转至9.2.5；若|R_a|＞remainNum，需要调整，设置待调整的专家子集为R_a；

②若选中专家r的审阅数大于averageNum，需要调整，设置待调整的专家子集为{r}；

步骤9.2.4：根据最小差原则调整分配状态；

其中，最小差原则为：首先，若|R_a|＜remainNum，设置最小差调整的专家审阅数为available＝averageNum；若|R_a|≥remainNum，设置最小差调整的专家审阅数为available＝averageNum-1；其次，在论文/项目集的第(0-i)篇论文子集和待调整的专家子集中，若论文/项目p与专家r为已分配状态，则将论文/项目p与专家r的匹配度值，减去p与专家集R中可分配的、匹配度最大的且审阅数小于available的专家r′的匹配度，若所得差值最小，则将Q[p][r]的分配状态置为-1，Q[p][r′]的分配状态置为1；根据调整后专家r的审阅数r.num以及专家r′的审阅数r′.num，调整R_a；

步骤9.2.5：jj＝jj+1；若jj＜k，转至步骤9.2.1；

步骤9.3：i＝i+1；若i＜g，转至步骤9.1；

步骤10：根据步骤9得出的论文/项目-专家的分配数组的最终结果，计算得结果集，以及结果集的匹配度和、标签相似度和、合作距离和；

根据论文/项目-专家的分配数组Q的最终结果，可得最优评审分配的结果集result，计算对应的匹配度和sumMatching、标签相似度和sumSimilarity、合作距离和sumDistance，输出结果；

至此，从步骤1到步骤10，完成了一种融合学术专长与社会网络的评审分配方法。

有益效果

一种融合学术专长与社会网络的评审分配方法，与现有技术对比，本方法具有如下有益效果：

1.本方法基于论文/项目数据库建模社会网络，提出论文/项目的作者/申请人与专家的合作距离，应用于评审分配方法中，可以降低专家的主观因素，提高了评审过程的客观性；

2.相较于仅依靠专业领域相似度进行评审分配的方法相比，本方法综合考虑论文/项目与专家的标签相似度与合作距离，提出论文/项目与专家的匹配度，确立了更加全面的最优化目标；

3.本方法设计了最大匹配度优先与最小差调整算法，能够在满足最优化目标的约束条件下，实现均衡评审分配，最大化结果集的标签相似度和与合作距离和，提供更加合理的评审分配方案；

4.本方法适用于不同形式的学术会议、期刊及项目的评审分配场景中，应用范围广，实用性强，易于推广。

附图说明

图1为本发明“一种融合学术专长与社会网络的评审分配方法”中的评审分配方法及实施例1的流程示意图；

图2为本发明“一种融合学术专长与社会网络的评审分配方法”中的最大匹配度优先与最小差调整算法及实施例4的流程示意图。

具体实施方式

下面根据附图及实施例对本发明进行详细说明，但本发明的具体实施形式并不局限于此。

实施例1

本实施例详细阐述了本发明“一种融合学术专长与社会网络的评审分配方法”应用于某学术会议在论文评审管理时的评审分配的流程。

图1为本方法的算法流程图以及本实施例的流程图；从图中可看出，本方法包含如下步骤：

步骤A：给定4个标签、带标签的10篇论文和7名专家，每篇论文由2名作者共同完成，建立标签集、带标签的论文集与专家集，以及论文集的作者集；得出论文数及专家数、标签相似度矩阵以及论文-专家的标签相似度；

具体到本实施例，建立标签集T＝{a，b，c，d}，带标签的论文集P＝{p₀，p₁，p₂，p₃，p₄，p₅，p₆，p₇，p₈，p₉}，带标签的专家集R＝{r₀，r₁，r₂，r₃，r₄，r₅，r₆}；集合大小|T|＝4，|P|＝10，|R|＝7；建立论文集的作者集：A＝{A(p₀)，A(p₁)，A(p₂)，A(p₃)，A(p₄)，A(p₅)，A(p₆)，A(p₇)，A(p₈)，

论文集P的标签T(P)＝{T(p₀)，T(p₁)，T(p₂)，T(p₃)，T(p₄)，T(p₅)，T(p₆)，T(p₇)，T(p₈)，r(p₉)}＝{(a，b)，(a，c)，(d)，(b，c)，(a，b)，(c，d)，(b)，(a)，(b，d)，(c)}；专家集的R标签T(R)＝{T(r₀)，T(r₁)，T(r₂)，T(r₃)，T(r₄)，T(r₅)，T(r₆)}＝{(a)，(b)，(c)，(d)，(a)，(c)，(d)}；

根据论文合作数据库统计计算得标签相似度矩阵S[4][4]：

根据论文-专家标签相似度定义，可得论文-专家的标签相似度S(p，r)：

步骤B：基于论文合作数据库建立包含200个节点、5000条边的权值为1的无向社交网络G，给定最大合作距离MAXD＝50，得出论文集的作者-专家的合作距离数组D[10][7]及论文-专家的合作距离D(p，r)；

步骤C：给定作者与专家无合作、非师生、不属于同一机构的约束条件，计算论文-专家的指示关系；

具体到本实施例，论文p₅中的作者

与专家r₃属同一机构；根据论文-专家的合作距离，得出论文p₂与专家r₀、论文p₆与专家r₁、论文p₉与专家r₆有合作；由论文-专家的关系指示函数B(p，r)的定义，计算得B(p，r)：

步骤D：确定每篇论文的审阅数k＝3，论文数为10，专家数为7，计算平均审阅数及冗余审阅数；

具体到本实施例，计算平均审阅数

计算冗余审阅数remainNum＝(3×10)％7＝2；为了保证均衡分配，专家集R中每名专家r的审阅数r.num为5或4，用R_a表示审阅数等于5的专家子集，且|R_a|＝＝2；

步骤E：根据步骤A中论文-专家的标签相似度、步骤B中论文-专家的合作距离及最大合作距离，确定论文-专家的匹配度；

具体本实施例，论文-专家的标签相似度为S(p，r)，步骤2中论文-专家的合作距离D(p，r)及最大合作距离MAXD＝50，给定平衡参数α＝0.5，论文-专家的匹配度计算公式为：

步骤F：建立结果集result，初始化为空；初始化结果集的匹配度和、标签相似度和、合作距离和为零；

具体本实施例，结果集result存储最优分配方案，是由10个二元组<p，R>组成的集合；结果集result的形式为：

其中分配给论文p_i的专家集

为由3名专家组成的集合，

形式为：

初始化结果集的匹配度和sumMatching、标签相似度和sumSimilarity、合作距离和sumDistance为0；

步骤G：根据步骤C中论文-专家的指示关系、步骤D中平均审阅数及冗余审阅数以及步骤F中结果集的匹配度和，确定最优化目标；

步骤H：建立论文-专家的分配数组Q[10][7]，用来存储论文-专家的分配状态selected(1已分配、0可分配，-1不可分配)、匹配度M、标签相似度S与合作距离D；初始化分配数组的每个元素为零向量，即(0，0，0，0)；

步骤I：遍历论文集，在满足最优化目标的约束条件的前提下，依次进行评审分配，并得出论文-专家的分配数组的最终结果；

对于论文集P中的每篇论文p_i，0≤i＜10，依次进行评审分配，具体按照以下步骤执行：

步骤I.1：对于专家集R中的每名专家r_j，0≤j＜7，若B(p_i，r_j)＝＝0，则计算论文p_i-专家r_j的标签相似度S、合作距离D与匹配度M，将Q[i][j]置为(0，M，S，D)；若B(p_i，r_j)＝＝1，则将Q[i][j]置为(-1，0，0，0)；

具体到本实施例，当i＝5时，0≤j＜7，计算后，Q为：

步骤I.2：为论文p_i分配3位评审，执行最大匹配度优先与最小差调整算法；

步骤I.3：i＝i+1；若i＜10，转至I.1；

步骤J：步骤I得出的论文-专家的分配数组的最终结果，计算得结果集，以及结果集的匹配度和、标签相似度和、合作距离和；

具体到本实施例，论文-专家的分配数组Q[10][7]的最终结果为：

计算的最优评审分配的结果集result，即为最优分配结果：

{<p₀，{r₀，r₁，r₄}>，<p₁，{r₂，r₃，r₅}>，<p₂，{r₃，r₅，r₆}>，<p₃，{r₁，r₂，r₅}>，<p₄，{r₀，r₂，r₄}>，

<p₅，{r₀，r₂，r₆}>，<p₆，{r₃，r₄，r₆}>，<p₇，{r₀，r₄，r₆}>，<p₈，{r₁，r₃，r₄}>，<p₉，{r₁，r₂，r₅}>}

计算结果集result对应的匹配度和sumMatching＝18.49，标签相似度和sumSimilarity＝26.8，合作距离和sumDistance＝509。

实施例2

本实施例按照实施例1所述的参数，具体阐述了本发明步骤2定义的论文/项目-专家的合作距离及实施例1的步骤B中的论文-专家的合作距离的计算过程。

具体过程为：社会网络G＝(V，E)，节点集|V|＝200，且专家集

论文作者集

边集|E|＝5000；根据定义，计算得论文的作者-专家的合作距离数组D[10][7]：

根据定义，计算得论文-专家的合作距离D(p，r)：

如果不考虑论文-专家的合作距离，仅考虑最大化论文-专家的标签相似度，进行评审分配，则专家很可能因为主观因素而影响对论文的评审的客观性；其中论文-专家的标签相似度由实施例1的S(p，r)得出；

具体到本实施例，论文p₆与专家r₁的标签相似度为1，则论文p₆会被分配给专家r₁进行评审；而论文p₆与专家r₁的合作距离为1，表示论文p₆与专家r₁有合作，在现实中存在学术交流，则专家r₁很可能会受到主观因素的影响而提高对论文p₆的评审分数；同样，论文p₁与专家r₀、论文p₄与专家r₁、论文p₈与专家r₆的标签相似度均为1，而论文p₁与专家r₀、论文p₄与专家r₁、论文p₈与专家r₆的合作距离分别为3、4、3，论文的作者与专家有较短的合作路径，则很可能存在现实中的学术交流；如果仅按照最大化论文-专家的标签相似度进行评审分配，则不能保证评审的客观性；而实施例1中按照本发明所用评审分配方法得出的评审分配结果，论文p₁，p₄，p₆，p₈没有分配给相应的专家r₀，r₁，r₁，r₆，因而降低了专家的主观因素，提高了评审过程的客观性。

实施例3

本实施例按照实施例1所述的参数，具体阐述了本发明步骤5定义的论文/项目-专家的匹配度、步骤7定义的最优化目标及实施例1的步骤E的论文-专家的匹配度、步骤G确定的最优化目标。

具体到本实施例，步骤E：论文-专家的匹配度计算公式为：

步骤G：评审分配的最优化目标为：

max sumMatching

st.for 0≤i，j＜10 and i≠j，0≤s，t＜3 and s≠t，that

for R_a，that|R_a|＝＝2

本实施例确立的最优化目标，在满足约束条件和均衡分配的前提下，最大化论文-专家的匹配度；而最大化论文-专家的匹配度，需要同时最大化论文-专家的标签相似度与合作距离；相较于仅依靠专业领域相似度进行评审分配的方法相比，本发明所用方法的最优化目标更加全面。

实施例4

本实施例具体阐述了本发明步骤9中叙述的最大匹配度优先与最小差调整算法及实施例1中步骤I的执行流程，算法流程如图2所示。

从图2中可以看出，最大匹配度优先与最小差调整算法的具体步骤为：

步骤I.2：为论文p_i分配3位评审，0≤jj＜3，执行最大匹配度优先与最小差调整算法，执行步骤为：

步骤I.2.1：根据最大匹配度优先分配评审，选择与论文p_i的匹配度值最大且可分配的1位专家r，将Q中相应的元素置为(1，M，S，D)，选中专家r的审阅数加1；

具体到本实施例，当i＝5，jj＝0时，选择匹配度值最大且可分配的1位专家为r₀，分配后，Q为：

步骤I.2.2：若i＜5或选中专家r的审阅数小于5，不用调整，转至I.2.5；

具体到本实施例，i＝5，jj＝0时，选中专家r₀的审阅数为3，小于5，不用调整；

步骤I.2.3：根据选中专家r的审阅数与averageNum的比较关系，以及审阅数等于averageNum的专家子集R_a的大小与remainNum的比较关系，判断是否执行最小差调整；若需要调整，则设置待调整的专家子集；否则转至I.2.5；

(a)若选中专家r的审阅数等于5，将专家r加入审阅数等于5的专家子集R_a；加入后，若|R_a|≤2，不用调整，转至I.2.5；若|R_a|＞2，需要调整，设置待调整的专家子集为R_a；

具体到本实施例，当i＝6，jj＝2时，选定专家r₅后，专家r₅的审阅数为5，将r₅加入R_a，此时R_a＝{r₄，r₅}，|R_a|≤2，不用调整，此时Q为：

当i＝9，jj＝1时，选定专家r₂后，专家r₂的审阅数为5，将r₂加入R_a后，R_a＝{r₂，r₄，r₅}，|R_a|＝3＞2，需要调整，设置待调整专家子集为{r₂，r₄，r₅}；

(b)若选中专家r的审阅数大于5，需要调整，设置待调整的专家子集为{r}；

具体到本实施例，当i＝7，jj＝0时，选中专家r₄后，专家r₄的审阅数为6，大于5，设置待调整专家子集为{r₄}；

步骤I.2.4：执行最小差调整；

调整原则为：若|R_a|＜2，设置最小差调整的专家审阅数为available＝5；若|R_a|≥2，设置最小差调整的专家审阅数为available＝5-1＝4；在论文集的(0-i)论文子集和待调整的专家子集中，若论文p与专家r为已分配状态，则将论文p与专家r的匹配度值，减去p与专家集R中、可分配的、审阅数小于available的、匹配度最大的专家r′的匹配度值，若所得差值最小，则将Q[p][r]的分配状态置为-1，Q[p][r′]的分配状态置为1；

具体到本实施例，当i＝9，jj＝1时，选定专家r₂后，专家r₂的审阅数为5，将r₂加入R_a，R_a＝{r₂，r₄，r₅}，|R_a|＝3＞2，待调整专家子集为{r₂，r₄，r₅}，调整前Q为：

执行最小差调整：|R_a|＝3，设置available＝4；在论文(0-9)中，与待调整专家子集{r₂，r₄，r₅}，与专家r₂为已分配状态的论文为{p₁，p₃，p₄，p₅，p₉}，与专家r₄为已分配状态的论文为{p₀，p₄，p₆，p₇，p₈}，与专家r₅为已分配状态的论文为{p₁，p₂，p₃，p₆，p₉}，根据最小差定义，计算得最小差为：Q[6][5].M-Q[6][6].M＝0.52-0.42＝0.1，调整Q[6][5]的分配状态置为-1，Q[6][6]置为已分配；调整后R_a＝{r₂，r₄}，|R_a|＝2；调整后的Q为：

当i＝7，jj＝0时，选中专家r₄后，专家r₄的审阅数为6，大于5，待调整专家子集为{r₄}，调整前Q为：

执行最小差调整：|R_a|＝2，设置available＝4；在论文(0-7)中，与待调整专家r₄为已分配状态的论文为{p₀，p₁，p₃，p₄，p₆，p₇}，根据最小差定义，计算得最小差为：Q[1][4].M-Q[1][3].M＝0.56-0.55＝0.01；调整Q[1][4]的分配状态置为-1，Q[1][3]置为已分配，调整后Q为：

步骤I.2.5：jj＝jj+1；若jj＜3，转至I.2.1；

步骤I.3：i＝i+1；若i＜10，转至I.1；

由本实施例的最大匹配度优先与最小差调整算法的执行过程以及实施例1的评审分配结果可以看出，本发明所用方法能够在满足最优化目标的约束条件下，实现均衡评审分配，最大化结果集的标签相似度和与合作距离和，提供更加合理的评审分配方案。

实施例5

将实施例1中的某学术会议改成其他学术会议、期刊及项目的评审分配管理场景中，本发明所提出的评审分配方法依然有效。

上述实施方式中未述及的有关技术内容采取或借鉴已有技术即可实现。

以上所述为本发明的较佳实施例而已，本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改，都落入本发明保护的范围。

Claims

1.一种融合学术专长与社会网络的评审分配方法，简称本方法，本方法能够在满足论文/项目的作者/申请人与专家无合作、非师生、不属于同一机构的约束条件下，实现均衡评审分配，最大化评审分配的标签相似度和与合作距离和，确保评审结果的客观、公平、公正；为实现上述目的，本方法其特征在于：包括如下步骤：

步骤2：建模社会网络,确定最大合作距离，得出论文/项目集的作者/申请人-专家的合作距离数组、论文/项目-专家的合作距离；

步骤3：确定约束条件，计算论文/项目-专家的指示关系；

步骤10：根据步骤9得出的由论文/项目-专家的分配数组的最终结果，计算得结果集，以及结果集的匹配度和、标签相似度和、合作距离和；

2.根据权利要求1所述的一种融合学术专长与社会网络的评审分配方法，其特征在于：步骤1中，标签集，记为T；论文/项目集，记为P；专家集，记为R；论文/项目集P的作者/申请人集，记为A；集合大小|T|＝h,|P|＝g,|R|＝f，|T|代表标签集T的大小，|P|代表论文/项目集P的大小，|R|代表专家集R的大小，且标签集T、论文/项目集P以及专家集R的大小，分别记为h,g,f，h,g及f均为大于1的整数常量；

标签相似度矩阵，记为S，其大小为h×h，其中h表示标签集的大小；其中每个元素表示相应的一对标签的相似度由用户设定或者通过论文/项目合作关系数据库统计计算得到；

S(p,r)＝max S[t_i][t_j]，t_i∈T(p)，t_j∈T(r)； (1)

其中，S(p,r)代表论文/项目p与专家r的标签相似度的最大值，max是求最大值的函数，S[t_i][t_j]代表相似度矩阵中标签t_i和标签t_j的相似度；其中，t_i代表T(p)中第i个标签，t_j代表T(r)中第j个标签；下标i，j为大于等于0，小于h的整数变量；

每篇论文/项目的审阅数，记为k，k为整数常量且k＞1；

平均审阅数，记为averageNum，平均审阅数的计算公式为(2)：

其中，

表示对(k×g)/f向上取整；

冗余审阅数，记为remainNum，冗余审阅数的计算公式为(3)：

remainNum＝(k×g)％f； (3)

其中，(k×g)％f表示(k×g)对f取整数类型余数；

为了保证均衡分配，专家集R中每名专家r的审阅数，记为r.num，r.num等于averageNum或averageNum-1。

3.根据权利要求2所述的一种融合学术专长与社会网络的评审分配方法，其特征在于：步骤2中，建模社会网络通过论文/项目合作关系数据库获得，具体为：

社会网络，记为G，G＝(V,E)为权值为1的无向网；其中节点集，记为V，|V|＝n，|V|表示节点集V的大小，n为大于1的整数常量；每个节点代表一位作者/申请人；且步骤1中的专家集

论文/项目集的作者/申请人集

计算论文/项目集的作者/申请人-专家的合作距离数组DIS，其大小为g×f，其中g,f分别表示论文/项目集P以及专家集R的大小；数组中的每个元素DIS[p][r]，是由论文/项目p的作者/申请人与专家r的合作距离组成的向量，该向量的长度为|A(p)|，A(p)代表论文/项目p的作者/申请人集；

论文/项目-专家的合作距离定义为论文/项目p的作者/申请人与专家r的合作距离组成的向量中的最小值，用公式(4)表示：

D(p,r)＝min D[p][r]； (4)

其中，D(p,r)代表论文/项目p与专家r的合作距离，min是求最小值的函数。

4.根据权利要求3所述的一种融合学术专长与社会网络的评审分配方法，其特征在于：步骤3中，约束条件为论文/项目的任一作者/申请人与专家无合作发表论文/申请项目、非师生关系、不属于同一机构；论文/项目的作者/申请人与专家是否无合作，可通过论文/项目-专家的合作距离得出；论文/项目的作者/申请人与专家是否非师生关系、不属于同一机构的条件由用户给定；

其中，论文/项目-专家的指示关系，记为B(p,r)，表示论文/项目p的任一作者/申请人a与专家r是否满足无合作发表论文/申请项目、非师生关系、不属于同一机构的约束条件；不满足约束条件，值为1，表示存在论文/项目p的作者/申请人a与专家r有关系，则不可分配；满足约束条件，值为0，表示论文/项目p的任一作者/申请人a与专家r没有关系，则可分配；论文/项目-专家的指示关系定义用公式(5)表示：

表示存在；

表示对于任意的。

5.根据权利要求4所述的一种融合学术专长与社会网络的评审分配方法，其特征在于：步骤5中，论文/项目-专家的匹配度用公式(6)表示：

其中，M(p,r)代表论文/项目p与专家r的匹配度，D(p,r)代表论文/项目p与专家r的合作距离，S(p,r)代表论文/项目p与专家r的标签相似度，α为平衡参数，由用户给定；MAXD代表最大合作距离，由用户给定；从公式(6)可以看出，论文/项目与专家的标签相似度越高、合作距离越远，匹配度M(p,r)就越高。

6.根据权利要求5所述的一种融合学术专长与社会网络的评审分配方法，其特征在于：步骤6中，结果集存储最优分配方案，记为result，其形式为：

结果集result中的p₀，...,p_g-1以及下标p₀，...,p_g-1表示论文/项目集中的第0到g-1篇论文/项目；

其中，分配给论文/项目p_i的专家集，记为

的大小为k；论文/项目p_i的专家集

的形式为：

其中，

与

中的下标p_i均表示论文/项目集中的第i篇论文/项目p_i；上标0，1，...，k-1表示序号；

结果集result的匹配度和，记为sumMatching，用公式(7)表示：

其中，

代表论文/项目p_i与专家

的标签相似度；

代表分配给论文/项目p_i的专家集中的第j名专家；上标j表示序号；p_i及下标_pi代表论文/项目集中的第i篇论文/项目；

其中，

代表论文/项目p_i与专家

的标签相似度；

代表分配给论文/项目p_i的专家集中的第j名专家；上标j表示序号；p_i及下标p_i代表论文/项目集中的第i篇论文/项目；

结果集result的合作距离和，记为sumDistance，用公式(9)表示：

其中，

代表论文/项目p_i与专家

的标签相似度；

代表分配给论文/项目p_i的专家集中的第j名专家；上标j表示序号；p_i及下标p_i代表论文/项目集中的第i篇论文/项目。

7.根据权利要求6所述的一种融合学术专长与社会网络的评审分配方法，其特征在于：步骤7中，评审分配的最优化问题为，在满足约束条件下，实现均衡评审分配，最大化论文/项目与专家的标签相似度和、合作距离和；

公式(10)中，第一行表示最优化目标是最大化结果集的匹配度和，其中，sumMatching代表结果集result的匹配度和，max是求最大值的函数；第二行至第七行为最优化目标的约束条件，其中g表示论文/项目集大小，k表示每篇论文/项目的审阅数，i,j为大于等于0小于g的整数变量，s,t为大于等于0小于k的整数变量，上标s,t表示序号，下标p_i，p_j分别表示论文/项目集中的第i与j篇论文/项目，

表示存在，

论文/项目p_i与

中的第s名专家的指示关系为0，其中，

表示分配给论文/项目p_i的专家集，

分别表示

的第s名专家，

中的第s名专家与第t名专家不能相同，其中，

分别表示

中第s和第t名专家；第五行表示存在论文/项目p_i的专家集

与论文/项目p_j专家集

中第s名专家与

8.根据权利要求7所述的一种融合学术专长与社会网络的评审分配方法，其特征在于：步骤8中，建立论文/项目-专家的分配数组，记为Q，其大小为g×f，其中g,f分别表示论文/项目集P以及专家集R的大小；分配数组的每个元素是由论文/项目p-专家r的分配状态、匹配度、标签相似度与合作距离组成的向量：论文/项目-专家的分配状态，记为selected(1代表已分配、0代表可分配、-1代表不可分配)；论文/项目p-专家r的匹配度，记为M；论文/项目p-专家r的标签相似度，记为S；论文/项目p-专家r的合作距离，记为D；初始化分配数组的每个元素为零向量，即(0,0,0,0)。

9.根据权利要求7或8所述的一种融合学术专长与社会网络的评审分配方法，其特征在于：步骤9中最优化目标的约束条件为公式(10)中的第二行至第六行；

步骤9.1：对于专家集R中的每名专家r_j，0≤j＜f，其中f为专家集R的大小，j为大于等于0小于f的整数变量；若B(p_i,r_j)＝＝0，则计算论文/项目p_i-专家r_j的标签相似度S(p_i,r_j)、合作距离D(p_i,r_j)和匹配度M(p_i,r_j)，将Q[i][j]的值置为(0,M(p_i,r_j),S(p_i,r_j),D(p_i,r_j))；若B(p_i,r_j)＝＝1，则将Q[i][j]置为(-1,0,0,0)，其中下标i为大于等于0小于g的整数变量，下标j为大于等于0小于f的整数变量；p_i表示论文/项目集中的第i篇论文/项目；r_j表示专家集中的第j名专家；B(p_i,r_j)表示论文/项目p_i与专家r_j的指示关系；Q表示论文/项目-专家的分配数组，Q[i][j]为数组Q中论文/项目p_i与专家r_j的分配向量，其中第一项表示分配状态selected，第二至四项分别表示论文/项目p_i-专家r_j的匹配度M(p_i,r_j)、标签相似度S(p_i,r_j)和合作距离D(p_i,r_j)；

步骤9.2.3：根据选中专家r的审阅数与averageNum的比较关系，以及审阅数等于averageNum的专家子集R_a的大小与remainNum的比较关系，判断是否执行最小差调整；若需要调整，则设置待调整的专家子集；否则转至步骤9.2.5，具体为：

步骤9.2.4：根据最小差原则调整分配状态；

其中，最小差原则为：首先，若|R_a|＜remainNum，设置最小差调整的专家审阅数为available＝averageNum；若|R_a|≥remainNum，设置最小差调整的专家审阅数为available＝averageNum-1；其次，在论文/项目集的第(0-i)篇论文子集和待调整的专家子集中，若论文/项目p与专家r为已分配状态，则将论文/项目p与专家r的匹配度值，减去p与专家集R中可分配的、匹配度最大的且审阅数小于avaliable的专家r′的匹配度，若所得差值最小，则将Q[p][r]的分配状态置为-1，Q[p][r′]的分配状态置为1；根据调整后专家r的审阅数r.num以及专家r′的审阅数r′.num，调整R_a；

步骤9.2.5：jj＝jj+1；若jj＜k,转至步骤9.2.1；

步骤9.3：i＝i+1；若i＜g,转至步骤9.1；

步骤10中根据论文/项目-专家的分配数组Q的最终结果，可得最优评审分配的结果集result，计算对应的匹配度和sumMatching、标签相似度和sumSimilarity、合作距离和sumDistance，输出结果。