CN110942082A

CN110942082A - 一种人才价值评估方法

Info

Publication number: CN110942082A
Application number: CN201910235224.3A
Authority: CN
Inventors: 徐小龙; 袁为捷
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Zhongshen Business Technology (Shenzhen) Co.,Ltd.
Priority date: 2019-03-27
Filing date: 2019-03-27
Publication date: 2020-03-31
Anticipated expiration: 2039-03-27
Also published as: CN110942082B

Abstract

本发明公开了一种人才价值评估方法，以专业人才发表的学术文献为基础，包括如下步骤：S1，计算文献网络结构高阶邻近度特征矩阵：计算网络结构邻接矩阵的特征值和特征向量，计算含有高阶邻近信息的结构矩阵奇异值分解结果，完成网络结构高阶邻近度的初始化嵌入特征矩阵计算；S2，计算文献网络低维特征矩阵：设计网络结构特征矩阵和节点内容特征矩阵的更新规则，迭代计算，获取最终的文献网络特征矩阵；S3，谱聚类完成文献网络节点聚类：将最终的网络嵌入矩阵作为谱聚类的输入矩阵，选择K‑Means聚类方法进行网络节点聚类；S4，计算人才价值数值。本发明提供法人一种人才价值评估方法，能够确定网络结构高阶邻近度特征矩阵，以及将网络节点内容高效地融合结构的高阶邻近度。

Description

一种人才价值评估方法

技术领域

本发明属于知识发现应用领域，具体涉及一种人才价值评估方法。

背景技术

针对科研这种知识密集型任务，一个十分有效的方法是找到具有适当专业知识的专家学者，专家能够提供可靠的信息和意见。个人的眼界与知识面终究是狭窄的，找到正确的专业知识与资源，与潜在的合作者互动是一种高效的工作模式。然而，寻找合作者并不是一件容易的事。专业知识是高度动态的，验证他人的专业知识是极为困难的。因此，研究和开发推荐在特定领域具有专业知识的人的工具已经受到了研究人员的广泛关注。

学术社交网站近年来发展迅速。大量用户希望与其他用户交朋友，以便进行潜在的学术交流合作。问答社区作为一种在人群中分享知识的有效方式，许多用户都是现实世界中的专家，可以在某些领域或技术中做出高质量的贡献，为了获取及评估这些专家目前已经有了大量的方法。但是，这些方法都过度的依赖专家本人的主动社交行为，对于专心学术、社交较少的专家却难以挖掘出来。因而，本发明拟从文献作者的角度实现人才挖掘。

信息网络在我们的日常生活中无处不在，如社交网络、引文网络和知识网络等，通过智能挖掘，可以提取各种有用的信息。通常，网络以图形的形式表示。不同类型的原始表示(如邻接矩阵或邻接列表)被用作许多机器学习算法的直接输入。然而，机器学习算法很难从这些表示中挖掘有用的信息，因为它们属于一个非常高维的空间，而且本质上也是非常稀疏的。

近年来，将高维网络映射到低维向量空间，使得信息损失在某种意义上最小，成为网络分析研究的中心课题。它能够保留了网络的固有特性和结构，已经成为一种用低维向量表示节点的范式，目的是为了弥合网络分析与机器学习算法之间的差距。

与直接挖掘网络中的数据相比，学习网络表示具有多种优势。一、特征本质上具有识别性和互补性，能够突出核心信息，剔除噪声信息；二、相同节点数量的低维特征相比于原始数据数据量少，存储空间少，计算速度快；三、不需要改变基本的网络嵌入算法来处理不同的网络分析任务，大多数嵌入方法被认为是通用的。四、由网络嵌入算法获取的特征可作为现有的机器学习算法的直接输入，例如现有的用于分类或聚类的网络分析方法可以很好地处理这些已经嵌入到低维的特征。

网络嵌入技术本质上大多是无监督的或半监督的。信息网络通常有少量标记节点或者没有任何标记节点，实际上，学习嵌入不需要太多的监督。大量文献提出了许多不同类型的网络嵌入方法，如Deepwalk、Line、node2vec、TADW、AROPE、FSCNMF等。对于网络结构高阶邻近度的研究表明，节点之间的高阶邻近度对于捕获网络的底层结构具有重要意义，因此可以为学习嵌入向量提供有价值的信息。可以在生成的节点嵌入中保留各种网络属性，如同质性、社区结构等。这些性质是自然联系在一起的。网络中的同质性根据所涉及节点之间的相似性来描述局部结构。尽管这种相似性通常是基于网络的结构属性捕获的，但是结合与节点相关的语义内容则可以更好地利用同质性。利用内容对结构数据进行目标正则化可以得到较好的嵌入效果，反之，利用结构对内容数据进行正则化也可以得到较好的嵌入结果。

如今，通过结合网络结构和节点内容，完成网络嵌入已经取得了较好的科研成果，同时，网络结构的高阶邻近度研究亦有了较大突破。但是，如何确定网络结构高阶邻近度特征矩阵，更进一步地，如何将网络节点内容高效地融合结构的高阶邻近度，并没有得到有效的解决，需要一个新的技术方案解决这个问题。

发明内容

发明目的：针对科研工作中寻找合作者的人才评估问题，提供一种能够确定网络结构高阶邻近度特征矩阵，以及将网络节点内容高效地融合结构的高阶邻近度的人才价值评估方法。

为解决上述技术问题，本发明采用的技术方案为：

一种人才价值评估方法，以专业人才发表的学术文献为基础，包括如下步骤：

S1，计算文献网络结构高阶邻近度特征矩阵：

基于网络结构构建邻接矩阵，计算其特征值和特征向量，映射到含有高阶邻近信息结构矩阵的特征值和特征向量，计算含有高阶邻近信息的结构矩阵奇异值分解结果，完成网络结构高阶邻近度的初始化嵌入特征矩阵计算；

S2，计算文献网络低维特征矩阵：

设计网络结构特征矩阵和节点内容特征矩阵的更新规则，迭代计算，获得它们的特征嵌入矩阵，将两个特征矩阵按比例相加融合，获取最终的文献网络特征矩阵；

S3，谱聚类完成文献网络节点聚类：

将最终的网络嵌入矩阵作为谱聚类的输入矩阵，选择全连接法构建数据节点的相似矩阵，依次计算出邻接矩阵、度矩阵和拉普拉斯矩阵，对拉普拉斯聚类完成标准化操作，选择K-Means聚类方法进行网络节点聚类；

S4，计算人才价值数值：

在每一类别中，分别计算文献作者的总影响力数值及活跃度数值，设计权重将两个数值结合，计算人才价值数值。

所述S01的具体步骤如下：

S11，网络结构数据建模：

首先，计算网络结构邻接矩阵：

设引文网络中文献节点的集合为V＝{v₁,v₂,…,v_n}，文献节点之间边的集合为

其中1≤i、j≤n；令网络结构邻接矩阵为A，则A是n×n阶矩阵，A＝(a_i,j)，a_i,j的取值如公式(1)所示，

其次，将网络结构多种邻近度加权和定义为网络结构高阶邻近度S：

S＝F(A)＝w₁A+w₂A²+...+w_qA^q (2)

式中，q是高阶邻近度的阶数，w₁,...w_q是权重，对于

w_i≥0；A^q所代表的意义是从点到点之间走q步能够到达的点与点之间的权重；

S12，计算网络结构高阶邻近度特征矩阵：

如果λ和x是矩阵A的一组特征值和特征向量，那么F(λ)和x是S的一组特征值和特征向量；

对网络结构高阶邻近度S做SVD分解，即：

S＝U_sΣV_s (3)

只截取SVD结果中奇异值最高的一部分，那么

其中B₁ ^*,B₂ ^*是矩阵分解的结果，U_s、Σ、V_s三个矩阵是SVD的结果，SVD的结果可以通过特征值分解的结果得到：

上述公式中，X和Λ分别是特征向量x和特征值λ，abs(x)指的是x的绝对值，即abs(x)＝|x|，另外：

对S分解:

这里，B₁ ^*,B₂ ^*∈R^r×d是最相近的分解嵌入向量，R^r×d指的是r×d阶矩阵，d是空间的维数，不失一般性，我们用B₁ ^*作为网络结构嵌入向量，其进一步的实验结果表明，针对任意阶邻近度的权重可以相等，则公式(2)可简化为：

其中m是高阶邻近度的阶数，所以，求得A的特征值和特征向量，再针对特征值应用函数M，获取网络结构高阶邻近度的初始化嵌入特征B₁ ^*为：

S2的具体步骤如下：

S21，网络节点内容数据建模：

取文献节点的内容矩阵为C，设为n×d阶矩阵，将文献节点中标题、关键词和摘要抽取出来构建词袋模型，C则基于该词袋模型计算而成，在词袋模型中，通常会删除停用字，并将词干提取作为预处理步骤进行，该矩阵的每一行都是对应节点上文本内容的tfidf向量。

S22，设计网络结构特征矩阵和节点内容特征矩阵的更新规则：

分别对A、C做非负矩阵分解，则有

A≈B₁B₂ (8)

C≈UV (9)

在公式(8)和公式(9)中，B₁是n×k阶矩阵，B₂是k×n阶矩阵，U是n×k阶矩阵，V是k×d阶矩阵，通常，应用于网络嵌入中，有k＜＜n，其中，

其中，α₂,α₃,β₂,β₃≥0对应于各部分的权重，

基于内容给出一个嵌入矩阵U，为了使B₁向U靠近，通过最小化以下成本函数，得到基于链接结构的嵌入矩阵B₁：

其中，D₁(B₁,B₂)代表结构内容靠近函数；

为了利用结构和内容的一致性，

会将B₁向U靠近，权重α₁≥0决定优化结构嵌入矩阵时内容的重要性，新的B₁和B₂获取如下：

同样，给定一个基于结构的嵌入矩阵B₁，为了使U向B₁靠近，通过最小化下面的成本函数，可以找到基于内容的嵌入矩阵U：

其中，D₂(U,V)代表内容结构靠近函数；

不允许内容嵌入矩阵U明显偏离给定的结构嵌入矩阵B₁，权重β₁≥0决定优化内容嵌入矩阵时结构的重要性，新的U和V计算如下：

多次迭代公式(13)和公式(15)的计算完成优化，获得网络的最终嵌入矩阵，

设置初始B₁为B₁ ^*，B₁值的更新与B₁ ^*无关，下面将推导出必要的更新规则，以解决公式(13)和公式(15)中的优化问题，在公式(13)中，如果以B₁为自变量，B₂为常量，则该函数是一个凹函数，为了求极小值，求偏导为0，得等式

I是单位矩阵，

是半正定矩阵，

的逆矩阵一定存在，为了确保B₁的非负性，我们进一步设置B₁的更新规则为：

式中[X]₊表示矩阵X的每一个元素X_ij完成以下公式：

那么，以B₂为自变量，求极小值，求偏导为0，得等式：

同理求U、V，得：

U＝[(CV^T+β₁B₁)(VV^T+β₁I+β₂I)^-1]₊ (23)

V＝[(U^TU+β₃I)^-1U^TC]₊ (24)

以上，更新规则设计完成，得到了网络的两个不同的嵌入矩阵B₁和U，得到了网络的两个不同的嵌入矩阵B₁和U，B₁为结构嵌入矩阵，U为内容嵌入矩阵；

S23，获取最终的网络嵌入矩阵：

为了获取最终的网络嵌入矩阵，则考虑以下情况：

a、如果结构和内容一致，矩阵B₁和U可能相似，在这种情况下，两个矩阵中的任何一个，或两个矩阵的凸组合形式(γ×B₁+(1-γ)×U),0≤γ≤1将是网络最终表示的选择，γ为最终网络嵌入矩阵的两个组成部分分别所占的比例；

b、如果有关于结构和内容质量的先验信息，可以相应地选择矩阵，当只有很少的关键词可用，作为引文网络中每篇文献的内容，而网络的链接结构良好，我们可以选择B₁作为网络的最终表示(γ＝1)，则不加入U的考量，反之亦然，更重视内容而忽视结构的影响。

S3的具体步骤包括如下过程：

将最终的网络嵌入矩阵作为谱聚类的输入矩阵，完成网络节点聚类，具体参数使用如下：

(a)n_clusters：既是谱聚类切图时降维到的维数，也是最后一步聚类算法聚类到的维数，数值选择与具体数据集有关；

(b)affinity：相似矩阵的建立方式。采用全连接法，使用内置高斯核函数“rbf”；

(c)核函数参数gamma：通过交叉验证，选择合适数值为0.1；

(d)assign_labels：最后的聚类方法的选择

使用“K-Means”完成聚类；

聚类过程如下：

S31，根据输入矩阵和全连接法构建数据节点的相似矩阵S；

S32，根据相似矩阵S构建邻接矩阵W，构建度矩阵D；

S33，计算出拉普拉斯矩阵L；

S34，构建标准化后的拉普拉斯矩阵D^-1/2LD^-1/2；

S35，计算D^-1/2LD^-1/2最小的n_clusters个特征值所各自对应的特征向量f；

S36，将各自对应的特征向量f组成的矩阵按行标准化，最终组成n×n_clusters维的特征矩阵F；

S37，对F中的每一行作为一个n_clusters维的节点，共n个节点，用K-Means聚类方法进行聚类，聚类维数为n_clusters；

S38，得到每个节点的类别划分。

S4的具体步骤包括如下过程：

在同一类别中，我们分别统计出学术专业人才每一年的发文量，计算该学者当年成果的影响力数值，以此为基础设计权重将两个数值结合，完成人才数值评估。

S41，署名顺序

一般来说，一篇文献由多名专业人才共同完成，而第一作者是贡献最大的，第二作者次之，依此类推，借用作者贡献率等级分配公式(25)，计算署名顺序不同的作者对文献的贡献值D_j：

上式中，j代表作者署名顺序，t代表文献的作者总数；

S42，人才总影响力

综合作者单篇文献的署名顺序和文献的影响力，文献影响力为c，人才该篇文献的影响力为I：

I＝D_j×c (26)

对于发表多篇文献的人才，其影响力为该人才在其所有文献的贡献值总和Iw指数，即：

公式(27)中，s为人才发表文献的总数，α＝1,2,3,4……s；

S43，人才价值评估

在每一年里，对人才完成发文量统计和影响力计算，分别归一化，归一化公式如下所示：

公式(28)中，y_max是要映射的目标区间最大值；y_min是要映射的目标区间最小值；x_max是目前数据最大值；x_min是目前数据最小值；x是假设目前数据中的任一值；y是归一化映射后的值；

将y_min设置为0，y_max设置为1，分别完成发文量和影响力的归一化，每一位人才的发文量和影响力数值分别设为y₁,y₂，人才评估数值的计算由公式(t×y₁+(1-t)×y₂)得出，(这里的t代表什么含义)用户通过设置t值确定权重，只将影响力作为人才评估指数时，设置t为0即可；

求和同一类别人才所有年份评估数值，即可计算出固定领域单类别下人才的评估指数，值得注意的是，不同类别不求和。

本发明的有益效果：本发明与现有技术相比，本发明提出的网络嵌入及聚类方法能够获得更准确的网络节点聚类结果，完成了人才贡献的价值计算，由此实现的人才评估为人才引进、人才推荐等问题提供了解决方法，加强了学术交流，提高了科研效率。

附图说明

图1为本发明方法的流程示意图；

具体实施方式

下面结合附图和具体实施例，进一步阐明本发明。

本发明的人才价值评估方法，以专业人才发表的学术文献为基础，计算文献数据网络结构的高阶邻近度，获取网络结构的低维表示，结合节点内容，最大限度地利用结构和内容之间的一致性，设计网络结构和节点内容特征矩阵的更新规则，实现特征降维，以该特征矩阵为谱聚类的输入完成节点聚类，在每一类别中，分别计算文献作者的总影响力及活跃度数值，设计权重将两个数值结合，完成人才价值数值计算。本实施例中在文献数据集上对大数据领域人才实现价值评估计算，其具体的过程如图1所示，一种人才价值评估方法，包括如下步骤：

步骤一，计算文献网络结构高阶邻近度特征矩阵：

基于网络结构构建邻接矩阵，计算其特征值和特征向量，映射到含有高阶邻近信息结构矩阵的特征值和特征向量，计算含有高阶邻近信息的结构矩阵奇异值分解结果，完成网络结构高阶邻近度的初始化嵌入特征矩阵计算，包括以下几个小步：

第一小步，网络结构数据建模：

首先，计算网络结构邻接矩阵：

其次，计算网络结构高阶邻近度S：

S＝F(A)＝w₁A+w₂A²+...+w_qA^q (2)

式中，q是高阶邻近度的阶数，w₁,...w_q是权重。当q→+∞时，如果S收敛到一个固定的值，则是理想状态。对于

w_i≥0。

一阶邻近度是捕获两个节点之间的局部成对邻近，指的是直接相连两点的边的权重。二阶邻近度捕获了两个节点之间各自近邻之间的相似性。进一步扩展，网络中两个节点之间的任何高阶邻近度都可以通过它们各自的高阶邻域的相似性来定义。更高阶的邻近信息对于学习网络嵌入也很有用，因为它以某种方式捕获了网络中连接的全局行为。具体地，不同的邻接矩阵的幂给出的是网络全局的连接信息。公式(2)中，A²是指用2步从当前节点到目标节点的连接权重。考虑累乘的效果，A^q所代表的意义是从点到点之间走q步能够到达的点与点之间的权重。

第二小步，计算网络结构高阶邻近度特征矩阵：

如果λ和x是矩阵A的一组特征值和特征向量，那么F(λ)和x是S的一组特征值和特征向量。给出如下证明过程：

Ax＝λx (3)

A²x＝Aλx＝λAx＝λ²x (4)

Sx＝F(A)x＝(w₁λ+w₂λ²+...+w_qλ^q)x＝F(λ)x (5)

秩矩阵的分解，一般可以由SVD的结果从高处截断得到，对网络结构高阶邻近度S做SVD分解，即：

S＝U_sΣV_s (6)

只截取SVD结果中奇异值最高的一部分，那么

对S分解:

公式解释如下：

Frobenius范数，简称F-范数，是一种矩阵范数，记为||·||_F。矩阵A的Frobenius范数定义为矩阵A各项元素的绝对值平方的总和。x,y＝argminF(x,y)是指当F(x,y)取得最小值时，变量x,y的取值。

步骤二，计算文献网络低维特征矩阵：

设计网络结构特征矩阵和节点内容特征矩阵的更新规则，迭代计算，获得它们的特征嵌入矩阵，将两个特征矩阵按比例相加融合，获取最终的文献网络特征矩阵，包括以下几个小步：

第一小步，网络节点内容数据建模：

第二小步，设计网络结构特征矩阵和节点内容特征矩阵的更新规则：

分别对A、C做非负矩阵分解，则有

A≈B₁B₂ (13)

C≈UV (14)

在公式(13)和公式(14)中，B₁是n×k阶矩阵，B₂是k×n阶矩阵，U是n×k阶矩阵，V是k×d阶矩阵，通常，应用于网络嵌入中，有k＜＜n。

在理想情况下，仅基于A的表示与仅基于C的表示能够完全匹配。但在现实中，它们可能会因网络中的噪声和拓扑不一致而失效。然而，这两者之间仍然应该有很强的一致性，为了将这种一致性充分利用起来，推出公式(15)和公式(16)。

其中，α₂,α₃,β₂,β₃≥0对应于各部分的权重，

利用结构和内容生成单一嵌入网络的一种直观方法是使用联合非负矩阵分解法，将公式(16)中的U替换为B₁。但这在实践中可能不起作用，因为大型信息网络中噪声很大，通常在结构和内容之间存在显著的不一致。因此，在两个成本函数中使用相同的嵌入矩阵是粗糙的，并且可能导致非常差的局部最优解。解决的办法是使用内容作为结构上的正则化器，相对地，使用结构作为内容的正则化器。

为了利用结构和内容的一致性，

多次迭代公式(18)和公式(20)的计算完成优化，获得网络的最终嵌入矩阵。在上述框架中，可以很容易地将网络和内容的先验知识结合起来。例如，如果知道网络的内容比链接结构更具信息性，那么在初始表示中U应该比B₁更加重要。这可以通过设置α₁比β₁更大的值来实现。相对地，如果β₁的值更大，网络结构就更重要，则获得的矩阵嵌入整体表现会更符合结构。

设置初始B₁为B₁ ^*，B₁值的更新与B₁ ^*无关，下面将推导出必要的更新规则，以解决公式(17)和公式(19)中的优化问题，在公式(18)中，如果以B₁为自变量，B₂为常量，则该函数是一个凹函数，为了求极小值，求偏导为0，得等式

I是单位矩阵，

是半正定矩阵，

的逆矩阵一定存在。证明如下：矩阵与其转置的乘积是一定半正定矩阵，两个半正定矩阵的和是半正定的，非负实数与半正定矩阵的数乘矩阵是半正定的。半正定矩阵的行列式是非负的，如果将0设定为一个趋向于0的最小值，因为是非负矩阵，则必可逆。

为了确保B₁的非负性，我们进一步设置B₁的更新规则为：

式中[X]₊表示矩阵X的每一个元素X_ij完成以下公式：

那么，以B₂为自变量，求极小值，求偏导为0，得等式：

同理求U、V，得：

U＝[(CV^T+β₁B₁)(VV^T+β₁I+β₂I)^-1]₊ (28)

V＝[(U^TU+β₃I)^-1U^TC]₊ (29)

第三小步，获取最终的网络嵌入矩阵：

为了获取最终的网络嵌入矩阵，则考虑以下情况：

步骤三，谱聚类完成文献网络节点聚类：

将最终的网络嵌入矩阵作为谱聚类的输入矩阵，选择全连接法构建数据节点的相似矩阵，依次计算出邻接矩阵、度矩阵和拉普拉斯矩阵，对拉普拉斯聚类完成标准化操作，选择K-Means聚类方法进行网络节点聚类，具体步骤包括如下过程：

(c)核函数参数gamma：通过交叉验证，选择合适数值为0.1；

(d)assign_labels：最后的聚类方法的选择。

使用“K-Means”完成聚类，聚类过程如下：

1，根据输入矩阵和全连接法构建数据节点的相似矩阵S；

2，根据相似矩阵S构建邻接矩阵W，构建度矩阵D；

3，计算出拉普拉斯矩阵L；

4，构建标准化后的拉普拉斯矩阵D^-1/2LD^-1/2；

5，计算D^-1/2LD^-1/2最小的n_clusters个特征值所各自对应的特征向量f；

6，将各自对应的特征向量f组成的矩阵按行标准化，最终组成n×n_clusters维的特征矩阵F；

7，对F中的每一行作为一个n_clusters维的节点，共n个节点，用K-Means聚类方法进行聚类，聚类维数为n_clusters；

8，得到每个节点的类别划分。

步骤四，计算人才价值数值：

在每一类别中，分别计算文献作者的总影响力数值及活跃度数值，设计权重将两个数值结合，计算人才价值数值。在同一类别中，我们分别统计出学术专业人才每一年的发文量，计算该学者当年成果的影响力数值，以此为基础设计权重将两个数值结合，完成人才数值评估，具体步骤包括如下过程：

第一小步，署名顺序

一般来说，一篇文献由多名专业人才共同完成，而第一作者是贡献最大的，第二作者次之，依此类推，借用作者贡献率等级分配公式(30)，计算署名顺序不同的作者对文献的贡献值D_j：

上式中，j代表作者署名顺序，t代表文献的作者总数。

第二小步，人才总影响力

I＝D_j×c (31)

公式(30)中，s为人才发表文献的总数，α＝1,2,3,4……s。

第三小步，人才价值评估

公式(31)中，y_max是要映射的目标区间最大值；y_min是要映射的目标区间最小值；x_max是目前数据最大值；x_min是目前数据最小值；x是假设目前数据中的任一值；y是归一化映射后的值；

将y_min设置为0，y_max设置为1，分别完成发文量和影响力的归一化，每一位人才的发文量和影响力数值分别设为y₁,y₂，人才评估数值的计算由公式(t×y₁+(1-t)×y₂)得出，(这里的t代表什么含义)用户通过设置t值确定权重，只将影响力作为人才评估指数时，设置t为0即可。

以上仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种人才价值评估方法，以专业人才发表的学术文献为基础，其特征在于：包括如下步骤：

S1，计算文献网络结构高阶邻近度特征矩阵：

S2，计算文献网络低维特征矩阵：

S3，谱聚类完成文献网络节点聚类：

S4，计算人才价值数值：

2.根据权利要求1所述的一种人才价值评估方法，其特征在于：所述S01的具体步骤如下：

S11，网络结构数据建模：

首先，计算网络结构邻接矩阵：

S＝F(A)＝w₁A+w₂A²+...+w_qA^q (2)

式中，q是高阶邻近度的阶数，w₁,…w_q是权重，对于

S12，计算网络结构高阶邻近度特征矩阵：

对网络结构高阶邻近度S做SVD分解，即：

S＝U_sΣV_s (3)

只截取SVD结果中奇异值最高的一部分，那么

对S分解:

3.根据权利要求2所述的一种人才价值评估方法，其特征在于：S2的具体步骤如下：

S21，网络节点内容数据建模：

取文献节点的内容矩阵为C，设为n×d阶矩阵，将文献节点中标题、关键词和摘要抽取出来构建词袋模型，C则基于该词袋模型计算而成，在词袋模型中，通常会删除停用字，并将词干提取作为预处理步骤进行，该矩阵的每一行都是对应节点上文本内容的tfidf 向量。

分别对A、C做非负矩阵分解，则有

A≈B₁B₂ (8)

C≈UV (9)

其中，α₂,α₃,β₂,β₃≥0对应于各部分的权重，

其中，D₁(B₁,B₂)代表结构内容靠近函数；

为了利用结构和内容的一致性，

其中，D₂(U,V)代表内容结构靠近函数；

I是单位矩阵，

是半正定矩阵，

式中[X]₊表示矩阵X的每一个元素X_ij完成以下公式：

那么，以B₂为自变量，求极小值，求偏导为0，得等式：

同理求U、V，得：

U＝[(CV^T+β₁B₁)(VV^T+β₁I+β₂I)^-1]₊ (23)

V＝[(U^TU+β₃I)^-1U^TC]₊ (24)

S23，获取最终的网络嵌入矩阵：

为了获取最终的网络嵌入矩阵，则考虑以下情况：

4.根据权利要求1所述的一种人才价值评估方法，其特征在于：S3的具体步骤包括如下过程：

(c)核函数参数gamma：通过交叉验证，选择合适数值为0.1；

(d)assign_labels：最后的聚类方法的选择。

5.根据权利要求4所述的一种人才价值评估方法，其特征在于：使用“K-Means”完成聚类；

聚类过程如下：

S31，根据输入矩阵和全连接法构建数据节点的相似矩阵S；

S32，根据相似矩阵S构建邻接矩阵W，构建度矩阵D；

S33，计算出拉普拉斯矩阵L；

S34，构建标准化后的拉普拉斯矩阵D^-1/2LD^-1/2；

S38，得到每个节点的类别划分。

6.根据权利要求1所述的一种人才价值评估方法，其特征在于：S4的具体步骤包括如下过程：

S41，署名顺序

上式中，j代表作者署名顺序，t代表文献的作者总数；

S42，人才总影响力

I＝D_j×c (26)

公式(27)中，s为人才发表文献的总数，α＝1,2,3,4……s；

S43，人才价值评估