CN115860706B

CN115860706B - 面向定制化需求的人员排序方法及装置

Info

Publication number: CN115860706B
Application number: CN202310168750.9A
Authority: CN
Inventors: 马涛; 李小伟; 刘金红; 郭茂华; 夏钧波; 胡文敏; 牛钊; 李歆昊
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2023-02-27
Filing date: 2023-02-27
Publication date: 2023-05-05
Anticipated expiration: 2043-02-27
Also published as: CN115860706A

Abstract

本发明公开了面向定制化需求的人员排序方法及装置。所述方法包括输入定制化需求和简历文本集合，提取定制化需求的关键词集合，遍历所述简历文本集合，计算每条简历文本与关键词集合的匹配性得分，将所述简历文本集合中简历文本，按所述匹配性得分从高到低顺序，得到人员排序信息。本发明所述方法构建了基于定制化需求的简历人物排序模型，所述方法既考虑了简历文本与关键词匹配的单词的相关性，又考虑了简历文本的主题对定制需求的内聚度大小，能够全面的反映定制化需求与简历文本的匹配度，为面向定制需求的人员排序提供了一种可用的方法。

Description

面向定制化需求的人员排序方法及装置

技术领域

本发明涉及电子信息及数据处理技术领域，尤其涉及一种面向定制化需求的人员排序方法及装置。

背景技术

数据分析人员根据特定的任务需求会关注位于特定地区、就职过特定单位、参与过特定工程项目、具备特定技能的人员，在获得一定范围内人员的简历后，如何向数据人员按与任务需求匹配性大小推送相关的人员，成为一个亟待解决的问题。目前主要是靠关键词检索匹配分析，通过一个或者数个关键词匹配到相关的简历人员，这种关键词检索匹配的方法很难从人员所从事的全部信息进行匹配，只考虑了需求关键词与简历文本的相关性，没有充分考虑到简历文本的内聚性。因此，需要一种既考虑定制化需求与简历文本相关性，又要考虑简历文本内聚性的智能算法去实现定制化需求的人员挖掘。

发明内容

鉴于上述现有定制化需求下人员挖掘存在的问题，本发明的目的在于提供一种面向定制化需求的人员排序方法及装置，实现智能化简历人员挖掘。

为了解决上述技术问题，本发明实施例第一方面公开了一种面向定制化需求的人员排序方法，方法包括：

S1，获取定制化需求、简历文本集合；所述简历文本集合包括至少一条简历文本；

S2，对所述定制化需求进行处理，得到关键词集合；所述关键词集合包含至少一个关键词；

S3，对所述关键词集合进行处理，得到所有关键词的权重系数；所述权重系数满足约束条件，所述 n表征所述关键词集合包含关键词的个数，所述 j为所述关键词集合的关键词对应的序号，所述 P _j表征所述关键词集合第 j个关键词的权重系数；

S4，遍历所述简历文本集合，计算每条简历文本与所述关键词集合的匹配性得分；

S5，按照所述匹配性得分从高到低顺序，将所述简历文本集合中简历文本进行排序，得到人员排序信息。

作为一种可选的实施方式，在本发明实施例第一方面中，所述定制化需求为定制词集合，或，定制文本段；所述定制词集合包含至少一个定制词。

作为一种可选的实施方式，在本发明实施例第一方面中，所述获取所述定制化需求的关键词集合包括：

如果所述定制化需求为定制词集合，确定所述定制词集合为关键词集合；

如果所述定制化需求为定制文本段，利用关键词提取算法，得到代表所述定制文本段的定制文本段关键词集合，将所述定制文本段关键词集合确定为关键词集合。所述关键词提取算法无监督的算法，可以为基于统计特征的关键词提取(TF-IDF)、基于词图模型的关键词提取(TextRank)、基于主题模型的关键词提取。

作为一种可选的实施方式，在本发明实施例第一方面中，所述对所述关键词集合进行处理，得到所有关键词的权重系数，包括：

依据定制化需求的任务需要，计算所述关键词集合中每个关键词权重大小，得到所有关键词的权重系数，或，依据从关键词提取算法中得到的关键词节点权重大小，确定所有关键词的权重系数。

作为一种可选的实施方式，在本发明实施例第一方面中，所述计算每条简历文本与所述关键词集合的匹配性得分，包括：

遍历所述关键词集合，对其中任一所述关键词 k _i，计算该关键词 k _i与所述简历文本的匹配分 S_v _i；所述 i表征顺序；

根据预设的匹配模型，计算简历文本与所述关键词集合的匹配性得分R_m；所述 m表征所述简历文本集合中第 m条简历文本。

所述预设的匹配模型为：

式中，R_m表示所述简历文本集合中第 m条简历文本与所述关键词集合匹配性得分， n表示所述关键词集合中关键词总数， P _i表示第 i个关键词的权重系数， S_v _i表示第 i个关键词 k _i的与第 m条简历文本的匹配分。

作为一种可选的实施方式，在本发明实施例第一方面中，所述计算所述关键词与所述简历文本的匹配分 S_v _i，包括：

预处理所述简历文本，得到简历文本的相关词集合；所述相关词集合包含至少一个相关词；

遍历所述相关词集合，利用预设的词向量相关模型，计算所述相关词集合中任一相关词 w _j与所述关键词 k _i的相关系数；所述词向量相关模型为：

式中，表示所述该关键词 k _i的词向量，表示所述相关词集合中第 j个单词 w _j的词向量，表示与的协方差，表示的方差，表示的方差；

将所述相关词集合中所有相关词所对应的降序排列，取相关系数最大的前 y个相关词，得到最优相关词集合，所述 y为大于0的自然数；

利用预设的关键词与简历文本匹配模型，计算所述关键词 k _i与所述简历文本的第一匹配分 S_k _i；所述关键词与简历文本匹配模型为：

式中， y表示所述最优相关词集合中相关词的个数，表示所述该关键词 k _i与所述最优相关词集合中相关词 u _f的相关系数。

利用预设的简历文本内聚模型，计算所述最优相关词集合中任意两个相关词的相关性，得到所述简历文本的第二匹配分 S_c _i；所述简历文本内聚模型为：

式中， y表示所述最优相关词集合中相关词的个数，表示所述最优相关词集合中任意两个相关词 u _h和 u _f的相关系数，所述 h， f表征顺序；

将第一匹配分 S_k _i与第二匹配分 S_c _i相乘，得到所述关键词 k _i与所述简历文本的匹配分 S_v _i，计算公式如下：

式中， S_k _i表示所述关键词 k _i与所述简历文本的第一匹配分， S_c _i表示所述简历文本的第二匹配分。

作为一种可选的实施方式，在本发明实施例第一方面中，所述预处理所述简历文本，得到简历文本相关词集合，包括：

去除所述简历文本中干扰字符，得到清洗后的简历文本；所述干扰字符包括但不限于制表符、特殊字符；

加载停用词表，对所述清洗后的简历文本进行分词、去停用词，得到简历文本相关词集合。

本发明实施例第二方面公开了一种面向定制化需求的人员排序装置，所述装置包括：

获取模块，用于获取定制化需求、简历文本集合；所述简历文本集合包括至少一条简历文本；所述定制化需求为定制词集合，或，定制文本段；

关键词处理模块，用于提取定制化需求的关键词集合，计算关键词的权重系数；

简历文本预处理模块，用于对简历文本进行预处理，得到简历文本相关词集合；所述相关词集合包含至少一个相关词；

匹配性得分计算模块，用于计算关键词集合和简历文本的匹配性得分；

人员排序模块，用于将所述简历文本集合中简历文本，按匹配性得分从高到低顺序，得到人员排序信息。

作为一种可选的实施方式，在本发明实施例第二方面中，所述关键词处理模块提取定制化需求的关键词集合，计算关键词的权重系数，包括：

如果所述定制化需求为定制文本段，利用关键词提取算法，得到代表所述定制文本段的定制文本段关键词集合，将所述定制文本段关键词集合确定为关键词集合。

作为一种可选的实施方式，在本发明实施例第二方面中，所述简历文本预处理模块，用于对简历文本进行预处理，得到简历文本相关词集合，包括：

作为一种可选的实施方式，在本发明实施例第二方面中，所述匹配性得分计算模块，用于计算关键词集合和简历文本的匹配性得分，包括：

判断是否完成所述关键词集合中所有关键词的与所述简历文本的匹配分的计算，得到第一判断结果；

如果第一判断结果为否，触发执行遍历所述关键词集合，对其中任一所述关键词 k _i，计算该关键词 k _i与所述简历文本的匹配分 S_v _i；

如果第一判断结果为是，则根据预设的匹配模型，计算简历文本与所述关键词集合的匹配性得分R_m；所述 m表征所述简历文本集合中第 m条简历文本；

所述预设的匹配模型为：

式中，R_m表示所述简历文本集合中第 m条简历文本与所述关键词集合匹配性得分， n表示所述关键词集合中关键词总数， P _i表示第 i个关键词的权重系数， S_v _i表示第 i个关键词的与第 m条简历文本的匹配分。

作为一种可选的实施方式，在本发明实施例第二方面中，所述计算所述关键词 k _i与所述简历文本的匹配分 S_v _i，包括：

遍历从所述简历文本预处理模块得到的相关词集合，利用预设的词向量相关模型，计算所述相关词集合中任一相关词 w _j与所述关键词 k _i的相关系数；

所述词向量相关模型为：

将所述相关词集合中所有相关词所对应的降序排列，取相关系数最大的前 y个相关词，得到最优相关词集合；所述 y为大于0的自然数；

式中， y表示所述最优相关词集合中相关词的个数，表示所述该关键词 k _i与所述最优相关词集合中相关词 u _f的相关系数；

利用预设的简历文本内聚模型，计算所述最优相关词集合中任意两个相关词的相关性，得到所述简历文本的第二匹配分 S_c _i；

所述简历文本内聚模型为：

将第一匹配分 S_k _i与第二匹配分 S_c _i相乘，得到所述关键词 k _i与所述简历文本的匹配分 S_v _i；所述匹配分 S_v _i为：

本发明的有益效果：

本发明所述的一种面向定制化需求的人员排序方法及装置，输入定制化需求，提取定制化需求的关键词集合，获取简历文本集合，遍历所述简历文本集合，计算每条简历文本与所述关键词集合的匹配性得分，将所述简历文本集合中简历文本，按所述匹配性得分从高到低顺序，得到人员排序信息。本发明所述方法构建了基于定制化需求的简历人物排序模型，所述方法中不仅反映了简历文本与关键词匹配的单词的相关性，还反映了简历文本的主题对定制需求的内聚度大小，解决了目前关键词匹配的方法只关注了局部的信息，忽略简历文本内聚度的问题，为面向定制需求的人员排序提供了一种可用的方法，可用于数据人员根据定制化需求进行精准的重要目标人物挖掘。

附图说明

图1是本发明实施例公开的一种面向定制化需求的人员排序方法流程示意图；

图2是本发明实施例公开的一种面向定制化需求的人员排序装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本发明公开了一种面向定制化需求的人员排序方法及装置，本发明涉及电子信息及数据处理技术领域，尤其涉及一种面向定制化需求的人员排序方法及装置。所述方法包括输入定制化需求，提取定制化需求的关键词集合，获取简历文本集合，遍历所述简历文本集合，计算每条简历文本与所述关键词集合的匹配性得分，将所述简历文本集合中简历文本，按所述匹配性得分从高到低顺序，得到人员排序信息。以下分别进行详细说明。

实施例一

图1是本发明实施例公开的一种面向定制化需求的人员排序方法流程示意图。其中，图1所描述的面向定制化需求的人员排序方法应用于数据人员进行特定人员发现的挖掘系统中，如用于面向定制化需求任务进行简历人员相关性排序的的本地服务器或云端服务器等，本发明实施例不做限定。如图1所示，该面向定制化需求的人员排序方法可以包括以下操作：

S1.获取定制化需求、简历文本集合。

本发明实施例中，上述简历文本集合包括至少一条简历文本；

可选的，本发明实施例中，上述定制化需求可以为定制词集合，也可以为定制文本段，所述定制词集合包含至少一个定制词。

可选的，所述简历文本集合获取方式包括：通过存储介质导入、通过网络导入、通过服务器导入。

可见，多种的简历文本集合获取方式利于用户的简历文本集合的导入，提升了用户体验感。

可选的，所述简历文本集合中简历文本为txt文本文件。

可选的，原始简历文件可以从地方公司HR或互联网招聘网站上获取，原始简历文件所述可以为pdf、doc和docx等格式的电子简历文件，使用工具软件，如doctotext、pdftotext等，将原始简历文件进行简历文本的提取，并保存成对应的txt文本文件，得到txt格式的所述简历文本。

可见，原始简历文件来源非常广泛，可以为多种格式，通过常见的工具软件转换为txt格式的简历文本，为数据人员获取简历提供了广泛的途径。

S2.对定制化需求进行处理，得到关键词集合。

可选的，如果所述定制化需求为定制词集合，确定所述定制词集合为关键词集合；如果所述定制化需求为所述定制文本段，利用现有的关键词提取算法，如TextRank算法，提取能代表所述定制文本段的定制文本段关键词集合，确定所述定制文本段关键词集合为关键词集合。

可见，本发明实施例所描述的面向定制化需求的人员排序方法中所述定制化需求可以是一组定制词，也可以是一段描述文本，可适应不同的定制需求。

S3.对关键词集合进行处理，得到所有关键词的权重系数。

所述权重系数满足约束条件，所述 n表征所述关键词集合包含关键词的个数，所述 j为所述关键词集合的关键词对应的序号，所述 P _j表征所述关键词集合第 j个关键词的权重系数；

可选的，本发明实施例中，依据所述关键词集合中每个关键词权重大小，确定所述关键词的权重系数；需求大小相同，则每个关键词的权重系数 P _j都同为1/ n，所述 n为关键词的个数。

或，依据关键词提取算法得到的关键词节点权重大小，确定所述关键词的权重系数。例如，在关键词提取算法中，第 j个关键词的节点权重大小为 s _j进行相应比例的权重系数赋值，第 j个关键词权重系数 P _j计算方法如下：

式中， P _j表示第 j个关键词权重系数， s _j表示关键词提取算法中第 j个关键词的节点权重， n表示关键词集合包含关键词的个数。

可见，将定制化需求提炼为关键词集合，使需求更精准；赋予每个关键词不同的权重系数，使核心需求可以获得更高的匹配性得分。

S4.遍历简历文本集合，计算每条简历文本与关键词集合的匹配性得分。

S5.按照匹配性得分从高到低顺序，将简历文本集合中简历文本进行排序，得到人员排序信息。

可见，实施本发明实施例所描述的面向定制化需求的人员排序方法通过对定制化需求与简历文本的匹配性计算，得到定制化需求与简历文本的匹配性得分，根据匹配性得分的高低得到简历文本所对应的人员与定制需求的关联度大小，为面向定制需求的人员排序提供了一种可用的方法。

在一个可选的实施例中，上述步骤S4中计算每条简历文本与所述关键词集合的匹配性得分，包括：

遍历所述关键词集合，对其中任一关键词 k _i计算所述关键词 k _i与所述简历文本的匹配分 S_v _i，所述 k _i表征第 i个关键词，所述 i表征顺序；

所述匹配性得分等于所述关键词集合中所有关键词组所述匹配分与所述权重系数乘积的总和，计算方法如下：

式中，R_m表示所述简历文本集合中第 m条简历文本对应人物的匹配性得分， n表示所述关键词集合中关键词总数， P _i表示第 i个关键词的相关系数， S_v _i表示第 i个关键词的与第 m条简历文本的匹配分。

可选的，上述计算所述关键词 k _i与所述简历文本的匹配分 S_v _i，包括：

预处理所述简历文本，得到简历文本的相关词集合，所述相关词集合包含至少一个相关词；

遍历所述相关词集合，计算所述相关词集合中任一相关词与所述该关键词的相关系数，记作，计算公式如下：

式中，表示所述该关键词 k _i的词向量，表示所述相关词集合中第 j个单词的词向量，表示与的协方差，表示的方差，表示的方差；

计算所述该关键词 k _i与所述简历文本的第一匹配分 S_k _i，公式如下：

计算所述最优相关词集合中任意两个相关词的相关性，得到所述简历文本的第二匹配分 S_c _i，计算公式如下：

式中， y表示所述最优相关词集合中相关词的个数，表示所述最优相关词集合中任意两个相关词 u _h和 u _f，所述 h， f表征顺序；

可选的，上述预处理所述简历文本，得到简历文本的相关词集合，包括：

可见，实施本发明实施例所描述的一种面向定制化需求的人员排序方法能够输入定制化需求，提取定制化需求的关键词集合，获取简历文本集合，遍历所述简历文本集合，计算每条简历文本与所述关键词集合的匹配性得分，将所述简历文本集合中简历文本所对应的人员按所述匹配性得分从高到低排序，得到并输出人员排序信息。本发明所述方法构建了基于定制化需求的简历人物排序模型，所述方法中不仅反映了简历文本与关键词匹配的单词的相似性，也反映了简历文本的主题对定制需求的内聚度大小，解决了目前关键词匹配的方法只关注了局部的信息，忽略了简历文本内聚度的问题，为面向定制需求的人员排序提供了一种可用的方法。

实施例二

图2是本发明实施例公开的一种面向定制化需求的人员排序装置结构示意图。其中，图2所描述的面向定制化需求的人员排序装置应用于数据人员进行特定人员发现的挖掘系统中，如用于面向定制化需求任务进行简历人员相关性排序的本地服务器或云端服务器等，本发明实施例不做限定。如图2所示，该面向定制化需求的人员排序装置可以包括：

获取模块201，用于获取定制化需求、简历文本集合。

关键词处理模块202，用于提取定制化需求的关键词集合，计算关键词的权重系数；

简历文本预处理模块203，用于对简历文本进行预处理，得到简历文本相关词集合；

匹配性得分计算模块204，用于计算关键词集合和简历文本的匹配性得分；

人员排序模块205，用于将所述简历文本集合中简历文本，按匹配性得分从高到低顺序，得到人员排序信息。

可见，实施图2所描述的面向定制化需求的人员排序装置，能够通过对定制需求和简历文本集合进行匹配性计算，得到简历文本所对应人员与定制化需求的匹配度，进而得到人员排序信息，提高了数据人员根据定制化需求进行精准的重要目标人物挖掘的效率和准确率。

可选的，上述关键词处理模块202提取定制化需求的关键词集合，计算关键词的权重系数，具体方式为：

可选的，上述简历文本预处理模块203对简历文本进行预处理，得到简历文本相关词集合，具体方式为：

可选的，上述匹配性得分计算模块204计算关键词集合和简历文本的匹配性得分，具体方式为：

遍历所述关键词集合，对其中任一所述关键词 S_v _i，计算该关键词 k _i与所述简历文本的匹配分 S_v _i；所述 i表征顺序；

所述预设的匹配模型为：

可选的，上述匹配性得分计算模块204计算所述关键词 k _i与所述简历文本的匹配分 S_v _i，包括：

所述词向量相关模型为：

所述简历文本内聚模型为：

可见，利用匹配性得分计算模块不仅计算了简历文本与关键词匹配的单词的相关性，还计算了简历文本的主题对定制需求的内聚度大小，解决了目前关键词匹配的方法只关注了局部的信息，忽略简历文本内聚度的问题。

最后应说明的是：本发明实施例公开的一种面向定制化需求的人员排序方法及装置所揭露的仅为本发明较佳实施例而已，仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各项实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或替换，并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims

1.一种面向定制化需求的人员排序方法，其特征在于，所述方法包括：

S3，对所述关键词集合进行处理，得到所有关键词的权重系数；所述所有关键词的权重系数之和为1；

S4，遍历所述简历文本集合，计算每条简历文本与所述关键词集合的匹配性得分，包括：

遍历所述关键词集合，对其中任一所述关键词k _i，计算该关键词k _i与所述简历文本的匹配分S_v _i，所述i表征顺序，具体包括：

去除所述简历文本中干扰字符，得到清洗后的简历文本；

加载停用词表，对所述清洗后的简历文本进行分词、去停用词，得到简历文本相关词集合；所述相关词集合包含至少一个相关词；

遍历所述相关词集合，利用预设的词向量相关模型，计算所述相关词集合中任一相关词与所述关键词k _i的相关系数；

所述词向量相关模型为：

式中，表示所述该关键词k _i的词向量，表示所述相关词集合中第j个单词w _j的词向量，表示与的协方差，表示的方差，表示的方差；

将所述相关词集合中所有相关词所对应的降序排列，取相关系数最大的前y个相关词，得到最优相关词集合；所述y为大于0的自然数；

利用预设的关键词与简历文本匹配模型，计算所述关键词k _i与所述简历文本的第一匹配分；所述关键词与简历文本匹配模型为：

式中，y表示所述最优相关词集合中相关词的个数，表示所述该关键词k _i与所述最优相关词集合中相关词u _f的相关系数；

利用预设的简历文本内聚模型，计算所述最优相关词集合中任意两个相关词的相关性，得到所述简历文本的第二匹配分S_c _i；

所述简历文本内聚模型为：

式中，y表示所述最优相关词集合中相关词的个数，表示所述最优相关词集合中任意两个相关词u _h 和u _f的相关系数，所述h，f表征顺序；

将第一匹配分S_k _i与第二匹配分S_c _i相乘，得到所述关键词k _i与所述简历文本的匹配分S_v _i；所述匹配分S_v _i为：

式中，S_k _i表示所述关键词k _i与所述简历文本的第一匹配分，S_c _i表示所述简历文本的第二匹配分；

根据预设的匹配模型，计算简历文本与所述关键词集合的匹配性得分R_m；所述m表征所述简历文本集合中第m条简历文本；

所述预设的匹配模型为：

式中，R_m表示所述简历文本集合中第m条简历文本与所述关键词集合匹配性得分，n表示所述关键词集合中关键词总数，P _i表示第i个关键词的权重系数，S_v _i表示第i个关键词的与第m条简历文本的匹配分；

2.根据权利要求1所述的面向定制化需求的人员排序方法，其特征在于，所述定制化需求为定制词集合，或，定制文本段；

所述定制词集合包含至少一个定制词。

3.根据权利要求2所述的面向定制化需求的人员排序方法，其特征在于，所述对所述定制化需求进行处理，得到关键词集合，包括：

如果所述定制化需求为定制文本段，利用关键词提取算法，得到关键词集合。

4.根据权利要求1所述的面向定制化需求的人员排序方法，其特征在于，所述对所述关键词集合进行处理，得到所有关键词的权重系数，包括：

5.一种面向定制化需求的人员排序装置，其特征在于，包括：

获取模块，用于获取定制化需求、简历文本集合；

简历文本预处理模块，用于对简历文本进行预处理，得到简历文本相关词集合，包括：

所述简历文本预处理模块去除所述简历文本中干扰字符，得到清洗后的简历文本；

所述简历文本预处理模块加载停用词表，对所述清洗后的简历文本进行分词、去停用词，得到简历文本相关词集合；

匹配性得分计算模块，用于计算关键词集合和简历文本的匹配性得分，包括：

所述简历文本预处理模块遍历所述关键词集合，对其中任一所述关键词k _i，计算该关键词k _i与所述简历文本的匹配分S_v _i，所述i表征顺序，具体包括：

所述简历文本预处理模块遍历所述相关词集合，利用预设的词向量相关模型，计算所述相关词集合中任一相关词w _j与所述关键词k _i的相关系数；

所述词向量相关模型为：

所述简历文本预处理模块将所述相关词集合中所有相关词所对应的降序排列，取相关系数最大的前y个相关词，得到最优相关词集合；所述y为大于0的自然数；

所述简历文本预处理模块利用预设的关键词与简历文本匹配模型，计算所述关键词k _i与所述简历文本的第一匹配分S_k _i；所述关键词与简历文本匹配模型为：

所述简历文本预处理模块利用预设的简历文本内聚模型，计算所述最优相关词集合中任意两个相关词的相关性，得到所述简历文本的第二匹配分S_c _i；

所述简历文本内聚模型为：

所述简历文本预处理模块将第一匹配分S_k _i与第二匹配分S_c _i相乘，得到所述关键词k _i与所述简历文本的匹配分S_v _i；所述匹配分S_v _i为：

所述简历文本预处理模块根据预设的匹配模型，计算简历文本与所述关键词集合的匹配性得分R_m；所述m表征所述简历文本集合中第m条简历文本；

所述预设的匹配模型为：