CN115221302A

CN115221302A - 基于文本分析的人力资源推荐方法

Info

Publication number: CN115221302A
Application number: CN202210855850.4A
Authority: CN
Inventors: 王冉
Original assignee: SHIJIAZHUANG INFORMATION ENGINEERING VOCATIONAL COLLEGE
Current assignee: SHIJIAZHUANG INFORMATION ENGINEERING VOCATIONAL COLLEGE
Priority date: 2022-07-20
Filing date: 2022-07-20
Publication date: 2022-10-21

Abstract

本发明公开了一种基于文本分析的人力资源推荐方法，包括：获取用人企业需求人才的岗位描述文本信息，基于获取的岗位描述文本信息确定任职条件，并提取任职条件下的需求关键词；以及，从该待业人员的简历文本信息中提取多个求职关键词；为该待业人员各求职条件配置对应的求职关键词；确定任职条件与求职条件之间的匹配程度；确定该待业人员的求职条件与当前岗位的综合匹配程度；将各待业人员求职条件的综合匹配程度进行排序，以基于综合匹配程度靠前的待业人员向用人企业进行推荐。本申请的方案将求职条件与任职条件进行匹配，通过模型输出综合匹配程度靠前的待业人员，实现智能化向企业推送与岗位适配的人才，提高企业的招聘效率。

Description

基于文本分析的人力资源推荐方法

技术领域

本发明涉及计算机技术领域，尤其涉及一种基于文本分析的人力资源推荐方法。

背景技术

随着社会的进步，招聘和求职的需求量不断增大，并且招聘岗位的细分程度也越来越精细化。而传统的一些收集信息的渠道，如专人登记等，己不能满足当前诸多企业对人才信息收集需要。而现在各种招聘网站层出不穷，网络化的社交方式也提供了良好的人力资源平台，由于网络招聘平台信息的丰富性以及操作的便利性，越来越多的求职者通过网络招聘平台查询合适的招聘职位信息进行求职。

目前的网络招聘平台求职的方法是：招聘企业在招聘平台上发布招聘信息，招聘信息被存储在网络招聘平台的招聘职位数据库中，求职者在求职时通过网络招聘平台在职位数据库中检索查找合适的招聘职位，然后投递简历，以等待招聘企业的回复。

然而，求职者在现有的招聘平台上求职时，由于求职简历与招聘职位不能实现智能精确匹配。由此企业通常需要大量的时间来找到合适空缺岗位的人才，长期的岗位空缺，给企业带来极大的不便。

发明内容

本发明实施例提供一种基于文本分析的人力资源推荐方法，根据企业的任职条件对待业者的简历信息进行匹配，从而精确向企业推荐合适的应聘人员，提高企业的招聘效率，同时提高求职者的求职成功率。

本发明实施例提出基于文本分析的人力资源推荐方法，包括：

数据采集步骤：获取用人企业需求人才的岗位描述文本信息，并获取数个待业人员的简历文本信息；

关键词提取步骤：对所述岗位描述文本信息确定任职条件，并提取所述任职条件下的需求关键词；

以及，对任一待业人员的所述简历文本信息进行分类，以获得求职条件，并从该待业人员的所述简历文本信息中提取多个求职关键词；

任职匹配步骤：为该待业人员各求职条件配置对应的求职关键词；

基于所述任职条件与配置后的求职条件，确定任职条件与求职条件之间的匹配程度；

根据预先配置的当前岗位下各任职条件的权重确定该待业人员的求职条件与当前岗位的综合匹配程度；

人才推荐步骤：将各待业人员求职条件的综合匹配程度进行排序，以基于综合匹配程度靠前的待业人员向用人企业进行推荐。

可选的，为该待业人员各求职条件配置对应的求职关键词包括采用如下方法构建各求职条件下的求职关键词的词向量：

为各求职条件配置多个求职关键词，形成求职序列S＝{s₁,…,s_i…,s_n}，n为求职关键词的数量；

为任一求职条件的各求职关键词s_i配置标识向量a_i；

基于任一求职条件的各求职关键词向量s_i以及标识向量a_i，拼接形成第一向量Z_i＝[s_i；a_i]作为双向LSTM模型的输入；

拼接双向LSTM模型的前向LSTM模型

以及后向LSTM模型

的输出，以基于双向LSTM模型输出求职序列的求职关键词s_i的词向量q_i。

可选的，基于与求职条件对应的任职条件，配置求职关键词s_i如下属性向量：

用于描述求职关键词s_i与求职条件最近距离的第一属性向量at¹；

用于描述求职关键词s_i与求职条件最远距离的第二属性向量at²；

用于描述求职关键词s_i与对应任职条件最近距离的第三属性向量at³；

用于描述求职关键词s_i与对应任职条件最远距离的第四属性向量at⁴；

基于所述任职条件与配置后的求职条件，确定任职条件与求职条件之间的匹配程度包括：

对于求职关键词s_i，拼接第一属性向量at¹、第二属性向量at²、第三属性向量at³、第四属性向量at⁴以及词向量q_i，以构建语义向量F_i＝[at¹；at²；at³；at⁴；q_i]，并将语义向量输入CNN模型；

对于求职关键词s_i，使用第一卷积过滤向量C_j生成第一目标值u_i，满足：

其中，第一卷积过滤向量C_s用于描述词语s_i在简历文本信息中的文本关系，T表示转秩运算，z表示窗口规模；

基于目标值u_i，利用最大池化模型，从{u_i|i∈[1,n]}，生成第二目标值u^*，满足：

u^*＝max_pooling(u₁,…,u_n)

基于CNN模型，生成求职序列S的全局语义向量u_j：

其中，f_j为第一卷积过滤向量C_j的数量。

可选的，将构建的语义向量F_i输入CNN模型之后还包括：

对于求职序列S中的求职关键词s_i，定义用于描述求职关键词s_i自身文本属性的第二卷积过滤向量C_k；

对于求职关键词s_i，使用第二卷积过滤向量C_k生成第三目标值u′_i，满足：

基于目标值u′_i，利用最大池化模型，从{u′_i|i∈[s_be,s_ed]}，1≤s_be≤s_ed≤n,，生成第四目标值u′^*，满足：

基于CNN模型，生成求职关键词s_i的局部语义向量u_k：

其中，f_k为第二卷积过滤向量C_k的数量。

可选的，基于所述任职条件与配置后的求职条件，确定任职条件与求职条件之间的匹配程度还包括：

基于预先构建的关键词库查询求职关键词s_i的概念集合，

以及查询任职条件中任职关键词p_i的概念集合

计算求职关键词s_i与任职条件P中任职关键词p_i之间的语义相似度：

其中，sim(s_i,P)表示求职关键词s_i与任职条件P中任职关键词p_i之间的语义相似度。

通过依存关系分析模型，确定求职序列S的依存关系结构树；

基于求职关键词s_i与任职条件P中任职关键词p_i之间的语义相似度sim(s_i,P)，计算求职序列S到任职条件P的注意力值，满足：

其中，l_i表示求职关键词s_i到任职条件P的依存距离，m表示依存距离窗口尺寸；

对于求职序列S，第i个求职关键词s_i对任职条件P的注意力值att_i，满足：

基于注意力值att_i生成注意力向量：

其中，u_ATT表示注意力值att_i的注意力向量。

拼接所述全局语义向量u_j、注意力向量u_ATT以及局部语义向量u_k；

将拼接后的向量输入到带有SoftMax激活函数的前馈神经网络模型，生成匹配程度预测向量v；

v＝SoftMax{M^T[u_j；u_ATT；u_k]+b}

M表示权重矩阵，b表示偏差向量。

可选的，采用如下目标函数执行训练：

其中，

表示求职条件对应的求职序列S_x与任职条件P_y之间的匹配关系；

使用随机梯度下降算法和反向传播算法，训练目标函数，在网络模型收敛时，训练结束。

本申请实施例还提出一种基于文本分析的人力资源推荐装置，包括：处理器和存储器，所述存储器上存储有计算机程序，所述计算机程序被处理器执行时实现前述的基于文本分析的人力资源推荐方法的步骤。

本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现前述的基于文本分析的人力资源推荐方法的步骤。

本申请的方法通过对岗位描述文本信息确定任职条件，并提取任职条件下的需求关键词，同时，对任一待业人员的简历文本信息进行分类，以获得求职条件，并从该待业人员的简历文本信息中提取多个求职关键词，从而将求职条件与任职条件进行匹配，通过模型输出综合匹配程度靠前的待业人员。实现智能化向企业推送与岗位适配的人才，提高企业的招聘效率。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1为本实施例的人力资源推荐方法的基本流程图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本申请实施例提出一种基于文本分析的人力资源推荐方法，如图1所示，包括：

数据采集步骤S101：获取用人企业需求人才的岗位描述文本信息，并获取数个待业人员的简历文本信息。具体的可以根据企业对某招聘岗位的岗位描述中来获取对应的文本信息，待业人员的简历信息可以通过大数据进行粗筛选，确定出数个与本岗位可能适配的待业人员的简历信息，并提取出建立文本信息。

关键词提取步骤S102：对所述岗位描述文本信息确定任职条件，并提取所述任职条件下的需求关键词。具体的例如描述文本信息中包括学历要求，工作经验要求，年龄要求等等，可以作为任职条件。对应的可以提取任职条件下的需求关键词，例如本科，30岁以下，相关领域工作经验2年等等。

以及，对任一待业人员的所述简历文本信息进行分类，以获得求职条件，并从该待业人员的所述简历文本信息中提取多个求职关键词。本示例中重点针对待业人员的所述简历文本信息提取的多个求职关键词进行分析。大多数情况下，企业的岗位描述文本信息的需求较为明确，而求职人员的简历信息会因为个人的经历有巨大的差异，因此在后续分析中，本申请重点基于求职人员的简历信息所提取的关键词进行匹配，以达到精准推荐的目的。

任职匹配步骤S103：为该待业人员各求职条件配置对应的求职关键词。具体的，例如可以根据待业人员的工作经历，来提取并分配各求职条件下的关键词。本示例中求职条件的类别数量可以与企业任职条件的类别数量相同，以便于后期进行匹配。

基于所述任职条件与配置后的求职条件，确定任职条件与求职条件之间的匹配程度。具体可以采用机器学习的方式实现，最后输出匹配程度，具体的匹配程度可以采用归一化的方式。

根据预先配置的当前岗位下各任职条件的权重确定该待业人员的求职条件与当前岗位的综合匹配程度。具体的，例如可以为“学历”、年龄、工作经验等任职条件分别配置企业期望的权重值，以根据不同岗位的需求来实现精准推荐。

人才推荐步骤S104：将各待业人员求职条件的综合匹配程度进行排序，以基于综合匹配程度靠前的待业人员向用人企业进行推荐。

在一些实施例中，为该待业人员各求职条件配置对应的求职关键词包括采用如下方法构建各求职条件下的求职关键词的词向量：

为各求职条件配置多个求职关键词，形成求职序列S＝{s₁,…,s_i…,s_n}，n为求职关键词的数量。具体的可以根据求职条件的不同设置对应的求职序列，也可以根据简历文本信息中的个人经历配置多个求职条件，从而提高推荐的准确度。

为任一求职条件的各求职关键词s_i配置标识向量a_i，标识向量可以用于表示求职关键词与求职条件之间的关联程度。

基于任一求职条件的各求职关键词向量s_i以及标识向量a_i，拼接形成第一向量Z_i＝[s_i；a_i]作为双向LSTM模型的输入。

拼接双向LSTM模型的前向LSTM模型

以及后向LSTM模型

的输出

以基于双向LSTM模型输出求职序列的求职关键词s_i的词向量

在一些实施例中，基于与求职条件对应的任职条件，配置求职关键词s_i如下属性向量：

对于求职关键词s_i，拼接第一属性向量at¹、第二属性向量at²、第三属性向量at³、第四属性向量at⁴以及词向量q_i，以构建语义向量F_i＝[at¹；at²；at³；at⁴；q_i]，并将语义向量输入CNN模型，从而生成全局性的语义向量。

具体的，对于求职关键词s_i，使用第一卷积过滤向量C_j生成第一目标值u_i，满足：

其中，第一卷积过滤向量C_s用于描述词语s_i在简历文本信息中的文本关系，T表示转秩运算，z表示窗口规模。

u^*＝max_pooling(u₁,…,u_n)

基于CNN模型，生成求职序列S的全局语义向量u_j：

其中，f_j为第一卷积过滤向量C_j的数量。

在一些实施例中，将构建的语义向量F_i输入CNN模型之后还包括：

对于求职序列S中的求职关键词s_i，定义用于描述求职关键词s_i自身文本属性的第二卷积过滤向量C_k。

基于目标值u′_i，利用最大池化模型，从{u′_i|i∈[s_be,s_ed]}，1≤s_be≤s_ed≤n,，其中s_be和s_ed分别表示求职关键词的起止位置，生成第四目标值u′^*，满足：

基于CNN模型，生成求职关键词s_i的局部语义向量u_k：

其中，f_k为第二卷积过滤向量C_k的数量。

在一些实施例中，基于所述任职条件与配置后的求职条件，确定任职条件与求职条件之间的匹配程度还包括：

基于预先构建的关键词库查询求职关键词s_i的概念集合，

以及查询任职条件中任职关键词p_i的概念集合

通过预先构建的依存关系分析模型，确定求职序列S的依存关系结构树；

基于注意力值att_i生成注意力向量：

其中，u_ATT表示注意力值att_i的注意力向量。

将拼接后的向量输入到带有SoftMax激活函数的前馈神经网络模型中，生成匹配程度预测向量v；

v＝SoftMax{M^T[u_j；u_ATT；u_k]+b}

M表示权重矩阵，b表示偏差向量，匹配程度预测向量

的维度|V|等于求职关键词的数量。

在一些实施例中，采用如下目标函数执行训练：

其中，

表示求职条件对应的求职序列S_x与任职条件P_y之间的匹配关系。

使用随机梯度下降算法和反向传播算法，训练目标函数，在网络模型收敛时，训练结束。通过这样的方式能够结合多层级的关键词信息，实现更精确的条件匹配提高人才推荐的效率。

本申请的方法通过对岗位描述文本信息确定任职条件，并提取任职条件下的需求关键词，同时，对任一待业人员的简历文本信息进行分类，以获得求职条件，并从该待业人员的简历文本信息中提取多个求职关键词，从而将求职条件与任职条件进行匹配，通过模型输出综合匹配程度靠前的待业人员。本申请的方法尤其适用于对具有多段不同工作经历的待业人员的筛选，实现智能化向企业推送与岗位适配的人才，提高企业的招聘效率。

此外，尽管已经在本文中描述了示例性实施例，其范围包括任何和所有基于本公开的具有等同元件、修改、省略、组合(例如，各种实施例交叉的方案)、改编或改变的实施例。权利要求书中的元件将被基于权利要求中采用的语言宽泛地解释，并不限于在本说明书中或本申请的实施期间所描述的示例，其示例将被解释为非排他性的。因此，本说明书和示例旨在仅被认为是示例，真正的范围和精神由以下权利要求以及其等同物的全部范围所指示。

以上描述旨在是说明性的而不是限制性的。例如，上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外，在上述具体实施方式中，各种特征可以被分组在一起以简单化本公开。这不应解释为一种不要求保护的公开的特征对于任一权利要求是必要的意图。相反，本公开的主题可以少于特定的公开的实施例的全部特征。从而，以下权利要求书作为示例或实施例在此并入具体实施方式中，其中每个权利要求独立地作为单独的实施例，并且考虑这些实施例可以以各种组合或排列彼此组合。本发明的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。

以上实施例仅为本公开的示例性实施例，不用于限制本发明，本发明的保护范围由权利要求书限定。本领域技术人员可以在本公开的实质和保护范围内，对本发明做出各种修改或等同替换，这种修改或等同替换也应视为落在本发明的保护范围内。