CN114139065B

CN114139065B - 基于大数据的人才筛选推荐方法、系统及可读存储介质

Info

Publication number: CN114139065B
Application number: CN202210115851.5A
Authority: CN
Inventors: 张广志; 于笑博; 成立立; 李奇
Original assignee: Beiling Rongxin Datalnfo Science and Technology Ltd
Current assignee: Beiling Rongxin Datalnfo Science and Technology Ltd
Priority date: 2022-02-07
Filing date: 2022-02-07
Publication date: 2022-05-24
Anticipated expiration: 2042-02-07
Also published as: CN114139065A

Abstract

本申请实施例提供了基于大数据的人才筛选推荐方法、系统及可读存储介质。该方法，包括：获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据；获取所述目标人群数据的人才特征信息生成目标人群特征画像；根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比，获取参考样本数据集；根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据；根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才；从而基于目标人群特征画像以及决策树模型实现目标受聘人才的精确推荐，可以提高推荐的准确率。

Description

基于大数据的人才筛选推荐方法、系统及可读存储介质

技术领域

本申请涉及大数据技术领域，具体而言，涉及一种基于大数据的人才筛选推荐方法、系统及可读存储介质。

背景技术

目前随着社会的发展，全社会全行业对各类人才的需求日益剧增，人才是区域/行业在自然资源、环境条件相对固定的前提下，实现经济增长的动力和源泉，当一个区域/行业人才表现为人才状况好，高素质、高技能、高学历的人才多，人才流动快，人才年轻化程度高、创新能力强的时候,高新技术产业、技术密集型产业就多，当地的经济实力就强，发展后劲就足，区域/行业经济活力自然就增强，因此人才活力是促进区域经济活力的重要因素。

而目前现有人才招聘获得方式主要是通过各招聘平台或招聘信息网以及各类招聘引擎等传统互联网方法获取人才，但对人才的选择缺乏全面的数据信息，缺少更精准细致的筛查方法，导致传统互联网招聘方式对人才的筛选和推荐的准确度不高，无法准确满足人才和用人单位的双向需求，难以实现双赢。

针对上述问题，目前尚未有有效的技术解决方案。

发明内容

本申请实施例的目的在于提供一种基于大数据的人才筛选推荐方法、系统及可读存储介质，可以提高目标受聘人才筛选的准确度。

本申请实施例还提供了一种基于大数据的人才筛选推荐方法，包括以下步骤：

获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据；

获取所述目标人群数据的人才特征信息生成目标人群特征画像，所述人才特征信息包括性别信息、学历信息、从业经验、业界成绩以及薪酬期望值；

根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比，获取参考样本数据集；

根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据；

根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才。

可选地，在本申请实施例所述的基于大数据的人才筛选推荐方法中，所述根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比，获取参考样本数据集，包括：

获取人才数据库；

根据所述目标人群的性别信息、学历信息、从业经验、业界成绩以及薪酬期望值生成目标人群数据集；

根据所述目标人群数据集与所述人才数据库的样本数据进行数据筛选获得多个参考样本数据；

根据获得的所述多个参考样本数据获得参考样本数据集。

可选地，在本申请实施例所述的基于大数据的人才筛选推荐方法中，所述根据参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据，包括：

将参考样本数据集中的各样本数据输入到训练好的决策树模型中；

所述样本数据包括所述参考样本数据集中各样本的人才特征信息；

所述决策树模型对所述各样本数据进行数据偏差率预测，获取不规则数据阈值；

所述决策树模型根据获取的所述不规则数据阈值对所述参考样本数据集进行节点数据阈值对比；

将所述节点数据阈值对比结果中小于所述不规则数据阈值的样本数据标记为不规则数据；

对所述参考样本数据集中标记的所述不规则数据进行剪枝和分类得到目标人才数据。

可选地，在本申请实施例所述的基于大数据的人才筛选推荐方法中，所述方法还包括：

获取参考样本数据集各样本数据的不规则数据；

根据所述不规则数据获得所述参考样本数据集的不规则数据率；

根据所述不规则数据率与所述预测的数据偏差率的比值与偏差率预设值进行对比；

若所述比值大于所述偏差率预设值，则所述参考样本数据集存在偏差，对所述参考样本数据集进行修正；

根据修正后的所述参考样本数据集输入到训练好的决策树模型中进行样本数据处理。

可选地，在本申请实施例所述的基于大数据的人才筛选推荐方法中，所述根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才，包括：

所述人才筛选平台根据各用人单位的拟聘人才数据建立拟聘人才数据库；

所述拟聘人才数据库包括所述目标人才数据中各拟聘人才对应的拟聘人才筛选倾向度系数；

所述拟聘人才筛选倾向度系数根据所述各拟聘人才的对应目标人才数据参数计算获得；

根据获得的所述各拟聘人才的拟聘人才筛选倾向度系数进行排名获得目标受聘人才。

根据公式计算所述各拟聘人才的拟聘人才筛选倾向度系数：

Q_x=U_x+V_xB_x+W/AR_x；

其中，Q_x为第x个拟聘人才的拟聘人才筛选倾向度系数，U_x为第x个拟聘人才的业界影响力系数，V_x为第x个拟聘人才的从业经验值，B_x为第x个拟聘人才的聘前薪酬指数，W为拟聘人才岗位团队比重系数，A为拟聘人才岗位风险指数，R_x为第x个拟聘人才的薪酬期望值，x为第x个拟聘人才；

根据所述目标人才数据的各拟聘人才数据参数计算获得对应所述拟聘人才筛选倾向度系数，将所述各拟聘人才筛选倾向度系数进行排名，选择排名位于首位的拟聘人才作为目标受聘人才。

第二方面，本申请实施例提供了一种基于大数据的人才筛选推荐系统，该系统包括：存储器及处理器，所述存储器中包括基于大数据的人才筛选推荐方法的程序，所述基于大数据的人才筛选推荐方法的程序被所述处理器执行时实现以下步骤：

可选地，在本申请实施例所述的基于大数据的人才筛选推荐系统中，所述根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比，获取参考样本数据集，包括：

获取人才数据库；

根据获得的所述多个参考样本数据获得参考样本数据集。

可选地，在本申请实施例所述的基于大数据的人才筛选推荐系统中，所述根据参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据，包括：

第三方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中包括基于大数据的人才筛选推荐方法程序，所述基于大数据的人才筛选推荐方法程序被处理器执行时，实现如上述任一项所述的一种基于大数据的人才筛选推荐方法的步骤。

由上可知，本申请实施例提供的基于大数据的人才筛选推荐方法及系统通过获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据；获取所述目标人群数据的人才特征信息生成目标人群特征画像，所述人才特征信息包括性别信息、学历信息、从业经验、业界成绩以及薪酬期望值；根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比，获取参考样本数据集；根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据；根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才；从而基于目标人群特征画像以及决策树模型实现目标受聘人才的精确推荐，可以提高推荐的准确率。

本申请的其他特征和优点将在随后的说明书阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的基于大数据的人才筛选推荐方法的一种流程图。

图2为本申请实施例提供的基于大数据的人才筛选推荐系统的一种结构示意图。

具体实施方式

下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

请参照图1，图1是本申请一些实施例中的一种基于大数据的人才筛选推荐的流程图。该基于大数据的人才筛选推荐方法用于终端设备中，例如手机、电脑等。该基于大数据的人才筛选推荐方法，包括以下步骤：

S101、获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据；

S102、获取所述目标人群数据的人才特征信息生成目标人群特征画像，所述人才特征信息包括性别信息、学历信息、从业经验、业界成绩以及薪酬期望值；

S103、根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比，获取参考样本数据集；

S104、根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据；

S105、根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才。

需要说明的是，首先根据求职平台或求职信息库链获取求职者信息，再根据招聘要求确定目标人群生成目标人群数据，根据目标人群数据的性别信息、学历信息、从业经验、业界成绩以及薪酬期望值的人才特征信息生成目标人群特征画像，根据目标人群特征画像在人才数据库中进行相似度匹配获得数据库中的多个匹配的样本数据集成为参考样本数据集，该相似度为余弦相似度或者基于欧式距离的相似度，再通过参考样本数据集的人才特征信息输入到训练好的决策树模型中获得标记的不规则数据进行数据剪枝和分类得到目标人才数据，再通过人才筛选平台对目标人才数据的拟聘人才筛选倾向度系数计算和排名确定最终目标受聘人才。

根据本发明实施例，所述根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比，获取参考样本数据集，具体为：

获取人才数据库；

根据获得的所述多个参考样本数据获得参考样本数据集。

需要说明的是，人才数据库中包含多种类型人才数据，还包括各类人才数据的特征参数如年龄数据、性别信息、学历信息、从业信息以及薪酬情况等，根据目标人群特征画像中的人才特征信息与人才数据库的多种类样本数据进行相似度对比筛选获得多个参考样本数据合成参考样本数据集，其中，相似度对比可以是欧式相似度对比或余弦相似度对比，相似度预设阈值设定为70%。

根据本发明实施例，所述根据参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据，具体为：

需要说明的是，为筛选参考样本数据集中的数据信息获得目标人才数据，通过训练好的决策树模型进行数据筛选，决策树模型是一种分类模型，通过大量数据的训练使训练好的决策树模型可对未知数据中影响预测准确率的不规则数据进行剪枝，其中决策树模型是根据预设数据筛选规则对被检验数据元组进行准确率检验，若某些被检验数据导致预测准确率降低则进行剪枝，对于本案来说，决策树模型通过大量训练按照用人单位拟聘人才需求制定相应用人筛选规则对参考样本数据集中的各样本数据进行数据偏差率预测确定不规则数据阈值，再将各参考样本数据集中的各节点数据与不规则数据阈值进行阈值对比，将不符合阈值对比要求的样本数据标记为不规则数据进行剪枝并分类标记，剪枝处理后的数据即为筛选后的目标人才数据。

根据本发明实施例，还包括：

获取参考样本数据集各样本数据的不规则数据；

需要说明的是，由于输入决策树模型的参考样本数据的准确性会影响模型对数据筛选获得目标人才数据的准确性，因此为检验参考样本数据的准确性，根据用人筛选规则设定偏差率预设值，再根据参考样本数据集中不规则数据占比的不规则数据率与预测的数据偏差率的比值与偏差率预设值进行数值对比，若比值大于偏差率预设值则参考样本数据集存在偏差，需对参考样本数据集进行修正，再将修正后的参考样本数据集输入到训练好的决策树模型中重新进行样本数据处理，提高参考样本数据集的准确性。

根据本发明实施例，所述根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才，具体为：

需要说明的是，通过人才筛选平台对目标人才数据的拟聘人才筛选倾向度系数计算和排名确定最终目标受聘人才，具体为，人才筛选平台根据各用人单位的拟聘人才数据建立拟聘人才数据库，数据库包括目标人才数据中各拟聘人才对应的拟聘人才筛选倾向度系数，再根据获得的各拟聘人才的拟聘人才筛选倾向度系数进行排名获得目标受聘人才。

根据本发明实施例，还包括：

根据公式计算所述各拟聘人才的拟聘人才筛选倾向度系数：

Q_x=U_x+V_xB_x+W/AR_x；

需要说明的是，根据目标人才数据的各拟聘人才数据参数根据计算公式获得对应拟聘人才筛选倾向度系数，该拟聘人才筛选倾向度系数反映出各拟聘人才的匹配度高低，系数Q_x越大表明该拟聘人才匹配度越高，U_x、B_x、R_x以及V_x均为经过平台大数据获得。

根据本发明实施例，所述决策树模型的训练方法具体为：

获取历史样本数据的留存数据与不规则数据；

将所述历史样数据的留存数据与不规则数据进行预处理，得到训练样本集；

将所述训练样本集输入至初始化的所述决策树模型中进行数据准确性检验；

获取检验结果的准确率；

若所述检验数据的准确率大于预设的准确率阈值，则保留所述数据；

若所述检验数据的准确率小于预设的准确率阈值，则对所述数据进行剪枝；

将所述训练样本集中的数据完成数据准确性检验得到所述决策树模型。

需要说明的是，决策树模型需要大量的历史数据进行训练，

数据量越大，则结果越准确，本申请中的决策树模型可以通过历史样本数据的留存数据与不规则数据作为设定参数输入进行训练，在进行决策树模型训练时，不仅要通过历史留存数据与不规则数据设定参数进行训练，还需要结合历史数据的不规则数据的预测准确率进行训练，使得决策树模型的输出结果更加准确，优选地，本方案中准确率阈值设置为80-85%。

如图2所示，本发明还公开了一种基于大数据的人才筛选推荐系统，包括存储器201和处理器202，所述存储器中包括基于大数据的人才筛选推荐方法程序，所述基于大数据的人才筛选推荐方法程序被所述处理器执行时实现如下步骤：

获取人才数据库；

根据获得的所述多个参考样本数据获得参考样本数据集。

根据本发明实施例，还包括：

获取参考样本数据集各样本数据的不规则数据；

根据本发明实施例，还包括：

根据公式计算所述各拟聘人才的拟聘人才筛选倾向度系数：

Q_x=U_x+V_xB_x+W/AR_x；

根据本发明实施例，所述决策树模型的训练方法具体为：

获取历史样本数据的留存数据与不规则数据；

获取检验结果的准确率；

需要说明的是，决策树模型需要大量的历史数据进行训练，

本发明第三方面提供了一种可读存储介质，所述可读存储介质中包括一种基于大数据的人才筛选推荐方法程序，所述基于大数据的人才筛选推荐方法程序被处理器执行时，实现如上述任一项所述的一种基于大数据的人才筛选推荐方法的步骤。

本发明公开的一种基于大数据的人才筛选推荐方法、系统和可读存储介质，通过获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据；获取所述目标人群数据的人才特征信息生成目标人群特征画像，所述人才特征信息包括性别信息、学历信息、从业经验、业界成绩以及薪酬期望值；根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比，获取参考样本数据集；根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据；根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才；从而基于目标人群特征画像以及决策树模型实现目标受聘人才的精确推荐，可以提高推荐的准确率。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机、服务器、或者网络设备等）执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种基于大数据的人才筛选推荐方法，其特征在于，包括以下步骤：

根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才；

所述根据参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据，包括：

对所述参考样本数据集中标记的所述不规则数据进行剪枝和分类得到目标人才数据；

所述方法还包括：

获取参考样本数据集各样本数据的不规则数据；

2.根据权利要求1所述的基于大数据的人才筛选推荐方法，其特征在于，根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比，获取参考样本数据集，包括：

获取人才数据库；

根据获得的所述多个参考样本数据获得参考样本数据集。

3.根据权利要求1所述的基于大数据的人才筛选推荐方法，其特征在于，所述根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才，包括：

4.根据权利要求3所述的基于大数据的人才筛选推荐方法，其特征在于，还包括：

根据公式计算所述各拟聘人才的拟聘人才筛选倾向度系数：

Qx=Ux+VxBx+W/ARx；

其中，Qx为第x个拟聘人才的拟聘人才筛选倾向度系数，Ux为第x个拟聘人才的业界影响力系数，Vx为第x个拟聘人才的从业经验值，Bx为第x个拟聘人才的聘前薪酬指数，W为拟聘人才岗位团队比重系数，A为拟聘人才岗位风险指数，Rx为第x个拟聘人才的薪酬期望值，x为第x个拟聘人才；

5.一种基于大数据的人才筛选推荐系统，其特征在于，该系统包括：存储器及处理器，所述存储器中包括基于大数据的人才筛选推荐方法的程序，所述基于大数据的人才筛选推荐方法的程序被所述处理器执行时实现以下步骤：

所述方法还包括：

获取参考样本数据集各样本数据的不规则数据；

6.根据权利要求5所述的基于大数据的人才筛选推荐系统，其特征在于，根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比，获取参考样本数据集，包括：

获取人才数据库；

根据获得的所述多个参考样本数据获得参考样本数据集。

7.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中包括基于大数据的人才筛选推荐方法程序，所述基于大数据的人才筛选推荐方法程序被处理器执行时，实现如权利要求1至4中任一项所述的一种基于大数据的人才筛选推荐方法的步骤。