CN114139065B - 基于大数据的人才筛选推荐方法、系统及可读存储介质 - Google Patents

基于大数据的人才筛选推荐方法、系统及可读存储介质 Download PDF

Info

Publication number
CN114139065B
CN114139065B CN202210115851.5A CN202210115851A CN114139065B CN 114139065 B CN114139065 B CN 114139065B CN 202210115851 A CN202210115851 A CN 202210115851A CN 114139065 B CN114139065 B CN 114139065B
Authority
CN
China
Prior art keywords
talent
data
sample data
target
reference sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210115851.5A
Other languages
English (en)
Other versions
CN114139065A (zh
Inventor
张广志
于笑博
成立立
李奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beiling Rongxin Datalnfo Science and Technology Ltd
Original Assignee
Beiling Rongxin Datalnfo Science and Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beiling Rongxin Datalnfo Science and Technology Ltd filed Critical Beiling Rongxin Datalnfo Science and Technology Ltd
Priority to CN202210115851.5A priority Critical patent/CN114139065B/zh
Publication of CN114139065A publication Critical patent/CN114139065A/zh
Application granted granted Critical
Publication of CN114139065B publication Critical patent/CN114139065B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了基于大数据的人才筛选推荐方法、系统及可读存储介质。该方法,包括:获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据;获取所述目标人群数据的人才特征信息生成目标人群特征画像;根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集;根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据;根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才;从而基于目标人群特征画像以及决策树模型实现目标受聘人才的精确推荐,可以提高推荐的准确率。

Description

基于大数据的人才筛选推荐方法、系统及可读存储介质
技术领域
本申请涉及大数据技术领域,具体而言,涉及一种基于大数据的人才筛选推荐方法、系统及可读存储介质。
背景技术
目前随着社会的发展,全社会全行业对各类人才的需求日益剧增,人才是区域/行业在自然资源、环境条件相对固定的前提下,实现经济增长的动力和源泉,当一个区域/行业人才表现为人才状况好,高素质、高技能、高学历的人才多,人才流动快,人才年轻化程度高、创新能力强的时候,高新技术产业、技术密集型产业就多,当地的经济实力就强,发展后劲就足,区域/行业经济活力自然就增强,因此人才活力是促进区域经济活力的重要因素。
而目前现有人才招聘获得方式主要是通过各招聘平台或招聘信息网以及各类招聘引擎等传统互联网方法获取人才,但对人才的选择缺乏全面的数据信息,缺少更精准细致的筛查方法,导致传统互联网招聘方式对人才的筛选和推荐的准确度不高,无法准确满足人才和用人单位的双向需求,难以实现双赢。
针对上述问题,目前尚未有有效的技术解决方案。
发明内容
本申请实施例的目的在于提供一种基于大数据的人才筛选推荐方法、系统及可读存储介质,可以提高目标受聘人才筛选的准确度。
本申请实施例还提供了一种基于大数据的人才筛选推荐方法,包括以下步骤:
获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据;
获取所述目标人群数据的人才特征信息生成目标人群特征画像,所述人才特征信息包括性别信息、学历信息、从业经验、业界成绩以及薪酬期望值;
根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集;
根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据;
根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才。
可选地,在本申请实施例所述的基于大数据的人才筛选推荐方法中,所述根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集,包括:
获取人才数据库;
根据所述目标人群的性别信息、学历信息、从业经验、业界成绩以及薪酬期望值生成目标人群数据集;
根据所述目标人群数据集与所述人才数据库的样本数据进行数据筛选获得多个参考样本数据;
根据获得的所述多个参考样本数据获得参考样本数据集。
可选地,在本申请实施例所述的基于大数据的人才筛选推荐方法中,所述根据参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据,包括:
将参考样本数据集中的各样本数据输入到训练好的决策树模型中;
所述样本数据包括所述参考样本数据集中各样本的人才特征信息;
所述决策树模型对所述各样本数据进行数据偏差率预测,获取不规则数据阈值;
所述决策树模型根据获取的所述不规则数据阈值对所述参考样本数据集进行节点数据阈值对比;
将所述节点数据阈值对比结果中小于所述不规则数据阈值的样本数据标记为不规则数据;
对所述参考样本数据集中标记的所述不规则数据进行剪枝和分类得到目标人才数据。
可选地,在本申请实施例所述的基于大数据的人才筛选推荐方法中,所述方法还包括:
获取参考样本数据集各样本数据的不规则数据;
根据所述不规则数据获得所述参考样本数据集的不规则数据率;
根据所述不规则数据率与所述预测的数据偏差率的比值与偏差率预设值进行对比;
若所述比值大于所述偏差率预设值,则所述参考样本数据集存在偏差,对所述参考样本数据集进行修正;
根据修正后的所述参考样本数据集输入到训练好的决策树模型中进行样本数据处理。
可选地,在本申请实施例所述的基于大数据的人才筛选推荐方法中,所述根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才,包括:
所述人才筛选平台根据各用人单位的拟聘人才数据建立拟聘人才数据库;
所述拟聘人才数据库包括所述目标人才数据中各拟聘人才对应的拟聘人才筛选倾向度系数;
所述拟聘人才筛选倾向度系数根据所述各拟聘人才的对应目标人才数据参数计算获得;
根据获得的所述各拟聘人才的拟聘人才筛选倾向度系数进行排名获得目标受聘人才。
可选地,在本申请实施例所述的基于大数据的人才筛选推荐方法中,所述方法还包括:
根据公式计算所述各拟聘人才的拟聘人才筛选倾向度系数:
Qx=Ux+VxBx+W/ARx
其中,Qx为第x个拟聘人才的拟聘人才筛选倾向度系数,Ux为第x个拟聘人才的业界影响力系数,Vx为第x个拟聘人才的从业经验值,Bx为第x个拟聘人才的聘前薪酬指数,W为拟聘人才岗位团队比重系数,A为拟聘人才岗位风险指数,Rx为第x个拟聘人才的薪酬期望值,x为第x个拟聘人才;
根据所述目标人才数据的各拟聘人才数据参数计算获得对应所述拟聘人才筛选倾向度系数,将所述各拟聘人才筛选倾向度系数进行排名,选择排名位于首位的拟聘人才作为目标受聘人才。
第二方面,本申请实施例提供了一种基于大数据的人才筛选推荐系统,该系统包括:存储器及处理器,所述存储器中包括基于大数据的人才筛选推荐方法的程序,所述基于大数据的人才筛选推荐方法的程序被所述处理器执行时实现以下步骤:
获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据;
获取所述目标人群数据的人才特征信息生成目标人群特征画像,所述人才特征信息包括性别信息、学历信息、从业经验、业界成绩以及薪酬期望值;
根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集;
根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据;
根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才。
可选地,在本申请实施例所述的基于大数据的人才筛选推荐系统中,所述根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集,包括:
获取人才数据库;
根据所述目标人群的性别信息、学历信息、从业经验、业界成绩以及薪酬期望值生成目标人群数据集;
根据所述目标人群数据集与所述人才数据库的样本数据进行数据筛选获得多个参考样本数据;
根据获得的所述多个参考样本数据获得参考样本数据集。
可选地,在本申请实施例所述的基于大数据的人才筛选推荐系统中,所述根据参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据,包括:
将参考样本数据集中的各样本数据输入到训练好的决策树模型中;
所述样本数据包括所述参考样本数据集中各样本的人才特征信息;
所述决策树模型对所述各样本数据进行数据偏差率预测,获取不规则数据阈值;
所述决策树模型根据获取的所述不规则数据阈值对所述参考样本数据集进行节点数据阈值对比;
将所述节点数据阈值对比结果中小于所述不规则数据阈值的样本数据标记为不规则数据;
对所述参考样本数据集中标记的所述不规则数据进行剪枝和分类得到目标人才数据。
第三方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中包括基于大数据的人才筛选推荐方法程序,所述基于大数据的人才筛选推荐方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的人才筛选推荐方法的步骤。
由上可知,本申请实施例提供的基于大数据的人才筛选推荐方法及系统通过获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据;获取所述目标人群数据的人才特征信息生成目标人群特征画像,所述人才特征信息包括性别信息、学历信息、从业经验、业界成绩以及薪酬期望值;根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集;根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据;根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才;从而基于目标人群特征画像以及决策树模型实现目标受聘人才的精确推荐,可以提高推荐的准确率。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的基于大数据的人才筛选推荐方法的一种流程图。
图2为本申请实施例提供的基于大数据的人才筛选推荐系统的一种结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1是本申请一些实施例中的一种基于大数据的人才筛选推荐的流程图。该基于大数据的人才筛选推荐方法用于终端设备中,例如手机、电脑等。该基于大数据的人才筛选推荐方法,包括以下步骤:
S101、获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据;
S102、获取所述目标人群数据的人才特征信息生成目标人群特征画像,所述人才特征信息包括性别信息、学历信息、从业经验、业界成绩以及薪酬期望值;
S103、根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集;
S104、根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据;
S105、根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才。
需要说明的是,首先根据求职平台或求职信息库链获取求职者信息,再根据招聘要求确定目标人群生成目标人群数据,根据目标人群数据的性别信息、学历信息、从业经验、业界成绩以及薪酬期望值的人才特征信息生成目标人群特征画像,根据目标人群特征画像在人才数据库中进行相似度匹配获得数据库中的多个匹配的样本数据集成为参考样本数据集,该相似度为余弦相似度或者基于欧式距离的相似度,再通过参考样本数据集的人才特征信息输入到训练好的决策树模型中获得标记的不规则数据进行数据剪枝和分类得到目标人才数据,再通过人才筛选平台对目标人才数据的拟聘人才筛选倾向度系数计算和排名确定最终目标受聘人才。
根据本发明实施例,所述根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集,具体为:
获取人才数据库;
根据所述目标人群的性别信息、学历信息、从业经验、业界成绩以及薪酬期望值生成目标人群数据集;
根据所述目标人群数据集与所述人才数据库的样本数据进行数据筛选获得多个参考样本数据;
根据获得的所述多个参考样本数据获得参考样本数据集。
需要说明的是,人才数据库中包含多种类型人才数据,还包括各类人才数据的特征参数如年龄数据、性别信息、学历信息、从业信息以及薪酬情况等,根据目标人群特征画像中的人才特征信息与人才数据库的多种类样本数据进行相似度对比筛选获得多个参考样本数据合成参考样本数据集,其中,相似度对比可以是欧式相似度对比或余弦相似度对比,相似度预设阈值设定为70%。
根据本发明实施例,所述根据参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据,具体为:
将参考样本数据集中的各样本数据输入到训练好的决策树模型中;
所述样本数据包括所述参考样本数据集中各样本的人才特征信息;
所述决策树模型对所述各样本数据进行数据偏差率预测,获取不规则数据阈值;
所述决策树模型根据获取的所述不规则数据阈值对所述参考样本数据集进行节点数据阈值对比;
将所述节点数据阈值对比结果中小于所述不规则数据阈值的样本数据标记为不规则数据;
对所述参考样本数据集中标记的所述不规则数据进行剪枝和分类得到目标人才数据。
需要说明的是,为筛选参考样本数据集中的数据信息获得目标人才数据,通过训练好的决策树模型进行数据筛选,决策树模型是一种分类模型,通过大量数据的训练使训练好的决策树模型可对未知数据中影响预测准确率的不规则数据进行剪枝,其中决策树模型是根据预设数据筛选规则对被检验数据元组进行准确率检验,若某些被检验数据导致预测准确率降低则进行剪枝,对于本案来说,决策树模型通过大量训练按照用人单位拟聘人才需求制定相应用人筛选规则对参考样本数据集中的各样本数据进行数据偏差率预测确定不规则数据阈值,再将各参考样本数据集中的各节点数据与不规则数据阈值进行阈值对比,将不符合阈值对比要求的样本数据标记为不规则数据进行剪枝并分类标记,剪枝处理后的数据即为筛选后的目标人才数据。
根据本发明实施例,还包括:
获取参考样本数据集各样本数据的不规则数据;
根据所述不规则数据获得所述参考样本数据集的不规则数据率;
根据所述不规则数据率与所述预测的数据偏差率的比值与偏差率预设值进行对比;
若所述比值大于所述偏差率预设值,则所述参考样本数据集存在偏差,对所述参考样本数据集进行修正;
根据修正后的所述参考样本数据集输入到训练好的决策树模型中进行样本数据处理。
需要说明的是,由于输入决策树模型的参考样本数据的准确性会影响模型对数据筛选获得目标人才数据的准确性,因此为检验参考样本数据的准确性,根据用人筛选规则设定偏差率预设值,再根据参考样本数据集中不规则数据占比的不规则数据率与预测的数据偏差率的比值与偏差率预设值进行数值对比,若比值大于偏差率预设值则参考样本数据集存在偏差,需对参考样本数据集进行修正,再将修正后的参考样本数据集输入到训练好的决策树模型中重新进行样本数据处理,提高参考样本数据集的准确性。
根据本发明实施例,所述根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才,具体为:
所述人才筛选平台根据各用人单位的拟聘人才数据建立拟聘人才数据库;
所述拟聘人才数据库包括所述目标人才数据中各拟聘人才对应的拟聘人才筛选倾向度系数;
所述拟聘人才筛选倾向度系数根据所述各拟聘人才的对应目标人才数据参数计算获得;
根据获得的所述各拟聘人才的拟聘人才筛选倾向度系数进行排名获得目标受聘人才。
需要说明的是,通过人才筛选平台对目标人才数据的拟聘人才筛选倾向度系数计算和排名确定最终目标受聘人才,具体为,人才筛选平台根据各用人单位的拟聘人才数据建立拟聘人才数据库,数据库包括目标人才数据中各拟聘人才对应的拟聘人才筛选倾向度系数,再根据获得的各拟聘人才的拟聘人才筛选倾向度系数进行排名获得目标受聘人才。
根据本发明实施例,还包括:
根据公式计算所述各拟聘人才的拟聘人才筛选倾向度系数:
Qx=Ux+VxBx+W/ARx
其中,Qx为第x个拟聘人才的拟聘人才筛选倾向度系数,Ux为第x个拟聘人才的业界影响力系数,Vx为第x个拟聘人才的从业经验值,Bx为第x个拟聘人才的聘前薪酬指数,W为拟聘人才岗位团队比重系数,A为拟聘人才岗位风险指数,Rx为第x个拟聘人才的薪酬期望值,x为第x个拟聘人才;
根据所述目标人才数据的各拟聘人才数据参数计算获得对应所述拟聘人才筛选倾向度系数,将所述各拟聘人才筛选倾向度系数进行排名,选择排名位于首位的拟聘人才作为目标受聘人才。
需要说明的是,根据目标人才数据的各拟聘人才数据参数根据计算公式获得对应拟聘人才筛选倾向度系数,该拟聘人才筛选倾向度系数反映出各拟聘人才的匹配度高低,系数Qx越大表明该拟聘人才匹配度越高,Ux、Bx、Rx以及Vx均为经过平台大数据获得。
根据本发明实施例,所述决策树模型的训练方法具体为:
获取历史样本数据的留存数据与不规则数据;
将所述历史样数据的留存数据与不规则数据进行预处理,得到训练样本集;
将所述训练样本集输入至初始化的所述决策树模型中进行数据准确性检验;
获取检验结果的准确率;
若所述检验数据的准确率大于预设的准确率阈值,则保留所述数据;
若所述检验数据的准确率小于预设的准确率阈值,则对所述数据进行剪枝;
将所述训练样本集中的数据完成数据准确性检验得到所述决策树模型。
需要说明的是,决策树模型需要大量的历史数据进行训练,
数据量越大,则结果越准确,本申请中的决策树模型可以通过历史样本数据的留存数据与不规则数据作为设定参数输入进行训练,在进行决策树模型训练时,不仅要通过历史留存数据与不规则数据设定参数进行训练,还需要结合历史数据的不规则数据的预测准确率进行训练,使得决策树模型的输出结果更加准确,优选地,本方案中准确率阈值设置为80-85%。
如图2所示,本发明还公开了一种基于大数据的人才筛选推荐系统,包括存储器201和处理器202,所述存储器中包括基于大数据的人才筛选推荐方法程序,所述基于大数据的人才筛选推荐方法程序被所述处理器执行时实现如下步骤:
获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据;
获取所述目标人群数据的人才特征信息生成目标人群特征画像,所述人才特征信息包括性别信息、学历信息、从业经验、业界成绩以及薪酬期望值;
根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集;
根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据;
根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才。
需要说明的是,首先根据求职平台或求职信息库链获取求职者信息,再根据招聘要求确定目标人群生成目标人群数据,根据目标人群数据的性别信息、学历信息、从业经验、业界成绩以及薪酬期望值的人才特征信息生成目标人群特征画像,根据目标人群特征画像在人才数据库中进行相似度匹配获得数据库中的多个匹配的样本数据集成为参考样本数据集,该相似度为余弦相似度或者基于欧式距离的相似度,再通过参考样本数据集的人才特征信息输入到训练好的决策树模型中获得标记的不规则数据进行数据剪枝和分类得到目标人才数据,再通过人才筛选平台对目标人才数据的拟聘人才筛选倾向度系数计算和排名确定最终目标受聘人才。
根据本发明实施例,所述根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集,具体为:
获取人才数据库;
根据所述目标人群的性别信息、学历信息、从业经验、业界成绩以及薪酬期望值生成目标人群数据集;
根据所述目标人群数据集与所述人才数据库的样本数据进行数据筛选获得多个参考样本数据;
根据获得的所述多个参考样本数据获得参考样本数据集。
需要说明的是,人才数据库中包含多种类型人才数据,还包括各类人才数据的特征参数如年龄数据、性别信息、学历信息、从业信息以及薪酬情况等,根据目标人群特征画像中的人才特征信息与人才数据库的多种类样本数据进行相似度对比筛选获得多个参考样本数据合成参考样本数据集,其中,相似度对比可以是欧式相似度对比或余弦相似度对比,相似度预设阈值设定为70%。
根据本发明实施例,所述根据参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据,具体为:
将参考样本数据集中的各样本数据输入到训练好的决策树模型中;
所述样本数据包括所述参考样本数据集中各样本的人才特征信息;
所述决策树模型对所述各样本数据进行数据偏差率预测,获取不规则数据阈值;
所述决策树模型根据获取的所述不规则数据阈值对所述参考样本数据集进行节点数据阈值对比;
将所述节点数据阈值对比结果中小于所述不规则数据阈值的样本数据标记为不规则数据;
对所述参考样本数据集中标记的所述不规则数据进行剪枝和分类得到目标人才数据。
需要说明的是,为筛选参考样本数据集中的数据信息获得目标人才数据,通过训练好的决策树模型进行数据筛选,决策树模型是一种分类模型,通过大量数据的训练使训练好的决策树模型可对未知数据中影响预测准确率的不规则数据进行剪枝,其中决策树模型是根据预设数据筛选规则对被检验数据元组进行准确率检验,若某些被检验数据导致预测准确率降低则进行剪枝,对于本案来说,决策树模型通过大量训练按照用人单位拟聘人才需求制定相应用人筛选规则对参考样本数据集中的各样本数据进行数据偏差率预测确定不规则数据阈值,再将各参考样本数据集中的各节点数据与不规则数据阈值进行阈值对比,将不符合阈值对比要求的样本数据标记为不规则数据进行剪枝并分类标记,剪枝处理后的数据即为筛选后的目标人才数据。
根据本发明实施例,还包括:
获取参考样本数据集各样本数据的不规则数据;
根据所述不规则数据获得所述参考样本数据集的不规则数据率;
根据所述不规则数据率与所述预测的数据偏差率的比值与偏差率预设值进行对比;
若所述比值大于所述偏差率预设值,则所述参考样本数据集存在偏差,对所述参考样本数据集进行修正;
根据修正后的所述参考样本数据集输入到训练好的决策树模型中进行样本数据处理。
需要说明的是,由于输入决策树模型的参考样本数据的准确性会影响模型对数据筛选获得目标人才数据的准确性,因此为检验参考样本数据的准确性,根据用人筛选规则设定偏差率预设值,再根据参考样本数据集中不规则数据占比的不规则数据率与预测的数据偏差率的比值与偏差率预设值进行数值对比,若比值大于偏差率预设值则参考样本数据集存在偏差,需对参考样本数据集进行修正,再将修正后的参考样本数据集输入到训练好的决策树模型中重新进行样本数据处理,提高参考样本数据集的准确性。
根据本发明实施例,所述根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才,具体为:
所述人才筛选平台根据各用人单位的拟聘人才数据建立拟聘人才数据库;
所述拟聘人才数据库包括所述目标人才数据中各拟聘人才对应的拟聘人才筛选倾向度系数;
所述拟聘人才筛选倾向度系数根据所述各拟聘人才的对应目标人才数据参数计算获得;
根据获得的所述各拟聘人才的拟聘人才筛选倾向度系数进行排名获得目标受聘人才。
需要说明的是,通过人才筛选平台对目标人才数据的拟聘人才筛选倾向度系数计算和排名确定最终目标受聘人才,具体为,人才筛选平台根据各用人单位的拟聘人才数据建立拟聘人才数据库,数据库包括目标人才数据中各拟聘人才对应的拟聘人才筛选倾向度系数,再根据获得的各拟聘人才的拟聘人才筛选倾向度系数进行排名获得目标受聘人才。
根据本发明实施例,还包括:
根据公式计算所述各拟聘人才的拟聘人才筛选倾向度系数:
Qx=Ux+VxBx+W/ARx
其中,Qx为第x个拟聘人才的拟聘人才筛选倾向度系数,Ux为第x个拟聘人才的业界影响力系数,Vx为第x个拟聘人才的从业经验值,Bx为第x个拟聘人才的聘前薪酬指数,W为拟聘人才岗位团队比重系数,A为拟聘人才岗位风险指数,Rx为第x个拟聘人才的薪酬期望值,x为第x个拟聘人才;
根据所述目标人才数据的各拟聘人才数据参数计算获得对应所述拟聘人才筛选倾向度系数,将所述各拟聘人才筛选倾向度系数进行排名,选择排名位于首位的拟聘人才作为目标受聘人才。
需要说明的是,根据目标人才数据的各拟聘人才数据参数根据计算公式获得对应拟聘人才筛选倾向度系数,该拟聘人才筛选倾向度系数反映出各拟聘人才的匹配度高低,系数Qx越大表明该拟聘人才匹配度越高,Ux、Bx、Rx以及Vx均为经过平台大数据获得。
根据本发明实施例,所述决策树模型的训练方法具体为:
获取历史样本数据的留存数据与不规则数据;
将所述历史样数据的留存数据与不规则数据进行预处理,得到训练样本集;
将所述训练样本集输入至初始化的所述决策树模型中进行数据准确性检验;
获取检验结果的准确率;
若所述检验数据的准确率大于预设的准确率阈值,则保留所述数据;
若所述检验数据的准确率小于预设的准确率阈值,则对所述数据进行剪枝;
将所述训练样本集中的数据完成数据准确性检验得到所述决策树模型。
需要说明的是,决策树模型需要大量的历史数据进行训练,
数据量越大,则结果越准确,本申请中的决策树模型可以通过历史样本数据的留存数据与不规则数据作为设定参数输入进行训练,在进行决策树模型训练时,不仅要通过历史留存数据与不规则数据设定参数进行训练,还需要结合历史数据的不规则数据的预测准确率进行训练,使得决策树模型的输出结果更加准确,优选地,本方案中准确率阈值设置为80-85%。
本发明第三方面提供了一种可读存储介质,所述可读存储介质中包括一种基于大数据的人才筛选推荐方法程序,所述基于大数据的人才筛选推荐方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的人才筛选推荐方法的步骤。
本发明公开的一种基于大数据的人才筛选推荐方法、系统和可读存储介质,通过获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据;获取所述目标人群数据的人才特征信息生成目标人群特征画像,所述人才特征信息包括性别信息、学历信息、从业经验、业界成绩以及薪酬期望值;根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集;根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据;根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才;从而基于目标人群特征画像以及决策树模型实现目标受聘人才的精确推荐,可以提高推荐的准确率。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (7)

1.一种基于大数据的人才筛选推荐方法,其特征在于,包括以下步骤:
获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据;
获取所述目标人群数据的人才特征信息生成目标人群特征画像,所述人才特征信息包括性别信息、学历信息、从业经验、业界成绩以及薪酬期望值;
根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集;
根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据;
根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才;
所述根据参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据,包括:
将参考样本数据集中的各样本数据输入到训练好的决策树模型中;
所述样本数据包括所述参考样本数据集中各样本的人才特征信息;
所述决策树模型对所述各样本数据进行数据偏差率预测,获取不规则数据阈值;
所述决策树模型根据获取的所述不规则数据阈值对所述参考样本数据集进行节点数据阈值对比;
将所述节点数据阈值对比结果中小于所述不规则数据阈值的样本数据标记为不规则数据;
对所述参考样本数据集中标记的所述不规则数据进行剪枝和分类得到目标人才数据;
所述方法还包括:
获取参考样本数据集各样本数据的不规则数据;
根据所述不规则数据获得所述参考样本数据集的不规则数据率;
根据所述不规则数据率与所述预测的数据偏差率的比值与偏差率预设值进行对比;
若所述比值大于所述偏差率预设值,则所述参考样本数据集存在偏差,对所述参考样本数据集进行修正;
根据修正后的所述参考样本数据集输入到训练好的决策树模型中进行样本数据处理。
2.根据权利要求1所述的基于大数据的人才筛选推荐方法,其特征在于,根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集,包括:
获取人才数据库;
根据所述目标人群的性别信息、学历信息、从业经验、业界成绩以及薪酬期望值生成目标人群数据集;
根据所述目标人群数据集与所述人才数据库的样本数据进行数据筛选获得多个参考样本数据;
根据获得的所述多个参考样本数据获得参考样本数据集。
3.根据权利要求1所述的基于大数据的人才筛选推荐方法,其特征在于,所述根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才,包括:
所述人才筛选平台根据各用人单位的拟聘人才数据建立拟聘人才数据库;
所述拟聘人才数据库包括所述目标人才数据中各拟聘人才对应的拟聘人才筛选倾向度系数;
所述拟聘人才筛选倾向度系数根据所述各拟聘人才的对应目标人才数据参数计算获得;
根据获得的所述各拟聘人才的拟聘人才筛选倾向度系数进行排名获得目标受聘人才。
4.根据权利要求3所述的基于大数据的人才筛选推荐方法,其特征在于,还包括:
根据公式计算所述各拟聘人才的拟聘人才筛选倾向度系数:
Qx=Ux+VxBx+W/ARx;
其中,Qx为第x个拟聘人才的拟聘人才筛选倾向度系数,Ux为第x个拟聘人才的业界影响力系数,Vx为第x个拟聘人才的从业经验值,Bx为第x个拟聘人才的聘前薪酬指数,W为拟聘人才岗位团队比重系数,A为拟聘人才岗位风险指数,Rx为第x个拟聘人才的薪酬期望值,x为第x个拟聘人才;
根据所述目标人才数据的各拟聘人才数据参数计算获得对应所述拟聘人才筛选倾向度系数,将所述各拟聘人才筛选倾向度系数进行排名,选择排名位于首位的拟聘人才作为目标受聘人才。
5.一种基于大数据的人才筛选推荐系统,其特征在于,该系统包括:存储器及处理器,所述存储器中包括基于大数据的人才筛选推荐方法的程序,所述基于大数据的人才筛选推荐方法的程序被所述处理器执行时实现以下步骤:
获取招聘平台信息和人才求职库中的求职信息数据生成拟招聘人才的目标人群数据;
获取所述目标人群数据的人才特征信息生成目标人群特征画像,所述人才特征信息包括性别信息、学历信息、从业经验、业界成绩以及薪酬期望值;
根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集;
根据所述参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据;
根据所述目标人才数据输入人才筛选平台进行筛选得到目标受聘人才;
所述根据参考样本数据集中人才特征信息输入到训练好的决策树模型中进行样本数据剪枝和分类得到目标人才数据,包括:
将参考样本数据集中的各样本数据输入到训练好的决策树模型中;
所述样本数据包括所述参考样本数据集中各样本的人才特征信息;
所述决策树模型对所述各样本数据进行数据偏差率预测,获取不规则数据阈值;
所述决策树模型根据获取的所述不规则数据阈值对所述参考样本数据集进行节点数据阈值对比;
将所述节点数据阈值对比结果中小于所述不规则数据阈值的样本数据标记为不规则数据;
对所述参考样本数据集中标记的所述不规则数据进行剪枝和分类得到目标人才数据;
所述方法还包括:
获取参考样本数据集各样本数据的不规则数据;
根据所述不规则数据获得所述参考样本数据集的不规则数据率;
根据所述不规则数据率与所述预测的数据偏差率的比值与偏差率预设值进行对比;
若所述比值大于所述偏差率预设值,则所述参考样本数据集存在偏差,对所述参考样本数据集进行修正;
根据修正后的所述参考样本数据集输入到训练好的决策树模型中进行样本数据处理。
6.根据权利要求5所述的基于大数据的人才筛选推荐系统,其特征在于,根据所述目标人群特征画像与人才数据库进行人才特征信息的相似度对比,获取参考样本数据集,包括:
获取人才数据库;
根据所述目标人群的性别信息、学历信息、从业经验、业界成绩以及薪酬期望值生成目标人群数据集;
根据所述目标人群数据集与所述人才数据库的样本数据进行数据筛选获得多个参考样本数据;
根据获得的所述多个参考样本数据获得参考样本数据集。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括基于大数据的人才筛选推荐方法程序,所述基于大数据的人才筛选推荐方法程序被处理器执行时,实现如权利要求1至4中任一项所述的一种基于大数据的人才筛选推荐方法的步骤。
CN202210115851.5A 2022-02-07 2022-02-07 基于大数据的人才筛选推荐方法、系统及可读存储介质 Active CN114139065B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210115851.5A CN114139065B (zh) 2022-02-07 2022-02-07 基于大数据的人才筛选推荐方法、系统及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210115851.5A CN114139065B (zh) 2022-02-07 2022-02-07 基于大数据的人才筛选推荐方法、系统及可读存储介质

Publications (2)

Publication Number Publication Date
CN114139065A CN114139065A (zh) 2022-03-04
CN114139065B true CN114139065B (zh) 2022-05-24

Family

ID=80381904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210115851.5A Active CN114139065B (zh) 2022-02-07 2022-02-07 基于大数据的人才筛选推荐方法、系统及可读存储介质

Country Status (1)

Country Link
CN (1) CN114139065B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115345078B (zh) * 2022-10-18 2023-04-14 国网浙江省电力有限公司宁波供电公司 一种基于电缆迭代模型的电缆管理方法及装置
CN117932040B (zh) * 2024-03-21 2024-05-28 成都鱼泡科技有限公司 应用于招聘信息化系统的信息推荐方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894270A (zh) * 2010-07-26 2010-11-24 中国科学院遥感应用研究所 面向遥感影像分类的样本自动选取方法
CN112819286A (zh) * 2021-01-07 2021-05-18 连云港中教常青科技发展有限公司 一种精英人才和岗位高嵌合度分类匹配系统和方法
CN113256397A (zh) * 2021-07-02 2021-08-13 佛山市墨纳森智能科技有限公司 基于大数据的商品推荐方法、系统及计算机可读存储介质
CN113435857A (zh) * 2021-07-09 2021-09-24 中国银行股份有限公司 应聘者数据分析方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679994A (zh) * 2017-07-26 2018-02-09 平安科技(深圳)有限公司 核保决策树的创建方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894270A (zh) * 2010-07-26 2010-11-24 中国科学院遥感应用研究所 面向遥感影像分类的样本自动选取方法
CN112819286A (zh) * 2021-01-07 2021-05-18 连云港中教常青科技发展有限公司 一种精英人才和岗位高嵌合度分类匹配系统和方法
CN113256397A (zh) * 2021-07-02 2021-08-13 佛山市墨纳森智能科技有限公司 基于大数据的商品推荐方法、系统及计算机可读存储介质
CN113435857A (zh) * 2021-07-09 2021-09-24 中国银行股份有限公司 应聘者数据分析方法及装置

Also Published As

Publication number Publication date
CN114139065A (zh) 2022-03-04

Similar Documents

Publication Publication Date Title
US11663545B2 (en) Architecture, engineering and construction (AEC) risk analysis system and method
Cheng et al. Contractor selection using the analytic network process
CN114139065B (zh) 基于大数据的人才筛选推荐方法、系统及可读存储介质
US20180053092A1 (en) Method and System for Innovation Management and Optimization Under Uncertainty
JP2019519021A (ja) パフォーマンスモデル悪影響補正
WO2021042006A1 (en) Data driven systems and methods for optimization of a target business
US20130173353A1 (en) Assessing maturity of business processes
CN110727852A (zh) 一种推送招聘推荐服务的方法、装置及终端
CN116523268B (zh) 一种基于大数据画像的人岗匹配分析方法及装置
CN112150094A (zh) 模型训练方法、基于模型的评估方法及装置
CN115115257A (zh) 一种基于关系图谱的企业风险预警方法及系统
CN113947322A (zh) 一种基于FP-Growth算法的画像匹配方法及系统
CN110310012B (zh) 数据分析方法、装置、设备及计算机可读存储介质
Burke et al. Using and abusing QFD scores
Appadoo et al. Job recommendation system, machine learning, regression, classification, natural language processing
El Yamami et al. Multi-objective IT project selection model for improving SME strategy deployment
Tan et al. Impact of manufacturing flexibility on business performance: Malaysian's perspective
CN117495298A (zh) 一种招投标评审监管方法及系统
US8645194B1 (en) Process impact matrix development and utilization
CN116681410A (zh) 基于云计算的人力资源数据管理系统及管理方法
CN115660695A (zh) 客服人员标签画像构建方法、装置、电子设备及存储介质
CN114299350A (zh) 一种基于机器学习的人工信贷审核信息推荐方法及系统
CN110262906B (zh) 接口标签推荐方法、装置、存储介质和电子设备
Chen et al. Strategic Decision-making Processes of NPD by Hybrid Classification Model Techniques
CN115292598A (zh) 专家推荐方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant