CN110688429A - 目标员工筛选方法、装置、计算机设备及存储介质 - Google Patents

目标员工筛选方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110688429A
CN110688429A CN201910748016.3A CN201910748016A CN110688429A CN 110688429 A CN110688429 A CN 110688429A CN 201910748016 A CN201910748016 A CN 201910748016A CN 110688429 A CN110688429 A CN 110688429A
Authority
CN
China
Prior art keywords
target
training
screening
employee
employees
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910748016.3A
Other languages
English (en)
Inventor
陈伟清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN201910748016.3A priority Critical patent/CN110688429A/zh
Publication of CN110688429A publication Critical patent/CN110688429A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06398Performance of employee with respect to a job function
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种目标员工筛选方法、装置、计算机设备及存储介质。本发明应用于智能决策中的预测模型领域。所述方法包括:从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据;通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征;通过逻辑回归模型对所述组合特征进行迭代计算以得到目标员工的概率;对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合。通过实施本发明实施例的方法可实现挖掘优质员工,缩短企业培养周期,降低培养成本。

Description

目标员工筛选方法、装置、计算机设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种目标员工筛选方法、装置、计算机设备及存储介质。
背景技术
目前,在企业管理体系中,员工管理占据非常重要的地位,员工管理关系着企业发展的命脉。尤其是销售型企业,对于销售型的企业来说,具有人员流动性大,一线销售人员数量多的特点,因此对于该部分员工难以建立有效的管理机制。随着科技与技术的发展,通过人工智能解决企业的销售人员管理的问题已逐渐成为主流。然而,现有的人工智能的模型需要人工寻找大量的有效特征来对模型进行训练,模型效果差,耗费人力物力。
发明内容
本发明实施例提供了一种目标员工筛选方法、装置、计算机设备及存储介质,旨在解决现有的模型需要人工寻找大量的有效特征来对模型进行训练,模型效果差,耗费人力物力的问题。
第一方面,本发明实施例提供了一种目标员工筛选方法,其包括:从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据;通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征;通过逻辑回归模型对所述组合特征进行迭代计算以得到目标员工的概率;对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合。
第二方面,本发明实施例还提供了一种目标员工筛选装置,其包括:从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据;通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征;通过逻辑回归模型对所述组合特征进行迭代计算以得到目标员工的概率;对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合。
第三方面,本发明实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现上述方法。
本发明实施例提供了一种目标员工筛选方法、装置、计算机设备及存储介质。其中,所述方法包括:从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据;通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征;通过逻辑回归模型对所述组合特征进行迭代计算以得到目标员工的概率;对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合。本发明实施例由于通过训练梯度提升决策树模型生成组合特征,根据组合特征通过逻辑回归模型预测目标员工概率,根据预测的目标员工的概率对候选员工集合进行筛选得到目标员工集合,可实现发掘大量有效特征,提高模型效果,减少人力成本。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的目标员工筛选方法的流程示意图;
图2为本发明实施例提供的目标员工筛选方法的子流程示意图;
图3为本发明实施例提供的目标员工筛选方法的子流程示意图;
图4为本发明实施例提供的目标员工筛选方法的子流程示意图;
图5为本发明实施例提供的目标员工筛选方法的子流程示意图;
图6为本发明实施例提供的目标员工筛选装置的示意性框图;
图7为本发明实施例提供的目标员工筛选装置的具体单元的示意性框图;
图8为本发明实施例提供的筛选子单元的示意性框图;以及
图9为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1为本发明实施例提供的目标员工筛选方法的示意性流程图。该目标员工筛选方法应用于终端中,本发明提出的一种目标员工筛选方法,该方法可用于帮助企业预测出优质员工,例如应用于保险行业中以挖掘具有潜力的保险代理人。通过本发明提出的目标员工筛选方法对员工潜力进行预测,以准确地筛选出符合要求的优质员工,可实现对企业员工的精细化、科学、高效的管理,降低企业经营成本。
图1是本发明实施例提供的目标员工筛选方法的流程示意图。如图所示,该方法包括以下步骤S110-S130。
S110、从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据。
具体地,候选员工集合指的是由多个员工组成的集合,例如,针对某保险企业,可包括该企业所有已转正的保险代理人。训练样本指的是员工的相关数据,例如,针对保险代理人,该相关数据包括入职简历、工作报告、考勤报告、业绩报告以及用户反馈报告等。预处理指的是将训练样本进行一系列的处理以将训练样本转化为可供模型输入的训练数据,具体地,首先通过预设关键字从训练样本中提取有效的特征数据,由于并非所有的特征数据均为数字化数据,因此对于数字化的特征数据可直接作为训练数据,而非数字化的特征数据还需进行进一步的编码转化,从而得到数字化形式的训练数据。企业对于已转正的代理人进行统一的培训和管理,通过在培训期间代理人的行为表现对已转正的代理人能否成为优质代理人进行预测,因此,首先需要收集代理人的相关数据作为训练样本,然后再将训练样本进行预处理得到可供模型输入的训练数据。
在一实施例中,如图2所示,所述步骤S110可包括步骤:S111-S113。
S111、从预设数据库中获取候选员工集合的训练样本。
S112、根据预设关键字对所述训练样本进行特征提取得到特征数据,其中,所述特征数据包括数字化的特征数据以及非数字化的特征数据。
S113、将数字化的所述特征数据直接作为训练数据以及将非数字化的所述特征数据通过编码转化为训练数据。
在一实施例中,每个代理人在入职后均会分配一个代理人账号,在企业的代理人管理系统中通过代理人账号记录每个代理人的工作情况,例如,代理人的日报、周报以及月报均要上传至代理人管理系统,且代理人管理系统每日记录代理人的考勤情况、业绩情况以及用户反馈情况等。预设数据库用于存储代理人管理系统的所有数据,因此根据候选员工集合中每个代理人的代理人账号从预设数据库中获取训练样本,其中,训练样本包括代理人的入职简历、工作报告、考勤报告、业绩报告以及用户反馈报告。由于训练样本中包括有用的数据以及没用的数据,因此需要对训练样本进行特征提取,提取有用的特征数据作为训练数据,具体地,通过预设关键字进行特征提取,预设关键字是根据与潜力相关的指标预先设定的,如年龄以及学历等,根据预设关键字在训练样本中遍历,找到预设关键字对应的值并获取,所获取到的值即为训练数据,例如,在入职简历中,提取年龄、学历以及相关工作年限;在工作报告中提取参展次数、拜访次数以及路演次数;在考勤报告中提取迟到、早退以及缺勤;在业绩报告中提取开单量、客户量以及销售额。具体如表1所示。
Figure BDA0002166242350000041
Figure BDA0002166242350000051
表1
对于训练样本中非数字化的特征数据,采用独热编码即one-hot编码的方式进行编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。例如,当特征数据为性别时,其特征值的取值范围包括男和女两个取值,那么性别为男对应的数字化编码为[1,0],性别为女对应的数字化编码为[0,1];当特征数据为学历时,其特征范围包括初中、高中、中专、大专以及本科五个值,那么其对应的数字化编码分别为[1,0,0,0,0]、[0,1,0,0,0]、[0,0,1,0,0]、[0,0,0,1,0]以及[0,0,0,0,1]。
在一实施例中,采用梯度提升决策树模型以及逻辑回归模型相结合的方式构建目标员工筛选模型,通过目标员工筛选模型预测目标员工的概率。企业则可以根据目标员工的概率筛选出优质的代理人进行精细化的培养和管理,充分挖掘优质代理人,缩短代理人的培养周期,降低培养成本。目标员工筛选模型采用梯度提升决策树模型以及逻辑回归模型进行构建。梯度提升决策树(Gradient Boosting Decision Tree)是一种组合决策树算法,其主要是通过多棵决策树串行在一起,下一棵决策树学习使用上一课决策树的残差,残差由梯度求得,所有的决策树组合在一起即为梯度提升决策树。逻辑回归模型是一种广义上的线性回归,是一个被逻辑回归方程归一化后的线性回归。由于逻辑回归模型是广义线性模型,与传统线性模型相比,逻辑回归模型使用了Logit变换将函数值映射到0至1区间,最后输出是一个概率值,逻辑回归模型这种线性模型很容易并行化,可轻松处理上亿条训练数据,但线性模型学习能力有限,需要大量特征工程预先分析出有效的特征、特征组合,从而去间接增强逻辑回归模型的非线性学习能力,而梯度提升决策树模型的思想使其天然可以发现多种有区分性的特征以及特征组合,决策树的路径可以直接作为逻辑回归模型输入特征使用,省去了人工寻找特征、特征组合的步骤。因此目标员工筛选模型采用将梯度提升决策树模型与逻辑回归模型相结合的方式,通过梯度提升决策树发掘特征之间的潜在关系自动对特征进行交叉组合,利用决策树的路径生成的组合特征可直接作为逻辑回归模型的输入,解决了逻辑回归模型学习能力有限,需要大量有效的特征组合问题,提高了模型的效果,减少了人力成本。因此目标员工筛选模型的预测机制是首先通过梯度提升决策树模型对训练数据进行分箱得到有效的组合特征,然后在将组合特征直接输入至逻辑回归模型中进行逻辑回归预测,预测该组合特征有潜力成为优质代理人的概率。
S120、通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征。
具体地,梯度提升决策树模型的训练通过多轮的迭代,每轮迭代得到一棵决策树,每轮的决策树在上一轮决策树的损失函数基础上拟合得到,最后将所有决策树的结论累加起来得到预测值。但是所需要的不是梯度提升决策树模型的预测值,而是需要利用梯度提升决策树模型的决策树生成组合特征作为逻辑回归模型的输入,因此在梯度提升决策树训练完成后对得到的多棵决策树进行进一步处理生成组合特征。
在一实施例中,如图3所示,所述步骤S120可包括步骤:S121-S122。
S121、根据所述训练数据对所述梯度提升决策树模型进行训练得到训练完成的多棵决策树。
具体地,梯度提升决策树模型的公式如下:
Fm(x)=Fm-1(x)+T(x;θm)
Figure BDA0002166242350000062
L[y,F(x)]=[y-F(x)]2
其中,FM(x)表示模型,T(x;θm)表示决策树,θm为决策树参数,m为决策树个数,L为损失函数,x为样本特征,y为样本标签,样本特征和样本标签组成训练数据,标签是预先设定,例如,高中为0,本科为1,i为样本数量,T采用CART决策树,CART决策树是一种典型的二叉决策树,可以进行分类或者回归。具体地,首先初始化决策树即令F0(x)=0,然后根据训练样本计算损失函数,接着根据损失函数更新模型,继续迭代模型直到迭代结束从而得到最终模型。
S122、根据多棵所述决策树的路径进行编码生成组合特征。
具体地,在得到梯度提升决策树模型后,根据模型中决策树的路径进行编码,具体地,采用独热编码即one-hot编码对决策树的叶子节点进行编码,根据样本落在决策树叶子节点的位置进行编码,例如,通过梯度提升决策模型得到了两棵树,两棵树共有五个叶子节点,第一棵树有三个叶子节点,第二棵有两个叶子节点,样本落在第一棵树的第二个叶子节点,编码为[0,1,0],落在第二课树的第一个叶子节点,编码为[1,0],然后将各编码进行特征组合得到组合特征[0,1,0,1,0]。
S130、通过逻辑回归模型对所述组合特征进行迭代计算以得到目标员工的概率。
具体地,在得到组合特征后,组合特征可直接输入至逻辑回归模型中进行训练,逻辑回归模型的公式如下:
Figure BDA0002166242350000071
Figure BDA0002166242350000072
Figure BDA0002166242350000074
其中,hθ(x)为模型的输出,x为组合特征,θ为模型参数,L为对数似然函数,y为0或1,i为组合特征的个数,J为损失函数,其中,h采用Sigmoid函数。具体地,首先将组合特征输入至h函数进行预测得到参数θ,然后根据θ求解其损失函数,损失函数由最大对数似然函数推导得到,运用梯度下方法对θ进行更新迭代直到使得损失函数最小,从而完成模型的训练输出概率值。
S140、对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合。
具体地,在得到目标员工的概率后,利用目标员工的概率对候选员工集合进行筛选,在候选员工集合中挑选出具有成为优质代理人的代理人组成目标员工集合。企业则可以根据目标员工集合为目标员工制定更适合的培训计划以提高培养效率,提高代理人的能力水平。
在一实施例中,如图4所示,所述步骤S140可包括步骤:S141-S142。
S141、采用德尔菲法对所述候选员工集合进行排序;
S142、根据所述目标员工的概率对所述排序进行筛选得到目标员工集合。
在一实施例中,采用德尔菲法对候选员工集合进行排序,德尔菲法又称为专家调查法,该方法是由企业组成一个专门的预测机构,其中包括若干专家和企业预测组织者,按照规定的程序,背靠背地征询专家对未来市场的意见或者判断,然后进行预测的方法。具体地,第一步首先确定决策目标,即预测代理人的潜力;第二步选择合适的预测专家,例如为培训导师,代理人的直属领导;第三步是专家提出预测和决策,即每位专家提出自己的决策意见;第四步是对数据进行汇总、整理以及归纳;第五步由专家们综合分析后最终确定一致的决策结果。由德尔菲法得到的代理人的潜力,按照潜力的大小由高到低进行排序,当然可以理解的是,还可以是其他的排序规则。在得到排序后,根据目标员工的概率在该排序中筛选目标员工组成目标员工集,例如,参与排序的候选员工为100人,目标员工概率为60%,为了确保企业能够尽可能地得到更有潜力的员工,可选择在该排序中的前50名组成目标员工集。
在一实施例中,如图5所示,所述步骤S142可包括步骤:S1421-S1422。
S1421、根据所述目标员工的概率与所述候选员工集合中候选员工的数量计算目标员工的数量。
S1422、根据所述目标员工的数量在所述排序中选取对应数量的目标员工组成目标员工集合。
在一实施例中,根据目标员工的概率乘以候选员工集合的人数得到目标员工的人数,例如,目标员工的概率为0.8,候选员工集合的人数为100人,得到的目标员工的人数为80人;最后根据目标员工的人数在排序中挑选出80名组成目标员工集合,即在100个按照潜力大小排序的员工中,挑选出前80个员工组成目标员工集合。
在另一实施例中,在得到目标员工集合后,将目标员工集合作为初级目标员工集合,在初级目标员工集合的基础上构建中级目标员工筛选模型以得到中级目标员工集合,同理,在得到中级目标员工集合后,在中级目标员工集合的基础上,构建高级目标员工筛选模型以得到高级目标员工集合。具体如下所述。
构建中级目标员工筛选模型,获取初级目标员工集合的训练数据并将所述初级目标员工集合的训练数据输入至所述中级目标员工筛选模型中进行预测输出中级目标员工的概率;
根据所述中级目标员工的概率对所述初级目标员工集合进行筛选得到中级目标员工集合;
构建高级目标员工筛选模型,获取所述中级目标员工集合的训练数据并将所述中级目标员工集合的训练数据输入至所述高级目标员工筛选模型中进行预测输出高级目标员工的概率;
根据所述高级目标员工的概率对所述中级目标员工集合进行筛选得到高级目标员工集合。
其步骤与得到目标员工集合的步骤相同,在此不再赘述。通过构建多层级的目标员工筛选模型,预测代理人成为优质代理人的潜力,将代理人划分为初级、中级以及高级三个级别,根据不同级别代理人的潜力实现精细化的管理和培养,提升培养效果,提高培养效率,缩短培养周期,降低培养成本。
本发明展示了一种目标员工筛选方法,通过从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据;通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征;通过逻辑回归模型对所述组合特征进行迭代计算以得到目标员工的概率;对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合,可以挖掘优质保险代理人、缩短培养周期,降低培养成本。
图6是本发明实施例提供的一种目标员工筛选装置200的示意性框图。如图6所示,对应于以上目标员工筛选方法,本发明还提供一种目标员工筛选装置200。该目标员工筛选装置200包括用于执行上述目标员工筛选方法的单元,该装置可以被配置于台式电脑、平板电脑、手提电脑、等终端中。具体地,请参阅图6,该目标员工筛选装置200包括:预处理单元210、生成单元220、计算单元230以及筛选单元240。
预处理单元210,用于从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据。
在一实施例中,如图7所示,所述预处理单元210包括:获取单元211、提取单元212以及转化单元213。
获取单元211,用于从预设数据库中获取候选员工集合的训练样本。
提取单元212,用于根据预设关键字对所述训练样本进行特征提取得到特征数据,其中,所述特征数据包括数字化的特征数据以及非数字化的特征数据。
转化单元213,用于将数字化的所述特征数据直接作为训练数据以及将非数字化的所述特征数据通过编码转化为训练数据。
生成单元220,用于通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征。
在一实施例中,如图7所示,所述生成单元220包括:训练单元221以及编码单元222。
训练单元221,用于根据所述训练数据对所述梯度提升决策树模型进行训练,得到训练完成的多棵决策树。
编码单元222,用于根据多棵所述决策树的路径进行编码以生成组合特征。
计算单元230,用于通过逻辑回归模型对所述组合特征进行迭代计算以得到目标员工的概率。
筛选单元240,用于对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合。
在一实施例中,如图7所示,所述筛选单元240包括:排序单元241和筛选子单元242。
排序单元241,用于采用德尔菲法对所述候选员工集合进行排序。
筛选子单元242,用于根据所述目标员工的概率对所述排序进行筛选得到目标员工集合。
在一实施例中,如图8所示,所述筛选子单元242还包括:计算子单元2421以及组成单元2422。
计算子单元2421,用于根据所述目标员工的概率与所述候选员工集合中候选员工的数量计算目标员工的数量。
组成单元2422,用于根据所述目标员工的数量在所述排序中选取对应数量的目标员工组成目标员工集合。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述目标员工筛选装置200和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述目标员工筛选装置可以实现为一种计算机程序的形式,该计算机程序可以在如图9所示的计算机设备上运行。
请参阅图9,图9是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是终端,其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。
参阅图9,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种目标员工筛选方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种目标员工筛选方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据;通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征;通过逻辑回归模型对所述组合特征进行迭代计算以得到目标员工的概率;对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合。
在一实施例中,处理器502在实现所述从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据步骤时,具体实现如下步骤:从预设数据库中获取候选员工集合的训练样本;根据预设关键字对所述训练样本进行特征提取得到特征数据,其中,所述特征数据包括数字化的特征数据以及非数字化的特征数据;将数字化的所述特征数据直接作为训练数据以及将非数字化的所述特征数据通过编码转化为训练数据。
在一实施例中,处理器502在实现所述通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征步骤时,具体实现如下步骤:根据所述训练数据对所述梯度提升决策树模型进行训练,得到训练完成的多棵决策树;根据多棵所述决策树的路径进行编码以生成组合特征。
在一实施例中,处理器502在实现所述对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合步骤时,具体实现如下步骤:采用德尔菲法对所述候选员工集合进行排序;根据所述目标员工的概率对所述排序进行筛选得到目标员工集合。
在一实施例中,处理器502在实现所述根据所述目标员工的概率对所述排序进行筛选得到目标员工集合步骤时,具体实现如下步骤:根据所述目标员工的概率与所述候选员工集合中候选员工的数量计算目标员工的数量;根据所述目标员工的数量在所述排序中选取对应数量的目标员工组成目标员工集合。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中计算机程序包括程序指令。该程序指令被处理器执行时使处理器执行如下步骤:从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据;通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征;通过逻辑回归模型对所述组合特征进行迭代计算以得到目标员工的概率;对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合。
在一实施例中,所述处理器在执行所述程序指令而实现所述从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据步骤时,具体实现如下步骤:从预设数据库中获取候选员工集合的训练样本;根据预设关键字对所述训练样本进行特征提取得到特征数据,其中,所述特征数据包括数字化的特征数据以及非数字化的特征数据;将数字化的所述特征数据直接作为训练数据以及将非数字化的所述特征数据通过编码转化为训练数据。
在一实施例中,所述处理器在执行所述程序指令而实现所述通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征步骤时,具体实现如下步骤:根据所述训练数据对所述梯度提升决策树模型进行训练,得到训练完成的多棵决策树;根据多棵所述决策树的路径进行编码以生成组合特征。
在一实施例中,所述处理器在执行所述程序指令而实现所述对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合步骤时,具体实现如下步骤:采用德尔菲法对所述候选员工集合进行排序;根据所述目标员工的概率对所述排序进行筛选得到目标员工集合。
在一实施例中,所述处理器在执行所述程序指令而实现所述根据所述目标员工的概率对所述排序进行筛选得到目标员工集合步骤时,具体实现如下步骤:根据所述目标员工的概率与所述候选员工集合中候选员工的数量计算目标员工的数量;根据所述目标员工的数量在所述排序中选取对应数量的目标员工组成目标员工集合。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种目标员工筛选方法,其特征在于,包括:
从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据;
通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征;
通过逻辑回归模型对所述组合特征进行迭代计算以得到目标员工的概率;
对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合。
2.根据权利要求1所述的目标员工筛选方法,其特征在于,所述从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据,包括:
从预设数据库中获取候选员工集合的训练样本;
根据预设关键字对所述训练样本进行特征提取得到特征数据,其中,所述特征数据包括数字化的特征数据以及非数字化的特征数据;
将数字化的所述特征数据直接作为训练数据以及将非数字化的所述特征数据通过编码转化为训练数据。
3.根据权利要求1所述的目标员工筛选方法,其特征在于,所述通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征,包括:
根据所述训练数据对所述梯度提升决策树模型进行训练,得到训练完成的多棵决策树;
根据多棵所述决策树的路径进行编码以生成组合特征。
4.根据权利要求1所述的目标员工筛选方法,其特征在于,所述对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合,包括:
采用德尔菲法对所述候选员工集合进行排序;
根据所述目标员工的概率对所述排序进行筛选得到目标员工集合。
5.根据权利要求4所述的目标员工筛选方法,其特征在于,所述根据所述目标员工的概率对所述排序进行筛选得到目标员工集合,包括:
根据所述目标员工的概率与所述候选员工集合中候选员工的数量计算目标员工的数量;
根据所述目标员工的数量在所述排序中选取对应数量的目标员工组成目标员工集合。
6.一种目标员工筛选装置,其特征在于,包括:
预处理单元,用于从预设数据库中收集候选员工集合的训练样本并对所述训练样本进行预处理得到训练数据;
生成单元,用于通过梯度提升决策树模型对所述训练数据进行迭代计算以生成组合特征;
计算单元,用于通过逻辑回归模型对所述组合特征进行迭代计算以得到目标员工的概率;
筛选单元,用于对所述候选员工集合进行排序并根据所述目标员工概率从所述排序中筛选得到目标员工集合。
7.根据权利要求6所述的目标员工筛选装置,其特征在于,所述预处理单元包括:
获取单元,用于从预设数据库中获取候选员工集合的训练样本;
提取单元,用于根据预设关键字对所述训练样本进行特征提取得到特征数据,其中,所述特征数据包括数字化的特征数据以及非数字化的特征数据;
转化单元,用于将数字化的所述特征数据直接作为训练数据以及将非数字化的所述特征数据通过编码转化为训练数据。
8.根据权利要求6所述的目标员工筛选装置,其特征在于,所述生成单元包括:
训练单元,用于根据所述训练数据对所述梯度提升决策树模型进行训练,得到训练完成的多棵决策树;
编码单元,用于根据多棵所述决策树的路径进行编码以生成组合特征。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-5中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现如权利要求1-5中任一项所述的方法。
CN201910748016.3A 2019-08-14 2019-08-14 目标员工筛选方法、装置、计算机设备及存储介质 Pending CN110688429A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910748016.3A CN110688429A (zh) 2019-08-14 2019-08-14 目标员工筛选方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910748016.3A CN110688429A (zh) 2019-08-14 2019-08-14 目标员工筛选方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN110688429A true CN110688429A (zh) 2020-01-14

Family

ID=69108236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910748016.3A Pending CN110688429A (zh) 2019-08-14 2019-08-14 目标员工筛选方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110688429A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368901A (zh) * 2020-02-28 2020-07-03 深圳前海微众银行股份有限公司 基于联邦学习的多方联合建模方法、设备和介质
CN112182069A (zh) * 2020-09-30 2021-01-05 中国平安人寿保险股份有限公司 代理人留存预测方法、装置、计算机设备及存储介质
CN112380215A (zh) * 2020-11-17 2021-02-19 北京融七牛信息技术有限公司 一种基于交叉聚合的自动特征生成方法
CN113222632A (zh) * 2020-02-04 2021-08-06 北京京东振世信息技术有限公司 对象挖掘的方法和装置
CN113240213A (zh) * 2021-07-09 2021-08-10 平安科技(深圳)有限公司 基于神经网络和树模型的人员甄选方法、装置及设备
CN113342983A (zh) * 2021-06-30 2021-09-03 中国平安人寿保险股份有限公司 基于机器学习的简历分配方法、装置、设备及存储介质
CN113516513A (zh) * 2021-07-20 2021-10-19 重庆度小满优扬科技有限公司 数据分析方法、装置、计算机设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733631A (zh) * 2018-04-09 2018-11-02 中国平安人寿保险股份有限公司 一种数据评估方法、装置、终端设备及存储介质
CN108764273A (zh) * 2018-04-09 2018-11-06 中国平安人寿保险股份有限公司 一种数据处理的方法、装置、终端设备及存储介质
CN110009022A (zh) * 2019-03-26 2019-07-12 第四范式(北京)技术有限公司 吸毒人员信息的预测方法、装置与计算设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733631A (zh) * 2018-04-09 2018-11-02 中国平安人寿保险股份有限公司 一种数据评估方法、装置、终端设备及存储介质
CN108764273A (zh) * 2018-04-09 2018-11-06 中国平安人寿保险股份有限公司 一种数据处理的方法、装置、终端设备及存储介质
CN110009022A (zh) * 2019-03-26 2019-07-12 第四范式(北京)技术有限公司 吸毒人员信息的预测方法、装置与计算设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113222632A (zh) * 2020-02-04 2021-08-06 北京京东振世信息技术有限公司 对象挖掘的方法和装置
CN111368901A (zh) * 2020-02-28 2020-07-03 深圳前海微众银行股份有限公司 基于联邦学习的多方联合建模方法、设备和介质
CN112182069A (zh) * 2020-09-30 2021-01-05 中国平安人寿保险股份有限公司 代理人留存预测方法、装置、计算机设备及存储介质
CN112182069B (zh) * 2020-09-30 2023-11-24 中国平安人寿保险股份有限公司 代理人留存预测方法、装置、计算机设备及存储介质
CN112380215A (zh) * 2020-11-17 2021-02-19 北京融七牛信息技术有限公司 一种基于交叉聚合的自动特征生成方法
CN113342983A (zh) * 2021-06-30 2021-09-03 中国平安人寿保险股份有限公司 基于机器学习的简历分配方法、装置、设备及存储介质
CN113342983B (zh) * 2021-06-30 2023-02-07 中国平安人寿保险股份有限公司 基于机器学习的简历分配方法、装置、设备及存储介质
CN113240213A (zh) * 2021-07-09 2021-08-10 平安科技(深圳)有限公司 基于神经网络和树模型的人员甄选方法、装置及设备
CN113516513A (zh) * 2021-07-20 2021-10-19 重庆度小满优扬科技有限公司 数据分析方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN110688429A (zh) 目标员工筛选方法、装置、计算机设备及存储介质
Alsharef et al. Review of ML and AutoML solutions to forecast time-series data
Amindoust et al. Textile supplier selection in sustainable supply chain using a modular fuzzy inference system model
Azadeh et al. An adaptive network based fuzzy inference system–genetic algorithm clustering ensemble algorithm for performance assessment and improvement of conventional power plants
Sadiq A fuzzy set-based approach for the prioritization of stakeholders on the basis of the importance of software requirements
CN109034861A (zh) 基于移动端日志行为数据的用户流失预测方法及装置
CN115795131B (zh) 基于人工智能的电子档案分类方法、装置及电子设备
Gharehchopogh et al. A new approach by using Tabu search and genetic algorithms in Software Cost estimation
CN115034430A (zh) 碳排放量预测方法、装置、终端及存储介质
Gabryelczyk et al. Motivations to adopt BPM in view of digital transformation
Jie RETRACTED ARTICLE: Precision and intelligent agricultural decision support system based on big data analysis
Chao Estimating project overheads rate in bidding: DSS approach using neural networks
Wang et al. Prediction based on integration of decisional DNA and a feature selection algorithm RELIEF-F
Huang et al. Rough set theory: a novel approach for extraction of robust decision rules based on incremental attributes
Chai et al. Correlation Analysis-Based Neural Network Self-Organizing Genetic Evolutionary Algorithm
Feng Data analysis and prediction modeling based on deep learning in E-commerce
CN116188115A (zh) 基于供应链网络需求与偏好挖掘的供应商推荐系统及方法
Shankar et al. Analyzing attrition and performance of an employee using machine learning techniques
Rao 1* Statistics: Reflections on the Past and Visions for the Future
Wang et al. Clustered Coefficient Regression Models for Poisson Process with an Application to Seasonal Warranty Claim Data
Langan et al. Benchmarking factor selection and sensitivity: a case study with nursing courses
Bee Hua The state of applications of quantitative analysis techniques to construction economics and management (1983 to 2006)
CN112381653A (zh) 潜在投资企业的挖掘与推荐方法、装置、设备及存储介质
Hsu et al. Similarity search over personal process description graph
CN113065911A (zh) 推荐信息生成方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination