CN109214671B

CN109214671B - 人员分组方法、装置、电子装置及计算机可读存储介质

Info

Publication number: CN109214671B
Application number: CN201810982127.6A
Authority: CN
Inventors: 邓悦; 金戈; 徐亮; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-08-27
Filing date: 2018-08-27
Publication date: 2022-03-01
Anticipated expiration: 2038-08-27
Also published as: WO2020042580A1; CN109214671A

Abstract

一种人员分组方法，包括：获取多组样本数据；训练决策树模型，其中，所述决策树模型包括多个叶子节点；以每一叶子节点作为当前节点，计算所有当前节点的绩优率以及绩优覆盖率，确定每一所述当前节点是否符合预设条件；当属于同一父节点的所有所述当前节点均不符合所述预设条件时，判断所述父节点是否为根节点；当所述父节点为根节点时，计算所述根节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定所述根节点是否符合预设条件，当所述根节点符合预设条件时将所述根节点划分至绩优分组，当所述根节点不符合预设条件时忽略所述根节点。本发明可通过绩优分组的条件属性识别绩优人员的显著特征，从而构建用户画像。

Description

人员分组方法、装置、电子装置及计算机可读存储介质

技术领域

本发明涉及分组方法，具体涉及一种人员分组方法、人员分组装置、电子装置以及计算机可读存储介质。

背景技术

企业通常拥有海量的人员基础数据和行为数据。企业通常期望搭建用户画像，对绩优人员的显著特征进行识别。现有技术中，通常采用无监督学习的聚类算法对无序的对象进行分群、归类，已达到更好地理解研究对象的目的。然而，利用该类方法建立用户画像存在缺陷，如，分群目标不明确，分群效果不可控，分群结果不可解释，且各分群的重要特征无法识别等。

发明内容

鉴于以上内容，有必要提出一种人员分组方法、人员分组装置、电子装置以及计算机可读存储介质，能够解决以上问题。

本发明一较佳实施方式提供一种人员分组方法，包括：获取多组样本数据，每一组样本数据包括多个条件属性以及对应的决策属性，所述决策属性为所述样本数据的绩效；根据所述样本数据训练一决策树模型，其中，所述决策树模型包括多个叶子节点，每一叶子节点代表一个分组；以所述决策树模型中的每一叶子节点作为当前节点，计算所有当前节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定每一个所述当前节点是否符合预设条件；当属于同一父节点的所有所述当前节点均不符合所述预设条件时，判断所述父节点是否为根节点；当所述父节点不是根节点时，以每一个所述父节点作为新的当前节点，触发所述计算所有当前节点的绩优率以及绩优覆盖率的步骤；当所述父节点为根节点时，计算所述根节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定所述根节点是否符合预设条件，当所述根节点符合预设条件时将所述根节点划分至绩优分组，当所述根节点不符合预设条件时忽略所述根节点；针对每一个所述当前节点，执行以下步骤：将所述当前节点作为目标节点，当所述目标节点符合所述预设条件时，将所述目标节点划分至所述绩优分组；当所述目标节点不符合所述预设条件时，判断与所述目标节点属于同一父节点的其它同层节点是否符合所述预设条件；当属于同一父节点的至少一其它同层节点符合所述预设条件时，将所述目标节点划分至绩差分组；当属于同一父节点的所有其它同层节点均不符合所述预设条件时，忽略所述目标节点。

在一种可能的实现方式中，所述根据所述样本数据训练一决策树模型包括：以所述样本数据作为训练集计算每一条件属性的信息增益；选择信息增益最大的条件属性作为所述决策树模型的根节点以分割所述样本数据以得到下一层节点；以每一节点包含的样本数据作为训练集重新计算每一条件属性的信息增益；选择信息增益最大的条件属性分割所述节点以得到下一层节点；以及递归执行重新计算每一条件属性的信息增益的步骤以及选择信息增益最大的条件属性分割所述节点的步骤，直至分割停止。

在一种可能的实现方式中，在所述决策树的层数达到一预设层数时停止下一次分割。

在一种可能的实现方式中，在所述决策树的当前层的每一节点包含的样本数量小于一预设数量时停止下一次分割。

在一种可能的实现方式中，每一节点的绩优率为所述节点的绩优人员数量与所述节点的待分组人员的总数量之间的比值，每一节点的绩优覆盖率为所述节点的绩优人员数量与整个决策树模型的绩优人员的总数量之间的比值。

在一种可能的实现方式中，所述根据所述绩优率以及所述绩优覆盖率确定每一个所述当前节点是否符合预设条件包括：当所述当前节点的绩优率以及绩优覆盖率分别达到一绩优率阈值与一绩优覆盖率阈值时，确定所述当前节点符合所述预设条件；以及当所述当前节点不符合所述预设条件为所述节点的绩优率未达到所述绩优率阈值，或所述当前节点的绩优覆盖率未达到所述绩优覆盖率阈值，或所述当前节点的绩优率以及绩优覆盖率均未达到所述绩优率阈值与所述绩优覆盖率阈值时，确定所述当前节点不符合所述预设条件。

在一种可能的实现方式中，所述样本数据同时包括绩优人员和绩差人员的数据。

本发明一较佳实施方式还提供一种人员分组装置，包括：获取模块，用于获取多组样本数据，每一组样本数据包括多个条件属性以及对应的决策属性，所述决策属性为所述样本数据的绩效；训练模块，用于根据所述样本数据训练一决策树模型，其中，所述决策树模型包括多个叶子节点，每一叶子节点代表一个分组；执行模块，用于计算所有当前节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定每一个所述当前节点是否符合预设条件；当属于同一父节点的所有所述当前节点均不符合所述预设条件时，所述执行模块判断所述父节点是否为根节点；当所述父节点不是根节点时，所述执行模块以每一个所述父节点作为新的当前节点，触发所述计算所有当前节点的绩优率以及绩优覆盖率的步骤；当所述父节点为根节点时，所述执行模块计算所述根节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定所述根节点是否符合预设条件，当所述根节点符合预设条件时将所述根节点划分至绩优分组，当所述根节点不符合预设条件时忽略所述根节点；针对每一个所述当前节点，所述执行模块用于：将所述当前节点作为目标节点，当所述目标节点符合所述预设条件时，将所述目标节点划分至所述绩优分组；当所述目标节点不符合所述预设条件时，判断与所述目标节点属于同一父节点的其它同层节点是否符合所述预设条件；当属于同一父节点的至少一其它同层节点符合所述预设条件时，将所述目标节点划分至绩差分组；当属于同一父节点的所有其它同层节点均不符合所述预设条件时，忽略所述目标节点。

本发明一较佳实施方式还提供一种电子装置，包括处理器和存储器，所述存储器中存储有人员分组程序，所述处理器用于执行所述人员分组程序以实现如前所述的人员分组方法。

本发明一较佳实施方式还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有人员分组程序，所述人员分组程序被处理器执行时实现如前所述的人员分组方法。

本发明实施例在决策树建模中加入绩差人员的信息，使得分组目标更明确，且数据的执行效果更好，保证最终获得的绩优分组为绩优人数比例达到一定程度的群体；而且，可通过绩优分组的条件属性识别绩优人员的显著特征，从而构建用户画像。

附图说明

图1是本发明一较佳实施例提供的人员分组方法的流程图。

图2是图1的人员分组方法所使训练的决策树的示意图。

图3是本发明一较佳实施例提供的人员分组装置的结构示意图。

图4为本发明一较佳实施例提供的电子装置的结构示意图。

符号说明

如下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施例对本发明进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。

图1是本发明一较佳实施例提供的人员分组方法的流程图。所述人员分组方法应用于一电子装置1中。根据不同需求，所述人员分组方法的步骤顺序可以改变，某些步骤可以省略或合并。所述人员分组方法包括以下步骤：

步骤S11，获取多组样本数据，每一组样本数据包括多个条件属性以及对应的决策属性，所述决策属性为所述样本数据的绩效。

其中，所述样本数据需同时包括绩效较优的人员(即，绩优人员)和绩效较差的人员(即，绩差人员)的数据，所述样本数据可存储于所述电子装置中。在另一实施方式中，所述电子装置还可以通过接入网络连接之一外部样本库，进而来获取所述样本库存储的样本数据。在其它实施方式中，所述电子装置还可以通过大数据方式来收集并建立所述样本库。

在本实施方式中，所述条件属性可为行为轨迹(如，出差情况)、app活跃情况、业务扩展情况、消费情况、兴趣爱好、参加培训情况、考勤率等。以所述条件属性包括出差情况、业务扩展情况、参加培训情况以及考勤率为例进行说明，所述样本数据如表1所示。

表1样本数据

步骤S12，根据所述样本数据训练一决策树模型，其中，所述决策树模型包括多个叶子节点中，每一叶子节点代表一个分组。

其中，决策树算法属于监督学习分类算法，而决策树模型代表对象属性与对象值之间的一种映射关系。其中，所述决策树模型具有N层(N为自然数，N>2)，所述电子装置根据所述条件属性设置所述决策树模型中的每个节点(包括根节点、内部节点和叶子节点)的值。所述决策树模型的第一层为根节点，所述决策树模型的第二层代表以第一级条件属性对所述根节点进行分割得到的多个节点，所述决策树模型的第三层代表以第二级条件属性对上一层节点进行分割得到的多个节点，等等。如图2所示，所述决策树模型包括四层，即，N＝4。

在本实施方式中，训练所述决策树模型具体包括：

步骤S121，以所述样本数据作为训练集计算每一条件属性的信息增益(information gain)。

步骤S122，选择信息增益最大的条件属性作为所述决策树模型的根节点以分割所述样本数据以得到下一层节点；其中，某一条件属性的信息增益越大，说明选择所述条件属性对分类提供的信息越多，越有利于确定性，越有利于将所述样本数据进行分类。如图2所示，若计算信息增益最大的条件属性为“出差情况”，则选择“出差情况”条件属性作为根节点以分割所述样本数据。

步骤S123，以每一节点包含的样本数据作为训练集重新计算每一条件属性的信息增益。

步骤S124，选择信息增益最大的条件属性分割所述节点以得到下一层节点。如图2所示，对于包含每月出差情况为0次(C＝0)的样本的节点，若计算信息增益最大的条件属性为“业务拓展情况”，则根据“业务拓展情况”条件属性对所述节点进行分割而获得下一层节点。对于包含每月出差情况为≧2次(C≧2)的样本的节点，若计算信息增益最大的条件属性为“参加培训情况”，则根据“参加培训情况”条件属性对所述节点进行分割而获得下一层节点。实际训练过程中，对位于同一层的多个节点进行分割所采用的条件属性通常不同。每一次分割后形成的节点比上一层节点的数据纯度更高。

步骤S125，递归执行步骤S123以及S124，直至分割停止。此时，每一叶节点代表一个分组，每一分组包含的绩优人员数量与绩差人员数量之间具有固定的比值，而多个分组包含的绩优人员数量与绩差人员数量之间的比值可以互不相同。如，叶子节点“分组1”的所述比值可为1:8。当然，某一叶节点包含的可均为绩优人员，也可以均为绩差人员。其中，每一组样本数据只能被划分至其中一个叶子节点中，即，每一组样本数据不能同属于两个及两个以上的叶子节点。

在本实例中，在所述决策树的层数达到一预设层数(如：4层)时停止下一次分割。在另一实施例中，在所述决策树的当前层的每一节点包含的样本数量小于一预设数量时停止下一次分割。

其中，每一条件属性的信息增益Gain(S,A)可通过如下方式计算：

Gain(S,A)＝Entropy(S)-Entropy(S,A)

其中，Gain(S,A)表示A条件属性在训练集S上的信息增益，Entropy(S)表示训练集S的信息熵，Entropy(S,A)表示A属性的信息熵。

例如，如表1所示，在步骤S121中，所述训练集共有样本数据16组，绩优的有11组，绩差的有5组。以“出差情况”条件属性的信息增益计算为例进行说明，其它条件属性的信息增益计算过程同理。对于C＝0的情况，共有样本数据5组，绩优的有4组，绩差的有1组；对于C＝1的情况，共有样本数据4组，绩优的有2组，绩差的有2组；对于C≧2的情况，共有样本数据7组，绩优的有5组，绩差的有2组。因此，“出差情况”条件属性的信息增益的计算方式如下：

步骤S13，以所述决策树模型中的每一叶子节点作为当前节点，计算所有当前节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定每一个所述当前节点是否符合预设条件。

针对每一个所述当前节点，执行以下步骤：

将所述当前节点作为目标节点，当所述目标节点符合所述预设条件时，将所述目标节点划分至所述绩优分组；

当所述目标节点不符合所述预设条件时，判断与所述目标节点属于同一父节点的其它同层节点是否符合所述预设条件；

当属于同一父节点的至少一其它同层节点符合所述预设条件时，将所述目标节点划分至绩差分组；

当属于同一父节点的所有其它同层节点均不符合所述预设条件时，忽略所述目标节点。即，既不将所述目标节点划分至所述绩优分组，也不将所述目标节点划分至所述绩差分组。

其中，每一节点的绩优率为所述节点的绩优人员数量与所述节点的待分组人员的总数量之间的比值，所述节点的绩优率可通过所述节点包含的绩优人员数量与绩差人员数量之间的比值进行计算。每一节点的绩优覆盖率为所述节点的绩优人员数量与整个决策树模型的绩优人员的总数量之间的比值。当所述节点的绩优率以及绩优覆盖率分别达到一绩优率阈值与一绩优覆盖率阈值时，确定所述节点符合所述预设条件。反之，当所述节点的绩优率未达到所述绩优率阈值，或是，所述节点的绩优覆盖率未达到所述绩优覆盖率阈值，又或是，所述节点的绩优率以及绩优覆盖率均未达到所述绩优率阈值与所述绩优覆盖率阈值时，确定所述节点不符合所述预设条件。

例如，设置所述绩优率阈值为40％，所述绩优覆盖率阈值为20％。若计算出节点“分组8”的绩优率为80％，绩优覆盖率为20％，则节点“分组8”符合预设条件，被划分至绩优分组。对于节点“分组7”，若绩优覆盖率为30％，绩优覆盖率为25％，则节点“分组7”不符合预设条件，但是由于与所述节点“分组7”属于同一父节点的同层节点“分组8”预设条件，因此节点“分组7”被划分至绩差分组。反之，若节点“分组7”与节点“分组8”均不符合预设条件，则忽略节点“分组7”以及节点“分组8”。

在本实施方式中，所述绩优率阈值与所述绩优覆盖率阈值预先存储于所述电子装置中。所述绩优率阈值与所述绩优覆盖率阈值可根据实际需要进行调整。

步骤S14，每次当属于同一父节点的所有所述当前节点均不符合所述预设条件时，判断所述父节点是否为根节点。

步骤S15，当所述父节点不是根节点时，以每一个所述父节点作为新的当前节点，触发所述计算所有当前节点的绩优率以及绩优覆盖率的步骤；当所述父节点为根节点时，计算所述根节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定所述根节点是否符合预设条件，当所述根节点符合预设条件时将所述根节点划分至绩优分组，当所述根节点不符合预设条件时忽略所述根节点。

根据上述例子，若节点“分组7”与节点“分组8”均不符合预设条件，则需要考虑父节点是否为根节点。由于节点“分组7”与节点“分组8”的父节点并非根节点，则继续判断所述父节点的所述绩优率以及所述绩优覆盖率是否符合预设条件。可以理解，当所有的内部节点和叶子节点均不符合预设条件时，才对所述根节点进行判断。

其中，通过调整所述绩优率阈值与所述绩优覆盖率阈值，可控制所述绩优分组与所述绩差分组的大小和质量。

其中，最终得到的绩优分组可包括具有不同特征的绩优人群。如，若“分组4”被划分至所述绩优分组，则该部分绩优人群涉及的条件属性包括：出差情况＝0次、业务拓展情况≧1次，考勤率≧80。也就是说，该部分绩优人群的显著特征为：不出差、业务能力强、出勤情况较好。

若“分组8”被划分至所述绩优分组，则该部分绩优人群涉及的条件属性包括：出差情况为≧2次、参加培训情况≧1次，考勤率≧80。也就是说，该部分绩优人群的显著特征为：经常出差、乐于学习、出勤情况较好。

图3为本发明一较佳实施方式提供的人员分组装置300的结构示意图。在一些实施例中，所述人员分组装置300运行于电子装置中。所述人员分组装置300可以包括多个由程序代码段所组成的功能模块。所述人员分组装置300的各个程序段的程序代码可以存储于电子装置的存储器中，并由所述至少一个处理器所执行，以实现人员分组功能。

本实施例中，所述人员分组装置300根据其所执行的功能，可以被划分为多个功能模块。如图3所示，所述人员分组装置300包括：获取模块301、训练模块302、执行模块303。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段，其存储在存储器中。在本实施例中，关于各模块的功能将在后续的实施例中详述。

所述获取模块301用于获取多组样本数据，每一组样本数据包括多个条件属性以及对应的决策属性，所述决策属性为所述样本数据的绩效。

在本实施方式中，所述条件属性可为行为轨迹(如，出差情况)、app活跃情况、业务扩展情况、消费情况、兴趣爱好、参加培训情况、考勤率等。以所述条件属性包括出差情况、业务扩展情况、参加培训情况以及考勤率为例进行说明，所述样本数据如上表1所示。

所述训练模块302用于根据所述样本数据训练一决策树模型，其中，所述决策树模型包括多个叶子节点，每一叶子节点代表一个分组。

其中，决策树算法属于监督学习分类算法，而决策树模型代表对象属性与对象值之间的一种映射关系。其中，所述决策树模型具有N层(N为自然数，N>2)，所述训练模块302根据所述条件属性设置所述决策树模型中的每个节点(包括根节点、内部节点和叶子节点)的值。所述决策树模型的第一层为根节点，所述决策树模型的第二层代表以第一级条件属性对所述根节点进行分割得到的多个节点，所述决策树模型的第三层代表以第二级条件属性对上一层节点进行分割得到的多个节点，等等。如图2所示，所述决策树模型包括四层，即，N＝4。

在本实施方式中，所述训练模块302以所述样本数据作为训练集计算每一条件属性的信息增益(information gain)，并选择信息增益最大的条件属性作为所述决策树模型的根节点以分割所述样本数据以得到下一层节点。其中，某一条件属性的信息增益越大，说明选择所述条件属性对分类提供的信息越多，越有利于确定性，越有利于将所述样本数据进行分类。如图2所示，若计算信息增益最大的条件属性为“出差情况”，则选择“出差情况”条件属性作为根节点以分割所述样本数据。

所述训练模块302进一步以每一节点包含的样本数据作为训练集重新计算每一条件属性的信息增益，并选择信息增益最大的条件属性分割所述节点以得到下一层节点。如图2所示，对于包含每月出差情况为0次(C＝0)的样本的节点，若计算信息增益最大的条件属性为“业务拓展情况”，则根据“业务拓展情况”条件属性对所述节点进行分割而获得下一层节点。对于包含每月出差情况为≧2次(C≧2)的样本的节点，若计算信息增益最大的条件属性为“参加培训情况”，则根据“参加培训情况”条件属性对所述节点进行分割而获得下一层节点。实际训练过程中，对位于同一层的多个节点进行分割所采用的条件属性通常不同。每一次分割后形成的节点比上一层节点的数据纯度更高。

所述训练模块302进一步递归执行每一条件属性的信息增益的计算步骤以及选择信息增益最大的条件属性分割所述节点以得到下一层节点的步骤，直至分割停止。此时，每一叶节点代表一个分组，每一分组包含的绩优人员数量与绩差人员数量之间具有固定的比值，而多个分组包含的绩优人员数量与绩差人员数量之间的比值可以互不相同。如，叶子节点“分组1”的所述比值可为1:8。当然，某一叶节点包含的可均为绩优人员，也可以均为绩差人员。其中，每一组样本数据只能被划分至其中一个叶子节点中，即，每一组样本数据不能同属于两个及两个以上的叶子节点。

Gain(S,A)＝Entropy(S)-Entropy(S,A)

例如，如表1所示，在所述训练模块302选择根节点的过程中，所述训练集共有样本数据16组，绩优的有11组，绩差的有5组。以“出差情况”条件属性的信息增益计算为例进行说明，其它条件属性的信息增益计算过程同理。对于C＝0的情况，共有样本数据5组，绩优的有4组，绩差的有1组；对于C＝1的情况，共有样本数据4组，绩优的有2组，绩差的有2组；对于C≧2的情况，共有样本数据7组，绩优的有5组，绩差的有2组。因此，“出差情况”条件属性的信息增益的计算方式如下：

所述执行模块303用于以所述决策树模型中的每一叶子节点作为当前节点，计算所有当前节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定每一个所述当前节点是否符合预设条件。

针对每一个所述当前节点，所述执行模块303用于：

所述执行模块303还用于每次当属于同一父节点的所有所述当前节点均不符合所述预设条件时，判断所述父节点是否为根节点。

当所述父节点不是根节点时，所述执行模块303以每一个所述父节点作为新的当前节点，触发所述计算所有当前节点的绩优率以及绩优覆盖率的步骤；当所述父节点为根节点时，计算所述根节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定所述根节点是否符合预设条件，当所述根节点符合预设条件时将所述根节点划分至绩优分组，当所述根节点不符合预设条件时忽略所述根节。

如图4所示，图4是本发明一较佳实施方式中实现所述人员分组方法的电子装置1的结构示意图。所述电子装置1包括存储器101、处理器102以及存储于所述存储器101中并可在所述处理器102上运行的计算机程序103，例如人员分组程序。

所述处理器102执行所述计算机程序103时实现上述实施例中人员分组方法的步骤：

步骤S12，根据所述样本数据训练一决策树模型，其中，所述决策树模型包括多个叶子节点，每一叶子节点代表一个分组。

在本实施方式中，训练所述决策树模型具体包括：

Gain(S,A)＝Entropy(S)-Entropy(S,A)

针对每一个所述当前节点，执行以下步骤：

或者，所述处理器102执行所述计算机程序103时实现上述人员分组装置实施例中各模块/单元的功能，例如图3中的单元301-303。

示例性的，所述计算机程序103可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器101中，并由所述处理器102执行，以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序103在所述电子装置1中的执行过程。例如，所述计算机程序103可以被分割成图3中的获取模块301、训练模块302、执行模块303。

所述电子装置1可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解，所述示意图仅仅是电子装置1的示例，并不构成对电子装置1的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述电子装置1还可以包括输入输出设备、网络接入设备、总线等。

所称处理器102可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器30也可以是任何常规的处理器等，所述处理器102是所述电子装置1的控制中心，利用各种接口和线路连接整个电子装置1的各个部分。

所述存储器101可用于存储所述计算机程序103和/或模块/单元，所述处理器102通过运行或执行存储在所述存储器101内的计算机程序和/或模块/单元，以及调用存储在存储器101内的数据，实现所述电子装置1的各种功能。所述存储器101可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据电子装置1的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器101可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述电子装置1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

在本发明所提供的几个实施例中，应该理解到，所揭露的电子装置和方法，可以通过其它的方式实现。例如，以上所描述的电子装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

另外，在本发明各个实施例中的各功能单元可以集成在相同处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。电子装置权利要求中陈述的多个单元或电子装置也可以由同一个单元或电子装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种人员分组方法，其特征在于，包括：

获取多组样本数据，每一组样本数据包括多个条件属性以及对应的决策属性，所述决策属性为所述样本数据的绩效；

根据所述样本数据训练一决策树模型，其中，所述决策树模型包括多个叶子节点，每一叶子节点代表一个分组；

以所述决策树模型中的每一叶子节点作为当前节点，计算所有当前节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定每一个所述当前节点是否符合预设条件；

当属于同一父节点的所有所述当前节点均不符合所述预设条件时，判断所述父节点是否为根节点；

当所述父节点不是根节点时，以每一个所述父节点作为新的当前节点，触发所述计算所有当前节点的绩优率以及绩优覆盖率的步骤；

当所述父节点为根节点时，计算所述根节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定所述根节点是否符合预设条件，当所述根节点符合预设条件时将所述根节点划分至绩优分组，当所述根节点不符合预设条件时忽略所述根节点；

针对每一个所述当前节点，执行以下步骤：

当属于同一父节点的所有其它同层节点均不符合所述预设条件时，忽略所述目标节点。

2.如权利要求1所述的人员分组方法，其特征在于，所述根据所述样本数据训练一决策树模型包括：

以所述样本数据作为训练集计算每一条件属性的信息增益；

选择信息增益最大的条件属性作为所述决策树模型的根节点以分割所述样本数据以得到下一层节点；

以每一节点包含的样本数据作为训练集重新计算每一条件属性的信息增益；

选择信息增益最大的条件属性分割所述节点以得到下一层节点；以及

递归执行重新计算每一条件属性的信息增益的步骤以及选择信息增益最大的条件属性分割所述节点的步骤，直至分割停止。

3.如权利要求2所述的人员分组方法，其特征在于，在所述决策树的层数达到一预设层数时停止下一次分割。

4.如权利要求2所述的人员分组方法，其特征在于，在所述决策树的当前层的每一节点包含的样本数量小于一预设数量时停止下一次分割。

5.如权利要求1所述的人员分组方法，其特征在于，每一节点的绩优率为所述节点的绩优人员数量与所述节点的待分组人员的总数量之间的比值，每一节点的绩优覆盖率为所述节点的绩优人员数量与整个决策树模型的绩优人员的总数量之间的比值。

6.如权利要求5所述的人员分组方法，其特征在于，所述根据所述绩优率以及所述绩优覆盖率确定每一个所述当前节点是否符合预设条件包括：

当所述当前节点的绩优率以及绩优覆盖率分别达到一绩优率阈值与一绩优覆盖率阈值时，确定所述当前节点符合所述预设条件；以及

当所述当前节点的绩优率未达到所述绩优率阈值，或所述当前节点的绩优覆盖率未达到所述绩优覆盖率阈值，或所述当前节点的绩优率以及绩优覆盖率均未达到所述绩优率阈值与所述绩优覆盖率阈值时，确定所述当前节点不符合所述预设条件。

7.如权利要求1所述的人员分组方法，其特征在于，所述样本数据同时包括绩优人员和绩差人员的数据。

8.一种人员分组装置，其特征在于，包括：

获取模块，用于获取多组样本数据，每一组样本数据包括多个条件属性以及对应的决策属性，所述决策属性为所述样本数据的绩效；

训练模块，用于根据所述样本数据训练一决策树模型，其中，所述决策树模型包括多个叶子节点，每一叶子节点代表一个分组；

执行模块，用于计算所有当前节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定每一个所述当前节点是否符合预设条件；

当属于同一父节点的所有所述当前节点均不符合所述预设条件时，所述执行模块判断所述父节点是否为根节点；

当所述父节点不是根节点时，所述执行模块以每一个所述父节点作为新的当前节点，触发所述计算所有当前节点的绩优率以及绩优覆盖率的步骤；

当所述父节点为根节点时，所述执行模块计算所述根节点的绩优率以及绩优覆盖率，根据所述绩优率以及所述绩优覆盖率确定所述根节点是否符合预设条件，当所述根节点符合预设条件时将所述根节点划分至绩优分组，当所述根节点不符合预设条件时忽略所述根节点；

针对每一个所述当前节点，所述执行模块用于：

9.一种电子装置，其特征在于，包括处理器和存储器，所述存储器中存储有人员分组程序，所述处理器用于执行所述人员分组程序以实现如权利要求1至7中任意一项所述的人员分组方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有人员分组程序，所述人员分组程序被处理器执行时实现如权利要求1-7中任一项的所述人员分组方法。