CN110717787A

CN110717787A - 一种用户的分类方法及装置

Info

Publication number: CN110717787A
Application number: CN201910948666.2A
Authority: CN
Inventors: 张茂洪
Original assignee: Enyike (beijing) Data Technology Co Ltd
Current assignee: Enyike (beijing) Data Technology Co Ltd
Priority date: 2019-10-08
Filing date: 2019-10-08
Publication date: 2020-01-21

Abstract

本申请提供了一种用户的分类方法及装置，获取多个样本待分类用户中每个样本待分类用户的待选用户属性特征下的特征值；用户属性特征包括用户居住区域、房屋价格、房屋面积以及楼层中一种或者多种；基于各个样本待分类用户的待选用户属性特征下的特征值，对待选用户属性特征进行筛选，从待选用户属性特征中，确定至少一个选定用户属性特征；基于各个样本待分类用户的在各个选定用户特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵；基于各个样本待分类用户的特征矩阵，训练得到用户分群模型；基于预先训练的用户分群模型中，对待分类用户进行分群。该用户的分类方法能够对用户进行分类，提升用户分类的精准性。

Description

一种用户的分类方法及装置

技术领域

本申请涉及数据处理领域，尤其是涉及一种用户的分类方法及装置。

背景技术

人的本质在其现实性上是一切社会关系的总和，对于不同的用户，其所具有的特性在某种意义上也表征了一些其他的特性，如工作区域与职业类型的关联、消费习惯与收入水平的关联等等。对于一些行业，掌握用户类别对于开展各项业务是具有极大的推进作用。

目前，很多行业通过多种方式对用户进行信息分类，以达到开展针对不同用户类型业务的目的。但是现有技术中在对用户进行信息分类时，只能根据单一特征对用户进行分类，分类结果不够精准。

因此，更加精准的对用户进行分类就显得尤为重要。

发明内容

有鉴于此，本申请实施例的目的在于提供一种用户的分类方法及装置，能够对用户进行分类，提升用户分类的精准性。

第一方面，本申请实施例提供了一种用户的分类方法，包括：

获取多个样本待分类用户中每个样本待分类用户的待选用户属性特征下的特征值；所述用户属性特征包括用户居住区域、房屋价格、房屋面积以及楼层中一种或者多种；

基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选，从所述待选用户属性特征中，确定至少一个选定用户属性特征；

基于各个所述样本待分类用户的在各个选定用户属性特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵；

基于各个样本待分类用户的特征矩阵，训练得到用户分群模型；

基于预先训练的用户分群模型中，对待分类用户进行分群。

一种可选实施方式中，所述基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选，包括：

针对每种待选用户属性特征，基于各个所述样本待分类用户分别在该待选用户属性特征下的特征值，得到该待选用户属性特征对应的标准差；将该待选用户属性特征对应的标准差与预设标准差阈值进行比对；

若该待选用户属性特征对应的标准差大于所述预设标准差预阈值，则将该待选用户属性特征确定为选定用户属性特征。

一种可选实施方式中，基于各个所述样本待分类用户的在各个选定用户特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵，包括：

针对在所有选定用户特征下均不存在特征值确实的样本待分类用户，基于该样本待分类用户在各个选定用户特征下均不存在特征值，构成该样本待分类用户的特征矩阵；

针对在任一选定用户特征下存在特征值缺失的样本待分类用户，基于除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值，对该样本待分类用户在该任一选定用户特征下的特征值进行数据填充，得到该样本待分类用户在该任一选定用户特征下的填充值；

基于该样本待分类用户在该任一选定用户特征下的填充值，以及该样本待分类用户在其他未存在缺失的选定用户特征下的特征值，构成该样本待分类用户的特征矩阵。

一种可选实施方式中，基于除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值，对该样本待分类用户在该任一选定用户特征下的特征值进行数据填充，包括：

确定除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值的平均数或众数，基于确定的所述平均数或者众数，对该样本待分类用户在该任一选定用户特征下的特征值进行数据填充。

一种可选实施方式中，用户分群模型包括：岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型；

基于各个样本待分类用户的特征矩阵，训练得到用户分群模型，包括：

针对每个样本待分类用户，将该样本待分类用户的特征矩阵依次输入至岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型，得到与岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型分别对应的中间预测分类结果；

基于岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型分别对应的中间预测分类结果，得到与该样本待分类用户对应的预测分类结果；

基于各个样本待分类用户分别对应的实际分类结果，以及预测分类结果，对岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型进行本轮训练，并训练岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型分别对应的权重；

对岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型进行多轮训练，得到用户分群模型。

第二方面，本申请实施例还提供一种用户的分类装置，该用户的分类装置包括：获取模块、筛选模块、构成模块、训练模块以及分群模块；其中：

所述获取模块，用于获取多个样本待分类用户中每个样本待分类用户的待选用户属性特征下的特征值；所述用户属性特征包括用户居住区域、房屋价格、房屋面积以及楼层中一种或者多种；

所述筛选模块，用于基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选，从所述待选用户属性特征中，确定至少一个选定用户属性特征；

所述构成模块，用于基于各个所述样本待分类用户的在各个选定用户属性特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵；

所述训练模块，用于基于各个样本待分类用户的特征矩阵，训练得到用户分群模型；

所述分群模块，用于基于预先训练的用户分群模型中，对待分类用户进行分群。

一种可选实施方式中，所述筛选模块，用于基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选时，具体用于：

一种可选实施方式中，所述构成模块，在基于各个所述样本待分类用户的在各个选定用户特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵时，具体用于：

一种可选实施方式中，所述构成模块，用于基于除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值，对该样本待分类用户在该任一选定用户特征下的特征值进行数据填充时，具体用于：

一种可选实施方式中，所述用户分群模型包括：岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型；

所述训练模块，用于基于各个样本待分类用户的特征矩阵，训练得到用户分群模型，包括：

第三方面，本申请实施例还提供一种计算机设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当计算机设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述+处理器执行时执行上述第一方面、或第一方面中任一种可能的实施方式中的步骤。

第四方面，本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述第一方面、或第一方面中任一种可能的实施方式中的步骤。

本申请实施例提供的用户的分类方法及装置，获取多个样本待分类用户中每个样本待分类用户的待选用户属性特征下的特征值；所述用户属性特征包括用户居住区域、房屋价格、房屋面积以及楼层中一种或者多种；基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选，从所述待选用户属性特征中，确定至少一个选定用户属性特征；基于各个所述样本待分类用户的在各个选定用户属性特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵；基于各个样本待分类用户的特征矩阵，训练得到用户分群模型；基于预先训练的用户分群模型中，对待分类用户进行分群。该用户的分类方法利用数据计算的方法，对用户数据进行详细分析，并根据不同待分类用户属性特征对用户进行分类，能够提升用户分类的精准性，提高用户分类数据的有效性。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例所提供的用户的分类方法的流程图；

图2示出了本申请实施例所提供的用户的分类方法中生成用于表征各个样本待分类用户属性特征的特征矩阵的流程图；

图3示出了本申请实施例所提供的一种用户的分类装置名称的结构示意图；

图4示出了本申请实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

基于上述研究，本申请实施例提供了一种用户的分类方法及装置，获取多个样本待分类用户中每个样本待分类用户的待选用户属性特征下的特征值；所述用户属性特征包括用户居住区域、房屋价格、房屋面积以及楼层中一种或者多种；基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选，从所述待选用户属性特征中，确定至少一个选定用户属性特征；基于各个所述样本待分类用户的在各个选定用户属性特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵；基于各个样本待分类用户的特征矩阵，训练得到用户分群模型；基于预先训练的用户分群模型中，对待分类用户进行分群，可以提高对用户分类的精准性。

针对以上方案所存在的缺陷，均是发明人在经过实践并仔细研究后得出的结果，因此，上述问题的发现过程以及下文中本申请针对上述问题所提出的解决方案，都应该是发明人在本申请过程中对本申请做出的贡献。

下面将结合本申请中附图，对本申请中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

为便于对本实施例进行理解，首先对本申请实施例所公开的一种用户的分类方法进行详细介绍，本申请实施例所提供的用户的分类方法的执行主体一般为软件程序。特殊地，其执行主体还可以为其他计算机设备。

实施例一

参见图1所示，为本申请实施例一提供的用户的分类方法的流程图，所述方法包括步骤S101～S105，其中：

S101：获取多个样本待分类用户中每个样本待分类用户的待选用户属性特征下的特征值；所述用户属性特征包括用户居住区域、房屋价格、房屋面积以及楼层中一种或者多种。

S102：基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选，从所述待选用户属性特征中，确定至少一个选定用户属性特征。

S103：基于各个所述样本待分类用户的在各个选定用户特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵。

S104：基于各个样本待分类用户的特征矩阵，训练得到用户分群模型。

S105：基于预先训练的用户分群模型中，对待分类用户进行分群。

下面分别对上述S101～S105加以详细说明。

一：在上述S101中，获取多个样本待分类用户中每个样本待分类用户的待选用户属性特征下的特征值，所述用户属性特征包括用户居住区域、房屋价格、房屋面积以及楼层中一种或者多种。

其中，对于样本待分类用户，其所居住的区域、所购买房屋的价格、购买房屋的楼层以及面积，还包括购买房屋时选择的中介、物业费、水电费等，都可以作为间接估测用户类别的依据。

示例性的，居住在不同区域的用户，可能具有相似的职业、爱好，也可以具有大致同一水平的收入等等，因此可以以区域为特征，估计居住在该区域用户的某些特征。

此外，对于一些信息，如居住区域等不能用数字表示出来的信息，可以按照一些预设的程序，将其转化成数字型信息，方便后续的计算，加快运算速度。

示例性的，某区域的居住人群大多收入超过某一数值，那么就可以将区域转化成收入数值，进行后续计算。

二：在上述S102中，基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选，从所述待选用户属性特征中，确定至少一个选定用户属性特征。

其中，各个样本待分类用户的待选用户属性特征下的特征值相对于估测用户类别的重要性不同，例如，房屋价格相对于房屋楼层就更为重要，居住区域相对于居住面积也更为重要。在理想情况下，计算采用的待分类用户中每个样本待分类用户的待选用户属性特征下的特征值越完整，其预测处的结果就越准确，但是在实际运算过程中，在计算资源包括计算时间的限制下，往往不能够将所有待选用户属性特征下的特征值进行计算，所有需要选择一些重要性比较大的待选用户属性特征下的特征值进行计算。

示例性的，选取1000名待分类用户，其居住在相同区域，或者该区域的其他特征极其相似，该居住区域这一待选用户属性特征就属于特征值变化很小的特征，也就是区分度很小，对于待选用户属性特征下的特征值的计算的贡献很小，为了节约计算资源，缩短计算时间，可以对待选用户属性特征进行剔除。

在一种可能的实施方式中，可以预设对于待选用户属性特征值阈值，若计算得出的结果不符合预期，即达不到预设的对于待选用户属性特征值阈值，考虑可能是剔除了过多的待选用户属性特征，例如，居住在某一区域的或是房价高于某一特定值的用户，在大概率的情况下，其收入情况不会低于某一数值，若低于该数值，则可以对于剔除的待选用户属性特征进行重新选取，直至符合预设预期情况。

示例性的，对待选用户属性特征的区分度进行计算，针对每种待选用户属性特征，基于各个所述样本待分类用户分别在该待选用户属性特征下的特征值，得到该待选用户属性特征对应的标准差；将该待选用户属性特征对应的标准差与预设标准差阈值进行比对；若该待选用户属性特征对应的标准差大于所述预设标准差预阈值，则将该待选用户属性特征确定为选定用户属性特征。

三：在上述S103中，基于各个所述样本待分类用户的在各个选定用户特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵。

其中，针对在所有选定用户特征下均不存在特征值缺失样本待分类用户，基于该样本待分类用户在各个选定用户特征下均不存在特征值，构成该样本待分类用户的特征矩阵；

示例性的，某些待分类用户由于统计缺失或待分类用户信息记忆不完全等种种限制，可以会存在一些待选用户属性特征下的特征值，比如缺失房屋价格信息，居住面积信息等等，造成待分类用户的特征值不完整，影响后期计算过程，此时，可以将其他待分类用户的平均数或众数填充在特征值缺失的位置，方便后续的计算过程。

四：在上述S104中，基于各个样本待分类用户的特征矩阵，训练得到用户分群模型。

其中，用户分群模型包括：岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型；

五：在上述S105中，基于预先训练的用户分群模型中，对待分类用户进行分群。

示例性的，基于用户居住区域、房屋价格、房屋面积以及楼层等信息，可以预测出待分类用户的收入水平、资产水平等信息，再结合待分类用户的性别、家庭、婚姻状况、家乡等信息，可以对待分类用户进行分群，这对于一些商家针对不同用户推出不同的营销方法，具有极强的推动作用。

参见图2所示，为本申请实施例一提供的用户的分类方法中生成用于表征各个样本待分类用户属性特征的特征矩阵的流程图，所述方法包括步骤S201～S203，其中：

S201：针对在所有选定用户特征下均不存在特征值确实的样本待分类用户，基于该样本待分类用户在各个选定用户特征下均不存在特征值，构成该样本待分类用户的特征矩阵。

S202：针对在任一选定用户特征下存在特征值缺失的样本待分类用户，基于除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值，对该样本待分类用户在该任一选定用户特征下的特征值进行数据填充，得到该样本待分类用户在该任一选定用户特征下的填充值。

S203：基于该样本待分类用户在该任一选定用户特征下的填充值，以及该样本待分类用户在其他未存在缺失的选定用户特征下的特征值，构成该样本待分类用户的特征矩阵。

其中，在上述S201，针对在所有选定用户特征下均不存在特征值确实的样本待分类用户，基于该样本待分类用户在各个选定用户特征下均不存在特征值，构成该样本待分类用户的特征矩阵。

示例性的，某些待分类用户由于统计缺失或待分类用户信息记忆不完全等种种限制，可以会存在一些待选用户属性特征下的特征值，比如缺失房屋价格信息，居住面积信息等等，造成待分类用户的特征值不完整，影响后期计算过程。

在上述S202，针对在任一选定用户特征下存在特征值缺失的样本待分类用户，基于除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值，对该样本待分类用户在该任一选定用户特征下的特征值进行数据填充，得到该样本待分类用户在该任一选定用户特征下的填充值。

示例性的，针对特征值不完整的待分类用户，可以利用除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值的平均数或者众数进行填充，例如某一用户缺失房屋面积信息，可以通过利用其他待分类用户的房屋面积的平均数或众数对该用户缺失的房屋面积进行填充。

在上述S203，基于该样本待分类用户在该任一选定用户特征下的填充值，以及该样本待分类用户在其他未存在缺失的选定用户特征下的特征值，构成该样本待分类用户的特征矩阵。

示例性的，将全部待分类用户以及填充缺失的选定用户特征下的特征值构成该样本待分类用户的特征矩阵，准备进行后续计算。

本申请实施例获取多个样本待分类用户中每个样本待分类用户的待选用户属性特征下的特征值；所述用户属性特征包括用户居住区域、房屋价格、房屋面积以及楼层中一种或者多种；基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选，从所述待选用户属性特征中，确定至少一个选定用户属性特征；基于各个所述样本待分类用户的在各个选定用户属性特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵；基于各个样本待分类用户的特征矩阵，训练得到用户分群模型；基于预先训练的用户分群模型中，对待分类用户进行分群，可以提高对用户分类的精准性。

基于同一发明构思，本申请实施例中还提供了与用户的分类方法对应的用户的分类装置，由于本申请实施例中的装置解决问题的原理与本申请实施例上述用户的分类方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

实施例二

参照图3所示，为本申请实施例三提供的一种用户的分类装置，该用户的分类装置包括：获取模块31、筛选模块32、构成模块33、训练模块34以及分群模块35；其中：

获取模块31，用于获取多个样本待分类用户中每个样本待分类用户的待选用户属性特征下的特征值；所述用户属性特征包括用户居住区域、房屋价格、房屋面积以及楼层中一种或者多种；

筛选模块32，用于基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选，从所述待选用户属性特征中，确定至少一个选定用户属性特征；

构成模块33，用于基于各个所述样本待分类用户的在各个选定用户属性特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵；

训练模块34，用于基于各个样本待分类用户的特征矩阵，训练得到用户分群模型；

分群模块35，用于基于预先训练的用户分群模型中，对待分类用户进行分群。

一种可能的实施方式中，所述筛选模块32，用于基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选时，具体用于：

一种可能的实施方式中，所述构成模块33，在基于各个所述样本待分类用户的在各个选定用户特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵时，具体用于：

一种可能的实施方式中，所述构成模块33，用于基于各个所述样本待分类用户的在各个选定用户特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵时，具体用于：

一种可能的实施方式中，所述分群模块，用于用户分群模型包括：岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型；

实施例三

本申请实施例还提供了一种计算机设备400，如图4所示，为本申请实施例提供的计算机设备400结构示意图，包括：

处理器41、存储器42、和总线43；存储器42用于存储执行指令，包括内存421和外部存储器422；这里的内存421也称内存储器，用于暂时存放处理器41中的运算数据，以及与硬盘等外部存储器422交换的数据，处理器41通过内存421与外部存储器422进行数据交换，当所述计算机设备400运行时，所述处理器41与所述存储器42之间通过总线43通信，使得所述处理器41在用户态执行以下指令：

基于预先训练的用户分群模型中，对待分类用户进行分群。

一种可能的实施方式中，处理器41执行的指令中，所述基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选，包括：

一种可能的实施方式中，处理器41执行的指令中，基于各个所述样本待分类用户的在各个选定用户特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵，包括：

一种可能的实施方式中，处理器41执行的指令中，基于除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值，对该样本待分类用户在该任一选定用户特征下的特征值进行数据填充，包括：

一种可能的实施方式中，处理器41执行的指令中，所述用户分群模型包括：岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型；

目标存储位置本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法实施例中所述的用户的分类方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本申请的具体实施方式，用以说明本申请的技术方案，而非对其限制，本申请的保护范围并不局限于此，尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种用户的分类方法，其特征在于，包括：

基于预先训练的用户分群模型中，对待分类用户进行分群。

2.根据权利要求1所述的方法，其特征在于，所述基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选，包括：

3.根据权利要求1所述的方法，其特征在于，基于各个所述样本待分类用户的在各个选定用户特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵，包括：

4.根据权利要求3所述的方法，其特征在于，基于除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值，对该样本待分类用户在该任一选定用户特征下的特征值进行数据填充，包括：

5.根据权利要求1所述的方法，其特征在于，所述用户分群模型包括：岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型；

6.一种用户的分类装置，其特征在于，包括：

获取模块，用于获取多个样本待分类用户中每个样本待分类用户的待选用户属性特征下的特征值；所述用户属性特征包括用户居住区域、房屋价格、房屋面积以及楼层中一种或者多种；

筛选模块，用于基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选，从所述待选用户属性特征中，确定至少一个选定用户属性特征；

构成模块，用于基于各个所述样本待分类用户的在各个选定用户属性特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵；

训练模块，用于基于各个样本待分类用户的特征矩阵，训练得到用户分群模型；

分群模块，用于基于预先训练的用户分群模型中，对待分类用户进行分群。

7.根据权利要求6所述的装置，其特征在于，所述筛选模块，在基于各个样本待分类用户的待选用户属性特征下的特征值，对所述待选用户属性特征进行筛选时，具体用于：

8.根据权利要求6所述的装置，其特征在于，所述构成模块，在基于各个所述样本待分类用户的在各个选定用户特征下的特征值，构成用于表征各个样本待分类用户属性特征的特征矩阵时，具体用于：

9.根据权利要求8所述的装置，其特征在于，所述构成模块，用于基于除该样本待分类用户外的其他样本待分类用户在该任一选定用户特征下的特征值，对该样本待分类用户在该任一选定用户特征下的特征值进行数据填充时，具体用于：

10.根据权利要求6所述的装置，其特征在于，所述用户分群模型包括：岭回归模型、套索回归模型、弹性网络模型、轻量级梯度提升机模型、以及梯度回归决策树模型；

11.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1至5任一所述方法的步骤。

12.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至5任一所述方法的步骤。