CN112308616A

CN112308616A - 一种航司旅客的群体划分方法及装置

Info

Publication number: CN112308616A
Application number: CN202011203027.2A
Authority: CN
Inventors: 张凯淞
Original assignee: Shenyang Ne Cares Co ltd
Current assignee: Shenyang Ne Cares Co ltd
Priority date: 2020-11-02
Filing date: 2020-11-02
Publication date: 2021-02-02

Abstract

本发明公开了一种航司旅客的群体划分方法及装置，该方法包括：当接收航司旅客的分类请求时，获取航司旅客的预设时长内的数据信息，数据信息包括：是否为VIP、购票总价、飞行总里程、乘坐不同舱位次数、机票平均折扣率、购票频率、使用航司付费服务次数和每次出行航班的准点率；将数据信息转换为第一预设数量的消费水平维度数据；将消费水平维度数据传递给预设的分类模型进行分类，得到航司旅客属于第二预设数量的预设分类的概率，将各个概率中最大值对应的预设分类作为第一目标分类，将所述航司旅客划分为所述第一目标分类。上述方法，基于不同的数据信息进行分类，数据信息中存在与消费和购票相关数据，可以实现对航司旅客消费习惯的分析。

Description

一种航司旅客的群体划分方法及装置

技术领域

本发明涉及数据处理技术领域，尤其涉及一种航司旅客的群体划分方法及装置。

背景技术

随着经济的发展和时代的进步，越来越多的旅客选择乘坐飞机出行，随着机票价格的不断下探，现在民航领域内的竞争也愈发激烈，针对这种情况，航司应该整合旅客的出行信息和数据，对航司旅客进行聚类划分，结合推荐算法，对不同类别的旅客进行机票推送和行程规划。同时，机场也可以根据用户的消费能力以及消费趋势来为用户提供不同的商品以及服务。

目前，对航司旅客的群体划分只是对其是否为VIP进行划分，使用的航司旅客信息过于单一，无法深度挖掘航司旅客的消费习惯偏好。

发明内容

有鉴于此，本发明提供了一种航司旅客的群体划分方法及装置，用以解决对航司旅客的群体划分只是对其是否为VIP进行划分，使用的航司旅客信息过于单一，无法深度挖掘航司旅客的消费习惯偏好的问题。具体方案如下：

一种航司旅客的群体划分方法，包括：

当接收航司旅客的分类请求时，获取所述航司旅客的预设时长内的数据信息，其中，所述数据信息包括：是否为VIP、购票总价、飞行总里程、乘坐不同舱位次数、机票平均折扣率、购票频率、使用航司付费服务次数和每次出行航班的准点率；

将所述数据信息转换为第一预设数量的消费水平维度数据；

将所述消费水平维度数据传递给预设的分类模型进行分类，得到所述航司旅客属于第二预设数量的预设分类的概率，其中，所述预设的分类模型基于历史数据信息进行训练得到；

将各个概率中最大值对应的预设分类作为第一目标分类，将所述航司旅客划分为所述第一目标分类。

上述的方法，可选的，将所述数据信息转换为第一预设数量的消费水平维度数据，包括：

基于所述数据信息计算预设数量的初始消费水平维度数据；

对每一个初始消费水平数据采用对应的映射方法映射到(0,1]区间，得到所述第一预设数量的消费水平维度数据。

上述的方法，可选的，还包括：

获取所述消费水平维度数据属于各个预设分类中的概率和概率阈值；

获取所述消费水平维度数据与各个预设分类中心点的距离和距离阈值；

依据所述概率、所述概率阈值、所述距离和所述距离阈值采用预设的确定规则确定所述航司旅客属于的第二目标分类，其中，所述第二目标分类为第三预设数量的预设分类中的任意一个，所述第三预设数量大于所述第二预设数量。

上述的方法，可选的，所述预设的分类模型为高斯混合分类模型。

上述的方法，可选的，还包括：

获取与所述第一目标分类对应的待推荐服务；

将所述待推荐服务推荐给所述航司旅客。

一种航司旅客的群体划分装置，包括：

信息获取模块，用于当接收航司旅客的分类请求时，获取所述航司旅客的预设时长内的数据信息，其中，所述数据信息包括：是否为VIP、购票总价、飞行总里程、乘坐不同舱位次数、机票平均折扣率、购票频率、使用航司付费服务次数和每次出行航班的准点率；

转换模块，用于将所述数据信息转换为第一预设数量的消费水平维度数据；

分类模块，用于将所述消费水平维度数据传递给预设的分类模型进行分类，得到所述航司旅客属于第二预设数量的预设分类的概率，其中，所述预设的分类模型基于历史数据信息进行训练得到；

划分模块，用于将各个概率中最大值对应的预设分类作为第一目标分类，将所述航司旅客划分为所述第一目标分类。

上述的装置，可选的，所述转换模块包括：

计算单元，用于基于所述数据信息计算预设数量的初始消费水平维度数据；

映射单元，用于对每一个初始消费水平数据采用对应的映射方法映射到 (0,1]区间，得到所述第一预设数量的消费水平维度数据。

上述的装置，可选的，还包括：

第一获取模块，用于获取所述消费水平维度数据属于各个预设分类中的概率和概率阈值；

第二获取模块，用于获取所述消费水平维度数据与各个预设分类中心点的距离和距离阈值；

确定模块，用于依据所述概率、所述概率阈值、所述距离和所述距离阈值采用预设的确定规则确定所述航司旅客属于的第二目标分类，其中，所述第二目标分类为第三预设数量的预设分类中的任意一个，所述第三预设数量大于所述第二预设数量。

上述的装置，可选的，所述预设的分类模型为高斯混合分类模型。

上述的装置，可选的，还包括：

服务获取模块，用于获取与所述第一目标分类对应的待推荐服务；

推荐模块，用于将所述待推荐服务推荐给所述航司旅客。

与现有技术相比，本发明包括以下优点：

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例公开的一种航司旅客的群体划分方法流程图；

图2为本申请实施例公开的一种航司旅客的群体划分装置结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

本发明公开了一种航司旅客的群体划分方法及装置，应用于将航司旅客分配到对应的分类中，现有技术中，机场以及航空公司对航司旅客的类别划分基本上是判断航司旅客是否为某航空公司的VIP来进行服务，这种方式有以下缺点：

1.使用到的旅客数据信息过于单一，无法深度挖掘旅客的消费习惯偏好。

2.只关注高端旅客的服务，忽略了对经济型旅客的类别标注，无形中减少了很多利润。

3.航空公司对于新用户，只考虑其当前是否是VIP身份，不考虑该用户之前的购票和消费记录，无法对其精准营销，影响了新用户的体验。

4.对于用户消费习惯的转变不敏感，无法分析用户消费习惯转变趋势，无法及时进行有效的服务推送。

传统的聚类方法普遍使用k临近算法(knn)或者是k均值算法(k-means) 进行聚类，但是这种传统的聚类方法有几个缺点：迭代过程相对缓慢(knn)、计算量大(knn)、样本不平衡时，对稀有类别的预测准确率低(knn，k-means)、对噪声比较敏感(k-means)和只能得到局部最优解(k-means)等问题，基于上述的问题，本发明提供了一种航司旅客的群体划分方法，所述划分方法的执行流程如图1所示，包括步骤：

S101、当接收航司旅客的分类请求时，获取所述航司旅客的预设时长内的数据信息，其中，所述数据信息包括：是否为VIP、购票总价、飞行总里程、乘坐不同舱位次数、机票平均折扣率、购票频率、使用航司付费服务次数和每次出行航班的准点率；

本发明实施例中，所述预设时长可以基于经验或者具体情况进行设定，所述预设时长可以为一个月，一个季度或者一年等，本发明实施例中，以所述预设时长为一个季度为例进行说明，以季度为单位获取所述旅客的数据信息，所述数据信息为多维度的航司旅客消费属性信息。所述数据信息包括：是否为VIP、购票总价、飞行总里程、乘坐不同舱位次数、机票平均折扣率、购票频率、使用航司付费服务次数和每次出行航班的准点率，其中，所述基本信息可以存储在数据库中或者指定位置，优选的还可以获取所述航司用户的基本信息，所述基本信息包括：姓名，性别，年龄以及常住地等。

S102、将所述数据信息转换为第一预设数量的消费水平维度数据；

本发明实施例中，基于所述数据信息计算第一预设数量的消费水平维度数据，其中，所述第一预设数量的可以基于经验或者具体情况进行设定，本发明实施例中，对所述第一预设数量的具体取值不进行限定，本发明实施例中，以所述第一预设数量为13为例进行说明，则所述第一预设数量的消费水平维度数据包括：

1.是否是某航司的VIP会员

2.航司偏好(乘坐单个航司出行的种类占所有航司种类的25％以上)

3.购票单价(元/1000km)

4.购票单价平均涨幅(可以<0),把本季度相对于上一季度的涨幅累加求平均(追溯到距今两年之前)

5.头等舱和商务舱比率(乘坐头等舱或商务舱占飞行总次数的比例)

6.头等舱和商务舱比率平均涨幅(计算方式同第三个维度)

7.购票频率涨幅(计算方式同第三个维度)

8.使用航司付费服务比率(使用航司付费服务次数占飞行总次数的比例)

9.使用航司付费服务比率涨幅(计算方式同第三个维度)

10.机票平均折扣率

11.高频航线比率

12.航班平均准点率

13.航班平均准点率涨幅(计算方式同第三个维度)

在确定了上述13个用户信息维度之后，需要将所述第一预设数量的消费水平维度数据映射到[0,1]的区间内，对于离散的属性值：用户是否属于VIP，我们将VIP用户的值设为0.8，将非VIP用户设为0.2，对于连续的属性，基于下式实现映射

X’＝(X-Xmin)/(Xmax-Xmin) (1)

其中，X’代表映射之后的值，X代表要映射之前的值，Xmin代表所有样本中该属性的最小值，反之，Xmax代表最大值。(X-Xmin)/(Xmax-Xmin)是介于0到1中的数字。

进一步的，针对上述消费水平维度数据具体的处理过程如下:

如果该用户是某航司会员，该用户的航司VIP维度值为0.8，反之则为0.2

如果该用户乘坐某航司的次数占所有出行次数的25％以上，则该用户的航司维度为0.6，反之则为0.4

计算每个用户的平均购票单价，取最近一个季度的购票数据信息做计算，用机票总价/总飞行里程(单位：元/1000km)，使用(X-Xmin)/(Xmax-Xmin) 将每个用户的购票单价映射到[0,1]区间内。

计算每个用户最近两年内相邻两个季度的机票单价涨幅，最后取平均，并映射到[0,1]区间内

计算该用户乘坐头等舱或商务舱占飞行总次数的比例，结果在[0,1]区间内

计算每个用户最近两年内相邻两个季度的头等舱或商务舱占飞行次数比例的涨幅，最后取平均，并映射到[0,1]区间内

计算每个用户最近两年内相邻两个季度的购票频率涨幅，最后取平均，并映射到[0,1]区间内

计算该用户使用航司付费服务次数占飞行总次数的比例，结果在[0,1]区间内

计算每个用户最近两年内相邻两个季度使用航司付费服务次数占飞行总次数的比例的涨幅，最后取平均，并映射到[0,1]区间内

收集该用户购买的最近一季度内的所有机票的折扣率的平均，结果在[0,1] 区间内

如果该用户在一季度中飞行同一航线(北京-沈阳和沈阳-北京属于同一航线)的次数大于两次，则该用户的高频航线维度值为0.6，反正则为0.4

获取该用户最近一季度内乘坐过的所有航班的准点率并取平均，结果在 [0,1]区间内

计算每个用户最近两年内相邻两个季度航班平均准点率的涨幅，最后取平均，并映射到[0,1]区间内

进一步的，对于在某一季度没有出行(未产生消费记录)的旅客，在上述第3、5、8、12维度中按季度以衰减比例进行衰减，第4、6、9、13维度上的值也按相应的衰减比例随之减少，衰减比例可以基于经验或者具体情况进行设定，本发明实施例中，对衰减比例的具体取值不进行限定，优选的，所述衰减比例为r＝10％。以上述的第12个维度为例：假设用户在某季度a的平均航班准点率为60％，在第a+1季度中，如果该用户没有出行记录，则该用户在(a+1)季度中的平均航班准点率为60％*(1-10％)＝54％。

S103、将所述消费水平维度数据传递给预设的分类模型进行分类，得到所述航司旅客属于第二预设数量的预设分类的概率，其中，所述预设的分类模型基于历史数据信息进行训练得到；

本发明实施例中，所述预设的分类模型为高斯混合分类模型GMM，GMM 算法模型基于高斯分布，高斯分布符合客消费分布客观规律。其中，

高斯分布：

公式(2)中，μ为样本集的均值，σ^2为样本的方差

GMM似然函数，本聚类的目的就是最大化似然：

公式(3)中，每个样本可以看作是多个高斯分布叠加而成，xi代表每个样本，公式中的μk和vark分别是第k个高斯分布的均值和方差，Wk代表权重，目是求出Wk、μk以及vark使得公式最大化。

更新样本对于每个簇的隶属度(概率)(不断迭代)：

公式(4)中，分子中的μm和varm代表第m个高斯模型的均值和方差。

更新GMM模型的均值(不断迭代)：

公式(5)中，Wi,m代表第i个样本在第m个高斯模型中的权重，X代表第 i个样本。

更新GMM模型的方差(不断迭代)：

公式(6)中，μm代表第m个高斯模型的均值。

针对所述高斯混合分类模型，在对所述高斯混合分类模型进行训练之前，编码实现GMM聚类，配置模型参数如下：

cluster_number：本参数是GMM算法中聚类的个数，需要提前确定，在本发明实施例中，cluster_number的值为4。

dimensions：第二步特征工程中的提取出的旅客消费维度(13个维度)

points_number：参与聚类的样本点的个数。

means：一个cluster_number*dimensions大小的数组，用来存放每个高斯分布的初始化均值(在本专利中随机取值)。

variances：一个cluster_number*dimensions大小的数组，存放每个高斯分布的方差，为了过程简便，本发明实施例中，假设协方差矩阵都是对角矩阵。

weight：一个points_number*cluster_number大小的数组，存放每个点分别属于每一类的概率。

Pi：一个[1*cluster_number]大小的数组，用来存放每一簇的比重，可以根据weight求得，在初始化时Pi＝[1/4,1/4,1/4，1/4]。

配置完成后，进行训练，GMM模型的主要目的是使用条件概率模型(公式4)来更新weight。基于更新的weight来更新均值means和方差variances。

迭代阶段：首先判断是否收敛，判断过程如下：预先设置第一迭代次数和第二迭代次数，所述第一迭代次数和所述第二迭代次数可以基于经验或者具体情况进行设定，以所述第一迭代次数为5，所述第二迭代次数为100为例进行说明，当迭代次数达到所述第一迭代次数时，验证是否收敛，若是，停止迭代，反之，继续迭代，若直至所述第二迭代次数还未收敛，则停止迭代，判定算法收敛，则所述预设的分类模型训练完成，返回聚类结果。高斯混合聚类不同于其他聚类方法，会计算样本属于每个簇的概率，取概率最大的簇用于该样本的类别标注。

训练完成后，将所述消费水平维度数据传递给预设的分类模型进行分类，得到所述航司旅客属于第二预设数量的预设分类的概率，其中，所述第二预设数量可以基于经验或者具体情况进行设定，本发明实施例中，以所述第二预设数量为4进行说明，在所述预设分类包括：高端型旅客、经济型旅客、消费水平增长型旅客、消费水平下降型旅客。上述预设分类的确定过程如下：第一类航司旅客在上述十三个维度中的第一个维度(是否为某航司的VIP会员)、第三个维度(购票单价)、第五个维度(头等舱和商务舱占比)、第八个维度(使用航司付费服务比率)和第十二个维度(航班平均准点率)上的均值(对整个类别中的所有旅客求均值)高于其他三个类别，因此我们将第一类旅客标记为高端型旅客；第二类旅客在第一、三、五、八和第十二个维度中的均值(对整个类别中的所有旅客求均值)低于其他三个类别，因此我们第二类旅客标记为经济型旅客。在余下的两个类别中，第三类旅客在上述十三个维度中的第四个维度(购票单价的平均涨幅)、第六个维度(头等舱和商务舱的平均涨幅)、第七个维度(购票频率涨幅)、第九个维度(使用航司付费服务比例涨幅)、第十三个维度(航班平均准点率涨幅)上的均值(对整个类别中的所有旅客求均值)高于第四个类别，因此我们将第三类旅客标记为消费水平增长型旅客；余下的第四个类别则标记为消费水平下降型旅客。基于上述的确定过程，采用GMM模型确定所述航司旅客属于每一个预设分类的概率。

S104、将各个概率中最大值对应的预设分类作为第一目标分类，将所述航司旅客划分为所述第一目标分类。

本发明实施例中，遍历各个概率，将所述各个概率中最大值对应的预设分类作为第一目标分类，将所述航司旅客划分为所述第一目标分类。

本发明公开了一种航司旅客的群体划分方法，包括：当接收航司旅客的分类请求时，获取航司旅客的预设时长内的数据信息，数据信息包括：是否为VIP、购票总价、飞行总里程、乘坐不同舱位次数、机票平均折扣率、购票频率、使用航司付费服务次数和每次出行航班的准点率；将数据信息转换为第一预设数量的消费水平维度数据；将消费水平维度数据传递给预设的分类模型进行分类，得到航司旅客属于第二预设数量的预设分类的概率，将各个概率中最大值对应的预设分类作为第一目标分类，将所述航司旅客划分为所述第一目标分类。上述方法，基于不同的数据信息进行分类，数据信息中存在与消费和购票相关数据，可以实现对航司旅客消费习惯的分析。

进一步的，基于上述的群体划分方法，采用以下规则，从聚类的结果中进行数据分析和信息提取，规则如下：

规定类别名称(参照配置模型参数中簇的顺序)：c1,c2,c3,c4

规定单个样本属于每个簇的概率(参照配置模型参数中簇的顺序)：r1,r2, r3,r4

规定单个样本属于每个簇的概率阀值(参照配置模型参数中簇的顺序)： R1，R2，R3，R4

规定单个样本距离每个簇的中心点的距离(参照配置模型参数中簇的顺序)：d1,d2,d3,d4

规定单个样本距离每个簇的中心点的距离阀值(参照配置模型参数中簇的顺序)：D1,D2,D3,D4

(1)规定一个总体概率的阀值R＝30％，其中，阈值可以基于经验或者具体情况进行设定，本发明实施例中不作具体限定，用于类别模糊判断，如果样本所在簇的概率r1/r2/r3/r4<R,则判别为模糊型用户。

(2)如果样本被归类为c3或c4，则该用户可被标注为消费增长型或消费降低型用户，但是由于部分用户消费增长率或降低率过高，影响对其消费状态判断，引入以下规则继续进行标注。

(3)在(2)的基础上，我们规定R1＝R2＝30％，如果样本属于c1的概率r1>R1或样本属于c2的概率r2>R2，则该用户被标注为高端消费增长/降低型用户或经济消费增长/降低型用户。

(4)如果不满足(2)的条件，在(2)的基础上，规定D1＝D2＝1/2*D,D 为样本距离每个cluster中心(除该样本所在的cluster)的平均距离，,本发明实施例中，对D1和D2的具体计算方式不进行限定，如果样本与c1中心点的距离d1<D1或样本与c2中心点的距离d2<D2(采用欧式距离计算方法)，则该用户被标注为高端消费增长/降低型用户或经济消费增长/降低型用户。

(5)如果不满足(3)和(4)中的条件，在(2)的基础上，如果该用户属于c3类别，则判别为经济消费增长型用户，如果该用户属于c4类别，则判别为高端消费降低型用户，对于旅客消费状态过于模糊的情况，采用此判断规则更加符合大多数的客观消费规律。

(6)如果样本被归类为c1或c2，则该用户可被标注为高端型或经济型用户，但是由于部分用户消费状态特征过高，影响对其消费趋势判断，我们引入以下规则继续进行标注。

(7)在(6)的基础上，规定R3＝R4＝30％，其中，R3和R4可以基于经验或者具体情况进行设定，本发明实施例中不作具体限定，如果样本属于 c3的概率r3>R3或样本属于c4的概率r4>R4，则该用户被标注为高端/经济消费增长型用户或高端/经济消费降低型用户。

(8)如果不满足(7)的条件，在(6)的基础上，规定D3＝D4＝1/2*D,D 为样本距离每个cluster中心(除该样本所在的cluster)的平均距离，本发明实施例中，对D3和D4的具体计算方式不进行限定，如果样本与c3中心点的距离 d3<D3或样本与c4中心点的距离d4<D4(采用欧式距离计算方法)，则该用户被标注为高端/经济消费增长型用户或高端/经济消费降低型用户。

(9)如果不满足(7)和(8)中的条件，在(6)的基础上，如果该用户属于c3类别，则判别为高端消费稳定型用户，如果该用户属于c4类别，则判别为经济消费稳定型用户。

本专利利用高斯混合聚类返回的四个类别结果数据信息，通过上述规则的限定对数据信息进行挖掘，最终将用户的消费类别确定为七(第三预设数量) 类：高端消费增长型用户、高端消费降低型用户、经济消费增长型用户、经济消费降低型用户、高端消费稳定型用户、高端消费稳定型用户和消费模糊型用户。

进一步的，抽取当前时刻最新采样的数据信息，按照前叙特征工程方法处理数据，输入到上述模型中并使用上述规则加以限定，得到最新的航司旅客消费水平标注信息。上述的方法，在GMM算法的基础上充分挖掘更多信息，在消费状态和消费趋势两个维度上对用户进行全方位标注。

进一步的，预先基于经验或者具体情况为每一个预设分类分配待推荐服务，其中，所述待推荐服务包括，机票推荐、酒店推荐或者相关服务推荐等，在确定了第一目标分类或者第二目标分类以后，其中，所述第二目标分类为高端消费增长型用户、高端消费降低型用户、经济消费增长型用户、经济消费降低型用户、高端消费稳定型用户、高端消费稳定型用户和消费模糊型用户中的一个。获取与所述第一目标分类或第二目标分类对应的待推荐服务，将所述待推荐服务推荐给所述航司旅客。

基于上述的一种航司旅客的群体划分方法，本发明实施例中，还提供了一种航司旅客的群体划分装置，所述划分装置的结构框图如图2所示，包括:

信息获取模块201、转换模块202、分类模块203和划分模块204。

其中，

所述信息获取模块201，用于当接收航司旅客的分类请求时，获取所述航司旅客的预设时长内的数据信息，其中，所述数据信息包括：是否为VIP、购票总价、飞行总里程、乘坐不同舱位次数、机票平均折扣率、购票频率、使用航司付费服务次数和每次出行航班的准点率；

所述转换模块202，用于将所述数据信息转换为第一预设数量的消费水平维度数据；

所述分类模块203，用于将所述消费水平维度数据传递给预设的分类模型进行分类，得到所述航司旅客属于第二预设数量的预设分类的概率，其中，所述预设的分类模型基于历史数据信息进行训练得到；

所述划分模块204，用于将各个概率中最大值对应的预设分类作为第一目标分类，将所述航司旅客划分为所述第一目标分类。

本发明公开了一种航司旅客的群体划分装置，包括：当接收航司旅客的分类请求时，获取航司旅客的预设时长内的数据信息，数据信息包括：是否为VIP、购票总价、飞行总里程、乘坐不同舱位次数、机票平均折扣率、购票频率、使用航司付费服务次数和每次出行航班的准点率；将数据信息转换为第一预设数量的消费水平维度数据；将消费水平维度数据传递给预设的分类模型进行分类，得到航司旅客属于第二预设数量的预设分类的概率，将各个概率中最大值对应的预设分类作为第一目标分类，将所述航司旅客划分为所述第一目标分类。上述装置，基于不同的数据信息进行分类，数据信息中存在与消费和购票相关数据，可以实现对航司旅客消费习惯的分析。

本发明实施例中，所述转换模块202包括：

计算单元205和映射单元206。

其中，

所述计算单元205，用于基于所述数据信息计算预设数量的初始消费水平维度数据；

所述映射单元206，用于对每一个初始消费水平数据采用对应的映射方法映射到(0,1]区间，得到所述第一预设数量的消费水平维度数据。

本发明实施例中，所述划分装置还包括：

第一获取模块207、第二获取模块208和确定模块209。

其中，

所述第一获取模块207，用于获取所述消费水平维度数据属于各个预设分类中的概率和概率阈值；

所述第二获取模块208，用于获取所述消费水平维度数据与各个预设分类中心点的距离和距离阈值；

所述确定模块209，用于依据所述概率、所述概率阈值、所述距离和所述距离阈值采用预设的确定规则确定所述航司旅客属于的第二目标分类，其中，所述第二目标分类为第三预设数量的预设分类中的任意一个，所述第三预设数量大于所述第二预设数量。

本发明实施例中，所述划分装置中所述预设的分类模型为高斯混合分类模型。

本发明实施例中，所述划分装置还包括：

服务获取模块210和推荐模块211。

其中，

所述服务获取模块210，用于获取与所述第一目标分类对应的待推荐服务；

所述推荐模块211，用于将所述待推荐服务推荐给所述航司旅客。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

以上对本发明所提供的一种航司旅客的群体划分方法及装置进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种航司旅客的群体划分方法，其特征在于，包括：

将所述数据信息转换为第一预设数量的消费水平维度数据；

2.根据权利要求1所述的方法，其特征在于，将所述数据信息转换为第一预设数量的消费水平维度数据，包括：

基于所述数据信息计算预设数量的初始消费水平维度数据；

3.根据权利要求1所述的方法，其特征在于，还包括：

4.根据权利要求1所述的方法，其特征在于，所述预设的分类模型为高斯混合分类模型。

5.根据权利要求1所述的方法，其特征在于，还包括：

获取与所述第一目标分类对应的待推荐服务；

将所述待推荐服务推荐给所述航司旅客。

6.一种航司旅客的群体划分装置，其特征在于，包括：

7.根据权利要求6所述装置，其特征在于，所述转换模块包括：

映射单元，用于对每一个初始消费水平数据采用对应的映射方法映射到(0,1]区间，得到所述第一预设数量的消费水平维度数据。

8.根据权利要求6所述的装置，其特征在于，还包括：

9.根据权利要求6所述的装置，其特征在于，所述预设的分类模型为高斯混合分类模型。

10.根据权利要求6所述的装置，其特征在于，还包括：

推荐模块，用于将所述待推荐服务推荐给所述航司旅客。