CN110119974A - 一种基于δ-GMM聚类算法的移动套餐智能推送方法 - Google Patents
一种基于δ-GMM聚类算法的移动套餐智能推送方法 Download PDFInfo
- Publication number
- CN110119974A CN110119974A CN201910412381.7A CN201910412381A CN110119974A CN 110119974 A CN110119974 A CN 110119974A CN 201910412381 A CN201910412381 A CN 201910412381A CN 110119974 A CN110119974 A CN 110119974A
- Authority
- CN
- China
- Prior art keywords
- user
- clustering algorithm
- set meal
- cluster
- consumption
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明提供了一种基于δ‑GMM聚类算法的移动套餐智能推送方法,包括S1,提取消费用户的信息进行整理形成样本集以及确定聚类个数;S2根据改进的高斯混合聚类算法对用户进行聚类,所述高斯混合聚类算法中引入δ更新规则,对每一轮迭代后每一簇的个体的后验概率进行去离散化;S3根据聚类结果构建移动套餐智能推送模型。针对用户在每项服务中消费情况对用户的消费特征进行归纳,对进行聚类处理;然后根据聚类结果为每类用户推荐合适的套餐,每类套餐中各项服务消费比重为该类群体各项消费比重的平均值,通过提供不同档次的资费套餐,为用户提供不同口味的消费方案,从而提高用户满意度,比单纯降价更具适应性。
Description
技术领域
本发明属于大数据应用领域,具体涉及一种基于δ-GMM聚类算法的移动套餐智能推送方法。
背景技术
随着我国移动通信的迅猛发展,手机用户对运营商提供的服务有了各种各样的需求,特别是数据流量及语音通话时长的需求,不同年龄行业的人相关需求不同。因此移动通信的项目设置及资费设置一直是通信行业关注的焦点与难点。资费套餐通过将通话时间、超值服务、月租费、短信、彩信、彩铃、手机上网、手机邮箱等组合,为用户提供了如接听免费、免费手机套餐绑定、赠送话费等各种套餐服务。它要求更为全面和深入的市场细分,以实现向不同的用户群提供适合其需要的不同种类的电信业务的组合。其范围可以是不同电信业务的组合,也可以是电信业务与终端产品的组合,比如联通推出的业务与组合捆绑销售,以及移动推出的“手机大礼包”等。由于消费习惯、消费数量、价格承受力的差异,用户存在不同层次的消费需求,通信企业通过提供不同档次的资费套餐,为用户提供不同口味的消费方案,从而提高用户满意度,比单纯降价更具适应性。
发明内容
为达到上述技术目的,本发明提供了一种基于δ-GMM聚类算法的移动套餐智能推送方法,解决了背景技术中的问题。
一种基于δ-GMM聚类算法的移动套餐智能推送方法包括,所述方法包括:
S1,提取消费用户的信息进行整理形成样本集以及确定聚类个数;
S2,根据改进的高斯混合聚类算法对用户进行聚类,所述高斯混合聚类算法中引入δ更新规则,对每一轮迭代后每一簇的个体的后验概率进行去离散化;
S3,根据聚类结果构建移动套餐智能推送模型。
其特征在于,所述步骤S1包括:
S11,提取用户的身份信息和消费信息作为δ-GMM聚类算法的输入,准备样本集D={x1,x2,x3,x4,…,xm};
S12,初始化δ-GMM模型参数{(αi,μi,∑i)|1≤i≤k},其中αi是混合系数,μi与∑i是第i个混合分布的参数,k表示混合分布个数。
优选的,所述身份信息包括年龄、性别、职业和所在地区中的至少一种;所述消费信息包括通话时长、超值服务、月租费、短信、彩铃、彩信、网络流量、手机邮箱和积分兑换中的至少一种。
优选的,所述步骤S2包括:
S21,依次计算每个样本由各个混合成分生成的后验概率;
S22,判断是否完成对样本集中所有样本由各个混合成分生成的后验概率的计算;
S23,计算混合成分i(i∈{1,2,…,k}的新均值向量μ′i,新的协方差矩阵∑′i及新的混合系数α′i;
S24,判断是否完成所有混合成分新参数的计算;
S25,计算此时模型的似然函数值LL(D),表达式如下:
S26,更新模型参数,用新的参数替换,计算参数更新后的模型的似然函数值L(D);
S27,判断似然函数LL(D)与L(D),即似然函数值是否停止增长,直至LL(D)与L(D)。
优选的,步骤S23中新的混合系数α′i采用δ规则,通过去除每个样本由各个混合成分生成的后验概率的最大与最小值,计算剩余后验概率的平均值作为更新的混合系数,新的混合系数α′i的表达式为:
其中
γji为随机变量zj的后验分布。
优选的,所述步骤S3具体为:
S31,将样本集中的样本根据标记规则进行簇标记;
S32,输出簇划分C={C1,C2,…,Ck},簇C中每一簇代表一类用户群体;
S33,对每一类用户群体Cj中的通信服务项目的消耗量进行求均值记为其中1≤j≤k;
S34,输出针对每一类用户Cj形成的套餐Δj,其中1≤j≤k。
本发明具有如下优点或有益效果:
1)本发明提供的一种基于δ-GMM聚类算法的移动套餐智能推送方法,对高斯混合模型的混合系数更新方式进行改进,引入δ更新规则,对每一轮迭代后每一簇的个体的后验概率进行去离散化,即去掉最大值与最小值,计算剩余后验概率的平均值,并更新混合系数,去除噪音数据对聚类的影响,准确率高;
2)选择各个维度的平均值作为代表值,构建基于改进的高斯混合模型聚类的通讯运营服务套餐智能推送模型,实现对特定用户人群的个性化套餐推送,从而提高用户满意度,比单纯降价更具适应性。
附图说明
图1为本发明中的一种基于δ-GMM聚类算法的移动套餐智能推送方法的示意图;
图2为本发明中的一种基于δ-GMM聚类算法的移动套餐智能推送方法的流程图。
具体实施方式
为了能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。
为了最大化实现通信运营商与移动用户之间二者双赢的目的,使得运营商提供的服务套餐能更贴近用户的需求,本文对用户消费项目包括将通话时间、超值服务、月租费、短信、彩信、彩铃、手机上网、手机邮箱以及用户自身特征如年龄、性别、职业等进行关联,并对各用户进行聚类分析。由于消费习惯、消费数量、价格承受力的差异,用户存在不同层次的消费需求,通信企业通过提供不同档次的资费套餐,为用户提供不同口味的消费方案,从而提高用户满意度,比单纯降价更具适应性,该问题可由图1所示。通过对用户进行聚类,在进一步分析群体的消费特征,计算各项服务在该类群体中平均值,进而得出针对特定用户的套餐将其推荐给该类用户。
本发明提供的一种基于高斯混合模型聚类的套餐推送方法,包括以下内容:
1)对高斯混合聚类算法进行改进(δ-GMM)
δ-GMM在高斯混合(GMM)聚类算法利用EM算法更新参数过程中引入混合系数更新方式δ,不同于标准GMM中使用簇中个体后验概率平均值作为下一轮迭代的混合系数,在本发明中,将利用规则δ去除离散个体后计算得到后验概率平均值作为新的混合系数;
本文提出利用改进的高斯混合聚类算法(δ-GMM)对用户进行聚类,分析每类用户的资费特征,包括流量、语音、短信、积分兑换、流量优惠等消费习惯,总结消费规律。在标准高斯混合聚类算法(Gaussian misture model,GMM)中其概率分布模型如下所示:
其中αi是混合系数,p(x|μi,∑i)是高斯分布密度,k表示混合分布个数,μi与∑i是第i个混合分布的参数。另随机变量zj∈{1,2,…,k}表示样本xj属于高斯混合分布中的zj,取值未知。zj的先验概率对应αi,则由贝叶斯定理,zj的后验分布用γji表示,其表达式如下:
当参数确定完后,对样本集中每个样本xi进行簇标记,记为λj,其表达式如下:
在原算法中利用EM算法进行模型参数更新时,新的混合系数α′i的更新规则如下:
上述更新规则并未考虑噪音数据对聚类的影响,本发明针对混合系数αi的更新规则进行了改进,采用规则δ进行混合系数更新,δ规则具体内容如下:
通过去除每个样本由各个混合成分生成的后验概率中最大与最小值,计算剩余后验概率的平均值作为更新的混合系数,相关表达式如下:
2)利用改进的高斯混合算法构建套移动套餐智能推送模型
选择聚类算法中高斯混合聚类算法进行改进并构建δ-GMM移动套餐智能推送模型,模型流程图如图2所示。
具体步骤如下:
步骤1:准备样本集D={x1,x2,…,xm},高斯混合成分个数;初始化δ-GMM模型参数{(αi,μi,∑i)|1≤i≤k};
步骤2:判断是否完成对样本集中所有样本由各个混合成分生成的后验概率的计算,即是否j<=m,若是则执行下一步,否则执行步骤5;
步骤3:计算当前样本由各个混合成分生成的后验概率;
步骤4:更新j,j++,返回步骤2;
步骤5:判断是否完成所有混合成分新参数的计算,即是否i<=k,若是则执行下一步,否则执行步骤8;
步骤6:计算混合成分i(i∈{1,2,…,k}的新均值向量μ′i,新的协方差矩阵∑′i及新的混合系数α′i,其中混合系数由δ规则得到;表达式分别如下所示:
步骤7:更新i,i++,返回步骤5;
步骤8:计算此时模型的似然函数值LL(D),表达式如下:
步骤9:更新模型参数,用新的参数替换,计算参数更新后的模型的似然函数值L(D);
步骤10:判断似然函数LL(D)>L(D),即似然函数值是否停止增长,若是则执行下一步,否则执行步骤2;
步骤11:将样本集中的样本根据标记规则进行簇标记:
步骤12:输出簇划分C={C1,C2,…,Ck}。
步骤13:簇C中每一簇代表一类用户群体,对每一类用户群体Cj中的通信服务项目的消耗量进行求均值记为其中1≤j≤k;
步骤2.14:输出针对每一类用户Cj形成的套餐Δj,其中1≤j≤k。
通过实验结果表明,采用改进的高斯混合聚类算法能够较好的依据用户自身及消费特征对手机互联网用户进行聚类,且准确率较高;同时通过计算每类用户群体个服务项目平均消耗量,帮助通信企业通过提供不同档次的资费套餐,为用户提供不同口味的消费方案,从而提高用户满意度,比单纯降价更具适应性。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于δ-GMM聚类算法的用户通讯服务套餐智能推送方法,其特征在于,所述方法包括:
S1,提取消费用户的信息进行整理形成样本集以及确定聚类个数;
S2,根据改进的高斯混合聚类算法对用户进行聚类,所述高斯混合聚类算法中引入δ更新规则,对每一轮迭代后每一簇的个体的后验概率进行去离散化;
S3,根据聚类结果构建移动套餐智能推送模型。
2.根据权利要求1所述的一种基于δ-GMM聚类算法的移动套餐智能推送方法,其特征在于,所述步骤S1包括:
S11,提取用户的身份信息和消费信息作为聚类高斯算法的输入,准备样本集D={x1,x2,x3,x4,…,xm};
S12,初始化δ-GMM模型参数{(αi,μi,∑i)|1≤i≤k},其中αi是混合系数,μi与∑i是第i个混合分布的参数,k表示混合分布个数。
3.根据权利要求2所述的一种基于δ-GMM聚类算法的移动套餐智能推送方法,其特征在于,所述身份信息包括年龄、性别、职业和所在地区中的至少一种;所述消费信息包括通话时长、超值服务、月租费、短信、彩铃、彩信、网络流量、手机邮箱和积分兑换中的至少一种。
4.根据权利要求1所述的一种基于δ-GMM聚类算法的移动套餐智能推送方法,其特征在于,所述步骤S2包括:
S21,依次计算每个样本由各个混合成分生成的后验概率;
S22,判断是否完成对样本集中所有样本由各个混合成分生成的后验概率的计算;
S23,计算混合成分i(i∈{1,2,…,k}的新均值向量μ′i,新的协方差矩阵∑′i及新的混合系数α′i;
S24,判断是否完成所有混合成分新参数的计算;
S25,计算此时模型的似然函数值LL(D),表达式如下:
S26,更新模型参数,用新的参数替换,计算参数更新后的模型的似然函数值L(D);
S27,判断似然函数LL(D)与L(D),即似然函数值是否停止增长,直至LL(D)与L(D)。
5.根据权利要求4所述的一种基于δ-GMM聚类算法的移动套餐智能推送方法,其特征在于,步骤S23中新的混合系数α′i采用δ规则,通过去除每个样本由各个混合成分生成的后验概率的最大与最小值,计算剩余后验概率的平均值作为更新的混合系数,新的混合系数α′i的表达式为:
其中
γji为随机变量zj的后验分布。
6.根据权利要求1所述的一种基于δ-GMM聚类算法的移动套餐智能推送方法,其特征在于,所述步骤S3具体为:
S31,将样本集中的样本根据标记规则进行簇标记;
S32,输出簇划分C={C1,C2,…,Ck},簇C中每一簇代表一类用户群体;
S33,对每一类用户群体Cj中的通信服务项目的消耗量进行求均值记为其中1≤j≤k;
S34,输出针对每一类用户Cj形成的套餐Δj,其中1≤j≤k。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910412381.7A CN110119974B (zh) | 2019-05-17 | 2019-05-17 | 一种基于δ-GMM聚类算法的移动套餐智能推送方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910412381.7A CN110119974B (zh) | 2019-05-17 | 2019-05-17 | 一种基于δ-GMM聚类算法的移动套餐智能推送方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110119974A true CN110119974A (zh) | 2019-08-13 |
CN110119974B CN110119974B (zh) | 2022-07-05 |
Family
ID=67522647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910412381.7A Active CN110119974B (zh) | 2019-05-17 | 2019-05-17 | 一种基于δ-GMM聚类算法的移动套餐智能推送方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110119974B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898954A (zh) * | 2020-07-31 | 2020-11-06 | 沙师弟(重庆)网络科技有限公司 | 一种基于改进高斯混合模型聚类的车辆匹配方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636496A (zh) * | 2015-03-04 | 2015-05-20 | 重庆理工大学 | 基于高斯分布和距离相似度的混合聚类的推荐方法 |
US9058611B2 (en) * | 2011-03-17 | 2015-06-16 | Xerox Corporation | System and method for advertising using image search and classification |
CN107545471A (zh) * | 2017-09-19 | 2018-01-05 | 北京工业大学 | 一种基于高斯混合的大数据智能推荐方法 |
CN108627241A (zh) * | 2018-05-11 | 2018-10-09 | 西安理工大学 | 一种基于高斯混合模型的宽吻海豚click信号检测方法 |
CN109218034A (zh) * | 2018-08-24 | 2019-01-15 | 曹春江 | 基于多角度神经网络模型的通信用户套餐精准推荐方法 |
-
2019
- 2019-05-17 CN CN201910412381.7A patent/CN110119974B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9058611B2 (en) * | 2011-03-17 | 2015-06-16 | Xerox Corporation | System and method for advertising using image search and classification |
CN104636496A (zh) * | 2015-03-04 | 2015-05-20 | 重庆理工大学 | 基于高斯分布和距离相似度的混合聚类的推荐方法 |
CN107545471A (zh) * | 2017-09-19 | 2018-01-05 | 北京工业大学 | 一种基于高斯混合的大数据智能推荐方法 |
CN108627241A (zh) * | 2018-05-11 | 2018-10-09 | 西安理工大学 | 一种基于高斯混合模型的宽吻海豚click信号检测方法 |
CN109218034A (zh) * | 2018-08-24 | 2019-01-15 | 曹春江 | 基于多角度神经网络模型的通信用户套餐精准推荐方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898954A (zh) * | 2020-07-31 | 2020-11-06 | 沙师弟(重庆)网络科技有限公司 | 一种基于改进高斯混合模型聚类的车辆匹配方法 |
CN111898954B (zh) * | 2020-07-31 | 2024-01-12 | 沙师弟(重庆)网络科技有限公司 | 一种基于改进高斯混合模型聚类的车辆匹配方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110119974B (zh) | 2022-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105007171B (zh) | 基于通信领域大数据的用户数据分析系统及方法 | |
CN110097066A (zh) | 一种用户分类方法、装置及电子设备 | |
CN109345263A (zh) | 预测客户满意度的方法和系统 | |
CN103150696A (zh) | 选择目标增值业务潜在客户的方法及装置 | |
Lim et al. | Forecasting 3G mobile subscription in China: A study based on stochastic frontier analysis and a Bass diffusion model | |
CN106341312A (zh) | 社交信息显示方法、系统和服务器 | |
CN109359868A (zh) | 一种电网用户画像的构建方法及系统 | |
CN106776859A (zh) | 基于用户偏好的移动应用App推荐系统 | |
CN110347675A (zh) | 一种数据存储方法及装置 | |
CN103325067A (zh) | 基于用电客户细分的服务推送方法和系统 | |
CN101110877A (zh) | 一种实现综合计费的方法及系统 | |
CN110119974A (zh) | 一种基于δ-GMM聚类算法的移动套餐智能推送方法 | |
Wellmann | Are OTT messaging and mobile telecommunication an interrelated market? An empirical analysis | |
CN111556205A (zh) | 一种用于对目标用户推荐电信产品的方法及系统 | |
CN108632088B (zh) | 业务处理方法、装置及服务器 | |
CN109978575A (zh) | 一种挖掘用户流量经营场景的方法及装置 | |
CN106714202A (zh) | 一种网络容量优化方法及装置 | |
Konnov et al. | Two-level decomposition method for resource allocation in telecommunication network | |
Zhao et al. | Improved K-Means cluster algorithm in telecommunications enterprises customer segmentation | |
Kumar et al. | Diffusion of mobile communications: Application of bass diffusion model to BRIC countries | |
CN109785050A (zh) | 一种云端生产资源匹配推荐方法及装置 | |
CN104734898B (zh) | 一种基于社交网络分析的业务推荐方法和系统 | |
Fraihat et al. | An efficient enhanced k-means clustering algorithm for best offer prediction in telecom | |
CN103107936B (zh) | 一种发送信息的方法及装置 | |
CN106330745B (zh) | 流量策略选择方法和流量策略选择装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A method based on d- Intelligent push method for mobile package based on GMM clustering algorithm Effective date of registration: 20230719 Granted publication date: 20220705 Pledgee: Wuhan area branch of Hubei pilot free trade zone of Bank of China Ltd. Pledgor: WUHAN ZHONGCHENG HUAXIN TECHNOLOGY Co.,Ltd. Registration number: Y2021420000149 |