CN108960922A - 终端的更换预测方法及装置 - Google Patents

终端的更换预测方法及装置 Download PDF

Info

Publication number
CN108960922A
CN108960922A CN201810742982.XA CN201810742982A CN108960922A CN 108960922 A CN108960922 A CN 108960922A CN 201810742982 A CN201810742982 A CN 201810742982A CN 108960922 A CN108960922 A CN 108960922A
Authority
CN
China
Prior art keywords
user data
data sample
machine learning
classification model
learning classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810742982.XA
Other languages
English (en)
Inventor
刘楠
魏进武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201810742982.XA priority Critical patent/CN108960922A/zh
Publication of CN108960922A publication Critical patent/CN108960922A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种终端的更换预测方法及装置。该方法包括:将用户数据样本的各个特征维度进行预处理,得到预处理后的用户数据样本;预处理后的用户数据样本的各个特征维度具有相同的类别特征模式;将预处理后的用户数据样本进行特征筛选处理以及异常数据剔除处理,得到处理后的用户数据样本;根据处理后的用户数据样本以及机器学习分类模型的评价指标,从至少一个机器学习分类模型中选取一个机器学习分类模型作为预测模型;根据用户数据和预测模型,得到用户数据对应的用户的换机频率。本发明实施例可以预先获取到在网用户终端更换的可能时间窗口,能够快速有效的找出终端换机的潜在用户,缩小了营销用户群体数量,减少了营销成本。

Description

终端的更换预测方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种终端的更换预测方法及装置。
背景技术
作为移动业务的载体,终端是新增市场的开发、存量市场的维系、以及数据及业务发展的一个重要切入点。若能对用户终端偏好(换机时间、品牌、型号等)进行分析,并快速有效的找出终端换机的潜在用户进行精准营销,对电信运营商带来“以点带面”存量经营价值提升的发展非常有益。
发明人在实现本发明的过程中发现,传统方式下,终端营销主要依赖“等靠思想”,即用户到店进行咨询终端资费信息、套餐业务、捆绑优惠等信息的时候,营业人员才进行终端换机业务的推荐。此外,电信营业厅不定期或节假日举办促销活动,通过拉横幅、发传单以及在门店附近的路边通过“引流路人”的方式进行终端换机导购。
因此,为了实现对终端换机的潜在用户进行精准营销,如何根据用户数据进行终端更换预测是本领域技术人员亟需解决的技术问题。
发明内容
本发明提供一种终端的更换预测方法及装置,以实现根据用户数据进行终端更换频率的预测。
第一方面,本发明提供一种终端的更换预测方法,包括:
将用户数据样本的各个特征维度进行预处理,得到预处理后的用户数据样本;所述预处理后的用户数据样本的各个特征维度具有相同的类别特征模式;
将所述预处理后的用户数据样本进行特征筛选处理以及异常数据剔除处理,得到处理后的用户数据样本;
根据所述处理后的用户数据样本以及机器学习分类模型的评价指标,从至少一个机器学习分类模型中选取一个机器学习分类模型作为预测模型;
根据用户数据和所述预测模型,得到所述用户数据对应的用户的换机频率。
第二方面,本发明提供一种终端的更换预测装置,包括:
预处理模块,用于将用户数据样本的各个特征维度进行预处理,得到预处理后的用户数据样本;所述预处理后的用户数据样本的各个特征维度具有相同的类别特征模式;
数据处理模块,用于将所述预处理后的用户数据样本进行特征筛选处理以及异常数据剔除处理,得到处理后的用户数据样本;
模型建立模块,用于根据所述处理后的用户数据样本以及机器学习分类模型的评价指标,从至少一个机器学习分类模型中选取一个机器学习分类模型作为预测模型;
预测模块,用于根据用户数据和所述预测模型,得到所述用户数据对应的用户的换机频率。
本发明实施例提供的终端的更换预测方法及装置,将用户数据样本的各个特征维度进行预处理,得到预处理后的用户数据样本;所述预处理后的用户数据样本的各个特征维度具有相同的类别特征模式;将所述预处理后的用户数据样本进行特征筛选处理以及异常数据剔除处理,得到处理后的用户数据样本;根据所述处理后的用户数据样本以及机器学习分类模型的评价指标,从至少一个机器学习分类模型中选取一个机器学习分类模型作为预测模型;根据用户数据和所述预测模型,得到所述用户数据对应的用户的换机频率,可以预先获取到在网用户终端更换的可能时间窗口,能够快速有效的找出终端换机的潜在用户,缩小了营销用户群体数量,减少了营销成本,预测准确率较高。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本发明提供的终端的更换预测方法一实施例的流程示意图;
图2是本发明提供的终端的更换预测方法另一实施例的流程示意图;
图3是本发明提供的终端的更换预测装置一实施例的结构示意图;
图4是本发明提供的电子设备实施例的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的方法和装置的例子。
本发明的说明书和权利要求书及所述附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先对本发明所涉及的名词和场景进行介绍:
终端是指用户通信所使用的智能或非智能手机设备。
终端更换预测是进行产品分析和终端产品营销的新手段,本发明实施例中的方法利用已有的用户属性(如性别、年龄等)、终端属性(如手机品牌等)、历史换机情况等用户数据对可能存在换机需求的用户进行换机频率预测。
图1是本发明提供的终端的更换预测方法一实施例的流程示意图。如图1所示,本实施例提供的方法,包括:
步骤101、将用户数据样本的各个特征维度进行预处理,得到预处理后的用户数据样本;所述预处理后的用户数据样本的各个特征维度具有相同的类别特征模式。
本步骤中,首先获取到用户数据样本,对用户数据样本的各个特征维度进行预处理。下表1中示出了用户数据样本包括的特征维度(即数据字段)。
每一个用户数据样本对应一个用户的特征,包括年龄、性别、收入、流量、城市和IMEI。
表1用户数据样本包括的数据字段
字段 说明
USERID 标识用户的唯一编码
AGE 年龄(单位:岁)
GENDER 性别:(1、男性,2、女性)
INCOME 月收入(单位:元)
TRAFFIC_UP 上行流量(单位:bytes)
TRAFFIC_DOWN 下行流量(单位:bytes)
CITY 城市
PHONE_BRAND 手机品牌
FREQUENCY 换机频率(单位:天/次)
IMEI 终端IMEI码
在预处理之前还可以进行如下处理:
可以将用户数据样本中的各个特征维度的数据转化为可操作运算的数据类型。其中的数值文本信息(如年龄、收入、流量)转化为浮点数数值特征;其中的非数值特征(如性别、城市、IMEI等),如性别和城市为类别信息,用离散数值代表其类别,IMEI特征可以转化为新的可计算特征。具体通过另一张IMEI价格对应表(该表中包括其他辅助数据:每款终端对应的具体信息),即将IMEI特征变更转化为终端价格、品牌变更等特征,两个终端价格可衍生出平均价格、换机差价、当前手机价格等特征,品牌则看作一个类别特征。
可选的,步骤101具体可以通过如下方式实现:
通过特征多项式组合增加所述用户数据样本的特征维度;
将所述用户数据样本中的各个特征维度的特征模式转化为类别特征模式,并对所述各个特征维度进行编码,得到所述预处理后的用户数据样本;所述预处理后的用户数据样本中的用户数据分别对应一个特征向量。
具体的,受限于用户数据样本中的数据字段有限、特征维度较少,因此可以增加特征维度。
具体可以通过特征多项式组合,将各维度的特征互相组合产生新特征,例如,若将收入分为高中低三档,终端价格也为高中低三档,则它们的组合特征就有9种特征维度,有效丰富了特征维度。
在增加了特征维度后,可以对各个特征维度的特征模式进行统一。由于用户数据样本中的特征既有连续数值特征,又有类别特征,且类别特征若转化为数值将无意义(如城市、品牌),为了统一用户数据样本中各个特征维度的特征模式,可以将所有特征维度的特征模式均转换为类别特征模式,如下表2所示。并且对各个特征维度进行特征编码,如采用onehot编码。
表2
在一些实施方式中在特征编码之前还可以对缺失值进行补充,由于缺失在数据分析中是频繁出现的,处理过程中首先确定缺失的种类,是完全随机缺失、随机缺失、完全非随机缺失,进而选择缺失值的处理方法为补缺或是仅作为一种状态。
预处理之后得到了特征维度较大的特征向量,如得到一个特征维度7000+的特征向量X。由于采用了特征编码的方式,又进行了多项式组合,故该特征向量十分稀疏,大部分维度都是冗余或是无特征意义的,故还需要进行进一步处理,参见步骤102。
步骤102、将所述预处理后的用户数据样本进行特征筛选处理以及异常数据剔除处理,得到处理后的用户数据样本。
本步骤中,将预处理之后的用户数据样本进行特征筛选处理,例如使用决策树预拟合算法对预处理之后的特征向量进行预拟合,并根据得到的特征重要性评分对特征向量中的特征进行筛选,最后得到特征筛选处理后特征向量,该特征向量的维度小于特征筛选处理之前的特征向量的维度。
然后,使用异常检测算法去除用户数据样本的异常数据。例如可以使用孤立森林算法来实现异常检测,具体可以设立异常比例阈值为1%,剔除1%的异常数据。
可选的,步骤102具体可以通过如下方式实现:
根据预拟合算法对所述预处理后的用户数据样本进行特征筛选处理,得到筛选后的用户数据样本;
根据异常检测算法对所述筛选后的用户数据样本中的异常数据进行剔除处理,得到所述处理后的用户数据样本。
具体的,可以使用决策树预拟合算法对预处理之后的特征向量进行预拟合,并根据得到的特征重要性评分对特征向量中的特征进行筛选,最后得到特征筛选处理后特征向量,例如最后得到维度为500+的特征向量X。
然后,使用孤立森林算法来去除异常数据,可以设立异常比例阈值为1%,剔除1%的异常数据。
在一具体实施例中,在上述处理结束后,原本用户数据样本的24000条训练数据仅剩9000条,主要原因是IMEI对应价格表数据不全。随后将步骤102后的用户数据样本分为训练样本和测试样本,例如比例为7:3,通过训练样本训练机器学习分类模型,通过训练样本和测试样本选取最终的预测模型。
可选的,在步骤103之前,即在确定预测模型之前,首先需要根据用户数据样本进行训练得到机器学习分类模型,具体可以通过如下方式实现:
根据所述处理后的用户数据样本中的训练样本对至少一个机器学习分类模型进行训练,得到训练后的至少一个机器学习分类模型;
根据网格搜索算法对训练后的至少一个机器学习分类模型的参数分别进行调整,得到调整后的机器学习分类模型。
具体的,根据处理后的训练样本训练得到机器学习分类模型,例如一般线性模型、神经网络模型、支持向量模型、集成学习模型等。
训练得到的机器学习分类模型一般都会存在过拟合现象,故需要对机器学习分类模型的参数进行调整,调整参数的目标为对机器学习分类模型中的参数进行适当的正则化以使其正确拟合。
具体可以先根据回归系数及模型负责度为衡量标准,对机器学习分类模型的参数进行评估,然后根据Pipeline进行串行管道化处理以实现参数寻优,在参数寻优过程中,具体可以通过网格搜索算法(Grid search)来实现参数寻优过程中的多重参数指标的自有组合,进行最优参数的自动筛选,最终得到调整后的参数以及调整后的机器学习分类模型。
步骤103、根据所述处理后的用户数据样本以及机器学习分类模型的评价指标,从至少一个机器学习分类模型中选取一个机器学习分类模型作为预测模型。
本步骤中,从上述训练得到的机器学习分类模型中选取一个机器学习分类模型作为预测模型。具体可以根据机器学习分类模型的评价指标进行选取。
评价指标例如包括F1分数、均方误差MSE等。
可选的,步骤103具体可以通过如下方式实现:
根据所述处理后的用户数据样本中的训练样本和测试样本,进行交叉验证,得到所述至少一个机器学习分类模型各自的F1分数评价指标;
选取所述至少一个机器学习分类模型中F1分数最高的一个机器学习分类模型作为所述预测模型。
具体的,根据训练样本和测试样本,分布对各个机器学习分类模型进行交叉验证,得到F1分数。在上述各机器学习分类模型中选取F1分数最高的模型作为预测模型。例如训练样本和测试样本的比例为7:3。
在其他实施方式中,也可以根据各个机器学习分类模型的均方误差选取预测模型。选取交叉验证后的均方误差接近的机器学习分类模型作为预测模型,如一般线性模型和支持向量回归模型。
表3各算法在测试集和训练集上的MSE
步骤104、根据用户数据和所述预测模型,得到所述用户数据对应的用户的换机频率。
具体的,通过上述处理得到的预测模型,以用户数据为输入,以用户终端更换频率为预测目标字段,可以预先获取到在网用户终端更换的可能时间窗口,能够快速有效的找出终端换机的潜在用户,缩小了营销用户群体数量,减少了营销成本,预测准确率较高。
预测结果如下表4:
表4
字段 说明
USERID 标识用户的唯一编码
Frequency 预测换机频率(单位:天/次)
进一步的,可以根据预测结果,选取当前一个月内具有换机倾向的用户,并随机划分为A、B两组用户,对用户进行营销,并根据不同的营销策略进行反馈验证。
本发明实施例中的方法有效利用了用户数据,并使用特征编码的方法,将各特征维度进行类别化,提供了更多的特征组合可能性,扩展了用户数据的特征维度;并且使用预拟合算法筛选特征,实现特征降维,缩短了模型的训练时间;
本发明实施例中的方法,用户数据样本可以根据实际需求增加特征维度。通过扩大数据规模和增加特征维度对于预测模型的预测效果有很大提升。
综上所述,本发明的实现流程如图2所示,首先对原始的用户数据样本进行数学分析以及特征提取,得到特征数据样本然后再进行数据预处理,可通过多项式组合增加特征,以及决策树拟合筛选特征,然后将预处理的用户数据样本分为训练样本和测试样本,训练机器学习分类模型,并对机器学习分类模型进行调参调优,即对参数进行调整,得到较佳的机器学习分类模型,然后根据多个机器学习分类模型选取出预测模型,最终根据预测模型进行预测,并根据预测结果进行反馈,调整预测模型。
本实施例的方法,将用户数据样本的各个特征维度进行预处理,得到预处理后的用户数据样本;所述预处理后的用户数据样本的各个特征维度具有相同的类别特征模式;将所述预处理后的用户数据样本进行特征筛选处理以及异常数据剔除处理,得到处理后的用户数据样本;根据所述处理后的用户数据样本以及机器学习分类模型的评价指标,从至少一个机器学习分类模型中选取一个机器学习分类模型作为预测模型;根据用户数据和所述预测模型,得到所述用户数据对应的用户的换机频率,可以预先获取到在网用户终端更换的可能时间窗口,能够快速有效的找出终端换机的潜在用户,缩小了营销用户群体数量,减少了营销成本,预测准确率较高。
图3为本发明提供的终端的更换预测装置一实施例的结构图,如图3所示,本实施例的终端的更换预测装置,包括:
预处理模块301,用于将用户数据样本的各个特征维度进行预处理,得到预处理后的用户数据样本;所述预处理后的用户数据样本的各个特征维度具有相同的类别特征模式;
数据处理模块302,用于将所述预处理后的用户数据样本进行特征筛选处理以及异常数据剔除处理,得到处理后的用户数据样本;
模型建立模块303,用于根据所述处理后的用户数据样本以及机器学习分类模型的评价指标,从至少一个机器学习分类模型中选取一个机器学习分类模型作为预测模型;
预测模块304,用于根据用户数据和所述预测模型,得到所述用户数据对应的用户的换机频率。
可选的,所述预处理模块301具体用于:
通过特征多项式组合增加所述用户数据样本的特征维度;
将所述用户数据样本中的各个特征维度的特征模式转化为类别特征模式,并对所述各个特征维度进行编码,得到所述预处理后的用户数据样本;所述预处理后的用户数据样本中的用户数据分别对应一个特征向量。
可选的,所述数据处理模块302,具体用于:
根据预拟合算法对所述预处理后的用户数据样本进行特征筛选处理,得到筛选后的用户数据样本;
根据异常检测算法对所述筛选后的用户数据样本中的异常数据进行剔除处理,得到所述处理后的用户数据样本。
可选的,所述模型建立模块303,具体用于:
根据所述处理后的用户数据样本中的训练样本对至少一个机器学习分类模型进行训练,得到训练后的至少一个机器学习分类模型;
根据网格搜索算法对训练后的至少一个机器学习分类模型的参数分别进行调整,得到调整后的机器学习分类模型。
可选的,所述模型建立模块303,具体用于:
根据所述处理后的用户数据样本中的训练样本和测试样本,进行交叉验证,得到所述至少一个机器学习分类模型各自的F1分数评价指标;
选取所述至少一个机器学习分类模型中F1分数最高的一个机器学习分类模型作为所述预测模型。
本实施例的装置,可以用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图4为本发明提供的电子设备实施例的结构图,如图4所示,该电子设备包括:
处理器401,以及,用于存储处理器401的可执行指令的存储器402。
可选的,还可以包括通信接口403,用于与其他设备进行通信。
其中,处理器401配置为经由执行所述可执行指令来执行前述方法实施例中对应的方法,其具体实施过程可以参见前述方法实施例,此处不再赘述。
本发明实施例中还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述方法实施例中对应的方法,其具体实施过程可以参见前述方法实施例,其实现原理和技术效果类似,此处不再赘述。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (10)

1.一种终端的更换预测方法,其特征在于,包括:
将用户数据样本的各个特征维度进行预处理,得到预处理后的用户数据样本;所述预处理后的用户数据样本的各个特征维度具有相同的类别特征模式;
将所述预处理后的用户数据样本进行特征筛选处理以及异常数据剔除处理,得到处理后的用户数据样本;
根据所述处理后的用户数据样本以及机器学习分类模型的评价指标,从至少一个机器学习分类模型中选取一个机器学习分类模型作为预测模型;
根据用户数据和所述预测模型,得到所述用户数据对应的用户的换机频率。
2.根据权利要求1所述的方法,其特征在于,将用户数据样本的各个特征维度进行预处理,得到预处理后的用户数据样本,包括:
通过特征多项式组合增加所述用户数据样本的特征维度;
将所述用户数据样本中的各个特征维度的特征模式转化为类别特征模式,并对所述各个特征维度进行编码,得到所述预处理后的用户数据样本;所述预处理后的用户数据样本中的用户数据分别对应一个特征向量。
3.根据权利要求1或2所述的方法,其特征在于,所述将所述预处理后的用户数据样本进行特征筛选处理以及异常数据剔除处理,包括:
根据预拟合算法对所述预处理后的用户数据样本进行特征筛选处理,得到筛选后的用户数据样本;
根据异常检测算法对所述筛选后的用户数据样本中的异常数据进行剔除处理,得到所述处理后的用户数据样本。
4.根据权利要求1或2所述的方法,其特征在于,所述从至少一个机器学习分类模型中选取一个机器学习分类模型作为预测模型之前,还包括:
根据所述处理后的用户数据样本中的训练样本对至少一个机器学习分类模型进行训练,得到训练后的至少一个机器学习分类模型;
根据网格搜索算法对训练后的至少一个机器学习分类模型的参数分别进行调整,得到调整后的机器学习分类模型。
5.根据权利要求1或2所述的方法,其特征在于,所述根据所述处理后的用户数据样本以及机器学习分类模型的评价指标,从至少一个机器学习分类模型中选取一个机器学习分类模型作为预测模型,包括:
根据所述处理后的用户数据样本中的训练样本和测试样本,进行交叉验证,得到所述至少一个机器学习分类模型各自的F1分数评价指标;
选取所述至少一个机器学习分类模型中F1分数最高的一个机器学习分类模型作为所述预测模型。
6.一种终端的更换预测装置,其特征在于,包括:
预处理模块,用于将用户数据样本的各个特征维度进行预处理,得到预处理后的用户数据样本;所述预处理后的用户数据样本的各个特征维度具有相同的类别特征模式;
数据处理模块,用于将所述预处理后的用户数据样本进行特征筛选处理以及异常数据剔除处理,得到处理后的用户数据样本;
模型建立模块,用于根据所述处理后的用户数据样本以及机器学习分类模型的评价指标,从至少一个机器学习分类模型中选取一个机器学习分类模型作为预测模型;
预测模块,用于根据用户数据和所述预测模型,得到所述用户数据对应的用户的换机频率。
7.根据权利要求6所述的装置,其特征在于,所述预处理模块具体用于:
通过特征多项式组合增加所述用户数据样本的特征维度;
将所述用户数据样本中的各个特征维度的特征模式转化为类别特征模式,并对所述各个特征维度进行编码,得到所述预处理后的用户数据样本;所述预处理后的用户数据样本中的用户数据分别对应一个特征向量。
8.根据权利要求6或7所述的装置,其特征在于,所述数据处理模块,具体用于:
根据预拟合算法对所述预处理后的用户数据样本进行特征筛选处理,得到筛选后的用户数据样本;
根据异常检测算法对所述筛选后的用户数据样本中的异常数据进行剔除处理,得到所述处理后的用户数据样本。
9.根据权利要求6或7所述的装置,其特征在于,所述模型建立模块,具体用于:
根据所述处理后的用户数据样本中的训练样本对至少一个机器学习分类模型进行训练,得到训练后的至少一个机器学习分类模型;
根据网格搜索算法对训练后的至少一个机器学习分类模型的参数分别进行调整,得到调整后的机器学习分类模型。
10.根据权利要求6或7所述的装置,其特征在于,所述模型建立模块,具体用于:
根据所述处理后的用户数据样本中的训练样本和测试样本,进行交叉验证,得到所述至少一个机器学习分类模型各自的F1分数评价指标;
选取所述至少一个机器学习分类模型中F1分数最高的一个机器学习分类模型作为所述预测模型。
CN201810742982.XA 2018-07-09 2018-07-09 终端的更换预测方法及装置 Pending CN108960922A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810742982.XA CN108960922A (zh) 2018-07-09 2018-07-09 终端的更换预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810742982.XA CN108960922A (zh) 2018-07-09 2018-07-09 终端的更换预测方法及装置

Publications (1)

Publication Number Publication Date
CN108960922A true CN108960922A (zh) 2018-12-07

Family

ID=64483346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810742982.XA Pending CN108960922A (zh) 2018-07-09 2018-07-09 终端的更换预测方法及装置

Country Status (1)

Country Link
CN (1) CN108960922A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919675A (zh) * 2019-03-04 2019-06-21 深圳微品致远信息科技有限公司 基于神经网络的通讯用户升档预测概率识别方法及系统
CN110163525A (zh) * 2019-05-29 2019-08-23 中国联合网络通信集团有限公司 终端推荐方法和终端推荐系统
CN110210403A (zh) * 2019-06-04 2019-09-06 电子科技大学 一种基于特征构造的sar图像目标识别方法
CN110784435A (zh) * 2019-04-15 2020-02-11 北京嘀嘀无限科技发展有限公司 一种异常服务识别方法、装置、电子设备及存储介质
CN111144935A (zh) * 2019-12-17 2020-05-12 武汉海云健康科技股份有限公司 基于大数据的睡眠会员唤醒方法及系统、服务器及介质
CN112115991A (zh) * 2020-09-09 2020-12-22 福建新大陆软件工程有限公司 移动终端换机预测方法、装置、设备及可读存储介质
CN112329911A (zh) * 2020-10-20 2021-02-05 上海钧正网络科技有限公司 一种充电异常确定方法和装置
CN113538025A (zh) * 2020-04-14 2021-10-22 中国移动通信集团浙江有限公司 终端设备的更换预测方法及装置
CN113905078A (zh) * 2021-09-27 2022-01-07 中国联合网络通信集团有限公司 信息推送方法、装置、设备及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107730893A (zh) * 2017-11-30 2018-02-23 大连理工大学 一种基于乘客出行多维特征的共享巴士站点客流预测方法
CN107886366A (zh) * 2017-11-22 2018-04-06 深圳市金立通信设备有限公司 性别分类模型的生成方法、性别填充方法、终端及存储介质
CN108231201A (zh) * 2018-01-25 2018-06-29 华中科技大学 一种疾病数据分析处理模型的构建方法、系统及应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107886366A (zh) * 2017-11-22 2018-04-06 深圳市金立通信设备有限公司 性别分类模型的生成方法、性别填充方法、终端及存储介质
CN107730893A (zh) * 2017-11-30 2018-02-23 大连理工大学 一种基于乘客出行多维特征的共享巴士站点客流预测方法
CN108231201A (zh) * 2018-01-25 2018-06-29 华中科技大学 一种疾病数据分析处理模型的构建方法、系统及应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
TINA JAKAŠA 等: "Electricity price forecasting—ARIMA model approach", 《2011 8TH INTERNATIONAL CONFERENCE ON THE EUROPEAN ENERGY MARKET (EEM)》 *
杨秀松: "基干数据挖掘的电信替在换机客户的预测研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
甘杨兰 等: "《面向基因组分析的数据挖掘算法研究》", 30 August 2017 *
金融安全协同创新中心 等: "《中国金融安全问题研究 2017》", 30 November 2017 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919675A (zh) * 2019-03-04 2019-06-21 深圳微品致远信息科技有限公司 基于神经网络的通讯用户升档预测概率识别方法及系统
CN110784435A (zh) * 2019-04-15 2020-02-11 北京嘀嘀无限科技发展有限公司 一种异常服务识别方法、装置、电子设备及存储介质
CN110163525A (zh) * 2019-05-29 2019-08-23 中国联合网络通信集团有限公司 终端推荐方法和终端推荐系统
CN110210403B (zh) * 2019-06-04 2022-10-14 电子科技大学 一种基于特征构造的sar图像目标识别方法
CN110210403A (zh) * 2019-06-04 2019-09-06 电子科技大学 一种基于特征构造的sar图像目标识别方法
CN111144935A (zh) * 2019-12-17 2020-05-12 武汉海云健康科技股份有限公司 基于大数据的睡眠会员唤醒方法及系统、服务器及介质
CN113538025A (zh) * 2020-04-14 2021-10-22 中国移动通信集团浙江有限公司 终端设备的更换预测方法及装置
CN113538025B (zh) * 2020-04-14 2024-03-22 中国移动通信集团浙江有限公司 终端设备的更换预测方法及装置
CN112115991A (zh) * 2020-09-09 2020-12-22 福建新大陆软件工程有限公司 移动终端换机预测方法、装置、设备及可读存储介质
CN112115991B (zh) * 2020-09-09 2023-08-04 福建新大陆软件工程有限公司 移动终端换机预测方法、装置、设备及可读存储介质
CN112329911A (zh) * 2020-10-20 2021-02-05 上海钧正网络科技有限公司 一种充电异常确定方法和装置
CN112329911B (zh) * 2020-10-20 2023-04-07 上海钧正网络科技有限公司 一种充电异常确定方法和装置
CN113905078A (zh) * 2021-09-27 2022-01-07 中国联合网络通信集团有限公司 信息推送方法、装置、设备及可读存储介质
CN113905078B (zh) * 2021-09-27 2023-07-04 中国联合网络通信集团有限公司 信息推送方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN108960922A (zh) 终端的更换预测方法及装置
CN110807527B (zh) 一种基于客群筛选的额度调整方法、装置和电子设备
CN109522556A (zh) 一种意图识别方法及装置
CN108205766A (zh) 信息推送方法、装置及系统
CN106910087A (zh) 一种智能广告创意生成方法及系统
CN104992347A (zh) 一种视频匹配广告的方法及装置
CN111047412A (zh) 一种大数据电商运营平台
CN112561082A (zh) 生成模型的方法、装置、设备以及存储介质
CN107748898A (zh) 文件分类方法、装置、计算设备及计算机存储介质
Pradhan et al. Relationships between telecommunications infrastructure, capital formation, and economic growth
CN109690581A (zh) 用户指导系统及方法
CN107590195A (zh) 文本分类模型训练方法、文本分类方法及其装置
US20230162215A1 (en) Methods and apparatus to perform multi-level hierarchical demographic classification
CN107633433A (zh) 广告的审核方法及装置
CN114219545B (zh) 一种数据处理的方法和装置
CN112149352A (zh) 一种结合gbdt自动特征工程对营销活动点击的预测方法
CN115545886A (zh) 逾期风险识别方法、装置、设备及存储介质
CN109727125A (zh) 借款金额预测方法、装置、服务器、存储介质
CN110457329B (zh) 一种实现个性化推荐的方法及装置
CN110765352B (zh) 一种用户兴趣识别方法及装置
Daneshmandi et al. A hybrid data mining model to improve customer response modeling in direct marketing
CN113744009A (zh) 目标对象输出方法、装置、计算机可读介质及电子设备
CN116912016A (zh) 一种账单稽核方法和装置
CN116797235A (zh) 消费信息的处理方法、装置、存储介质及计算机设备
CN112487295A (zh) 5g套餐推送方法、装置、电子设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181207

RJ01 Rejection of invention patent application after publication