CN106845731A - 一种基于多模型融合的潜在换机用户发现方法 - Google Patents
一种基于多模型融合的潜在换机用户发现方法 Download PDFInfo
- Publication number
- CN106845731A CN106845731A CN201710089934.0A CN201710089934A CN106845731A CN 106845731 A CN106845731 A CN 106845731A CN 201710089934 A CN201710089934 A CN 201710089934A CN 106845731 A CN106845731 A CN 106845731A
- Authority
- CN
- China
- Prior art keywords
- user
- feature
- model
- xgboost
- mobile phone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种基于多模型融合的潜在换机用户发现方法,该方法主要包括用户的消费数据和换机轨迹数据采集和预处理、特征构建、模型构建及模型融合、预测等步骤。本发明旨在利用机器学习算法的多样性和差异性,将多个模型组合起来,以获得更好的效果,使集成的模型具有更强的泛化能力。通过用户历史数据进行训练,最后在数据集上进行预测,从而得到即将换机的高价值用户,并精确的为用户推送手机信息。
Description
技术领域
本发明涉及数据清洗方法、异常数据处理方法、用户换机打标方法、特征工程构建方法,以及采用多模型融合进行换机用户预测的技术。
背景技术
运营商几乎每分每秒都在产生着海量业务数据,如何将这些数据利用起来并产生价值,这就成了运营商的一个迫切需求。然而随机投放的推送对多数用户造成无意义的干扰。对商家而言,滥发的推送可能降低品牌声誉,同时难以估算营销成本。基于数据挖掘技术和手段,通过运营商提供的精确的用户消费行为和历史换机轨迹刻画用户画像、了解用户需求,充分利用数据挖掘和机器学习技术为运营商的业务开展提供有力支撑。
利用数据挖掘、机器学习等技术对用户行为进行分析,发现潜在的换机用户。当前通用的方法为利用有监督的分类器对用户历史换机数据、用户app使用情况等信息来建立模型,对用户是否换机,换机类型等做出预测。
随着大数据时代的到来,如何有效的进行数据挖掘,从而产生商业价值已经成为了一种企业必然趋势。
发明内容
本发明提出了一种基于多模型融合的分类算法对用户换机行为进行预测,同时本发明还涉及到了用户历史行为分析、样本标注意、特征工程构建、特征选择和特征变换等领域的技术。
为了实现上述目的,本发明采用的技术方案是:一种基于多模型融合的潜在换机用户发现方法,包括以下步骤:
(1)数据采集和预处理,收集用户的基本信息和用户历史换机轨迹信息,删除异常信息,处理缺失信息,对数值型信息进行归一化处理;利用时间窗口划分训练集和测试集。用户的基本信息和用户历史换机轨迹信息从运营商的用户最近1年消费信息中获取。
(2)特征构建,根据步骤(1)训练集和测试集中的数据提取出基本信息,以及对基本信息进行扩展得到原始特征;对原始特征分别进行排序得到排序特征;用皮尔逊相关系数衡量原始特征和目标变量之间的相关性,构建多项式特征;将训练集和测试集中的无关联属性特征作为离散特征。
(3)模型构建及模型融合,分别构建树型模型、超平面模型和惰性模型中的分类器Xgboost、LIBSVM和KNN,用训练集中的数据分别对分类器Xgboost,LIBSVM和KNN进行训练,再用训练后的Xgboost、LIBSVM和KNN分别训练测试集。
(4)用步骤(3)所述Xgboost、LIBSVM和KNN分类器分别对未知样本进行预测,得到的多个预测结果进行加权投票为最终的预测结果。
上述步骤(1)中还包括根据用户历史换机轨迹信息对用户打标签,具体为:过滤换机时间小于20天的用户历史换机轨迹;统计用户在整个考察时间窗内使用的手机机型集合(PA)和考察时间窗之前使用的手机机型集合(PB),若集合PA和PB存在差异,那么用1标注该用户为换机用户,否则用0标注该用户不是换机用户。
上述步骤(1)中异常信息是指用户的特征缺失率大于50%,则删除。处理缺失信息包括,当用户在某一个时间段内使用的手机缺失,按照时间点向后滚动,即用用户的下个时间段的手机参数填充该缺失,若用户的下个时间段内手机也存在缺失,那么向前滚动,即用用户的上个时间段的手机参数填充该缺失。
所述Xgboost分类器的构建方法如下:分别对原始特征、排序特征、离散特征、多项式特征进行特征选择,按照特征重要性排序,在原始特征中选取前N1个特征,在排序特征中选取前N2个特征,在离散特征中选取前N3个特征,在多项式特征中选取前N4个特征(上述参数N1,N2,N3,N4随机取值,但N1,N2,N3,N4分别小于原始特征个数、排序特征个数、离散特征个数、多项式特征个数),Xgboost模型参数在±0.5围内(以初始化参数值为参考,上下0.5以内浮动)随机扰动,生成多个不同的Xgboost模型,所有的模型投票得到Xgboost模型。
本发明利用多模型融合方法来进行潜在换机用户挖掘,客服了传统的人工识别换机用户的局限性;同时,不同算法的结果着眼点不同,能满足不同用户的需求,将众多的机器学习算法进行合理地组合更能刻画用户换机的多样性、准确性。通过用户历史数据进行训练,最后在数据集上进行预测,从而发现即将换机的高价值用户,并精确地为用户推送手机机型。本发明从实际问题手机终端精准营销出发,将数据挖掘技术应用到潜在手机终端更换的预测研究中,研究工作对决策及市场人员开展工作有重要的作用。
附图说明
图1为潜在换机用户发现的流程图;
图2为本发明构建Xgboost模型的流程图;
图3为本发明构建KNN模型的流程图;
图4为本发明模型融合的流程图;
图5为本发明界定考察时间段内使用的手机机型集合PA的时间轴图。
具体实施方式
为进一步阐述本发明方案,特以贵州移动2011年至2016年用户数据为例对本技术方案进行详尽阐述:
1.数据采集
通过运行商获取用户最近1年的消费信息以及用户的历史机型的各种参数,包括处理器、内存、像素以及是否支持导航等,收集到用户的基本信息和用户历史换机轨迹信息。
2.数据预处理
包括用户基本信息和用户历史换机轨迹信息的处理,根据两个数据表的描述以及物理理解进行如下处理:
由于用户基本信息中某些特征存在缺失现象,针对数值型特征和枚举型特征分别做不同的处理,flow、mou、apru等数值型特征,如果存在缺失现象那么就用当前的中位数补充;性别等枚举型特征用区别于数据集中现有的枚举值填充,如“未知”。
对信息中的数值型特征进行最大最小归一化处理。
3.数据打标
本发明中规定换机标准:考察时间段内出现的手机型号中,至少有一款在考察时间段之前没有出现过。轨迹数据中如果型号数据缺失,则取该用户按时间后一记录的型号补充,如果缺失记录为最后条记录,则按时间前一记录的型号补充,如果为唯一记录,在填充NULL型号。结合实际案例阐述如下:
对用户打标签,首先过滤换机时间小于20天的用户历史换机轨迹的记录,随后统计用户在整个考察时间窗内使用的手机机型集合PA和考察时间窗之前使用的手机机型集合PB,若集合PA减去PB不为空,那么用1标注该用户为换机用户,否则用0标注该用户不是换机用户。
4.训练集和测试集划分
训练集时间点:2015年9月30日;
测试集时间点:2015年12月31日;
本发明采用基于时间滑动窗口的方法划分数据集,在不考虑突变和周期规律的情况下,该时间序列是具有短期自相关性的,即相邻的时间序列值具有连续性。很显然要预测2016年1月1日-2016年3月31日用户是否换机,离待预测时间越近的几个月的信息与待预测值相关性较大,从已知的2015年12月31日开始倒推5个月提取用户的消费数据作为主要特征,训练集的标注和特征提取和测试集保持相同。以考察用户在2015年10月1日-2015年12月31是否换机为例,图5描述了在考察时间窗内使用的手机的开始使用时间与结束时间和考察时间窗的起始点之间的关系,①手机被使用的开始时间在考察时间窗的开始时间点之前,手机被使用的结束时间在考察时间窗的结束时间点之前;②手机被使用的开始时间和结束时间在考察时间窗之内;③手机被使用的开始时间在考察时间窗的开始时间之后,手机被使用的结束时间在考察时间窗的结束时间点之后;④手机被使用的开始时间在考察时间窗的开始时间点之前,手机被使用的结束时间在考察时间窗的结束点之后。
5.特征工程构建
前置条件:数据打标结果,即2015年10月1日-2015年12月31日换机的用户为训练集,2016年1月1日-2016年3月31日换机的用户为测试集,用户用ID进行标识。
基础特征
用户基本消费数据中,样本(用户)在换机时间段前5个月的流量、5个月的通话时长、5个月的arpu值,一共有15个特征,因此,对于训练集和测试集的每一个样本,都可以构建一个15维的向量(加上标签是16维,这一维是目标列)。
基础特征扩展
①对基础特征中的每个特征,分别构建排序特征,并进行归一化,特征增加到15+15=30个;
②添加相邻月份流量、通话时长、arpu值的差值特征,特征增加到30+12=42个。5个月份的流量有4个相邻月份的流量差,5个月份的通话时长有4个相邻月份的通话时长差,5个月份的arpu值有4个相邻月份的apru值差,4*3=12(个特征)。
③添加用户5个月内流量、通话时长、arpu值的标准差,均值特征,特征增加到42+6=48个。
轨迹特征
①考察时间段前,用户最后一个手机使用时长,48+1=49个特征。
②考察时间段前,用户曾经使用过多少个手机,49+1=50个特征。
③考察时间段前,用户使用的手机时长的均值、最大值、最小值,50+3=53个特征。
④用户最后一个手机的品牌、CPU频率、内存、屏幕大小、是否4G,53+5=58个特征。
多项式特征
在基础特征、扩展的基础特征、以及基础轨迹特征中,计算训练集中每一维特征与目标列之间的皮尔逊相关系数,取相关系数的绝对值,倒序排序,取排名前30%(48*03.3=14)的特征,然后分别对训练集和测试集,利用上述得到的特征进行两两加、减、乘,得到91*3=273个新特征。(排名前30%的特征只能采用训练集数据,因为经验知识只能从训练集获取,但是进阶特征的构建必须是训练集和测试集同步的,相当于把从训练集得到的知识应用在测试集上)。
轨迹特征扩展
计算各个品牌的手机的平均使用时长,最大使用时长,最小使用时长(不能跨越时间段),根据用户最后一个手机的品牌,加入这3个特征,如果没有品牌,可以选择留空、填均值、或者把所有非著名品牌都统一当作其他处理;
用户倒数第二个手机的轨迹基础特征、轨迹特征扩展。
离散特征
对用户的某些基本属性特征(年龄,性别)构建离散特征;
根据对换机业务场景的理解从用户历史换机轨迹表中提取出用户距考察时间段最近的已使用手机的参数,内存、屏幕尺寸、处理器类型;
对上述轨迹特征中非数值型特征进行One-hot编码,为了避免数据稀疏和纬度灾难问题,只有当用户历史换机轨迹表中品牌使用量大于设定的阈值才唯一编码,否则对小众品牌统一编码。
6.模型构建和融合
前置条件:特征提取进阶构建完毕,利用机器学习算法构建模型auc达到0.66以上;
AUC(Area Under Curve,ROC曲线下的面积)为任取一对(正、反)样本,正样本的得分大于负样本的得分的概率,在不平衡数据集中相比于召回率、准确率更能体现一个分类器模型的好坏。在换机用户预测场景中换机用户远远小于非换机用户的数量,因此本发明选用AUC作为评估模型优劣的指标。
为了表达模型的多样性,分别选取树型模型、超平面模型、惰性模型中典型的分类器Xgboost,LIBSVM,KNN等。
基于Xgboost分别对原始特征、排序特征、离散特征、多项式特征进行特征选择,按照特征重要性排序,在原始特征中选取前N1个特征,在排序特征中选取前N2个特征,在离散特征中选取前N3个特征,在多项式特征中选取前N4个特征,参数N1,N2,N3,N4随机取值,Xgboost模型参数在小范围(±0.5)内随机扰动,生成多个不同的Xgboost模型,所有的模型投票得到Xgboost分类器,图2为构建Xgboost模型的流程图。
由于LIBSVM参数复杂,收敛速度慢等因素不利于手动调整参数,利用LIBSVM网格寻优工具得到最优模型SVM;
基于训练集进行Boostrap采样,Boostrap采样得到多份不同的数据,然后用不同的参数和数据训练多个KNN模型,所有的模型进行投票得到模型KNN,图3为构建KNN模型的流程图。
分别用上述Xgboost,SVM,KNN得到的训练数据的输出结果带到训练集中得到更加贴近真实结果的模型,再用这个模型训练测试数据结果,这样模型会一次比一次好。
图4为用上述多个模型得到的测试结果的偏差当做特征作为线性模型LR(LinearRegression)的输入,线性模型的输出为上述每个模型的权重;用训练好的xgboost模型,SVM模型,KNN模型预测验证集,相对于验证集的真实标签,每个模型输出与真是标签的做异或运算的结果作为线性模型的特征,最后训练好的线性模型参数WT为上述xgboost模型,SVM模型,KNN模型的权重。最后用上述多个异构模型对未知样本进行预测,用上述线性模型的参数WT,对得到的多个预测结果进行加权投票为最终的预测结果;若用户为潜在换机用户,那么根据用户的消费信息以及使用过的手机推荐套餐和相似的手机品牌。
Claims (6)
1.一种基于多模型融合的潜在换机用户发现方法,其特征在于,包括以下步骤:
(1)数据采集和预处理,收集用户的基本信息和用户历史换机轨迹信息,删除异常信息,处理缺失信息,对数值型信息进行归一化处理;利用时间窗口划分训练集、验证集和测试集;
(2)特征构建,根据步骤(1)训练集和测试集中的数据提取出基本信息,以及对基本信息进行扩展得到原始特征;对原始特征分别进行排序得到排序特征;用皮尔逊相关系数衡量原始特征和目标之间变量的相关性,构建多项式特征;将训练集和测试集中的无关联属性特征作为离散特征;
(3)模型构建及模型融合,分别构建树型模型、超平面模型和惰性模型中的典型的分类器Xgboost、LIBSVM和KNN,用训练集中的数据分别对Xgboost,LIBSVM和KNN进行训练,再用训练后的Xgboost、LIBSVM和KNN分别训练测试集;
(4)用步骤(3)所述Xgboost、LIBSVM和KNN分类器分别对未知样本进行预测,得到的多个预测结果进行加权投票为最终的预测结果。
2.根据权利要求1所述一种基于多模型融合的潜在换机用户发现方法,其特征在于:所述用户的基本信息和用户历史换机轨迹信息从运营商的用户最近1年消费信息中获取。
3.根据权利要求1或2所述一种基于多模型融合的潜在换机用户发现方法,其特征在于:所述步骤(1)中还包括根据用户历史换机轨迹信息对用户打标签,具体为:过滤换机时间小于20天的用户历史换机轨迹;统计用户在整个考察时间窗内使用的手机机型集合(PA)和考察时间窗之前使用的手机机型集合(PB),若集合PA和PB存在差异,那么用1标注该用户为换机用户,否则用0标注该用户不是换机用户。
4.根据权利要求1所述一种基于多模型融合的潜在换机用户发现方法,其特征在于:所述异常信息是指用户的特征缺失率大于50%,则删除。
5.根据权利要求1所述一种基于多模型融合的潜在换机用户发现方法,其特征在于:所述处理缺失信息包括,当用户在某一个时间段内使用的手机缺失,按照时间点向后滚动,即用用户的下个时间段的手机参数填充该缺失,若用户的下个时间段内手机也存在缺失,那么向前滚动,即用用户的上个时间段的手机参数填充该缺失。
6.根据权利要求1所述一种基于多模型融合的潜在换机用户发现方法,其特征在于:所述Xgboost分类器的构建方法如下:分别对原始特征、排序特征、离散特征、多项式特征进行特征选择,按照特征重要性排序,在原始特征中选取前N1个特征,在排序特征中选取前N2个特征,在离散特征中选取前N3个特征,在多项式特征中选取前N4个特征,参数N1,N2,N3,N4随机取值,但N1,N2,N3,N4分别小于原始特征个数、排序特征个数、离散特征个数、多项式特征个数,Xgboost模型参数在±0.5围内随机扰动,生成多个不同的Xgboost模型,所有的模型投票得到最终的Xgboost模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710089934.0A CN106845731A (zh) | 2017-02-20 | 2017-02-20 | 一种基于多模型融合的潜在换机用户发现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710089934.0A CN106845731A (zh) | 2017-02-20 | 2017-02-20 | 一种基于多模型融合的潜在换机用户发现方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106845731A true CN106845731A (zh) | 2017-06-13 |
Family
ID=59128453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710089934.0A Pending CN106845731A (zh) | 2017-02-20 | 2017-02-20 | 一种基于多模型融合的潜在换机用户发现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106845731A (zh) |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107527124A (zh) * | 2017-10-13 | 2017-12-29 | 众安信息技术服务有限公司 | 生成行业基本面组合预测模型的方法和装置 |
CN108038720A (zh) * | 2017-12-06 | 2018-05-15 | 电子科技大学 | 一种基于因子分解机的广告点击率预测方法 |
CN108257593A (zh) * | 2017-12-29 | 2018-07-06 | 深圳和而泰数据资源与云技术有限公司 | 一种语音识别方法、装置、电子设备及存储介质 |
CN108764597A (zh) * | 2018-04-02 | 2018-11-06 | 华南理工大学 | 一种基于集成学习的产品质量控制方法 |
CN109166012A (zh) * | 2018-09-21 | 2019-01-08 | 苏州创旅天下信息技术有限公司 | 针对行程预定类用户的分类及信息推送的方法和装置 |
CN109242539A (zh) * | 2018-08-14 | 2019-01-18 | 中国平安人寿保险股份有限公司 | 基于流失用户的潜在用户预测方法、装置和计算机设备 |
CN109325781A (zh) * | 2018-09-04 | 2019-02-12 | 中国平安人寿保险股份有限公司 | 客户品质分析方法、装置、计算机设备和存储介质 |
CN109359674A (zh) * | 2018-09-27 | 2019-02-19 | 智庭(北京)智能科技有限公司 | 一种基于多模型blending的智能锁异常检测方法 |
CN109509033A (zh) * | 2018-12-14 | 2019-03-22 | 重庆邮电大学 | 一种消费金融场景下的用户购买行为大数据预测方法 |
CN109635118A (zh) * | 2019-01-10 | 2019-04-16 | 博拉网络股份有限公司 | 一种基于大数据的用户搜索匹配方法 |
CN109886756A (zh) * | 2019-03-04 | 2019-06-14 | 深圳微品致远信息科技有限公司 | 基于集成模型的通讯用户升档预测概率识别方法及系统 |
CN109919219A (zh) * | 2019-03-01 | 2019-06-21 | 北京邮电大学 | 一种基于粒计算ML-kNN的Xgboost多视角画像构建方法 |
CN109948869A (zh) * | 2019-04-22 | 2019-06-28 | 东南大学 | 基于有序聚类离散化的脱硫系统so2出口浓度预测方法 |
CN109962795A (zh) * | 2017-12-22 | 2019-07-02 | 中国移动通信集团广东有限公司 | 一种基于多维组合变量的4g用户流失预警方法和系统 |
CN109993339A (zh) * | 2017-12-29 | 2019-07-09 | 上海诺悦智能科技有限公司 | 一种出国金融业务潜在用户的预测方法 |
CN110059775A (zh) * | 2019-05-22 | 2019-07-26 | 湃方科技(北京)有限责任公司 | 旋转型机械设备异常检测方法及装置 |
CN110059112A (zh) * | 2018-09-12 | 2019-07-26 | 中国平安人寿保险股份有限公司 | 基于机器学习的用户挖掘方法及装置、电子设备、介质 |
CN110490625A (zh) * | 2018-05-11 | 2019-11-22 | 北京京东尚科信息技术有限公司 | 用户偏好确定方法及装置、电子设备、存储介质 |
CN110648153A (zh) * | 2018-06-11 | 2020-01-03 | 中国移动通信集团浙江有限公司 | 一种换机倾向预测方法、装置、电子设备及存储介质 |
CN110941963A (zh) * | 2019-11-29 | 2020-03-31 | 福州大学 | 一种基于句子情感属性的文本属性生成观点摘要方法与系统 |
CN110991711A (zh) * | 2019-11-19 | 2020-04-10 | 浙江鸿程计算机系统有限公司 | 一种基于深度神经网络的多因素感知终端换机预测方法 |
CN111105082A (zh) * | 2019-12-05 | 2020-05-05 | 山东浪潮人工智能研究院有限公司 | 基于机器学习的工件质量预测模型构建方法及预测方法 |
CN111179016A (zh) * | 2019-11-21 | 2020-05-19 | 国电南京自动化股份有限公司 | 一种售电套餐推荐方法、设备及存储介质 |
CN111222709A (zh) * | 2020-01-15 | 2020-06-02 | 杭州华网信息技术有限公司 | 一种国家电网树线放电预测方法 |
WO2020114302A1 (zh) * | 2018-12-04 | 2020-06-11 | 深圳先进技术研究院 | 一种行为预测方法 |
CN111277445A (zh) * | 2020-02-17 | 2020-06-12 | 网宿科技股份有限公司 | 一种评估在线节点服务器性能的方法及装置 |
CN111310785A (zh) * | 2020-01-15 | 2020-06-19 | 杭州华网信息技术有限公司 | 一种国家电网机械外破预测方法 |
CN111340553A (zh) * | 2020-02-28 | 2020-06-26 | 山东爱城市网信息技术有限公司 | 一种金融服务平台产品个性化推荐方法及系统 |
CN111507507A (zh) * | 2020-03-24 | 2020-08-07 | 重庆森鑫炬科技有限公司 | 基于大数据的月用水量预测方法 |
CN111861667A (zh) * | 2020-07-21 | 2020-10-30 | 上海仙豆智能机器人有限公司 | 车辆推荐方法及装置、电子设备、存储介质 |
CN111861606A (zh) * | 2019-04-29 | 2020-10-30 | 浙江大搜车软件技术有限公司 | 车型热度的计算方法及装置、电子设备、存储介质 |
CN112115991A (zh) * | 2020-09-09 | 2020-12-22 | 福建新大陆软件工程有限公司 | 移动终端换机预测方法、装置、设备及可读存储介质 |
CN112017777B (zh) * | 2020-11-02 | 2021-02-26 | 北京妙医佳健康科技集团有限公司 | 相似对问题预测的方法、装置及电子设备 |
CN112685641A (zh) * | 2020-12-31 | 2021-04-20 | 五八有限公司 | 一种信息处理方法及装置 |
CN112712383A (zh) * | 2019-10-24 | 2021-04-27 | 上海莉莉丝科技股份有限公司 | 应用程序的潜在用户预测方法、装置、设备及存储介质 |
CN113538025A (zh) * | 2020-04-14 | 2021-10-22 | 中国移动通信集团浙江有限公司 | 终端设备的更换预测方法及装置 |
CN114765772A (zh) * | 2021-01-04 | 2022-07-19 | 中国移动通信有限公司研究院 | 终端信息的输出方法、装置及可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104794195A (zh) * | 2015-04-17 | 2015-07-22 | 南京大学 | 一种用于电信潜在换机用户发现的数据挖掘方法 |
CN106599935A (zh) * | 2016-12-29 | 2017-04-26 | 重庆邮电大学 | 基于Spark大数据平台的三支决策不平衡数据过采样方法 |
-
2017
- 2017-02-20 CN CN201710089934.0A patent/CN106845731A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104794195A (zh) * | 2015-04-17 | 2015-07-22 | 南京大学 | 一种用于电信潜在换机用户发现的数据挖掘方法 |
CN106599935A (zh) * | 2016-12-29 | 2017-04-26 | 重庆邮电大学 | 基于Spark大数据平台的三支决策不平衡数据过采样方法 |
Cited By (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107527124A (zh) * | 2017-10-13 | 2017-12-29 | 众安信息技术服务有限公司 | 生成行业基本面组合预测模型的方法和装置 |
CN108038720A (zh) * | 2017-12-06 | 2018-05-15 | 电子科技大学 | 一种基于因子分解机的广告点击率预测方法 |
CN109962795A (zh) * | 2017-12-22 | 2019-07-02 | 中国移动通信集团广东有限公司 | 一种基于多维组合变量的4g用户流失预警方法和系统 |
CN108257593B (zh) * | 2017-12-29 | 2020-11-13 | 深圳和而泰数据资源与云技术有限公司 | 一种语音识别方法、装置、电子设备及存储介质 |
CN108257593A (zh) * | 2017-12-29 | 2018-07-06 | 深圳和而泰数据资源与云技术有限公司 | 一种语音识别方法、装置、电子设备及存储介质 |
CN109993339A (zh) * | 2017-12-29 | 2019-07-09 | 上海诺悦智能科技有限公司 | 一种出国金融业务潜在用户的预测方法 |
CN108764597A (zh) * | 2018-04-02 | 2018-11-06 | 华南理工大学 | 一种基于集成学习的产品质量控制方法 |
CN110490625A (zh) * | 2018-05-11 | 2019-11-22 | 北京京东尚科信息技术有限公司 | 用户偏好确定方法及装置、电子设备、存储介质 |
CN110648153A (zh) * | 2018-06-11 | 2020-01-03 | 中国移动通信集团浙江有限公司 | 一种换机倾向预测方法、装置、电子设备及存储介质 |
CN109242539A (zh) * | 2018-08-14 | 2019-01-18 | 中国平安人寿保险股份有限公司 | 基于流失用户的潜在用户预测方法、装置和计算机设备 |
CN109325781A (zh) * | 2018-09-04 | 2019-02-12 | 中国平安人寿保险股份有限公司 | 客户品质分析方法、装置、计算机设备和存储介质 |
CN110059112A (zh) * | 2018-09-12 | 2019-07-26 | 中国平安人寿保险股份有限公司 | 基于机器学习的用户挖掘方法及装置、电子设备、介质 |
CN109166012A (zh) * | 2018-09-21 | 2019-01-08 | 苏州创旅天下信息技术有限公司 | 针对行程预定类用户的分类及信息推送的方法和装置 |
CN109166012B (zh) * | 2018-09-21 | 2021-05-28 | 苏州创旅天下信息技术有限公司 | 针对行程预定类用户的分类及信息推送的方法和装置 |
CN109359674A (zh) * | 2018-09-27 | 2019-02-19 | 智庭(北京)智能科技有限公司 | 一种基于多模型blending的智能锁异常检测方法 |
WO2020114302A1 (zh) * | 2018-12-04 | 2020-06-11 | 深圳先进技术研究院 | 一种行为预测方法 |
CN109509033B (zh) * | 2018-12-14 | 2023-04-07 | 重庆邮电大学 | 一种消费金融场景下的用户购买行为大数据预测方法 |
CN109509033A (zh) * | 2018-12-14 | 2019-03-22 | 重庆邮电大学 | 一种消费金融场景下的用户购买行为大数据预测方法 |
CN109635118A (zh) * | 2019-01-10 | 2019-04-16 | 博拉网络股份有限公司 | 一种基于大数据的用户搜索匹配方法 |
CN109919219A (zh) * | 2019-03-01 | 2019-06-21 | 北京邮电大学 | 一种基于粒计算ML-kNN的Xgboost多视角画像构建方法 |
CN109919219B (zh) * | 2019-03-01 | 2021-02-26 | 北京邮电大学 | 一种基于粒计算ML-kNN的Xgboost多视角画像构建方法 |
CN109886756A (zh) * | 2019-03-04 | 2019-06-14 | 深圳微品致远信息科技有限公司 | 基于集成模型的通讯用户升档预测概率识别方法及系统 |
CN109948869A (zh) * | 2019-04-22 | 2019-06-28 | 东南大学 | 基于有序聚类离散化的脱硫系统so2出口浓度预测方法 |
CN109948869B (zh) * | 2019-04-22 | 2020-11-13 | 东南大学 | 基于有序聚类离散化的脱硫系统so2出口浓度预测方法 |
CN111861606A (zh) * | 2019-04-29 | 2020-10-30 | 浙江大搜车软件技术有限公司 | 车型热度的计算方法及装置、电子设备、存储介质 |
CN110059775A (zh) * | 2019-05-22 | 2019-07-26 | 湃方科技(北京)有限责任公司 | 旋转型机械设备异常检测方法及装置 |
CN112712383A (zh) * | 2019-10-24 | 2021-04-27 | 上海莉莉丝科技股份有限公司 | 应用程序的潜在用户预测方法、装置、设备及存储介质 |
CN110991711A (zh) * | 2019-11-19 | 2020-04-10 | 浙江鸿程计算机系统有限公司 | 一种基于深度神经网络的多因素感知终端换机预测方法 |
CN111179016A (zh) * | 2019-11-21 | 2020-05-19 | 国电南京自动化股份有限公司 | 一种售电套餐推荐方法、设备及存储介质 |
CN111179016B (zh) * | 2019-11-21 | 2023-09-22 | 国电南京自动化股份有限公司 | 一种售电套餐推荐方法、设备及存储介质 |
CN110941963A (zh) * | 2019-11-29 | 2020-03-31 | 福州大学 | 一种基于句子情感属性的文本属性生成观点摘要方法与系统 |
CN111105082A (zh) * | 2019-12-05 | 2020-05-05 | 山东浪潮人工智能研究院有限公司 | 基于机器学习的工件质量预测模型构建方法及预测方法 |
CN111222709B (zh) * | 2020-01-15 | 2023-12-12 | 国网冀北电力有限公司超高压分公司 | 一种国家电网树线放电预测方法 |
CN111222709A (zh) * | 2020-01-15 | 2020-06-02 | 杭州华网信息技术有限公司 | 一种国家电网树线放电预测方法 |
CN111310785A (zh) * | 2020-01-15 | 2020-06-19 | 杭州华网信息技术有限公司 | 一种国家电网机械外破预测方法 |
CN111277445B (zh) * | 2020-02-17 | 2022-06-07 | 网宿科技股份有限公司 | 一种评估在线节点服务器性能的方法及装置 |
CN111277445A (zh) * | 2020-02-17 | 2020-06-12 | 网宿科技股份有限公司 | 一种评估在线节点服务器性能的方法及装置 |
CN111340553A (zh) * | 2020-02-28 | 2020-06-26 | 山东爱城市网信息技术有限公司 | 一种金融服务平台产品个性化推荐方法及系统 |
CN111507507A (zh) * | 2020-03-24 | 2020-08-07 | 重庆森鑫炬科技有限公司 | 基于大数据的月用水量预测方法 |
CN113538025B (zh) * | 2020-04-14 | 2024-03-22 | 中国移动通信集团浙江有限公司 | 终端设备的更换预测方法及装置 |
CN113538025A (zh) * | 2020-04-14 | 2021-10-22 | 中国移动通信集团浙江有限公司 | 终端设备的更换预测方法及装置 |
CN111861667A (zh) * | 2020-07-21 | 2020-10-30 | 上海仙豆智能机器人有限公司 | 车辆推荐方法及装置、电子设备、存储介质 |
CN112115991B (zh) * | 2020-09-09 | 2023-08-04 | 福建新大陆软件工程有限公司 | 移动终端换机预测方法、装置、设备及可读存储介质 |
CN112115991A (zh) * | 2020-09-09 | 2020-12-22 | 福建新大陆软件工程有限公司 | 移动终端换机预测方法、装置、设备及可读存储介质 |
WO2022088602A1 (zh) * | 2020-11-02 | 2022-05-05 | 北京妙医佳健康科技集团有限公司 | 相似对问题预测的方法、装置及电子设备 |
CN112017777B (zh) * | 2020-11-02 | 2021-02-26 | 北京妙医佳健康科技集团有限公司 | 相似对问题预测的方法、装置及电子设备 |
CN112685641A (zh) * | 2020-12-31 | 2021-04-20 | 五八有限公司 | 一种信息处理方法及装置 |
CN114765772A (zh) * | 2021-01-04 | 2022-07-19 | 中国移动通信有限公司研究院 | 终端信息的输出方法、装置及可读存储介质 |
CN114765772B (zh) * | 2021-01-04 | 2024-06-11 | 中国移动通信有限公司研究院 | 终端信息的输出方法、装置及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106845731A (zh) | 一种基于多模型融合的潜在换机用户发现方法 | |
US20200117675A1 (en) | Obtaining of Recommendation Information | |
CN107633254A (zh) | 建立预测模型的装置、方法及计算机可读存储介质 | |
CN106251174A (zh) | 信息推荐方法及装置 | |
CN105426514A (zh) | 个性化的移动应用app推荐方法 | |
CN108921398B (zh) | 店铺质量评价方法及装置 | |
US11599892B1 (en) | Methods and systems to extract signals from large and imperfect datasets | |
CN104504583B (zh) | 分类器的评价方法 | |
CN110532351A (zh) | 推荐词展示方法、装置、设备及计算机可读存储介质 | |
CN102955902A (zh) | 雷达模拟设备可信度的评估方法及评估系统 | |
CN104166732B (zh) | 一种基于全局评分信息的项目协同过滤推荐方法 | |
CN107563557A (zh) | 确定油井产量递减率的方法及装置 | |
WO2018232331A1 (en) | Systems and methods for optimizing and simulating webpage ranking and traffic | |
CN111191133B (zh) | 业务搜索处理方法、装置及设备 | |
CN104993962A (zh) | 获取终端使用状态的方法和系统 | |
CN110880127A (zh) | 消费水平的预测方法、装置、电子设备及存储介质 | |
CN113051317B (zh) | 一种数据挖掘模型更新方法、系统、计算机设备及可读介质 | |
CN111967914A (zh) | 基于用户画像的推荐方法、装置、计算机设备和存储介质 | |
CN109801101A (zh) | 标签确定方法、装置、计算机设备和存储介质 | |
CN113627975A (zh) | 门店选址方法、装置、计算机设备和存储介质 | |
CN109582859B (zh) | 保险推送方法、装置、计算机设备及存储介质 | |
CN112487283A (zh) | 训练模型的方法、装置、电子设备及可读存储介质 | |
CN107545457B (zh) | 汽车竞品车型确定方法及装置 | |
CN113761084B (zh) | 一种poi搜索排序模型训练方法、排序装置与方法及介质 | |
CN113360790A (zh) | 信息推荐方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170613 |
|
RJ01 | Rejection of invention patent application after publication |