CN101075303A - 一种预测新业务潜在用户的数据挖掘模型 - Google Patents

一种预测新业务潜在用户的数据挖掘模型 Download PDF

Info

Publication number
CN101075303A
CN101075303A CNA2006100127224A CN200610012722A CN101075303A CN 101075303 A CN101075303 A CN 101075303A CN A2006100127224 A CNA2006100127224 A CN A2006100127224A CN 200610012722 A CN200610012722 A CN 200610012722A CN 101075303 A CN101075303 A CN 101075303A
Authority
CN
China
Prior art keywords
per capita
data
gprs
client
wap
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006100127224A
Other languages
English (en)
Inventor
郭永宏
贾殿承
乔辉
武海斌
庞咏
李祎
张文杰
易剑光
刘鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HEBEI QTONG COMMUNICATION CO Ltd
Original Assignee
HEBEI QTONG COMMUNICATION CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HEBEI QTONG COMMUNICATION CO Ltd filed Critical HEBEI QTONG COMMUNICATION CO Ltd
Priority to CNA2006100127224A priority Critical patent/CN101075303A/zh
Publication of CN101075303A publication Critical patent/CN101075303A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种预测新业务潜在用户的数据挖掘模型,该数据挖掘模型包括以下步骤:1)业务理解;2)数据理解;3)数据分析;4)数据挖掘,得到潜在用户。本发明采用了目前领先的数据挖掘、数据仓库、OLAP分析等技术,创造性的将企业数据融合在一起,为企业的经营生产提供全方位的决策支持。与同类系统相比有更强的优势。利用数据仓库系统将分散在企业中的各个“信息孤岛”,有效、完整的集合在一起。建立统一的企业数据视图,并在此基础之上,将企业各个生产环节的数据综合在一起进行分析。并利用数据挖掘、OLAP分析等技术,形成各种关联分析和预测分析,可以为企业的决策提供更为可靠且全面的支持。

Description

一种预测新业务潜在用户的数据挖掘模型
技术领域
本发明涉及一种预测新业务潜在用户的数据挖掘模型。
背景技术
随着全球经济一体化进程的加剧、中国电信市场的竞争越来越激烈,各大电信运营商纷纷推出新业务以拓展自己的市场,如何能够有效地开展营销活动,是摆在各运营商面前的一个课题。
随着电信企业信息化建设的推进,特别是近几年来,数据仓库技术在国内的推广使用,使得企业有条件使用系统中的数据为市场营销活动提供支撑,于是,统计、分析、数据挖掘等应用得到了迅速的推广。但是在目前的数据仓库应用中,多数已统计分析为主,以预测为目的的应用还很少。
发明内容
本发明所要解决的技术问题在于避免上述现有技术中的不足,而提出一种以数据仓库为基础,以数据挖掘技术为手段,以预测分析为目的一种预测新业务潜在用户的数据挖掘模型。
本发明所提供的技术方案是:一种预测新业务潜在用户的数据挖掘模型,该数据挖掘模型包括以下步骤:
1)业务理解:确定业务目标和基础的客户响应变量,即选择适当的数据仓库,并确定完全相同的响应变量;
2)数据理解:对客户的其它数据进行分析,得到相应的所有行为特征;
3)数据分析:分析客户的所有行为特征,得出彼此之间的相似性;
4)数据挖掘:按照相似的行为特征,重新搜索数据仓库,挖掘出具有该行为特征的其它客户,该客户即为潜在用户。
进一步地,所述相似的行为特征为:用户数、在网时长、人均在网时长、通信次数、人均通信次数、通信费用、人均通信费用、通信时长、人均通信时长、短信次数、人均短信次数、短信费用、人均短信费用、GPRS次数、人均GPRS次数、GPRS流量、人均GPRS流量、GPRS费用、人均GPRS费用、WAP次数、人均WAP次数、WAP费用、人均WAP费用、总费用和人均消费。
本发明有如下优点:采用了目前领先的数据挖掘、数据仓库、OLAP分析等技术,创造性的将企业数据融合在一起,为企业的经营生产提供全方位的决策支持。与同类系统相比有更强的优势。利用数据仓库系统将分散在企业中的各个“信息孤岛”,有效、完整的集合在一起。建立统一的企业数据视图,并在此基础之上,将企业各个生产环节的数据综合在一起进行分析。并利用数据挖掘、OLAP分析等技术,形成各种关联分析和预测分析,可以为企业的决策提供更为可靠且全面的支持。
具体实施方式
下面结合具体实施例来详细说明本发明。
一种预测新业务潜在用户的数据挖掘模型,该数据挖掘模型包括以下步骤:1)业务理解:确定业务目标和基础的客户响应变量,即选择适当的数据仓库,并确定完全相同的响应变量;2)数据理解:对客户的其它数据进行分析,得到相应的所有行为特征;3)数据分析:分析客户的所有行为特征,得出彼此之间的相似性,该相似的行为特征为:用户数、在网时长、人均在网时长、通信次数、人均通信次数、通信费用、人均通信费用、通信时长、人均通信时长、短信次数、人均短信次数、短信费用、人均短信费用、GPRS次数、人均GPRS次数、GPRS流量、人均GPRS流量、GPRS费用、人均GPRS费用、WAP次数、人均WAP次数、WAP费用、人均WAP费用、总费用和人均消费;4)数据挖掘:按照相似的行为特征,重新搜索数据仓库,挖掘出具有该行为特征的其它客户,该客户即为潜在用户。
上述模型的预测方式都依赖于这样两个假设,其一是,纵向历史相似,在某一特定的时间周期内,具有同一特点的一批用户的行为具有重复性。其二,横向相似,即不同用户之间,如果70%特点都相同,那么另外的30%的特点也应该相同。
在具体的研究过程中,我们选取了河北移动通信有限责任公司的彩铃与WAP业务的预测为实例,来构建模型。利用数据仓库中大量的历史数据,辅以先进的搜索技术来实现,具体操作如下:以彩铃用户为例,市场部门在做营销推广之前,需求大致知道那些用户是彩铃业务的潜在消费群体,我们的具体做法是:首先在数据仓库中,将已经注册了彩铃业务的用户找出,然后分析其行为特征,找出他们之间的相似行为特征,最后,将未注册彩铃的但符合以上相似行为特征的用户圈定为彩铃业务的潜在用户群。
经过分析我们得出:通信次数在200次以上,通信费在65元以上,通信时长在450分钟以上,短信次数在120次以上,短信费用在7元以上,GPRS在5次以上,GPRS流量在200K以上,GPRS费用在1.85元以上,WAP次数1次以上,人均消费在100元以上的用户使用彩铃的可能比较大。依此类推,其他新业务如:GPRS业务、梦网短信业务或WAP主站业务等的潜在用户预测也可依此而行。

Claims (2)

1、一种预测新业务潜在用户的数据挖掘模型,该数据挖掘模型包括以下步骤:
1)业务理解:确定业务目标和基础的客户响应变量,即选择适当的数据仓库,并确定完全相同的响应变量;
2)数据理解:对客户的其它数据进行分析,得到相应的所有行为特征;
3)数据分析:分析客户的所有行为特征,得出彼此之间的相似性;
4)数据挖掘:按照相似的行为特征,重新搜索数据仓库,挖掘出具有该行为特征的其它客户,该客户即为潜在用产。
2、根据权利要求1所述的预测新业务潜在用户的数据挖掘模型,其特征在于:所述相似的行为特征为:用户数、在网时长、人均在网时长、通信次数、人均通信次数、通信费用、人均通信费用、通信时长、人均通信时长、短信次数、人均短信次数、短信费用、人均短信费用、GPRS次数、人均GPRS次数、GPRS流量、人均GPRS流量、GPRS费用、人均GPRS费用、WAP次数、人均WAP次数、WAP费用、人均WAP费用、总费用和人均消费。
CNA2006100127224A 2006-05-18 2006-05-18 一种预测新业务潜在用户的数据挖掘模型 Pending CN101075303A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2006100127224A CN101075303A (zh) 2006-05-18 2006-05-18 一种预测新业务潜在用户的数据挖掘模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2006100127224A CN101075303A (zh) 2006-05-18 2006-05-18 一种预测新业务潜在用户的数据挖掘模型

Publications (1)

Publication Number Publication Date
CN101075303A true CN101075303A (zh) 2007-11-21

Family

ID=38976346

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006100127224A Pending CN101075303A (zh) 2006-05-18 2006-05-18 一种预测新业务潜在用户的数据挖掘模型

Country Status (1)

Country Link
CN (1) CN101075303A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101383872B (zh) * 2008-10-22 2011-03-16 中国移动通信集团福建有限公司 通信行业基于数据仓库的飞机乘坐客户筛选的方法
CN104331502A (zh) * 2014-11-19 2015-02-04 亚信科技(南京)有限公司 针对快递员周边人群营销中快递员数据的识别方法
CN104794195A (zh) * 2015-04-17 2015-07-22 南京大学 一种用于电信潜在换机用户发现的数据挖掘方法
CN105096170A (zh) * 2015-09-18 2015-11-25 车智互联(北京)科技有限公司 基于bbd或/和rf模型获取潜客级别的方法和系统
CN105550900A (zh) * 2015-12-18 2016-05-04 晶赞广告(上海)有限公司 一种基于自动挑选属性的相似人群扩展方法
CN107679889A (zh) * 2017-09-08 2018-02-09 平安科技(深圳)有限公司 一种潜在客户的识别方法及终端设备
CN113614757A (zh) * 2019-02-11 2021-11-05 Hrl实验室有限责任公司 用于事件的人机混合预测的系统和方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101383872B (zh) * 2008-10-22 2011-03-16 中国移动通信集团福建有限公司 通信行业基于数据仓库的飞机乘坐客户筛选的方法
CN104331502A (zh) * 2014-11-19 2015-02-04 亚信科技(南京)有限公司 针对快递员周边人群营销中快递员数据的识别方法
CN104794195A (zh) * 2015-04-17 2015-07-22 南京大学 一种用于电信潜在换机用户发现的数据挖掘方法
CN104794195B (zh) * 2015-04-17 2018-04-06 南京大学 一种用于电信潜在换机用户发现的数据挖掘方法
CN105096170A (zh) * 2015-09-18 2015-11-25 车智互联(北京)科技有限公司 基于bbd或/和rf模型获取潜客级别的方法和系统
CN105550900A (zh) * 2015-12-18 2016-05-04 晶赞广告(上海)有限公司 一种基于自动挑选属性的相似人群扩展方法
CN107679889A (zh) * 2017-09-08 2018-02-09 平安科技(深圳)有限公司 一种潜在客户的识别方法及终端设备
CN113614757A (zh) * 2019-02-11 2021-11-05 Hrl实验室有限责任公司 用于事件的人机混合预测的系统和方法

Similar Documents

Publication Publication Date Title
WO2020238631A1 (zh) 一种基于手机信令数据的人群类型识别方法
CN101075303A (zh) 一种预测新业务潜在用户的数据挖掘模型
CN106022708A (zh) 一种预测员工离职的方法
CN101620692A (zh) 一种移动通信业务的客户流失分析方法
CN103377432A (zh) 智能客服营销分析系统
CN104809188A (zh) 一种企业人才流失的数据挖掘分析方法及装置
CN108388625A (zh) 一种基于大数据的工程造价信息管理平台
Cheng et al. Big data assisted customer analysis and advertising architecture for real estate
CN102281498A (zh) 手机通话数据中用户通勤od的挖掘方法
CN102279963B (zh) 两级预算合理性检查提醒及自动优化的方法、设备和系统
CN106332052B (zh) 基于移动通信终端的微区域治安预警方法
GB2606114A (en) Community life circle space identification method and system, computer device and storage medium
CN105262913A (zh) 基于数据挖掘的cti系统及自动化控制方法
Tong et al. The research of customer loyalty improvement in telecom industry based on NPS data mining
CN114202138A (zh) 一种基于多维数据分析的线上渠道运营评估方法
CN101047888A (zh) 基于信令分析的精确营销系统及其方法
CN102045748A (zh) 基于数据业务流量的移动网络智能分析方法及系统
CN106528682A (zh) 一种呼叫中心大数据文本挖掘系统
CN101471945A (zh) 一种进行手机精准营销的方法及系统
CN105634850A (zh) Ptn网络的业务流量建模方法及装置
Kong et al. An analytical CRM based on customer knowledge
CN105205605B (zh) 一种城市智能门户终端与电力营销终端的交互服务系统
CN114004535A (zh) 一种电网多级一体化管理分类与评价方法
CN101707756A (zh) 基于内存表的号码级结算成本分析系统
CN106384229A (zh) 建筑全寿命周期内建筑信息快速判定的app操作方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20071121