CN104794195A - 一种用于电信潜在换机用户发现的数据挖掘方法 - Google Patents
一种用于电信潜在换机用户发现的数据挖掘方法 Download PDFInfo
- Publication number
- CN104794195A CN104794195A CN201510186319.2A CN201510186319A CN104794195A CN 104794195 A CN104794195 A CN 104794195A CN 201510186319 A CN201510186319 A CN 201510186319A CN 104794195 A CN104794195 A CN 104794195A
- Authority
- CN
- China
- Prior art keywords
- data
- attribute
- user
- node
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000007418 data mining Methods 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 32
- 238000003066 decision tree Methods 0.000 claims abstract description 17
- 238000010276 construction Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000009412 basement excavation Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 2
- 230000000712 assembly Effects 0.000 claims description 2
- 238000000429 assembly Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 10
- 238000005065 mining Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 2
- 238000007781 pre-processing Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 5
- 230000004807 localization Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供用于电信潜在换机用户发现的数据挖掘方法,包括如下步骤:1)数据集构造阶段:a收集用户的消费信息、用户历史换机信息、用户信息、终端信息;b数据预处理,同时产生数据集;c处理类别不均衡的数据集,形成最终的训练集和预测集;挖掘阶段:a)获取步骤1-c中处理生成的数据集;b)实施决策树算法发现潜在换机用户;c)结束。本发明是基于数据挖掘的技术在电信用户中找出潜在的换机用户。和传统的方法相比更精确、更高效,具有实现简单、代价低等一系列的优点。
Description
技术领域
本发明涉及数据集构建方法、类别不均衡问题解决方法,以及在数据集上采用决策树算法挖掘出电信潜在换机用户的技术。
背景技术
利用数据挖掘技术可以智能分析电信用户数据,发现潜在的用户换机规律。常用的电信潜在换机用户数据挖掘中有一类应用是决策树分类算法,其基于用户的消费数据、换机信息等对用户未来的换机行为进行预测。本发明也使用了KNN算法和聚类算法对类别不均衡数据进行了欠采样处理,构造数据平衡、分布均匀的数据集。同时在数据进行预处理时使用信息增益率进行属性选择,选择合适的属性。也尝试用数据处理技术去除干扰性噪音数据。
电信行业的运营商几乎每分每秒都在产生大量的业务数据,这些实时海量的数据对于运营商就像一座含有无数矿藏的矿山,本身并不能产生价值,但如果开采得当,就可以得到想象不到的价值,而数据挖掘无疑就是最好的开采工具。在激烈的运营商竞争中,运用数据挖掘去分析海量的业务数据,对理解商业行为、了解客户需求、把握产品和服务的走向等等无疑有着不可估量的价值。
基于数据挖掘进行潜在换机用户定位这一思路打破了传统经验总结的换机模型的惯例,采用数据挖掘中的决策树算法可以深入挖掘用户换机的信息,发现用户更换手机的特点以及用户换机的规律,克服了传统地人为经验总结不能更具针对性同时高精确性的不足。
近期以来,随着大数据时代的来临,将数据挖掘技术用于电信行业进行商业价值提升逐渐成为一种趋势。
发明内容
本发明的目的,构造预测用户换机行为所需的训练数据集和预测数据集,并在训练数据集上采用KNN和聚类算法,以处理类别不均衡的数据集。最后在数据集上实施决策树算法,以快速有效地发现潜在换机用户。
为解决上述问题,本发明的技术方案是,用于电信潜在换机用户发现的数据挖掘方法,包括如下步骤:
1)数据集构造阶段:
a收集用户消费信息、用户历史换机信息、用户信息、终端信息;
b数据预处理,同时产生数据集;
c处理类别不均衡的数据集,形成最终的训练集和预测集;
d结束。
2)挖掘阶段:
a获取步骤1)-c中处理生成的数据集;
b实施数据挖掘算法发现潜在换机用户;
c保存结果;
d结束。
步骤1)-a中所说的收集数据为收集电信客户的消费信息等相关数据。
步骤1)-b中所说的数据预处理具体过程如下:
1)选择用户状态表中状态正常的用户作为我们的预测用户,每个用户都有一个唯一的user_id;
2)以时间点为分割,规划出每个用户在该时间点之前的消费信息、换机信息等,并通过user_id关联起来,以当前月为时间分割点的是预测数据集,以前的其他月为时间分割点的是训练数据集;
3)求出每个属性的信息增益率,选择信息增益率大的属性,摒弃信息增益率小的属性
其中S表示数据集,n表示数据集的类标中值的个数,pi表示第i个值出现的概率,E(S)表示数据集S的熵
属性A有n个取值C1,C2...Cn,将数据集S分为n个不相交的子集S1,S2...Sn,|S|为数据集的实例数,|Si|为数据集的第i个子集的实例数,E(S,A)表示数据集S由属性A分裂后的熵计算公式
InfoGain(S,A)=E(S)-E(S,A)
InfoGain(S,A)表示属性A的信息增益
GainRatio(S,A)表示属性A的信息增益率
4)过滤掉消费属性值为空的数据;
5)过滤掉用机时间属性值小于15天的数据;
6)过滤掉历史用机个数属性值超于50个的数据;
7)过滤掉手机imei重复的数据;
8)为训练数据集的每一条记录添加类标;
9)结束。
步骤1)-c具体过程如下:
1)基于KNN算法对训练数据集中的边界数据进行过滤;
2)对训练数据集中大类数据进行聚类;
3)对聚类后的大类数据进行分层抽样;
4)结合小类数据组合成最终的训练集;
5)结束。
步骤2)-b中数据挖掘决策树算法的一次构建过程具体如下:
1)创建一个根节点N;
2)若训练数据集集为空,则标记节点N为空,并将其返回;
3)若训练数据集属于同一个类标C,则将节点N标记为C,并将其作为叶子节点返回;
4)若属性集合A为空,则将节点N标记为训练集中最多的那个类标M,并将其作为叶子节点返回;
5)对属性集合A中的每个属性进行离散型判断;
6)将连续型属性离散化处理;
7)选择属性集合A中信息增益最高的属性a;
8)根据属性a的取值a=di对结点N进行分支划分,确定每个分支的子数据集;
9)建立a=di的分支,并且节点N按该分支建立子结点Ni;
10)以Ni为根节点,属性a以外的属性为属性集,递归构建决策树。
本发明的有益效果,本发明基于数据挖掘技术的电信潜在换机用户定位方法构建了预测所需的数据集,并且利用KNN和聚类算法处理了类别不均衡的数据集,平衡了数据的均匀度,最后使用决策树算法高效、精确地挖掘出潜在换机的人群。
附图说明
图1为潜在换机用户挖掘操作流程图。
图2为本发明的基于数据挖掘技术的电信潜在换机用户定位方法的流程图。
图3为生成换机数据集的流程图。
图4为处理类别不均衡数据集的流程图。
图5为挖掘过程中决策树算法的一次构造过程
具体实施方式
为了更了解本发明的技术内容,特举实例并配合所附图式说明如下。
如图1所示,潜在换机用户挖掘通过电信数据库查询、数据整合获取用户消费、换机等原始数据,经过相关口径以及数据预处理生成训练数据集和预测训练集,然后在KNN和聚类算法下产生更平衡、均匀的数据集,最后在数据集上运行决策树算法以挖掘出潜在换机的用户。
换机数据集构造与决策树算法挖掘换机用户是该发明的主要步骤,本发明的思路就是通过数据集构造和决策树算法有效挖掘潜在换机用户,同时提高算法可扩展性和运行速度。
本发明的基于数据挖掘技术的电信潜在换机用户定位方法的流程图如图2所示。
步骤0为本发明的换机用户发现方法的起始状态;
在数据集构造阶段(步骤1-3),步骤1是从电信数据库查询、数据整合获取用户消费、换机等原始数据;
步骤2是在原始数据上按照数据集构造口径以及数据预处理形成初始的训练数据集和预测数据集;
步骤3是使用KNN算法和聚类算法欠采样处理类别不均衡的初始数据集。
在挖掘阶段(步骤4-5),步骤4,在步骤3所生成的训练数据集和预测数据集上运行决策树算法;
步骤5是将挖掘出的结果保存至数据库中;
步骤6是本发明的基于数据挖掘技术的电信潜在换机用户定位方法的结束步骤。
图3是对图2中步骤2的详细描述。
步骤20为起始步骤;
步骤21为选择用户状态表中状态正常的用户user_id;
步骤22为以时间点为分割,通过user_id关联用户相关的信息,构造初始的数据集;
步骤23为通过信息增益率来选择换机预测算法中要用到的属性;
步骤24为过滤掉消费属性值为空的数据;
步骤25为过滤掉用机时间属性值小于15天的数据;
步骤26为过滤掉历史用机个数属性值超于50个的数据;
步骤27为过滤掉手机imei重复的数据;
步骤28为给训练数据集每条记录添加类标;
步骤29为图3的结束。
图4是对图2中步骤3的详细描述。
步骤30为起始步骤;
步骤31为使用KNN算法去除训练数据集中的边界数据;
步骤32为对训练数据集中的大类数据进行聚类操作;
步骤33为对聚类过后的大类数据进行分层抽样;
步骤34为对抽样的数据和小类数据进行合并,构建最终的训练数据集;
步骤35为图4的结束。
图5是对图2中步骤4中决策树算法一次递归的详细描述。
步骤40为起始步骤;
步骤41表示创建一个根节点N;
步骤42判断训练数据集中数据是否为空,是则执行步骤43,否则执行步骤44;
步骤43标记根节点N为空,然后执行步骤53;
步骤44判断训练数据集中所有记录是否属于同一类别,是则执行步骤45,否则执行步骤46;
步骤45标记结点为所属类别C,然后执行步骤53;
步骤46判断属性集合是否为空,是则执行步骤47,否则执行步骤48;
步骤47标记节点为训练集中最多的类标M,然后执行步骤53;
步骤48判断属性集合中属性的离散性,是则执行步骤50,否则执行步骤49;
步骤49表示把连续型属性离散化处理;
步骤50表示选择信息增益率最高的属性a;
步骤51表示根据所选属性a的值,对根结点N进行分支划分;
步骤52表示以分支递归构造决策树;
步骤53为图5的结束步骤;
注:决策树算法是一个递归过程,递归的终止条件是以下其一:a)为给定节点的数据全部属于同一类标;b)属性集已经全部参与划分;c)通过某一属性分裂后的数据集中没有记录。
综上所述,本发明利用决策树算法以及数据挖掘中相关算法的可扩展性和运行速度,以便能在大量电信数据下快速高效运行潜在换机用户挖掘算法,并且能有效且精准地挖掘出换机人群,帮助研究换机规律。
本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。
Claims (1)
1.用于电信潜在换机用户发现的数据挖掘方法,其特征是包括如下步骤:
1)数据集构造阶段:
a收集用户的消费信息、用户历史换机信息、用户信息、终端信息;
b数据预处理,同时产生数据集;
c处理类别不均衡的数据集,形成最终的训练集和预测集;
d结束;
2)挖掘阶段:
a获取步骤1)-c中处理生成的数据集;
b实施数据挖掘算法发现潜在换机用户;
c保存结果;
d结束;
步骤1)-a中所说的收集数据为收集电信客户的消费信息等相关数据;
步骤1)-b中所说的数据预处理具体过程如下:
1)选择用户状态表中状态正常的用户作为我们的预测用户,每个用户都有一个唯一的user_id;
2)以时间点为分割,规划出每个用户在该时间点之前的消费信息、换机信息等,并通过user_id关联起来,以当前月为时间分割点的是预测数据集,以前的其他月为时间分割点的是训练数据集;
3)求出每个属性的信息增益率,选择信息增益率大的属性,摒弃信息增益率小的属性
其中S表示数据集,n表示数据集的类标中值的个数,pi表示第i个值出现的概率,E(S)表示数据集S的熵
属性A有n个取值C1,C2...Cn,将数据集S分为n个不相交的子集S1,S2...Sn,|S|为数据集的实例数,|Si|为数据集的第i个子集的实例数,E(S,A)表示数据集S由属性A分裂后的熵计算公式
InfoGain(S,A)=E(S)-E(S,A)
InfoGain(S,A)表示属性A的信息增益;
4)过滤掉消费属性值为空的数据;
5)过滤掉用机时间属性值小于15天的数据;
6)过滤掉历史用机个数属性值超于50个的数据;
7)过滤掉手机imei重复的数据;
8)为训练数据集的每一条记录添加类标;
9)结束;
步骤1)-c具体过程如下:
1)基于KNN算法对训练数据集中的边界数据进行过滤;
2)对训练数据集中大类数据进行聚类;
3)对聚类后的大类数据进行分层抽样;
4)结合小类数据组合成最终的训练集;
5)结束;
步骤2)-b中数据挖掘决策树算法的一次构建过程具体如下:
1)创建一个根节点N;
2)若训练数据集集为空,则标记节点N为空,并将其返回;
3)若训练数据集属于同一个类标C,则将节点N标记为C,并将其作为叶子节点返回;
4)若属性集合A为空,则将节点N标记为训练集中最多的那个类标M,并将其作为叶子节点返回;
5)对属性集合A中的每个属性进行离散型判断;
6)将连续型属性离散化处理;
7)选择属性集合A中信息增益最高的属性a;
8)根据属性a的取值a=di对结点N进行分支划分,确定每个分支的子数据集;
9)建立a=di的分支,并且节点N按该分支建立子结点Ni;
10)以Ni为根节点,属性a以外的属性为属性集,递归构建决策树。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510186319.2A CN104794195B (zh) | 2015-04-17 | 2015-04-17 | 一种用于电信潜在换机用户发现的数据挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510186319.2A CN104794195B (zh) | 2015-04-17 | 2015-04-17 | 一种用于电信潜在换机用户发现的数据挖掘方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104794195A true CN104794195A (zh) | 2015-07-22 |
CN104794195B CN104794195B (zh) | 2018-04-06 |
Family
ID=53558987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510186319.2A Active CN104794195B (zh) | 2015-04-17 | 2015-04-17 | 一种用于电信潜在换机用户发现的数据挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104794195B (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096170A (zh) * | 2015-09-18 | 2015-11-25 | 车智互联(北京)科技有限公司 | 基于bbd或/和rf模型获取潜客级别的方法和系统 |
CN105354210A (zh) * | 2015-09-23 | 2016-02-24 | 深圳市爱贝信息技术有限公司 | 移动游戏支付账户行为数据处理方法和装置 |
CN105760889A (zh) * | 2016-03-01 | 2016-07-13 | 中国科学技术大学 | 一种高效的不均衡数据集分类方法 |
CN106054104A (zh) * | 2016-05-20 | 2016-10-26 | 国网新疆电力公司电力科学研究院 | 一种基于决策树的智能电表故障实时预测方法 |
CN106056137A (zh) * | 2016-05-25 | 2016-10-26 | 南京大学 | 一种基于数据挖掘多分类算法的电信集团业务推荐方法 |
CN106412796A (zh) * | 2015-07-28 | 2017-02-15 | 中国移动通信集团湖北有限公司 | 一种推荐方法及系统 |
CN106845731A (zh) * | 2017-02-20 | 2017-06-13 | 重庆邮电大学 | 一种基于多模型融合的潜在换机用户发现方法 |
CN106991577A (zh) * | 2016-01-21 | 2017-07-28 | 中国移动通信集团湖南有限公司 | 一种确定目标用户的方法及装置 |
CN107016460A (zh) * | 2017-03-27 | 2017-08-04 | 中国联合网络通信集团有限公司广西壮族自治区分公司 | 用户换机预测方法及装置 |
CN107203774A (zh) * | 2016-03-17 | 2017-09-26 | 阿里巴巴集团控股有限公司 | 对数据的归属类别进行预测的方法及装置 |
CN107437095A (zh) * | 2017-07-24 | 2017-12-05 | 腾讯科技(深圳)有限公司 | 类别确定方法及装置 |
WO2018014610A1 (zh) * | 2016-07-20 | 2018-01-25 | 武汉斗鱼网络科技有限公司 | 基于c4.5决策树算法的特定用户挖掘系统及其方法 |
CN108629609A (zh) * | 2017-03-22 | 2018-10-09 | 中国移动通信集团河北有限公司 | 匹配终端的方法和装置 |
CN109583949A (zh) * | 2018-11-22 | 2019-04-05 | 中国联合网络通信集团有限公司 | 一种用户换机预测方法及系统 |
CN110648153A (zh) * | 2018-06-11 | 2020-01-03 | 中国移动通信集团浙江有限公司 | 一种换机倾向预测方法、装置、电子设备及存储介质 |
CN114727274A (zh) * | 2022-04-07 | 2022-07-08 | 中国联合网络通信集团有限公司 | 用户迁移方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101075303A (zh) * | 2006-05-18 | 2007-11-21 | 河北全通通信有限公司 | 一种预测新业务潜在用户的数据挖掘模型 |
CN101169798A (zh) * | 2007-12-06 | 2008-04-30 | 中国电信股份有限公司 | 一种数据挖掘系统和方法 |
CN101373533A (zh) * | 2008-08-29 | 2009-02-25 | 中国移动通信集团福建有限公司 | 基于移动通信信令网关的实时精确营销装置及数据处理方法 |
-
2015
- 2015-04-17 CN CN201510186319.2A patent/CN104794195B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101075303A (zh) * | 2006-05-18 | 2007-11-21 | 河北全通通信有限公司 | 一种预测新业务潜在用户的数据挖掘模型 |
CN101169798A (zh) * | 2007-12-06 | 2008-04-30 | 中国电信股份有限公司 | 一种数据挖掘系统和方法 |
CN101373533A (zh) * | 2008-08-29 | 2009-02-25 | 中国移动通信集团福建有限公司 | 基于移动通信信令网关的实时精确营销装置及数据处理方法 |
Non-Patent Citations (1)
Title |
---|
WENLU ZHOU: ""Base on the Data Mining in Reach and Application of Developing of the"", 《2011 2ND INTERNATIONAL CONFERENCE ON MANAGEMENT SCIENCE AND ENGINEERING》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106412796A (zh) * | 2015-07-28 | 2017-02-15 | 中国移动通信集团湖北有限公司 | 一种推荐方法及系统 |
CN105096170A (zh) * | 2015-09-18 | 2015-11-25 | 车智互联(北京)科技有限公司 | 基于bbd或/和rf模型获取潜客级别的方法和系统 |
CN105354210A (zh) * | 2015-09-23 | 2016-02-24 | 深圳市爱贝信息技术有限公司 | 移动游戏支付账户行为数据处理方法和装置 |
CN106991577A (zh) * | 2016-01-21 | 2017-07-28 | 中国移动通信集团湖南有限公司 | 一种确定目标用户的方法及装置 |
CN105760889A (zh) * | 2016-03-01 | 2016-07-13 | 中国科学技术大学 | 一种高效的不均衡数据集分类方法 |
CN107203774A (zh) * | 2016-03-17 | 2017-09-26 | 阿里巴巴集团控股有限公司 | 对数据的归属类别进行预测的方法及装置 |
CN106054104A (zh) * | 2016-05-20 | 2016-10-26 | 国网新疆电力公司电力科学研究院 | 一种基于决策树的智能电表故障实时预测方法 |
CN106054104B (zh) * | 2016-05-20 | 2019-01-11 | 国网新疆电力公司电力科学研究院 | 一种基于决策树的智能电表故障实时预测方法 |
CN106056137A (zh) * | 2016-05-25 | 2016-10-26 | 南京大学 | 一种基于数据挖掘多分类算法的电信集团业务推荐方法 |
CN106056137B (zh) * | 2016-05-25 | 2019-06-04 | 南京大学 | 一种基于数据挖掘多分类算法的电信集团业务推荐方法 |
WO2018014610A1 (zh) * | 2016-07-20 | 2018-01-25 | 武汉斗鱼网络科技有限公司 | 基于c4.5决策树算法的特定用户挖掘系统及其方法 |
CN106845731A (zh) * | 2017-02-20 | 2017-06-13 | 重庆邮电大学 | 一种基于多模型融合的潜在换机用户发现方法 |
CN108629609A (zh) * | 2017-03-22 | 2018-10-09 | 中国移动通信集团河北有限公司 | 匹配终端的方法和装置 |
CN107016460A (zh) * | 2017-03-27 | 2017-08-04 | 中国联合网络通信集团有限公司广西壮族自治区分公司 | 用户换机预测方法及装置 |
CN107437095A (zh) * | 2017-07-24 | 2017-12-05 | 腾讯科技(深圳)有限公司 | 类别确定方法及装置 |
CN110648153A (zh) * | 2018-06-11 | 2020-01-03 | 中国移动通信集团浙江有限公司 | 一种换机倾向预测方法、装置、电子设备及存储介质 |
CN109583949A (zh) * | 2018-11-22 | 2019-04-05 | 中国联合网络通信集团有限公司 | 一种用户换机预测方法及系统 |
CN114727274A (zh) * | 2022-04-07 | 2022-07-08 | 中国联合网络通信集团有限公司 | 用户迁移方法、装置、电子设备及存储介质 |
CN114727274B (zh) * | 2022-04-07 | 2023-07-21 | 中国联合网络通信集团有限公司 | 用户迁移方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104794195B (zh) | 2018-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104794195A (zh) | 一种用于电信潜在换机用户发现的数据挖掘方法 | |
CN105389713A (zh) | 基于用户历史数据的移动流量套餐推荐算法 | |
CN102722709B (zh) | 一种垃圾图片识别方法和装置 | |
Guo et al. | Evolutionary community structure discovery in dynamic weighted networks | |
CN102194149B (zh) | 社区发现方法 | |
CN102122291A (zh) | 一种基于树形日志模式分析的博客好友推荐方法 | |
JP2009099124A (ja) | データ構築方法とシステム | |
CN103020163A (zh) | 一种网络中基于节点相似度的网络社区划分方法 | |
CN112269844B (zh) | 基于大规模轨迹数据的通用伴随模式分布式挖掘方法 | |
CN110275910A (zh) | 一种不平衡数据集的过采样方法 | |
CN105138650A (zh) | 一种基于孤立点挖掘的Hadoop数据清洗方法及系统 | |
CN104317794A (zh) | 基于动态项权值的中文特征词关联模式挖掘方法及其系统 | |
CN108427753A (zh) | 一种新的数据挖掘方法 | |
CN108090787A (zh) | 一种基于Apriori算法的话单数据深度挖掘和用户行为预测的方法 | |
CN102622447B (zh) | 一种基于Hadoop的频繁闭项集挖掘方法 | |
CN104834709A (zh) | 一种基于负载均衡的并行余弦模式挖掘方法 | |
CN104700311A (zh) | 一种社会网络中的邻域跟随社区发现方法 | |
CN109697206A (zh) | 一种分布式函数依赖关系挖掘方法 | |
CN104268270A (zh) | 基于MapReduce挖掘海量社交网络数据中三角形的方法 | |
CN105138445A (zh) | 基于概率行为关系挖掘业务流程中不可见任务的新方法 | |
CN105813235B (zh) | 移动终端客户社团的划分方法和系统 | |
CN106506183B (zh) | 网络社区的发现方法及装置 | |
CN111125082B (zh) | 基于关联规则挖掘的水泥工艺参数数据分析方法 | |
CN109614491B (zh) | 基于数据质量检测规则挖掘结果的进一步挖掘方法 | |
Babu et al. | Performance Analysis on Advances in Frequent Pattern Growth Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |